Skip to content

Commit

Permalink
update README.md
Browse files Browse the repository at this point in the history
  • Loading branch information
nobsun committed May 15, 2017
1 parent 2154537 commit 4fbb3ac
Showing 1 changed file with 12 additions and 0 deletions.
12 changes: 12 additions & 0 deletions 文字列/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -83,3 +83,15 @@ main = T.interact (T.unlines . map foo . T.lines)
foo :: Text -> Text
foo = const "あらそうですか."
```

## 日本語の文字列を扱う

Haskellでは文字を表す型は``Char``型です.
文字に関する関数の多くは``Data.Char``モジュールで定義されています.
Haskellは文字としてUnicode文字集合を使います.
``Char``は内部的には,UTF-32でエンコードされたUnicode文字に対応しています.

GHCでは受け入れ可能なプログラムはUTF-8でエンコードされているテキストです.
プログラムで文字列リテラルやコメントで日本語の文字列を含めるときは,UTF-8でエンコードしたテキストファイルにする必要があります.

UTF-8以外でエンコーディングされているテキストデータを扱う場合には変換が必要になります.

0 comments on commit 4fbb3ac

Please sign in to comment.