文字化けのおそれのある文字の範囲について #631
Unanswered
fuyuhikos
asked this question in
1.1 Errors and Problems (in Japanese)
Replies: 2 comments
-
本当に不鮮明ですね |
Beta Was this translation helpful? Give feedback.
0 replies
-
EUC-JPという文字コードで定義されていない文字(および3バイト文字)は,「文字化け」と見なしています。詳しくはマニュアルのA.4.1節をご参照ください。自動修正の「実行」ボタンをクリックすれば,それらの文字はすべて自動で削除されるので,ご心配には及ばないかと存じます。 あるいは形態素解析にMeCabを使えば,EUC-JPの範囲に限らず,UTF-8の文字を扱えるはずです。この場合は,単に「問題点が発見されました」を無視していただけばよいかと思います。 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
■お使いのKH Coderのバージョン
3.Alpha.13c, 2.00f
■KH Coderのインストール先フォルダ(解凍先フォルダ)
C:\khcoder3
■どんなエラー・不具合・問題ですか?
順調にテキスト読み込みができたのですが、23か所のみで文字化けの可能性があるとの
表示が出ました
分析にはほとんど影響を与える範囲ではないとは思いますが、
~、()、:等が反応しているようなのですが、特定できません
この文字は避けたほうがよい等ありましたら、アドバイスお願いします
■OS
→記入例:Windows Server 12 RD
Beta Was this translation helpful? Give feedback.
All reactions