2007年8月16日木曜日

日本語の文字を処理するのは複雑なので、いくつかのテストが必要です

またテストしています。

特にアメリカで開発されているソフトは、「文字」というものの中にアルファベット、アラブ数字、半角記号しかないと言う感覚が多いです。そのソフトが日本語の漢字、かな、全角ローマ字や記号を正しく取り扱えるようにするのは、そんな簡単なことではありません。ひとつのところを直すのは、だいたい難しくないですが、直す必要があるところを全部探し出すことが大変です。

This is multibyte (full-width) text that  should be readable to English speakers.It is actually encoded as Japanese text, but the Japanese character set includes ”wide” 2-byte versions of the English alphabet. (They’re more than 2 bytes in UTF-8.)

タグ:   

0 件のコメント: