Bruce.です。
機械伯爵 さんは書きました (2005/10/31 0:32):
> 「うん。英語の ASCII コードから発展した ISO コード
> の基本は、1文字を1バイトっていう情報単位で記録す
> る方法なんだ。ところが、この1バイトって、基本的に
> 256 種類しか文字を識別できないんだよね。だから日本
> 語コードは、1文字2バイトで表してるんだ。
後でISO10646に触れているのに一文字一バイトですか?
確かに常に1バイト == 8ビットではないわけですが。
> 「う〜んと、JIS X 0208,日本語 EUC,ISO-2022-JP,JIS
> X 0212,EUC-JP,ISO-2022-JP-1,ISO-2022-JP-2 ってとこ
> かな。あと、日本語だけじゃなく、世界中の言語を扱う
> コードとして、Unicode と ISO 10646 があるよ」
JIS X 0213は無視っすか(笑)
それと日本語EUCとEUC-JPって重複してません?
さらに言えば文字コードとエンコーディング方式が微妙に混在
しているような気がするんですが。
--
木村浩一
I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
mail kbk@...
web www.kt.rim.or.jp/~kbk/index.html#zakkicho
homepage3.nifty.com/farstar/