作者: Bruce.
日時: 2005/10/31(02:11)
Bruce.です。

機械伯爵 さんは書きました (2005/10/31 0:32):

> 「うん。英語の ASCII コードから発展した ISO コード
> の基本は、1文字を1バイトっていう情報単位で記録す
> る方法なんだ。ところが、この1バイトって、基本的に
> 256 種類しか文字を識別できないんだよね。だから日本
> 語コードは、1文字2バイトで表してるんだ。

後でISO10646に触れているのに一文字一バイトですか?
確かに常に1バイト == 8ビットではないわけですが。


> 「う〜んと、JIS X 0208,日本語 EUC,ISO-2022-JP,JIS
> X 0212,EUC-JP,ISO-2022-JP-1,ISO-2022-JP-2 ってとこ
> かな。あと、日本語だけじゃなく、世界中の言語を扱う
> コードとして、Unicode と ISO 10646 があるよ」

JIS X 0213は無視っすか(笑)
それと日本語EUCとEUC-JPって重複してません?

さらに言えば文字コードとエンコーディング方式が微妙に混在
しているような気がするんですが。


-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
  mail kbk@...
	web  www.kt.rim.or.jp/~kbk/index.html#zakkicho
	     homepage3.nifty.com/farstar/