作者: 閑舎
日時: 2004/5/10(14:50)
Fe2+ <VED03370@...> さん wrote.

> Shift_JIS は JIS で EUC-JP は ASCII、ISO-2022-JP なら両方使い分けられ
> るということになっている、という理解はきっと単純過ぎるのでしょうが…。

私もそう思ってました。UNIX 環境では習慣的にバックスラッシュ、と思いこん
でましたが、今回文字コードの先生筋である Bruce. さんから疑問を投げかけら
れたので、待てよと思い、プレンティスホール出版「マルチリンガル環境の実現」
を読んでみると p.27 に

             コードセット1 コードセット2 コードセット3
  日本語 EUC JIS X 0201    JIS X 0208    JIS X 0201

などとあり、慌てました。コードセット1 がいわゆる JIS(円記号) か ASCII(バッ
クスラッシュ) かの別れ目なので、これでは円記号になってしまいます(^^;。

 Bruce. さんに薦められた Ken Lunde 著「日本語情報処理」によれば、

             コードセット1 コードセット2 コードセット3
  日本語 EUC JIS X 0201    JIS X 0208    JIS X 0201
             or ASCII                    (半角片仮名)

となってますね(どちらでもいい)。しかし、ネットでは、

  http://www.kanzaki.com/docs/jcode.html#euc ... ASCII
  http://euc.jp/i18n/euc-jp.txt ... ASCII
  http://www.net.intap.or.jp/oiia/cont1/p0302.html%7B0recid=10326.htm ... ASCII

と圧倒的に ASCII です。どうなってるんだろ(^^;;。

--
本田博通(閑舎)
テキストとスクリプトの http://rakunet.org/TSNET/