Fe2+ <VED03370@...> さん wrote.
> Shift_JIS は JIS で EUC-JP は ASCII、ISO-2022-JP なら両方使い分けられ
> るということになっている、という理解はきっと単純過ぎるのでしょうが…。
私もそう思ってました。UNIX 環境では習慣的にバックスラッシュ、と思いこん
でましたが、今回文字コードの先生筋である Bruce. さんから疑問を投げかけら
れたので、待てよと思い、プレンティスホール出版「マルチリンガル環境の実現」
を読んでみると p.27 に
コードセット1 コードセット2 コードセット3
日本語 EUC JIS X 0201 JIS X 0208 JIS X 0201
などとあり、慌てました。コードセット1 がいわゆる JIS(円記号) か ASCII(バッ
クスラッシュ) かの別れ目なので、これでは円記号になってしまいます(^^;。
Bruce. さんに薦められた Ken Lunde 著「日本語情報処理」によれば、
コードセット1 コードセット2 コードセット3
日本語 EUC JIS X 0201 JIS X 0208 JIS X 0201
or ASCII (半角片仮名)
となってますね(どちらでもいい)。しかし、ネットでは、
http://www.kanzaki.com/docs/jcode.html#euc ... ASCII
http://euc.jp/i18n/euc-jp.txt ... ASCII
http://www.net.intap.or.jp/oiia/cont1/p0302.html%7B0recid=10326.htm ... ASCII
と圧倒的に ASCII です。どうなってるんだろ(^^;;。
--
本田博通(閑舎)
テキストとスクリプトの http://rakunet.org/TSNET/