作者: 機械伯爵
日時: 2005/10/31(17:11)
 機械です。

 自転車で山を越えて帰宅してMacで打ってます。

> >  Shift-JISやEUCはエンコーディング方法ですよね。
> >  一応考慮してUTF-8とかはやめといたんですが、さすがにShift-JIS
> > やEUCの話に触れないわけにもいかなくて。

 よくよく調べてみたら、

<符号化文字集合>
ASCII … 半角英数字・半角記号 (a,A,0,!,@,#)
JIS X 0201 … 半角英数字・半角カナ
JIS X 0208 … ひらがな・かたかな・漢字・全角記号
JIS X 0212 … 補助漢字
JIS X 0213 … さらに拡張

Unicode1.0,2.0
ISO-10640,-1(UCS)
  UCS-2
  UCS-4

<エンコーディング>
ISO-2022(JIS X 0202)
  EUC-JP
  ISO-2022-JP(JISエンコーディング,JUNETコード)
Shift-JIS

UTF-1(削除)
UTF-2(UTF-8,UTF-FSS)
UTF-7
UTF-16(?)

 「文字コードの話」http://euc.jp/i18n/charcode.ja.html より




 エンコーディング方法で作られたのはキャラクタセットなのだから、
最初からキャラクタセットと言っておけばよかったかも・・・

> Python2.4の Lib/encodings/ の下から日本語関連らしきものを抜き出して
> みると
> 
> 
> へーデフォルトで JIS X 0213 に対応してるんですね。Perlではオプションだった
> と思うんですが。

 でも、テキストエディタが対応してなかったりして(笑)

 /機械伯爵/