機械です。
自転車で山を越えて帰宅してMacで打ってます。
> > Shift-JISやEUCはエンコーディング方法ですよね。
> > 一応考慮してUTF-8とかはやめといたんですが、さすがにShift-JIS
> > やEUCの話に触れないわけにもいかなくて。
よくよく調べてみたら、
<符号化文字集合>
ASCII … 半角英数字・半角記号 (a,A,0,!,@,#)
JIS X 0201 … 半角英数字・半角カナ
JIS X 0208 … ひらがな・かたかな・漢字・全角記号
JIS X 0212 … 補助漢字
JIS X 0213 … さらに拡張
Unicode1.0,2.0
ISO-10640,-1(UCS)
UCS-2
UCS-4
<エンコーディング>
ISO-2022(JIS X 0202)
EUC-JP
ISO-2022-JP(JISエンコーディング,JUNETコード)
Shift-JIS
UTF-1(削除)
UTF-2(UTF-8,UTF-FSS)
UTF-7
UTF-16(?)
「文字コードの話」http://euc.jp/i18n/charcode.ja.html より
エンコーディング方法で作られたのはキャラクタセットなのだから、
最初からキャラクタセットと言っておけばよかったかも・・・
> Python2.4の Lib/encodings/ の下から日本語関連らしきものを抜き出して
> みると
>
>
> へーデフォルトで JIS X 0213 に対応してるんですね。Perlではオプションだった
> と思うんですが。
でも、テキストエディタが対応してなかったりして(笑)
/機械伯爵/