Bruce.です。
機械伯爵 さんは書きました (2007/12/03 22:01):
> 機械す、年末に向け、地獄の日々を送っています。
>
>> 中間には遅いし期末には早いような?
>
> 期末、終わって採点して返して……来週は三者面談ですな。
ふむう。
わたしの高校生の時分は期末が終わるのが12月の10日前後でした。
まあ地域とかにも寄るんでしょうけど。
>>> おお、もしかして、CD-ROM付きは、日本語では初めてかな。
>>> 私もゲットしよっと(結局日本語の入門書は全部コレクションしてるし……)
>> どうも2ちゃんのPythonスレでは評判が今ひとつですね。
>
> 2chって、ちゃんとした評価、出した事あるんかいな。
まあたまに鋭い投稿があるにはありますが、今回のこの本に関しては悪材料が
目だった(あのタイトルは著者自身が狙ってつけた?とか)ので、ほめるのは
皆無だったかもしれません。
>> Pythonの内部文字コードがUnicode(UTF-8)ってのにはひっくり返りましたw
>> 現在付箋紙片手にチェック中 :)
>
> そう云われてるし、そーらしいんだけど、ソースコード読んだこと
> 無いからわかんないす。
あー、PythonのUnicode文字列というのは、基本はUCS-2、ただしコンパイル時に
UCS-4を指定することもできるというものです。UCS-2という表記の通り固定長で
あり、サロゲートペアを含むUTF-16には対応していません。
PerlのUnicode文字列は確かにUTF-8なんですけどね。
http://www.python.org/doc/api/unicodeObjects.html
7.3.2 Unicode Objects
"Py_UNICODE
This type represents the storage type which is used by Python internally as basis for holding Unicode ordinals.
Python's default builds use a 16-bit type for Py_UNICODE and store Unicode values internally as UCS2. It is also
possible to build a UCS4 version of Python (most recent Linux distributions come with UCS4 builds of Python). These
builds then use a 32-bit type for Py_UNICODE and store Unicode data internally as UCS4. On platforms where wchar_t is
available and compatible with the chosen Python Unicode build variant, Py_UNICODE is a typedef alias for wchar_t to
enhance native platform compatibility. On all other platforms, Py_UNICODE is a typedef alias for either unsigned short
(UCS2) or unsigned long (UCS4)."
> でも、UTF-8ってASCIIとコンパチだから、ASCIIだけ使ってたら、わからり
> ませんけどね。
まあそうですね。
--
木村浩一
I thought what I'd do was, I'd pretend I was one of those deaf-mutes or should I?
mail kbk [at] kt.rim.or.jp
web www.kt.rim.or.jp/~kbk/zakkicho/
homepage3.nifty.com/farstar/