作者: Bruce.
日時: 2007/12/04(01:13)
Bruce.です。

機械伯爵 さんは書きました (2007/12/03 22:01):
>  機械す、年末に向け、地獄の日々を送っています。
> 
>> 中間には遅いし期末には早いような?
> 
>  期末、終わって採点して返して……来週は三者面談ですな。

ふむう。

わたしの高校生の時分は期末が終わるのが12月の10日前後でした。
まあ地域とかにも寄るんでしょうけど。

>>>  おお、もしかして、CD-ROM付きは、日本語では初めてかな。
>>>  私もゲットしよっと(結局日本語の入門書は全部コレクションしてるし……)
>> どうも2ちゃんのPythonスレでは評判が今ひとつですね。
> 
>  2chって、ちゃんとした評価、出した事あるんかいな。

まあたまに鋭い投稿があるにはありますが、今回のこの本に関しては悪材料が
目だった(あのタイトルは著者自身が狙ってつけた?とか)ので、ほめるのは
皆無だったかもしれません。
>> Pythonの内部文字コードがUnicode(UTF-8)ってのにはひっくり返りましたw
>> 現在付箋紙片手にチェック中 :)
> 
>  そう云われてるし、そーらしいんだけど、ソースコード読んだこと
> 無いからわかんないす。

あー、PythonのUnicode文字列というのは、基本はUCS-2、ただしコンパイル時に
UCS-4を指定することもできるというものです。UCS-2という表記の通り固定長で
あり、サロゲートペアを含むUTF-16には対応していません。

PerlのUnicode文字列は確かにUTF-8なんですけどね。


http://www.python.org/doc/api/unicodeObjects.html
7.3.2 Unicode Objects
"Py_UNICODE
    This type represents the storage type which is used by Python internally as basis for holding Unicode ordinals.
Python's default builds use a 16-bit type for Py_UNICODE and store Unicode values internally as UCS2. It is also
possible to build a UCS4 version of Python (most recent Linux distributions come with UCS4 builds of Python). These
builds then use a 32-bit type for Py_UNICODE and store Unicode data internally as UCS4. On platforms where wchar_t is
available and compatible with the chosen Python Unicode build variant, Py_UNICODE is a typedef alias for wchar_t to
enhance native platform compatibility. On all other platforms, Py_UNICODE is a typedef alias for either unsigned short
(UCS2) or unsigned long (UCS4)."


>  でも、UTF-8ってASCIIとコンパチだから、ASCIIだけ使ってたら、わからり
> ませんけどね。

まあそうですね。


-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes or should I?
  mail kbk [at] kt.rim.or.jp
        web  www.kt.rim.or.jp/~kbk/zakkicho/
             homepage3.nifty.com/farstar/