作者: Bruce.
日時: 2005/12/21(22:55)
Bruce.です。

T.Watanabe さんは書きました (2005/12/15 22:22):
>>ん、OS X はどうなんだっけ?
> 
>   ファイル名に濁点が入るとこれが元の文字と分離してしまいますが、これがそ
> うかもしれません。これねぇ、ものすごく困るんですよね。

弾さんのblogによると。

|UTF-16
|
|U+0000からU+FFFFまではそのまま16bit整数、U+0000からU+10FFFFまではいわゆ
|る Surrogate Pair という一対の16bit整数で符号化する規格。Javaでcharとい
|うとこれになります。U+10FFFFまでしか符号化できません。Unicodeの現規格の
|制限はここから来ています。
|
|Windows、Mac OS Xなど多くのOS、そしてJavaの内部文字コードとしてよく使わ
|れています。

だそうです。そうかあ OS XもUTF-16だったのか。
まあUTF-32だと無駄が多いのかもね。特にASCIIが主な環境を考えると。

-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
  mail kbk@...
	web  www.kt.rim.or.jp/~kbk/index.html#zakkicho
	     homepage3.nifty.com/farstar/