作者: INABA HITOSHI
日時: 2010/2/16(23:21)
こんばんは、でびさん

Ext.B は CJK Unified Ideographs Extension B (CJK統合漢字拡張漢字B集合)のことですね?
UTF-2 というのがきっと紛らわしいのだと思いますが、これは UCS-2 ではありません。
UTF-8http://ja.wikipedia.org/wiki/UTF-8
UTF-2 はいわゆる UTF-8 のことです。つまり1文字は1バイトから4バイトの可変長で表現されます。これに対して UCS-2 は1文字が2バイト固定で表現され、Ext.B を扱うことはできないと思います。
このソフトウェアの名前をすなおに UTF8.pm としたかったところですが、すでにutf8 というプラグマがあり、仕方なく空いている名前の UTF2.pm としました。
# Ext.B は UTF-8 にてカバーされているので、UTF2 ソフトウェアで扱えるはず。
INABA HITOSHI----------------------------------------
> Date: Tue, 16 Feb 2010 13:02:35 +0900
> From: davi-1984@...
> Subject: [TSabc:771] Re: UTF-8フラグの立て方・降ろし方(Re: Re: Sortの考え方)
> To: TSabc@...
>
> INABA HITOSHIさん < こん??は でび です
>
> On Tue, 16 Feb 2010 01:04:13 +0900
> INABA HITOSHI  wrote:
>
>> C. UTF2 ソフトウェアを使う方法
>>
>> この方法は外部エンコーディング(=オクテット列)と内部エンコーディング(=文字
>> 列)を同一として扱う方法です。なので utf8 フラグを立てたり(=decode)、降ろし
>> たり(=encode)する必要はありません。perluniadvice に書かれていることは考慮
>> 不要です。
>
> 0x80 から 0xFF の128個分のオクテット以外は使えるよ、と
> いうことは、一部のダイアクリティカルマーク付きアルファ
> ベットを捨てれば、後はパラダイスだよ、という理解で宜しい
> のでしょうか。
>
> 「UTF2」ということは、Ext.Bのようなものは、いわゆる
> 「だめ字」問題みたいになってしまうのかな、と…。
>
> Perl IOレイヤーとかUTF8フラグとか、グシャグシャなのが
> どうにもこうにも理解不能なので、もう“入門用として紹介
> される”スクリプティング言語としての位置づけではないん
> だろうな、という気がしています。
>
> でび http://davi.txt-nifty.com/1984/

 		 	   		  
_________________________________________________________________
メール一括チェック!他の無料メールもプロバイダーメールも。
http://windows7.jp.msn.com/master/hm-popaggre/default.htm