作者: davi
日時: 2005/12/05(23:26)
Bruce.さん  <  こん??は でび です

On Mon,  5 Dec 2005 12:26:53 +0900 (JST)
kbk@... (Bruce.) wrote:

> awklib/eg/lib/ord.awk に以下のパッチを当てて、ord関数を
> 使ってみてください。

コンパイラ持ってないっすよ…と思い込んで、苦手なPerlと
ニラメッコして逃げました。

後で気づきましたが、これ、ライブラリじゃん。
そんなディレクトリあったんですね…。
今まで意識したことがありませんでした。

入門書の類にも使い方が書かれているのを見た記憶が
ありません。どうやって使うのでしょう?
案外、こういうののリファレンスって大事かも。

> > 作業を試みたのですが、ソフトによって採用している
> > 変換テーブルに違いがあるようで、それぞれ結果が違い、
> > 結構厄介です。
> 
> これには日本のプログラマーはたくさん泣かされているはずです。
> RubyがUnicodifyされないのもこれが理由の一つだったかと。

とりあえず、

1:Unicode.orgのftpにあるUnihan.txtからJIS関連部分を
   抽出したもの
2:Perlの use Encode qw(from_to); なんちゃらで
     from_to($_, "cp932","UTF16-LE");したもの。
3:NEC拡張漢字とIBM拡張漢字がオリジナルのコードで
   入っているもの(伊藤隆幸氏作)。

を梱包して以下に設置しました。
http://homepage1.nifty.com/davi/tsnet/Bruce.zip

3についてですが、「黒」の旧字体などはFC4Bと7C6Fに
あるんですが、Win上で操作すると、自動的にFC4Bに
寄せられてしまいます。ご注意下さい。

Winは、OSレベルでround-trip conversionについては
配慮せず、寄せてしまう方針のようです。

その他、全角領域に半角デザインのカナが入って
いたりした過去の事実が発掘できたりして面白いです。
ホンの10年前なんですけど、そうだったっけ?って
感じですな。

なお、上記のいずれも、半角カナについてはリスト
アップしていません。

でび  http://homepage1.nifty.com/davi/