Bruce.さん < こん??は でび です
On Mon, 5 Dec 2005 12:26:53 +0900 (JST)
kbk@... (Bruce.) wrote:
> awklib/eg/lib/ord.awk に以下のパッチを当てて、ord関数を
> 使ってみてください。
コンパイラ持ってないっすよ…と思い込んで、苦手なPerlと
ニラメッコして逃げました。
後で気づきましたが、これ、ライブラリじゃん。
そんなディレクトリあったんですね…。
今まで意識したことがありませんでした。
入門書の類にも使い方が書かれているのを見た記憶が
ありません。どうやって使うのでしょう?
案外、こういうののリファレンスって大事かも。
> > 作業を試みたのですが、ソフトによって採用している
> > 変換テーブルに違いがあるようで、それぞれ結果が違い、
> > 結構厄介です。
>
> これには日本のプログラマーはたくさん泣かされているはずです。
> RubyがUnicodifyされないのもこれが理由の一つだったかと。
とりあえず、
1:Unicode.orgのftpにあるUnihan.txtからJIS関連部分を
抽出したもの
2:Perlの use Encode qw(from_to); なんちゃらで
from_to($_, "cp932","UTF16-LE");したもの。
3:NEC拡張漢字とIBM拡張漢字がオリジナルのコードで
入っているもの(伊藤隆幸氏作)。
を梱包して以下に設置しました。
http://homepage1.nifty.com/davi/tsnet/Bruce.zip
3についてですが、「黒」の旧字体などはFC4Bと7C6Fに
あるんですが、Win上で操作すると、自動的にFC4Bに
寄せられてしまいます。ご注意下さい。
Winは、OSレベルでround-trip conversionについては
配慮せず、寄せてしまう方針のようです。
その他、全角領域に半角デザインのカナが入って
いたりした過去の事実が発掘できたりして面白いです。
ホンの10年前なんですけど、そうだったっけ?って
感じですな。
なお、上記のいずれも、半角カナについてはリスト
アップしていません。
でび http://homepage1.nifty.com/davi/