タイトルの件、もう4・5年前になりますが、山本さんにご
教示いただきながら、tcl/tkを使って対応でるようになりまし
た。最近、他の方法も知ることが出来、久しぶりの書き込みで、
いまさらですが、自分自身の覚え書きのためにメモしておきま
す。
1)発端は常用漢字を正字体に変換する必要が出てきたこと
です。木村さんのmbsedと、でびさんのwxqkanji.sedを使用し
て、必要な処理を行いました。今回はutf8ファイルの操作には、
以前、木村さんが紹介してくださったxyzzyを使っています。
木村さん・でびさんには、貴重なツールを提供していただき、
感謝しています。ただでびさんは、常用されている漢字に異体
字があれば、機械的にそれに変更されており、僕の用途と異な
った部分があり、多少変更させていただきました(たとえば、
ご存じのように「芸」をどんなときでも「藝」に変換できるわ
けではありませんので)。
2)この過程でutf8ファイルのデータをフィールドソートで
きる益山健さんのsortlとRubyを使った方法を知りました。
http://www.massangeana.com/mas/archive/archive.htm
http://www003.upp.so-net.ne.jp/NAMBOKU/ruby/ruby0242.html
作者の方々に感謝するとともに、自分の検索能力の低さに愕
然とした次第です。
3)その他、まだ試していませんが、沖電気のwebサイトによ
ると、cygwinでutf8をコンソールで表示できるようにすることも
可能のようですね。
http://www.okisoft.co.jp/esc/cygwin-20.html
技術の改良・変化の早さに改めて驚きました。
こんな僕ですが、ときどきは書き込ませていただきます。よろ
しくお願いします。
水羽信男