作者: 藤岡和夫
日時: 2004/1/04(12:05)
あけましておめでとうございます。

On Sat,  3 Jan 2004 13:27:29 +0900 (JST)
HFC01730@... (水羽信男) さんwrote:

> 頌春

 なかなか趣がありますね(^^)水羽さんならではですね。

> 
> 【たむら】さん、【極悪】さん、【うえた】さん、【山本】さん、【藤岡】さん、ご教
> 示、感謝します。
>  
>  期間限定とはいえ、40歳を過ぎて生まれて初めて、広島以外の土地で生活をしているた
> め、なかなか反応が遅くなります。

 えーと、よろしければ、どちら方面へ行かれたのですか。

>  さらに年末は電話が不通になったり(ということはダイアルアップ環境の僕のコン
> ピュータはメイルの送受信さえできなくなりました)、年越しは親孝行に時間がとられる
> など、なかなか思うように自分のことができずにおりました。
>  皆様には失礼の段、ひらにお詫びするとともに、ご海容のほど、お願い申し上げます。
>  こんな僕ですが、本年もどうぞよろしくお願いします。

 マイペースでいきましょう。

> 
>  以下、まとめてのレスなどです。
> 
> 1)今回の僕の作業の具体的な例は次のようなもので、11の改行を欄区切り文字とする
>   unicodeのデータが、空行(←空白行ではないです!)で区切られています。
>  
> 番号:1
> 名前:王贛愚
> よみ1:おうかんぐ
> よみ2:Wang Ganyu
> 生年:1906
> 卒年:-
> 学歴1:清華大学
> 学歴2:コロンビア大学
> 経歴1:大陸
> 経歴2:-
> 雑誌1:○
> 雑誌2:×
> 
> 2)上記のようなデータを、たとえば第3の欄の【よみ2】で中国語読みにしたり、第7の欄
>   の学歴1ごとにまとめたり、というふうにソートしています。
>  さらに1910年より後に生まれた清華大学出身者で、雑誌1に書いた人物の日本語読み
>   五十音順表などというのも作ったりします。
> 
> 3)上記の類のデータの“見出し”を削除して、【/】などを欄区切り文字にして1行にま
>   とめ、改行をデータの区切り文字としてソートする場合もあります。
> 
> 例:15/李広田/りこうでん/Li Guangtian/1906/1968/北京大学/?/大陸/-/×/×/

 水羽流情報処理術の一端を見せていただき大変参考になります。やはり複行レ
コードと単行レコードとの行き来というのは重要なテキスト処理の課題になりま
すね。

藤岡 和夫
FGALTS@...
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/