作者: MIZUHA Nobuo
日時: 2009/9/14(12:40)
木村浩一さま&各位

 ご無沙汰しています。昨日のジャイアンツ戦の 
敗戦がとてもショックな水羽です。

 昨日、久しぶりに木村さんのサイトを覗かせて 
いただいたところmbsedが5月に更新されている 
ことを知りました。僕がぼんやりしている間に世 
界はどんどん進化していることを改めて知りました。

 本来は個人的に木村さんにメールすべきかとは 
思ったのですが、mbsed以外のことも含んでいる 
ように思ったので、ここで幾つか質問させていた 
だきます。木村さん、そしてみなさんのアドバイ 
スを期待しております。よろしくお願いします。

 次のようなファイル(test.txt)をOKIソフト 
ウェアーが作成されたUTF-8 Cygwinのコンソール 
(bash)上で、mbsedを用いて処理しました。


 mbsed --ctype=UTF8 -f test.sed test.txt

   --------test.sed------------
s/\\&{ 
}\(..*)\)/\\begin{flushright}\1\n\\end{flushright}/g
 --------------------------

 ---------test.txt------------
\&{ }2009/04/14 (MIZUHA,N) K313
   你的??是什??
   王?愚 ?小平 ??? ?君?
 王贛愚 鄧小平 張東蓀 張君勱
 -----------------------------

 気になっている点は次の2点です。

 1)変換の結果は次のようなものですが、K313の 
位置が僕の期待するものと異なります(僕として 
は\endの前に置きたいのです)。たぶん正規表現 
の使い方の問題だと思うのですが、いまのこと 
ろ?です。

 --------------
\begin{flushright}2009/04/14 (MIZUHA,N)
\end{flushright} K313
 ------------

 2)またUTF-8 Cygwinのコンソール上でcatす 
ると、以下のテキストのうち日本語と同じ形の文 
字は問題なく表記できます。ちなみに1行と2行 
目は中国語(gbコード)、三行目は第3・4水準 
を使った日本語表記(sjis)をutf8ファイルで保 
存したものです。catで表示されないのは、?、 
??、?、?、?、?、?、?、? でした。

 -----------------------
   你?的??是什??
   王?愚 ?小平 ??? ?君?
 王贛愚 鄧小平 張東蓀 張君勱
 --------------------------

 またmbsedで処理したものをコンソールで表示 
しようとするとwindowsのコンソール(cmd)と同 
じく全面的に文字化けします。

 mbsedで処理したものをUTF-8 Cygwinのコン 
ソールで表示すたるめには、UTF-8 Cygwinのコン 
パイラを用いて再コンパイルが必要、ということ 
でしょうか。ご教示いただければ、幸甚です。

 ……この問題はファイルにリダイレクトしておけ 
ば何の問題もないので、別に取り立てて質問する 
こともなかったのですが、少し気になりましたの 
で、書き込ませていただきました。

 取り急ぎ。

 みずは