木村浩一さま&各位
ご無沙汰しています。昨日のジャイアンツ戦の
敗戦がとてもショックな水羽です。
昨日、久しぶりに木村さんのサイトを覗かせて
いただいたところmbsedが5月に更新されている
ことを知りました。僕がぼんやりしている間に世
界はどんどん進化していることを改めて知りました。
本来は個人的に木村さんにメールすべきかとは
思ったのですが、mbsed以外のことも含んでいる
ように思ったので、ここで幾つか質問させていた
だきます。木村さん、そしてみなさんのアドバイ
スを期待しております。よろしくお願いします。
次のようなファイル(test.txt)をOKIソフト
ウェアーが作成されたUTF-8 Cygwinのコンソール
(bash)上で、mbsedを用いて処理しました。
mbsed --ctype=UTF8 -f test.sed test.txt
--------test.sed------------
s/\\&{
}\(..*)\)/\\begin{flushright}\1\n\\end{flushright}/g
--------------------------
---------test.txt------------
\&{ }2009/04/14 (MIZUHA,N) K313
你的??是什??
王?愚 ?小平 ??? ?君?
王贛愚 鄧小平 張東蓀 張君勱
-----------------------------
気になっている点は次の2点です。
1)変換の結果は次のようなものですが、K313の
位置が僕の期待するものと異なります(僕として
は\endの前に置きたいのです)。たぶん正規表現
の使い方の問題だと思うのですが、いまのこと
ろ?です。
--------------
\begin{flushright}2009/04/14 (MIZUHA,N)
\end{flushright} K313
------------
2)またUTF-8 Cygwinのコンソール上でcatす
ると、以下のテキストのうち日本語と同じ形の文
字は問題なく表記できます。ちなみに1行と2行
目は中国語(gbコード)、三行目は第3・4水準
を使った日本語表記(sjis)をutf8ファイルで保
存したものです。catで表示されないのは、?、
??、?、?、?、?、?、?、? でした。
-----------------------
你?的??是什??
王?愚 ?小平 ??? ?君?
王贛愚 鄧小平 張東蓀 張君勱
--------------------------
またmbsedで処理したものをコンソールで表示
しようとするとwindowsのコンソール(cmd)と同
じく全面的に文字化けします。
mbsedで処理したものをUTF-8 Cygwinのコン
ソールで表示すたるめには、UTF-8 Cygwinのコン
パイラを用いて再コンパイルが必要、ということ
でしょうか。ご教示いただければ、幸甚です。
……この問題はファイルにリダイレクトしておけ
ば何の問題もないので、別に取り立てて質問する
こともなかったのですが、少し気になりましたの
で、書き込ませていただきました。
取り急ぎ。
みずは