作者: Koichi Yamamoto
日時: 2002/2/12(01:32)
こんにちは、山本です。

"藤岡和夫 <kazuf@...>"さんは書きました:
> $ head -1 book2txt2.rb | od -t x1
> 0000000 ef bb bf 23 21 2f 75 73 72 2f 6c 6f 63 61 6c 2f
> 0000020 62 69 6e 2f 72 75 62 79 0a
> 0000031
> 
>  毎度ありがとうございます。ゴミがありますね。バイナリエディタで取り除く
> と正常に動きました。再現するのでおそらくDanaのバグですね。

「ef bb bf」って何かなと思って調べたら、U+FEFFというコードですね。
つまり、Byte Order Mark(BOM)という文字です。16ビットUnicodeでは
よく見かけますけど、UTF-8でも付けることがあるんですね。知らなかったです。
# 少なくとも、Tclが吐き出すUTF-8では見たこと無いです。

詳しくは、http://www.unicode.org/unicode/faq/utf_bom.html#25 に
説明されています。

--
Koichi Yamamoto, 
http://www3.ocn.ne.jp/~yamako/