作者: Bruce.
日時: 2006/4/27(16:46)
Bruce.です。

機械伯爵 writes:

>  UTF-8なら基本がオクテッド(疑似ASCII)で、エスケープしてUNICODEの
> 16ビットを扱うわけですから、ソースに埋め込むには結局その方法しか
> 無いわけですよね。

んー? おっしゃる意味が良くとれんのですが(^^;

  unicode('\x30\x30', 'utf-16')

のようなことではなく?
それと、octetなので濁らないっす。

>  やっぱ長い日本語とかを使用する場合は、別ファイルで読み込むのが
> 正しい方法なんでしょうね(UTF-8だと、日本語部分が24ビットになる
> から、1.5倍になってしまふ)

750GBのハードディスクが$590で売られる時代です。1.5倍くらいなんだ。
とかゆってみる(笑)

まあ、メッセージ文字列とかはソースコードから追い出すのが流行ですから
(多言語対応とかで)、UTF-16でメッセージカタログを作るとかすれば
良いかもしれませんね。

それと、拡張領域Bの文字を扱う場合にはUTF-8で3バイトを越えますよ。

いじょ。