作者: 藤岡和夫
日時: 2002/5/03(21:36)
On Fri, 3 May 2002 12:17:40 +0900
Koichi Yamamoto <yamako@...> さんwrote:

> こんにちは、山本です。
> 
> 早速sourceforge.jpのプロジェクト登録を行いましたが、
> あっと言う間に「approved」の通知が届きました。早っ
> 
> とりあえず、GWを利用して準備を始めることにしましょう。

 マニュアルのencoding.htmを訳してみました。こんなものでよいでしょうか。
ソースは、

http://dev.scriptics.com/man/tcl8.4/TclCmd/encoding.htm

 それから、書式等を統一する必要があると思いますが・・・後、正規表現の関
連をまずは訳してみたいと考えています(^^)

NAME
====
encoding - Manipulate encodings 
コード変換 - コード変換を操作する

SYNOPSIS
========
encoding option ?arg arg ...?

INTRODUCTION
============
Strings in Tcl are encoded using 16-bit Unicode characters. Different
operating system interfaces or applications may generate strings in
other encodings such as Shift-JIS. The encoding command helps to bridge
 the gap between Unicode and these other formats. 

 Tclの中の文字列は16ビットのUnicode文字を使用してコード化される。異なる
オペレーティング・システムのインターフェースあるいはアプリケーションは、
シフトJISのような他のコードの文字列を生成することができる。コード変換コ
マンドは、Unicodeと他のフォーマットの間のギャップを埋めることに役立つ。

DESCRIPTION
===========
Performs one of several encoding related operations, depending on option.
 The legal options are:

 オプションによって、コード変換に関連するいくつかのオペレーションの1つ
を実行する。正式なオプションは次のとおり: 

encoding convertfrom ?encoding? data
------------------------------------
Convert data to Unicode from the specified encoding. The characters in
data are treated as binary data where the lower 8-bits of each
character is taken as a single byte. The resulting sequence of bytes is
 treated as a string in the specified encoding. If encoding is not
specified, the current system encoding is used. 

 データを特定のコードからUnicodeに変換する。データ中の文字は、各文字の
下位8ビットが単一バイトとして取られる場合、バイナリデータとして扱われる。
バイトの結果として生じる並びは、特定のコードの文字列として扱われる。コー
ドが特定されない場合、現行システムのコードが使用される。

encoding convertto ?encoding? string
------------------------------------
Convert string from Unicode to the specified encoding. The result is a
sequence of bytes that represents the converted string. Each byte is
stored in the lower 8-bits of a Unicode character. If encoding is not
specified, the current system encoding is used. 

 Unicodeから特定のコードへ文字列を変換する。結果は変換された文字列を表
わすバイトの並びである。各バイトは、Unicode文字の下位8ビットで格納される。
コードが特定されない場合、現行システムのコードが使用される。

encoding names
--------------
Returns a list containing the names of all of the encodings that are
currently available. 

 現在利用可能なコードのすべての名前を含むリストを返す。 

encoding system ?encoding?
--------------------------
Set the system encoding to encoding. If encoding is omitted then the
command returns the current system encoding. The system encoding is
used whenever Tcl passes strings to system calls. 

 システムのコードをencodingにセットする。encodingが省略されるなら、コマ
ンドは現行システムのコードを返す。Tclが文字列をシステムコールへ渡す場合
は常に、システムのコードが使用される。 

EXAMPLE

 例

It is common practice to write script files using a text editor that
produces output in the euc-jp encoding, which represents the ASCII
characters as single bytes and Japanese characters as two bytes. This
makes it easy to embed literal strings that correspond to non-ASCII
characters by simply typing the strings in place in the script. However,
 because the source command always reads files using the ISO8859-1
encoding, Tcl will treat each byte in the file as a separate character
that maps to the 00 page in Unicode. The resulting Tcl strings will not
 contain the expected Japanese characters. Instead, they will contain a
 sequence of Latin-1 characters that correspond to the bytes of the
original string. The encoding command can be used to convert this
string to the expected Japanese Unicode characters. For example, 

set s [encoding convertfrom euc-jp "\xA4\xCF"]

would return the Unicode string "\u306F", which is the Hiragana letter
HA. 

 euc-jpコードを出力するテキストエディタでスクリプトファイルを書くのは普
通の習慣である。euc-jpコードはASCII文字を1バイトで、日本の文字を2バイト
で表現するからである。これは、スクリプト中の適所に文字列を単にタイプする
ことにより、非ASCII文字に対応するリテラル文字列を埋め込むことを容易にす
る。しかしながら、ソース・コマンドは常にISO8859-1コードを使用してファイ
ルを読むので、TclはUnicodeの00ページにマップした分離した文字としてファイ
ル中の各バイトを扱う。結果として生じるTcl文字列は期待される日本文字を含
まないだろう。その代わりに、それらはオリジナルの文字列のバイトに対応するLatin-1
文字の並びを含むだろう。コード変換コマンドはこの文字列を期待される日本のUnicode
文字に変換するために使用することができる。例えば、

set s [encoding convertfrom euc-jp "\xA4\xCF"]

は、Unicode文字列「¥u306F」を返す。それは平仮名文字「は」である。

SEE ALSO
--------
Tcl_GetEncoding
KEYWORDS
encoding
------------------------------------------------------------------------
Copyright c 1998 by Scriptics Corporation.
Copyright c 1995-1997 Roger E. Critchlow Jr.

藤岡 和夫
FGALTS@...
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/