Perl | Sjis.pm | UTF2.pm | jacode.pl | Char.pm
404 Flag Not Found
The UTF8 flag was not found -- unless you need it.
EUCJPソフトウェアはEUC-JPを扱うための Perl プログラムです。Sjisソフトウェアと同様のコンセプトによって Perl のマルチバイト文字対応を行います。つまり、外部コードであるEUC-JPそのものを内部コードとして処理します。
インストール方法
以下のファイルを @INC に含まれるディレクトリ、例えば C:\Perl\site\lib にコピーするとインストール完了です。
使い方
スクリプト先頭に以下の記述をします。そうするとスクリプトをEUC-JPで記述でき、Perlの動作もEUC-JPによる日本語文字列に対応するようになります。
use EUCJP;
EUCJPソフトウェアの概要
Sjisソフトウェアと異なる点は大きく2つあります。
- マルチバイト文字の先行するバイト列
- Sjisの場合 [\x81-\x9F\xE0-\xFC] のところ (?:[\x8F]?[\xA1-\xFE]|[\x8E\xA1-\xFE]) になります
- マルチバイト文字の2バイト目以降の扱い
- 2バイト目が ASCII の値と重ならずメタ文字が出現しないため、エスケープが不要です
- 2バイト目に英字が出現しないため uc(), lc() 関数はそのまま利用できます
主な特徴
Perl関連の成功したソフトウェアからいいところをとってきました。
- 互換性: Perl4→Perl5 のように追加によって新機能を実現している
- 文字列の長さや文字の位置を示す単位は今までどおりオクテット
- 文字単位の関数は別の名前で新設(EUCJP::length, EUCJP::substr など)
- 制御性: JPerl のようにプログラマの意図を汲む
- バイト列だと思えばバイト列に、文字列だと思えば文字列になる
- EUC-JPそのままの値を扱うことができる
- UTF8フラグがない
- オブジェクト指向は導入していない(これは利点!!)
- 可搬性: jcode.pl のように単体のPerlスクリプト
- 他に必要なモジュールがない
- perl5.00503でも実行することができる
- それなのにperl5.00503のXSに束縛されない
関連情報