皆さん、こんにちは。
相変わらず XML 変換器をいじっているのですが、気になることに気づきまし
た。
http://member.nifty.ne.jp/rain/makeweb/html4/sgmldec.htm
によると、そもそも、HTML4 の規格では、「実体参照」(& など)以外のタグ
内部分は大文字小文字を区別していません。つまり、
<html> と <HTML>
<img src="hoge.jpg"> と <IMG SRC="HOGE.JPG">
<meta http-equiv="content-type" content="text/html; charset="shift_jis">
と <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">
<a href="http://www.w3.org/TR/REC-html40/loose.dtd">HTML4</a>
と <a href="http://www.w3.org/tr/rec-html40/loose.dtd">HTML4</a>
はいずれも同じように動作すべき、ということになります。特に最後のケースは
うまくいかないんじゃないかと思ったので、やってみると、W3C に行きますね。
ですので、apache の設定をいじって、
http://rakunet.org/tsnet/tsinfo/
などでも、
http://rakunet.org/TSNET/TSinfo/
と同じページが出るようにしておきました。
# 変換器の方は HTML4 文書を与えると、タグのレベルに応じてインデントをつ
# けてみやすくし、省略されたタグを適切に補って、XHTML に準じた HTML 文書
# の出力ができるところまではきました(つまり、XML に加え HTML をサポート
# というところかな。複雑な HTML のソースを見やすくしたかったので)。もう
# 少ししたらアップします。
--
本田博通(閑舎)
テキストとスクリプトの http://rakunet.org/TSNET/