作者: 閑舎
日時: 2003/11/18(16:38)
 皆さん、こんにちは。

 相変わらず XML 変換器をいじっているのですが、気になることに気づきまし
た。

  http://member.nifty.ne.jp/rain/makeweb/html4/sgmldec.htm

によると、そもそも、HTML4 の規格では、「実体参照」(& など)以外のタグ
内部分は大文字小文字を区別していません。つまり、

  <html> と <HTML>

  <img src="hoge.jpg"> と <IMG SRC="HOGE.JPG">

  <meta http-equiv="content-type" content="text/html; charset="shift_jis">
    と <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">

  <a href="http://www.w3.org/TR/REC-html40/loose.dtd">HTML4</a>
    と <a href="http://www.w3.org/tr/rec-html40/loose.dtd">HTML4</a>

はいずれも同じように動作すべき、ということになります。特に最後のケースは
うまくいかないんじゃないかと思ったので、やってみると、W3C に行きますね。

 ですので、apache の設定をいじって、

  http://rakunet.org/tsnet/tsinfo/

などでも、

  http://rakunet.org/TSNET/TSinfo/

と同じページが出るようにしておきました。

# 変換器の方は HTML4 文書を与えると、タグのレベルに応じてインデントをつ
# けてみやすくし、省略されたタグを適切に補って、XHTML に準じた HTML 文書
# の出力ができるところまではきました(つまり、XML に加え HTML をサポート
# というところかな。複雑な HTML のソースを見やすくしたかったので)。もう
# 少ししたらアップします。

--
本田博通(閑舎)
テキストとスクリプトの http://rakunet.org/TSNET/