TSxml 発言

作者: 閑舎
日時: 2003/11/18(16:38)

　皆さん、こんにちは。

　相変わらず XML 変換器をいじっているのですが、気になることに気づきまし
た。

  http://member.nifty.ne.jp/rain/makeweb/html4/sgmldec.htm

によると、そもそも、HTML4 の規格では、「実体参照」(&amp; など)以外のタグ
内部分は大文字小文字を区別していません。つまり、

  <html> と <HTML>

  <img src="hoge.jpg"> と <IMG SRC="HOGE.JPG">

  <meta http-equiv="content-type" content="text/html; charset="shift_jis">
    と <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">

  <a href="http://www.w3.org/TR/REC-html40/loose.dtd">HTML4</a>
    と <a href="http://www.w3.org/tr/rec-html40/loose.dtd">HTML4</a>

はいずれも同じように動作すべき、ということになります。特に最後のケースは
うまくいかないんじゃないかと思ったので、やってみると、W3C に行きますね。

　ですので、apache の設定をいじって、

  http://rakunet.org/tsnet/tsinfo/

などでも、

  http://rakunet.org/TSNET/TSinfo/

と同じページが出るようにしておきました。

# 変換器の方は HTML4 文書を与えると、タグのレベルに応じてインデントをつ
# けてみやすくし、省略されたタグを適切に補って、XHTML に準じた HTML 文書
# の出力ができるところまではきました(つまり、XML に加え HTML をサポート
# というところかな。複雑な HTML のソースを見やすくしたかったので)。もう
# 少ししたらアップします。

--
本田博通（閑舎）
テキストとスクリプトの http://rakunet.org/TSNET/

前の発言:

125. Re: XML 簡易コンバータ [閑舎] 2003/11/09(23:39)
後の発言:

127. Re: URIなどの大文字小文字の区別 [藤岡和夫] 2003/11/18(20:42)
親発言:
子発言:

127. Re: URIなどの大文字小文字の区別 [藤岡和夫] 2003/11/18(20:42)