作者: T.Watanabe
日時: 2007/2/17(20:29)
  ねこ丸です。

# sh スクリプトで悩んだのは引数のチェックの部分ですね。未定義か否かの
チェック
# について分かりやすくというか正確な記述というか、test コマンドの振る舞
いを把
# 握できる情報が見つからなくて。つかエラーメッセージを見てもなぜそういうメッ
# セージになるのかが分からなかったのがいちばんつらかったんですが。

Bruce. wrote:

> それは「変換」とは別問題でしょう。
> 
> 自動変換しないで良いというのは入力をチェックしないでいいという意味では
> 云ってないです。以前藤岡さんに対するレスポンスとして、malformなUTF-8の
> チェックをした方が良いのではないかとか書いていますし。
> 
> もちろん、いやらしい問題ではあるのでチェックしたとしても誤判定の可能性は
> 付いて回るわけですけどね。

  入力をチェックしなくていいと言われたとは捉えていないのですが、結局判定
は必要になるんじゃないのかということですね。

  自分の興味は要するに不正なデータが内部の動作で悪影響を与えるかどうかだ
けでして。乱暴なことを言えば化けていても問題なく動いてりゃそれでいいわけ
ですが、化けてるデータで正しく動くとは断言できないですしね。

  脱線ですが、調べると HTML の form には accept-charset という属性があっ
て、ここで受付可能なエンコーディングを宣言することが可能なんですね。判定
の精度の話は置いておくとして、不正なデータを不正と判断する根拠を先に明示
することは可能なんだなぁということは分かりました。

  XML とか規格の決まってるデータならね、チェックの方法もいろいろあります
からね。決まっていない部分がやっぱりいちばん面倒だなという感じでしょう
か。HTTP も調べれば調べるほど発見があるんですけど、なかなか手が回んねん
なーというのが正直なところです。

--
    ねこ丸