作者: 機械伯爵
日時: 2004/9/19(00:14)
 機械です。

 Pythonから離れたけど、このネタは追っかけます。

> インターネット上のHTMLやXMLデータを取ってくるのは簡単です。モジュール
>を使えば、一行か二行で書けますから。一度取り込めば、多少のノウハウはある
>にしても、単なるテキスト処理に過ぎません。後はアイデア次第でしょう。

 まず、Webページをテキストデータだと知ってる人、少ないでしょうね。

 私は授業でやってますが、フツーやりませんからね・・・IEで落としたデータを
ノートパッドで開くなんて作業は・・・

 しかも時代はUnicodeとかが混じってきたので、テキストも複雑になってきたし・
・・

※UTF-8とかだと、1文字が1バイトだったり3バイトだったりするし・・・

>> 普通の人にとってデータの保
>> 存形式なんてどうでもいいことだし、わざわざお金を出してアプリケーションの
>> 使い方を必死に覚える人も少なくない。

 アプリケーションとデータが独立してることを知ってる人は、パソコンユーザの
半分の居ないんじゃないかと、時々思うことがあります。

 Wordからそのままメールとか出せますしね(おぞましいことに・・・)

> インターネット上のデータがテキストだし、ユーザーインターフェースさえ、
>テキストで表現されつつある。これは大変魅惑的なことです。

 XULとかはそーですよね・・・(古くはTcl/Tkもそうか・・・)

>テキストを交換す
>ることでインテリジェントな情報のやりとりができるようになってきた。ロジッ
>クさえ、いずれはテキストで表現されるようになる。テキストによる会話がイン
>ターネット上でなされるのは普通になる。これを自在にするためにはスクリプティ
>ングが不可欠になるのじゃないかと思ったりしています。

 デジタルディバイドが深刻化するだけではないかと、懸念しています。

 情報を自在に操る人と、与えられた情報を与えられた方法でしか扱えない人との
差がますます広がることになります。

 でも、不必要なバイナリコードも増えるでしょうね・・・著作権とか独占権
とかが、製品の品質や保守のコストより大切な方々には、ね。

> 今なら、XMLがおもしろいということになるんでしょう。
<中略>
>これらを関連付けてまとめる
>作業はテキスト処理で自動化できるわけです。

 先ほどもいいましたが、Unicodeのややこしさが、テキスト処理を複雑にする
可能性もでてきています。

 完全にUnicodeに移れば問題無いのですが、複数の文字コードが飛び交う
現在では、コード判別の時点で色々と問題が残ります。

> 私の問題意識は通常のアプリケーションは閉じているということです。これは
>カスタマイズもできないし、他のアプリケーションと連携自動化させることも難
>しい。単体としていくら優れていても使いにくい。開かれたアプリケーションを
>作るためにはスクリプトしかないのではと思うのです。それができる仕組みがス
>クリプトによってできつつあるというのが認識なんですね。取り扱うデータもテ
>キストだ。それならいろいろ作ってみようと(^^)

 Unixの時代はそれが当たり前だったんですけどね(アプリはシェルスクリプト
とパイプ処理で書かれていたわけですし)。

 まぁ、フリーウェアでないソフトウェアが一般的である現状が変化すること
が、まず望まれるべきでしょうね。

 ドキュメントの非互換の理由は、どう考えてもソフトウェアの著作権に
関係しているとしか思えないので(昔は高速化が目的だったかもしれません
が、現在の処理速度ではそれもナンセンスですから)

 /機械伯爵/