作者: 機械伯爵
日時: 2004/9/19(14:08)
 機械です。

 このMLにお集りの方々は、無論データのテキスト化の重要性
についてご存知だと思います。

 ただ、こういったコミュニティーの外でそれを訴えつづける
のは至難の業ですね・・・例えば日本はハードウェア関連が強
い地域性の関係で、情報関係の方でも、機械に近い仕事が専門
だった方々がたくさんいます。

 ・・・データの汎用性より、処理の高速化の話題が未だに人
気があるというのは、民族性ですらあるのではないかと感じた
りしますけど(苦笑)

 我々はまだ、情報関係者の中でもマイノリティーのような気
がします。

> >  まず、Webページをテキストデータだと知ってる人、少ないでしょうね。
> >  私は授業でやってますが、フツーやりませんからね・・・IEで落としたデータを
> > ノートパッドで開くなんて作業は・・・
> 
>  知る機会のない人は知ることができません。だからこそ教育が必要なわけです。
> なぜそれを知ることに意義があるのかを説き起こす必要があります。そのために
> はおそらくキラーアプリが必要なんです。

 でも現状の学校では、Webはホームページビルダで書くのが一
般的らしいです。

 NotePadを使ってタグを見るのはマニアックだと、正面から
笑われたこともありますしね(こちらは怒るというか、その考
えに不安しか覚えませんが)

 2県ほど情報の教採(教員採用試験)の専門教科を受けました
が、ハードウェアの話題やネットワークプロトコルの話題、法律
の話題が大半で、テキストデータに関する話題はほとんどありま
せんでした(アルゴリズムの問題くらいかな?)

 つまり、情報関連で詳しい先生というのは、ハードウェアやネ
ットワーク構造/プロトコル、法律に詳しい先生という意味で、
テキストデータなんか、そもそも教育委員会や教科会が理解して
いないようです。

>  有難いことにこういう大変な作業はモジュールがやってくれるので、インター
> ネットでプロトコルを使って作業するのと同様に簡単にできます。

 PerlやRubyなんかはその点、進んでるんでしょうね。

 Pythonはまだまだ問題山積のようです(毎回前進してますが)

 ただ、そろそろ8ビットコードと16ビットコードのどちらが標準
になるのかが決まるとありがたいです。

 8ビットなら16ビット文字は実体参照を使いますし、16ビットなら、
8ビットコードをデフォルトで変換すれば良いのですから。

 標準が決まれば、Shift-JISやEUCも一旦標準フォーマットに直せば良い
わけですから、ずいぶん扱いやすくなるはずです。

 どうやら16ビットに進みつつあるようですが、Unicodeの実務がまだ
まだ遅れているようで、このへんの混乱が不安です。
 
> >  アプリケーションとデータが独立してることを知ってる人は、パソコンユーザの
> > 半分の居ないんじゃないかと、時々思うことがあります。 
>  これも教育の問題ですね。

 流石に情報の先生でそれを知らない人はいません(笑)が、普通の
先生にはちらほら・・・

 「現代の読み書き算盤」という言葉は言い得て妙です。

> >  Wordからそのままメールとか出せますしね(おぞましいことに・・・) 
>  これはなぜおぞましいのかよくわからない。

 これはWord-DOC形式の本文が「添付」されてきたり、HTMLに変換
されてきたりするのですが、どっちにせよマクロウィルス増殖の温
床になりますし、バイナリのWord-DOC形式だと、Wordを立ち上げな
いと読めないので、辛いです。

※OpenOfficeでは読めないドキュメントも時々あるので・・・
 
> >  デジタルディバイドが深刻化するだけではないかと、懸念しています。
>  そこで教育の重要性が強調されるべきだと思います。がんばってください。

 素地の違う生徒を扱うのは大変ですよ・・・

 普通教科と異なり、習熟度別編成クラスなんて許してもらえませ
んので(教員が足りない)様々な知識量の生徒を一括に扱うことに
なります。

 できる限り工夫はしてますが、効率は果てしなく悪いです。
 
> デー
> タベースのデータには自由にアクセスできるべきです。作られたインターフェー
> スがその邪魔をするのです。

 ナンセンスですよね・・・自分のデータが自分で自由に扱えないのですから。

 ドキュメント/データはドキュメント/データの作者のものであって、ドキ
ュメントを作るツールの作者のものであって良い筈がないですから。

※これが、「鉛筆で書かれたものは、鉛筆会社のモノか?」という例を出さ
 ないとなかなか理解してもらえないのも辛い・・・いや、この例を出して
 も「それとは話が別」とか、よく言われるし・・・何が別なのか、教えて
 もらいたいところです。
 
> >  まぁ、フリーウェアでないソフトウェアが一般的である現状が変化すること
> > が、まず望まれるべきでしょうね。
> 
>  Linux + Mozilla(FireFox + Thunderbird) + OpenOffice + Gimp + エディタ + 
> スクリプト言語
> 
> で、他にはいらない時代は既に到来していますね。Windowsのメリットもあるけ
> ど、それは好きなエディタやメーラーがあることだったりして(^^;)ShiftJISの
> 世界に慣れているということもある。パソコンについてくるし。

 実は、自分で使って実感したことですが、日本人には日本語変換がもう少し
充実すれば、かなり変わるんじゃないかな、と思います。

 WinでもMacでも、実際そこが一番ネックだったので・・・

 例えばリナザウにくっついてくる日本語変換システムは結構優秀なので、この
レベルのものがフリーで使えるようになると、完全にメインをLinuxに移せるの
ですけどね・・・

※KNOPPIXに標準でついてるのは、ちょっと実用には力不足・・・

 ・・・あるのかな? もしかして・・・
 
> >  ドキュメントの非互換の理由は、どう考えてもソフトウェアの著作権に
> > 関係しているとしか思えないので(昔は高速化が目的だったかもしれません
> > が、現在の処理速度ではそれもナンセンスですから)
> 
>  この部分は、さてどうなっていきますか。私はよく知りませんが、postscript
> あたりが最終解になるのかと思ったりしています。出版がpostscriptなんでしょ
> う。PC上では今はリーダーが普及しているpdfが有利ですよね。これも中島さん
> のPDFJやXPDFJのようにテキストから作成が可能になりつつあるので、いろいろ
> とおもしろいことができるのではと思います。WORDはリーダーとしては使えない
> し。

 あ、この場合のドキュメントとは、文章だけでなく、データも含めて、
「アプリで作成したデータ」の意味です。

 文章ならTeX(DIV)やPDFが有力候補ですが(Word-DOCは論外)でずが、全般
にはやはりXMLアプリケーション(XUL,XHTMLなど)がキーワードとなるでしょう。

※そろそろXMLとHTMLを同列に話すのはやめてほしいものですが、なぜかいまだに
 解説するような立場の人さえ混乱してるってのは悲しいです。また、わざと
 「簡単に説明するために」と銘打って、同列に語る人もいますが・・・XMLに
 関わるって、結構高度な話題なので、変な説明するのははっきりと間違ってる
 と私は思うんですけど・・・

 /機械伯爵/