作者: 藤岡和夫
日時: 2004/6/23(23:14)
On Wed, 23 Jun 2004 22:08:59 +0900
WATANABE Hirofumi <eban@...> さんwrote:

> >  仰るとおりだと思うのですが、descriptionに<![CDATA[...]]>で挟んでHTMLタ
> > グ付きまま記事全体を入れる人もいますね。なんでもありの世界です(^^;)
> 
> それはRSS 1.0ならcontent:encodedのほうに。って名前が変わるだけか。

 RSS 2.0ですね。問題が出るのは。

> >  -bを付けると取り敢えずテストデータでは問題がなくなりました(^^)vしばら
> > く試してみます。しかし、anhttpdのCGIでjperlに-bのスイッチを付けるのはど
> > うするんだろ・・・実行プログラムの入力欄に一応加えてみる・・・おーっ、動
> > く、素晴らしい(^^)v・・・いくつか読めないサイトがあったのですが、全部読
> > めるようになりました。ありがとうございました。聞いてよかったです(^^;)v
> 
> それでいいんならjperlである必要はないですね。
> RSSの場合はUTF-8が多いので、ますますjperlが不要になります。

 私の経験では、RSS 1.0でもEUC-JPが結構あります(本当はUTF-8しか認めてい
ないはずたけど、それも半角カナが使われていたりする)。そういうサイトのデー
タも含めてすべてSJISに変換してHTML化して読んでいるのです。問題のあるサイ
トは英語のサイトなので、JPerlである必要はもともとないのですが、CGIスクリ
プト自体がSJIS文字コードを含んでいたりします。それに他のCGIは全部SJISデー
タで動いていてバリバリにJPerlの機能を使っているので、単純には行かないの
です。RSSだけがデータではないですから。Windows上で文字コードを統一すると
すれば、やはりSJISになります。エディタで文字コードを切り替えるのは面倒で
すし、コマンドラインがSJISですからね。手間を掛ければなんでもできるんです
けど、これまでより不便になるのでは・・・

 Windows上の文字コードが全部UTF-8になれば、OKなんですけどね(^^;)ならな
いでしょうね。文字コードが統一されるというのは幻想です。スクリプト言語が
一つにならないのと同じです。それでいいじゃないと思いますけど(^^)スクリプ
ト言語の出番が多くなる(^^)v 

> 
> >  それで、-bというスイッチはプログラミングPerl(第2版)には記載されていな
> > いのですが、どのような働きをしているのでしょうか。
> 
> jperlのように名前にjperlが含まれているときにjperlの機能が活
> きますが、それを殺したいときに使います。だからPerlオリジナル
> には存在しないオプションです。

 -bスイッチで解決というわけには行かないですね(^^;)でも原因がある程度わ
かりましたので、多少効率は落ちるとしてもスクリプト側で工夫は可能でしょう。
今回の場合、おそらく7KBものデータをパターンマッチ演算子で挟まなければ問
題ないわけで、そこに取り敢えず注意すればよいということにしましょう。

 いろいろとありがとうございました。極悪さんも毎度フォローどうもです
_(__)_

藤岡 和夫
kazuf@...
TS Networkのために http://homepage1.nifty.com/kazuf/