作者: ねこ丸
日時: 2009/4/8(12:22)
  ねこ丸です。

藤岡和夫 writes:

> >   おめでとうございます。個人的にはこのツールを動かせるようになってから
> > は正規表現でのスクレイプはやらなくなりました。読みにくいだけな気がして。
> 
>  ただ、モジュールを使うのではそのモジュールの機能に限定されちゃうので、
> 発想も限定されてしまいますね。

  ん? なんか本末転倒な感じが。より目的に合致するツールを選ぶ、っていう
だけじゃないんですか?  初めに Hpricot ありきなんではなくて、よりスクレ
イプに向いたツールがあるからそれを使うってだけな気が。なんか勘違いして
ます?

  というか正規表現も同じですよね。ぼくも覚えたての頃なんでも「正規表現
一発」で処理できると思い込んで、他の方法に頭が回らなくなってたことがあ
りますし。

# なんでも連想配列とか、なんか一通りハマった気がするなぁ


> > >  Xpathの表現の仕方を勉強しないと・・・
> > 
> >   CSSセレクタでもいけますよ。
> 
>  XPathは知っていたのですが、CSSセレクタというものを全然知りませんでした。
> これはどういうものなのでしょうか。

  CSS が要素を特定する際に利用するセレクタです。もし CSS が通じてないと
するとそこから説明するのはちょっと大変なので勘弁してください^^;

  本家の情報はこれですね。

http://wiki.github.com/why/hpricot/hpricot-css-search

--
    ねこ丸