Program

HTMLスクレイピングを補助するライブラリ書いてみた (javascript)

HTMLのスクレイピングを補助するライブラリを書いたのでアップしてみる(・ω・)
jQueryなど、メジャーどころのライブラリを使用できない特殊環境用です。
メジャーライブラリ使えない人以外は、普通にjQueryなどを使うのがおすすめ!

あ。ちなみにMIT Licenseです。

容量:
圧縮版 – 1.88KB
通常版 – 4.4KB

クラス名:
findTags

利用可能メソッド:
☆条件にマッチしたHTMLオブジェクトを一つだけ取得する
・docfind()
・find()

☆条件にマッチしたHTMLオブジェクトを全て取得する
・docfindAll()
・findAll()

☆HTMLオブジェクトを指定する(これは単体では使用しません)
・elem()

ちなみにdocfind(All)は「document find(All)」という名前を略しました。
docfind, docfindAll は常に”document”全体から検索します。
find, findAllは初回実行時は”document”を親として検索しますが、二回目以降は前回検索して得たHTMLオブジェクトを親として検索します。
例えば…
1. docfindやfindで div id=’result’ を検索。
2. 再度findで div id=’result’ を検索すると、1で得たHTMLオブジェクトにぶら下がっている div id=’result’ を検索します。docfindだと、document全体から再検索します。

使い方:
1. インスタンス作成

2. docfind, docfindAll, find, findAllでHTMLオブジェクトを検索できます。
@第1引数 … タグ名
@第2引数 … アトリビュートのハッシュ ※アトリビュートを特に指定しない場合は空ハッシュでOKです

docfind, findはそのまま連結することができます

すでにHTMLオブジェクトを持っており、その下に含まれるHTMLを検索したい場合は、elem()で親を指定することができます。

と、まぁこんな感じです。使いたい方はどうぞー(。・ω・)ノ
バグ報告・ご要望は@wg_koroまでお願いします。

Facebook / 広告
2010年10月14日 | Posted in Program1 Comment » 

関連記事

コメント1件

  • […] This post was mentioned on Twitter by koro, 久世 浩史. 久世 浩史 said: HTMLスクレイピングを補助するライブラリ書いてみた (javascript) | Azrael http://dlvr.it/70r2c […]

  • コメントを残す

    メールアドレスが公開されることはありません。

    スパム対策のため、コメントする際は下記の計算式を埋めてください。 計算式の有効期限が切れました。計算式の隣にある再読み込みボタンを押してください。