クローラー作成にチャレンジしてみた。
手始めにWeb上のページから画像ファイルだけを抽出してみた。
その結果を表示するのは問題があるので、
結果画面のHTMLを掲載する。
最初はうまく画像を抽出できなかったが
XPathについて調べて、
何となくだが理解したら、
あとは割とスムーズに進んだ。
初めて作成したクローラーの
ソースを公開すると良いのだが、
お粗末なので、今回は見送り。
情報を抽出したいページをいくつか決め、
それらのページ専用に作成すれば、
欲しい情報を一度に表示できるので便利。
ビジネスに使えそう。
【このカテゴリーの最新記事】
-
no image
-
no image
-
no image