クローラー作成: データベースエンジニアが行く

2018年09月18日

「横断検索サイト」という言葉を知り、

クローラー作成にチャレンジしてみた。

手始めにWeb上のページから画像ファイルだけを抽出してみた。

その結果を表示するのは問題があるので、

結果画面のHTMLを掲載する。

最初はうまく画像を抽出できなかったが

XPathについて調べて、

何となくだが理解したら、

あとは割とスムーズに進んだ。

初めて作成したクローラーの

ソースを公開すると良いのだが、

お粗末なので、今回は見送り。

情報を抽出したいページをいくつか決め、

それらのページ専用に作成すれば、

欲しい情報を一度に表示できるので便利。

ビジネスに使えそう。

【このカテゴリーの最新記事】

この記事へのコメント

コメントを書く

検索

カテゴリーアーカイブ

プロフィール

db-engineer

タグクラウド

月別アーカイブ