phpQueryというライブラリを使えば
PHPでも非常に簡単にスクレイピングできます。
phpQuery
https://code.google.com/archive/p/phpquery/downloads
onefileという名前がついた最新のものをダウンロードします。
PHP1つなのでインストールもインクルードも簡単なので省略します。
使い方も簡単で、file_get_contentsでページをとってきて
1 |
$html = file_get_contents('スクレイピングしたいページ'); |
phpQueryに読み込ませれば
1 |
$query = phpQuery::newDocument($html); |
あとは、いろんな条件でデータを抽出するだけ
タグで抽出
1 |
$data = $query->find("タグ")->text(); |
IDで抽出
1 |
$data = $query->find("#ID")->text(); |
クラス名で抽出
1 |
$data = $query->find(".クラス名")->text(); |