【PHP】PHPで簡単にスクレイピング

phpQueryというライブラリを使えば
PHPでも非常に簡単にスクレイピングできます。

phpQuery
https://code.google.com/archive/p/phpquery/downloads
onefileという名前がついた最新のものをダウンロードします。
PHP1つなのでインストールもインクルードも簡単なので省略します。

使い方も簡単で、file_get_contentsでページをとってきて

phpQueryに読み込ませれば

あとは、いろんな条件でデータを抽出するだけ

タグで抽出

IDで抽出

クラス名で抽出

【Linux】サーバーでPDFの結合

Linuxサーバー上でPDFを結合できるコマンドがあります

コマンドが見つからないとなる場合は

というパッケージをインストールしましょう。

PDFの結合

逆にPDFをページごとに分割するpdfseparateというコマンドもあります。
pdfseparateコマンドで元のPDFをページごとに分割しておけば
任意のページだけを組み合わせて新たなPDFファイルを生成できますね。

JSONビューア

APIの出力フォーマットはもっぱらJSONが増えてきましたね。
出力結果のチェックは、短いデータならそのまま目視できますが
一覧データの取得など、ものすごい巨大なJSONをチェックする必要があるときは
ビューアが便利です。

Online JSON Viewer
http://jsonviewer.stack.hu/

自作できそうな気もしますが、こういうのチェックしているときって
たいてい精神的に追い詰められてたりして余裕がないんですよね。

個人情報が入っているデータの場合は
できればよそのサービスは使わずに自作したいところですが。

Windowsのイベントログを抽出する

テレワークの社員が増えてくると、人事や経営陣としては
ちゃんと社員が仕事をしているかチェックしたくなります。

社員のPCのログインにドメインコントローラーを使用している場合は
ADサーバーのイベントログから
社員がPCにログインした時間を抽出することができます。

イベントビューアからエクスポートする方法、
wevtutilコマンドを使用する方法もありますが、
ここではwmicコマンドを使用します。

まずはイベントビューアでログインイベントのIDを特定する必要がありますが、
イベントIDが特定出来たら
イベントIDと期間で絞り込んで抽出します。
例)イベントID:1234、2021年4月のログ

Youtubeからサムネイルを簡単に取得する

Youtubeの動画にリンクを貼る際にいきなりembedタグを使うと
ページの動作が重くなります。

動画が1つならまだいいのですが、
一覧画面などで複数の動画が表示されるページだとかなり重く感じると思います。
一覧ではできればembedタグではなくサムネイルを表示したいですよね。

サムネイル画像はYoutubeですでに生成されたものを簡単に取得できます。

まずは動画のURLから動画のIDを取得します。
(URLの末尾の記号が動画のIDです)

あとは簡単、下記にURLに動画のIDを入れたものが
サムネイルのURLになります。

サムネイルはクオリティ別に何種類かあるようです。

HQ動画

FULLHD動画