wgetでセッション資料をダウンロードする
イベントに行ったりなんかすると、しばらくしてから「セッション資料の公開」なんかがあったりする。
あれ、見たくてダウンロードするのだけど、個別にPDFダウンロードしても、9-A-2だとか10-B-1だとかの番号がファイル名になっていて、後から見て何だったのかわからない。やっぱりインデックスページごとダウンロードするのが必要だ。
で、いつもwgetを使うのだが、毎回オプションを忘れてしまうのでメモ。
適当なディレクトリを掘って
$ wget -r -L -l 1 -k http://...
これでウマー
-r, --recursive 再帰ダウンロードを行う -l, --level=NUMBER 再帰時の階層の最大の深さを NUMBER に設定する (0 で無制限) -L, --relative 相対リンクだけ取得対象にする -k, --convert-links HTML 中のリンクをローカルを指すように変更する
深いディレクトリ階層が出来てほしくなければ、
-nd, --no-directories ディレクトリを作らない -nH, --no-host-directories ホスト名のディレクトリを作らない
とかを併用するとよい。
丸ごとダウンロードするのでサーバに優しくないかも。まあ、(ウチの)イントラの中でやる分にはプロキシ通すから、みんなでやっても大丈夫なはず。