-

wgetでセッション資料をダウンロードする

イベントに行ったりなんかすると、しばらくしてから「セッション資料の公開」なんかがあったりする。
あれ、見たくてダウンロードするのだけど、個別にPDFダウンロードしても、9-A-2だとか10-B-1だとかの番号がファイル名になっていて、後から見て何だったのかわからない。やっぱりインデックスページごとダウンロードするのが必要だ。
で、いつもwgetを使うのだが、毎回オプションを忘れてしまうのでメモ。

適当なディレクトリを掘って

$ wget -r -L -l 1 -k http://...

これでウマー

  -r,  --recursive          再帰ダウンロードを行う
  -l,  --level=NUMBER       再帰時の階層の最大の深さを NUMBER に設定する (0 で無制限)
  -L,  --relative           相対リンクだけ取得対象にする
  -k,  --convert-links      HTML 中のリンクをローカルを指すように変更する

深いディレクトリ階層が出来てほしくなければ、

  -nd, --no-directories           ディレクトリを作らない
  -nH, --no-host-directories      ホスト名のディレクトリを作らない

とかを併用するとよい。

丸ごとダウンロードするのでサーバに優しくないかも。まあ、(ウチの)イントラの中でやる分にはプロキシ通すから、みんなでやっても大丈夫なはず。