認証が必要なサイトをwgetする
Cookieで認証しているサイトのコンテンツをwgetのCookieを送信する機能で取ってくる。
% wget --help | grep cookie --no-cookies don't use cookies. --load-cookies=FILE load cookies from FILE before session. --save-cookies=FILE save cookies to FILE after session. --keep-session-cookies load and save session (non-permanent) cookies.
--load-cookiesに指定するFILEのフォーマットはNetscapeのcookies.txtの形式だが、このファイルをわざわざ作ったり探しに行ったりするのは面倒なので、下記の方法の方がお手軽。(マニュアルに書いてある方法)
- LiveHTTPHeadersかTamper Dataを開いてヘッダを記録する
- リクエストヘッダの "Cookie:" の行をコピー
- wget --no-cookies --header "コピーした文字列"