четверг, 21 июня 2012 г.

Ковыряние www.theanimegallery.com



Один товарищ поделился ссылкой на страницу одной картинки на www.theanimegallery.com. Меня почему-то переклинило непременно скачать её с помощью wget или curl. Зуд  в руках был просто нестерпимым, пришлось искать способ. Никакого готового скрипта для массовой загрузки изображений с этого сайта я делать не собирался, просто стало интересно, как обойти их защиту.
Первым делом, я скопировал ссылку на загрузку изображения в нужном разрешении и добавил к ней реферер в виде ссылки на исходную страницу и запись переданных cookies в файл. Получилось что-то типа такого:
curl -c c.txt http://www.theanimegallery.com/download.php?image_id=91913 -e http://www.theanimegallery.com/image/91913

В итоге всё равно получил отлуп от сервера:
Hotlinking is not allowed

Но какие-то куки сервер передал.
Появилась другая идея. Надо попробовать кроме реферера передать еще и куки, полученные от исходной страницы. Получилось что-то вроде такого:
curl -c c.txt -v --head http://www.theanimegallery.com/image/91913

Теперь попытался скачать картинку по ссылке с использованием полученных куков.
curl -b c.txt http://www.theanimegallery.com/download.php?image_id=91913 -e http://www.theanimegallery.com/image/91913 > test.jpg

Теперь в файле "test.jpg" появилась искомая картинка.
Своего я добился, осталось теперь понять, как полученные знания можно применить.