пятница, 12 августа 2011 г.

Качалка для rghost.ru



Есть такой файлообменник rghost.ru с очень демократичным подходом к хранению файлов: максимальный размер файла составляет 50 мегабайт, а максимальный срок хранения после последнего скачивания - 30 дней. Но разговор не о его прелестях, а о том, как быстро обработать пачку ссылок на файлы, хранящиеся на этом обменнеке. На странице скачивания нет никаких счетчиков времени и прочих усложнителей закачки, что есть очень хорошо.

Для решения поставленной задачи я написал малюсенький скрипт на bash с использование pcregrep и curl:

#/bin/sh
html=`curl $*`
wget -nc `echo $html |pcregrep -o 'http\:\/\/rghost.ru/download[^\"]+'|grep -v metalink|uniq`

Синтаксис простой:
rghostdl.sh список_url