Захотелось парсить яндекс

Не силён, ни в curl’e ни в языках программирования, так что пользуюсь wget’ом. Куку у яндекса можно получить вот по этой ссылке http://kiks.yandex.ru/su/ что мы и делаем (все команды пишутся в одну строку):

wget --cookies=on --keep-session-cookies --save-cookies=cookie.txt 
--load-cookies=cookie.txt "http://kiks.yandex.ru/su/"

Теперь этим же wget’ом, мы смело можем обращаться в тот же wordstat и забирать от туда страницы:

wget --cookies=on --load-cookies=cookie.txt -O result.txt 
"http://wordstat.yandex.ru/?cmd=words&text=zapros"

Остаётся эту самую страницу распарсить. Как? А пока что не знаю, надо таки научиться с текстом и тем же sed’ом работать. Как только напишу вариант скрипта – размещу его здесь.

--- Комментарии к заметке ---

artem   Фев 27, 04:56    #

А скрипт таки написал. :) Смотрим следующий пост.

---

  Помощь по Textile