Что нового

Автоматизация скачивания файлов с сайта

Meta2

Новичок
Сообщения
1
Репутация
0
Дано:
Есть сайт (HP Care Pack Central), на этом сайте есть раздел "Я хочу просмотреть услуги HP Care Pack" (доступен на главной странице)

В этом разделе приводятся ссылки на подразделы, путём навигации по которым можно спуститься до уровня конкретного продукта. Спустившись до уровня продукта можно скачать перечень программ Care Pack, доступных для этого продукта.

Иерархия разделов, ведущая к конкретному продукту, выглядит примерно так: "Начальная страница > HP ProLiant > Серверы серии HP ProLiant DL > Серверы HP ProLiant DL36x > ProLiant DL360 G7". Добравшись до страницы продукта, надо нажать на кнопу "Экспортировать список", в результате чего, список Care pack-ов скачается в виде Excel.

Собственно, задача состоит в том, чтобы написать скрипт, который обходит дерево разделов, и скачивает файлы.

При скачивании надо обратить внимание на то, что в выпадающем списке установлено значение "Russian Federation".

Ссылка в адресной строке браузера, ведущая к продукту "HP ProLiant > Серверы серии HP ProLiant DL > Серверы HP ProLiant DL36x > ProLiant DL360 G7" имеет совершенно дикий вид:
Код:
http://h20559.www2.hp.com/portal/site/cpc/template.PAGE/public/?javax.portlet.tpst=67778a6e4bb58e57aad4ab02b053ce01&javax.portlet.pbp_67778a6e4bb58e57aad4ab02b053ce01=cpcNodeIdentifierAsString%3D30057&javax.portlet.prp_67778a6e4bb58e57aad4ab02b053ce01=wsrp-navigationalState%3Daction%25253DdetermineNodeContents%25257CcpcNodeIdentifierAsString%25253D30057&javax.portlet.begCacheTok=com.vignette.cachetoken&javax.portlet.endCacheTok=com.vignette.cachetoken

Совершенно неясно, как можно автоматизировать скачивание путём, скажем, конструирования ссылки на лету, путём замены какой-либо её части.

Предварительный анализ показал, что в адресной строке меняются части cpcNodeIdentifierAsString и CcpcNodeIdentifierAsString но сопоставить значения этих параметров и раздел не удалось.
 
Верх