Что нового

Создание парсера с загрузкой страницы и поиском нужных значений в коде

Death

Новичок
Сообщения
12
Репутация
0
Версия AutoIt: 3.3.12.0 3.3.6.1

Описание:
Всем привет!
Года 4 назад работал с автоитом, делал простенькие скрипты. Но сейчас всё уже забыл.
Помогите реализовать простенький парсер.

Алгоритм:
1. Получить исходный код страницы, например naprimer.com/page278.html
Тут нашёл нужную функцию,
Код:
For $page = $start to $stop
$SiteRead = InetRead("http://www.naprimer.com/page"& $page &".html")
;...
Next


2. Найти в этом коде строку:
Код:
<th class="thHead" colspan="2" height="25" nowrap="nowrap">Просмотр профиля :: Пользователь </th>
из неё извлечь и записать значение Пользователь в переменную.

3. Найти в этом коде строку:
Код:
<td valign="top"><b><span class="gen">Число</span>
из неё извлечь и записать значение Число в переменную.

Вот собственно то, что не могу реализовать. Цикл, запись в файл и т.п. я знаю как сделать, а это нет. Поэтому прошу помочь. Спасибо.
 

madmasles

Модератор
Глобальный модератор
Сообщения
7,790
Репутация
2,320
Re: [Данные, строки] Нужно сделать за меня парсер, а я посижу отдохну

Предупреждение За нарушение правил форума (пункт Б.5):
Имя темы должно нести смысловую нагрузку (отражать суть вопроса/проблемы)
Правильно сформулированное название темы привлекает больше внимания, и шансы получить конкретный ответ увеличиваются.


Данные правила могут пополняться локальными правилами раздела.
Как правильно называть темы

"[Данные, строки] Нужно сделать за меня парсер, а я посижу отдохну" - это неприемлемое название темы, переименуйте тему иначе она будет закрыта, а вам возможно будет выдан бан на несколько дней.

С уважением, ваш Глобальный модератор.











Добавлено:
Сообщение автоматически объединено:

Death,
Дайте реальную ссылку, а лучше несколько.
 
Автор
D

Death

Новичок
Сообщения
12
Репутация
0
есть вы предлагаете зарегистрироваться на сайте? :-X

Нет.
Допустим, есть исходный код страницы сайта, в котором есть строка:
Код:
<th class="thHead" colspan="2" height="25" nowrap="nowrap">Просмотр профиля :: Бог Autoit </th>
Мне нужно, что бы скрипт нашёл имя пользователя - в данном случае "Бог Autoit" в исходном коде страницы, и записал это имя в переменную.

Вообщем сделал сам, крайне коряво, но... то что нужно получил.

Код:
#include <Inet.au3>
#Include <File.au3>

$start = 1
$stop = 1000
$hFile = FileOpen("result.txt", 1)

For $member = $start to $stop
		$SiteRead = InetGet ("http://www.naprimer.ru/page"& $member &".html", "page"& $member &".txt")
		$StrName = FileReadLine ("page"& $member &".txt" ,91)
		$StrPosts = FileReadLine ("page"& $member &".txt" ,106)
		$StrName2 = StringMid ($StrName, 61)
		$StrPosts2 = StringMid ($StrPosts, 43, 7)
		FileWrite($hFile, $StrName2 & ";" & $StrPosts2 & ";" & @CRLF)
		FileDelete ("page"& $member &".txt")
Next


Остаётся только result.txt почистить от мусора.

Всем спасибо за помощь!
 
Верх