Доброе время суток!
Столкнулся с небольшой проблемой. Есть код для парсинга HTML страничек на наличие данных.
Он на выходе в txt файле выдаёт значения в данном виде:
Подскажите, как правильно оформить код для того, чтобы несуществующие ID не отображались в текстовом файле?
Заранее благодарен за подсказки)
Столкнулся с небольшой проблемой. Есть код для парсинга HTML страничек на наличие данных.
Код:
#include <MsgBoxConstants.au3>
#include <Inet.au3>
#include <StringConstants.au3>
#include <Array.au3>
#include <Inet.au3>
$Fname ='item.txt'
$Fname2 ='works.txt'
$i=1
Dim $items[$i+1][2]
FileOpen($Fname, 0)
$timer=TimerInit()
While FileReadLine($Fname, $i)
redim $items[$i+1][2]
$Items[$i][0]=FileReadLine($Fname, $i)
$i+=1
toolTip("Страница = " & $i & " Прошло времени = " & round((Timerdiff($timer)/1000), 0) & " сек", 0,0)
WEnd
FileClose($Fname)
$maxItems=UBound($Items)
$maxItems2=2
$Items[0][0]=UBound($Items)-1
$q=0
$k=0
$i=0
$timer=TimerInit()
Dim $aLinks[2]
For $i=1 to UBound($Items)-1
$WinUrl='https://блаблабла/showprofile/item/' & $Items[$i][0] &'/'
toolTip("Страница = " & $i & " Прошло времени = " & round((Timerdiff($timer)/1000), 0) & " сек", 0,0)
$sHTML = _INetGetSource($WinUrl)
If StringRegExp($sHTML,'(?si)<div class="pab_char"><span>Age</span>
(.*?)</div>', 1)=0 then ContinueLoop
$aLinksRaw_Age= StringRegExp($sHTML,'(?si)<div class="pab_char"><span>Age</span>
(.*?)</div>', 3)
$Items[$i][1]=$aLinksRaw_Age[0]
Next
FileOpen($Fname2, 2)
For $i=1 to UBound($Items)-1
toolTip("Запись в txt = " & $i & " Прошло времени = " & round((Timerdiff($timer)/1000), 0) & " сек", 0,0)
If StringRegExp($sHTML,'(?si)<div class="pab_char"><span>Age</span>
(.*?)</div>', 1)=1 then ContinueLoop
FileWriteLine($Fname2, "Id " & $Items[$i][0] & " Age " & $Items[$i][1] )
For $j=2 to $items[0][1]-1
If $Items[$i][$j]="" then exitloop
FileWriteLine($Fname2, @TAB&@TAB&" Age " & $Items[$i][$j])
Next
Next
FileClose($Fname2)
Он на выходе в txt файле выдаёт значения в данном виде:
Код:
Id 40541 Age 20
Id 39107 Age 25
Id 40657 Age 37
Id 40603 Age 26
Id 40653 Age 25
Id 747 Age 27
Id 15 Age
Id 11 Age
Заранее благодарен за подсказки)