Redline
AutoIT Гуру
- Сообщения
- 506
- Репутация
- 375
Есть html-файл, пытаюсь получить содержимое заголовков <h1> одним регэкспом.
Примеры заголовков(в файле может быть любой из них или все сразу ;)):
На выходе нужен текст заголовка без тегов <strong> & </strong>
Мои потуги:
Работает только с первым и вторым примером.
По идее нужно каким-то способом повторить конструкцию (?:<strong>)*(.+?)(?:</strong>)*
Примеры заголовков(в файле может быть любой из них или все сразу ;)):
Код:
$sHTML = '<h1>Заголовок заголовок</h1>'
$sHTML = '<h1 class="tzag"><strong>Заголовок заголовок</strong></h1>'
$sHTML = '<h1><strong>Заголовок</strong><strong> заголовок</strong></h1>'
На выходе нужен текст заголовка без тегов <strong> & </strong>
Мои потуги:
Код:
#include <Array.au3>
$sHTML = '<h1>Заголовок заголовок</h1>'
;~ $sHTML = '<h1 class="tzag"><strong>Заголовок заголовок</strong></h1>'
;~ $sHTML = '<h1><strong>Заголовок</strong><strong> заголовок</strong></h1>'
$aHeaders = StringRegExp($sHTML, '<h1.*?>(?:<strong>)*(.+?)(?:</strong>)*</h1>', 3)
_ArrayDisplay($aHeaders)
Работает только с первым и вторым примером.
По идее нужно каким-то способом повторить конструкцию (?:<strong>)*(.+?)(?:</strong>)*