Что нового

Как распарсить html страницу

astanid

Новичок
Сообщения
38
Репутация
0
Это страница тестов. Планируется записать вопросы и варианты в базу (Excel хотя бы), не торопять разобрать - потом зайти ответить.
Нужно по хоткею распарсить страницу и записать в excel вопрос и варианты ответов.
Вот с парсингом страницы проблемы. Кто может помочь примером ?

страницы во вложении (несколько штук для примера). нужная часть кода страницы вот эта
Код:
 <section>
                <h1 class="np">PHP Test</h1>
                <h2 class="oH2Low">Question 1 of 50</h2>
            </section>
            <form id="questionForm" action="https://www.upwork.com/ostep/test2.php/attempt/serve" method="POST" class="oFormTop">
                                <p class="oTxtMed"><pre>Which of the following is not a predefined constant?</pre></p>
                                <fieldset class="oFormField">
                    <div id="answerOptions" class="oOptGrp oOptBoxGrp " style="width: 100%;">
                                                                        <div class="oOpt oOptBox">
                                <label class="oOptLbl">
                                    <input type="checkbox" name="answers[a]" class="optInput" id="answers_a" />                                    <pre class="np">TRUE</pre>
                                </label>
                            </div>
                                                                                                <div class="oOpt oOptBox">
                                <label class="oOptLbl">
                                    <input type="checkbox" name="answers[b]" class="optInput" id="answers_b" />                                    <pre class="np">FALSE</pre>
                                </label>
                            </div>
                                                                                                <div class="oOpt oOptBox">
                                <label class="oOptLbl">
                                    <input type="checkbox" name="answers[c]" class="optInput" id="answers_c" />                                    <pre class="np">NULL</pre>
                                </label>
                            </div>
                                                                                                <div class="oOpt oOptBox">
                                <label class="oOptLbl">
                                    <input type="checkbox" name="answers[d]" class="optInput" id="answers_d" />                                    <pre class="np">__FILE__ </pre>
                                </label>
                            </div>
                                                                                                <div class="oOpt oOptBox">
                                <label class="oOptLbl">
                                    <input type="checkbox" name="answers[e]" class="optInput" id="answers_e" />                                    <pre class="np">CONSTANT</pre>
                                </label>
                            </div>
                                                                </div>
                </fieldset>
или может принципиально другой способ логичней использовать чтобы записать данные в данном случае ?
 

Вложения

  • upwork.rar
    15.6 КБ · Просмотры: 2
Автор
A

astanid

Новичок
Сообщения
38
Репутация
0
В целом разобрался (в своем случае по крайней мере). Все делается с помощью _StringBetween
Код:
$answers=_StringBetween($sFileRead, '<pre class="np">','</pre>')
 _ArrayDisplay($answers, "Answers")
 
Верх