snoitaleR
AutoIT Гуру
- Сообщения
- 855
- Репутация
- 223
Есть документ WORD с текстами и таблицами, он сохраняется как вэб-страница, но WORD, как известно, добавляет огромное количество лишних ключей в теги...
Подскажите, пожалуйста, как почистить теги <p>, <div>, <span>, <td>, единственно, очень желательно сохранить ключи colspan и rowspan, отвечающие за объединение ячеек... Можно удалить и другие ненужные теги и ключи, но без потери текста...
Пример:
Есть текст:
Нужно получить:
Подскажите, пожалуйста, как почистить теги <p>, <div>, <span>, <td>, единственно, очень желательно сохранить ключи colspan и rowspan, отвечающие за объединение ячеек... Можно удалить и другие ненужные теги и ключи, но без потери текста...
Пример:
Есть текст:
Код:
<p class=MsoNormal><span lang=EN-US style='mso-ansi-language:EN-US'><o:p> </o:p></span></p>
Код:
<p><span> </span></p>