Доброго дня, уважаемые знатоки.
Задача примерно следующая:
1. Имеется интернет-форум, точнее одна из его многочисленных тем.
В этой теме куча страниц, URL первой значится как forum.org/forum/viewforum.php?f=цифры
Последующие выглядят как: forum.org/forum/viewforum.php?f=цифры&start=50
На каждой следующей странице последние цифры увеличиваются на 50, то есть на каждой - по 50 записей.
Всего около 3100 записей (названий тем) с ссылками вида: forum.org/forum/viewtopic.php?t=семизначное число (может есть и шестизначные и даже пяти...)
2. Есть обычный эксел файл, где каждая строка уникальна, и соответствует как минимум одной записи темы, на какой-то из страниц этой темы. Часто - такие записи имеют повторы на рандомных страницах.
Задача: соорудить автоматизированный поиск и сравнение между значениями строк в эксел-файле и записями на страницах форума. Интересны только уникальные значения с совпадением как минимум двух слов. То есть надо найти все уникальные записи без повторов и кучи мусора (служебной инфы, которая указывается в названиях каждой из тем)
Ну и соответственно видеть ссылки на эти уникальные записи.
Может как то можно просто выдрать из темы значения всех 3100 записей, вместе с их ссылками и провести сравнение...
Дано:
Полный ноль в программировании :( хотя и инженер по связи и ближе к первым четырем уровням OSI))
Слышал подсказку что можно решить как-то эту задачу посредством MS Access и макросов, но не имею ни малейшего понятия как, куда и что. Что-то про регулярные выражения и т.п. :stars:
Собственно вроде мозг есть, и руки не кривые, так что прошу посильной помощи :-[
С меня - лучи добра и пожелания долго здравствовать! ;D
Задача примерно следующая:
1. Имеется интернет-форум, точнее одна из его многочисленных тем.
В этой теме куча страниц, URL первой значится как forum.org/forum/viewforum.php?f=цифры
Последующие выглядят как: forum.org/forum/viewforum.php?f=цифры&start=50
На каждой следующей странице последние цифры увеличиваются на 50, то есть на каждой - по 50 записей.
Всего около 3100 записей (названий тем) с ссылками вида: forum.org/forum/viewtopic.php?t=семизначное число (может есть и шестизначные и даже пяти...)
2. Есть обычный эксел файл, где каждая строка уникальна, и соответствует как минимум одной записи темы, на какой-то из страниц этой темы. Часто - такие записи имеют повторы на рандомных страницах.
Задача: соорудить автоматизированный поиск и сравнение между значениями строк в эксел-файле и записями на страницах форума. Интересны только уникальные значения с совпадением как минимум двух слов. То есть надо найти все уникальные записи без повторов и кучи мусора (служебной инфы, которая указывается в названиях каждой из тем)
Ну и соответственно видеть ссылки на эти уникальные записи.
Может как то можно просто выдрать из темы значения всех 3100 записей, вместе с их ссылками и провести сравнение...
Дано:
Полный ноль в программировании :( хотя и инженер по связи и ближе к первым четырем уровням OSI))
Слышал подсказку что можно решить как-то эту задачу посредством MS Access и макросов, но не имею ни малейшего понятия как, куда и что. Что-то про регулярные выражения и т.п. :stars:
Собственно вроде мозг есть, и руки не кривые, так что прошу посильной помощи :-[
С меня - лучи добра и пожелания долго здравствовать! ;D