Что нового

[Данные, строки] Хочу написать скрипт для выделения тегов (меток) из текста.

vaf

Новичок
Сообщения
189
Репутация
2
Доброго времени суток всем.
Ищу способ как грамотно выделить метки из текста.
Дан длинный текст, нужно из него выделить несколько ключевых слов, характеризующих данный текст. Пока сделал так, что ключевое слово, это самое часто встречающееся слово в тексте, но это далеко не всегда так.
Может есть какие то наработки в этой области ?
 

joiner

Модератор
Локальный модератор
Сообщения
3,556
Репутация
628
vaf
это на подобии : найти главную тему романа Евгений Онегин.
или это список анекдотов?
 

C2H5OH

AutoIT Гуру
Сообщения
1,473
Репутация
333
Вот Цветаева говорила что в стихах о любви само слово "любовь" (и его вариации) не должно встречаться. И с этим не поспоришь! Так что, имхо, наиболее часто встречающиеся слова совсем не характеризуют суть текста.

Для того чтобы найти наработки неплохо бы научиться пользоваться поиском
(сам смысл слова "наработки" в том что кто-то уже работал над этой проблемой)
:search:
http://autoit-script.ru/index.php/topic,5792.0.html
http://autoit-script.ru/index.php/topic,6720.0.html
 

joiner

Модератор
Локальный модератор
Сообщения
3,556
Репутация
628
vaf [?]
что ключевое слово, это самое часто встречающееся слово в тексте, но это далеко не всегда так.
C2H5OH, видишь как оно?. тут сродни поиска смысла. только кто что увидит. я помню со школы еще, поиск ключевых момент по литературе. но если это математика, то тут алгоритмы подойдут. только автор не уточнил. раз слово часто встречается и при этом не является ключевым, то поиск повторяющихся слов не подходит. но если верно то, что ключевое слово то, которое больше всех повторяется и верно то, что часто может быть - ключевое слово одно в куче слов, то :stars:
 
Верх