Что нового

[Данные, строки] Распознавание текста

Дмитрий1984

Новичок
Сообщения
24
Репутация
0
Дано: игра, в которой необходимо в определенном прямоугольнике распознать текст. Игра на флэш. Шрифт более-менее стандартный. Фон достаточно однородный. Но могут быть шумы.

Пример того, что нужно распознать:
5819a-clip-3kb.jpg

Пробовал через прогу tesseract - она этот файл вообще не распознает - возвращает "пусто".
 

Belfigor

Модератор
Локальный модератор
Сообщения
3,608
Репутация
941
тессеракт надо потому что обучать, перед тем как скармливать ему текст
 
Автор
Д

Дмитрий1984

Новичок
Сообщения
24
Репутация
0
Belfigor сказал(а):
тессеракт надо потому что обучать, перед тем как скармливать ему текст

Не совсем понял. Можно подробнее?
1) Обучать - это как? Добавлять параметры или какие-то действие производить?
2) Банальный код ввёл для распознавания этой текста с этой картинки - ответ "ничего".
Код:
$image = '1.jpg'
ShellExecuteWait(@ScriptDir & '\tesseract.exe', $image & ' capcha -l rus', @SW_MINIMIZE)
$sText = FileRead('capcha.txt')
MsgBox(0,'', $sText)
 

Belfigor

Модератор
Локальный модератор
Сообщения
3,608
Репутация
941
Вроде и тут были темы про обучение тессеракта новым шрифтам, ему последовательно скармливаются экземпляры знаков, объясняется ху из ху и тд и тп. Я находил записи о процессе и самое его описание в гугле несколько лет назад.
 
Верх