Что нового

полный алфавит для OCR (tesseract)

running-frag

why me?
Сообщения
441
Репутация
60
ребят 101% уверен что есть люди которые знают и умеют но не палятся :laugh:
разкурил на днях обучение данного OCR, уже умею обучать :-[

сейчас стоит проблема в наборе символов и собственно текста

по сабжу, нужен текст который содержит в себе внятные слова и в его составе есть полный алфавит (нижний + верхний регистры) + цифры + пунктуацию

так же хочется что бы текст был внятный (ну что б проверить было легко)

ps: нужно только англ. текст, русский не интересует
 

sngr

AutoIT Гуру
Сообщения
1,010
Репутация
408
C:\WINDOWS\system32\charmap.exe - таблица символов.
 
Автор
R

running-frag

why me?
Сообщения
441
Репутация
60
sngr [?]
C:\WINDOWS\system32\charmap.exe - таблица символов.
Не подойдёт. Набор текста можно и проклацать каждую клавишу на клаве. И получить чёткие буквы. Задача же именно осознанный текст. Самый простой пример это "TT" или "tt". Даже с обучением алфавита (без текста) это будет всё одна буква и явно не Т.

ps: Это тяжело обьяснить если ты не сталкивался с обучением Tesseract. :(
 

Belfigor

Модератор
Локальный модератор
Сообщения
3,608
Репутация
941
Раздувая текстовую базу ты будешь увеличивать время распознавания, и в итоге там где у тебя будет не TT а например ri или же II, у тебя будет появляться тот же TT. Пример, сунь любой не сильно разборчивый скан текста (например 75-50 дпи) в акробат ридер, перед этим несколько раз отсканированный, распечатанный, отсканированный, и тд и тп, и начинай учить его понимать что там написано. Через часа эдак пол, он у тебя даже нормальные знаки распознавать перестанет. Если тессеракт не понимает нормальный текст который понимает человек, проблема не в тессеракте а в тексте с которым он работает т.к. тессеракт и прочие OCR движки в первую очередь рассчитаны на работу с текстом с оптимальным разрешением 200dpi и лучше. А в любой игре за редким исключением буковка занимает 3-4 х 5-7 пикселей, и то заглавная. Когда текст на листе с разрешением 300dpi будет занимать те же 15-20 на 25-35 пикселей. Если у игры шрифт квадратный и букву можно уместить в прямоугольник, проще самому написать распознавание текста для такого шрифта чем научить тессеракт работать с мелкопрофильным шрифтом.
 
Автор
R

running-frag

why me?
Сообщения
441
Репутация
60
Belfigor [?]
буковка занимает 3-4 х 5-7 пикселей
Ты упускаешь или просто промалчиваешь один момент, но не будем его раздувать.

А вообще да, тут пробывал научить его выпадающему меню (в добавок обычному тексту в ingame notepad) такую чушь начал писать, то что раньше обрабатывало типО правильно - перестало. В общем в очередной раз разочеровался в tesseract.
 

Belfigor

Модератор
Локальный модератор
Сообщения
3,608
Репутация
941
Дак я же говорю, если буквы в тексте можно поместить в прямоугольник\квадрат, то проще написать самому, считываешь предполагаемую область буквы (определяешь размер квадрата текущей буквы), далее составляешь с помощью того же TrimColor разметку этой буквы и сравниваешь с эталоном полученную чек сумму.
 
Верх