Что нового

Распознавание текста с картинки

jilexandr

Знающий
Сообщения
129
Репутация
6
Есть сайт, на нем есть вопросы, отображены как картинка, нужно сделать програмку таким образов, чтобы она распознавала выделенный участок страницы, читабельность полная, как можно сделать?


Добавлено:
Сообщение автоматически объединено:

и как программа для создания GUI?
 

WSWR

AutoIT Гуру
Сообщения
941
Репутация
363
jilexandr

Язык на картинке какой?
А так можно Tesseract использовать.
 

WSWR

AutoIT Гуру
Сообщения
941
Репутация
363
jilexandr
Самый простой вариант со скриншотом.

Установить Tesseract http://code.google.com/p/tesseract-ocr/downloads/list

скрипт положить в его папку

Код:
#include <ScreenCapture.au3>

Sleep(10000)

$image = '3.jpg'
_ScreenCapture_Capture(@ScriptDir & '\' & $image)

ShellExecuteWait(@ScriptDir & '\tesseract.exe', $image & ' capcha -l rus', @SW_MINIMIZE)
$sText = FileRead('capcha.txt')
MsgBox(0,'', $sText)
 

Дмитрий1984

Новичок
Сообщения
24
Репутация
0
WSWR сказал(а):
jilexandr
Самый простой вариант со скриншотом.

Установить Tesseract http://code.google.com/p/tesseract-ocr/downloads/list

1) Если я передаю кому-то программу с tesseract - эта программа должна и у него быть установлена? Или просто приложить файл tesseract.exe ?

2) Где можно на русском прочитать про функции, примеры использования этой проги?

3) Пробовал ей распознать вот этот рисунок(приложение) - не получается. Код скрипта:

Код:
$image = '1.jpg'
ShellExecuteWait(@ScriptDir & '\tesseract.exe', $image & ' capcha -l rus', @SW_MINIMIZE)
$sText = FileRead('capcha.txt')
MsgBox(0,'', $sText)
 

Вложения

  • 1.jpg
    1.jpg
    3 КБ · Просмотры: 362

madmasles

Модератор
Глобальный модератор
Сообщения
7,790
Репутация
2,322
Дмитрий1984
Не надо в разных темах создавать одинаковые сообщения. Какую оставить? Если ответа не будет, оставлю это, остальные удалю.
 

Дмитрий1984

Новичок
Сообщения
24
Репутация
0
madmasles сказал(а):
Дмитрий1984
Не надо в разных темах создавать одинаковые сообщения. Какую оставить? Если ответа не будет, оставлю это, остальные удалю.

Продублированную тему удалил.
 

Pers__

Новичок
Сообщения
2
Репутация
0
можно и на Autoit сделать , но работать будет медленно.
примерный смысл такой:

Сканим пиксели на цвет\яркость и записываем значение в строку.
сравниваем строку с известными заранее записанными значениями (0-9)
профит

сколько значений сканить - подбирать нужно , минимально 4 получается , но проще не париться и сделать 9 (поле 3на3)
 

Дмитрий1984

Новичок
Сообщения
24
Репутация
0
Pers__ сказал(а):
можно и на Autoit сделать , но работать будет медленно.
примерный смысл такой:

Сканим пиксели на цвет\яркость и записываем значение в строку.
сравниваем строку с известными заранее записанными значениями (0-9)
профит

сколько значений сканить - подбирать нужно , минимально 4 получается , но проще не париться и сделать 9 (поле 3на3)

Если это на флэш и при изменении числа промежутки и сами цифры могут немного растягиваться. Мне писали, что тессеракт как-то обучать можно... Или есть альтернативы?
 
Верх