Страница 1 из 1

Распознавание текста.

Добавлено: 02 ноя 2009, 16:56
kashey
Предлагаю альтернативный подход к файнридеру.
Мою программу можно посмотреть здесь
При помощи неё я сейчас и обрабатываю тексты диссертаций. При этом картинка сжимается, где-то в 50 раз по сравнению с исходным размером. В общем-то она не многим уступает pdf- формату

Re: Распознавание текста.

Добавлено: 03 ноя 2009, 09:19
pas2005
kashey
Поподробнее можно?? Аналог файнридера это или акробата? Что там такого инновационного? В чем заключается обработка?

Re: Распознавание текста.

Добавлено: 03 ноя 2009, 21:59
StR
pas2005 писал(а):Аналог файнридера это или акробата?

Аналог одной из функций фотошопа.

pas2005 писал(а):В чем заключается обработка?

Преобразование картинки в битовый формат. Задается порог, все, что светлее - белое, что темнее - черное.

При правильном подборе порога, возможно, потом даже удастся распознать файнридером.

Re: Распознавание текста.

Добавлено: 03 ноя 2009, 23:26
kashey
Примерно так.
С фотошопом не пробовал, но скорее всего он не позволит обработать большинство страниц диссертаций.
Пробовал использовать другие программы, но в результате от них отказался, сейчас пользуюсь своей.

файнридер изначально не может распознать подобные страницы.

Re: Распознавание текста.

Добавлено: 04 ноя 2009, 01:49
StR
kashey писал(а):Примерно так.

Да куда нам...

Re: Распознавание текста.

Добавлено: 04 ноя 2009, 02:27
kashey
StR писал(а):
kashey писал(а):Примерно так.

Да куда нам...

Можете что-то своё предложить?