Запрос стоимости услуг
Обслуживание компьютеров Обслуживание сайта Продажа компьютеров Продажа лицензионного ПО
Проектирование и монтаж ЛВС Заправка картриджей Обслуживание 1С Прочие
Продвижение сайтов от Сеон

Обзор программ для распознавания текста


У пользователей, которым приходится работать с документами, иногда возникает необходимость перевести текст с бумаги в цифровой документ, чтобы с ним можно было впоследствии работать в текстовом редакторе. Набирать текст с листка вручную – занятие довольно трудоемкое и неблагодарное, особенно если этого текста не один листик, а страниц 20-30, или даже больше. В таком случае может сильно пригодиться специальный инструмент для распознавания текста, называемый OCR (Optical Character Recognition). Программа оптического распознавания текста поможет выиграть время, которое вы могли бы потратить на перепечатку текста, а также даст возможность сохранить иллюстрации, что порой тоже очень важно. В данной статье мы проведем небольшой обзор наиболее популярных и востребованных OCR-инструментов

ABBYY Fine Reader

Программа ABBYY Fine Reader является одним из лучших инструментов для распознавания отсканированных документов. Также данная программа может распознавать PDF и DjVu-файлы.

Fine Reader имеет встроенный текстовый редактор с проверкой орфографии, может проводить распознавание текста с изображений почти всех форматов, поддерживает более 180-ти языков. Программа позволяет проводить довольно качественное извлечение текста даже из тех изображений, которые были сделаны при помощи цифровой камеры и имеют неравномерное освещение и недостаточную резкость.

Программа ABBYY Fine Reader выпускается в трех версиях: Home Edition, Professional Edition и Corporate Edition. Первая версия предназначена для домашнего использования и имеет слегка упрощенный интерфейс, вторая больше подходит для профессиональной работы с текстом, так как ее функциональность несколько шире, а версия Corporate Edition ориентирована на совместное использование в различных организациях.

ABBYY Fine Reader является платной программой, пробную демо-версию продукта можно бесплатно скачать на официальном сайте разработчика, который находится по адресу Abbyy.ru

OmniPage

OmniPage – это еще один качественный профессиональный инструмент для распознавания текста с графических и PDF-файлов. Программа обеспечивает качественное и быстрое распознавание документа с полным сохранением его структуры, что особенно важно при распознавании документов, которые содержат таблицы.

OmniPage имеет поддержку более чем 120 языков, также в программу встроены распознавательные словари для юридических, финансовых и медицинских терминов. Помимо распознавания текста, программа также имеет такие функции, как конвертация документов в PDF, конвертация электронных документов в аудиофайл и распознавание текста с изображения напрямую в аудиофайл.

Программа OmniPage также платная, приобрести ее можно на официальном сайте разработчика - Nuance.com.

OCR CuneiFrom

Программа OCR CuneiFrom после разработки позиционировалась как платный продукт, однако со временем компания-разработчик стала распространять ее бесплатно и даже открыла исходные коды программы, предложив всем желающим принять участие в улучшении работы программы. OCR CuneiFrom имеет простой, но приятный интерфейс, и может распознавать текст на более чем 20-ти языках. При распознавании программа сохраняет форматирование текста и расположение таблиц, а встроенные алгоритмы оптического распознавания позволяют выполнять извлечение текста даже из нечетких ксерокопий и факсов.

Программа OCR CuneiFrom является, пожалуй, лучшим бесплатным инструментом для распознавания документов. Скачать бесплатно данную утилиту можно на официальном сайте разработчика по адресу Cognitiveforms.ru.

Помимо программ для распознавания текста, вы можете воспользоваться еще и специальными сервисами, с помощью которых можно выполнять распознавание документов в режиме онлайн. Разумеется, их возможности несколько ограничены по-сравнению с возможностями специализированных программ, однако для небольших объемов такие сайты вполне сгодятся.

FineReader Onine

Сервис FineReader Online от компании ABBYY представляет собой «облегченную» версию программы FineReader. Так же, как и программа, онлайн-сервис отличается отличным качеством распознавания и поддержкой практически всех графических форматов. Распознанный текст можно загрузить на локальный диск компьютера или же экспортировать напрямую в облачные сервисы Google, Dropbox или Evernote.

К сожалению, так же, как и «настольная» версия, онлайновый FineReader является платным – оплата проводится за каждую распознанную страницу текста.

Online OCR

Сайт Online OCR хотя и не обещает таких результатов, как FineReader Online, но зато пользование им обойдется вам существенно дешевле. Сервис поддерживает распознавание документов на более чем 30-ти языках, и может сохранять распознанный текст в форматах .doc, .xls, .rtf, .txt, .html и .pdf.

При хорошем качестве сканированного изображения сервис Online OCR показывает весьма хорошие результаты – распознавание текста проводится почти без ошибок, с сохранением структуры. А вот с нечеткими сканами Online OCR справляется из рук вон плохо – иногда проще напечатать самому, чем исправлять то множество ошибок, которое получается при распознавании плохого исходника.

New OCR

И последний «герой» нашего обзора – абсолютно бесплатный онлайн-сервис New OCR. Сайт поддерживает распознавание на более, чем 50-ти языках и позволяет выполнять извлечение текста из всех популярных графических файлов, также для обрабатываемых сканов доступны такие функции, как увеличение контрастности, поворот изображений и выбор области распознавания.

Распознанный текст можно загрузить на компьютер (сервис поддерживает все распространенные форматы документов, в том числе формат .odt) или же отправить в хранилище «Документы Google».

Единственный недостаток сервиса New OCR – англоязычный интерфейс, однако он довольно прост, так что даже при самых начальных знаниях английского распознать текст не составит для вас труда.

Наша организация оказывает услугу профилактическое обслуживание компьютеров.