Программы для редактирования сканированных документов. Как отсканировать документ для дальнейшего редактирования


Как отредактировать отсканированный документ с помощью специальных программ

Процесс редактирования сканированных документов

Довольно часто среди пользователей сканеров возникает вопрос о том, как отредактировать отсканированный документ. В целом решить задачу подобного рода можно, воспользовавшись специальным программным обеспечением или онлайн-сервисом, который поддерживает конвертацию из PDF в любой удобный для редактирования формат. Ниже вы можете ознакомиться с несколькими популярными ПО и сервисами, которые помогут вам произвести конвертирование отсканированных документов с целью их дальнейшего редактирования.

Решение задачи с помощью OCR

Если вам нужно редактирование отсканированных документов, то воспользуйтесь любой программой OCR, функция которой заключается в оптическом распознавании символов. Данное ПО сравнивает символы в отсканированном файле с теми символами, которые имеются в его БД. После этого, программа данной категории производит конвертацию файла в удобный текстовый формат. Однако примите во внимание, что далеко не все OCR способны работать на бесплатной основе – среди них есть немало и платных вариантов. Также учтите, что в зависимости от того, насколько качественно вам удастся выполнить сканирование оригинала, вы можете столкнуться с различными ошибками, редактируя готовый скан. Чтобы решить непосредственно задачу связанную с тем, как редактировать сканированный текст следуйте следующей инструкции:

Но прежде чем включить сканер и отсканировать тот или иной текст, вам стоит изначально определиться с удобной для вас программой оптического распознавания символов. Далее можно ознакомиться с одними из самых популярных и распространенных среди них:

  1. Одной из самых известных программ категории OCR, является ABBYY FineReader, работающая на платной основе. Данное ПО используется для конвертирования сканов в текстовые файлы с помощью запатентованных алгоритмов, которые позволяют распознавать даже текст, имеющий не очень высокое качество. В целом преимущества программы заключаются в высокой точности распознавания текста, способности преобразовывать всю структуру и внешний вид отсканированного текста. Следовательно, она оставит на своих местах не только текст, но также таблицы, рисунки и прочее.
  2. Readiris Pro — также является довольно распространенной программой с функцией OCR, которая обладает очень удобным интерфейсом. С ее помощью можно сохранить распознанный текст в таких форматах, как XPS, OpenOffice, PDF, Word и Excel. Следует добавить, что эта программа позволяет работать с более чем сотней языков мира и форматом DjVu.
  3. Freemore OCR представляет собой программу, распространяемую абсолютно бесплатно. С ее помощью можно достаточно оперативно извлекать графику и текст с отсканированных изображений. Извлеченный текст можно сохранить в виде документа Word. Помимо этого, она обладает функцией многостраничного распознавания. Но учтите, что интерфейс программы выполнен только на английском языке. Однако данное обстоятельство не влияет на удобство ее использования.

Решение задачи с помощью онлайн-сервисов

Если вас интересует ответ на вопрос о том, как изменить отсканированный документ, не устанавливая специальных программных приложений, то воспользуйтесь любым онлайн-сервисом, предлагающим конвертирование изображений в текст. Обычно все эти ресурсы работают по одной схеме. Вам нужно лишь загрузить скан документа, предварительно сохранив его в PDF-формате, после чего следуя рекомендации выбрать нужное задание и нажать на что-то типа «Конвертировать» (везде по-разному). Затем сервис выдаст вам готовый файл в виде документа Word.

printeros.ru

Как изменить текст после сканирования

Благодаря современным технологиям больше не нужно перепечатывать вручную большое количество текста. Можно просто отсканировать документ сохранить его в электронном формате. Однако отсканированные документы не всегда соответствуют тому виду, который нужен пользователю. И тут нам на помощь придут современные программы. Наиболее актуальной и распространённой является ABBYY FineReader, который достаточно прост в использовании, если следовать инструкциям.

Лицензионную версию программы ABBYY FineReader можно заказать по приятной цене в нашем интернет-магазине.

  1. FineReader позволяет проводить различные действия с отсканированными документами. Сама программа сохраняет документ в PDF-формате. Для дальнейшего редактирования текста, например, в программе Microsoft Office Word, FineReader имеет функцию “Отправить в” и предлагает перечень редакторов.
  2. К сожалению, отсканированный текст не всегда ясен и последователен, именно для исправления данной проблемы разработчики данной программы и придумали функцию распознавания текста. Распознавание текста помогает работать с материалом ещё до его сохранения. В этой утилите всё чрезвычайно сбалансировано и продумано. При большом количестве материала каждая страница открывается в отдельном окне, что позволяет пользователю комфортно работать с документом.
  3. Программа ABBYY FineReader так же позволяет работать с изображением текста. Для этого пользователю понадобится графический редактор. В некоторых случаях будет достаточно базового Paint, однако иногда этого бывает недостаточно, в таком случае придётся прибегнуть к помощи серьёзных редакторов, таких как Adobe Photoshop и др. Помочь в работе с изображением может все та же функция “Распознавания текста”, в отдельных, более сложных случаях сперва нужно отредактировать изображение: подобрать нужный фон, убрать “помехи”, а также подобрать шрифт.
  4. Однако если вы не желаете покупать программу FineReader, которая, кстати, стоит не так уж и мало, то можно использовать онлайн редакторы, прочесть о работе которых можно в интернете. Для этого нужно будет произвести всё те же действия, загрузить файл в онлайн редактор, который предоставит более узкий спектр возможностей, однако их может вполне хватить в отдельных случаях.
  5. Зачастую процесс сканирования происходит без действий, которые были перечислены, другими словами достаточно отсканировать документ и открыть его в текстовом редакторе Microsoft Word.

Видео: Как изменить текст после сканирования

besthard.ru

Программы для редактирования сканированных документов

Программы для редактирования сканированных документов логоСоздание книжных изданий и журналов в цифровом формате для чтения возможно благодаря PDF-редакторам. Такое ПО превращает бумажные страницы в файл PDF. Представленные ниже программные продукты позволяют выполнить поставленную задачу. Применяя последние технологии, программы помогут получить отсканированное изображение с последующей цветокоррекцией или отображением текста из листа и его редактированием.

Adobe Acrobat

Продукт компании Adobe, предназначенный для создания PDF документов. Существует три версии программы, которые в определенной степени отличаются. К примеру, преобразование в формат для работы с Autodesk AutoCAD, создание цифровой подписи и совместный доступ с другими пользователями есть в премиум-версии, но отсутствуют в стандартной. Все инструменты группируются в конкретных рубриках меню, а сам интерфейс выдержан и минималистичен. Непосредственно в рабочей области вы сможете конвертировать PDF в DOCX и XLSX, а также сохранять веб-страницы как PDF-объект. Благодаря всему этому собрать собственное портфолио и настроить готовые рабочие шаблоны не составит проблем.

Интерфейс PDF-редактора Adobe Acrobat

Скачать Adobe Acrobat

Читайте также: Программы для создания портфолио

ABBYY FineReader

Одно из самых известных приложений по распознаванию текста, которое позволяет сохранять его как PDF-документ. Программа распознает содержимое в PNG, JPG, PCX, DJVU, а сама оцифровка происходит сразу после открытия файла. Здесь можно редактировать документ и сохранить его в популярных форматах, к тому же, поддерживаются таблицы XLSX. Непосредственно из рабочей области FineReader подключаются принтеры для печати и сканеры для работы с бумагами и последующей их оцифровки. Софт универсальный и позволяет полностью обработать файл от бумажного листа до цифрового варианта.

Редактирование отсканированного текста в рабочей области программы ABBYY FineReader

Скачать ABBYY FineReader

Скан Корректор А4

Простая программа по коррекции отсканированных листов и изображений. В параметрах предоставляется изменение яркости, контрастности и цветового тона. К особенностям относится запоминание до десяти последовательно введенных изображений без сохранения их на компьютере. В рабочей области настраиваются границы формата А4, чтобы полностью отсканировать бумажный лист. Русскоязычный интерфейс программы будет легким в восприятии неопытными пользователями. ПО не устанавливается в систему, что позволяет использовать его, как портативную версию.

Окно программы Скан Корректор А4

Скачать Скан Корректор А4

Итак, рассматриваемый софт дает возможность эффективно оцифровать фото для хранения на ПК или изменения цветового тона, а сканирование текста позволит конвертировать его из бумажного в электронный формат. Таким образом, программные продукты пригодятся в самых разных рабочих моментах.

Мы рады, что смогли помочь Вам в решении проблемы. Задайте свой вопрос в комментариях, подробно расписав суть проблемы. Наши специалисты постараются ответить максимально быстро.

Помогла ли вам эта статья?

Да Нет

lumpics.ru

Как отредактировать отсканированный документ в Word

С помощью программы FineReader можно легко преобразовать текст с бумажного носителя в файл формата Ворд и отредактировать его при необходимости.

Узнать все этапы проведения данной процедуры можно в представленной статье.

функции FineReader

Фото: функции FineReader

Большое количество пользователей, работающих с документами, нередко сталкиваются с необходимостью копирования текста с бумажного носителя в Word. В этом случае самым оптимальным выбором будет сканирование текста и его дальнейшее редактирование.

Сделать это возможно с помощью современной программы FineReader, она успешно преобразует обычную фотографию, полученную со скана, в осмысленный набор слов.

Работа с документом в FineReader

FineReader – наиболее актуальная программа автоматического распознавания отсканированного документа, она была создана российскими программистами. Ее главными достоинствами можно считать возможность поддерживания большого количества языков, среди которых имеются даже самые древние.

Помимо этого в этой программе допускается пакетная обработка многостраничного текста.

Ее преимуществами также можно назвать:

Пробную версию данной программы можно загрузить на официальном сайте, ее единственный недостаток заключается в том, что там установлено ограничение. Бесплатно можно обработать не более пятидесяти отсканированных страниц текста.

функция проверки

Фото: функция проверки

Полная версия программы стоит около пятидесяти долларов, на ней подобное ограничение отсутствует.

Загрузка и сканирование

Самым первым этапом работы в FineReader является загрузка и сканирование файла.

распознавание текста

Фото: распознавание текста

Для запуска процесса:

распознавание несложно оформленных документов

Фото: распознавание несложно оформленных документов

Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.

Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.

Удаление форматирования из документа

Сейчас мы более подробно разберем, как можно отредактировать отсканированный документ в программе FineReader. На представленном изображении таблицы, картинки и тексты будут отличаться разными цветами.

удаление форматирования

Фото: удаление форматирования

Данные области расшифровываются автоматически в зависимости от своего типа. В дальнейшем работать с ними в данной программе позволяет раздел под названием «Проверьте области», он располагается в правом окне FineReader.

выделение фрагмента

Фото: выделение фрагмента

Для удаления какой-либо области из документа необходимо выбрать в выпадающем меню кнопку «Удалить область», а затем можно будет щелкать мышкой по тем фрагментам, которые следует удалить.

Допускается уничтожение всех картинок и таблиц, можно оставить только лишь нужный для распознавания и дальнейшего сохранения текст.

Видео: Как изображение перевести в Microsoft Word

Редактирование

Чтобы выделить какую-либо область требуется выполнить следующие действия:

  1. кликнуть мышью по кнопке «Выделить область Текст»;
  2. нажатой левой кнопкой обвести границы текстового блока в рамку.
редактирование документа

Фото: редактирование документа

А чтобы выделить картинку или таблицу потребуется:

Многих пользователей интересует, можно ли в программе FineReader поменять размеры выделенного фрагмента. Это вполне реально, необходимо лишь щелкнуть мышью по нужному фрагменту, навести курсор на его границу до возникновения специального курсива.

Именно на нее требуется нажать левой кнопкой мыши и, удерживая, менять размер, перемещая мышь в большую или меньшую сторону.

Конвертирование в формат Word

конвертация в ворд

Фото: конвертация в ворд

После того, как все области будут выделены и отредактированы так, как нужно, можно будет приступить к распознаванию написанного документа и его сохранению в формате Word. Для проведения подобной процедуры следует нажать кнопку «Конвертировать» в меню программы.

Пользователю нужно будет подождать некоторое количество времени, после чего он сможет просмотреть результаты проделанной работы. Для сохранения текста необходимо ввести имя файла, выбрать для него место и формат сохранения.

Для создания файла в формате Microsoft Word нужно выбрать в окне «Rich Text Format (*.rtf)».

Завершающее редактирование отсканированного документа в Ворде

вспомогательные функции программы

Фото: вспомогательные функции программы

После проведенных манипуляций документ будет создан в формате Ворд, пользователь может открыть его и сравнить с оригиналом. Если будут выявлены какие-либо ошибки, их можно будет без труда отредактировать в обычном режиме программы.

Как правило, программа FineReader отлично распознает написанное на любом языке, но при плохом качестве исходника некоторые слова могут быть распознаны неверно.

Программа FineReader позволяет пользователям существенно экономить свое время при обработке текста, таблиц или картинок с бумажного носителя. Для того чтобы действительно оценить все преимущества работы с ней, можно скачать бесплатную пробную версию программы на пятнадцать дней на официальном сайте.

proremontpk.ru

Как изменить отсканированный документ в word

С помощью программы FineReader можно легко преобразовать текст с бумажного носителя в файл формата Ворд и отредактировать его при необходимости.

Узнать все этапы проведения данной процедуры можно в представленной статье.

Как изменить отсканированный документ в word

Большое количество пользователей, работающих с документами, нередко сталкиваются с необходимостью копирования текста с бумажного носителя в Word. В этом случае самым оптимальным выбором будет сканирование текста и его дальнейшее редактирование.

Сделать это возможно с помощью современной программы FineReader, она успешно преобразует обычную фотографию, полученную со скана, в осмысленный набор слов.

Работа с документом в FineReader

FineReader – наиболее актуальная программа автоматического распознавания отсканированного документа, она была создана российскими программистами. Ее главными достоинствами можно считать возможность поддерживания большого количества языков, среди которых имеются даже самые древние.

Помимо этого в этой программе допускается пакетная обработка многостраничного текста.

Ее преимуществами также можно назвать:

Пробную версию данной программы можно загрузить на официальном сайте, ее единственный недостаток заключается в том, что там установлено ограничение. Бесплатно можно обработать не более пятидесяти отсканированных страниц текста.

Как изменить отсканированный документ в word

Полная версия программы стоит около пятидесяти долларов, на ней подобное ограничение отсутствует.

Загрузка и сканирование

Самым первым этапом работы в FineReader является загрузка и сканирование файла.

Как изменить отсканированный документ в word

Для запуска процесса:

Как изменить отсканированный документ в word

Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.

Удаление форматирования из документа

Сейчас мы более подробно разберем, как можно отредактировать отсканированный документ в программе FineReader. На представленном изображении таблицы, картинки и тексты будут отличаться разными цветами.

Как изменить отсканированный документ в word

Данные области расшифровываются автоматически в зависимости от своего типа. В дальнейшем работать с ними в данной программе позволяет раздел под названием «Проверьте области», он располагается в правом окне FineReader.

Как изменить отсканированный документ в word

Для удаления какой-либо области из документа необходимо выбрать в выпадающем меню кнопку «Удалить область», а затем можно будет щелкать мышкой по тем фрагментам, которые следует удалить.

Допускается уничтожение всех картинок и таблиц, можно оставить только лишь нужный для распознавания и дальнейшего сохранения текст.

Видео: Как изображение перевести в Microsoft Word

Редактирование

Чтобы выделить какую-либо область требуется выполнить следующие действия:

  1. кликнуть мышью по кнопке «Выделить область Текст»;
  2. нажатой левой кнопкой обвести границы текстового блока в рамку.

Как изменить отсканированный документ в word

А чтобы выделить картинку или таблицу потребуется:

Многих пользователей интересует, можно ли в программе FineReader поменять размеры выделенного фрагмента. Это вполне реально, необходимо лишь щелкнуть мышью по нужному фрагменту, навести курсор на его границу до возникновения специального курсива.

Именно на нее требуется нажать левой кнопкой мыши и, удерживая, менять размер, перемещая мышь в большую или меньшую сторону.

Конвертирование в формат Word

Как изменить отсканированный документ в word

После того, как все области будут выделены и отредактированы так, как нужно, можно будет приступить к распознаванию написанного документа и его сохранению в формате Word. Для проведения подобной процедуры следует нажать кнопку «Конвертировать» в меню программы.

Пользователю нужно будет подождать некоторое количество времени, после чего он сможет просмотреть результаты проделанной работы. Для сохранения текста необходимо ввести имя файла, выбрать для него место и формат сохранения.

Для создания файла в формате Microsoft Word нужно выбрать в окне «Rich Text Format (*.rtf)».

Завершающее редактирование отсканированного документа в Ворде

Как изменить отсканированный документ в word

После проведенных манипуляций документ будет создан в формате Ворд, пользователь может открыть его и сравнить с оригиналом. Если будут выявлены какие-либо ошибки, их можно будет без труда отредактировать в обычном режиме программы.

Как правило, программа FineReader отлично распознает написанное на любом языке, но при плохом качестве исходника некоторые слова могут быть распознаны неверно.

Программа FineReader позволяет пользователям существенно экономить свое время при обработке текста, таблиц или картинок с бумажного носителя. Для того чтобы действительно оценить все преимущества работы с ней, можно скачать бесплатную пробную версию программы на пятнадцать дней на официальном сайте.

compsch.com

Как отредактировать отсканированный документ: рекомендации

#1

Обычно, такая необходимость возникает отнюдь не ради простой забавы, ведь порекомендовать полностью перенабирать документацию вручную можно лишь только в том случае, если у человека на это есть свободное время и речь не идет о больших масштабах. Мало того, вопрос о том, как отредактировать отсканированный документ, может возникнуть по причине возникновения необходимости соблюдения его максимального соответствия с оригиналом. Самый простой метод исправить ошибку в отсканированном документе, заключается в применении обычного штриха. Так, используя этот или любой другой маскирующий корректор, можно полностью или частично удалять ненужный текст, цифры, символы и знаки. При неимении под рукой таких подручных средств, на худой конец, можно заклеить лишнюю информацию белыми кусочками бумаги соответствующего размера или непрозрачным скотчем.

#2

После того, как вся лишняя информация будет устранена посредством применения всех обозначенных выше средств, документ отправляют в сканер на повторное копирование и проводят данную процедуру до тех пор, подбирая разные программные режимы, пока не получится добиться идеального результата, в котором от проведенных исправлений не останется визуального следа. Справиться с поставленной задачей можно и с помощью любого фоторедактора, а попросту говоря фотошопа, используя функцию ретуширования. Обычно, готовый результат выглядит еще более достойно, чем при проделывании всех указанных выше манипуляций, да и мороки в этом случае будет однозначно поменьше. Однако, тут может возникнуть ряд других проблем и трудностей, ведь далеко не все имеют в наличии лицензированные программы такого плана, а также обладают навыками их использования.

#3

Кроме того, оба упомянутых выше способа могут пригодиться только лишь в том случае, если отсканированный документ не нуждается в доработке и все, что требуется заключается в том, чтобы удалить лишнюю информацию, поэтому далеко не всегда они являются приемлемыми. В этом случае понадобится специальный текстовый редактор с функцией распознавания и установки совместимости приведенных символов. Но, об этом позже так как существует еще один простой метод того, как можно сразу конвертировать текст на редактор. Речь идет о сканировании документа на специальном устройстве с использованием одной из "офисовски" программ (если точнее "Microsoft Office Document Scanning"). Дело в том, что данная функция позволяет моментально распознавать все сканируемые символы и знаки копируемого документа, что максимально облегчает дальнейшую работу с ними.

#4

Простыми словами, документ будет полностью готов к редактированию сразу же после сканирования, что несомненно очень удобно. При этом не следует забывать о таком важнейшем нюансе, как сохранение цветности. Дело в том, что моментальная конвертация при сканировании чаще всего возможно только лишь при работе с документами, набранными в черно-белом цвете. При этом утверждение о том, что редактировать цветные копии будет в дальнейшем невозможно, является ошибочным, но вместе с тем процесс их редактирования может быть очень сложным и повлечь за собой много хлопот и временных затрат. Что касается сканеров, не имеющих в наличии функции моментальной конвертации, то использование оборудования подобного рода, вовсе не является поводом для отказа для решения поставленной задачи. Это обусловлено тем, что существует масса других конвертеров, которые предполагают работу с документов в уже самом программном обеспечении.

#5

Так, например, можно бесплатно скачать и установить на персональный компьютер любую программу с функцией "Optical Character Recognition". Под ней подразумевается оптическое распознавание символов, приведенных на сканированных документах. То есть достаточно пропустить скопированный текст через этот конвертер и перезапустить полученный экземпляр в любом удобном для пользователя текстовом редакторе, после чего можно смело приступать к требующимся коррекции и исправлениям. Единственная сложность, которая потенциально может возникнуть в этом случае, напрямую связана с четкостью символов, размещенных на сканируемом документе. И если нет никакой возможности найти более качественную копию, то после пропуска текста через конвертер, с ним придется повозиться, а быть может и применить местами фотошоп.

uznay-kak.ru

Как отредактировать отсканированный документ? - Програмное обеспечение - Каталог статей

После сканирования текста с изображением  получается графическое изображение документа (графический образ). Но графический образ еще не является текстовым документом. То есть вы не сможете редактировать его содержимое.Проблема распознавания текста в составе точечного графического изображения является весьма сложной.Появились так называемые системы OCR (Optical Character Recognition — оптическое распознавание символов) и опирались на специально разработанные шрифты, облегчавшие распознавание текстов.

С помощью программы  Fine reader эта проблема легко разрешается. Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках, а также для распознавания смешанных текстов.

Распознавание документов в программе FineReader 7

 

 

После установки программы FineReader в меню Программ Главного меню появляются пункты, обеспечивающие работу с ней. Окно программы имеет типичный для приложений Windows вид и содержит строку меню, ряд панелей инструментов и рабочую область.

  1. В левой части рабочей области располагается панель Пакет, содержащая список графических документов, которые должны быть преобразованы в текст. Эти графические файлы рассматриваются как части одного документа. Результаты их обрабатываются и в дальнейшем объединяются в единый текстовый файл. Форма значка, отмечающего исходные файлы, указывает, было ли произведено распознавание.
  2. Панель в нижней части рабочей области содержит фрагмент графического документа в увеличенном виде. С ее помощью можно оценить качество распознавания. Эту панель используют также при «обучении» программы в ходе распознавания.
  3. Остальную часть рабочей области занимают окна документа. Здесь располагается окно графического документа, подлежащего распознаванию, а также окно текстового документа, полученного после распознавания.
  4. В верхней части окна приложения под строкой меню располагаются панели инструментов. На приведенном рисунке включено отображение всех панелей, которые могут быть использованы в программе FineReader.
  5. Панель инструментов Стандартная содержит кнопки для открытия документов и для операций с буфером обмена. Прочие кнопки этой панели служат для изменения рабочей зоны.
  6. Панель Scan&Read содержит кнопки, соответствующие этапам превращения бумажного документа в электронный текст. Первая кнопка позволяет выполнить такое преобразование в рамках единой операции. Остальные кнопки соответствуют отдельным этапам работы и содержат раскрывающиеся меню, служащие для управления соответствующей операцией.
  7. Панель Изображение используют при работе с исходным изображением. В частности, она позволяет управлять сегментацией документа. С помощью элементов управления этой панели задают последовательность фрагментов текста в итоговом документе.
  8. Элементы управления панели Форматирование используют для изменения представления готового текста или при его редактировании.

Как ввести документ за минуту

  1. Включите сканер (если он имеет отдельный от компьютера источник питания).
  2. Внимание! Многие модели сканера необходимо включать до включения компьютера.
  3. Вставьте в сканер страницу, которую Вы хотите распознать.
  4. Нажмите на стрелку справа от кнопки Scan&Read, в открывшемся локальном меню выберите пункт Мастер Scan&Read.

Мастер Scan&Read вызывает специальный режим, при котором Вы можете отсканировать и распознать страницу или открыть и распознать графическое изображение (пример графического файла Вы можете найти в папке Dio. Она находится в папке, в которую Вы установили FineReader). При этом каждый шаг сопровождается подсказками системы.

Далее следуйте указаниям Мастера Scan&Read.

Процесс ввода документов в компьютер состоит из четырех этапов: сканирования, распознавания, проверки и сохранения результатов распознавания.

В результате сканирования появится окно Изображение, содержащее "фотографию" страницы. Затем программа попросит Вас установить параметры распознавания и приступит к распознаванию изображения, одновременно анализируя его. Обработанные участки изображения закрашиваются голубым цветом.

Результат распознавания Вы увидите в окне Текст. В этом же окне Вы можете проверить и отредактировать распознанный текст. Следуя далее указаниям Мастера Scan&Read, Вы можете либо передать распознанный текст в выбранное Вами приложение или сохранить его на диске, либо продолжить обработку следующих изображений.

Параметры сканирования

 

Используйте разрешение 300 dpi для стандартных текстов (размер шрифта 10pts. и больше) и разрешение 400-600 dpi для текстов с меньшим шрифтом (9pts. и меньше). Сканирование в сером режиме рекомендуется для повышения качества распознавания. При сканировании в сером режиме яркость регулируется автоматически. Если Вы хотите, чтобы диалог Настройки сканера открывался каждый раз перед сканированием при работе в режиме - Использовать интерфейс FineReader, Меню Сервис — Опции - на закладке Сканирование / отметьте опцию - Запрашивать опции перед началом сканирования.

 

Анализ оформления страницы может проходить как вручную, так и автоматически. В большинстве случаев программа FineReader сама выполняет сложную задачу анализа страницы. Нажмите кнопку Распознать для запуска автоматического анализа оформления страницы. Распознавание и анализ страницы выполняются одновременно.Блоками называются заключенные в рамку участки изображения.

Блок тексата - зеленый, изображения - красный, таблица - синий.Если программа выделила некоторые блоки неправильно, проще и быстрее редактировать неправильно размеченные блоки, используя инструмент для редактирования блоков, чем удалять блоки и выделять их заново вручную.

В некоторых случаях качество автоматического анализа страницы может быть улучшено с помощью изменения опций анализа оформления страницы. Для просмотра текущих опций страницы меню Сервис — Опции / закладка Распознавание.

 

Чтобы увеличить качество распознавания, разбейте сканируемые изображения так, чтобы каждой из пары сдвоенных страниц на изображении соответствовала отдельная страница пакета. Изображения могут быть разбиты как автоматически, так и вручную. 

Чтобы разбивать изображения автоматически перед добавлением в пакет на стрелке возле кнопки Сканирование/Открыть в диалоге Опции, отметьте опцию - Делить разворот книги. Чтобы разбивать изображения вручную, отметьте опцию - Разбить изображение  в меню Изображение. Устранение искажений, анализ оформления страницы и распознавание будут проходить отдельно для каждой страницы.

 

Если в окне Текст программы FineReader символы отображаются неправильно (например, "?" или "?" на месте некоторых букв), это означает, что текущий шрифт не поддерживает полностью алфавит выбранного Вами языка распознавания. Выберите шрифт, который поддерживает все символы текста распознаваемой страницы (например, Arial Unicode или Bitstream Cyberbit) на закладке Форматирование (меню Свойства — Опции) в группе Шрифты, и распознайте документ заново.

 

 

Если Вы предпочитаете редактировать распознанный текст в Microsoft Word, а не в текстовом окне программы FineReader, Вы можете сделать так, чтобы неуверенно распознанные символы остались подсвеченными. В меню Сервис выберите пункт Форматы - на закладке RTF/DOC/Word XML отметьте опцию Цветом фона и/или Цветом символа в группе - Выделять неуверенно распознанные символы. В сохраненном файле все неуверенно распознанные символы будут подсвечены выбранными Вами на этой закладке цветами.

Теперь давайте остановимся немного подробнее на панелях программы и правилах работы с программой. 

 

Основные панели

 

Главная панель программы Scan&Read

Мастер Scan&Read - запускает специальный режим сканирования и распознавания, во время которого система контролирует действия пользователя и подсказывает ему, что надо делать, чтобы получить тот или иной результат. Сканировать и распознать - запускает сканирование и распознавание документа. Сканировать и распознать несколько страниц - сканирует и распознает несколько страниц в цикле.

Открыть и распознать - позволяет открыть и распознать изображения, выбранные в диалоге Открыть (Open).

Открыть изображение - добавляет изображение в пакет, при этом копия изображения сохраняется в папке пакета.

Сканировать изображение - сканирует изображение. Сканировать несколько страниц - сканирует изображения в цикле. Чтобы остановить сканирование, в меню Файл выберите пункт Остановить сканирование. Опции - открывает закладку Сканирование/Открытие диалога Опции, на которой Вы может установить опции сканирования и предварительной обработки документа.

Распознать - распознает открытую страницу (или выделенные страницы) пакета.

Распознать все - распознает все нераспознанные страницы пакета.

Опции - открывает закладку Распознавание диалога

Опции, на которой Вы может установить опции распознавания документа.

Проверить - позволяет найти в тексте слова, содержащие неуверенно распознанные символы, и неправильно написанные слова.

Опции - открывает закладку Проверка диалога Опции, на которой Вы можете установить опции проверки документа.

Мастер сохранения результатов - открывает диалог Мастер сохранения результатов, в котором Вы можете выбрать приложение для сохранения и установить опции сохранения.

Сохранить текст в файл - сохраняет распознанный текст в файл на диск.

Передать страницы в - напрямую передает распознанный текст в выбранное приложение без сохранения его на диск. При передаче распознанного текста с нескольких страниц пакета сначала выделите их в окне Пакет.

Передать все страницы в - передает все распознанные страницы в выбранное приложение без сохранения их на диск.

Опции - открывает закладку Форматирование диалога Опции, на которой Вы можете установить опции сохранения документа.

 

Панель Изображение

 

 

 

 

Советы и примеры

 

PDF документ

 Одним из наиболее популярных форматов представления электронных документов в Internet, архивах и т.д. является формат PDF (Portable Document Format).

Открыв PDF-файл в FineReader, Вы можете его распознать, отредактировать и сохранить либо в PDF, выбрав один из четырех режимов сохранения оформления документа (только текст и картинки, только изображение, текст поверх изображения картинки, текст под изображением картинки), либо в любом другом поддерживаемом формате сохранения.

 

Чтобы установить режимы сохранения в формате PDF:

 

PDF является распространенным форматом для пересылки документов по электронной почте или публикации документов на web-сайтах. Естественно, что при публикации на web-сайтах очень важна высокая скорость открытия документов. Документ, сохраненный из программы FineReader в формате PDF, отвечает подобным требованиям. Структура PDF такова, что позволяет открывать в пользовательском браузере для просмотра первые страницы PDF документа, не дожидаясь, когда весь файл целиком будет загружен с web-сервера.

Сложная журнальная страница

Описание ситуации: плохое качество распознавания вследствие неправильного выделения блоков.

Решение: В результате автоматического анализа данной страницы были выделены лишние блоки (например, участки текста на картинке). Проверьте количество блоков, а также отредактируйте форму выделенных блоков.

Для этого воспользуйтесь инструментами на панели Изображение:

 

 

Замечание: При выделении текстовых блоков следите за тем, чтобы границы блоков совпадали с границами текста.

Книжный разворот

Описание ситуации: за одно сканирование сканируется пара страниц (книжный разворот), при этом каждая страница имеет свой угол наклона, что отрицательно сказывается на качестве распознавания, кроме того, обе страницы сохраняются на одну страницу в две колонки.

(DualPage.tif)           При распознавании изображение должно иметь стандартную ориентацию: текст должен читаться сверху вниз, и строки должны быть горизонтальными. По умолчанию при распознавании программа автоматически определяет и корректирует ориентацию изображения. У изображений со сдвоенными страницами стандартная ориентация отсутствует, так как каждая страница имеет свой угол наклона.

Решение: В программе существует специальный режим, при котором изображение со сдвоенными страницами разрезается на две части и превращается в две отдельные страницы пакета. Это позволяет обработать каждую страницу: автоматически исправить угол наклона и сохранить распознанный текст с каждой страницы в отдельный файл (или на отдельную страницу).

 

 

Разрезать изображение со сдвоенными страницами на две части, которые впоследствии будут преобразованы в две отдельные страницы пакета, можно также с помощью опции - Разбить изображение. 

Визитные карточки

Конечно, это очень удобно - вся важная информация о человеке сконцентрирована на листке бумаги небольшого формата. Но иногда пугает их количество, и мы тратим массу времени для того, чтобы их упорядочить, привести в систему, найти удобное средство хранения.

Удобный способ ввода и хранения визиток в компьютере с помощью программы FineReader. Все визитки обрабатываются и хранятся в пакете программы. Используя функцию полнотекстового поиска по распознанным страницам пакета, Вы можете найти нужную визитку (при этом поиск возможен по любой распознанной информации с визитки - по названию компании, фамилии, телефону и т.д.). Список найденных визиток показывается в окне Поиск. Чтобы открыть визитку, выберите запись в результатах поиска.

Вы можете пополнять пакет новыми визитками, редактировать уже распознанные визитки в окне Текст.

 

 

Внимание! Визитки должны быть разложены так, чтобы в результате была получена "табличная структура". Между рядами и колонками должно быть некоторое расстояние. Допустимо либо горизонтальное (более длинные стороны визиток расположены вдоль горизонтали), либо вертикальное размещение визиток на листе, но не оба сразу.

Установите следующие параметры сканирования:

 

 

Нажмите кнопку - Сканировать.

 

 

Замечание: Если изображение было поделено на визитки неверно, то попробуйте поделить изображение вручную. Для этого воспользуйтесь кнопками  и . Чтобы передвинуть или удалить разделитель, нажмите кнопку Выбор разделителя - , мышью переместите разделитель в нужное место. Для удаления разделителя переместите его за границы изображения. Чтобы удалить все разделители, нажмите кнопку .

 

 

Программная распечатка

Описание ситуации: данный пример имеет две особенности, влияющие на качество распознавания:

 

 

Решение:

 

 

В этом случае в распознанном тексте сохранится деление на строки; отступы от левого края будут  переданы пробелами; каждая строка выделена в отдельный абзац, а расстояния между абзацами переданы пустыми строками. Все это позволит сохранить исходное форматирование текста при сохранении в формате Txt.

 

 

 

Замечание: Если распознаваемая программная распечатка помимо программного кода содержит текстовые комментарии, то для хорошего распознавания необходимо выбрать несколько языков распознавания: язык программирования и язык, на котором написаны комментарии.

Таблица с неполным количеством черных разделителей

Описание ситуации: все строки таблицы между черными горизонтальными линиями (разделителями) объединены в одну строку таблицы.

Если в таблице встречается смешанное разделение на строки и столбцы, при котором некоторые строки разделены черными разделителями, а некоторые нет, программа может разбить таблицу на строки неправильно.

Решение: Программу можно "заставить" выделять каждую строку текста в отдельную строку таблицы, отметив специальную опцию на закладке Распознавание (меню Сервис — Опции) в группе Таблицы: В каждой ячейке таблицы не более одной строки текста.

Сложная таблица

Описание ситуации: неправильный анализ таблиц со сложной нерегулярной структурой: неправильное разделение таблицы на строки и столбцы; неправильное выделение картинок в ячейках таблицы; плохое распознавание вертикального и инвертированного текста.

Решение: Воспользуйтесь инструментами ручной разметки таблиц, расположенными на панели Изображение:

 - чтобы добавить вертикальную линию;

 - чтобы добавить горизонтальную линию;

 - чтобы удалить линию.

Для ячеек таблицы, содержащих только картинки, в диалоге Свойства блока (меню Вид — Свойства), отметьте пункт - Считать ячейку картинкой.

Для выделения картинок внутри ячеек с текстом в отдельные блоки, воспользуйтесь инструментом на панели Изображение: .

Для ячеек таблицы, содержащих вертикальный текст, в диалоге Свойства блока (меню Вид — Свойства) в поле Направление текста укажите направление текста в ячейке; для ячеек с инвертированным текстом отметьте пункт Инвертированный.

Рассмотрим теперь   десятую версию программы  - она умеет распознавать и фотографии, снятые на обычные фотоаппараты или даже мобильные телефоны с камерой. Рассмотрим основные особенности последней версии ABBYY FineReader.

Сканирование и распознавание фотографий

В ABBYY FineReader 10 функция распознавания фотографий в текст существенно ускоряет процесс перевода бумажного документа в электронный вид, так как фотографирование бумаг и документов осуществляется гораздо быстрее сканирования. Технология позволяет перевести в текст даже снятые на мобильный телефон фотографии с низким разрешением — от 2 мегапикселей. Кроме того, процесс ускоряется также за счет того, что пользователю необязательно копировать фотографии с фотоаппарата на жесткий диск ПК. Достаточно просто воспользоваться командой «Получить изображение и распознать» при подключенном фотоаппарате. При этом полученный текст сразу выводится в окне текстового редактора.

ABBYY FineReader 10 позволяет в ходе подготовки изображения к распознаванию провести обработку, повышающую качество результата работы OCR-движка. У обрабатываемой фотографии можно улучшить четкость, применить шумоподавление, исправить некоторые виды геометрических искажений, причем эти операции проходят в автоматическом режиме. В прошлых версиях FineReader условно можно было работать с отснятыми фотографическими изображениями, однако в целом, очень многое зависело от качества съемки. Так, отснятый разворот книги мог некорректно восприниматься OCR-механизмом, поэтому такие страницы содержали «мусор» ближе к сгибу. В новой версии подобные сложности преодолены — движок автоматически «исправит» неверный угол при съемки книги.

Если качество изображения фотографии совсем плохое, то графическим редактором ABBYY FineReader 10 можно пользоваться вручную — программа предоставляет возможность регулировать настройки устранения размытия, обрезать нужную часть изображения с точностью до пикселей. Можно редактировать цветовой спектр изображения благодаря опции «Инвертировать цвета», а также менять качество или удалять часть ненужного текста. Данные настройки изображения, выставляемые в графическом редакторе, можно применить автоматически ко всем изображениям, импортируемым в программу.

Интеллектуальное распознавание элементов и форм

В ABBYY Finereader 10, в отличие от предыдущих версий, улучшилась функция определения структуры сканируемого текста. Это осуществляется благодаря новейшей технологии адаптивного распознавания документов (ADRT — Adaptive Document Recognition Technology), предоставляемой теперь во второй версии (в ABBYY FineReader 9 была ADRT 1.0).

Текст распознается не постранично, как раньше, а сразу как единое целое. Благодаря этому происходит точное определение всех элементов текста, включая заголовки, сноски, подписи под картинками, таблицы, колонтитулы. Если сканирование проводится сразу в определенный формат, например MS Word, то итоговый текстовый документ будет содержать нужные элементы в виде соответствующих форм, а не просто как текст. Это очень существенно упрощает работу, потому что избавляет пользователя от выполнения дальнейших рутинных операций по форматированию в редакторе распознанного текста. В новой версии ADRT позволяет определять еще больше элементов форматирования текста, что позволяет на порядок облегчить процессы вычитки итогового документа в текстовом редакторе. ABBYY FineReader 10 помимо классических функций распознавания отсканированного текста в форматы Microsoft Word, Microsoft Excel, PDF, теперь предоставляет возможности сканирования в HTML, что позволяет создавать многостраничные сверстанные электронные книги с оглавлениям и разбивкой по главам в виде отдельных страниц. Получившийся результат можно скомпилировать, например, для создания файлов справки.

При процессе распознавания используется проверка орфографии для основных 39 языков, в том числе и для нескольких «мертвых». Сам же механизм распознавания приобрел в новой версии поддержку нескольких новых языков, доведя общее количество до 186. При этом качество «понимания» текстов на азиатских языках улучшилось на 30%, а на европейских — на 20%.

В десятой версии существенно расширились возможности работы с PDF. ABBYY FineReader и ранее позволяет осуществлять операции с распознаванием, позже с конвертацией в PDF и из PDF-файлов в популярные офисные форматы, однако реализация подобной функции в приложении имела недостаточно опций. В новой 10-й версии PDF-файл можно сжимать до нужного размера, а также переводить в архивный формат PDF/A, который является оптимальным для хранения PDF-документов. Кроме того, при загрузке приложения появляется интерактивный мастер с уже предустановленным сценарием автоматической переконвертации PDF в Word.

Дополнительные возможности

Для того чтобы упростить распознавание сложного и большого по объему текста, содержащего большое количество специальных символов или своеобразные шрифты, предназначена функция «Распознавание с обучением». Программа предлагает пользователю создать шаблон, содержащий эти нестандартные элементы. Благодаря такому «эталону» ABBYY FineReader 10 может ускорить и оптимизировать распознавание оставшегося объема текста.

Если документ содержит сразу несколько языков, то для упрощения работы можно воспользоваться функцией объединения языков в группы.

Кроме того, для оптимизации работы в ABBYY FineReader 10 можно настраивать менеджер сценариев в соответствии с поставленными целями. Он предполагает составление последовательности выполнения операций в программе и аналогичен макросам, например, в MS Word.

Большим плюсом ABBYY FineReader 10 является совместимость со всеми основными платформами, включая последнюю на сегодняшний день версию Microsoft Windows 7. По существу, среди OCR-продуктов на платформе Windows решение от компании ABBYY занимает уже длительное время лидирующие позиции. Условные «конкуренты» в лице популярных в 1990-х годах приложений для домашних пользователей, несмотря на периодический выпуск новых версий, серьезно отстают как по качеству распознавания, так и по функциональности. ABBYY FineReader, в свою очередь, в каждой новой версии упрощает работу пользования для перевода бумажных документов в электронные форматы, среди которых файлы MS Word, PDF и HTML. Особое отличие программы от предыдущих версий состоит в том, что пользователю больше не нужен сканер, а достаточно самого простого и дешевого фотоаппарата или телефона с камерой, фотографии с которого могут быть качественно распознаны. Кроме того, подобное решение работает быстрее предыдущих версий. Удобный интерфейс, поддерживающий Windows 7, возможность автоматической и ручной обработки изображений для сканирования, улучшенный механизм анализа структуры документа, позволяющий создавать электронные книги, — выгодно отличает новую версию OCR-приложения не только от предыдущих изданий ABBYY FineReader, но и от немногочисленных конкурентов.

spwindows.ucoz.ru