Автоматичне розпізнавання текстів
Проблема розпізнавання тексту в складі
графічного зображення є досить складною. Подібні задачі вирішують за допомогою
спеціальних програмних засобів, що називають засобами розпізнавання
образів.
Оскільки потреба в розпізнавані тексту досить
значна, не дивно, що значною є кількість програм, призначених для реалізації
даної мети. Різні програми використовують різні алгоритми.
Ці алгоритми можуть давати різні результати для
одного і того самого завдання. Наприклад, система OCR (оптичне розпізнавання
символів) здатна розпізнавати лише стандартний спеціально підготовлений шрифт і
дає на даному шрифті найкращі результати, які не може перевершити ж одна з
програм.
Сучасні алгоритми розпізнавання текстів не
орієнтуються на жодний шрифт та алфавіт. Більшість програм здатні розпізнавати
текст на декількох мовах.
Найбільш широко відомі і розповсюджені програми
FineReader і CuneiForm.
Після установки програми FineReader у меню
Програми Головного меню з'являються пункти, що забезпечують роботу з нею. Вікно
програми має типовий для додатків Windows 9x вид і містить рядок меню, низку
панелей інструментів і робочу область.
У лівій частині робочої області розташована
панель Пакет, котра утримує список графічних документів, що мають бути
перетворені в текст. Ці графічні файли розглядаються як частини одного
документа. Результати їхньої обробки в подальшому поєднуються в
єдиний текстовий файл. Форма значка, що визначає вихідні файли, вказує, чи було
зроблене розпізнавання.
Панель у нижній частині робочої області містить
фрагмент графічного документа в збільшеному вигляді. З її допомогою можна
оцінити якість розпізнавання. Цю панель використовують також під час «навчання»
програми в процесі розпізнавання тексту.
Іншу частину робочої області займають вікна
документів. Тут розташовується вікно графічного документа, який підлягає
розпізнаванню, а також вікно текстового документа, одержаного після
розпізнавання.
У верхній частині вікна додатка під рядком меню
розміщуються панелі інструментів.
Панель інструментів Стандартна містить кнопки для відкриття документів і
для операцій з буфером обміну. Інші кнопки цієї панелі служать для
зміни представлень документа.
Панель Scan&Read містить кнопки, що відповідають всім
етапам перетворення паперового документа в електронний текст. Перша кнопка
дозволяє виконати таке перетворення в рамках однієї операції. Решта кнопок
відповідає окремим етапам роботи, і вони містять меню, що розкриваються, які
служать для керування відповідною операцією.
Панель Розпізнавання дозволяє вказати мову документа і вид
шрифту. Останнє потрібно використовувати лише в тих випадках, коли документ має
недостатню якість друку.
Панель Інструменти використовують у процесі роботи з
вихідним зображенням. Зокрема, вона дозволяє керувати сегментацією документа.
За допомогою елементів керування цієї панелі задають послідовність фрагментів
тексту в підсумковому документі.
Елементи керування панелі Форматування використовують для зміни представлення
готового тексту чи під час його редагування.
Перетворення паперового документа в електронний
відбувається у три етапи.
Кожний з цих етапів програма FineReader може виконувати
як автоматично, так і під контролем користувача. Якщо всі етапи проводяться
автоматично, то перетворення документа відбувається за один прийом.
Перший етап роботи — сканування. На
цьому етапі використовують сканер. Однак зображення з листа папера може бути
перетворене в цифрову форму і за допомогою інших засобів, таких, наприклад, як
цифрові фотоапарати і цифрові відеокамери.
Другий етап роботи — сегментація тексту.
Справа в тім, що в паперовому документі, наприклад, на сторінці книги чи
журналу текст не завжди розташовується у фіксованому порядку. Він може
розміщатися в декількох колонках, містити ілюстрації (і підписи до них).
Додаткові урізання і дані, представлені в таблицях, також можуть заплутати
природний порядок тексту. Тому, перш ніж включати текст у документ, його
розбивають на блоки, які містять цільні фрагменти. Блоки
розпізнають послідовно. Одержаний текст включається в документ у порядку
нумерації блоків.
Останній етап роботи програми —
безпосереднє розпізнавання. Цей етап, зазвичай, не вимагає
втручання користувача, за винятком тих випадків, коли розпізнавання
супроводжується «навчанням».
Розпізнаний текст відображається в окремому
вікні у вигляді форматованого текстового документа. Він «втрачає зв'язок» з
вихідним зображенням і може редагуватися і форматуватися незалежно від нього.
Програма виділяє кольором ті символи, котрі вона сама розглядає як неоднозначно
розпізнані. Це спрощує пошук помилок. Засобами програми в одержаному тексті
можна також провести перевірку граматики.
Одержаний текст можна зберегти у вигляді
форматованого чи неформатованого документа. Передбачена також можливість прямої
передачі одержаного тексту в програму Word чи Excel, а також до буферу обміну
Windows.
Сканування — це технічна операція, що виконує пристрій для сканування.
Завдання програми FineReader на цьому етапі полягає в тому, щоб прийняти
одержану інформацію і відобразити значки відсканованих сторінок на панелі
Пакет. Таким чином сторінки готуються до розпізнавання.
Для того, щоб провести сканування за допомогою
програми FineReader, необхідно запустити цю програму і включити сканер.
Сканування сторінки відбувається під час натискання кнопки “Сканувати” на
панелі інструментів Scan&Read, чи при натисканні комбінації клавіш CTRL+K.
Програма здатна працювати зі сканером як
безпосередньо, так і через протокол TWAIN. При безпосередній взаємодії зі
сканером можливість сканування кольорових зображень не використовується, тому
що передбачається, що текст у будь-якому випадку є одноколірним.
Програма використовує для сканування пристрій,
що заданий за замовчуванням. Для того, щоб вибрати такий пристрій чи змінити
його настроювання, треба натиснути на кнопку, що розкривається поруч із кнопкою
“Сканувати” і вибрати в меню, що відкрилося, пункт “Опції” -
відкриється діалогове вікно “Опції”.
Якщо до комп'ютера підключено кілька сканерів
чи сканер був підключений після установки програми FineReader, варто натиснути
на кнопку “Вибрати сканер”. У цьому випадку програма проведе пошук
підключених до комп'ютера сканерів і дозволить вибрати потрібний.
Для зміни настроювань сканера використовують
кнопку “Настроювання” сканера.
Коли сканер обраний, активізуються два прапорці
в нижній частині діалогового вікна. Якщо установити прапорець Показувати діалог
TWAIN-драйвера сканера, то сканування відбувається через протокол TWAIN з
відображенням спеціального діалогового вікна. В супротивному випадку програма
безпосередньо працює зі сканером. Використовувати протокол TWAIN має сенс
тільки в тому випадку, коли робота напряму неможлива чи дає неякісні
результати.
Прапорець “Показувати опції” перед
початком сканування застосовують лише в тому випадку, коли паперові сторінки
документа істотно відрізняються одна від одної. Це може бути викликано,
наприклад, властивостями паперу чи тим, що різні сторінки друкувалися в різний
час і різними засобами. В цьому випадку перед скануванням кожної сторінки
відкривається діалогове вікно настроювання сканера, щоб користувач міг
відрегулювати якість процесу.
Сам процес сканування відбувається в
автоматичному режимі. Якщо потрібно обробити багато сторінок, то найкраще
спочатку всі відсканувати, а вже потім приступати до розпізнавання. Це
пов'язане з тим, що сканування вимагає присутності користувача через
необхідність керування сканером (наприклад, для зміни сторінок), а
розпізнавання може відбуватися в автоматичному режимі.
Після сегментації і встановлення порядку
проходження текстових блоків виконують останній етап роботи — власне
розпізнавання. Звичайно цей етап проходить автоматично.
Якщо документ надрукований стандартним шрифтом,
і до того ж, був добре відтворений під час сканування, то натиснення по кнопці
“Розпізнати” відкриту сторінку досить, щоб документ був
розпізнаний.
Якщо паперовий документ має недостатню
контрастність чи незвичайний шрифт, процедура трохи ускладнюється. В цьому
випадку програма може не справлятися з розпізнаванням визначених символів і
допускати однотипні помилки.
У таких випадках для великих документів
доцільно спочатку провести вивчення програми відповідно до особливостей даного
документа. Це досить трудомісткий процес, але він усе-таки простіший, ніж ручне
введення багатосторінкового документа.
Настроювання розпізнавання починають зі
створення еталона, в якому зберігаються особливості даного
документа. Для цього треба дати команду “Сервіс > Редактор
еталонів”, натиснути в діалоговому вікні “Еталони” на кнопці “Новий
еталон” і ввести ім'я створюваного еталона.
Для підключення еталона в процесі
розпізнавання, треба натиснути на кнопці, що розкривається, поруч із
кнопкою “Розпізнати” відкриту сторінку і вибрати пункт “Опції”.
У діалоговому вікні, що відкрилося, в групі “Навчання” варто
вибрати щойно створений еталон. Якщо передбачається розпізнавання документа, що
відповідає еталону, який був створений і настроєний раніше, то вибирається не
новий, а старий еталон.
Для «навчання» еталона варто встановити
прапорець “Розпізнавання” з навчанням.
Режим розпізнавання в цьому випадку трохи
змінюється. Кожного разу, коли програма не може впевнено розпізнати символ,
вона видає діалогове вікно “Ручне” навчання еталона. У верхній
частині цього діалогового вікна приводиться збільшене зображення поточного
розпізнаного рядка. Поточний символ вкладено у рамку.
У поле зі списком “Символ” наведено
символ, що, на думку програми, знаходиться в рамці.
Необхідно переконатися, що символ у полі
зазначений правильно і замінити його в разі потреби. Після цього треба
натиснути на кнопку “Навчити”.
Якщо неправильно зазначені границі символу, то
кнопки “Зрушити вліво” і “Зрушити вправо” дозволяють
поправити положення рамки.
Якщо правильно розташувати рамку не вдається,
чи в тексті зустрівся рідкісний символ, який правильно інтерпретувати не можна,
варто натиснути на кнопку “Пропустити”.
Немає коментарів:
Дописати коментар