Системи за автоматично разпознаване на формата, ComputerPress
Човечеството непрекъснато се бори за намаляване на дела на ръчния труд. Можем да кажем, че в областта на офис автоматизацията е отбелязан особен напредък.
Но едно е да развиваш технология, а друго е да я прилагаш навсякъде. Ярък пример тук е системата за автоматично разпознаване на форми - технология, която ви позволява да прехвърлите монотонната многочасова работа на машинописка към компютърно оборудване.
Същността на системата за разпознаване на формуляр (на Запад те използват термина Document Capturing - „улавяне на документ“) е да разпознае документ с определен формат в общия случай с печатно или ръчно отпечатано попълване. Задачата на разпознаването е да намери определени известни полета, а резултатът от програмата обикновено не е просто текстов документ, а определен запис в някаква база данни. Задачата е много спешна и възниква почти навсякъде, където човек се сблъсква с необходимостта от автоматизирана компютърна обработка на еднотипни документи. Като общо приближение пазарът на заснемане на документи (само неговата софтуерна част) в света се оценява на около 300 милиона долара, като се развива доста бързо. Българските компании постигнаха големи успехи в тази посока. Трябва да се отбележи, че в областта на системите за разпознаване (което може да се припише на системите с изкуствен интелект) имаме много силна местна школа.
Понякога обаче невежеството на властите и неефективната организация на работа водят до факта, че хиляди еднотипни печатни и ръчно отпечатани формуляри се забиват ръчно в компютъра по стария начин. Обемът на такава работа е наистина огромен. В страната функционират стотици организации, работещи с физически и юридически лица, които в ежедневната си дейностобработват безброй потоци от документи: платежни нареждания, анкетни карти, декларации, разписки и др.
Общият брой документи, които трябва да бъдат въведени в базата данни за по-нататъшна обработка само в една организация, може да достигне няколко хиляди и дори десетки хиляди на ден. Човек може да си представи мащаба на тази работа, извършена в цялата страна. За това се харчат огромни суми, а проблемът може да бъде решен много по-ефективно.
„Ръкопис на ABBYY FineReader“
Системата ABBYY FineReader Manuscript е предназначена за офлайн разпознаване на 1 ръчно отпечатани и отпечатани формуляри от различни типове, включително дори такива, които първоначално не са били предназначени за машинна обработка.
Системата има способността да разпознава печатни текстове на 50 езика и ръкописни текстове на шест езика. Благодарение на различните методи за премахване на изображението на формуляра, в допълнение към традиционните цветни и растерни форми, FineReader Manuscript може да разпознава информация и от черно-бели формуляри с различни видове маркировки на полета.
Програмата ви позволява да въвеждате форми с различна сложност, включително многостранични форми. Мащабируемостта на системата я прави подходяща за въвеждане на почти всякакво количество информация – от най-простите системи за въвеждане на стотици документи на ден до комплекси от десетки компютри за въвеждане на стотици хиляди документи на ден.
Благодарение на технологията FlexiForm, внедрена във FineReader Manuscript, могат да се обработват дори нечетими от машината - така наречените гъвкави - форми.
Задачата за въвеждане на гъвкави форми (FlexiForms) се разбира като задача за въвеждане на идентични форми, отпечатани върху формуляри, които не са строго от същия тип. Например, това могат да бъдат документи, отпечатани на различни принтери, в различниорганизации, тоест един и същи тип информация, върху която се намира по различни начини.
Технологията FlexiForm намери своето място в много различни системи за въвеждане на документи, включително български платежни нареждания; Полски ръкописни банкови чекове; международни карти VISA; украински платежни нареждания; литовски библиотечни карти; междубанкови преводи в Белгия и много други.
В случаите, когато формулярът не съдържа корекции и е попълнен точно, програмата разпознава ръкописни знаци, като прави по-малко от пет грешки на 1000 знака, което е повече от пет пъти по-малко, отколкото професионалната машинописка.
Повишената точност се обяснява с автоматичния контрол на резултатите от разпознаването въз основа на проверки в речници и бази данни. Програмата автоматично проверява коректността на резултатите от разпознаването в бази данни, речници, като използва кръстосани проверки на полета, проверки на суми, формати на дати и др. Отвореният интерфейс позволява на потребителя да създава свои собствени правила за автоматичен контрол.
Въз основа на FineReader API 2 можете да персонализирате интерфейса на системата, да стартирате програмата от други приложения и лесно да я интегрирате във всяка друга система за обработка на информация.
С помощта на FineReader Developer Edition можете да пишете вашите приложения на базата на програмата FineReader Manuscript.
FineReader разпознава формуляри, попълнени на ръка, на пишеща машина или принтер, както и отметки и баркодове. След разпознаването FineReader оцветява всички несигурно разпознати знаци с цвят и ги изпраща за проверка. Операторът прекарва само секунди в проверка на отделни символи, вместо да прекарва минути във въвеждане на целия формуляр.
Система за когнитивни форми
Системата Когнитивни форми принадлежи къмклас OCR/ICR/OMR (Оптично разпознаване на знаци/Интелигентно разпознаване на знаци/Оптично разпознаване на знаци 3 ) и позволява поточно въвеждане на стандартни формуляри с печатно, ръкописно попълване и квадратчета за отметка в компютърни бази данни и корпоративни информационни системи.
Системата Cognitive Forms прилага така наречената технология за разпознаване на три нива:
1. Разпознаване на един знак. Тук се използва комбинация от няколко метода за разпознаване (композитен метод):
- невротехнологии;
- структурен метод (скелет);
- разпознаване на дървета;
- метод, базиран на клъстерен анализ (разпознаване на събития 4 ).
Освен това има алгоритми, които ви позволяват да работите с текстове с ниско качество. И така, за изрязване на "залепени" символи има алгоритъм за оценка на оптималните дялове (FustCut технология и нейната подобрена версия PowerCut). Напротив, за свързване на "разпръснатите" елементи има алгоритъм за свързването им.
2. Разпознаване на символни полета (методите за разпознаване са базирани на опция 1 и методи на динамично програмиране).
3. Езикова подкрепа. Включва обработка на речник, микролингвистика и честотен речник. Това ниво е необходимо за подобряване на точността на разпознаване. Някои полета на формуляра се поддържат от специални речници. Например, резултатът от разпознаването на полето "име" може да бъде коригиран с помощта на речник на имената, буква не може да се появи в цифрово поле и обратно.
Честотният речник, разработен от Cognitive Technologies, има способността да коригира грешки поради наличието на статистика за оценките на вероятността за поява на съседни знаци. С други думи, вероятността за появата на "b" следгласната е нула.
Така на първия етап системата разпознава структурата на документа (разделителни линии и текст), след това анализира местоположението на неговите полета (символи, набори от знаци) и накрая извършва езикова обработка на резултатите от разпознаването.
Ако формулярът заема няколко страници, успешно се използват така наречените самообучаващи се или адаптивни методи за разпознаване. Принципът на тяхната работа е следният. Всеки текст съдържа ясно и неясно написани знаци. След като системата е разпознала текста (както прави конвенционалната OCR система) и е получила точност, по-малка от прага, текстът се разпознава допълнително въз основа на шрифта, който се генерира самостоятелно от системата от добре отпечатани знаци. При този подход разработчиците комбинираха предимствата на два вида системи за разпознаване: omnifont и multifont. Спомнете си, че първите ви позволяват да разпознавате всякакви шрифтове без допълнително обучение, докато вторите са по-стабилни при разпознаване на текстове с ниско качество. Използването на самообучаващи се алгоритми позволява да се увеличи точността на разпознаване на текстове с ниско качество четири до пет пъти. Но най-важното може би е, че самообучаващите се системи имат повече потенциал за подобряване на точността на разпознаване.
Заслужава да се отбележи, че технологията Cognitive Forms не принадлежи към класа на така наречените кутийни продукти. Всяка негова инсталация е съпроводена с адаптиране в съответствие с изискванията на клиента. Въвеждането на тази процедура позволява да се получи необходимото качество на разпознаване.
Процесът на работа с Cognitive Forms е следният. Оператор на станция за сканиране поставя купчина документи в автоматичното подаващо устройство на скенера (обикновено високоефективен Kodak, Banctech,Bell+Howell, Hewlett-Packard, Fujitsu). С натискане на клавиша стартира процесът на поточно сканиране на документи.
Подсистемата за разпознаване - Cognitive FormReader - автоматично управлява разпознаването и контекстната проверка на коректността на разпознаването.
В станцията за визуален контрол (Cognitive FormEditor) операторът има възможност визуално да контролира и редактира разпознатите полета на формуляра преди експортиране в базата данни.
В подсистемата за създаване на описания на формуляри (Cognitive FormDesigner) се създава компютърно описание на обработваните формуляри, което се използва на всички етапи от процеса на въвеждане – от разпознаването до експортирането в базата данни.
Подсистемата за експортиране на резултати генерира текстово представяне на документа, преди да бъде записан в базата данни, с последна проверка за валидността на стойностите на експортираните данни. Регистрирането се извършва от потребителя след въвеждане и проверка на определен брой документи.
Подсистемата за експорт на база данни ви позволява да експортирате разпознати документи чрез ODBC към SQL сървъри, да запазвате резултатите от разпознаването във формати DBF, XLS, CSV, TXT, RTF, DOC и др.
Един от важните елементи на Cognitive Forms е системата за следене на коректността на въвеждане на информация. Основната му функция е да постигне 100% точност на разпознаване на изхода, като същевременно минимизира умората на оператора. Системата за проверка на правилността на въвеждане на документи е разработена, като се вземат предвид изискванията за ергономичност и повишаване на производителността на труда. Само тези данни, които не отговарят на изискванията за коректно разпознаване, подлежат на човешки контрол.
Групово въвеждане на платежни нареждания
Ефективност на въвеждане на платежни нареждания (ПП)значително увеличава количеството информация, обработвана от банката, и до голяма степен намалява броя на грешките, неизбежно допускани при традиционния метод за въвеждане на PP.
Ефективното въвеждане на PP на банкови клиенти в автоматизираната банкова система се осигурява от системата за автоматизиране на обработката на платежни нареждания - частен случай на Cognitive Forms (CF: WFP).
Важно е да се отбележи, че CF:VFP автоматизира не само въвеждането на документ (прехвърлянето му от хартиен в електронен формат), но и целия последващ процес до платежната операция. Системата предвижда следните етапи на обработка на платежни нареждания:
- въвеждане (сканиране на завършена форма на произволно форматиране);
- проверка (документът се разпознава и автоматично се проверява);
- изпращане за изпълнение (експортиране на документ в автоматизирана банкова система в необходимия формат).