Работа с ръкописни математически текстове

Статията описва проблема с разпознаването на ръкописни математически текстове. Разглеждат се два основни метода за разпознаване: динамичен и статичен. Дадено е кратко описание на алгоритъма за разпознаване на ръкописни математически формули по статичен метод. За обикновен текст се използва динамичен текст. Описан е метод за отделяне на математически формули от останалата част от текста и по-нататъшно комбиниране на резултатите, без да се нарушава оригиналната структура на целия текст.

В тази работа е описан проблемът с разпознаването на ръкописен математически текст. Разглеждаме динамични и статични методи за разпознаване на изображения. Предложено е кратко описание на алгоритъма за разпознаване на ръкописен математически текст, който използва статичния метод. Динамичният метод се използва за разпознаване на нематематически текст. Описваме метода за отделяне на математическите формули от целия текст и обединяването на резултатите, без да губим оригиналната структура.

Разпознаването на текст в момента е спешна задача, особено ако тези текстове съдържат математически формули. За да се дигитализират хартиени документи, самите формули трябва да бъдат въведени ръчно. Но човек не може да се справи с тази задача по няколко причини. Първо, ръчното въвеждане на математически формули изисква допълнителни познания в областта на информационните технологии, а именно способността за отпечатване на математически формули, което е много трудно за повечето хора.За да напишете математически формули, човек трябва едновременно да си представи как трябва да изглежда формулата и в каква форма трябва да бъде написана в електронен документ.Един хартиен документ може просто да съдържа много голям брой формули, в резултат на което дори и на най-добрите специалисти ще отнеме много време.

Сложността на решаването на проблема с разпознаването пряко зависи от структурата на самите текстове и от метода на тяхното създаване (ръкописен, печатен). В момента някои задачи в тази област се решават доста добре. Например, разпознаването на обикновени печатни текстове, които не съдържат сложни структури (математически формули, диаграми и др.), се извършва доста добре. Пример за това е световноизвестният FineReader на ABBYY.

При по-сложните текстове пак има големи проблеми. Разпознаването на математически текстове включва трансформиране на ръкописни или печатни текстове, използвани в математическите науки. В този момент не

ДОКЛАД НА КОНФЕРЕНЦИЯТА

“ИНФОРМАЦИОННИ ТЕХНОЛОГИИ

В ПРОФЕСИОНАЛНАТА ДЕЙНОСТ”

ТОМ II, ИЖЕВСК, НОЕМВРИ 2011 г

ТОМ II, ИЖЕВСК, НОЕМВРИ 2011

Сапаров А.Ю. Работа с ръкописни математически текстове

Очевидно човек пише формули на хартия по-бързо, отколкото да ги въвежда с помощта на клавиатура. Първата задача е да се увеличи скоростта на въвеждане на математически формули. Това потвърждава актуалността на проблема за разпознаването на математически текстове.

1. Обща информация

Разпознаването на текст може да се извърши по два основни начина: динамичен и статичен.

Първият метод се използва главно за ръкописно писане в електронни устройства с допълнително оборудване (например таблет, сензорен екран и др.). В този случай не се използват нито готови текстове на хартия, нито обикновени графични изображения в растерни формати, съдържащи текст. Технологията за разпознаване не е много сложна. Веднага по време на ръкописно въвеждане последователността на запис се запазва, т.е. точкови последователностивърху равнините, през които е преминало записващото устройство (например стилусът). Според получените данни се извършва търсене на най-подходящия шаблон, съхраняван в базата данни, като по този начин текстът се оформя в електронен вид. За този метод е много важно да се знае последователността на писане на текст, тъй като това е основният източник на информация, необходима за разпознаване. Така два записа на една и съща дума, написани в различни последователности, са неразличими за човешко око и дори за компютър, ако са записани в растерен формат. Но те се разпознават по много различен начин.

Този метод не е подходящ за обработка на сканирани изображения, тъй като в такива случаи е невъзможно да се определи последователността на запис, следователно в този случай се използва метод за статично разпознаване. Този метод се използва за готови текстове, обикновено печатни. Алгоритъмът за разпознаване е напълно различен от алгоритъма, използван при динамичното разпознаване. Тъй като последователността на запис е неизвестна, цялото изображение на текста се използва наведнъж. В началото има търсене на отделни елементи в изображението, които по своите геометрични характеристики се сравняват със съхранените в базата данни шаблони. След това се разглеждат всички подходящи комбинации от символи и се избира най-подходящата. Редът на разпознаване зависи

ДОКЛАД НА КОНФЕРЕНЦИЯТА

“ИНФОРМАЦИОННИ ТЕХНОЛОГИИ

В ПРОФЕСИОНАЛНАТА ДЕЙНОСТ”

ТОМ II, ИЖЕВСК, НОЕМВРИ 2011 г

ТОМ II, ИЖЕВСК, НОЕМВРИ 2011

Сапаров А.Ю. Работа с ръкописни математически текстове

сита от езика на самия разпознат текст.

2. Описание на задачата

В съвременния свят в професионалната си дейност човек трябва да пише на компютъртекстове с различна степен на сложност. Същността на тази задача е да се улесни човешкият труд при въвеждане на текстове, съдържащи математически формули. Това може да се постигне по два основни начина. И в двата случая човек не трябва да използва клавиатурата за въвеждане на формули. В първия случай човек трябва да може да пише формули с помощта на графично устройство за въвеждане (напр. таблет, сензорен екран) и подходящият софтуер ще разпознае написания почерк. Във втория случай въвеждането на текст трябва да се извърши чрез разпознаване на сканирано изображение, т.е. в случай, че текстът вече съществува под формата на хартиен документ. Очевидно е, че в първия случай е възможно да се използват методи за динамично разпознаване, докато във втория тази възможност не е такава. Статичният метод може да се използва и в двата случая, така че тази работа ще се основава на задачата за създаване на алгоритъм за статично разпознаване на математически формули.

Полученият текст трябва да бъде записан в един от форматите, предназначени да представят математически текстове.

Трябва да се въведе възможността за отделяне на математическите формули от останалата част от текста за отделно разпознаване. Могат да се използват няколко метода за разделяне на текст: от ръчно (човек избира формули) до автоматично. Обединяването трябва да е автоматично и да се извършва без нарушаване на структурата на оригиналното изображение.

За разпознаване на обикновен ръкописен или печатен текст е необходимо да се прегледат съществуващите системи и да се изберат най-подходящите. Основната цел на работата е да се разпознаят самите математически формули, а не обикновени текстове, следователно да се разпознаят обичайнитетрябва да се използва текст

ДОКЛАД НА КОНФЕРЕНЦИЯТА

“ИНФОРМАЦИОННИ ТЕХНОЛОГИИ

В ПРОФЕСИОНАЛНАТА ДЕЙНОСТ”

ТОМ II, ИЖЕВСК, НОЕМВРИ 2011 г

ТОМ II, ИЖЕВСК, НОЕМВРИ 2011

Сапаров А.Ю. Работа с ръкописни математически текстове

извикване на готови алгоритми.

3. Описание на метода

При решаването на този проблем възниква един проблем, а именно: в момента няма системи, способни да разпознават достатъчно добре ръкописни текстове. В тази връзка засега ще разглеждаме само ръкописни текстове, за които е известна последователността на писане, т.е. ще се използват само динамични методи за разпознаване. Друго важно ограничение е ръчният избор на математически формули.

Помислете за кратко описание на метода за решаване на този проблем. Разпознаването протича на 3 основни етапа:

1) Разделяне на оригиналното изображение на две части: математически формули и обикновен текст.

2) Разпознаване на всяка част поотделно.

3) Връзка на резултатите.

На втория етап се извършва самото разпознаване на текста. За обикновен текст можете да използвате всяка съществуваща система. Избраната система трябва да разпознае ръкописния текст въз основа на последователността на запис и да го запише в текстов файл. След обработка на масив с обикновен текст, полу-