Разпознаване на текст в работния процес
Този модул е предназначен за разпознаване на текст при сканиране от карта с документи,доставя се само с търговските версии на EDMS. За работата му като част от системата FossDoc се използва софтуер Tesseract на трети страни, който се разпространява свободно от разработчиците му под отворен лиценз. Използването на този модул изисква той да бъде включен в сървърния лиценз на FossDoc.
Следващото ще бъде разгледано:
Разпознаване на текст
Командите за разпознаване на текст се намират в менюто на бутонаСканиране на картата с документи. За разпознаване можете първо да сканирате определен документ (или да прикачите вече сканиран документ към раздела с файлове)
Да приемем, че сте получили някои сканирани документи по един или друг начин. НатиснетеScan/Recognize и изберете файловете, за които искате да разпознаете текста:
Ако поставите отметка в квадратчето „Запазване в един файл“, системата ще обедини текстовете от избраните файлове в един файл. В резултат на това ще бъде създаден файл в два формата - PDF и TXT. Името на файла по подразбиране е „Документ“:
По подобен начин можете да изберетеСканиране и OCR за незабавно сканиране и OCR на сканирания текст. След сканиране ще се появи диалогов прозорец:
ИзберетеЗавършване и разпознаване и натиснетеОК. Ще бъде създаден документ с разпознат текст. Поставете отметка в квадратчетоЗапазване в един файл, за да обедините няколко документа в един.
Допълнителни настройки на модула
Системата е настроена по подразбиране да разпознава текст на 3 езика: украински, английски и български. Ако тисигурни, че работата ви изисква само един език за разпознаване, можете да изберете само него в настройките - това донякъде ще намали времето на програмата за разпознаване. За да изберете един език, в програмата за администриране отидете наБиблиотеки с документи/Сървър в разделаБиблиотека на сървъра, щракнете върху "Настройки ":
Изберете желания език и натиснетеОК.