Системи за разпознаване на текст и компютърен превод

Съдържание на урока

4.5.1. OCR софтуер

4.5.1. OCR програми

компютърен
системи
системи
разпознаване

Ключови думи:

В допълнение към текстовите процесори, предназначени за създаване и обработка на текстове на компютър, има редица програми, които ви позволяват да автоматизирате работата на човек с текстова информация.

Много често става необходимо да въведете в компютъра няколко страници текст от книга, статия от списание или вестник и т.н. Разбира се, можете да отделите известно време и просто да напишете този текст с помощта на клавиатурата. Но колкото по-голям е изходният текст, толкова повече време ще отнеме въвеждането му в паметта на компютъра.

Преценете сами. Да предположим, че един от вашите съученици, които са усвоили клавиатурния симулатор, може да въвежда текстова информация със скорост от 150 знака в минута. Нека разберем колко време ще му отнеме да въведе в паметта на компютъра текста на романа на А. Дюма "Тримата мускетари". Едно издание на този роман е дълго 590 страници; всяка страница съдържа 48 реда, всеки ред съдържа средно 53 знака.

Нека изчислим общия брой герои в романа:

590 • 48 • 53 = 1 500 960 знака.

Нека изчислим времето, необходимо за въвеждане на този масив от знаци в паметта на компютъра: 1 500 960 : 150 ≈ 10 000 минути. А това са приблизително 167 часа.

В същото време не обсъждаме въпроса за времето за коригиране на възможни грешки с този метод на въвеждане на текст, не вземаме предвид човешката умора.

Скенери и програми се използват за въвеждане на текстове в компютърната памет от хартия.разпознаване на знаци. Една от най-известните програми от този тип е ABBYY FineReader. Опростената работа с такива програми може да бъде представена по следния начин:

разпознаване

Следваща страница4.5.2. Компютърни речници и софтуер за превод