Сканиране в библиотеката Защо Какво Как Култура
Защо библиотеката е най-яркият образ на системологията – фундаментална наука, която изучава организацията на процесите и явленията в света? Отговорът се крие във фондовия и справочно-издирвателния апарат на библиотеката. За обикновения читател книгите по рафтовете са фонд, но това не е съвсем вярно. Библиотечният фонд е сложен набор от документи, представени на различни носители на информация, съответстващи на определени отрасли на знанието и свързани със специализиран механизъм за търсене, базиран на картов каталог.
Дори поставянето на списания на библиотечните рафтове се основава на научен подход: информационният закон на Брадфорд обяснява модела на разпределение на статиите между публикациите и по този начин позволява да се предвиди с голяма вероятност търсенето на материали въз основа на спецификата на информацията.
С други думи, библиотеките успяха да създадат идеална система за класифициране и структуриране на информация, което направи възможно решаването на проблема със съхраняването и извличането на огромни количества данни от всякакъв източник. За тази цел са разработени специализирани библиотечни класификатори, които регулират разпределението и подреждането на фондовете, методите за организиране на систематични каталози и стандартите за проектиране и отчитане на документи.
Когато говорим за дигитализиране на книгите на всяка библиотека, освен запазването на оригиналите и гарантирането на автентичността на електронното копие, е необходимо да се има предвид идентичността на класификационната структура и търсенето на информация в хартиения и електронния фонд. С други думи,сканирането на книги изисква задължително създаване на електронен каталог и формиране на индексно-търсена база данни с максимална пълнота на съдържанието.
Проекти за създаване на електроненбиблиотечните ресурси са едни от най-сложните и богати по отношение на разходите за труд, прилаганите методологии и техническите характеристики.
Възниква естествен въпрос - защо? Защо при такава сложност на изпълнението на подобни проекти да започнем дигитализиране на библиотечни материали, защото „книгите могат да се съхраняват векове“ и „като цяло никой вече не ходи в библиотеката“?
Това е погрешно мнение. През последните години библиотеките активно се променят, въвеждат модерни технологии и стандарти за обслужване, за да отговорят на нуждите на новото поколение читатели, възпитани в свободата да използват дигитално съдържание. Приемат се програми за преоборудване, въвеждат се в практиката показатели за ефективност на работата, създават се единни каталози, регионални и местни исторически колекции. През 2015 г. стартира Националната електронна библиотека. (NEB), за чието развитие редовно се дигитализират колекциите на българските библиотеки.
Не забравяйте за опазването на безценни знания и културни ценности, натрупани в книгохранилища в цялата страна. За тези цели дигитализацията е най-ефективният начин за запазване на публикациите и осигуряване на сигурен достъп до информацията, която съдържат.
Проектът в една голяма библиотека продължи от 2003 до 2011 г. По време на проекта бяха сканирани и индексирани над 2 милиона систематизирани каталожни карти на български и чужди езици. Данните за 17 полета от всяка карта бяха прехвърлени в АБИС.
В основата на автоматизацията на съвременните библиотеки е създаването на електронен каталог и попълването на автоматизирана библиотечно-информационна система (АБИС). ABIS е необходима за автоматизиране на счетоводното отчитане на средствата. Пълноценният електронен каталог значително повишава ефективността и скоростта на търсенетоинформация, което значително подобрява цялостното качество на читателското изживяване.
Като правило в библиотеката се поддържат няколко вида каталози: азбучен, в който всички карти са подредени по азбучен ред; систематичен, където картите са подредени според отраслите на знанието. Има каталози, които се делят според обхвата на фонда: общ или отделни части от фонда; с предварително записване: читалня или кабинет; по много други признаци: местна история, предмет и др.
При голям брой фондове дигитализирането на целия каталог е доста дълъг процес, който обикновено се извършва на етапи.
Гръбнакът на каталога е библиотечна карта, съдържаща информация за изданието, класификационни индекси, номер на книга (ISBN) и други данни.Поради голямото количество специфична информация картата е най-трудният документ за извличане на индексни данни.Записите на чужди езици, ръкописен текст или диакритични знаци (различни надписи, долен индекс, по-рядко вградени знаци) допълнително затрудняват обработката на информацията.
Един библиографски запис може да съдържа до 24 различни полета. Прехвърлянето на записи в системата директно от хартиен носител е непрактично поради ниската скорост и риска от загуба/пропускане на ключова информация, така че създаването на електронен каталог предполага задължително предварително сканиране на библиотечния файл, формиране и проверка на индексната база данни преди зареждане в АБИС.
Дори в малка библиотека броят на картите е хиляди. В такива условия е почти невъзможно да търсите собствени човешки и технически ресурси и самостоятелно да се ангажирате с формирането на електронен каталог, следователно, за да спестите време и пари, се включват професионални изпълнители, коитоса специализирани в обработката на библиотечна информация и са готови да гарантират крайния резултат.
Типичен работен процес за създаване на електронен каталог
Дигитализацията трябва да се извърши на територията на библиотеката, за да не се извадят от употреба библиотечните карти и да не се наруши работата с читателите. Процесът е разделен на няколко етапа:
Преглед.Оценява се физическото състояние на картите и обема на картотеката. Определят се съставът на библиографското описание и необходимият формат на машинночетимите записи. Въз основа на получените данни се съставя по-нататъшна технологична верига на работа. Списъкът с произведения и методите за извличане на данни се влияят от нюансите в изписването на знаците, формата и дори състава на материала (картон, хартия). Следните са възможните типове карти:
Модерното оборудване ви позволява да достигнете скорост на сканиране от 170 карти в минута, докато изборът на професионален скенер ви позволява да избегнете повреда на самите карти.
- допълнителна карта. Характеристика: печатни и ръкописни знаци,
- разделител. Характеристика: различен от стандартния формат на картата,
- референтна карта. Характеристика: само ръкописни знаци,
- описание. Особеност: старобългарски текст.
Сканиране.Непрекъснатото сканиране на хартиени карти се извършва на високоскоростни скенери за документи. Стандартни изисквания за дигитализиране: 300 dpi резолюция, черно-бял режим на сканиране, TIFF или JPEG файлов формат. Повечето карти имат стандартен размер 130х80 мм, но има до формат А6 (148х105 мм) включително. Понякога повредените карти се залепват заедно преди сканиране. Често се извършва двустранно сканиране на карти, където обратната страна съдържаинвентарни номера, разбивка по клонове. Незначителните разделителни карти не се сканират.
След дигитализиране хартиеният масив на картотеката се връща в първоначалното си състояние. Цялата последваща работа се извършва с получените графични изображения на картите.
Изкривените изображения трябва да се завъртят, фонът да се премахне, символите с нисък контраст да се развият и т.н.
Свойствата на електронните копия трябва да изключват загубата на информация и да не влошават четливостта на документа в сравнение с хартиения оригинал. В случай на лошо състояние на изходния материал е разрешено използването на софтуер за подобряване на изображението.
Цялата обработка на изображения се извършва автоматично. Възможно е ръчно коригиране на геометрията на изображенията, премахване на шум и следи от прегъване, ако е необходимо да се обработят малък брой повредени документи.
Дори в случай на писане на пишеща машина, не всички знаци се разпознават правилно. Автоматичното разпознаване на ръкопис, белези с молив и карти, създадени преди средата на 20 век, е почти невъзможно.
Броят на графичните изображения трябва да съответства на броя на листовете хартиен масив. Сканирането по ред на каталожните карти се превърна в норма. Пропускането на страници се счита за брак.
Ретроконверсия:въвеждане на информация от сканирани карти и създаване на база данни. Картите могат да съдържат машинописен и ръкописен текст, маркировки с молив, размити знаци и други функции за попълване.
В редки случаи, когато документ, съдържащ отпечатан текст, е с добро качество, можете да използвате OCR софтуер за автоматично извличане на определени полета на карта.
Следователно данните от библиотекатакартите се въвеждат предимно ръчно и преминават презмногостепенна система за контрол на качеството.
Преди ретроконверсията изображенията се разделят (сортират), за да се групират отделни части от масива по типове карти и други функции за индексиране (свързване на съставни карти, създаване на блокове от данни за томове, разделяне по езици и т.н.). Блоковете са маркирани за удобство при извличане на данни от оператора.
На изхода се формира база данни в необходимия за библиотеката формат (RUSMARC, UNIMARK, MARC21 и др.). В някои случаи при създаване на електронен каталог обект на обработка могат да бъдат директно графични изображения на книги. Тогава в работата се включват оператори, които имат познания за правилата за съставяне на библиографски описания.
Изискванията за минимален процент грешки в базата данни са много високи, тъй като това пряко влияе върху качеството на търсене на информация в електронния каталог. Следователно, след въвеждане на данните, следва етап на проверка за различни параметри от опитни проверяващи.
За да се ускори процеса на ретроконверсия, се използва технология за заемане, която опростява въвеждането на информация чрез автоматично избиране на полета въз основа на предварително въведени данни.
Много библиотеки вече разполагат с професионални планетарни скенери за ежедневно дигитализиране на книги. Но входящата литература се сканира предимно сама. Аутсорсинг услугите обикновено се поръчват за висококачествена масова цифровизация. И така, в една голяма федерална библиотека от 2008 до 2014 г. повече от 16,5 милиона страници библиотечни и архивни колекции бяха дигитализирани от договорен изпълнител.
След създаването на електронен каталог или успоредно с този процес, библиотеките решават проблемите с осигуряването на безопасност и достъпност.книжен фонд чрез дигитализиране на книги. Извършват се работи по дигитализация за попълване на национални електронни проекти, създаване на колекции от редки книги и пълнотекстови ресурси, колекции от тематични илюстровани материали и много други.
Библиотеките могат сами да извършват работа по дигитализацията на колекциите. Например големите библиотеки имат цели отдели за сканиране с парк от професионално оборудване.
Важен аспект са характеристиките на цифровите копия. Ако местните проблеми са решени, библиотеката може самостоятелно да определи изискванията за изходни електронни ресурси. Но при изпълнението на национални проекти, където се използват фондовете на различни библиотеки, е необходим общ стандарт, който да регламентира основните характеристики на работата.
При създаването на NEL електронните ресурси, създадени от техническия изпълнител и библиотеките независимо, имаха различни параметри за цифровизация, което усложни работата по обработката и изтеглянето на цифрово съдържание.
Затова отрасловият експертен съвет изготви„Препоръки за дигитализация на материали от библиотечни фондове“, които показват принципа на създаване на електронни библиотечни ресурси. Препоръките посочват три вида цифрови копия. Основно копие - референтно копие на оригинала с печатно качество (резолюция не по-ниска от 600 dpi). Потребителско копие – за създаване на електронни колекции и предоставяне на читателите (резолюция не по-ниска от 300 dpi). Сервизното копие се използва за вътрешни задачи на библиотеката и поставяне на уебсайтове (резолюция не по-ниска от 150 dpi).
Функции за сканиране на книги
При дигитализиране на книги етапите на работа повтарят процеса на създаване на електронен каталог. Библиотеката работи самостоятелно или наема изпълнител, но и дветев противен случай, на първо място, е необходимо да се определи целта на проекта ида се извърши прегледна книжния фонд, за да се разбере цената и трудоемкостта на работата. В бъдеще се формира списъкът на публикациите, които ще бъдат дигитализирани, съгласуват се техническите изисквания и се извършва окончателната оценка на проекта.
Нека разгледаме няколко характеристики на дигитализацията на книги, които влияят върху цената и графика на проектите. От голямо значение е формата и състоянието на книгите, както и обемът на книжния фонд. Въз основа на тези характеристики се определя вида на сканиращата техника и технологията за цифровизация.
Захабената, накъсана хартия, както и дебелата подвързия на много книги позволява използването само на безконтактно сканиране - професионални планетарни (книжни) скенери. Използването на плоски скенери е изключено.
След сканиране, получените цифрови копия преминават през процес на софтуерна корекция и се довеждат до най-четливото качество на изображението. Често, когато използвате професионални скенери за книги, вграденият софтуер за обработка е достатъчен за това. След получаване на масив от дигитални копия, при необходимост се съставят библиографски описания на сканирани публикации.
Отделно си струва да се подчертае работата по висококачествено сканиране на колекции от редки книги, книжни паметници, фолианти и други ценни предмети. За целта се използват специализирани висококачествени сканиращи системи, осигуряващи уникално висока оптична резолюция.
Характеристики на формирането на пълнотекстови PDF-книги
За да се създадат такива книги, се извършва разпознаване на пълен текст с допълнителна проверка на текста и проверка на правописа. За финалната корекция на документа се включват професионални коректори.
БВ резултат на оформлението се оформя електронна книга, която е напълно идентична с хартиения оригинал - с точна подредба на страници, илюстрации, език и стил.
Дигитализацията на книги и библиотечни каталози, особено при значителен обем, разнородност на фондовете по отношение на формат и състояние на оригиналите, е най-сложниятпроизводствен процес, който може да се извърши качествено само от специализирани фирми с цялата необходима инфраструктура и богат опит в създаването на електронни ресурси.