Концепцията за база данни, СУБД и информационна система

База данние набор от структурирани, взаимосвързани, динамично актуализирани данни от определена предметна област.

Предметна областе част от реалния свят (например индустриално предприятие, образователна институция, организация, работеща в сектора на услугите и т.н.), която трябва да бъде изследвана, за да бъде автоматизирана. Ако обектът вече е автоматизиран, поне частично, но е необходимо да се предприемат мерки за реорганизиране на съществуващата автоматизирана система, понякога се използва терминътпроблемна област.

Всяка предметна област носи огромно количествоинформация,част от която, полезна от гледна точка на персонала, може да бъде ясно идентифицирана, структурирана и съхранена на електронен носител с цел последващо ефективно търсене и обработка. Структурираната информация за домейна, съхранявана на електронен носител, еданни.

Част от информацията за домейна може да бъде формулирана катобизнес правила —формални правила, които се вземат предвид при дефиниране на връзки между елементи от данни. Така се формира база данни, която може да се приеме за информационен модел на предметната област. Схематично това е показано на фигура 1.1.

Фиг.1.1 - Предметна област и база данни

Според степента на структурирана информация се разграничаватдокументно ориентираниифактическибази данни. Базите данни, ориентирани към документи, съдържат полуструктурирани данни, обикновено представени под формата на текстови документи с различни формати. Фактическите бази данни съдържат добре структурирана колекция от данни, базирани на известни структури от данни в програмирането.

Начинът, по който данните и връзките са организирани в база данни с факти, се наричамодел на данни.За по-строга дефиниция на модел на данни вижте раздел 1.3.

Базата данни (DB), заедно със софтуера (software), който я поддържа, образуваинформационна система(IS).Накратко, това може да се напише като проста формула DB + SW = IS.

По предназначение могат да се разграничат няколко класа IP:

  • IPS - системи за търсене на информация. Служат за ефективно извличане на информация (пример са сървърите за търсене в Интернет);
  • УИС (ЕИС) - контролни (икономически) информационни системи. Такива системи са предназначени да автоматизират отделни функции за управление на всеки икономически обект (подразделение, предприятие, корпорация), следователно те са най-важната част от автоматизираната система за управление (автоматизирана система за управление на предприятието). MIS, като правило, съдържа подсистема за отчитане на данни, която отразява всички основни факти от дейността на предприятието, и подсистема за анализ на натрупаните данни, което позволява на ръководството на предприятието да вземе компетентно управленско решение. Такива системи се наричат ​​системи за подпомагане на вземането на решения(DSS).
  • ES - експертни системи. Те са способни на самостоятелно вземане на решения, тъй като иматбаза от знания, която им позволява да получат нови знания въз основа на съществуващи.

Състав на ИС, персонал, взаимодействащ със системата

Софтуерът (софтуерът) за поддръжка на базата данни е разнороден. Обикновено целият софтуер е разделен наосновениприложен(PrPO).

Основният софтуер включва операционна система (ОС), която има директен достъп до данните на диска, както и специален набор от допълнителни софтуерни инструменти, нареченисистеми за управление на бази данни. Можете да мислите за СУБД катонякаква добавка над ОС, която значително разширява стандартните възможности за управление на данни на ОС.

Софтуерът включва програми (приложения), специфични за определена предметна област, които решават всички приложни задачи, изисквани от потребителите на системата. Всички приложни програмивзаимодействат с базата данни само чрез СУБД.1.2.

Фиг.1.2 - Състав на ИС, персонал, взаимодействащ с ИС

Тук под обикновени потребители се разбират специалисти по даден предмет, които използват ИС за автоматизиране на определена част от своите дейности (понякога се наричат ​​крайни потребители). Те взаимодействат с базата данни само чрез PrPO. При инсталиране на нов фърмуер потребителите се обучават да го използват правилно.

Нека разпределим (чисто условно) част от потребителите в група, която ще наречем "напреднали" (квалифицирани) потребители. Представителите на тази група имат известно образование в областта на компютърните технологии и имат директен достъп до функциите на СУБД, ако им бъдат предоставени такива права. За тази цел СУБД разполага с различни средства за взаимодействие с потребителите, основното от които е стандартизираният език за заявки към бази данни SQL (подробно описание с примери се съдържа в глава 4). Всеки потребител обаче предпочита да върши по-голямата част от работата си с удобството, предоставено от Софтуера.

За успешната работа на потребителите на системата, група разработчици са подготвили PrPO и го поддържат. Представителите на тази група имат основно образование в областта на програмирането и компютърните технологиизнания за достъп до база данни и умения за работа с инструменти за разработка на приложения за бази данни. Отделно отделяме специалисти в областта на проектирането на структури от бази данни. Проблемите с дизайна на базата данни са разгледани подробно в глава 3.

База данни и СУБД

Съвременните бази данни са самодостатъчни и относително независими от приложния софтуер (фиг. 1.2 показва, че някои потребители работят с базата данни директно през СУБД, заобикаляйки PPO слоя). Тази възможност се постига благодарение на факта, че съвременната база данни съхранява не само самите данни, но и тяхното описание (метаданни, т.е. данни върху данни), както и някакъв програмен код за обработка на данни (фиг. 1.3).

Ориз. 1.3 - Състав на базата данни

Частта от базата данни, която съхранява метаданни, се наричаречник на данни(DS).Речникът на данни под една или друга форма присъства във всяка база данни, независимо от използвания модел на данни. За всеки елемент от данни SD съхранява неговото уникално име, тип, размер и някои други свойства. Интересното е, че в релационните бази данни всички елементи на речника на данните се съхраняват в таблици, както и данните, и същите релационни операции се използват за манипулиране на елементите на речника, както и за данните.

Допълнителна функция, поддържана от повечето водещи доставчици на СУБД, е съхраняването на код за обработка на данни директно в базата данни заедно с данни и метаданни. За повече информация относно състава на базата данни и съхранения програмен код вижте Глава 4.

СУБДе набор от софтуерни и езикови инструменти за създаване, поддържане и споделяне на база данни. Таблица 1.1 изброява основните функции на СУБД, както и езикаи софтуера за СУБД, необходим за изпълнение на всяка функция.

Таблица 1.1 Функции на СУБД и средства за тяхното реализиране

1.1.3 Принципи на изграждане на информационни системи

Нека обобщим материала от предишните раздели, като подчертаем основните принципи. Всички принципи са много тясно свързани помежду си и следват един от друг, така че разделението по-долу ще се счита за условно.

1.Принципът на интеграция

Принципът е, че има една единствена интегрирана база данни за цялата предметна област (фиг. 1.4), която се споделя от персонала, докато много приложения могат да бъдат стартирани едновременно (на фиг. P1, P2 и т.н.) с различна функционалност.

По този начин всички отдели на едно предприятие изпълняват различни функции, но имат много тесни информационни връзки, следователно автономната автоматизация на всеки отдел, базирана на отделни бази данни (така наречената автоматизация на предприятието „на части“) води до дублиране на данни, излишни операции за ръчно въвеждане в различни отдели, което може да доведе до несъответствия в данните поради грешки при въвеждане и други негативни последици.

Ориз. 1.4 - Интегрирана информационна система

За разлика от автоматизацията "на части", автоматизацията, базирана на интегрирана информационна система, има редица много важни положителни страни.

  • минимален излишък(без дублиране) на данни може да бъде постигнат в интегрирана система. Този принцип обикновено се формулира по следния начин: „Всеки факт е на едно място“. В релационна база данни се въвежда известно излишък само за установяване на връзки между таблици, използващи едни и същи колони. За повече информация относно това вижте Глава 3, Основен дизайн.данни"
  • В интегрирана система е по-лесно да се постигне съгласуваност (интегритет) на данните, т.к поради липсата на дублиране на данни, няма несъответствия между тях. Възможно е да се контролира целостта на данните чрез вградени инструменти за СУБД, по-подробна информация за това се съдържа в раздел 2.1.
  • В интегрирана система е по-удобно да търсите и обработвате данни, можете да извършвате всякакъв вид обработка и анализ на данни.
  • За интегрирана IS проблемът с архивирането на данни и възстановяването на повредени данни е по-лесен за решаване, тъй като тази задача може да бъде възложена на едно лице (DBA), което ще отговаря лично за безопасността на всички корпоративни данни.

Трябва да се отбележи, че предприятията, които имат географски разпределена структура, обикновено използват така нареченитеразпределени бази данни,в които отделните елементи на база данни са физически разположени в различни възли на корпоративната мрежа. Разпределените бази данни обаче са проектирани по такъв начин, че да не нарушават принципа на интеграция.

2.Принципът на независимостта на приложния софтуер от начина, по който са организирани данните.

Между данните и приложния софтуер на ИС има поне два слоя основен софтуер - операционната система и СУБД, които поемат всички функции за управление на данни от ниско ниво. Следователно базата данни може да функционира дори без SSW изобщо и същата SSW може да взаимодейства с бази данни, които имат различна физическа организация.

Има следните нива на независимост:

а) логическа независимост - можете да направите някои промени в структурата на вече завършена база данни без радикална промяна на приложениетософтуер, например, можете да добавяте нови колони към вече попълнена таблица на база данни, докато всички приложения няма да загубят своята функционалност, но при изтриване на колони и още повече таблици някои приложения няма да могат да работят;

б) физическа независимост - физическият формат на съхранение на данни може да се променя, т.е. преход към нова СУБД или нова версия на СУБД, без радикален редизайн на приложния софтуер (приложният софтуер „не знае“ нищо за физическия формат на съхранение на данни, тъй като работи с данни на логическо ниво).

3.Принципи на мащабируемост и преносимост

Тези принципи произтичат от принципа за независимост на данните и PDP. Принципът на мащабируемост трябва да се разглежда в три аспекта:

а) възможността за неограничено увеличаване на размера на базата данни;

б) неограничено увеличаване на броя на потребителите;

в) неограничено увеличаване на броя на заявките.

В определен момент съществуващият основен софтуер вече няма да отговаря на изискванията за ефективно управление на увеличеното количество данни или няма да може да осигури приемлива скорост за увеличения брой потребители, така че ще има нужда от прехвърляне на данни към нова платформа, което трябва да стане без загуба на информация и радикална преработка на фърмуера. Това свойство на IP се наричапреносимост.

Концепцията за отворени системипредлага използването на общопризнатимеждународни стандарти, управляващи всички аспекти на работата на една информационна система, като механизъм за прилагане на горните принципи.Понастоящем съществуващите стандарти за отворени системи позволяват внедряването на интегриранихетерогенниинформационни системи, базирани наизползване на разнороден софтуер, гарантиране на тяхната мащабируемост и преносимост.

След това ще разгледаме по-подробно архитектурата на информационните системи.