Хранилища и бази данни - Информатика, програмиране
1. Складове за данни
- поддръжка на високоскоростни данни от хранилището;
- поддръжка за вътрешна последователност на данните;
- възможността за получаване и сравняване на данни;
-пълнота и достоверност на съхраняваните данни;
-поддръжка на висококачествен процес на попълване на данни.
1) Редовната база данни е предназначена да помага на потребителите да вършат ежедневната си работа, докато хранилищата за данни са предназначени да вземат решения;
2) Редовната база данни е обект на постоянни промени в хода на работата на потребителите, а хранилищата за данни са относително стабилни;
- данните в него се актуализират по график (например почасово, дневно, месечно),
- в идеалния случай процесът на попълване на данни за определен период от време без промяна на предишната информация, която вече е в хранилището.
3) Редовната база данни най-често е източникът на данни, влизащи в хранилището, освен това хранилището може да се попълва от външни източници (например компресиране на данни).
2. Принципи на изграждане
2.1 Основни понятия
Информацията, която се зарежда в склада, трябва да бъде интегрирана в последователна структура, която отговаря на целите на анализа на данни. В същото време несъответствията между данните от различни операционни системи са сведени до минимум; в хранилището те са наименувани и изразени по един единствен начин. Данните са интегрирани на много нива: ниво на ключ, ниво на атрибут, описателно ниво, структурно ниво и т.н. Общите данни и общата обработка на данни са консолидирани и унифицирани за всички данни, които са подобни или подобни в хранилището на данни. В този случай информацията е структурирана на различни нива на детайлност:
- висока степен на обобщаване;
- ниска степенсумиране;
- актуална подробна информация.
Хранилищата могат да се разглеждат като набор от моментни снимки на състоянието на данните: можете да възстановите картината до всеки момент от време. Атрибутът време винаги присъства изрично в структурите на данни за съхранение.
Веднъж попаднали в хранилището, данните никога не се променят, а само се допълват с нови данни от операционните системи, където данните се променят непрекъснато. Новите данни, когато пристигнат, се обобщават с вече натрупаната информация в хранилището на данни.
2.2 Основни компоненти на хранилище за данни
Използването на технологията за съхранение на данни предполага наличието на следните компоненти в системата:
-оперативни източници на данни;
- средства за пренос и трансформация на данни;
- метаданни - включват каталога за съхранение и правилата за трансформиране на данните при зареждането им от оперативни бази данни;
-средства за достъп и анализ на данни.
Предназначението на изброените компоненти е следното. Оперативните данни се събират от различни източници. Входящите оперативни данни се почистват, интегрират и добавят към релационното хранилище. Те вече са достъпни за анализ чрез инструменти за отчитане. След това данните (изцяло или частично) се подготвят с помощта на инструменти за трансфер и трансформация на данни за OLAP анализ, който се реализира с помощта на инструменти за достъп и анализ на данни. В същото време те могат да бъдат заредени в специална OLAP база данни или да останат в релационно хранилище.
Най-важният елемент от хранилището са метаданните, т.е. данни за структурата, разположението, трансформацията на данни, които се използват от всякакви процеси за съхранение. Метаданните може да са необходими за различни цели, като например: извличане и зареждане на данни; поддръжка на съхранение и заявки.Метаданните за различните процеси могат да имат различна структура, т.е. Може да има множество варианти на метаданни за един и същи елемент от данни.
И така, хранилищата за данни са структурирани. Те съдържат основни данни, които формират единен източник за обработка на данни във всички системи за подпомагане на вземането на решения. Елементарните данни, налични в хранилището, могат да бъдат представени в различни форми. Складовете за данни са изключително големи, защото съдържат интегрирани и детайлни данни.
Тези характеристики са общи за всички хранилища на данни. Но въпреки факта, че хранилищата имат общи свойства, различните видове хранилища имат свои индивидуални характеристики.