База данни в Excel
За да бъде базата данни удобна за по-нататъшна обработка, трябва да се следват прости принципи:
1) Най-добрата програма за създаване на база данни е MS Excel. Данните от Excel по-късно могат лесно да бъдат прехвърлени в други специализирани статистически пакети, като Statistica, SPSS и др. за по-сложни манипулации. Въпреки това, до 80-90% от изчисленията могат да бъдат извършени най-удобно в самия Excel с помощта на добавката Data Analysis.
2) Горният ред на таблицата с базата данни е проектиран като заглавка, където се въвеждат имената на тези показатели, които се вземат предвид в тази колона. Не е желателно да се използва обединяване на клетки (това изискване се отнася за цялата база данни като цяло), тъй като в този случай много операции ще станат невалидни. Също така не трябва да създавате "двуетажна" заглавка, в която горният ред показва името на група хомогенни индикатори, а долният ред - специфични индикатори. За да групирате хомогенни индикатори, по-добре е да ги маркирате с едноцветно запълване или да включите функция за групиране в скоби в името им.
Например, не по този начин:
ОБЩ АНАЛИЗ НА КРЪВТА | ||
спешна помощ | LEU | TR |
ER(UAC) | LEU(UAC) | TR(UAC) |
в последния вариант са осигурени както "едноетажен" хедър, така и визуална хомогенност на данните (всички те се отнасят до UAC индикатори).
3) Първата колона трябва да съдържа поредния номер на пациента в тази база данни, без да го свързва с някой от изследваните показатели. Това ще даде възможност в бъдеще да се осигури лесно връщане към първоначалния ред на пациентите на всеки етап, дори след многобройни сортирания на списъка.
4) Втората колона обикновено се попълвафамилии (или пълни имена) на пациентите.
5) Количествените показатели (тези, които се измерват с числа, например - ръст, тегло, кръвно налягане, пулс и др.) се вписват в таблицата в цифров формат. Изглежда, че това вече е ясно, но трябва да се помни, че в Excel, като се започне от версията от 2007 г., дробните стойности се обозначават с точка: 4.5. Ако напишете число, разделено със запетая, то ще се възприеме като текст и тези колони ще трябва да бъдат пренаписани.
6) С качествените показатели е по-трудно. Тези, които имат две значения (така наречените двоични стойности: Да-Не, Налични-Отсъстващи, Мъжки-Женски), е по-добре да се преведат в двоична система: 0 и 1. Стойността 1 обикновено се присвоява на положителна стойност (Да, Налично), 0 - отрицателно (Не, Липсващо).
7) Качествени показатели, които имат няколко стойности, които се различават по тежест, нивото на явлението (Слабо-Средно-Силно; Студено-Топло-Горещо) могат да бъдат класирани и съответно преведени в числа. На най-ниското ниво на феномена се присвоява най-ниският ранг - 0 или 1, следващите степени се обозначават със стойностите на ранговете по ред. Например: Без заболяване - 0, лека - 1, умерена - 2, тежка - 3.
8) Понякога един показател за качество отговаря на няколко стойности. Например в колона "Съпътстваща диагноза", ако има няколко заболявания, искаме да ги посочим разделени със запетаи. Това не трябва да се прави, тъй като обработката на такива данни е много трудна и не може да бъде автоматизирана. Ето защо е по-добре да направите няколко колони със специфични групи заболявания („ССЗ заболявания“, „заболявания на стомашно-чревния тракт“ и др.) Или определени нозологии („хроничен гастрит“, „ИБС“ и др.), В които данните се въвеждат в двоичен, двоичен вид: 1 (коетоозначава "Има дадено заболяване") - 0 ("Няма дадено заболяване").
9) За да разграничите отделните групи индикатори, можете активно да използвате цвят: например колони с KLA индикатори са маркирани в червено, OAM данни - в жълто и т.н.
10) Всеки пациент трябва да съответства на един ред от таблицата.
Такъв дизайн на базата данни позволява не само значително да опрости процеса на нейната статистическа обработка, но и да улесни нейното попълване на етапа на събиране на материал.