Агрегиране на данни

Процедурата за обобщени данни ви позволява да преобразувате групи от случаи в случаи, съдържащи обобщена информация за съответната група и да създадете нов файл с обобщени данни или да създадете нови променливи в активния набор от данни, съдържащ обобщена информация. Случаите се обобщават въз основа на стойности на нула или повече групиращи променливи. Ако променливите за групиране не са зададени, тогава целият набор от данни е една група за агрегиране.

 Ако създадете нов файл с обобщени данни, новият файл ще съдържа по един случай на група, дефинирана от променливата за групиране. Например, ако има една групираща променлива с две стойности, тогава новият файл с данни ще съдържа само два случая. Ако променливите за групиране не са зададени, тогава новият файл с данни ще съдържа едно наблюдение.

 Ако агрегатните променливи се добавят към активния набор от данни,

файлът с данни не е обобщен. Всеки случай с еднакви стойности на променливата за групиране получава същите стойности за новите сборни променливи. Например, ако има една променлива за групиране gender, тогава всички мъже ще имат една и съща стойност за нова обобщена променлива, представляваща средната възраст. Ако не са посочени променливи за групиране, тогава всички случаи ще получат една и съща стойност за нова обобщена променлива, представляваща средната възраст.

агрегиране

Работа с файлове

Диалог Обобщени данни

групиране на променливи. Случаите се групират въз основа на стойностите на групиращите променливи. Всяка уникална комбинация от стойности на променливи за групиране дефинира група. Ако се създаде нов, обобщен файлданни, всички променливи за групиране се записват в нов файл под предишните им имена и с информация от речника на данните. Групиращата променлива, ако е зададена, може да бъде числова или текстова.

агрегирани променливи. За създаване на нови променливи се използват оригиналните променливи с функции за агрегиране. Името на агрегатната променлива е последвано от незадължителен етикет на променлива, името на агрегатната функция и името на изходната променлива в скоби.

Можете да промените имената на агрегатните променливи по подразбиране, да добавите описателни етикети на променливи и да промените функциите, използвани за изчисляване на агрегатни стойности. Можете също така да създадете променлива, съдържаща броя случаи, попаднали във всяка група по време на агрегирането.

Как да агрегираме файл с данни

E Изберете от менюто:

Данни > Обобщени данни.

E Можете да зададете променливи за групиране, които определят как се групират случаите, когато данните се агрегират. Ако променливите за групиране не са зададени, тогава целият набор от данни е една група за агрегиране.

E Изберете една или повече агрегатни променливи.

E Изберете функция за агрегиране за всяка агрегирана променлива.

Запазване на обобщените резултати

Можете да добавите обобщени променливи към активния набор от данни или да създадете нов файл с обобщени данни.

 Добавяне на агрегатни променливи към активния набор от данни. Към активния набор от данни се добавят нови променливи, базирани на функции за агрегиране. Самият файл с данни не е обобщен. Всеки случай с еднакви стойности на променливата за групиране получава същите стойности за новите сборни променливи.

 Създайте нов набор от данни, съдържащ само агрегирани променливи.

Съхранява обобщените данни в нов набор от данни в текущата сесия. Файлът включва групиращи променливи, които дефинират агрегатни случаи и всички агрегатни променливи, които са дефинирани от агрегатни функции. Активният набор от данни не се променя.

 Напишете нов файл с данни, съдържащ само агрегирани променливи.

Съхранява обобщени данни във външен файл с данни. Файлът включва групиращи променливи, които дефинират агрегатни случаи и всички агрегатни променливи, които са дефинирани от агрегатни функции. Активният набор от данни не се променя.

Опции за сортиране за големи файлове с данни

За много големи файлове с данни може да е по-ефективно да се агрегират предварително сортирани данни.

Данните вече са сортирани по променливата(ите) за групиране. Ако данните вече са сортирани чрез групиране на стойности на променливи, тази опция позволява на процедурата да работи по-бързо и да използва по-малко памет. Използвайте тази опция с повишено внимание.

 Данните трябва да бъдат сортирани по стойностите на групиращите променливи в същия ред, в който групиращите променливи са посочени в процедурата за обобщени данни.

 Ако добавяте променливи към активния набор от данни, изберете тази опция само ако данните са сортирани във възходящ ред на групиране на стойности на променливи.

данни

Работа с файлове

Сортирайте данните преди агрегиране. В много редки случаи с големи файлове с данни може да се наложи да сортирате файла с данни чрез групиране на стойности на променливи преди агрегиране. Тази опция не се препоръчва, освен ако нямате проблеми с паметта или производителността.

Агрегиране на данни: агрегатна функция

Този диалогов прозорец указва функцията, използвана за изчисляване на стойностите на агрегираните данни за избраните променливи от списъка с агрегати в диалоговия прозорец с агрегирани данни. Агрегиращите функции включват:

 Обобщаващи функции за числови променливи, включително средна стойност, медиана, стандартно отклонение и сума.

 Брой наблюдения, включително непретеглени, претеглени, непропуснати и липсващи.

 Процентът или делът на стойностите, по-големи или по-малки от определената стойност.

 Процент или съотношение на стойности вътре или извън определения диапазон от стойности

Диалогов прозорец Агрегирани данни: Агрегирана функция

Агрегиране на данни: име и етикет на променлива

Когато данните се агрегират, имената на агрегираните променливи в новия файл с данни се задават по подразбиране. Диалоговият прозорец Обобщени данни: Име и етикет на променлива ви позволява да промените името и етикета на променливата, избрана в списъка Обобщени променливи. За повече информация вижте темата Имена на променливи в Глава 5 на стр.