Математическа статистика
Описателна статистика
Характеристики на вземане на проби от двумерен случаен вектор
Характеристиките на извадката могат също да бъдат въведени за извадки от многомерни генерални популации. Нека (x1, y1),…,(xn, yn) е извадка от наблюдения на двумерен случаен вектор (X, Y) с разпределение FXY(x, y). Нека извадката съдържа k различни двойки наблюдения (варианти) z1,…,zk, $_>=(_>,_>)$, а вариантът zi се среща с честота ni, $i=\overline$.
По аналогия с едномерния случай въвеждаме случаен вектор от дискретен тип $(X_^,Y_^)$, който приема стойностите z1,…,zk с вероятности, равни на съответните относителни честоти, n1 / n,…, nk / n, т.е. $P\left( (X_^=_>)\bigcap (Y_^=_>) \right)=_>/n$, $i=\overline$.
Разпределението на случайния вектор $(X_^,Y_^)$ се нарича разпределение на двумерната извадка. Предварителна представа за разпределението на извадката може да се получи чрез изобразяване на елементите на извадката като точки в координатната равнина xOy. Това примерно представяне се нарича точкова диаграма.
Селективните числени характеристики на двумерна извадка (x1, y1),…, (xn, yn) са числени характеристики на произволен вектор $(X_^,Y_^)$. Такива характеристики включват например моментите на произволен вектор.
Примерният смесен начален момент на поръчка (q + r) е:
където $_>=P\left( (X_^=_>)\bigcap (Y_^=_>) \right)$, а сумирането е върху всички варианти на произволния вектор $(X_^,Y_^)$.
Като се има предвид, че произволният вектор $(X_^,Y_^)$ приема варианта (xi, yi) с вероятност, равна на относителната честота ni на това наблюдение в извадката, и представя продуктите $x_^y_^_>$ като сума от ni идентичниусловия $x_^y_^$, $i=\overline$, формула (1) може да бъде записана като:
По подобен начин примерният смесен централен момент на ред (q + r) се дава от:
Най-често използваната числена характеристика на двумерен вектор е корелационният коефициент. Спомнете си, че за произволен вектор от дискретен тип (X, Y), коефициентът на корелация rXY се определя, както следва:
където kXY е ковариационният момент, по дефиниция $_>=\mu _^$.
Като вземем предвид (2), дефинираме израза за коефициента на корелация на извадката $\rho _^$:
където $k_^$ е примерният ковариационен момент:
За примерен ковариационен момент и коефициент на корелация са приложими всички идентичности, валидни за ковариационния момент и коефициента на корелация на случаен вектор от дискретен тип. По-специално, връзката между ковариационния момент на извадката и смесения начален момент на извадката от втори ред е полезна на практика:
Пример 1
Двуизмерна проба може да бъде представена като корелационна таблица. Корелационната таблица (Таблица 1.4) е аналог на групирана статистическа серия за едномерна извадка.
Процедурата за групиране на двуизмерни наблюдения на проби може да се извърши директно върху диаграмата на разсейване, като върху нея се начертае решетка от хоризонтални и вертикални линии, взети с постоянни стъпки h1 и h2, и се изчислят честотите nij на пробните точки, попадащи във всеки правоъгълник.