Математика (стр
Поради големия обем този материал е разположен на няколко страници: 1 2 3 4 5 6 7 8 9 |
Групиранетое процес на подреждане и систематизиране на данните, получени по време на експеримента, с цел извличане на съдържащата се в тях информация. В процеса на групиране се извършва разпределението на варианта на извадката в групи или интервали на групиране, всеки от които съдържа определен диапазон от стойности на изследвания атрибут. Процесът на групиране започва с разделянето на целия диапазон от вариации на характеристиките на интервали за групиране.
За всяка конкретна цел на статистическото изследване, размера на разглежданата извадка и степента на вариация на даден признак в нея има оптимална стойност за броя на интервалите и ширината на всеки от тях. Приблизителната стойност на оптималния брой интервалиkможе да се определи въз основа на размера на извадкатаn, или като се използват данните, дадени в Таблица 3., или като се използва формулата на Стърджис:
Задаване на броя на груповите интервали
Размер на извадкатаn
Брой интервалиk
Стойносттаk, получена по формулата, почти винаги се оказва дробна стойност, която трябва да се закръгли до цяло число, тъй като броят на интервалите не може да бъде дробен. Практиката показва, че като правило е по-добре да се закръгли надолу, тъй като формулата дава добри резултати за големи стойностиn, а за малки - донякъде надценени.
Нека разгледаме опцията за групиране на извадка на конкретен пример. За да направите това, нека се обърнем към примера с гюлетласкачи (вижте таблици 1, 2). Ще определим броя на интервалите на групиране въз основа на данните, дадени в таблица 3. Когаразмер на извадкатаn=29 е целесъобразно да се избере броят на интервалите, равен наk=5 (формулата на Стърджис дава стойностk=5,9).
Нека се съгласим да използваме интервали с еднаква ширина в разглеждания пример. В този случай, след като се определи броят на груповите интервали, трябва да се изчисли ширината на всеки от тях, като се използва връзката:
.
Тукhе ширината на интервалите, аxmax иxmin са съответно максималната и минималната стойност на характеристиката в извадката. Стойноститеxmax иxmin се определят директно от таблицата с първоначални данни (виж таблица 2). В такъв случай:
(м).
Тук е необходимо да се спрем на точността на определяне на ширината на интервала. Възможни са две ситуации: точността на изчислената стойностhсъвпада с точността на експеримента или я надвишава. В последния случай е възможно да се използват два подхода за определяне на границите на интервалите. От теоретична гледна точка най-правилно е получената стойностhда се използва за изграждане на интервали. Този подход няма да въведе допълнителни изкривявания, свързани с обработката на експериментални данни. Въпреки това, за практически цели в статистическите изследвания, свързани с физическата култура и спорта, е обичайно получената стойност да се закръгляhдо точността на измерването на данните. Това се дължи на факта, че за визуално представяне на получените резултати е удобно границите на интервалите да са възможните стойности на атрибута. По този начин получената стойност на ширината на интервалите трябва да бъде закръглена, като се вземе предвид точността на експеримента. Специално отбелязваме, че закръгляването трябва да се извършва не в общоприетия математически смисъл, а нагоре, т.е. в повече, за да не се намали общотодиапазон на вариация на характеристиката - сумата от ширината на всички интервали не трябва да бъде по-малка от разликата между максималните и минималните стойности на характеристиката. В разглеждания пример експерименталните данни са определени до най-близките стотни (0,01 m), така че стойността на ширината на интервала, получена по-горе, трябва да се закръгли до най-близките стотни. В резултат на това получаваме:
След определяне на ширината на груповите интервали трябва да се определят техните граници. Препоръчително е долната граница на първия интервал да бъде равна на минималната стойност на характеристиката в извадкатаxmin:
В този пример 14x15H1 = 13.04 (m).
За да получите горната граница на първия интервал (xB1), добавете стойността на ширината на интервала към стойността на долната граница на първия интервал:
Имайте предвид, че горната граница на всеки интервал (тук първият) ще бъде едновременно долна граница на следващия (в случая втория) интервал:xН2=xВ1.
По подобен начин се определят стойностите на долната и горната граница на всички останали интервали:
В този пример:
Преди да групираме варианта, въвеждаме концепцията засредната стойност на интервалаxi, равна на стойността на характеристиката, равноотдалечена от краищата на този интервал. Като се има предвид, че той е отделен от долната граница със стойност, равна на половината от ширината на интервала, за определянето му е удобно да се използва връзката:
къдетоxHi е долната границаi-ro на интервала, аhе неговата ширина. Средните стойности на интервалите ще бъдат използвани по-късно при обработката на групирани данни.
След определяне на границите на всички интервали е необходимо да се разпределят вариантите на извадката върху тези интервали. Но първо, въпросът коеинтервал, за да присвоите стойност, която е точно на границата на два интервала, т.е. когато стойността на опциите съвпада с горната граница на един и долната граница на интервала, съседен на него. В този случай вариантът може да бъде приписан към всеки от двата съседни интервала и за да се елиминира двусмислието при групирането, ще се съгласим в такива случаи да отнесем вариантите към горния интервал. В полза на този подход може да се направи следният аргумент. Тъй като минималната стойност на атрибута съвпада с долната граница на първия интервал и е включена в този интервал, тогава вариантът, който попада на границата на два интервала, трябва да бъде приписан на един от тях, чиято стойност на долната граница е равна на разглеждания вариант.
Нека да преминем към разглеждането на статистическата таблица - вижте таблица 4, която се състои от седем колони.
Таблично представяне на резултатите от тласкането на гюле