Основни статистически характеристики на серия от измервания
Основните статистически характеристикина серия от измервания (вариационни серии) включватпозиционни характеристики (средни характеристики,илицентрална тенденция на извадката);характеристики на разсейване (вариации или флуктуации) иххарактеристики на разпределение на формата.
Характеристиките на позициятавключватсредно аритметично(средно),модаимедиана.
Характеристиките на разсейване(вариация или колебание) включват:диапазон на вариация,дисперсия,средноквадратичен корен(стандарт)стандартно отклонение,грешка на средното аритметично(грешка на средното),коефициент на вариацияи т.н.
Характеристиките на форматавключватизкривяване, изкривяване и ексцес.
Следват формули за изчисляване на основните статистически характеристики и се предлагат формули за изчисление както за негрупирани данни, така и за данни, групирани в интервали.
Характеристики на позицията
Средно аритметично
Средната аритметична стойност е една от основните характеристики на извадката.
Тя, подобно на други числени характеристики на извадката, може да се изчисли както от необработени първични данни, така и от резултатите от групирането на тези данни.
Точността на изчислението върху необработените данни е по-висока, но процесът на изчисление се оказва отнемащ време при голям размер на извадката.
За негрупирани данни средноаритметичната стойност се определя по формулата:
,
За групирани данни:
,
къдетоnе размерът на извадката,kе броят на интервалите на групиране,niса честотите на интервалите,xi– средни стойности на интервалите.
Мода
Дефиниция 1.Режиме най-често срещаната стойност в примерните данни. Означено сMoи определено по формулата:
,
където е долната граница на модалния интервал, е ширината на групиращия интервал, е честотата на модалния интервал, е честотата на интервала, предхождащ модалния, е честотата на интервала, следващ модалния.
Дефиниция 2.Режим Moна дискретна случайна променливае нейната най-вероятна стойност.
Геометрично модата може да се интерпретира като абсцисата на максималната точка на кривата на разпределение. Имабимодални имултимодалниразпределения. Има разпределения, които имат минимум, но нямат максимум. Такива разпределения се наричат антимодални.
Дефиниция.Модаленинтервал е интервалът на групиране с най-висока честота.
Средно
Определение.Медиана- резултатът от измерването, който е в средата на класираната серия, с други думи, медианата е стойността на характеристикатаX, когато едната половина от стойностите на експерименталните данни е по-малка от нея, а втората половина е по-голяма, означена сMe.
Когато размерът на извадкатаnе четно число, т.е. има четен брой резултати от измерване, тогава за определяне на медианата се изчислява средната стойност на двата извадкови показателя, разположени в средата на класираната серия.
За данни, групирани в интервали, медианата се определя по формулата:
,
където е долната граница на средния интервал; ширина на интервала на групиране, 0.5n– половината от размера на извадката, - средна интервална честота, -кумулативна честота на интервала, предхождащ медианата.
Определение.Средният интервал е интервалът, в който кумулативната честота за първи път е по-голяма от половината от размера на извадката (n/2) или кумулативната честота е по-голяма от 0,5.
Числените стойности на средната, модата и медианата се различават, когато има несиметрична форма на емпиричното разпределение.
Характеристики на разсейване на резултатите от измерването
За математико-статистическия анализ на резултатите от извадката не е достатъчно да се познават само характеристиките на длъжността. Същата средна стойност може да характеризира напълно различни проби.
Следователно, в допълнение към тях, статистиката също така взема предвидхарактеристиките на разсейване (вариации, илифлуктуации )резултати.
Обхват на вариация
Дефиниция.Диапазонътна вариацията е разликата между най-големите и най-малките резултати от пробата, означена сRи се определя
Информационното съдържание на този показател не е високо, въпреки че с малки размери на извадката е лесно да се оцени разликата между най-добрите и най-лошите резултати на спортистите.
Дисперсия
Определение.Дисперсията е средният квадрат на отклонението на стойностите на характеристиките от средната аритметична стойност.
За негрупирани данни дисперсията се определя по формулата
s2 = , (1)
къдетоXiе стойността на характеристиката, е средната аритметична стойност.
За данни, групирани в интервали, дисперсията се определя по формулата
,
къдетохiе средната стойностiна груповия интервал,niса интервалните честоти.
За опростяване на изчисленията и избягване на грешки при изчисление при закръгляванерезултати (особено когато размерът на извадката се увеличи), други формули също се използват за определяне на дисперсията. Ако средната аритметична стойност вече е изчислена, тогава се използва следната формула за негрупирани данни:
s2 =,
за групирани данни:
.
Тези формули се получават от предишните чрез разширяване на квадрата на разликата под знака на сумата.
В случаите, когато средноаритметичната стойност и дисперсията се изчисляват едновременно, се използват следните формули:
за негрупирани данни:
s2 =,
за групирани данни:
.
3. Средно квадратично (стандартно )отклонение
Определение.RMS (стандартно )отклонениехарактеризира степента на отклонение на резултатите от средната стойност в абсолютни единици, тъй като, за разлика от дисперсията, има същите мерни единици като резултатите от измерването. С други думи, стандартното отклонение показва плътността на разпределение на резултатите в група около средната стойност или хомогенността на групата.
За негрупирани данни стандартното отклонение може да се определи по формулите
s =,
s= или s= .
За данни, групирани в интервали, стандартното отклонение се определя по формулите:
,
или .