1.3. Индикатори за точност на прогнозата
Всяка прогноза носи определена степен на грешка, следователно, когато прави прогнози въз основа на конкретен модел, изследователят винаги се занимава със случайни отклонения на прогнозните стойности от техните реални текущи и бъдещи стойности. Такива отклонения, в случай на правилна спецификация на модела, се приемат за нормално разпределени и различни показатели за точност на прогнозата служат като мярка за тяхното разсейване около прогнозираните стойности.
Нека разгледаме някои от тях. Нека yt са реалните стойности на показателите на времевия ред, а ft са прогнозираните. Тогава грешката на прогнозата за период от време t ще бъде:
Средната грешка на прогнозата(ME) се определя от съотношението
и характеризира степента на отклонение на прогнозата. В идеалния случай ME 0. Ако прогнозираните стойности са средно надценени, тогава ME 0.
Средната квадратна грешкана прогнозата (MSE) се определя от съотношението
.
Средната абсолютна грешка(MAE) се изчислява от съотношението:
.
MSE и MAE се използват за сравняване на процедурите за прогнозиране и избор на параметри за изглаждане на нивата на елементите на времевия ред.
Средната абсолютна процентна грешка(MPAE) се изчислява от съотношението:
и се използва за оценка на качеството на прогнозата.
Ако MPAE 50% - незадоволително. MRAE се изчислява от грешката при прогнозиране една стъпка напред.
Средната процентна грешка(MPE) се изчислява от съотношението:
и служи като индикатор за отклонение на прогнозата (не трябва да надвишава 5%).
Освен това в някои пакети за статистически приложения квадратният корен от MSE се нарича стандартна грешка и се обозначава като RMSE.
От разработените и използвани в практиката методи за анализ на времеви редове ще разгледаме само няколконай-простият, често използван в практиката и теоретично обоснован.
1.4. Нива на изглаждане на времеви редове
Този метод на анализ се използва главно за идентифициране на основната тенденция в развитието на изследваното явление и е предназначен да елиминира високочестотните колебания в нивата на времевия ред. Въпреки че този метод може също така да елиминира сезонните колебания, като избере продължителността на сезонността като осредняващ интервал.
Сред многото различни варианти на този метод, най-простият е изчисляването на проста подвижна средна. В този случай първо се избира дължината на интервала на изглаждане и изчислената стойност на средноаритметичната стойност на този интервал в началото на серията се присвоява на средата му. След това това действие се измества по нивата на серията с един елемент надясно и изчисленията се повтарят, т.е. изчисляването на средната аритметична стойност, така да се каже, се плъзга по нивата на серията. Оттук и името на метода.
Този метод е най-ефективен за линейната динамика на нивата на серията. В по-общ план се използват методи на претеглена пълзяща средна. Най-често използваният метод е експоненциално претеглената пълзяща средна. Този метод взема предвид остаряването на информацията, когато тя бъде премахната от текущия момент във времето.
Помислете за проста експоненциално претеглена средна стойност. Нека прогнозната стойност за периодаtсе изчисли по формулата
ft= yt+ (1 -)yt-1+ (1 -)2yt-2+…+ (1 -)nyt- n+ … ,
където е индикатор, характеризиращ тежестта на текущото наблюдение, наречен изглаждащ параметър (0n-1yt-n+ …].
В квадратни скоби се получава стойността заft-1. Тогава можем да напишем:
ft= yt+ (1 - )ft-1. (1.1)
Така получихме експоненциално претеглен модел на пълзяща средна. От (1.1) следва, че за да се изчисли експоненциално претеглената пълзяща средна, не е необходимо да се изчислява сумата от дълга числова серия, необходимо е само да се знае стойността на нивото на динамичния ред в текущия период и експоненциално претеглената пълзяща средна за предходния период.
Обърнете внимание, че сумата от теглата в израза за експоненциално претеглената средна (като сума от безкрайно намаляваща геометрична прогресия) е равна на единица.
Параметърът за изглаждане обикновено се избира според минималната грешка на прогнозата. За тази цел възможните стойности се сортират и се изчисляват експоненциално претеглени средни за всяка от тях, а за тях грешката на прогнозата, например MSE. Минималната грешка ще определи константата на изглаждане. При изчисляване на компютър възникват специални проблеми при избора поради автоматизацията на такива изчисления. Възможна е и ръчна опция за избор на стойността на тази константа.
След проста трансформация на модел (1.1), експоненциално претеглените пълзящи средни могат да бъдат представени като
ft=ft-1+(yt-ft-1).
Тази форма на представяне на модела оправдава името му като адаптивен прогнозен модел. Според този модел прогнозата за следващия периодt+1е равна на предходната прогноза плюс дела на грешката на предходната прогноза, т.е. моделът отчита резултатите от предишни прогнози, т.е. прогнозата за следващия период, така да се каже, се адаптира към резултатите от предишни прогнози.
Има различни препоръки за избор на възможни стойности на , основната е, че при анализиране на стационарни времеви редовеизглаждащият параметър не трябва да надхвърля интервала 0,05 - 0,3. Смята се, че ако грешката на прогнозата намалява, когато стойността надхвърли определения интервал, това означава, че говорим за нестационарен времеви ред.
Трябва да се отбележи, че както следва от (1.1), прогнозираните стойности са по-динамични с нарастване и в по-голяма степен отразяват динамиката на първоначалните данни и, обратно, колкото по-малки са прогнозираните стойности, се изглаждат. Следователно, когато в процеса на решаване на проблема се изисква да се увеличи чувствителността на прогнозата към динамиката на първоначалните данни, тогава високите стойности са напълно оправдани.
Обърнете внимание, че когато се изчислява съгласно модел (1.1), възниква проблемът с определянето на прогнозираната стойност за началния период (заt= 1, т.е.f0). Обикновеноf0е илиy1или средната стойност на първите няколко членове на серията. По правило изборът на началната стойностf0практически няма ефект върху крайния резултат от изчисленията.
Ето пример за използване на експоненциално претеглени пълзящи средни. Помислете (Фигура 1.7). Горе вляво на тази диаграма е графиката на оригиналната серия, горе вдясно е експоненциално претеглената пълзяща средна c=0,6, долу вляво е c=0,3, а долу вдясно е c=0,1. Както можете да видите, колкото повече, толкова по-плавна е серията от експоненциално претеглени пълзящи средни.
Фигура 1.7 - Експоненциално претеглени пълзящи средни