Кутия с инструменти за напасване на криви
Основи на кутията с инструменти за напасване на криви
1.3.8. Критерии за приближение
След напасване на данните със стандартен параметричен модел или дефиниран от потребителя модел, качеството на приближението може да бъде оценено както графично, така и с помощта на различни критерии за съответствие: SSE (сума от квадратни грешки), R-квадрат (R-квадрат тест), коригиран R-квадрат (коригиран R-квадрат), RSME (корен на средната квадратна грешка). Освен това е възможно да се изчислят доверителни интервали за намерените стойности на параметрите на модела, съответстващи на различни нива на вероятност, и доверителни ленти за приближение и данни, също съответстващи на различни нива на вероятност.
Визуална оценка на качеството на приближението
Първо, чрез изобразяване на данните и параметричния модел вече е възможно да се направи предварително заключение за това доколко избраният модел (с намерените стойности на параметрите) отговаря на данните. Например при приближаване на следните данни
полином от пета степен, функцияae bxилиa1sin(b1x + c1) + a2sin(b2x + c2)е малко вероятно да получим добри приближения, което е очевидно от съответните графики по-долу

Второ, качеството на приближението може да се прецени визуално чрез разпределението на грешките, т.е. разликата между данните в дадени точки и стойностите на параметричния модел в същите точки. Ако грешките са достатъчно равномерно разпределени около нулата и няма ясно изразена тенденция в тяхното поведение, тогава толкова по-добро е приближението.
Например, ако данните
приближен с полином от втора степенax² + bx + cи моделax² + c, в койтолинеен член, получаваме следните резултати. Грешките наax² + bx + cса по-равномерно разпределени около нулата, отколкотоax² + cнапасват (в приложението cftool персонализираното уравнение беше използвано за създаване на моделаax² + c, вижте Създаване на ваш собствен параметричен модел, за да покажете графиката на грешката, изберете елемента Остатъци в менюто Изглед на главния прозорец на приложението cftool и след това Scatter Plot или Подпозиция на линейния график). Графиките по-долу показват разпределението на грешките за квадратични модели със и без линеен член.

За оценка на пригодността на приближението се използват и редица числени критерии, които се изчисляват автоматично в приложението cftol.
Критерии за приблизителна валидност
Критерият SSE (сума от квадрати поради грешка) е сумата от квадратите на грешките.
Критерият SSE се изчислява по формулата:
къдетоwkса теглата (ако не са посочени по време на импортиране на данни, те се считат за равни на единица),ykса данните вxkиkса стойностите на параметричния модел вxk. Близостта на SSE до нула показва добро качество на апроксимацията на данните от параметричния модел.
Критерий R-квадрат (R-квадрат) - квадратът на смесената корелация.
Тестът R-квадрат се определя като съотношението на сумата от квадрати на регресията на SSR към общата сума от квадрати (SST), т.е.

къде е средното.
Критерият R-квадрат може да приема само стойности от нула до едно и, като правило, колкото по-близо е до едно, толкова по-добре параметричният модел приближава оригиналните данни.
Въпреки това, с увеличаване на броя на параметрите на модела, стойността на критерия R-квадрат може да се увеличи,въпреки че в същото време качеството на приближението няма да се подобри. В тази връзка често се използва друг критерий - прецизираният R-квадрат, който включва броя на коефициентите на параметричния модел.
Коригиран R-квадрат
Ако броят на данните еnи броят на параметрите на модела еm, тогава прецизираният критерий R-квадрат се определя, както следва:
Стойността му не може да надвишава единица, а стойностите на прецизирания R-квадрат, близки до единица, показват добро приближение на първоначалните данни от параметричния модел.
Средна квадратна грешка (RSME)
Близките до нула RSME стойности показват добро приближение на оригиналните данни от параметричния модел.
Стойностите на горните критерии за напасване на данни чрез параметричен модел се показват в прозореца Резултати и в таблицата с таблицата на съвпадението на прозореца Напасване след изчисляване на параметрите на модела. Освен това е възможно да се контролира броят на получените критерии за качество на апроксимацията и информацията за конструирания параметричен модел. За да направите това, в диалоговия прозорец Напасване щракнете върху бутона Опции на таблицата ... и изберете необходимата информация (чрез задаване на съответните флагове) в диалоговия прозорец Опции на таблицата, който се появява:

В диалоговия прозорец Опции на таблицата част от флаговете (SSE, R-квадрат, Adj R-sq, RMSE) се използват за показване на стойностите на критериите за сближаване на данните чрез параметричен модел, а имената на флаговете съвпадат с имената на критериите за сближаване, описани по-горе, а значението на останалите флагове е както следва:
- Име - показване на името на приближението (задаването на името на приближението е описано в раздела Апроксимация чрез стандартни параметри и модели. Работа с множество приближения и множество набори от данни.)
- Набор от данни - име на набор от данни(Задаването на име за набор от данни е описано в раздела Прозорецът на приложението cftool. Импортиране на данни в приложението cftool).
- Тип - тип приближение (един от стандартните параметрични модели, описани в раздела Стандартни параметрични и непараметрични модели или Персонализирано уравнение, ако е използван потребителски модел, вижте раздел Създаване на ваш собствен параметричен модел).
- DFE - брой степени на свобода, т.е. разликата между броя на данните и параметрите на модела.
- # Coeff - брой коефициенти в параметричния модел.
Доверителни интервали и ленти
При настройване на параметри, приложението cftool изчислява доверителни интервали за намерените стойности на параметрите на модела, съответстващи на определено ниво на вероятност (по подразбиране е 95%). Доверителните граници за параметрите се показват в областта за извеждане на резултатите на диалоговия прозорец Напасване. Например при приближаване към данни
полином от втора степен
Стойностите на коефициентите и доверителните интервали ще бъдат както следва
Тоест, с вероятност от 95%, първият коефициент p1 на полинома е в интервала (0.9678, 1.016), вторият p2 е в интервала (1.897, 2.145), а третият коефициент p3 е в интервала (2.944, 3.213).
За да промените нивото на вероятност, изберете елемента Ниво на доверие в менюто Изглед на главния прозорец на приложението и задайте необходимото ниво на вероятност в подменюто, след което изберете отново параметрите. Например, за нивото на вероятност от 90% в предишния пример се получават по-тесни доверителни интервали:
Доверителните интервали за параметрите на модела се изчисляват по следната формула
къдетоb- намерени стойности на параметри,t- обратна функция за функцията на разпределение на Стюдънт,S- вектор отдиагонални елементи на матрицатаsX T X, къдетоXе проектната матрица,sе средната квадратична грешка.
Доверителните ленти, съответстващи на различни нива на вероятност, могат да бъдат конструирани както за данните, така и за приближението.
За да създадете диапазон на достоверност за данните, задайте необходимото ниво на вероятност, като изберете елемента Ниво на достоверност в менюто Изглед на главния прозорец на приложението и зададете необходимото ниво на вероятност в подменюто, след което изберете елемента Граници на прогнозиране в менюто Изглед. Например при приближаване към данни
доверителната лента на полинома от втора степен за данни, съответстващи на 99% вероятност, е дадена по-долу

Доверителните ленти също могат да бъдат начертани в прозореца за анализ (вижте раздел Операции с изградена апроксимация), за да го покажете на екрана, натиснете едноименния бутон в главния прозорец на приложението cftool. Следва:
- посочете абсцисите на точките, в които ще се извършва анализът в реда за въвеждане Анализ на Xi=;
- задаване на флаг Оценяване на годността при Xi;
- въведете нивото на вероятност във входния ред Ниво;
- изберете радио бутона За функция или За ново наблюдение (в зависимост от това за какво трябва да изградите доверителна лента, съответно за приближение или за данни);
- задайте флага за резултати от графиката;
- натиснете бутона Приложи.
Резултатът се показва в отделен графичен прозорец.