Узагальнена модель регресії

При недотриманні основних передумов звичайного методу найменших квадратів доводиться коригувати модель: змінювати її форму, додавати або, навпаки, виключати фактори, перетворювати вихідні дані і т.п. Особливо часто на практиці доводиться стикатися з ситуаціями, в яких не виконуються передумови 3 і 4 про те, що обурення моделі мають постійну дисперсію і не коррелірованни між собою.

Невиконання передумови 3. тобто порушення умови гомоскедастичність збурень (8). означає, що дисперсія обурення залежить від значень факторів. Такі регресійні моделі називаються моделями з гетероскедастичності збурень. Наприклад, при дослідженні залежності вартості туристичної путівки (змінна Y) від середньомісячного доходу клієнта турагенства (фактор X) можна очікувати, що для більш забезпечених клієнтів розкид витрат на відпочинок вище, ніж для менш забезпечених, тобто дисперсія обурення не буде однаковою для різних значень фактора X (рис. 1).

Мал. 1. Лінійна модель регресії з гетероскедастичності збурень

Якщо має місце гетероскедастичності збурень, то оцінки параметрів моделі (1) звичайним методом найменших квадратів не будуть ефективними, т. Е. Їх дисперсії НЕ будуть найменшими. Розраховані значення стандартних помилок коефіцієнтів рівняння регресії (2) можуть бути заниженими, а при перевірці статистичної значимості коефіцієнтів може бути помилково прийнято рішення про їх значному відміну від нуля, тоді як насправді це не так.

При малому числі спостережень, що характерно для економетричних досліджень, для виявлення гетероскедастичності може використовуватися метод Голдфельда-Квандта. Даний тест використовується, якщо передбачається, що обурення регресійній моделі розподілені по нормальному закону, а середньоквадратичне відхилення збурень (i = 1, 2, ..., n) зростає пропорційно значенню фактора. Перевірка проводиться для всіх факторів, включених в модель, або тільки для факторів, імовірно що впливають на однорідність досліджуваної сукупності. Перевірка по деякому фактору Xj виконується в наступній послідовності:

1. Всі n залишків упорядковуються по зростанню значень фактора Xj.

2. В упорядкованому ряду вибирають k перших і k останніх залишків, при цьому k має бути більшою за кількість факторів, включених в модель. Зазвичай приймають. Центральні залишки, таким чином, виключаються з розгляду.

3. По кожній з груп обраних залишків визначається сума їх квадратів: і.

4. Розраховується F -Статистика Фішера за формулою. якщо SS1> SS2. або за формулою. якщо SS2> SS1.

5. Статистична гіпотеза про однакову дисперсії збурень не відхиляється, якщо F -Статистика не перевищує табличне значення F-критерію Фішера для прийнятого рівня значущості a і чисел ступенів свободи чисельника і знаменника. де р - число факторів в моделі (див. додаток).

Передумова 4 [умова (10)] може не виконуватися при побудові регресійної моделі по часових рядах досліджуваних змінних, де через наявність тенденції наступні рівні ряду можуть залежати від попередніх рівнів. У такому випадку говорять, що в моделі є автокорреляция збурень. Іншими причинами автокорреляции є:

Ø неврахування в моделі будь-якого важливого фактора;

Ø неправильний вибір форми регресійної залежності;

Ø наявність помилок вимірювання результативної ознаки;

Ø циклічність значень економічних показників;

Ø запізнювання зміни значень показників по відношенню до зміни економічних умов.

При наявності автокореляції збурень звичайний метод найменших квадратів дає незміщені і спроможні оцінки параметрів моделі, які однак неефективні, т. Е. Їх дисперсії НЕ будуть найменшими. У порівнянні з гетероскедастичності збурень автокорреляция призводить, навпаки, до завищення стандартних помилок коефіцієнтів рівняння регресії. На основі таких результатів може бути зроблений помилковий висновок про несуттєве вплив досліджуваного фактора на залежну змінну, в той час як насправді вплив фактора на неї значимо.

Автокорреляция збурень буває позитивною або негативною. Позитивна автокорреляция проявляється в тому, що завищені значення збурень попередніх спостережень результату Y призводять до завищення збурень наступних спостережень. На графіку тимчасового ряду залишків регресії це виражається, наприклад, в чергуванні зон позитивних і негативних залишків (рис. 2). При негативній автокореляції. навпаки, завищені значення збурень попередніх спостережень занижують обурення наступних спостережень, а залишки регресії «занадто часто» змінюють знак (рис. 3).

Автокореляцію збурень виявляють шляхом дослідження ряду залишків за допомогою різних критеріїв. Найбільш часто для цієї мети використовується тест Дарбіна-Уотсона. заснований на припущенні, що якщо є автокорреляция збурень, то вона присутня і в часі ряду залишків регресії. Тест заснований на розрахунку d # 8209; статистики

значення якої порівнюють з критичними значеннями d1 і d2 (див. додаток). При цьому можуть виникнути такі ситуації:

· Якщо. то обурення визнаються некоррелірованнимі;

· Якщо. то є позитивна автокорреляция збурень;

· Якщо. то існує негативна автокорреляция;

· Якщо або. то це вказує на невизначеність ситуації.

В останньому випадку для виявлення автокореляції використовується коефіцієнт автокореляції залишків першого порядку

Статистична гіпотеза про відсутність автокореляції збурень не відхиляється на прийнятому рівні значущості a, якщо коефіцієнт автокореляції не перевищує за абсолютною величиною критичне значення (див. Додаток). В іншому випадку роблять висновок про автокореляції збурень: позитивне значення коефіцієнта автокореляції вказує на позитивну автокореляцію, а негативне - відповідно на негативну.

Мал. 2. Модель регресії з позитивною автокореляцією збурень

Мал. 3. Модель регресії з негативною автокореляцією збурень

Невиконання передумов 3 і 4 означає, що ковариации і дисперсії збурень можуть бути довільними, т. Е. Здаватися деякою позитивно певної матрицею W:

де W - ковариационная матриця вектора збурень.

Модель множинної регресії, для якої виконується умова (22). називається узагальненої лінійної моделлю множинної регресії (Generalized Linear Multiple Regression Model). Для отримання незміщене і найбільш ефективних оцінок параметрів такої моделі застосовують узагальнений метод найменших квадратів (Generalized Least Squares), умова якого має вигляд:

Вектор оцінок b * параметрів узагальненої моделі визначається як

Слід зауважити, що коефіцієнт детермінації R 2 для узагальненої моделі не є задовільною мірою її якості і може використовуватися лише як наближена характеристика моделі.

На практиці ковариационная матриця вектора збурень W. як правило, невідома, і для реалізації узагальненого методу найменших квадратів доводиться вводити додаткові умови на структуру матриці W. Тому усунення гетероскедастичності та автокореляції збурень виробляють окремо, для чого використовують окремі випадки узагальненого методу найменших квадратів.