Якщо ви подивіться на роздруківку рівнянь регресії, то майже напевно знайдете поруч з коефіцієнтом R2 показник, який називають скоригованим коефіцієнтом R2 (adjusted R2). Іноді його також називають «виправленим» коефіцієнтом R2, хоча це визначення не означає, на думку багатьох, що такий коефіцієнт покращено порівняно зі звичайним.
Як зазначалося в розділі 5.2, при додаванні пояснює змінної до рівняння регресії коефіцієнт Л2 ніколи не зменшується, а зазвичай збільшується. Скоригований коефіцієнт R2, який зазвичай обознача-
-2
ють R. забезпечує компенсацію для такого автоматичного зсуву вгору шляхом накладення «штрафу» за збільшення числа незалежних змінних. Цей коефіцієнт визначається наступним чином:
R2 = 1 - (1 - R2) "| 1 =" 1 /? 2 - = R2 - (1 - /? 2), (5.60)
n-k- \ n-k- \ n-k-l n-k-l
де до - число незалежних змінних. У міру зростання до збільшується відношення до / (п - к - 1) і, отже, збільшується обсяг коригування коефіцієнта R2 в сторону зменшення.
Можна показати, що додавання нової змінної до регресії призведе
-2
до збільшення R. якщо і тільки якщо відповідна / -Статистика більше
2
одиниці (або менше -1). Отже, збільшення R при додаванні
нової змінної необов'язково означає, що її коефіцієнт значимо відрізняється від нуля. Тому аж ніяк не випливає, як можна було б припустити, що збільшення R означає поліпшення специфікації рівняння.
Це є однією з причин того, чому R2 не став широко використовуватися в якості діагностичної величини. Інша причина полягає в зменшенні уваги до самого коефіцієнту /? 2.
вправи
- Величина коефіцієнта R2 в логарифмічною регресії між витратами на продукти харчування, що розташовуються особистим доходом і відносною ціною продовольства (див. Рівняння 5.26) склала 0,9867. Перевірте, що критерій F виявився приблизно рівним 820,1 та оцініть його значимість (820,1 є фактичним значенням критерію F; число, яке ви обчисліть на основі коефіцієнта R2, буде дещо відрізнятися від цієї величини через помилки округлення).
- Перевірте, що критерій Єв відповідної регресії для обраного вами товару (див. Вправу 5.6) був правильно обчислений на основі коефіцієнта R2, і перевірте його значимість.
- Сума квадратів відхилень в регресії у вправі 5.6 виявилася меншою за ту, яка була отримана в оцінці регресійної залежності витрат на обраний вами товар від наявного особистого доходу у вправі 4.2. Використовуйте F-тест для оцінки значущості зменшення зазначеної суми. Цей тест еквівалентний деякому тесту, який ви вже виконували; поясніть, про яке тесті йдеться, і перевірте ідентичність зроблених висновків.
б