Для того щоб охарактеризувати розсіювання значень кількісної ознаки X генеральної сукупності навколо свого середнього значення, вводять зведену характеристику - генеральну дисперсію.
Генеральною дисперсією називають середнє арифметичне квадратів відхилень значень ознаки генеральної сукупності від їх середнього значення.
Якщо всі значення. . ознаки генеральної сукупності обсягу N різні, то
Якщо ж значення ознаки. . мають відповідно частоти. . . причому. то
Приклад 1. Генеральна сукупність задана таблицею розподілу:
Знайти генеральну дисперсію.
Рішення: Знайдемо генеральну середню:
Знайдемо генеральну дисперсію:
Крім дисперсії для характеристики розсіювання значень ознаки генеральної сукупності навколо свого середнього значення користуються зведеної характеристикою - середнім квадратичним відхиленням.
Генеральним середнім квадратичним відхиленням (стандартом) називають квадратний корінь з генеральної дисперсії:.
Для того щоб охарактеризувати розсіювання спостережуваних значень кількісної ознаки вибірки навколо свого середнього значення вводять зведену характеристику - вибіркову дисперсію.
Вибіркової дисперсією називають середнє арифметичне квадратів відхилення спостережуваних значень ознаки від їх середнього значення.
Якщо всі значення. . ознаки вибірки обсягу n різні, то
Якщо ж значення ознаки. . мають відповідно частоти. . . причому. то.
Приклад 2. Вибіркова сукупність задана таблицею розподілу:
Знайти вибіркову дисперсію.
Рішення: Знайдемо вибіркову середню:
Знайдемо вибіркову дисперсію:
Крім дисперсії для характеристики розсіювання значень ознаки вибіркової сукупності навколо свого середнього значення користуються зведеної характеристикою - середнім квадратичним відхиленням.
Вибірковим середнім квадратичним відхиленням (стандартом) називають квадратний корінь з вибіркової дисперсії:
Обчислення дисперсії, байдуже - вибіркової або генеральної, можна спростити, використовуючи наступну теорему.
Теорема.Дісперсія дорівнює середньому квадратів значень ознаки мінус квадрат загальної середньої:.
Приклад. Знайти вибіркову дисперсію за даним розподілом
Рішення. Знайдемо вибіркову середню:
Знайдемо середню квадратів значень ознаки:
Нехай нам необхідно за даними вибірки оцінити (приблизно знайти) невідому генеральну дисперсію. Якщо в якості оцінки генеральної дисперсії прийняти вибіркову дисперсію, то ця оцінка буде приводити до систематичних помилок, даючи занижене значення генеральної дисперсії. Пояснюється це тим, що, як можна довести, вибіркова дисперсія є зміщеною оцінкою іншими словами, математичне очікування вибіркової дисперсії не дорівнює оцінюваної генеральної дисперсії, а так само.
Легко «виправити» вибіркову дисперсію так, щоб її математичне очікування дорівнювало генеральної дисперсії. Досить для цього помножити на дріб. Зробивши це, отримаємо виправлену дисперсію, яку зазвичай позначають через:
Виправлена дисперсія є, звичайно, несмещенной оцінкою генеральної дисперсії.
Отже, в якості оцінки генеральної дисперсії приймають виправлену дисперсію.
Для оцінки ж середнього квадратичного відхилення генеральної сукупності використовують «виправлене» середнє квадратичне відхилення, яке дорівнює квадратному кореню з виправленою дисперсії:
10.1.11 Точність оцінки, надійність. Довірчий інтервал
Точкової називають оцінку, яка визначається одним числом. Всі оцінки, розглянуті вище, - точкові. При вибірці малого обсягу точкова оцінка може значно відрізнятися від оцінюваного параметра, тобто приводити до грубих помилок. З цієї причини при невеликому обсязі вибірки слід користуватися інтервальними оцінками.
Інтервального називають оцінку, яка визначається двома числами - кінцями інтервалу. Інтервальні оцінки дозволяють встановити точність і надійність оцінок (сенс цих понять з'ясовується нижче).
Нехай знайдена за даними вибірки статистична характеристика служить оцінкою невідомого параметра. Будемо вважати постійним числом (може бути і випадкової величиною). Ясно, що тим точніше визначає параметр. чим менше абсолютна величина різниці. Іншими словами, якщо і. то чим менше. тим оцінка точніше. Таким чином, позитивне число характеризує точність оцінки.
Надійністю (довірчою ймовірністю) оцінки по називають ймовірність з якою здійснюється нерівність. Зазвичай надійність оцінки задається наперед, причому в якості беруть число, близьке до одиниці. Найбільш часто задають надійність, рівну 0,95; 0,99 і 0,999.
Нехай ймовірність того, що. дорівнює. .
Замінивши нерівність рівносильним йому подвійним нерівністю. або. маємо
Це співвідношення слід розуміти так: ймовірність того, що інтервал містить в собі (покриває) невідомий параметр. дорівнює.
Довірчим називають інтервал. який покриває невідомий параметр із заданою надійністю.
Метод довірчих інтервалів розробив американський статистик Ю. Нейман, виходячи з ідей англійського статистика Р. Фішера.