Числові характеристики вибірки

Числові характеристики вибірки - параметри вибірки, що виражають найбільш суттєві особливості статистичного розподілу вибірки.

Вибіркової середньої називають середнє аріфмітіческое значення ознаки вибіркової сукупності.

Якщо статистичний розподіл вибірки задано інтервальним варіаційним рядом, тоді при обчисленні необхідно перейти до дискретного варіаційного ряду, варіантами якого виступають середини інтервалів

Модою Мо називають варіанту, яка має найбільшу частоту.

Для інтервального статистичного розподілу спочатку визначають модальний інтервал [xm; xm + 1), для якого,

ni - число варіант цього інтервалу.

Медианой Ме дискретного статистичного розподілу називають варіанту, яка ділить варіаційний ряд на дві частини, відповідно до кількості варіант.

Якщо число варіант непарне, то,

Медианой Me інтервального статистичного розподілу називається число, для якого виконується рівність

Формула для обчислення Me має вигляд

де [xm; xm + 1) - медіанний частковий інтервал, для якого виконується нерівність

Дисперсія вибірки (вибіркова дісперссія) Dв - середнє аріфмітіческое квадратів відхилень спостережуваних значень ознаки від їх середнього значення.

Обчислення Dв можна спростити, використовуючи наступну формулу

Dв характеризує розсіювання спостережуваних значень кількісної ознаки навколо свого середнього значення.

Вибірковим середнім квадратичним відхиленням (стандартом) називають квадратний корінь з Dв.

Розмахом варіювання R називають різницю між найбільшою і найменшою варіантами.

Розмах варіювання є найпростішою характеристикою розсіювання варіаційного ряду.

Середнім абсолютним відхиленням називають середнє арифметичне абсолютних відхилень

Середнє абсолютне значення використовується для характеристики розсіювання варіаційного ряду.

Коефіцієнтом варіації V називають виражене у відсотках відношення к.

Коефіцієнт варіації V служить для порівняння величин розсіювання по відношенню до двох варіаційних рядів, навіть якщо варіанти мають різну розмірність.

Зведеними характеристиками статистичних розподілів виступають статистичні (емпіричні) моменти.

Звичайним емпіричним моментом порядку l називають середнє значення l х ступенів різниць.

де с - довільна постійна число, т. н. помилковий нуль.

Початковим емпіричним моментом порядку l називають звичайний момент порядку l при с = 0.

т. е. початковий емпіричний момент першого порядку дорівнює вибіркової середньої.

Центральним емпіричним моментом порядку l називають звичайний момент порядку l при.

т. е. центральний емпіричний момент другого порядку дорівнює вибіркової дисперсії.

Центральні моменти можна виразити через звичайні:

Умовним емпіричним моментом порядку l називають початковий момент порядку l. обчислений для умовних варіант.

де ui - умовна варіанту.

Умовними називають варіанти, які визначаються рівністю

де с - будь-яка варіанти xi. яка розташовується в середині варіаційного ряду або є модою;

Таким чином, для варіаційного ряду, що складається з рівновіддалених варіант з кроком h. умовні варіанти є цілі числа.

Висловимо звичайні моменти через умовні:

Підставивши (5.22) в (5.18), можна отримати зручні для обчислень формули, що виражають центральні моменти через умовні.

Приклад. Для статистичного розподілу розрахувати числові характеристики.

Теорія оцінок визначає методи і способи статистичної оцінки невідомих параметрів теоретичного розподілу випадкової величини за сукупністю експериментальних даних. При цьому часто допускається, що закон розподілу генеральної сукупності відомий, але невідомі параметри цього закону (математичне очікування, дисперсія), які необхідно оцінити (приблизно знайти) по вибіркової сукупності.

Статистичною оцінкою невідомого параметра теоретичного розподілу називається функція від вибіркових значень (варіант), яка дає наближене значення оцінюваного параметра.

Всі оцінки діляться на точкові і інтервальні.

Точкової називається оцінка, яка визначається одним числом.

До точкових оцінками ставляться такі вимоги:

Нехай - статистична оцінка невідомого параметра теоретичного розподілу. Припустимо, що за вибіркою обсягу n знайдена оцінка. Ізвлечём з генеральної сукупності іншу вибірку обсягу n і обчислимо. . Повторюючи досвід багаторазово, отримаємо числа. , ...,. які, взагалі кажучи, різні між собою. Таким чином, оцінку можна розглядати як випадкову величину, а числа. , ..., - як її вкладені значення.

Несмещённой називають статистичну оцінку. математичне очікування якої дорівнює оцінюваному параметру при будь-якому обсязі вибірки, т. е.

Зміщеною називають оцінку, математичне очікування якої не дорівнює оцінюваному параметру, т. Е.

Ефективною називають статистичну оцінку, яка при заданому обсязі вибірки n имет найменшу можливу дисперсію.

Заможної називають статистичну оцінку, яка при прагне за ймовірністю до оцінюваного параметру, т. Е.

де - нескінченно мала величина.

Оцінка генеральної середньої вибіркової середньої виконується за формулою (5.4) і є немещённой і заможної, якщо вибірка повторна і несмещённой, якщо вибірка бесповторная.

В якості оцінки генеральної дисперсії приймають виправлену вибіркову дисперсію S 2.

яка задовольняє вимогу несмещённості. Очевидно, при досить великих значеннях n Dв і S 2 розрізняються мало. На практиці S 2 обчислюється, якщо n <30.

Для оцінки середнього квадратичного відхилення генеральної сукупності використовується виправлене вибіркове середнє квадратичне відхилення S або вибіркове середньоквадратичне відхилення.

Всі розглянуті оцінки (формули (5.4), (5.11), (5.24), (5.25)) є точковими.

Точкові оцінки використовуються насамперед тоді, коли з їх допомогою виконуються інші розрахунки. При цьому точкові оцінки не несуть інформації про точність конкретної оцінки. При малих обсягах вибірки точкові оцінки можуть значно відрізнятися від оцінюваного параметра.

Інтервального називається оцінка, яка визначається двома числами - початком і концомм інтервалу, в якому знаходиться оцінюваний параметр теоретичного розподілу з певною ймовірністю.

Нехай знайдена за даними вибірки статистична оцінка є оцінкою невідомого параметра. Статистична оцінка тим точніше визначає параметр. чим менше абсолютна величина різниці. т. е. якщо і

то чим менше. тим оцінка точніше. Таким чином, величина характеризує точність оцінки.

Зазвичай задається наперед у вигляді числа, близького до одиниці, найбільш често - 0,95; 0,99; 0,999.

Замінимо нерівність у формулі (5.27) рівносильним подвійним нерівністю:

Інтервал називають довірчим. його межі - довірчими межами.

Довірчий інтервал покриває невідомий параметр з надійністю.

Якщо випадкова величина X розподілена нормально з математичним очікуванням рівним a і среднеквадратическим відхиленням відомим і рівним. то по вибірці об'єму n можна знайти довірчі кордону для математичного очікування a по вирівняний

де aн і aв - нижня і верхня довірчі кордону математичного очікування a;

t - коефіцієнт, що визначається за таблицею функції Лапласа, якому відповідає значення функції Лапласа. В цьому випадку

Аналіз формули (5.29) показує, що

- при зростанні обсягу вибірки n число зменшується і, отже, точність оцінки зростає;

- при збільшенні надійності зростають значення t (функція є зростаючою) і. що призводить до зменшення точності оцінки;

- якщо потрібно оцінити математичне сподівання з наперед заданою точністю і надійністю. то мінімальний обсяг вибокі, який забезпечить цю точність знаходять за формулою

Формула (5.30) використовується для повторної вибірки, для бесповторной вибірки мінімальний обсяг перераховують за формулою

де N - генеральної сукупності.

Приклад 1. Випадкова величина X має нормальний розподіл з відомим среднеквадратическим відхиленням. Знайти довірчий інтервал для оцінки невідомого математичного очікування a по. якщо і .

Отримали шуканий довірчий інтервал:

Приклад 2. Знайти мінімальний обсяг повторної і бесповторной вибірок для генеральної сукупності з об'ємом N = 1000 с. при якому точність оцінки математичного очікування нормально розподіленого ознаки дорівнюватиме 0,2 прі.

Приймаємо обсяг повторної вибірки n = 385.

Для бесповторной вибірки

Приймаємо обсяг бесповторной вибірки.

Якщо випадкова величина X розподілена нормально з математичним очікування рівним a і среднеквадратическим відхиленням невідомим, то за вибіркою обсягу n можна знайти довірчі кордону для математичного очікування a за формулами

де S - виправлене середнє квадратичне відхилення;

- коефіцієнт Стьюдента, який визначається за таблицею в залежності від надійності і числа ступенів свободи, рівну.

При необмеженому зростанні обсягу вибірки n розподіл Ст'юдента прагне до нормального, тому при n> 30 в формулах (5.32) можна замінити на.

Якщо випадкова величина X розподілена нормально і середньоквадратичне відхилення невідомо, то оцінити його помжно по виправленому середньоквадратичного відхилення S. розрахованому для вибірки обсягу n. за формулами

де. - нижня і верхня довірчі кордону середнє відхилення;

q - коефіцієнт розподілу. визначається за таблицею в залежності від і обсягу вибірки n.

якщо q<1. то учитывая, что . .

Приклад. Випадкова величина X має нормальний розподіл. За вибіркою обсягу n = 10 знайдено виправлене середнє квадратичне відхилення S = 0,16. Знайти довірчий інтервал, що покриває невідоме середньоквадратичне відхилення з надійністю.

По таблиці знайдемо q = 1,8 (q> 0) при і n = 10.

Шукані довірчі кордону довірчого інтервалу:

Практичне застосування формули (5.28) і (5.32) отримали для оцінки істинного значення вимірюваної величини, формули (5.33) - для оценці точності вимірювань (точності приладу).

Якщо випадкова величина X має біномінальної розподіл, то оцінити невідому ймовірність p появи події A в кожному випробуванні можна, розрахувавши довірчі кордону за формулами

де рн і рв - нижня і верхня довірчі кордону невідомого значення ймовірності p;

w - відносна частота (точкова оцінка для p).

де m - число появи події A;

n - число випробувань.

Приклад. Проводять незалежні випробування з однаковою, але невідомої ймовірністю p появи події A в кожному випробуванні. Знайти довірчий інтервал для оцінки p з надійністю 0,95. якщо в 80 випробуваннях подія A з'явилося 16 разів.

Знайдемо t по таблиці функції Лапласа зі співвідношення.

Підставивши n. w. t в формулу (5.34), отримаємо

При великих значеннях n (порядку сотень) складові і дуже малі і множник. тому довірчі кордону можна розрахувати за формулами

Схожі статті