Оцінювання ймовірності випадкової події

Оцінювання ймовірності випадкової події - розділ Освіта, Методи статистичного оцінювання В Результаті Реалізації Певного Комплексу Умов Може Відбутися Некот.

В результаті реалізації певного комплексу умов може відбутися певний випадкова подія, ймовірність появи якого невідома. Потрібно за результатами спостережень даної події в деякому експерименті оцінити ймовірність р.

Для вирішення поставленого завдання проводиться серія n незалежних і однорідних випробувань - схема Бернуллі, тобто здійснюється n незалежних реалізацій одного і того ж комплексу умов. Підраховується число m (A) = m випробувань, в яких подія A з'явилося. ставлення

називається частотою події А в серії n випробувань або його статистичною ймовірністю. Проаналізуємо властивості частоти p * як оцінки ймовірності p.

1. Оскільки число появ події А в n незалежних і однорідних випробуваннях підпорядковане біноміальному закону розподілу, то

З виразу (3.3.2) випливає, що частота (3.3.1) є несмещённой оцінкою ймовірності p.

2. Згідно з теоремою Бернуллі

тобто частота p * сходиться по ймовірності до ймовірності р. Отже, розглянута частота - це заможна оцінка ймовірності р.

3. Дисперсія частоти

де q = 1 p. Зі співвідношення (3.3.3) випливає, що при n ® ¥ дисперсія ® 0. Це означає асимптотическую ефективність зазначеної оцінки. Можна показати, що при будь-якому n дисперсія частоти - мінімально можлива величина, отже, p * є ефективною оцінкою p.

Таким чином, частота p * події А в серії n незалежних однорідних випробувань є відповідне значення його ймовірності, тобто найкраща точкова оцінка.

Досліджуємо якість оцінювання ймовірності p по його частоті p *. Отже, вважаємо, що

Апріорі число випадково і підпорядковане біноміальному закону розподілу з параметрами n. p. Згідно з теоремою Муавра-Лапласа при досить великих n (практично при np (1 p)> 9) біноміальний розподіл може бути з достатньою точністю апроксимувати нормальним розподілом з параметрами,. У цьому випадку справедливо співвідношення

Оскільки оцінка пов'язана з лінійною залежністю, вона буде розподілена приблизно нормально з параметрами

Так як закон розподілу (3.3.4) оцінки симетричний щодо оцінюваної ймовірності p. довірчий інтервал Ib, n (p) буде симетричний щодо оцінки. Для визначення даного інтервалу досить знати половину його довжини, яка дорівнює максимальній з довірчою ймовірністю b (p) абсолютної похибки e (p):

В результаті довірча ймовірність для p буде визначатися наступним рівністю:

Дозволивши рівняння (3.3.5) щодо e, одержимо

У вираженні (3.3.6) величина tb - квантиль нормованого нормального розподілу:

Значення функції tb наведені в додатку 4.

Якщо необхідні точність e і надійність b задані, то потрібне для їх забезпечення число nb, n випробувань перебуває з рівняння (3.3.6):

Формули (3.3.5) - (3.3.8) визначають рішення трьох основних завдань дослідження якості статистичного оцінювання (див. § 3.2) стосовно оцінки ймовірності випадкової події за його частоті в серії n незалежних однорідних випробувань.

Зі співвідношення (3.3.8) видно, що реквізит обсяг вибірки обернено пропорційний квадрату максимальної можливої ​​похибки e оцінки і пропорційний квадрату функції tb. який росте швидше, ніж b. Тому для оцінювання ймовірності випадкової події за його частоті з достатньою точністю і надійністю потрібне проведення досить довгої серії випробувань. Сказане ілюструється табл.3.1, в якій наведено потрібні числа n0,95; e випробувань, що забезпечують з довірчою ймовірністю b = 0,95 необхідну точність e оцінювання різних значень ймовірності p.

Залежність числа випробувань від необхідної довірчої ймовірності

З табл.3.1 видно, що потрібне число nb; e випробувань зростає не тільки зі збільшенням неоходимой точності оцінювання, а й з наближенням істинного значення p оцінюваної ймовірності до 0,5. Це можна пояснити, оскільки при p = 0,5 дисперсія оцінки = p * досягає максимального значення, рівного 0,25 / n [см. формулу (3.3.3)]. Зазначений факт використовується для визначення верхньої межі потрібного числа випробувань. Так, вважаючи p = 0,5, b = 0,95, маємо значення tb = t0,95 = 1,96 »2 (див. Додаток 4). Відповідно до виразом (3.3.8) отримуємо

Приклад 3.1. В процесі експерименту виконано 200 дослідів, частота події A виявилася p * = 0,34.

1. Побудувати 85% -й довірчий інтервал для ймовірності події A.

2. Знайти довірчу ймовірність b для ймовірності події A. якщо максимальна ймовірна похибка eb = 0,1.

▼ 1) Для b = 0,85 в додатку 4 знаходимо tb = 1,439. Тоді за формулою (3.3.6) оцінка максимальної можливої ​​помилки складе

Знаходимо довірчий інтервал зі співвідношення (3.3.7)

I0,85; 200 »[0,34 - 0,048; 0,34 + 0,048] = [0,292; 0,388].

2) За формулою (3.3.5) знаходимо довірчу ймовірність

Значення функції Ф0 (x) взято з додатка 2.

Приклад 3.2. В процесі експерименту виконуються досліди, частота події становить p * = 0,7.

1. Визначити реквізит обсяг вибірки, щоб максимальна ймовірна похибка оцінки p * становила e £ 0,05 при довірчій ймовірності b = 0,9.

2. Знайти верхню межу потрібного числа дослідів при будь-якій частоті події.

▼ 1) По заданому b знаходимо tb = 1,643. Тоді відповідно до формули (3.3.8) реквізит обсяг вибірки складе

2) З виразу (3.3.9) маємо

[1] Для зміщеною оцінки поняття ефективності не визначено.

[2] Символи -, ¯ означають відповідно зростання і спадання.