Оцінювання ймовірності випадкової події - розділ Освіта, Методи статистичного оцінювання В Результаті Реалізації Певного Комплексу Умов Може Відбутися Некот.
В результаті реалізації певного комплексу умов може відбутися певний випадкова подія, ймовірність появи якого невідома. Потрібно за результатами спостережень даної події в деякому експерименті оцінити ймовірність р.
Для вирішення поставленого завдання проводиться серія n незалежних і однорідних випробувань - схема Бернуллі, тобто здійснюється n незалежних реалізацій одного і того ж комплексу умов. Підраховується число m (A) = m випробувань, в яких подія A з'явилося. ставлення
називається частотою події А в серії n випробувань або його статистичною ймовірністю. Проаналізуємо властивості частоти p * як оцінки ймовірності p.
1. Оскільки число появ події А в n незалежних і однорідних випробуваннях підпорядковане біноміальному закону розподілу, то
З виразу (3.3.2) випливає, що частота (3.3.1) є несмещённой оцінкою ймовірності p.
2. Згідно з теоремою Бернуллі
тобто частота p * сходиться по ймовірності до ймовірності р. Отже, розглянута частота - це заможна оцінка ймовірності р.
3. Дисперсія частоти
де q = 1 p. Зі співвідношення (3.3.3) випливає, що при n ® ¥ дисперсія ® 0. Це означає асимптотическую ефективність зазначеної оцінки. Можна показати, що при будь-якому n дисперсія частоти - мінімально можлива величина, отже, p * є ефективною оцінкою p.
Таким чином, частота p * події А в серії n незалежних однорідних випробувань є відповідне значення його ймовірності, тобто найкраща точкова оцінка.
Досліджуємо якість оцінювання ймовірності p по його частоті p *. Отже, вважаємо, що
Апріорі число випадково і підпорядковане біноміальному закону розподілу з параметрами n. p. Згідно з теоремою Муавра-Лапласа при досить великих n (практично при np (1 p)> 9) біноміальний розподіл може бути з достатньою точністю апроксимувати нормальним розподілом з параметрами,. У цьому випадку справедливо співвідношення
Оскільки оцінка пов'язана з лінійною залежністю, вона буде розподілена приблизно нормально з параметрами
Так як закон розподілу (3.3.4) оцінки симетричний щодо оцінюваної ймовірності p. довірчий інтервал Ib, n (p) буде симетричний щодо оцінки. Для визначення даного інтервалу досить знати половину його довжини, яка дорівнює максимальній з довірчою ймовірністю b (p) абсолютної похибки e (p):
В результаті довірча ймовірність для p буде визначатися наступним рівністю:
Дозволивши рівняння (3.3.5) щодо e, одержимо
У вираженні (3.3.6) величина tb - квантиль нормованого нормального розподілу:
Значення функції tb наведені в додатку 4.
Якщо необхідні точність e і надійність b задані, то потрібне для їх забезпечення число nb, n випробувань перебуває з рівняння (3.3.6):
Формули (3.3.5) - (3.3.8) визначають рішення трьох основних завдань дослідження якості статистичного оцінювання (див. § 3.2) стосовно оцінки ймовірності випадкової події за його частоті в серії n незалежних однорідних випробувань.
Зі співвідношення (3.3.8) видно, що реквізит обсяг вибірки обернено пропорційний квадрату максимальної можливої похибки e оцінки і пропорційний квадрату функції tb. який росте швидше, ніж b. Тому для оцінювання ймовірності випадкової події за його частоті з достатньою точністю і надійністю потрібне проведення досить довгої серії випробувань. Сказане ілюструється табл.3.1, в якій наведено потрібні числа n0,95; e випробувань, що забезпечують з довірчою ймовірністю b = 0,95 необхідну точність e оцінювання різних значень ймовірності p.
Залежність числа випробувань від необхідної довірчої ймовірності
З табл.3.1 видно, що потрібне число nb; e випробувань зростає не тільки зі збільшенням неоходимой точності оцінювання, а й з наближенням істинного значення p оцінюваної ймовірності до 0,5. Це можна пояснити, оскільки при p = 0,5 дисперсія оцінки = p * досягає максимального значення, рівного 0,25 / n [см. формулу (3.3.3)]. Зазначений факт використовується для визначення верхньої межі потрібного числа випробувань. Так, вважаючи p = 0,5, b = 0,95, маємо значення tb = t0,95 = 1,96 »2 (див. Додаток 4). Відповідно до виразом (3.3.8) отримуємо
Приклад 3.1. В процесі експерименту виконано 200 дослідів, частота події A виявилася p * = 0,34.
1. Побудувати 85% -й довірчий інтервал для ймовірності події A.
2. Знайти довірчу ймовірність b для ймовірності події A. якщо максимальна ймовірна похибка eb = 0,1.
▼ 1) Для b = 0,85 в додатку 4 знаходимо tb = 1,439. Тоді за формулою (3.3.6) оцінка максимальної можливої помилки складе
Знаходимо довірчий інтервал зі співвідношення (3.3.7)
I0,85; 200 »[0,34 - 0,048; 0,34 + 0,048] = [0,292; 0,388].
2) За формулою (3.3.5) знаходимо довірчу ймовірність
Значення функції Ф0 (x) взято з додатка 2.
Приклад 3.2. В процесі експерименту виконуються досліди, частота події становить p * = 0,7.
1. Визначити реквізит обсяг вибірки, щоб максимальна ймовірна похибка оцінки p * становила e £ 0,05 при довірчій ймовірності b = 0,9.
2. Знайти верхню межу потрібного числа дослідів при будь-якій частоті події.
▼ 1) По заданому b знаходимо tb = 1,643. Тоді відповідно до формули (3.3.8) реквізит обсяг вибірки складе
2) З виразу (3.3.9) маємо
[1] Для зміщеною оцінки поняття ефективності не визначено.
[2] Символи -, ¯ означають відповідно зростання і спадання.