Критерій Вілкоксона-Манна-Уїтні

Цей критерій призначений для перевірки однорідності двох генеральних сукупностей, що розуміється в сенсі відсутності відмінностей в значеннях параметрів розташування (медіан, середніх значень) відповідних розподілів.

Ми маємо в своєму розпорядженні вибірками, витягнутими з двох генеральних сукупностей (l = 2). Пронумеруємо ці вибірки, так щоб забезпечити виконання нерівності n1 n2. Об'єднаймо вибірки і по об'едіннених вибірці обсягу n1 + n2 побудуємо загальний варіаційний ряд.

Критична статистика описуваного критерію має вигляд:

(2) і носить назву суми рангів.

Наступне правило перевірки гіпотези:

1) По заданим рівнем значущості критерію a за допомогою таблиць квантилів (процентних точок) стандартного нормального розподілу визначаємо квантиль рівня 1-a / 2 (або 100a / 2% точку стандартного нормального розподілу.

2) Обчислюємо стандартизоване значення критичної статистики g

де значення g обчислено за формулою.

3) Якщо виявиться, що

| Gст |> U1-a / 2 або | ga / 2 |> U1-a / 2. то перевіряється гіпотезу слід відкинути (і відповідно прийняти при всіх інших значення стандартизованої критичної статистики.

В умовах справедливості перевіряється гіпотези статистика поводиться як нормально розподілена випадкова величина з параметрами:

При цьому збіжність до нормального розподілу дуже швидка: воно вже ефективно працює при n1> 8.

Зважування вибіркових даних х1, ..., хn.

У загальному випадку спостереження хi приписується вага wi ³ 0, який визначається як деяка функція від його поточного значення. Зазвичай wi підпорядковують умові нормування 1

Під w розуміється вектор ваг (w (x1) ... w (xn)) в вираженні для вибіркових моментів і функція зі значеннями w (x) в вираженні для теоретичних моментів.

Якщо мають справу з результатами спостереження одновимірної випадкової величини х1 ... хn. то часто вага спостереження хi визначають залежно від його порядкового номера в упорядкованому (по зростанню) ряду спостережень, тобто мають у своєму розпорядженні спостереження в варіаційний ряд х1, х2, ..., хn і кожному члену варіаційного ряду хi ставлять у відповідність деяку вагу wi.

Цей прийом полягає в приписуванні ряду «хвостових» членів варіаційного ряду нульових ваг, а іншим однакових позитивних. Якщо приписування нульових ваг проводиться за ознакою виходу поточних значень спостережень за межі заданого діапазону [a; b], тобто:

то говорять про цензуру першого типу. Очевидно, в разі число u залишилися в розгляді спостережень є величина випадкова (u

Якщо ж нульові ваги приписуються фіксованій частці a крайніх малих значень і фіксованій частці b крайніх великих значень, то кажуть, що виробляється цензурування другого типу рівня (a і b). У цьому випадку число u залишилися в розгляді спостережень є величиною, заздалегідь заданій і рівній, зокрема n (1-a-b).

Дослідник може вдатися до цензурування вимушено або добровільно. Вимушене цензурування обумовлено відповідними умовами експерименту: наприклад, ми ставимо на руйнують випробування n виробів, але можемо експериментувати протягом обмеженого часу Т. Очевидно, ми будемо змушені провести в даному випадку одностороннє цензурування першого типу, при якому з подальшого розгляду виключаються точні значення довговічності (часу до руйнування) всіх тих виробів, що не зруйнувалися за час Т. з іншого боку, в класі оцінок, побудованих по цензурувати вибірках, годину то можна знайти оцінки, хоча і не є найкращими в рамках генеральної сукупності певного типу, але володіють вигідними властивостями стійкості своїх хороших якостей по відношенню до тих чи інших відхилень від апріорних припущень.

Це поняття пов'язане з ситуаціями, коли досліджуваний ознака x не може бути спостерігаємо в якій-небудь області його можливих значень. Так, наприклад, якщо ми досліджуємо розподіл сімей за доходом, то за умовами вибіркового обстеження позбавлені можливості спостерігати сім'ї з середньо нульовим доходом, менше деякого заданого рівня a (тис. Руб.), То в подібних випадках кажуть, що розподіл урізано зліва в точці a. На відміну від цензурованих вибірок в вибірках з урізаних розподілів ми не маємо можливості оцінити навіть частки спостережень, розташованих за межами порога урізання.

Завдання для самостійного рішення.

1. Аудиторська фірма хоче проконтролювати стан рахунків одного з комерційних банків. Для цього випадково відбираються 50 рахунків. За 20 рахунках з 50 відібраних мало місце рух грошових коштів протягом місяця. Побудуйте 99% довірчий інтервал, що оцінює частку рахунків в генеральної сукупності, якими можна говорити про рух грошових коштів на протязі місяця.

А) Побудуйте гістограму, кумуляту.

Б) Розрахуйте середню потужність підприємств.

В) Знайдіть дисперсію, середньоквадратичне відхилення, коефіцієнт варіації.

Поясніть отримані результати, зробіть висновки.

4. Менеджер компанії, що займається прокатом автомобілів, хоче оцінити середню величину пробігу одного автомобіля протягом місяця. З 280 автомобілів, що належать компанії, методом випадкової бесповторной вибірки відібрано 30. За даними цієї вибірки встановлено, що середній пробіг автомобіля протягом місяця становить 1 342 км зі стандартним відхиленням 227 км. Вважаючи пробіг автомобіля випадковою величиною, розподіленою за нормальним законом, знайдіть 95% -й довірчий інтервал, що оцінює середній пробіг автомобілів за все парку протягом місяця.

5. За допомогою власне-випадкового повторного відбору керівництво фірми провело вибіркове обстеження 900 своїх службовців. Середній стаж їх роботи в фірмі дорівнює 8,70 року, а середньоквадратичне (стандартне) відхилення - 2,70 року. Серед обстежених виявилося 270 жінок. Вважаючи стаж роботи службовців фірми розподіленим по нормальному закону, визначте: а) з ймовірністю 0,95 довірчий інтервал, в якому опиниться середній стаж роботи всіх службовців фірми; б) з ймовірністю 0,90 довірчий інтервал, що накриває невідому частку жінок у всьому колективі фірми.

6. Власник автостоянки побоюється обману з боку своїх службовців (охорони автостоянки). Протягом року (365 днів) власником авто стоянки проведено 40 перевірок. За даними перевірок середнє число автомобілів, що залишаються на ніч на охорону, склало 400 одиниць, а середньоквадратичне (стандартне) відхилення їх числа - 10 автомобілів. Вважаючи відбір власне-випадковою, з імовірністю 0,99 оціните за допомогою довірчого інтервалу справжнє середнє число автомобілів, що залишаються на ніч на охорону. Чи обгрунтовані побоювання власника автостоянки, якщо по звітності охоронців середнє число автомобілів, що залишаються на ніч на охорону, становить 395 автомобілів?

7. За даними таблиці досліджуйте залежність між доходами сімей Х (тис. Руб) і їх витратами на споживання у.

Схожі статті