Моделі цензурованих вибірок

Нагадаємо, що в разі цензурування залежною змінною yt замість її значень вище (або нижче) певного рівня розглядається сам цей рівень.

Наприклад, якщо попит на квитки істотно перевищує пропозицію, то за рівень попиту приймається кількість проданих квитків (цензурування зверху). У цьому випадку розподіл випадкової величини може бути представлено у вигляді поєднання дискретного і безперервного розподілів (див. Рис. 10.9).

Моделі цензурованих вибірок

Моделі цензурованих вибірок

Мал. 10.9. Розподіл, цензуроване "зверху"

Підходи до дослідження цензурованих і усічених вибірок дуже схожі. Також зазвичай припускають, що випадкова змінна у має нормальний розподіл.

Покажемо, як зміняться математичне очікування і дисперсія випадкової змінної у. якщо вибірка її значень цензурується знизу.

Введемо в розгляд нову випадкову змінну у *. таку, що

де b - точка цензурування.

N [m, s 2], то математичне очікування і дисперсія цензурувати випадкової величини y відповідно рівні *

Для опису залежності цензурувати змінної yt від впливають на неї факторів зазвичай використовується так звана tobit-модель.

Tobit- модель виходить з того, що цензурувати змінна yt описується наступним виразом:

де yt - спостережувані значення залежної змінної (наприклад, або фактичні витрати на відпочинок за кордоном, або 0); xt - вектор незалежних змінних, що впливають на залежну змінну yt. a - вектор параметрів; et - помилка моделі.

З виразу (10.159) слід, що умовне математичне очікування змінної уt за такими чинниками xt визначається як

Математичне сподівання уt з урахуванням цензурування (т. Е. M [уt цін]) для точки цензурування b = 0 визначаються наступним чином (див. Вираз (10.154)):

Відповідно до виразом (10.160) маржинальні ефекти факторів xt для математичного очікування змінної уt (без урахування цензурування) визначаються як

Відповідно до виразом (10.161) маржинальні ефекти факторів xt для математичного очікування змінної уt з урахуванням цензурування можуть бути представлені в наступному вигляді:

Зауважимо, що tobit-модель передбачає, що зміна факторів xt призводить до того, що ймовірність P (yt> 0) і математичне очікування М (yt | yt> 0) обов'язково змінюються в одному напрямку. Дійсно, відповідно до виразу (10.156) ймовірність того, що уt> 0 визначається як

Відповідно маржинальний ефект факторів xt для ймовірності P (уt> 0) може бути представлений в наступному вигляді:

Якщо коефіцієнт ai позитивний, то відповідно до виражень (10.164) і (10.166) зі збільшенням фактора ХIT (i = 1,2. N; t = 1,2. T) збільшується як математичне сподівання М (yt | yt> 0), так і ймовірність P (yt> 0), і, навпаки, при негативному ai з ростом фактора ХIT ці показники зменшуються.

Разом з тим зауважимо, що ефект одночасного збільшення математичного очікування та ймовірності при збільшенні деякого незалежного фактора хi на практиці може і не мати місце. Зокрема, як показали Фін і Шмідт (Fin and Schmidt, 1984), незалежна змінна хi. збільшує ймовірність позацензурна спостереження (P (yt> 0)), не завжди збільшує і математичне очікування змінної (М (yt | yt> 0)). Як приклад вони наводять втрати від пожеж в будівлях. Імовірність виникнення пожежі в старій будівлі вище, отже ¶P (yt> 0) / ¶хit> 0 (ХIT - вік t -го будівлі), але так як стара будівля коштує дешевше, то і пожежа в ньому приносить менше збитків, т. е. ¶М (yt | yt> 0) / ¶хit <0. Таким образом, в данной задаче предполагается, что коэффициент ai при факторе “возраст здания” имеет разные знаки в функциях вероятности и математического ожидания. В рамках tobit -модели это учесть невозможно.

Для опису процесів, в рамках яких припущення про однаковий характер маржинального ефекту математичного очікування та ймовірності не виконується, була запропонована більш загальна модель, що є поєднанням одномірної probit -моделі і усіченої регресії (для позацензурна значень залежної змінної).

На основі probit -моделі визначається ймовірність позацензурна (або цензурувати) спостереження при даному наборі факторів xt.

де F (g ¢ xt) - інтегральна функція закону нормального розподілу, що визначає ймовірність позацензурна спостереження; g - вектор параметрів моделі, zt - змінна-індикатор, що приймає значення 1 для позацензурна спостереження і значення 0 - для цензурувати.

Далі на основі моделі усіченої регресії визначається математичне сподівання позацензурна спостереження. Відповідно до виразом (10.150) математичне сподівання нецензурованої змінної може бути представлено в наступному вигляді:

Схожі статті