Коефіцієнт спряженості ознак

Фі-коефіцієнт застосовують тільки до таблиці 2 х 2, а коефіцієнт спряженості ознак С (contingency coefficient) використовують для оцінки тісноти зв'язку в таблицях будь-якого розміру.

Коефіцієнт спряженості ознак (contingency coefficient)

Міра тісноти зв'язку в таблицях будь-якого розміру.

Коефіцієнт спряженості ознак пов'язаний з Х 2 наступним чином:

Значення коефіцієнта спряженості знаходяться в діапазоні від 0 до 1. При відсутності зв'язку він дорівнює нулю (тобто змінні статистично незалежні), але свого максимального значення (1) він ніколи не досягає. Максимальне значення коефіцієнта спряженості залежить від розміру таблиці (числа рядків і колонок). Тому він використовується тільки для порівняння таблиць однакового розміру. Значення коефіцієнта спряженості для табл. 15.3 наступне:

Це значення коефіцієнта спряженості вказує на слабкий зв'язок. Інший статистикою, яку можна обчислити для будь-якої таблиці, є V-коефіцієнт Крамера (Cramer).

V-коефіцієнт Крамера (Cramer's V) - це модифікована версія коефіцієнта кор-реляції фі (ф), яку використовують в таблицях, великих за розміром, ніж 2x2.

V-коефіцієнт Крамера (Cramer's V)

Міра тісноти зв'язку, яка використовується в таблицях, великих за розміром, ніж 2x2.

Якщо для таблиць, більших, ніж 2x2, обчислюють фі-коефіцієнт, то він не має верхньої межі, V-коефіцієнт Крамера отримують коригуванням фі-коефіцієнта або по числу рядів, або за кількістю колонок в таблиці. Причому з двох значень вибирають менше. Корекції-вання здійснюють так, що значення V-коефіцієнта лежать в діапазоні від 0 до 1. Більше значення V-коефіцієнта вказує на більш сильну зв'язок, але не вказує, як пов'язані пе-ремінні. Для таблиці з rрядамі і з колонками зв'язок між V-коефіцієнтом Крамера і фі-коефіцієнтом виражається наступним чином:

Значення V-коефіцієнт Крамера для табл. 15.3 одно:

Таким чином, зв'язок не дуже сильна. В цьому випадку V = ф. Так завжди відбувається для таб-лиці 2x2. Інший зазвичай розраховується статистикою є коефіцієнт "лямбда".

Коефіцієнт "лямбда" використовується в тому випадку, коли змінні виміряні за допомогою на-гою номінальної шкали. Асиметричний коефіцієнт "лямбда" (asymmetric lambda) по-показувала виражене у відсотках поліпшення при прогнозуванні значення залежної змінної при даному значенні незалежної змінної.

Асиметричний коефіцієнт "лямбда" (asymmetric lambda)

Міра вираженого у відсотках поліпшення прогнозування значення залежної змінної при даному значенні незалежної змінної. Значення коефіцієнта "лямбда" ле-жать в межах від 0 до 1.

Асиметричний коефіцієнт "лямбда" підраховують для кожної з залежних змінних. Також розраховують симетричний коефіцієнт "лямбда" (symmetric lambda) - середнім значенням двох асиметричних значень.

Симетричний коефіцієнт "лямбда" (symmetric lambda)

Симетричний коефіцієнт "лямбда" не дає припущення про те, яка з змінних залежна. Він вимірює загальне поліпшення прогнозування, коли прогноз вже зроблений в обох напрямках.

Симетричний коефіцієнт "лямбда" робить припущення про те, яка з змінних залежна. Він вимірює загальне поліпшення, прогнозування, коли прогноз вже виконано в обох напрямках [14]. Значення асиметричного коефіцієнта "лямбда" в табл. 15.3, якщо в якості залежної змінної взяти використання Internet, так само 0,333. Це вказує на те, що знання статі збільшує нашу можливість прогнозування на0,333, тобто має місце поліпшення прогнозування на 0,33%. Симетричний коефіцієнт "лямбда" також дорівнює 0,33%.

Обчислюється статистика, яка вимірює зв'язок між двома порядковими змінними. Вона обчислюється з урахуванням числа пов'язаних рангів, і її краще використовувати для квадратних таблиць.

Значення цієї статистики лежать в межах від +1 до - 1. Таким чином, можна визначити напрям (позитивне чи негативне) і силу (наскільки близько дане значення знаходиться до 1) зв'язку. Для прямокутної таблиці, в якій кількість рядів відрізняється від кількості колонок, слід використовувати Таус (tau с).

Обчислюється статистика, яка вимірює зв'язок між двома порядковими змінними. Вона обчислюється з урахуванням числа пов'язаних рангів, і її краще використовувати, коли таблиця пе-ремінь не квадратна, а прямокутна.

Статистика "гамма" (gamma) не враховує ні пов'язані ранги, ні розмір таблиці. Зна-чення гами також лежать в межах від +1 до - 1 і зазвичай має більше числове зна-ня, ніж тау b і тау с.

Статистика "гамма" (gamma)

Обчислюється статистика, яка вимірює зв'язок між двома порядковими змінними. Вона не робить поправку на пов'язані ранги.

Дані табл. 15.3, де підлогу - номінальна змінна, не обробляють за допомогою по-рядкових статистик. Всі викладені вище статистики можна оцінити відповідними комп'ютерними програмами для крос-табуляції. Інші статистики для вимірювання тісно-ти зв'язку, а саме: змішаний момент кореляції і Неметричні кореляція, обговорюють-ся в главі 17.

Схожі статті