Кореляція і коефіцієнт кореляції, кореляційна залежність

Кореляція - ступінь зв'язку між 2-ма або декількома незалежними явищами.

Кореляція буває позитивною і негативною.

Позитивна кореляція (пряма) виникає при одночасній зміні 2-х змінних величин в однакових напрямках (в позитивному або негативному). Наприклад, взаємозв'язок між кількістю користувачів, що приходять на сайт з пошукової видачі і навантаженням на сервер: чим більше користувачів, тим більше навантаження.

Кореляція негативна (зворотна). якщо зміна однієї величини призводить протилежного зміни іншої. Наприклад, зі збільшенням податкового навантаження на компанії зменшується їх прибуток. Чим більше податків, тим менше грошей на розвиток.

Кореляція і коефіцієнт кореляції, кореляційна залежність
Типові види кореляції

Ефективність кореляції як статистичного інструменту полягає в можливості вираження зв'язку між двома змінними за допомогою коефіцієнта кореляції.

Коефіцієнт кореляції (КК) знаходиться в діапазоні чисел від -1 до 1.

При значенні КК рівним 1, слід розуміти, що при кожній зміні 1-й змінної відбувається еквівалентну зміна 2-й змінної в тому ж напрямку.

Кореляція і коефіцієнт кореляції, кореляційна залежність
Позитивна кореляція концентрацій етанолу в синовії і крові

Якщо значення КК дорівнює -1, то при кожній зміні відбувається еквівалентну зміна другою змінною величиною в протилежному напрямку.

Кореляція і коефіцієнт кореляції, кореляційна залежність
Негативна кореляція між показниками результатів в бігу на 100 м з бар'єрами і стрибками в довжину

Чим ближче кореляція до -1 або 1, тим сильніше зв'язок між змінними. При нульовому значенні (або близьким до 0) значуща зв'язок між 2-ма змінними відсутній або дуже мінімальна.

Інтерпретація значень коефіцієнта кореляції

Дуже висока кореляція

Кореляційна залежність відображає тільки взаємозв'язок між змінними і не говорить про причинно-наслідкові зв'язки: позитивна чи негативна кореляція між 2-ма змінними не обов'язково означає, що зміна однієї змінної викликає зміну іншої.

Можливо існує якась третя змінна, що впливає на причину наявності або відсутності кореляції.

Коефіцієнт кореляції не розраховується:

  • коли співвідношення між двома змінними нелінійно, наприклад, квадратичне;
  • в даних є більше 1-го спостереження за кожним випадком;
  • є аномальні спостереження (викиди, «відщепенці»);
  • дані містять яскраво виражені підгрупи спостережень.

Схожі статті