Парадокс Сімпсона - статистичний парадокс. згідно з яким фактор. більше виявляється при будь-яких фонових умовах, ніж протилежний йому, програє менш ефективного, але відносно часто зустрічається фактору. Ефект цього парадоксу на подив часто проявляється в області соціологічних наук і медичною статистикою; це відбувається, коли вагова змінна не враховується для однієї групи, але повинна використовуватися при розрахунках загальних оцінок.
приклади Правити
Приклад М. Гарднера з камінням Правити
Нехай ми маємо чотири набори каменів. Імовірність витягнути чорний камінь набору № 1 вище, ніж з набору № 2. У свою чергу, ймовірність витягнути чорний камінь з набору № 3 більше, ніж з набору № 4. Об'єднаймо набір № 1 з набором № 3 (отримаємо набір I), а набір № 2 - з набором № 4 (набір II). Інтуїтивно можна очікувати, що ймовірність витягнути чорний камінь з набору I буде вище, ніж з набору II. Однак, в загальному випадку таке твердження не так.
Доведення таке. Нехай - число чорних каменів в -ом наборі (вибірці), - загальне число каменів в -ом наборі при. За умовою:
Імовірність витягнути чорний камінь з наборів I і II, відповідно: ЦФА иаіер циа
Вираз для набору I не завжди більше вирази для набору II. Наприклад:.
Легко перевірити, що. В той час як .