Що ж це за закон такий - закон малих чисел?
Щоб відповісти на це питання, нам потрібно ненадовго зосередитися на законі чисел великих.
А закон великих чисел, кажучи гранично спрощено, стосується ось чого.
Припустимо у нас є величезний мішок з російськими монетами номіналом 1 рубль, 2 рубля, 5 рублів і 10 рублів. У мішку цих монет нескінченно багато, причому монет кожного номіналу порівну. Припустимо, що ці монети не відрізняються за розміром і вагою. До мішка по черзі підходять люди і виймають кожен по одній монеті. Це відбувається знову і знову: величезна кількість людей отримують свої монети.
Наше завдання - вгадати, скільки грошей отримає кожен підійшов в середньому.
Закон великих чисел стверджує, що чим більше до мішка підійде людей, тим більше середня кількість отриманих ними грошей буде наближатися до (1 + 2 + 5 + 10) / 4 = 4,5 руб. тобто до середнього арифметичного. І закон великих чисел, повірте, правдивий.
А ось закон малих чисел був би істинним, якби вже на основі підрахунку середньої кількості грошей, отриманих першими кількома людьми, ми отримали б результат 4,5 руб. А такий результат вельми малоймовірний. Наприклад, перші кілька людей цілком можуть отримати кожен по 10 рублів.
Таким чином, на відміну від закону великих чисел закон малих чисел помилковий.
Нагадаю, що терміни "закон великих чисел" і "закон малих чисел" - це умовні терміни, які не варто трактувати буквально.
Стосовно до більш реальним дослідницьким завданням, ніж наведена вище умовна завдання з монетами, помилковість закону малих чисел проявляється в тому, що чим менше вибірка, тим менш точно вона відображає властивості генеральної сукупності, тобто тим менше вона репрезентативна. І навпаки: чим більше вибірка, тим більше точно вона відображає властивості генеральної сукупності, тобто тим більшою мірою вона репрезентативна (за умови рандомізації, природно, але, як то кажуть, це вже зовсім інша історія). Відповідно, якщо людина робить висновки про генеральну сукупність за надто малою вибіркою, то він як би вірить в закон малих чисел, як би не розуміє його хибності.
Ось ще одна пояснювальна ілюстрація. Коли я вчився в школі, в кабінеті математики у нас висів, серед інших, невеликий плакат, на якому було написано:
Статистика. Вірно, коли багато.
Але нас цікавить не сам по собі закон малих чисел, а то, як люди діють (проводять дослідження, формулюють висновки), якщо, умовно кажучи, вірять в цей закон.
У цьому сенсі має місце наступне. Віра в закон малих чисел (а така віра, як правило, не усвідомлюється) породжує так зване "скоростигла узагальнення" (hasty generalization). Скоростиглим є таке узагальнення, при якому людина на підставі всього лише кількох своїх спостережень за певними об'єктами або явищами робить однозначний висновок про властивості всіх таких об'єктів або явищ. Наприклад, у дівчини було троє хлопців, і кожен з них виявився козлом, з цього дівчина робить висновок, що взагалі всі чоловіки козли. Звичайно, такий висновок є невірним, що лежить в його основі узагальнення - скоростигла, а дівчина як би вірить в те, що трьох чоловіків достатньо, щоб судити про все чоловіках, тобто вірить в закон малих чисел.
Іншими словами, людина, що вірить в закон малих чисел, перебільшує репрезентативність малої вибірки. Саме тому, до речі, віру в закон малих чисел Даніель Канеман відносив до евристики репрезентативності.
Щоб краще зрозуміти хибність закону малих чисел давайте вирішимо невелику задачу.
На столі стоїть кошик. У ній знаходяться кулі, причому 2/3 куль одного кольору і 1/3 куль іншого кольору. До кошику підійшли два гінеколога: молодий і старий. Кожен з них засовує в кошик руку і, не бачачи куль, виймає їх з кошика.
Молодий гінеколог витягнув 5 куль. Причому 4 з них виявилися червоними і один - білим.
Старий гінеколог витягнув 20 куль, причому 12 з них виявилися червоними і 8 - білими.
Хто з гінекологів - молодий чи старий - може з більшою впевненістю заявити, що в кошику 2/3 червоних куль і 1/3 білих, а не навпаки?
Зазвичай люди (причому незалежно від їх статі) вибирають молодого гінеколога. Міркують вони приблизно так: у молодого гінеколога 80% куль (4/5 * 100%) виявилися червоними, а у старого - тільки 60% куль (12/20 * 100%), значить більш впевнений повинен бути молодий гінеколог. Але таке міркування помилково і є прикладом віри в закон малих чисел: людина вважає, що вибірка в 5 куль може бути більш репрезентативною, ніж вибірка в 20 куль. А це, звичайно, не так.
Віра в закон малих чисел і йде з нею рука об руку скоростигла узагальнення поширені досить широко.
Для початку давайте звернемо увагу на те, що віра в закон малих чисел і скоростигла узагальнення можуть бути притаманні психологам-дослідникам, які, хоча і навчені математико-статистичних методів, все одно, наприклад, виводять закономірність, дослідивши лише 30 випробовуваних. (Так-так, дослідження Д. Канемана показують, що навіть навчені статистикою люди можуть вірити в закон малих чисел).
Притаманні віра в закон малих чисел і скоростигла узагальнення і психоаналітиків, які вважають, умовно кажучи, що семи пацієнток було досить Фрейду для формулювання основних положень психоаналізу.
Впливає закон малих чисел і на повсякденні висновки, які формулюються обивателями і притаманні житейському рівню пізнання. Наприклад, в наступних твердженнях, що відносяться до життєвого рівня пізнання, легко помітити скоростиглі узагальнення: всі блондинки - дурні, всі росіяни - алкоголіки, все москвичі - зізналася і т.д. і т.п.
Ще один відмінний приклад побутової, повсякденної віри в закон малих чисел можна побачити у вітчизняному фільмі "Статський радник". Пам'ятаєте епізод, в якому Пожарський, висловлюючи захоплення даром Фандоріна завжди вигравати, пропонує йому зіграти в карти - вгадувати, червона або чорна масть буде у витягнутій з колоди карти? Коли два рази випало чорне, Фандорін знову говорить "чорне", Пожарський не погоджується з ним ( "даруйте, три рази" чорне "."), Вибирає "червоне" і програє.
В даному випадку Пожарський ніби вірить в закон малих чисел, тобто вважає, що вже вибірка всього лише з трьох карт продемонструє закон великих чисел, під дією якого виникає послідовність карт, в якій чергування червоних і чорних мастей є рівномірним. Але така послідовність виникне тільки в досить множинної серії ігор і тасовок, причому чим більше буде ігор, тим більше буде рівномірність. (Звичайно, якщо знехтувати зносом карт і особливостями тасування).
Цей приклад, до речі, ілюструє не тільки віру в закон малих чисел, але і один з видів когнітивних спотворень (cognitive biases) під назвою "помилка азартного гравця" (gambler's fallasy).
Вірить в закон малих чисел і гравець в "Дурня", який, бачачи, що у нього на руках одні чорні масті заявляє, що колода погано перетасувати.
І звичайно, віра в закон малих чисел і скоростигла узагальнення лежать в основі всіляких лженаук і, зокрема, різних лжепсіхологій. Наприклад, саме в режимі скоростиглого узагальнення сформульовані всі соціонічні опису типів людей і соционических функцій.
На закінчення я б хотів відзначити, що віра в закон малих чисел - це всього лише одна з безлічі когнітивних спотворень (cognitive biases), притаманних людині. Причому в умовах наукового дослідження це спотворення можна порівняно легко компенсувати, застосовуючи сучасні математико-статистичні методи і належним чином забезпечуючи репрезентативність вибірки.
Ймовірно або не можливо? Випадково чи не випадково? Чому ми помиляємося в цьому?