Репрезентативність (франц. Representatif- показовий) - властивість вибіркової сукупності представляти характеристики генеральної сукупності. Репрезентативність вибірки означає, що з деякою наперед заданої або обчисленої на фактичної вибірці похибкою встановлене на вибіркової сукупності можна ототожнити з генеральною сукупністю або, якщо використовувати мову статистики, знайти оцінки параметрів генеральної сукупності. По-перше, кожна одиниця генеральної сукупності повинна мати рівну ймовірність потрапити до вибірки. По-друге, щоб уникнути спрямованого відбору вибір одиниць генеральної сукупності потрібно виробляти незалежно від досліджуваного ознаки. По-третє, відбір повинен проводитися по можливості з однорідних сукупностей. По-четверте, число одиниць генеральної сукупності, відібраних для обстеження, має бути досить великим.
Процес безпосереднього визначення репрезентативності вибірки складається з етапів: зіставлення середніх показників розподілів вибіркової і генеральної сукупно-стей; зіставлення форм розподілу цих показників. Середній показник розподілу зазвичай береться як середня 144
арифметична або середньозважена арифметична цього розподілу.
У разі вивчення сукупностей з альтернативними ознаками замість середньої арифметичної обчислюється частка одиниць, що володіють розглянутої характеристикою, щодо всієї сукупності. Якщо позначити обсяг сукупності символом N, а явище з даними ознакою - М, то Р - частка явищ з цим ознакою визначається:
де Q - частка явищ з альтернативним ознакою.
Користуватися висновками, отриманими на підставі дослід-вання вибіркової сукупності, можна в тому випадку, якщо раз-ність між середніми арифметичними (або середніми частками) 'ознак вибіркової і генеральної сукупностей прагне до нуля. Передбачається, що ця вимога задовольняється при виконанні чотирьох умов, обумовлених вище. Правда, знаючи тільки вибіркові середні показники, не можна дати точні оціню-ки їх різниці, так як невідомі середні показники генераль-ної сукупності. Крім того, самі значення вибіркових середніх можуть коливатися в залежності від того, які одиниці генеральної сукупності потраплять до вибірки. Тому оцінка репрезентативності вибіркової сукупності за середніми показниками її розподілу зводиться до пошуку помилки репрезентативності.
Порівняння вибіркової і генеральної сукупностей за середніми показниками не дає повного уявлення про генеральну сукупність. Так, в двох сукупностях з однаковими середніми показниками розбіжності між максимальним і мінімальним значенням ознаки, що визначають форму його розподілу, можуть бути різні. Якщо уявити такий розподіл графічно, то воно утворює симетричну колоколообразную (нормальну) криву, яка відображатиме той факт, що сума багатьох незалежних довільно розподілених випадкових змінних наближено розподіляється по нормальному закону.
Ордината у, яка визначає висоту кривої для кожної точки х, являє собою щільність ймовірності для значення ХГ
Максимум щільності ймовірності доводиться на середнє значення змінної і дорівнює одиниці. Це означає, що чим менше
випадкове значення змінної відрізняється від її середнього значення, тим більша ймовірність його прояви. І навпаки, чим більше відхилення значень змінної від її середньої величини, тим ймовірність їх появи менше. Таким чином, значення відхилень від середніх величин, тобто значення виду х (- х, несуть інформацію про варіації досліджуваних змінних. Якби всі значення ознаки були однакові і збігалися з його середньою величиною, то сукупність значення цієї ознаки була б гранично однорідною.
Зазвичай число позитивних відхилень від середнього арифметичного значення сукупності приблизно дорівнює числу негативних відхилень, тобто сума всіх відхилень неминуче прагне до нульового значення. Тому, якби треба було підсумувати все відхилення ознаки в сукупності, ця сума завжди була б дорівнює нулю:
Щоб уникнути цього кожне відхилення зводять в квадрат і знаходять суму квадратів - дисперсію.
Нормальний розподіл повною мірою характеризується параметрами: JC - середнє значення ознаки і а - середнє квадратичне (стандартне) відхилення. Середнє х визначає положення розподілу щодо осі х; стандартне відхилення показує форму кривої; чим більше значення а, тим ширше крива і тим нижче її максимум.
Площа під нормальною кривою розташовується таким чином, що в межах х ± про перебуває 68% всього розподілу ознаки, в межах х ± 2