Є сайт, на ньому користувачі ставлять різним компаніям рейтинг.
Є K - число голосів, N - середня оцінка, яка входить в інтервал [1, 5].
Потрібен якийсь показник T (K, N), який є функцією від середньої оцінки компанії і числа голосів.
За цим показником компанії будуть сортуватися.
Показник повинен враховувати те, що чим менше число голосів, тим більша ймовірність того, що оцінка відрізняється від об'єктивної (будемо для простоти вважати об'єктивною середню оцінку всіх користувачів землі :)).
Поки придумав тільки таку формулу:
N = K + (K-3) * (N-1) * k / Nmax. де Nmax - максимальне число голосів, k - деякий коефіцієнт, який підбирають зі здорового глузду, дивлячись на реальні дані.
Може я винаходжу велосипед і є якісь математично обгрунтовані і життєво перевірені формули для подібних речей?
Є готові і працюють нині алгоритми, наприклад рейтинг IMDB, який заснований на теоремі Байеса. Формула дуже добре розписана тут: www.wowwebdesigns.com/formula.php
Дякуємо!
Бачив цю формулу на Кинопоиск, але не звернув увагу.
Так, хитра насправді формула.
Чим менше голосуючих, тим ближче рейтинг до середньої оцінки всіх об'єктів.
я б використовував щось типу:
средневзвешанной оцінки за даним критерієм * к-ент достовірності.
к-ент достовірності = средневзвешанное число всіх оцінок за кожним критерієм приведене до 1.
тобто - якщо на вашу критерієм проголосувало більше ніж средневзвешанное кількість голосів, то вага цієї оцінки збільшується.
сенс - чим більше оцінок - тим більше вага результату.
Дякуємо!
Ваша формула схожа на описану в наступних пості.
Так, напевно, правильна логіка - чим більше оцінок - тим більше вага результату.