Знання - сукупність фактів, закономірностей і евристичних правил, за допомогою яких вирішується поставлене завдання.
Отже, формування інформації відбувається в процесі збору та передачі, тобто обробки даних. Яким же чином з інформації отримують знання?
Все частіше справжні знання утворюються на основі розподілених взаємозв'язків різнорідної інформації [19]. Коли інформація зібрана і передана для отримання явно не визначеного заздалегідь результату, то ви отримуєте знання. Сама по собі інформація в чистому вигляді не має сенсу. Звідси випливає висновок. що інформація - це чиєсь тактичне знання. передане у вигляді символів і за допомогою будь-яких прикладних засобів.
За визначенням Денхема Грея, "знання - це абсолютне використання інформації і даних, спільно з потенціалом практичного досвіду людей, здібностями, ідеями, інтуїцією, переконаністю і мотиваціями".
Знання мають певні властивості, які відрізняють їх від інформації [20].
- Структурованість. Знання повинні бути "розкладені по поличках".
- Зручність доступу і засвоєння. Для людини - це здатність швидко зрозуміти і запам'ятати або, навпаки, згадати; для комп'ютерних знань - засоби доступу до знань.
- Лаконічність. Лаконічність дозволяє швидко освоювати і переробляти знання і підвищує "коефіцієнт корисної змісту". До цього списку лаконічність була додана через всім відомої проблеми шуму і сміттєвих документів, характерною саме для комп'ютерної інформації - Internet і електронного документообігу.
- Несуперечливість. Знання не повинні суперечити один одному.
- Процедури обробки. Знання потрібні для того, щоб їх використовувати. Одне з головних властивостей знань - можливість їх передачі іншим і здатність робити висновки на їх основі. Для цього повинні існувати процедури обробки знань. Здатність робити висновки означає для машини наявність процедур обробки і виведення і підготовленість структур даних для такої обробки, тобто наявність спеціальних форматів знань.
Зіставлення і порівняння понять "інформація", "дані", "знання"
Для того щоб впевнено оперувати поняттями "інформація", "дані", "знання", необхідно не тільки розуміти суть цих понять, але і відчути відмінності між ними. Однак, однією інтуїтивної інтерпретації цих понять тут недостатньо. Складність розуміння відмінностей вищезазначених понять - в їх уявній синонімічно. Згадаймо, що поняття Data Mining переводиться на російську мову за допомогою цих же трьох понять: як видобуток даних, вилучення інформації. розкопка знань.
Для початку зробимо спробу розібратися в цих термінах на простих прикладах.
- Студент, який здає іспит, потребує даних.
- Студент, який здає іспит, має потребу в інформації.
- Студент, який здає іспит, потребує знань.
При розгляді першого варіанту - студент потребує даних - виникає думка, що студенту потрібні дані, наприклад, для обчислень. Інформацією в другому варіанті може виступати конспект або підручник. В результаті їх використання студент отримує лише інформацію, яка в певних випадках може перейти в знання. Третій варіант звучить найбільш логічно.
Інформація. на відміну від даних, має сенс.
Поняття "інформація" і "знання", з філософської точки зору, є поняттями більш високого рівня, ніж "дані", яке виникло відносно недавно.
Поняття "інформації" безпосередньо пов'язано з сутністю процесів всередині інформаційної системи, тоді так поняття "знання" швидше орієнтоване на якість процесів. Поняття "знання" тісно пов'язане з процесом прийняття рішень.
Незважаючи на відмінності, розглянуті поняття, як уже зазначалося раніше, не є розрізненими і непов'язаними. Вони є частина одного потоку: біля витоку його знаходяться дані, в процесі передачі яких виникає інформація. і в результаті використання інформації. за певних умов, виникають знання.
У лекції ми вже відзначали, що в процесі руху вгору по інформаційної піраміді обсяги даних переходять в цінність знань. Однак великі обсяги даних зовсім не означають і, тим більше, не гарантують отримання знань. Існує певна залежність цінності отриманих знань від якості і потужності процедур обробки даних. Типовим прикладом інформації. яку не можна перетворити в знання. є текст іноземною мовою. При відсутності словника і перекладача ця інформація взагалі не має цінності, вона не може перейти в знання. При наявності словника процес переходу від інформації до знань можливий, але тривалий і трудомісткий. При наявності перекладача інформація дійсно переходить в знання.
Таким чином, для отримання цінних знань необхідні якісні процедури обробки. Процес переходу від даних до знань займає багато часу і коштує дорого. Тому очевидно, що технологія Data Mining з її потужними і різноманітними алгоритмами є інструментом, за допомогою якого, просуваючись вгору по інформаційної піраміді. ми можемо отримувати дійсно якісні та цінні знання.