Ноу Інти, лекція, завдання data mining

Знання - сукупність фактів, закономірностей і евристичних правил, за допомогою яких вирішується поставлене завдання.

Отже, формування інформації відбувається в процесі збору та передачі, тобто обробки даних. Яким же чином з інформації отримують знання?

Все частіше справжні знання утворюються на основі розподілених взаємозв'язків різнорідної інформації [19]. Коли інформація зібрана і передана для отримання явно не визначеного заздалегідь результату, то ви отримуєте знання. Сама по собі інформація в чистому вигляді не має сенсу. Звідси випливає висновок. що інформація - це чиєсь тактичне знання. передане у вигляді символів і за допомогою будь-яких прикладних засобів.

За визначенням Денхема Грея, "знання - це абсолютне використання інформації і даних, спільно з потенціалом практичного досвіду людей, здібностями, ідеями, інтуїцією, переконаністю і мотиваціями".

Знання мають певні властивості, які відрізняють їх від інформації [20].

  1. Структурованість. Знання повинні бути "розкладені по поличках".
  2. Зручність доступу і засвоєння. Для людини - це здатність швидко зрозуміти і запам'ятати або, навпаки, згадати; для комп'ютерних знань - засоби доступу до знань.
  3. Лаконічність. Лаконічність дозволяє швидко освоювати і переробляти знання і підвищує "коефіцієнт корисної змісту". До цього списку лаконічність була додана через всім відомої проблеми шуму і сміттєвих документів, характерною саме для комп'ютерної інформації - Internet і електронного документообігу.
  4. Несуперечливість. Знання не повинні суперечити один одному.
  5. Процедури обробки. Знання потрібні для того, щоб їх використовувати. Одне з головних властивостей знань - можливість їх передачі іншим і здатність робити висновки на їх основі. Для цього повинні існувати процедури обробки знань. Здатність робити висновки означає для машини наявність процедур обробки і виведення і підготовленість структур даних для такої обробки, тобто наявність спеціальних форматів знань.

Зіставлення і порівняння понять "інформація", "дані", "знання"

Для того щоб впевнено оперувати поняттями "інформація", "дані", "знання", необхідно не тільки розуміти суть цих понять, але і відчути відмінності між ними. Однак, однією інтуїтивної інтерпретації цих понять тут недостатньо. Складність розуміння відмінностей вищезазначених понять - в їх уявній синонімічно. Згадаймо, що поняття Data Mining переводиться на російську мову за допомогою цих же трьох понять: як видобуток даних, вилучення інформації. розкопка знань.

Для початку зробимо спробу розібратися в цих термінах на простих прикладах.

  1. Студент, який здає іспит, потребує даних.
  2. Студент, який здає іспит, має потребу в інформації.
  3. Студент, який здає іспит, потребує знань.

При розгляді першого варіанту - студент потребує даних - виникає думка, що студенту потрібні дані, наприклад, для обчислень. Інформацією в другому варіанті може виступати конспект або підручник. В результаті їх використання студент отримує лише інформацію, яка в певних випадках може перейти в знання. Третій варіант звучить найбільш логічно.

Інформація. на відміну від даних, має сенс.

Поняття "інформація" і "знання", з філософської точки зору, є поняттями більш високого рівня, ніж "дані", яке виникло відносно недавно.

Поняття "інформації" безпосередньо пов'язано з сутністю процесів всередині інформаційної системи, тоді так поняття "знання" швидше орієнтоване на якість процесів. Поняття "знання" тісно пов'язане з процесом прийняття рішень.

Незважаючи на відмінності, розглянуті поняття, як уже зазначалося раніше, не є розрізненими і непов'язаними. Вони є частина одного потоку: біля витоку його знаходяться дані, в процесі передачі яких виникає інформація. і в результаті використання інформації. за певних умов, виникають знання.

У лекції ми вже відзначали, що в процесі руху вгору по інформаційної піраміді обсяги даних переходять в цінність знань. Однак великі обсяги даних зовсім не означають і, тим більше, не гарантують отримання знань. Існує певна залежність цінності отриманих знань від якості і потужності процедур обробки даних. Типовим прикладом інформації. яку не можна перетворити в знання. є текст іноземною мовою. При відсутності словника і перекладача ця інформація взагалі не має цінності, вона не може перейти в знання. При наявності словника процес переходу від інформації до знань можливий, але тривалий і трудомісткий. При наявності перекладача інформація дійсно переходить в знання.

Таким чином, для отримання цінних знань необхідні якісні процедури обробки. Процес переходу від даних до знань займає багато часу і коштує дорого. Тому очевидно, що технологія Data Mining з її потужними і різноманітними алгоритмами є інструментом, за допомогою якого, просуваючись вгору по інформаційної піраміді. ми можемо отримувати дійсно якісні та цінні знання.

Схожі статті