Навчання з учителем (англ. Supervised learning) - один із способів машинного навчання. в ході якого випробувана система примусово навчається за допомогою прикладів «стимул-реакція». З точки зору кібернетики. є одним з видів кібернетичного експерименту. Між входами і еталонними виходами (стимул-реакція) може існувати деяка залежність, але вона невідома. Відома тільки кінцева сукупність прецедентів - пар «стимул-реакція», звана навчальної вибіркою. На основі цих даних потрібно відновити залежність (побудувати модель відносин стимул-реакція, придатних для прогнозування), тобто побудувати алгоритм, здатний для будь-якого об'єкта видати досить точну відповідь. Для вимірювання точності відповідей, так само як і в навчанні на прикладах. може вводитися функціонал якості.
Принцип постановки даного експерименту
Даний експеримент являє собою окремий випадок кібернетичного експерименту зі зворотним зв'язком. Постановка даного експерименту передбачає наявність експериментальної системи, методу навчання і методу випробування системи або вимірювання характеристик.
Експериментальна система в свою чергу складається з випробовуваної (використовуваної) системи, простору стимулів, одержуваних із зовнішнього середовища, і системи управління підкріпленням (регулятора внутрішніх параметрів). В якості системи управління підкріпленням може бути використано автоматичне регулюють пристрій (наприклад, термостат) або людина-оператор (учитель), здатний реагувати на реакції випробовуваної системи і стимули зовнішнього середовища шляхом застосування особливих правил підкріплення, що змінюють стан пам'яті системи.
Розрізняють два варіанти: (1) коли реакція випробовуваної системи не змінює стан зовнішнього середовища, і (2) коли реакція системи змінює стимули зовнішнього середовища. Ці схеми вказують принципову схожість такої системи загального вигляду з біологічної нервовою системою.
Типологія завдань навчання з учителем
Типи вхідних даних
типи відгуків
- Коли безліч можливих відповідей нескінченно (відповіді є дійсними числами або векторами), говорять про завдання регресії і апроксимації;
- Коли безліч можливих відповідей звичайно, говорять про завдання класифікації і розпізнавання образів;
- Коли відповіді характеризують майбутні поведінку процесу або явища, кажуть про завдання прогнозування.
Вироджені види систем управління підкріпленням ( «вчителів»)
- Система підкріплення з керуванням по реакції (R - керована система) - характеризується тим, що інформаційний канал від зовнішнього середовища до системи підкріплення не функціонує. Дана система, незважаючи на наявність системи управління, відноситься до спонтанного навчання. так як випробувана система навчається автономно, під дією лише своїх вихідних сигналів незалежно від їх «правильності». При такому методі навчання для управління зміною стану пам'яті не потрібно ніякої зовнішньої інформації;
- Система підкріплення з керуванням по стимулам (S - керована система) - характеризується тим, що інформаційний канал від випробовуваної системи до системи підкріплення не функціонує. Незважаючи на нефункціонірующіх канал від виходів випробовуваної системи, відноситься до навчання з учителем, так як в цьому випадку система підкріплення (учитель) змушує випробовувану систему виробляти реакції згідно з визначеним правилом, хоча і не береться до уваги наявність істинних реакцій випробовуваної системи.
Дана відмінність дозволяє більш глибоко поглянути на відмінності між різними способами навчання, так як грань між навчанням з учителем і навчанням без учителя більш тонка. Крім цього, така різниця дозволило показати для штучних нейронних мереж певні обмеження для S і R - керованих систем (див. Теорема збіжності перцептрона).