Ви не гаджет

Одним з таких шляхів є побудова комп'ютерної моделі для перевірки роботи гіпотези. Якщо гіпотеза про те, як функціонує частина мозку, інспірує створення працюючої технології, ця гіпотеза безумовно має право на існування. Однак неясно, наскільки вона вірна. Обчислювальна неврологія знаходиться на нечіткої межі наукового методу. Здавалося б, програма розпізнавання міміки скорочує ступінь невизначеності, присутню в людській натурі, але фактично вона може не скоротити, а посилити цю невизначеність. Справа в тому, що програма наближає вчених і інженерів до того стану, коли наука поступово починає використовувати методи, близькі до поезії і прозі. Правила, що використовуються програмою, кілька невизначені і залишаться такими до тих пір, поки ми не отримаємо більш точні дані про функції нейронів в живому мозку.

Вперше ми можемо розповісти хоча б в загальних рисах, як мозок розпізнає образи, що зустрічаються в світі, наприклад посмішку, хоча ми і не знаємо, як довести, що наше розуміння вірно. Ось ця розповідь.

Яким здається світ статистичному алгоритму

Почну зі свого дитячого спогади. Коли я ріс в пустелі південного Нью-Мехіко, я звернув увагу на смуги, що залишаються на грунтовій дорозі проїжджають автомобілями. На дорозі з'являлися хвилясті опуклі поперечні смуги, як вельветові рубчики, які представляли собою природним чином утворюється нескінченну послідовність «лежачих поліцейських». Відстань між смугами визначалося середньою швидкістю руху автомобілів по цій дорозі.

Коли ви їхали з цієї середньою швидкістю, менше трясло. Смуги були видні лише на заході, коли горизонтальні червоні сонячні промені висвітлюють всі нерівності на землі. Днем потрібно було їхати обережно, щоб не пропустити цю інформацію, заховану на дорозі.

Цифрові алгоритми повинні підходити до проблеми розпізнавання образів подібним непрямим шляхом, і їм часто доводиться застосовувати загальну процедуру, трохи схожу на проїзд віртуальних коліс по віртуальним нерівностей. Вона носить назву «перетворення Фур'є». Перетворення Фур'є визначає обсяг діяльності, що проходить на конкретній «швидкості» (частоті) в блоці цифрової інформації.

Уявіть собі графічний дисплей еквалайзера, наявний на музичних програвачів та показує інтенсивність відтворення музики на різних частотних смугах. Саме перетворення Фур'є виробляє поділ частотних смуг.

На жаль, перетворення Фур'є не в змозі розпізнати міміку, проте існує пов'язаний з ним, але більш складний алгоритм - фільтр Габора для невеликих хвиль, який нам і допоможе. Цей математичний процес ідентифікує окремі маркери діяльності на конкретних частотах в конкретних місцях, в той час як перетворення Фур'є лише повідомляє, які взагалі частоти присутні.

Існують вражаючі паралелі між тими процесами, що відбуваються в інжинірингу, і тими, що спостерігаються в людському мозку, включаючи подвійність Платона / Дарвіна: новонароджене немовля здатний відстежити просте схематичне особа, але дитині постарше потрібно спостерігати людей, щоб навчитися відрізняти їх один від одного.

Я радий повідомити, що група вчених з Хартмут заробила найвищі бали в змаганні з розпізнавання осіб, спонсорував урядом. Національний Інститут стандартів і технології проводить тестування систем розпізнавання осіб з тією ж метою, що ліків і машин: люди повинні знати, кому і чому можна довіряти.

Від образів до запахів

І тепер у нас з'являються теорії - або принаймні ми можемо дещо детально розповісти про те, як мозок розпізнає об'єкти цього світу, такі як посмішка, наприклад. Але рот виробляє набагато більше рухів, ніж просто посміхається. Чи є можливість розширити нашу розповідь, щоб пояснити, що таке слово і як мозок дізнається його?

Виявляється, найкраще підійти до цього питання через розгляд зовсім іншого почуття. Замість зору і слуху, можливо, нам корисніше почати з вивчення запахів, відчутних людським носом.

Зо два десятки років я виступав з лекціями про основи віртуальної реальності. Я розповідав про головні характеристики зору і слуху, а також дотику і нюху. В кінці лекції починалися питання, і одним з перших зазвичай було питання про нюх: чи скоро у машин віртуальної реальності з'явиться здатність відчувати запахи?

Можливо, але, швидше за все, лише кілька. Запахи фундаментально відрізняються від образів або звуків. Останні можуть бути розділені на вихідні складові, які відносно легко обробити комп'ютера - і мозку. Видимі кольору - всього лише слова, що складаються з різної довжини світлових хвиль. Будь-яка звукова хвиля складається з безлічі синусоид, кожна з яких легко може бути описана математично. Кожна схожа на «лежачого поліцейського» певної висоти з грунтових доріг мого дитинства.

Інакше кажучи, кольору і звуки можуть бути описані за допомогою декількох чисел, широкий спектр кольорів і тонів описується за допомогою інтерполяції цих чисел. Людської сітківці необхідно сприймати лише невелика кількість довжин хвиль або кольорів, щоб наш мозок зумів сприйняти все проміжні. Комп'ютерна графіка працює подібним чином: екран пікселів, кожен з яких здатний передати червоний, зелений або синій, може відтворити приблизно всі кольори, які визначає мозок. Музичний синтезатор можна уявити собі як пристрій, що генерує безліч синусових хвиль, потім накладає їх один на одного, щоб зробити набір звуків.

Все вищесказане вказує на глибоку різницю в базовій структурі почуттів - відмінність, що породжує важливі питання про те, як же ми мислимо, і, ймовірно, навіть про походження мови. Неможливо інтерполювати дві молекули запаху. Запахи можуть змішувати і створювати мільйони різних поєднань, це вірно. Однак існуючі запахи неможливо розбити на кілька базових одиниць, «пікселів запаху» не існує. Можна висловити це так: кольори і звуки можна виміряти за допомогою лінійки, але запахи потрібно шукати в словнику.

Запахи були першими словами?

Схожі статті