по зображенню особи
Нікітенко О.В., канд. фіз.-мат. наук,
Сіліченко А.І., магістрант
Чернігівський державний технологічний університет, м.Чернігів, Україна
Спроектована структура системи ідентифікації людини по зображенню особи, яка здійснює розпізнавання осіб, виділення антропометричних точок і безпосередньо ідентифікацію на основі відгуку від різних алгоритмів, поєднання яких дозволяє підвищити достовірність результату ідентифікації.
Завдання ідентифікації людини по зображенню особи є однією з найскладніших видів біометричної ідентифікації, так як найчастіше її доводиться виконувати при обмеженою інформативності зображень і вельми поширеною недостатньою порівнянності через розрив у часі, різниці умов зйомок і т.д. Ця обставина не дає можливості використовувати весь арсенал прийомів і методів даного виду біометричної ідентифікації.
Рішення завдання ідентифікації вважається найбільш складним з наступних причин:
а) система, як правило, ніколи раніше не стикалася з зображенням даної людини;
б) система порівнює завжди відрізняються зображення. Навіть при створенні оптимальних умов для порівняння (освітленість, ракурс, міміка) зображення завжди відрізняються один від одного, облік всіх можливих відмінностей в процесі попереднього налаштування системи вкрай скрутний;
в) порівнювані зображення, як правило, значно розрізняються за часом їх отримання (вікові, косметичні та інші подібні зміни можуть мати значний негативний вплив на якість ідентифікації).
Сучасні системи розпізнавання осіб забезпечують високий відсоток розпізнавання і можуть використовуватися спільно з системами контролю і управління доступом для збільшення рівня контролю доступу на об'єктах з підвищеними вимогами до забезпечення безпеки, наприклад, в банках або на режимних підприємствах.
Використання системи розпізнавання осіб актуально для торгових підприємств і розважальних закладів. Магазини, супермаркети, автозаправки, клуби, ресторани, кафе - всіх їх об'єднує одне: бажання отримати максимальний прибуток, для чого необхідно підвищувати якість обслуговування клієнтів і убезпечити відвідувачів. Для них важливо обмежити доступ людям, які з тих чи інших причин небажані в цьому закладі і, навпаки, заздалегідь дізнавшись про прибуття постійного клієнта або VIP-персони, на більш високому рівні обслужити його.
Аналіз останніх досліджень і публікацій
Класичні системи розпізнавання осіб засновані на методах, орієнтованих на зовнішність в цілому: PCA (Principal Component Analysis) [1], ICA (Independent Component Analysis) [2], а також LDA (Linear Discriminant Analysis) [3]. В роботі [4] описується застосування SIFT-дескрипторів для розпізнавання осіб, але не пропонується вирішення проблеми ідентифікації людини. В роботі [5] пропонується комбінація дескрипторів PCA і SIFT: PCA використовується для розпізнавання очей, носа і рота, а за допомогою SIFT описуються області навколо знайдених елементів зовнішності. Нарешті, в роботі [6] пропонується розраховувати відстані між усіма парами дескрипторів обох зображень і використовувати в якості міри близькості найменше з них. У деяких випадках використовуються тільки ті дескриптори, які описують стан очей і рота, оскільки ці елементи зовнішності є найбільш інформативними.
Альтернативою методам, орієнтованим на зовнішність в цілому, є методи локального опису зовнішності. Подібні методи в даний час підлягають активному дослідженню в області розпізнавання осіб. В роботі [7] описується алгоритм ASM (Active Shape Models - Активні Моделі Форми). Мета алгоритму - підлаштувати модель форми під форму об'єкта на зображенні. ASM успішно використовується для вирішення широкого спектра завдань, в тому числі визначення форми органів на медичних знімках, розпізнавання осіб і рукописних символів.
На сьогоднішній день найбільш ефективним алгоритмом пошуку осіб на зображенні є алгоритм, запропонований П. Віолою і М. Джонсом [8]. Ними був запропонований метод класифікації об'єктів (не тільки осіб) на підставі методу посилення слабких класифікаторів. Посилення слабких класифікаторів - це підхід до вирішення задачі класифікації шляхом комбінування примітивних класифікаторів в один сильніший. П. Віола і М. Джонс побудували каскад слабких класифікаторів, що працює за принципом послідовних наближень. Каскад складається з декількох ступенів, кожна щабель - безліч простих класифікаторів. Якщо ступінь приймає рішення про те, що вектор ознак відноситься до класу шуканого об'єкта, то приймається позитивне рішення, тільки якщо всі щаблі каскаду це підтвердили, інакше вектор ознак класифікується як неіскомий об'єкт. За показниками роботи в реальних системах даний підхід забезпечує високу точність, високий рівень вірних виявлень і низький рівень помилок другого роду [9].
Метою даної статті є створення структури системи ідентифікації людини, яка виконувала б поставлене завдання ідентифікації на основі відгуку від різних алгоритмів. Встановлення відповідності невідомої людини жодного з зареєстрованих в системі повинно виконуватися на підставі взаємного розташування антропометричних точок обличчя.
Узагальнена схема біометричної ідентифікації
Одна з узагальнених реалізацій схеми біометричної ідентифікації приведена на малюнку 1. Як видно з малюнка 1, існує дві фази функціонування біометричної системи: реєстрація і ідентифікація. У подібних системах найбільш часто виконується процес ідентифікації. Слід зазначити, що в процесі функціонування система може бути переключена в фазу реєстрації для додавання нових користувачів.
Процедура порівняння ознак здійснює порівняння отриманих ознак і ознак, наявних у базі даних. Як правило, в подібних системах вирішується завдання пошуку зображення найбільш схожого на дане у великій базі зображень. Такий напрям характеризується високими вимогами до помилок першого роду - система повинна знайти всі зображення, що відповідають даному, не пропустивши, по можливості, жодного з досить схожих. При цьому вважається допустимим, якщо у вибірці присутні більше одного зображення, визначеного як схоже з даними.
Мал. 1. Узагальнена схема функціонування біометричних методів
Принцип мінімізації часового проміжку обробки зображення реалізується шляхом зберігання в базі даних невеликих наборів заздалегідь витягнутих ключових ознак, максимально характеризують кожне зображення.
Біометричні системи, як правило, функціонують в режимі вільного пошуку в багатолюдних громадських місцях (вулиці, транспортні пасажирські вузли, громадські будівлі). Головними цілями подібних систем є оперативне розпізнавання осіб, які перебувають у розшуку, і фіксація в режимі реального часу переміщень осіб, що представляють потенційну небезпеку для суспільства або відібраних по яким-небудь іншим критеріям.
У подібних системах зазвичай є можливість зберігання в базі даних більше одного зображення кожного конкретного фізичної особи, одержаного при умовах, що змінюються (освітленість, ракурс, міміка, зачіска, наявність окулярів і головного убору і т.д.).
Розробка сістемиідентіфікаціі по зображенню особи
Структура системи, що розробляється повинна складатися з модулів (малюнок 2). Модульність системи дозволить без особливих труднощів замінювати реалізацію того чи іншого алгоритму або зовсім замінити реалізацію одного алгоритму зовсім іншим без внесення істотних змін в структуру системи в цілому. Така особливість системи ідентифікації людини по зображенню особи просто необхідна, оскільки всі системи, які виконують розпізнавання осіб, часто застосовуються в різних умовах і для отримання найкращого результату, в поставлених умовах, може знадобитися замінити будь-якої компонент системи більш підходящим.
Мал. 2. Діаграма компонентів системи
Підсистема ідентифікації (Portrait identification) грає роль сполучної ланки між всіма компонентами і містить в собі ядро всієї системи. Для взаємодії з підсистемою розпізнавання в підсистемі ідентифікації повинен бути присутнім модуль взаємодії з підсистемою розпізнавання (Image receiver), який відповідає за отримання зображень і передачу їх на подальшу обробку. Після встановлення зв'язку image receiver обробляє інформацію, що надходить від підсистеми розпізнавання інформацію: ціле зображення або знайдене особа. Залежно від типу, зображення або відразу передається в підсистему обробки результатів ідентифікації, якщо це цілий кадр, або в модуль нормалізації, якщо це зображення обличчя.
Наступним етапом розробки системи є модуль нормалізації зображення особи (Normalizer). У більшості випадків зображення для спрощення обробки, якщо воно кольорове, конвертується в відтінки сірого. Також даний модуль повинен виконувати нормалізацію яскравості і контрастності зображення, підбір найбільш відповідного динамічного діапазону для більш точного виділення ключових точок. Нормалізоване зображення обличчя передається підсистемі виділення антропометричних точок.
У підсистемі виділення антропометричних точок (Points finder adapter) пропонується використовувати алгоритм ASM. реалізований у зовнішній бібліотеці (Points finder). В алгоритмі ASM використовуються активні форми моделі - це статистичні моделі, які итеративно деформуються, щоб відповідати об'єкту на зображенні, і складаються з моделі форми, керованої набором ключових точок, і моделей областей розподілу навколо кожної точки. Модель форми і моделі розподілу навчаються на тестових зображеннях із зазначеними позиціями ключових точок. В алгоритмі застосовується "грубо-точний" пошук, для цього необхідно навчити безліч моделей розподілу кожної ключової точки, по одній моделі на кожному рівні дозволу зображення. Пошук починається з зображення в найбільш грубому (низькому) дозвіл, далі, в процесі пошуку, дозвіл зображення підвищується до тих пір, поки можуть бути поліпшені позиції ключових точок. В результаті роботи алгоритму ASM буде сформовано безліч точок, відповідних точкам форми особи і його основних елементів, що відобразилися на знімку.
Масив виділених антропометричних точок передається модулю формування ознак (Feature extractor). Як ідентифікаційних ознак повинні виділятися щодо незмінні за ідентифікаційний період характеристики елементів зовнішності. Введення ознак у вигляді відносин певних властивостей людини робить їх інваріантними до масштабу зображення і відстані, з якого робиться фотографія людини. Використання абсолютних значень розмірів особи і його ділянок неприпустимо, оскільки розміри всіх об'єктів на зображенні залежать від відстані до об'єктива камери, значення якого, в загальному випадку, визначити неможливо.
При обчисленні кількісних ознак зовнішності слід дотримуватися ряду вимог. Пропорції розмірів повинні складатися з вимірів ліній, однаково і приблизно в одній площині розташованих по відношенню до знімальної камери. Внаслідок неможливості точного визначення спотворень, що виникли в результаті довільного ракурсу особи на зображенні, відстань між антропометричними точками, для кожного окремого ознаки, вимірюється тільки по горизонталі або по вертикалі.
На етапі встановлення особи за ознаками зовнішності модуль ідентифікації (Identifier) виконує серію запитів до БД для отримання безлічі біометричних портретів зареєстрованих користувачів (малюнок 3). Оскільки умови отримання зображення кожного разу дещо відрізняються, а зовнішність людини також не цілком постійна, то слід враховувати той факт, що завжди буде присутній деяка похибка в позиціях виділених антропометричних точок і відповідно в значеннях ознак. Для того, щоб врахувати зазначену похибка, слід в пошуковий запит включити значення відхилень від значень ідентифікаційних ознак, і при кожному запиті збільшувати відхилення, якщо кількість знайдених користувачів менш заданого.
Мал. 3. Діаграма послідовності функціонування системи
Практично всі алгоритми ідентифікації ґрунтуються на порівнянні тієї чи іншої міри близькості або подібності між невідомим і відомим особами. В якості зворотнього міри близькості може бути використано евклідова відстань в просторі ознак. Якщо міра подібності між вектором ознак ідентифікованого людини і еталонного опису зареєстрованого користувача перевищує деякий заздалегідь заданий число P. то приймається рішення про відповідність ідентифікованого людини зареєстрованому користувачу. Якщо міра близькості не перевищує число P. то приймається рішення про те, що в базі даних системи не міститься біометричного портрета ідентифікованого людини. Очевидно, варіюючи число P. з'являється можливість регулювати "строгість" системи ідентифікації. У теорії систем розпізнавання це число іноді називають порогом прийняття рішення.
Підсистема обробки результатів ідентифікації (Display) призначена для виконання визначених розробниками дій, які залежать від предметної області застосування системи: дозвіл доступу до обчислювальних ресурсів або даними, відкриття дверей в приміщення, що охороняється, запуск двигуна в автомобілі, оповіщення служби охорони про появу злочинця або менеджера про VIP-клієнтів.
На базі узагальненої структури системи ідентифікації запропонована структура системи, в яку закладені модулі, що реалізують алгоритми Віоли-Джонса і ASM. Для вирішення завдання пошуку біометричних портретів був запропонований метод з використанням відновлювальних відхилень значень ознак, що дозволяє регулювати кількість результатів пошуку.
Список літературних джерел