У розділі $ 2 $ ми вже писали про те, що кольорові цифрові зображення являють собою сукупність трьох колірних площин, кожна з яких характеризує одну незалежну складову кольору, представлену в тому ж форматі, що і звичайне $ 8 $ -бітний півтонування. Отже, всі описані процедури обробки напівтонових зображень
Колірна модель RGB
в яркостной області можуть бути узагальнені і на випадок обробки кольорових зображень. Специфіка ж тут пов'язана перш за все з різними колірними моделями, що дозволяють по-різному працювати з різними колірними і іншими складовими зображення.
Призначення колірної моделі - дати кошти опису кольору в межах деякого колірного охоплення. Найбільш часто в комп'ютерному зорі використовуються моделі RGB, CMY, YUV, YCbCr, HSV.
Колірна модель RGB.
RGB (Red, Green, Blue - червоний, зелений, синій) - апаратно-орієнтована модель, використовувана в дисплеях для адитивного формування відтінків самосвітних об'єктів (пікселів екрану). Система координат RGB - куб з початком відліку $ \ langle 0,0,0 \ rangle $, відповідним чорному кольору (рис. 4). Максимальне значення RGB - $ \ langle 255,255,255 \ rangle $ відповідає білому кольору. У моделі RGB не розділені яркостная і оттеночная компоненти кольору, тут легко вказати яскравості для одного з основних кольорів, але важко вказати відтінок з необхідним колірним тоном (наприклад, тілесним) і насиченістю.
Колірна модель HSV
Колірна модель HSV.
Колірна модель HSV (Hue, Saturation, Value - колірний тон, насиченість, міра яскравості) - модель, орієнтована на людину і забезпечує можливість явного завдання необхідного відтінку кольору. Серед інших використовуваних в даний час моделей, ця модель відображає фізичні властивості кольору і найбільш точно відповідає способу сприйняття кольору людським оком. Відтінок кольору (H) асоціюється в людській свідомості з обумовленістю забарвлення предмета певним типом пігменту, фарби, барвника. Складова Н - це довжина світлової хвилі, відбитої або пройшла через об'єкт. Дана складова є об'єктивною і відображає фізичну сутність кольору. Насиченість (S) характеризує ступінь, силу, рівень вираження відтінку кольору. Цей атрибут в людській свідомості пов'язаний з кількістю (концентрацією) пігменту, фарби, барвника. Насиченість дозволяє оцінити, наскільки "глибоким" і "чистим" є даний колір, тобто як він відрізняється від ахроматичного. Вона визначає співвідношення сірого кольору і обраного відтінку і виражається в частках від $ 0 $ (сірий) до $ 1 $ (повністю насичений). Міра яскравості (V) характеризує відносну освітленість або затьмарення кольору (інтенсивність кольору), тому вона вимірюється в діапазоні від 0 (чорний) до 1 (білий). При збільшенні яскравості колір стає більш світлим (білим). Складова V є нелінійної, що близько відповідає сприйняттю людиною світлих і темних кольорів. Дві останні складові є суб'єктивно визначеними, так як відображають психологічні особливості сприйняття кольору.
Підпростір, яке визначається даною моделлю, відповідає проекції колірного простору на головну діагональ RGB-куба в напрямку від білого до чорного і являє собою перевернутий шестигранний конус (рис. 5). За вертикальної осі конуса задається V - міра яскравості. Значенням $ \ rm = 0 $ відповідає вершина конуса, значенням $ \ rm = 1 $ - підстава конуса; кольори при цьому найбільш інтенсивні. Тон H задається кутом, відлічуваним навколо вертикальної осі. Зокрема, $ 0 $ ° - чистий червоний колір (Red), $ 60 $ ° - жовтий (Yellow), $ 120 $ ° - зелений (Green), $ 180 $ ° - блакитний (Cyan), $ 240 $ ° - синій (Blue), $ 300 $ ° - пурпурний (Magenta), тобто додаткові кольори розташовані один проти одного (відрізняються на $ 180 $ °). Насиченість S визначає, наскільки близький колір до "чистому" пігменту і змінюється від $ 0 $ на вертикальній осі V до 1 на бічних гранях шестигранного конуса. Точка $ \ rm = 0 $, в якій знаходиться вершина конуса, відповідає чорному кольору. Значення S при цьому може бути будь-яким в діапазоні $ 0 $ - $ 1 $. Точка з координатами $ \ rm = 1 $, $ \ rm = 0 $ - центр основи конуса, відповідає білому кольору. Проміжні значення координати V при $ \ rm = 0 $, тобто на осі конуса, відповідають сірим кольорами. Якщо $ \ rm = 0 $, то значення відтінку H вважається невизначеним.
Колірна модель HSV може бути отримана з моделі RGB в такий спосіб: $$ _1 = \ arccos \ left (\ left [-> \ right) + \ left (-> \ right)> \ right]> -> \ right) ^ 2 + \ left (-> \ right) \ left (-> \ right) >>> \ right), \ quad = \ begin_1, \ Le \ cr 360 ° - _1, >, \ Cr \ end $$ $$ = \ frac,,> \ right) - \ min \ left (,,> \ right)>,,> \ right)>, \ quad = \ frac,,> \ right )>. $$ Дане перетворення є нелінійним, що ускладнює його практичне використання. Апроксимація перетворення лінійними залежностями істотно спрощує алгоритм перекладу з RGB в HSV і забезпечує високу обчислювальну ефективність. Колірна модель HSV є найбільш зручним поданням кольорових зображень для їх колірної сегментації.
Колірна модель YUV.
Зупинимося також на колірному просторі YUV, яке широко застосовується в телемовленні і відповідно прийшло на комп'ютер разом з MPEG-форматом. Справа в тому, що око людини найбільш чутливий до яскравості зображення і дещо менш - до кольоровості.
Якщо адитивні складові RGB-сигналу представити у вигляді яскравості (Y) і двох різних складових сигналу кольоровості (U і V) за формулами $$ \ mbox = 0,299 \ mbox + 0,587 \ mbox + 0,114 \ mbox, $$ $$ \ mbox = 0,493 (\ mbox - \ mbox), $$ $$ \ mbox = 0,877 (\ mbox - \ mbox), $$ то U в такому співвідношенні висловлює відмінності між синьою і жовтою складовими кольорового зображення, а V - між червоною і зеленою компонентами кольорового зображення. Відомо, що око людини легше розрізняє градації яскравості і відтінки зеленого, тому U і V можна відображати з меншою точністю, що здатне істотно зменшити кількість інформації, що зберігається при стисненні. Таким чином, використовуючи особливості людського зору, ще до того, як буде застосовуватися компресія даних, ми можемо отримати виграш тільки за рахунок переходу до іншого колірного простору. Тому, коли говорять, наприклад, що стиснення в MPEG здійснюється з коефіцієнтом $ 100: 1 $ і більше, часто забувають, що частина інформації була "втрачена" вже при переході до іншого колірного простору.
Формат кодування YUV $ 4: 1: 1 $ відрізняється від $ 4: 2: 2 $ способом дискретизації сигналу, яка обчислюється для конкретного каналу як добуток базової частоти цифрового кодування на відповідний коефіцієнт: наприклад, на $ 4 $ відліку для каналу Y береться по одному відліку для кожного з цветоразностних каналів.
Колірна сегментація зображення.
Колірна сегментація зазвичай проводиться по попередньо побудованої моделі розподілу кольору шуканого об'єкта в