РОЗДІЛ 6. КОЛІР У КОМП’ЮТЕРНІЙ ГРАФІЦІ

6.1. Основні відомості про колір і колірні моделі

Колір, особливо відмінності в кольорі – це є здатність організму реагувати на різні довжини електромагнітних хвиль.

Колірне охоплення екрану монітора, офсетного друку чи фотознімка набагато менше, ніж людського ока. Їх колірне охоплення – це діапазон кольорів, що можуть бути відтворені, зафіксовані чи описані будь-яким чином.

У зв’язку з різницею в колірних охопленнях різних пристроїв із різними принципами утворення кольору, для передачі й одержання зображень були створені різні моделі кольорів. Оскільки жодна з моделей не є ідеальною і повною за колірним охопленням.

Призначенням колірної моделі надання засобам опису кольору в межах деякого колірного охоплення і забезпечення інтерполяції кольорів для взаємозв’язку між пристроями з різними колірними охопленнями і способами отримання кольору [2].

Колірні моделі описують колірні відтінки за допомогою змішування декількох основних кольорів. Основні кольори розбиваються на відтінки за яскравістю (від темного до світлого), і кожній градації яскравості привласнюється цифрове значення (наприклад, найтемнішій – 0, найсвітлішій – 255). Таким чином, будь-який колір можна розкласти на відтінки основних кольорів і позначити його набором цифр – колірних координат.

Під час вибору колірної моделі можна визначати тривимірний колірний координатний простір, усередині якого кожен колір представляється точкою. Такий простір називається простором колірної моделі.

Професійні графічні програми зазвичай дозволяють оперувати з декількома колірними моделями, більшість з яких створена для спеціальних цілей чи особливих типів фарб: RGB, CMY, CMYК, Lab, HSV/HSB і HLS.

6.2. Колірна модель RGB

Геніальний «локус», був затверджений Міжнародною Освітлювальною Комісією, – МОКНУВ багато десятків років тому назад. Принципом роботи локуса було складання будь-якого кольору не з семи барв веселки, а всього з трьох R – red (червоний), G – green (зелений), B – blue (блакитний), тобто RGB.

Стисло історія системи RGB така. Томас Юнг (1773-1829) узяв три ліхтарі і пристосував до них червоний, зелений і синій світлофільтри. Так були отримані джерела світла відповідних кольорів. Жовтий колір давало змішування червоного й зеленого, блакитний – зеленого й синього, пурпуровий – синього і червоного, а білий колір – усіх трьох основних кольорів. Джеймсом Максвеллом (1831-1879) був виготовлений перший колориметр, за допомогою якого порівнювалися монохроматичний колір і змішування в заданій пропорції компонентів RGB. Регулюючи яскравість кожного з компонентів, можна домогтися вирівнювання кольорів суміші й монохроматичного випромінювання [1].

До теперішнього часу система RGB є офіційним стандартом. Рішенням Міжнародної Комісії з Освітлення – МКО у 1931 році були стандартизовані основні кольори, які було рекомендовано використовувати в якості R, G і B, рис. 6.1.

Рис. 6.1. Комбінація базових кольорів колірної моделі RGB

RGB знайшла широке застосування в пристроях, що світяться (телевізійні кінескопи, комп'ютерні монітори), а також зображень, що отримуються під час сканування. По замовчуванню екран монітора працює саме в цьому діапазоні. Серйозною проблемою є великий колірний обхват і апаратна залежність (не зовсім аналогічний показ кольорів на різних у основному ЕЛТ-моніторах).

Оскільки монітори різних моделей і виробників відрізняються, було запропоновано декілька альтернативних колірних просторів, відповідних «усередненому» монітору. До таких відносяться, наприклад sRGB, Adobe RGB, Wide-Gamut RGB.

sRGB має найменший кольоровий обхват і тому підходить для тих, хто працює з веб-графікою, друкує на струменевих принтерах. Однак для професійної якості друку вона не придатна. Adobe RGB 1998 – отриманий з телестандартів, вважається найбільш оптимальним видом під час роботи з графічними пакетами. Останній Wide-Gamut RGB має найбільший обхват і може бути застосований до 48-розрядних робіт. Монітор комп’ютера має інший принцип показу кольорів, і тому модель RGB (з її трьома видами), для друку майже не придатна.

Кольори цієї моделі називають адитивними. Оскільки кольори в RGB генеруються підсумовуванням світлових потоків [2].

Колірний простір моделі RGB іноді представляють у вигляді колірного куба (рис. 6.2, 6.3). По осях відкладаються значення колірних каналів, кожен з яких може приймати значення від 0 до 255. Всередині куба знаходяться всі кольори цієї моделі. У точці початку відліку координатних осей усі значення каналів дорівнюють нулю (чорний колір), а в протилежній по діагоналі куба точці максимальні значення каналів під час змішування утворюють білий колір. Якщо ці дві точки з’єднати відрізком, то на ньому буде розташована шкала відтінків від чорного до білого – сіра шкала. Три вершини куба дають три чистих вихідних кольори. У той же час, кожна з трьох інших вершин між ними дає чистий, змішаний з двох основних, колір. Графічні програми дозволяють комбінувати необхідний RGB-колір з 256 відтінків червоного, зеленого і синього, що в сумі становить 16,7 мільйонів кольорів [2].


Рис. 6.2. Колірна модель RGB представлена у вигляді куба	Рис. 6.3. Колірна модель RGB у графічному вигляді

Модель RGB залежна від пристрою. Під час заміни пристрою змінюються і кольори. Вона не дуже підходить для відтворення кольору, коли в одному комплексі повинні працювати сканер, принтер і монітор. Оскільки модель використовує три первинні кольори, вона не підходить для розфарбовування чи для фарбників і пігментів, які використовуються під час друку, оскільки ті застосовують інший набір первинних кольорів (блакитний, пурпуровй, жовтий).

Фахівці ізраїльської компанії Genoa Color Technologies розробили алгоритм перетворення RGB-кольору в новий стандарт, названий MPC (multi-primary colour, тобто – множинні первинні кольори), і розробила чіпи, що проробляють таке перетворення на апаратному рівні.

Відтворення шести сигналів яскравості має здійснюватися на новій техніці, що має шість первинних кольорів для кожного пікселя.

Найлегше таке перетворення можна зробити з проекційними телевізорами, заснованими на мініатюрних рідкокристалічних панелях або так званих мікродзеркальних процесорах (або проекторах DLP). Все, що потрібно – це замінити кольорові фільтри на ЖК-панелі.

У принципі аналогічно можна модифікувати комп'ютерні дисплеї на рідких кристалах, що випускаються, і плазмові панелі. Але краще – створювати під новий стандарт нові моделі.

Мікросхема працює з роздільною здатністю до 1280 на 1024 точок при частоті оновлення екрану 60 герц (у співпраці з комп'ютерною технікою – дисплеями, проекторами), а також з телевізійною прогресивною (у сенсі – відрядковою) розгорткою стандарту 720 p (один із стандартів телебачення високої чіткості). Схема підтримує до 8 біт представлення яскравості для кожного з 6 базових кольорів. Genoa вже виготовила проекційний телевізор, що працює в новій системі і виміряла його параметри. Відмічалася надзвичайна точність передачі природних кольорів і правильний білий колір. І крім цього новий стандарт дав можливість підвищити яскравість зображення на 40% без втрати колірного обхвату. Технологія «звертається» до засобів відображення, не зачіпаючи джерела сигналу, і повністю сумісна з алгоритмами компресії MPEG-2 і стандартом DVD.

Ізраїльські науковці розробили алгоритм перетворення RGB-кольору в новий стандарт «множинні первинні кольори» і розробили чіпи, що здійснюють таке перетворення на апаратному рівні. При цьому для кожного пікселя повинно бути шість базових кольорів, а комп’ютерні дисплеї і плазмові панелі потрібно модифікувати, що в свою чергу призведе до створення нових колірних моделей.

6.3. Колірна модель CMY і CMYK

На відміну від колірної моделі RGB моделі CMY застосовуються в поліграфії для друкуючих пристроїв, фотонабірних автоматів.

Кольори цієї моделі засновані на відніманні частини спектра падаючого світла (білого) і називаються субтрактивними. Канали CMY являють собою залишок віднімання основних RGB компонентів з білого кольору (як відомо, білий колір складається з повного спектра кольорів). Під час змішування двох основних кольорів результат виявиться темнішим за кожен із вихідних, оскільки кожен колір поглинає свою частину спектра. При цьому утворюються такі кольори: Cyan – блакитний (білий колір мінус червоний), Magenta – пурпуровий (білий мінус зелений), Yellow – жовтий (білий мінус синій), рис. 6.4. Кольори, які виходять змішуванням базових фарб у субтрактивній системі, називаються складеними чи тріадними (process color). Складеними тому, що виходять змішуванням основних складових, а прикметник «тріадний» знаходить своє пояснення в технології друку. Такі кольори утворюються в результаті трьох прогонів друкарського верстата, і в кожному з них друкарська машина наносить необхідну кількість жовтої, пурпурової і блакитної фарби. Тільки її розуміють растрові процесори.

2_3

Рис. 6.4. Колірна модель CMY представлена у вигляді куба

Оскільки для відтворення чорного кольору потрібне нанесення трьох фарбників, а матеріали дорогі, використання СМY-моделі є неефективним. Крім того, під час застосування цієї моделі існують небажані візуальні ефекти, які виникають за рахунок того, що під час виведення точки три базові кольори можуть лягати з невеликими відхиленнями. Тому до базових кольорів CMY-моделі додали чорний (black). Завданням якого стало підсилити поглинання світла в темних частинах, зробити їх максимально чорними, тобто збільшити тоновий діапазон друку. Система CMY з додатковою чорною складовою називається CMYK. Чорний колір (Black) представлений в назві останньою буквою для того, щоб не плутати його в скороченнях і абревіатурах із синім (Blue), рис. 6.5. Ця система слугує теоретичною основою цифрового друку. Колірні координати розглядаються як фарбники, які наносяться на поверхню паперу, тому інтенсивність кожної координати вимірюється у відсотках від 0 (відсутність фарби) до 100 (максимальна щільність фарби).


Рис. 6.5. Комбінація базових кольорів колірної моделі CMYK	Рис. 6.6. Колірна модель CMYK у графіч графічному вигляді

Змішування всіх трьох компонентів за максимальних значень дає чорний колір. З іншого боку, при повній відсутності фарби і, відповідно, нульових значеннях основних компонентів, отримаємо білий колір. Для моделі CMYK білий колір варто сприймати як колір чистого білого паперу. Під час змішування основних компонентів із рівними значеннями одержуємо відтінки сірого кольору і утворюється сіра шкала (діагональ куба), рис. 6.6.

Проте модель CMYK має вузький колірний обхват, тому що вона описує відбиті кольори, інтенсивність яких завжди менша, ніж у випромінюючих. Коли виникає необхідність переведення зображення в CMYK і назад у RGB, то найімовірніше можна сказати, що це призведе до погіршення якості зображення, оскільки багато фільтрів растрових програм у цій моделі не працюють, на 30% потрібний більший об'єм пам'яті в порівнянні з моделлю RGB. Як і модель RGB, модель CMYK є апаратнозалежною [2].

Отже, колірні моделі CMY і CMYK призначені підготувати зображення і вивести його на друк. Застосування CMY доцільне лише теоретично для чорно-білих принтерів, де картридж можна замінити на кольоровий. Додавання чорної фарби дозволило зробити модель CMYK повністю функціональною (але не досконалою) в кольоровому друці. Також покращилась якість виводу діапазону сірих відтінків. Як і RGB, CMYK залишається апаратно залежною, з недостатньо великим кольоровим діапазоном моделлю. Однак при всіх своїх недоліках ця модель досить достатньо відображає необхідний для друку спектр, але разом із тим може нести в собі неадекватну кольоропередачу на виводі, тому деякі зображення краще з самого початку редагувати в ній. Якість, яка отримується під час друку, залежить від якості паперу. У професійній поліграфії CMYK майже не застосовують, а користуються різними її модифікаціями (системи Pantone, Trumatch і ін.) інтегрованими в серйозні графічні програми.

Зручним геометричним способом представлення взаємодії основних колірних моделей RGB і CMYK є колірний круг, рис. 6.7. У ньому на рівній відстані один від одного розміщені адитивні і субтрактивні кольори.

Пари кольорів, розташовані під кутом 180° називаються компліментарними чи додатковими.

У різних джерелах наводяться різні зображення колірного круга. Ці відмінності не мають принципового значення і не впливають на прогностичні властивості моделі.

Основними положеннями колірного синтезу по круговій моделі є: додавання будь-якої фарби колірного круга компенсує додаткову фарбу, ніби розбавляє її в результуючому кольорі. Наприклад, щоб змінити колірне співвідношення у бік зелених тонів, слід знизити кількість пурпурового кольору, який є додатковим до зеленого. Підвищення кількості компонентів RGB спричиняє за собою зниження концентрації параметрів CMY і навпаки; кожен субтрактивний (адитивний) колір знаходиться між двома адитивними (субтрактивними). Складання будь-яких двох кольорів RGB дає колір CMY, що лежить між ними. Справедливе і зворотне твердження. Наприклад, Red+Green=Yellow, Blue+Green = Cyan, Red +Blue = Magenta, Cyan +Magenta = Blue, Cyan +Yellow = Green, Magenta +Yellow = Red; освітлення чи затемнення кольору граничної насиченості спричиняє зниження його насиченості.

Отже, колірна модель RGB широко застосовується для відображення на моніторі і після сканування, CMY і CMYK - для друкуючих пристроїв, фотонабірних автоматів.

Цветовой круг
Рис. 6.7. Колірний круг

6.4. Колірна модель HSV/HSB

Колірна модель HSV/HSB є нелінійним перетворенням колірної моделі RGB. Вона широко застосовується дизайнерами і художниками завдяки практичній універсальності для кольорокорекції. У всіх графічних додатках ця модель присутня в тому чи іншому вигляді.

HSV/HSB не залежить від устаткування і зручна для сприйняття людиною. Оскільки людина інтуїтивно сприймає колір, розділяючи його на відтінок, насиченість і яскравість. Саме тому з нею часто працюють різні програми, надалі перетворюючи кольори в модель RGB для показу на екрані монітора чи в модель CMYK для друку на принтері. Крім того, модель HSV/HSB зручно використовувати при редагуванні малюнків.

Отже, компонентами моделі HSV/HSB є Hue (тон або відтінок), Saturation (насиченість) і Value (значення кольору, колірний тон, кількість світла чи світлота), Brightness (яскравість).

Модель HSV/HSB зручно представляти у вигляді кольорового круга, уздовж якого розташовуються відтінки кольорів. Значення кольору вибирається як точка на крузі (чи вектор, що виходить з центру окружності і вказує на дану точку), рис. 6.8. Різні відтінки розміщуються по окружності, яка становить 360°. Кольори йдуть у спектральному порядку і замикаються пурпуровим.

Модель HSV/HSB має досить широкий колірний обхват. Він не такий великий, як у Lab, але більший ніж у CMYK.

Модель HSV/HSB зручно представляти у вигляді колірного круга. Значення кольору вибирається як точка на колі (чи вектор, що виходить з центра окружності і вказує на дану точку). Різні відтінки розміщуються по окружності, яка становить 360°. Зокрема, 0 – червоний, 60 – жовтий, 120 – зелений, 180 – блакитний, 240 – синій, 300 – пурпуровий, тобто додаткові кольори розташовані один проти одного відрізняються на 180º, рис. 6.8. Застосовується спосіб представлення цієї колірної моделі у вигляді світлової шестигранної піраміди. При цьому по вертикальній осі відкладається значення V, а відстань від осі до бічної грані в горизонтальному перетині відповідає параметру S (за діапазон зміни цих величин приймається інтервал від нуля до одиниці), рис. 6.10. Шестикутник, що лежить в основі піраміди, являє собою проекцію колірного куба в напрямку його головної діагоналі, перевернутий шестигранний конус. Тон кольору H задається кутом, відкладеним навколо вертикальної осі відрахованим від червоного. Точки на самій окружності відповідають чистим (максимально насиченим) кольорам. Точка в центрі відповідає нейтральному кольору мінімальної насиченості (білий, сірий, чорний – це залежить від яскравості). Тобто можна сказати, що кут нахилу вектора визначає відтінок, довжина вектора – насиченість кольору. Величина S змінюється від нуля на осі конуса, до одиниці на його гранях. Значенню V=0 відповідає вершина піраміди (чорний колір), значенню V=1 – основа піраміди; кольори при цьому найбільш інтенсивні. Точка з координатами V=1, S=0 – центр основи піраміди відповідає білому кольору. Проміжні значення координати V при S=0, тобто на осі піраміди, відповідають сірим кольорами, якщо S=0, то значення відтінку H вважається невизначеним, а S=1, якщо точка лежить на бічній грані піраміди.

6.5. Колірна модель HLS

Розширенням колірної моделі HSV/HSB є HLS. Параметрами якої є Hue, Lightness, Saturation, відповідно: кольоровий тон, світимість, насиченість, рис. 6.11. Різниця між моделями HSV/HSB і HLS полягає в заміні нелінійного компоненту яскравість на лінійний компонент освітлений. А також в основній моделі HSV/HSB є власна яскравість об'єкта (ніби приймаємо його за джерело світла), а в HLS враховується світимість об'єкта (яскравість відбитого від нього світла). Іншими словами, в HSB «джерело» – Сонце, а в HLS – Місяць... В основі колірної моделі HLS лежить система Освальда. Ця модель утворює простір у формі подвійного конуса. Колірний тон задається кутом повороту навколо вертикальної осі конусів. За початок відліку прийнятий синій колір. Кольори йдуть у спектральному порядку і замикаються пурпуровим. Отже, по вертикальній осі відкладається L (світимість), а інші два параметри задаються як і в HSV/HSB. Ця модель утворює підпростір, що представляє собою подвійний конус, у якому чорний колір задається вершиною нижнього конуса і відповідає значенню L=0, білий колір максимальної інтенсивності задається вершиною верхнього конуса і відповідає значенню L=1. Максимально інтенсивні кольорові тони відповідають основі конусів з L=0,5, що не зовсім зручно. Тон кольору H, аналогічно системі HSV/HSB, задається кутом повороту. Насиченість S змінюється в межах від 0 до 1 і задається відстанню від вертикальної осі L до бічної поверхні конуса. Тобто максимально насичені кольори розташовуються при L=0,5 і S=1.

6.6. Колірна модель Lab

У комп’ютерній графіці широко застосовується кольорова модель Lab. Вона була розроблена в 1931 році. У 1976 році модель Lab була вдосконалена і названа CIE Lab. Оскільки модель апаратно-незалежна, то вона відтворює одні й ті ж кольори незалежно від особливостей пристрою (монітора, принтера чи комп'ютера).

Модель Lab базується на людському сприйнятті кольору. При однаковій інтенсивності око людини сприймає зелений колір променів найбільш яскравим, дещо менш яскравим – червоний колір, і ще більш темним – синій. Яскравість при цьому є характеристикою сприйняття, а не характеристикою самого кольору. Під час розробки моделі Lab переслідувалася мета математичного коректування нелінійності сприйняття кольору людиною [2].

Цій моделі віддають перевагу в основному професіонали, оскільки вона суміщає переваги як CMY, так і RGB, а саме забезпечує доступ до всіх кольорів, працюючи з досить великою швидкістю. А також вона відрізняється трохи незвичайною побудовою ніж у інших колірних моделях. Побудова кольорів тут, так як і в RGB, базується на злитті трьох каналів.


Рис. 6.8. Графічне представлення колірної моделі HSV/HSB		Рис. 6.10. Утворення кольору в HSV/HSB моделі

а)	б)
Рис. 6.9. Колірна модель HSV представлена у вигляді світлової шестигранної піраміди


а)	б)
Рис. 6.11. Колірна модель HLS у вигляді світлової подвійної шестигранної піраміди

Будь-який колір у колірній моделі Lab обумовлюється параметрами L – яскравість (Lightness) і хроматичними cкладовими – двома декартовими координатами: а, (змінюється від зеленого до червоного, через сірий) і b (змінюється від синього до яскраво жовтого через сірий), рис. 6.12–6.14. Lightness здійснює контроль за яскравістю кольорів, утворених а і b. Білий колір співставляється з максимальною інтенсивністю. L лежать в межах 0-100, а а і b –200–200. Якщо a і b рівні 0, змінюючи L, отримуємо зображення, що містить градації сірого (grayscale). Під час змішування двох кольорів результуючий буде більш яскравим, що є ще однією подібністю з колірною моделлю RGB. Професіонали застосовують цей колірний простір навіть для створення складних масок і кардинальних змін кольорів документа. Оскільки модель має величезний колірний обхват, перевід у неї не пов’язаний з втратами. Можна в будь-який момент перевести зображення з RGB в Lab і назад, і при цьому його кольори не зміняться.

На відміну від кольорових просторів RGB або CMYK, які є, по суті, набором апаратних даних для відтворення кольору на папері чи на екрані монітора (колір може залежати від типу друкарської машини, марки фарб, вологості повітря в цеху чи виробника монітора і його настройок), Lab визначає колір. Оскільки, яскравість у моделі Lab цілком відділена від кольору, то це робить модель зручною для регулювання тонової характеристики (підвищення контрасту, виправлення похибки тонових діапазонів) і видалення кольорового шуму (у т.ч. розмивка растру і видалення регулярної структури зображень у форматі JPEG), різкості та інших тонових характеристик зображення.

Враховуючи позитивні характеристики, а саме величезний колірний обхват, модель Lab знайшла широке застосування в програмному забезпеченні для обробки зображень як проміжна колірного простору, через яку відбувається конвертація даних між іншими кольоровими просторами під час їх підготовки (наприклад, з RGB сканера в CMYK друкованого пристрою). При цьому особливі властивості Lab зробили редагування в цьому просторі потужним інструментом корекції кольору.


Рис. 6.12. Графічне представлення колірної моделі CIE Lab

Рис. 6.13. Графічне представлення колірної моделі Lab		Рис. 6.14. Канали моделі Lab

Яскравість 25%	Яскравість 75%

Рис. 6.15. Приклад зміни яскравості в кольорій моделі Lab

Зображення, що готуються для публікації в Інтернеті, прийнято створювати в так званій безпечній палітрі («web-safe» palette) кольорів. Вона є варіантом індексної палітри. Але файли зображень у Web-графіці повинні мати мінімальний розмір, тому необхідно відмовитися від включення в їх склад індексної палітри. Для цього була прийнята єдина фіксована палітра кольорів, названа безпечною, тобто така, що забезпечує правильне відображення кольорів на будь-яких пристроях (і в програмах), підтримуючих єдину палітру. Безпечна палітра містить всього 216 кольорів, що пов'язане з обмеженнями, вимогами сумісності, накладаючими, з комп'ютерами, що не відносяться до класу IBM РС.

Для створення кольорів, відсутніх у індексній палітрі, застосовують спеціальний метод Error Diffusion Dithering. Це метод імітації (Dithering), в якому передача кольорового півтону в точковому зображенні, відсутнього в стандартній палітрі, досягається за рахунок змінних пікселів двох або доступніших кольорів. Оптичне зміщення кольорів у оці глядача, що не має можливості розглянути окремо суміжні пікселі, створює ілюзію присутності на малюнку кольору, насправді відсутнього в палітрі. Для кольорів, що сильно відрізняються від кольорів палітри, ця техніка приводить до створення зернистих зображень.

Отже, колірні моделі HSV/HSB, HLS широко застосовуються для роботи дизайнерів і художників, Lab – для обробки зображень як проміжна колірного простору через яку відбувається конвертація даних між іншими кольоровими просторами. Для подання графічних об’єктів у Інтернеті набула поширення спеціальна палітра «web-safe» palette.

6.7. Чорно-біле зображення

6.7.1. Створення зображень

Існують різні методи створення зображень — вручну, на дисплеї, з використанням програм графічного редагування та верстки. Для делікатних графічних робіт існує безліч спеціальних пристроїв – мишки у формі товстого олівця, різноманітні креслярські планшети, екрани, чутливі на дотик. Спеціальні програми сприймають зазначені координати та супровідні команди, і зберігають утворені малюнки у растрових (BMP, GIF, JPEG, PCX, PNG, PSD, TIFF та ін.) або векторних (SVG, SVGZ, EPS, WMF, EMF, CDR, CMX, AI та ін.) форматах.

Існують такі типи зображень як: монохромні, кольорові, растрові, векторні та ін.

Монохромне зображення – це зображення, що містить колір одного спектра (довжини хвилі), що сприймається, як один відтінок (на відміну від кольорового зображення, що містить різні кольори). Монохромними зображеннями, наприклад, є малюнки тушшю, олівцем або вугіллям, чорно-білі фотографії, зображення на екрані чорно-білими телевізорами або комп'ютерними моніторами (незалежно від істинного кольору їх свічення).

Кольорове зображення – це зображення, що містить кольори різних спектрів. Растрове зображення – це зображення, що являє собою масив пікселів. Векторне зображення – це зображення, що складається з об'єктів (ліній, кіл, кривих, багатокутників), які можна описати математичними рівняннями. Чорно-біле зображення є растровим. Існує два типи растрових зображень, які можна відносити до монохромних: бінарне і півтонове.

Бінарне (двійкове) зображення іноді називають «монохромним» і «чорно-білим», що в загальному випадку не правильно і веде іноді до плутанини. Бінарне растрове зображення може бути монохромним у випадках, коли: один вид пікселів (не важливо «0» або «1») відображається абсолютно чорним кольором, а інший будь-яким іншим (наприклад, «чорно-білий» растр, «чорно-зелений» і т. д.); обидва види (і «0», і «1») відображаються одним відтінком, але з різною яскравістю (наприклад, «темно- та світло-сірий», «яскраво-зелений і темно-зелений», «синій і сірий» і т. д.). Бінарне зображення не буде монохромним, якщо різні види пікселів відображаються різними відтінками кольору (наприклад, «жовто-зелене», «червоно-синє» растрове зображення та ін.)

Півтонове растрове зображення завжди є монохромним за визначенням, незалежно від того півтони (яскравості) якого відтінку кольору воно містить. Цей термін є досить неоднозначним, тому що в різних сферах людської діяльності розуміється по різному: наприклад, в науці, в обробці космічних знімків, в програмній індустрії.

У деяких програмних продуктах цим терміном називають бінарні зображення, що складаються з білих і чорних пікселів. Однак те ж зображення, візуалізоване іншим програмним продуктом, може виглядати, наприклад, як червоно-синє. При цьому півтонове зображення, що є суворо монохромним, так називають значно рідше.

У зв'язку з цим рекомендується утриматися від терміна монохромне зображення при першому використанні, коли його значення не цілком зрозуміле з контексту, на користь більш однозначних: бінарне зображення і півтонове зображення.

6.7.2. Основні відомості про чорно-біле зображення

Найбільш примітивний тип зображення – це монохромне зображення, кожна точка якого може бути пофарбована тільки чорним або білим кольором. Монохромні зображення потребують дуже мало пам’яті для збереження і виводу інформації. Конвертувати в чорно-біле зображення можна будь-який напівтоновий малюнок. Однак у такий спосіб можна зберігати не всі типи зображень.

Портрет або малюнок олівцем, збережені у монохромному режимі, дають погані результати. Оскільки людське око дуже чутливе до деталей обличчя, то конвертування портрета в монохромне зображення, що видаляє велику частину дрібних деталей, робить фрагменти залишених зображень грубішими, і може змінити обличчя на портреті до невпізнанності.

З іншого боку, малюнок, виконаний тушшю і збережений у вигляді монохромного зображення, при високій роздільній здатності виглядатиме дуже реалістично, оскільки туш має дуже однорідний чорний колір.

Чорно-біле зображення найбільше застосовується у фотографії.

6.7.3. Методи перетворення кольорового зображення в чорно-біле у програмі Photoshop

Практично всі RAW-конвертери мають можливість переведення зображення в чорно-біле. Працюючи з фотографіями в Photoshop, застовуючи конвертер тільки для конвертації RAW-файлів, доцільно переводити фотографії в 16-бітовий формат з невеликим контрастом. Оскільки низький контраст дасть більше можливостей для маніпуляцій градаціями яскравостей, а 16-бітовий формат запобігає випаданню тонів із гістограми.

Зйомка і підготовка до обробки. Багато камер мають можливість перетворення зображень у чорно-білі, здійснення різних налаштувань і тонувань. Зйомка в кольорі з подальшим перетворенням на комп’ютері у чорно-білий вид надає багато можливостей для роботи з тонами і контрастом, рис. 6.16.

Рис. 6.16. Композиція чорно-білої і кольорової фотографії

У деяких випадках корисніше зробити не одну фотографію, а кілька знімків з різною експозицією, створити з них HDRI (паномарна фотографія, яка охоплює всі кути зору з однієї точки і містить велику кількість даних, як правило 32 біта в пік селі на канал, який може застосовуватися для освітлення сцени) з подальшою тональною компресією і тоді переводити зображення в чорно-біле. Деякі ефекти, які вносять під час тональної компресії такі програми, як Photomatix, можуть виглядати непривабливо на кольорових фотографіях, але застосування їх цілком доречне на чорно-білих.

Для зміни балансу світлих і темних областей можна застосувати інструмент Shadow/Highlight. Під час роботи з кольоровими фотографіями параметри в цьому діалоговому вікні потрібно змінювати обережно, оскільки можна легко порушити не тільки природний контраст мотиву, а й спотворити колір. У той же час у чорно-білій фотографії цим інструментом можна користуватися набагато ширше, особливо під час зйомки архітектури, де зміна балансу світла і тіней може зробити знімок цікавішим, рис. 6.17.

Розглянемо методи перетворення зображення в чорно-біле, які надає Photoshop. У більшості випадків для роботи з фотографіями достатньо одного чи двох описаних нижче методів.

Для більш наочного показу методів можна взяти зображення подане на рис. 6.18. У середньому ряду знаходяться кольори в чистому вигляді, над ними – квадрати зі зменшеною насиченістю в HSB-моделі. Нижче середнього ряду зменшується яскравість кольорів у HSB-моделі.

thumb_339

Рис. 6.17. Результат застосування інструменту Shadow/Highlight

Рис. 6.18. Гамма кольорів у Photoshop

Метод Black/Whitе

Метод Black/Whitе є найбільш зручним і зрозумілим методом переводу зображення в чорно-біле. Використання його в більшості випадків призводить до оптимальних результатів. Він з’явився тільки у версії Photoshop CS3. Користувачі попередніх версій використовують схожий метод – Channel Mixer.

За допомогою діалогового вікна Black/White визначають яскравість кольорових тонів. При значенні 50 для певних колірних тонів всі пікселі цього кольору приймають такі ж значення HSL-яскравості, як і під час використання Hue/Saturation. А при значенні 0 відповідні насичені кольори стають чорними, при 100 – білими, а малонасичені кольори, відповідно, затемнюються чи стають світлішими. А при негативних значеннях затемнюються також малонасичені і світлі пікселі цього колірного тону, рис. 6.19. Незважаючи на те, що Black/White нагадує Channel Mixer, принцип його дії зовсім інший. А саме будь-які зміни у вікні Channel Mixer впливають на всі зображення, у той час як Black/White – тільки на певні колірні відтінки.

Рис. 6.19. Результат застосування інструменту Black/White

У ранніх версіях Photoshop фільтр частково замінюють двома коригуюючими шарами спочатку Selective Color і над ним – Hue/Saturation з насиченістю 100. Тепер, змінюючи параметр Black для певних кольорів у шарі Selective Color, можна змінити їх яскравість. Вплив цього методу буде помітний в першу чергу для насичених тонів. Обійти це обмеження можна створенням ще одного шару Hue/Saturation безпосередньо над шаром із фотографією і збільшити в ньому насиченість всього зображення чи тільки певних кольорів.

Метод Channel Mixer

До появи версії Photoshop CS3 метод Channel Mixer був найкращим методом переводу зображення в чорно-біле. Проте він ще широко застосовується, оскільки в каналах вже міститься чорно-біле зображення і результатом комбінування декількох каналів є хороше зображення, рис. 6.20.

Застосування методу Channel Mixer вимагає деякого часу і досвіду під час переводу фотографій у чорно-біле зображення. Для цього треба проаналізувати всі три канали окремо і з’ясувати, наскільки вигляд того чи іншого каналу відповідає бажаному результату. Потім, відзначивши опцію Monochrome в діалоговому вікні Channel Mixer, змінити процентний вміст інформації з певних каналів. Якщо ефект фільтра недостатньо виражений, можна додати новий коригувальний шар Hue/Saturation безпосередньо під шаром Channel Mixer і збільшити насиченість всього зображення або тільки певних кольорів. Щоб результати підвищення насиченості були більш якісними, можна скористатися виборчою насиченістю. Найчастіше для оптимальних результатів сума впливу всіх каналів повинна дорівнювати 100%. Найбільш природно виглядає результат 30/60/10.

Рис. 6.20. Вихідне зображення і результати застосування Channel Mixer

з параметрами 80/20/0 і -20/-30/150

Метод Calculations

Метод Calculations можна вважати логічним продовженням роботи з каналами через Channel Mixer. Діалогове вікно Calculations дозволяє розраховувати результат накладання каналів один на одний з різними режимами перекриття. Викликавши діалог через Image-Calculation, можна задати вихідні канали і режим перекриття.

Цей метод дозволяє працювати тільки з двома каналами. Для роботи з усіма трьома каналами треба перейти до списку каналів, в опціях вибрати Split Channels і отримати три зображення в режимі Grayscale. Скопіювавши їх в один файл у вигляді шарів, можна експериментувати з режимами перекриття і прозорістю, а за необхідності додавати до верств-каналів маски і закривати на ній частини.

Цей метод працює, тільки коли зображення представлене одним-єдиним базовим шаром Background. Якщо ні, то шари зображення потрібно спочатку скласти (Ctrl + Shift + E) і створити базовий шар через Layer-New-Background from Layer.

Метод Gradient Map

Застосування методу Gradient Map зобов’язує перед початком роботи встановити чорний і білий кольори, натиснувши клавішу D, створити новий шар Gradient Map і вибрати перший у списку градієнт Foreground to Background.

Цей метод базується на формулі 30% інформації червоного каналу, 60% – зеленого і 10% синього з невеликими варіаціями. Отримані результати сильніше відрізняються від візуального сприйняття яскравостей кольорового зображення, ніж результати наступних більш простих методів. Однак контраст отриманої фотографії вищий від 18 для чистого синього кольору до 237 для жовтого, рис. 6.21.

Рис. 6.21. Результат застосування інструменту Gradient Map

Як варіант цього методу можна використовувати «зонний градієнт», своєрідну імітацію методу роботи з зонами яскравості, який пропонує програма Lightzone. Для цього створюється чорно-білий градієнт і ставиться на ньому між двома крайніми каретками ще 9 кареток з кроком 10. Тобто друга каретка буде знаходитися на позиції 10, третя – 20 і т. д. Кожній каретці привласнюється відтінок сірого, відповідний її позиції, – перша буде зі значенням яскравості 0, друга – 10 і т. д. Тоді, змінюючи позиції кареток, маніпулюють контрастом і розподілом яскравостей на зображенні. Зрушуючи каретки в центр градієнта, отримуємо більш контрастне зображення, зрушуючи каретки до країв, – більше відтінків сірого, рис. 6.22.

Для оптимальних результатів краще застосовувати «зонний градієнт» до

16-бітових зображень.

Метод зрушення колірного відтінку практичного застосування немає, за винятком для знімків з неяскравими кольорами.

thumb_339

Рис. 6.22. Вихідна чорно-біла фотографія і результати застосування зонного градієнта з різними параметрами

Методи Hue/Saturation і Desaturate практичне застосування знайшли у випадках, якщо на вихідній фотографії немає кольору, який потрібно враховувати, рис. 6.23.

thumb_339

Рис. 6.23. Результат застосування методів Hue/Saturation і Desaturate

Метод Grayscale

Під час застосування методу Grayscale для заповнення інформацією єдиного результуючого каналу використовується приблизно класична формула 30/60/10. Крім застосування цієї формули Photoshop проводить додаткові маніпуляції над інформацією зображення, для рівномірнішого розподілу ступенів яскравості між різними колірними відтінками.

Контраст фотографій досить невисокий, проте це дає фотографу більший простір для маніпуляцій над зображенням з допомогою кривих, рівнів або інших методів роботи з контрастом. Цей метод застосовується, якщо на фотографії є тільки слабкі кольори. У такому випадку цей метод все ж підходить краще, ніж попередній, оскільки враховує колірні відтінки, рис. 6.24.

Якщо за переведенням зображення слідують маніпуляції з тонуванням, можна перевести зображення в Grayscale і відразу ж в RGB.

thumb_339

Рис. 6.24. Перетворення зображення в чорно-біле методом Grayscale

Метод Lab

Результати методу Lab схожі на попередній, тільки діапазон яскравостей, в якому розподіляються різні кольори, менший. Коли під час переведення в режим Grayscale яскравості чистих кольорів розподілялися від 70 для синього до 248 для жовтого, то під час цього методу – від 250 до 110. Зображення переводиться в колірний простір Lab, після чого вибирається канал L (в списку каналів або через Ctrl +3) і переводиться в Grayscale, рис. 6.25.

Рис. 6.25. Результат застосування методу Lab

6.8. Напівтонове зображення

6.8.1. Основні відомості про напівтонове зображення

Напівтоновим зображенням вважається зображення, що має безліч значень тону, і їх безперервну, плавну зміну.

Прикладами напівтонових зображень можуть бути малюнки, картини, виконані фарбами, фотографії.

Як і всі растрові зображення півтонове зображення кодується в цифровому вигляді за допомогою бітової карти (матриці), що зберігає значення елементів зображення (пікселів). Кожен піксель напівтонового зображення може кодуватися різною кількістю біт, що визначає кількість можливих півтонів. Наприклад: 2 біт – 4 півтони; 3 – 8; 4 – 16; 8 – 256 і т. д.

При цьому, однобітове бінарне зображення (1 біт на 1 піксель) можна вважати виродженим напівтоновим, здатним передати лише 2 півтони (наприклад чорний і білий), або ж окремим видом напівтонового.

Безліч можливих півтонів називають рівнями сірого (англ. gray scale), незалежно від того, півтони якого кольору або його відтінку передаються. Рівні сірого не відрізняються за спектральним складом (відтінком кольору), але відрізняються за яскравістю. Кількість можливих півтонів у даному випадку є глибина кольору, яку часто передають не в кількості самих півтонів, а в кількості біт на піксель (англ. bit per pixel, bpp).

Наприклад, в аерофотозйомці і космічній зйомці на виході можна отримати напівтонові зображення з глибиною кольору (кількістю біт на піксел, bpp від англ. Bit per pixel) 16 або 32. Яке значенння у допустимому діапазоні буде вважатися найяскравішим, а яке найтемнішим не має значення, тому що число, яке є значенням кожного пікселя – лише умовний код яскравості. Досить вказати напрямок відліку.

Наприклад, можуть існувати напівтонові растри, де на кожен піксель відведено по 8 біт, а зображення має 256 півтонів. При цьому пікселі зі значенням 0 або 255 будуть чорними, і навпаки, пікселі зі значенням 255 або 0 – білими, решта півтонів сірого будуть рівномірно розподілені між даними значеннями колірного індексу.

В образотворчому мистецтві та побуті найчастіше застосовують напівтонові растри з глибиною кольору 8 біт (що дорівнює 1 байт), тобто кожен піксель зображення може приймати 256 різних умовних значень яскравості від 0 до 255. Цього цілком достатньо, щоб правильно відобразити чорно-білу фотографію.

У науці і техніці часто такого діапазону і дискретності подання яскравості не достатньо.

Деякі формати зберігання растрових зображень (наприклад, TIFF) дозволяють задавати за допомогою палітри через умовне значення індексу точні фотометричні характеристики зображення. Така палітра являє собою таблицю, де кожному умовному рівню сірого (задається цілим числом – кодом) ставиться у відповідність будь-яка фотометрична величина. Це також часто використовується на практиці в тих випадках, коли умовної відмінності яскравості однієї ділянки зображення від іншої не достатньо. Наприклад, під час дешифрування аерокосмічних знімків з метою прогнозування врожаю чи оцінки ураженості шкідниками, необхідно знати точну кількість зареєстрованого випромінювання.

6.8.2. Структурна модель напівтонових зображень та її використання у задачі сегментації зображень

Форма об'єкту повністю визначає його опис і представлена його граничним контуром і функцією оптичної щільності, яка визначена в межах цього контуру.

Обробка візуальної інформації, зокрема напівтонових зображень, відноситься до найбільш складних завдань штучного інтелекту і, в той же час, все більше є актуальним методом для практичного використання в найрізноманітніших галузях науки і технологій. У даний час у засобах штучного інтелекту напівтонові зображення представлені у растровому вигляді. Таке уявлення виключає можливість обробки – перетворення, ідентифікації об'єктів, що відрізняються від афінних перетворень – масштабом, положенням у полі зображення, поворотом. У сучасних засобах обробки візуальної інформації практично не використовуються такі поняття як контури об'єктів напівтонових зображень (за винятком контурів об'єктів попередньо бініаризованих напівтонових зображень). У той же час однією з найважливіших і найбільш природних особливостей зорового сприйняття людини є її здатність до сегментації поля зору на об'єкти, які відрізняються від фону оптичною щільністю, кольором, текстурою та ін. Основною характеристикою будь-якого об'єкта є його форма, яка визначена контуром – кордоном між об'єктом і фоном. Контур, у свою чергу, сприймається людиною як послідовність відрізків прямих і дуг кривих ліній. Форма напівтонових і кольорових об'єктів визначається, крім того, функцією оптичної щільності з урахуванням кольору, текстури всередині контуру кожного з об'єктів. Ці особливості зорового сприйняття людини відображені у пропонованій структурній моделі напівтонового зображення.

Структурна модель дає можливість представлення довільних зображень за одноманітною формою. Завдання приведення до структурної моделі довільних зображень, заданих у растровому вигляді, спотворених перешкодами у загальному випадку ще не вирішена. Однак в окремих випадках приведення зображень до структурної моделі дозволяє істотно підвищити швидкість і якість обробки візуальної інформації, що, у свою чергу, забезпечить якісне функціонування інформаційних технологій які використовують ці засоби. Об'єкти напівтонового зображення, представлені в структурному вигляді, інваріантному щодо афінних перетворень, найкращим чином підходять у якості вихідних даних для обробки засобами зростаючих пірамідальних мереж і теорії розпізнавання і пам'яті.

Такий структурний аналіз форми візуальних об'єктів, спотворених перешкодами, добре узгоджується з відомим стандартом MPEG-7, і може бути до нього адаптований.

Розглянемо структурну модель напівтонового зображення і приклад її використання підчас розробки інформаційних технологій для медичних діагностичних систем, зокрема, для структурного аналізу напівтонових зображень з метою автоматичного виділення об'єктів на прикладі зображень медичних препаратів, отриманих за методом Кирліан.

6.8.3. Структурний аналіз напівтонового зображення

Основою структурного аналізу напівтонового зображення є модель, яка визначає його структурні елементи. У відповідності з відомими уявленнями про механізми зорового сприйняття такими структурними елементами зображення, зокрема, є об'єкти, розташовані на тлі, який визначається двовимірною функцією оптичної щільності. Об'єкти, в свою чергу, визначаються контурами, які їх обмежують, і двовимірною функцією оптичної щільності в межах об'єкта. Контури є замкнутими послідовностями, які утворені відрізками прямих і дугами кривих ліній.
Під зображенням розуміють частину площини, обмежену деякою геометричною фігурою, зазвичай прямокутником, кожна точка якої характеризується певним значенням оптичної щільності. Іншими словами, на частині площини, обмеженої прямокутником з розмірами Х, У визначена р = f (х, у), (0 <х <Х; 0 <у <У). Цій функції можна поставити у відповідність деяку поверхню z = f (х, у) в просторі OXYZ . Таким чином, кожному напівтоновому зображенню можна поставити у відповідність регулярну незамкнену поверхню в просторі OXYP яка складається з простих елементів поверхні. Для поверхні, яка відповідає напівтоновому зображенню, справедливе наступне обмеження. Кожному значенню пари координат (x, y) відповідає одне і тільки одне значення функції (x, y), тобто перпендикуляр до площини зображення в будь-якій точці х, у перетинає уявну поверхню один і тільки один раз.

Контур кожного елемента регулярної поверхні є замкнутою послідовністю регулярних дуг кривих і відрізків прямих. Точки контуру не є регулярними точками елементів простих поверхонь. Точки контуру – це граничні точки елементів простих поверхонь. Точки контуру утворюють особливі лінії поверхні, які є граничними, що розділяють різні елементи простих поверхонь. На відміну від бінарних зображень, точки яких можуть мати тільки два значення оптичної щільності – чорний або білий, області напівтонових зображень, обмежені контуром, можуть мати різні закони зміни оптичної щільності. Відповідно, кількість відмінних один від одного сусідніх елементів простих поверхонь, як правило, більше двох. Значить, контури напівтонового зображення можуть і не бути, в загальному випадку, однозв'язними послідовностями регулярних дуг кривих і відрізків прямих, а складаються з гілок, що з'єднують вузли. Гілки є особливими лініями зображення. Точки контуру, за винятком вузлів, є регулярними точками гілок. Вузли є особливими точками контуру і зображення. Гілки і вузли разом із законом зміни оптичної щільності кожного елемента простої поверхні повністю визначають регулярну поверхню і відповідну їй область зображення. У багатьох практичних випадках контури напівтонового зображення є однозв'язними послідовностями регулярних дуг кривих і відрізків прямих, що істотно спрощує завдання структурного аналізу.

У напівтоновому зображенні завжди можна виділити області, для яких значення оптичної щільності постійне, або змінюється за певним законом. Закон зміни оптичної щільності визначається grad() – градієнтом оптичної щільності. Зазвичай в межах однієї області = const, або /x + /y = const, або /x²+ /y² = const. У той же час можливі і інші закони зміни оптичної щільності. Згідно з наведеними визначеннями півтонове зображення можна розглядати як деяку область регулярної поверхні, що складається з регулярних елементів простих поверхонь, причому кожен об'єкт зображення відповідає одному чи декільком елементам простих поверхонь.

6.8.4. Цифрова строкова модель довільного напівтонового зображення

З поверхнею в просторі OXY, якій відповідає півтонове зображення, поєднана решітка NMP, і для кожного пікселя зображення визначено середнє в межах його площі значення оптичної щільності p (n, m), яка набирає цілі значення p (n, m) = (0, Р ); n = (0, N); m = (0, M). Сторона решітки з N клітинками розташована вздовж осі Ох, сторона решітки з M клітинками розташована уздовж осі ОY, сторона решітки з P клітинками розташована вздовж осі О. Нехай (yn); n = (0, N) – безліч паралельних площин, перпендикулярних осі Ox в тривимірному просторі OXY. Точно так само (xm); m = (0, M) – безліч паралельних площин, перпендикулярних осі OY. Перетин поверхні зображення з цими площинами утворює на кожній з площин Yn лінію контуру (x), а на кожній з площин Xm лінію контуру (y), або (m) і (n) для випадку дискретизованого зображення.

Виділення регулярних і особливих точок регулярних поверхонь може бути виконано в процесі структурного аналізу функцій (m) і (n) дискретизованого напівтонового зображення, що дає можливість представити їх як послідовності відрізків цифрових прямих і дуг цифрових кривих у площинах On для будь-яких значень m = (0, M) і Om для будь-яких значень n = (0, M) відповідно. Граничні точки відрізків і дуг є особливими точками ліній перетину, в той час як інші точки є регулярними точками ліній перетину. Кожна точка t дискретизованого зображення належить одночасно двом взаємно перпендикулярним площинам і та двом пересічним лініям контуру і відповідно.

З визначення регулярної поверхні випливає, що точка поверхні є регулярною, якщо вона є регулярною точкою горизонтальної і вертикальної ліній перетину.

Якщо ж точка поверхні є особливою точкою хоча б однієї з ліній – горизонтальної і / або вертикальної ліній перетину, то така точка є особливою – граничною точкою регулярної поверхні – області напівтонового зображення.

Граничні точки областей напівтонового зображення (його регулярної поверхні) утворюють лінії контурів у площині XOY. Лінії контурів, у свою чергу, містять регулярні та особливі точки.

Структурний аналіз напівтонового зображення повинен містити такі операції:

1) виділення особливих точок регулярних поверхонь (областей зображення);

2) побудова особливих ліній зображення (контурів), які обмежують об'єкти в особливих точках регулярних поверхонь;

3) виділення структурних елементів контурів – відрізків прямих і дуг кривих ліній.

На рис. 6.26 представлений приклад структурного аналізу з використанням строкової моделі, а саме виділення контурів на напівтоновому зображенні. Програми виконують над зображенням (рис. 6.26, а) такі операції. Для кожного вертикального і горизонтального рядків зображення будуються графіки функцій оптичної щільності, приклади яких зображені на рис. 6.26, с, d. Для кожного графіка визначається послідовність елементів, з яких він складається, – відрізків цифрових прямих і дуг цифрових кривих. Граничні точки між елементами графіка є особливими точками графіка цього рядка і всього напівтонового зображення. Особливі точки зображення виділені на рис. 6.26, b білим кольором. Особливі точки належать лініям контуру напівтонового зображення. За особливими точкам побудовані контури напівтонового зображення. На рис. 6.26,е представлені контури в растровому вигляді, утворені окремими особливими точками. Їм відповідають контури у векторному вигляді – рис. 6.26, f.

Рис. 6.26. Виділення контурів на напівтоновому зображенні, здійснено програмами, що реалізують строкову модель зображення та обробку контурів: a – модельне півтонове зображення з виділеними особливими точками; b – криві оптичної щільності – r – горизонтальних рядків; c – модельне півтонове зображення; d – криві оптичної щільності – r – вертикальних рядків; e – зображення контурів, утворені окремими особливими точками; f – зв'язкові зображення контурів

6.8.5. Експерименти з обробки зображень, отриманих за методом Кирліан

Розглянемо використання структурної строкової моделі цифрового зображення на прикладі обробки зображень медичних препаратів, отриманих за методом Кирліан.

Зображення медичних препаратів взагалі містять об'єкти, форма яких дуже мінлива, але, в той же час, саме у формі міститься діагностична інформація візуальної оцінки. Як правило, такі зображення спотворені перешкодами. Зображення медичних препаратів використовуються в процесі прийняття рішень в медичних діагностичних системах. Зображення, які отримані в процесі функціонування таких систем не завжди високої якості, що значно знижує можливість їх швидкого і повного сприйняття експертами з мінімальними витратами часу. У той же час саме в процесі аналізу великих кількостей таких зображень можуть бути отримані нові знання про стан здоров'я груп населення. Час обробки і прийняття рішення, так само як і кількість експертів у медичних діагностичних системах, як правило, обмежена. Без автоматизації обробка таких обсягів візуальної інформації перестає бути ефективною. Зокрема знижується якість обробки і зростає кількість помилок.

Зображення, отримані за методом Кирліан (далі зображення Кирліан), є знімками, виконаними на спеціальній фотоплівці, розміром А4, на яких зафіксовані світіння від кожного з десяти пальців (рис. 6.27).

Описание: Рис

Рис. 6.27. Приклади зображень Кирліан світіння пальців: a) лівих, b) правих рук

M_o, M_f – середні значення яскравості об'єктів і фону; o_min, o_max, f_min, f_max – мінімальні і максимальні значення яскравості об'єктів і фону.

Для зображень характерні нестабільність і нерівномірність фону, значна кількість перешкод, які за рівнем яскравості і величиною, в порівнянні з об'єктами, мають нестійкість форми та рівень яскравості.

Хоча за змістом обробки в даний час ці зображення могли б вважатися бінарними, проте, навіть завдання бінаризації таких зображень не може вважатися тривіальним, як і завдання подальшої обробки. Зокрема, завдання виділення та ідентифікації об'єктів з метою діагностики. Існує стандартне програмне забезпечення для обробки зображень Кирліан, отриманих на спеціальних приладах окремо для кожного пальця. Однак використання таких приладів ускладнює діагностику, оскільки стан досліджуючого організму за період послідовної фіксації світінь кожного з десяти пальців може істотно змінитися.

Щоб використовувати стандартне програмне забезпечення для зображень Кирліан, на яких одночасно зафіксовані всі пальці рук (рис. 6.27), необхідно попередньо сегментувати ці зображення і повернути зображення кожного пальця таким чином, щоб воно відповідало його вертикальному положенню.

Пропоноване програмне забезпечення призначене для автоматичної сегментації зображень Кирліан від п'яти пальців на зображення до кожного пальця окремо. Робота програми полягає у виконанні наступних операцій:

1) по осі абсцис визначають значення яскравості, а по осі ординат – умовні значення, пропорційні кількості пікселів, що відповідають даному значенню яскравості. Обчислення гістограми оптичної щільності досліджуючого зображення Кирліан зображено на рис. 6.28. Після її згладжування, визначають мінімальне значення яскравості об'єктів o_min, як мінімальне значення яскравості пікселів зображення та максимальне значення яскравості фону f_max, як максимальне значення яскравості пікселів зображення. Встановлюють середнє значення яскравості об'єктів М_о, як перший максимум під час зростання значень яскравості, починаючи з нуля, і фону M_f, як перший максимум під час зменшення значень яскравості, починаючи з максимального (255);

Рис. 6.28. Гістограма яскравості (оптичної щільності) зображення

2) на підставі припущення про симетричність розподілу випадкових величин яскравості пікселів фону та об'єктів, обчислюють мінімальне значення яскравості пікселів фону, як f_min = M_f - (f_max-M_f) і максимальне значення яскравості пікселів об'єктів, як o_max = М_о + (M_f - o_min);

3) обчислюють функції яскравості (оптичної щільності) горизонтальної рядка r (m, n) m = 1,M для всіх горизонтальних рядків зображення n = 1,N (рис. 6.29).

Ця функція не є результатом бінаризації, оскільки не розглянуті значення функції яскравості o_max< r (m, n) < f_min. Пікселі з такими значеннями функції яскравості є проміжними між пікселями фону та об'єкта і не мають суттєвого значення для виділення об'єктів на зображенні, принаймні, для вирішення завдань з обробки зображень Кирліан.

Дане перетворення зображення, з урахуванням динамічного діапазону є нелінійним із зміною кількості рівнів квантування від 256 до 3 і дозволяє в значній мірі виключити вплив перешкод. Приклади функції (m, n) зображені на рис. 6.29

Рис. 6.29. Виділення особливих точок у місцях перетину об'єктів горизонтальними рядками

4) визначають функцію на зображенні:

ламаною лінією. Числами 1, 4, 5, 8, 9, 12, 13, 16, визначені особливі точки зображення, які належать фону, а числами 2, 3, 6, 7, 10, 11, 14, 15 – особливі точки зображення, які належать об'єктам.

Будують внутрішній і, за необхідності, зовнішній контури об'єктів, за виділеними особливими точками, рис.6.30. Якщо контури визначено, то об'єкти виділені успішно.

Рис. 6.30. Контури об’єктів: а – внутрішні контури; b – апроксимація контурів еліпсами

Визначають положення об'єктів світіння пальців щодо центру долоні. Апроксимують внутрішні контури еліпсами, визначають кут повороту кожного пальця, обертають зображення світіння пальця до відповідності вертикального положення пальця (рис. 6.30) і формують результуючі файли зображень.

Структурна модель дозволяє будувати описи об'єктів напівтонового зображення інваріантні до афінних перетворень.

Отже, існує можливість і ефективність обробки напівтонових зображень з використанням структурної моделі напівтонових зображень.

6.8.6. Кодування напівтонових зображень, представлених набором бітових перерізів

Напівтонове зображення являє собою матрицю пікселів, в якій кожен піксель містить інформацію про яскравість складової сигналу. Під час розгляду зображення на двовимірній площині слід виділити наявність у ньому областей рівної чи приблизно рівної яскравості. Найпростіші алгоритми кодування, такі як RLE, LZ, не виділяють ці геометричні (просторові) області, розглядаючи зображення у вигляді довгого розгорнутого рядка, і тому не можуть повною мірою використовувати всі особливості зображення в процесі стиснення, забезпечуючи невисокий коефіцієнт компресії. Найближче до вирішення даної проблеми підійшли розробники фрактальних алгоритмів кодування напівтонових зображень.

Фрактальні алгоритми забезпечують досить великі коефіцієнти компресії за хорошого відновлення зображення приймачем. Недоліком даних алгоритмів є тривалий час кодування, яке визначається пошуком структури (атрактора) у зображенні. Істотним поштовхом до розвитку фрактального кодування напівтонових зображень стало обґрунтування можливості використання системи кусково-визначених функцій (PIFS) для кодування напівтонових зображень, отриманих не штучним (комп'ютерне моделювання) шляхом.

Робота алгоритму здійснюється наступним чином. Вихідне зображення розбивається на доменні (опорні) і рангові (відновлювані) растрові області. На підставі певного набору функціональних перетворень для кожного рангового блоку проводиться пошук відповідного доменного блоку. Швидкість і якість кодування можна регулювати введенням порогових значень відповідності під час порівняння рангових і доменних областей. З урахуванням того, що в процесі пошуку кращого доменного блоку порівнюються растрові області, відповідний блок повинен мати відповідну яскравість і контрастність, що знижує швидкість кодування і збільшує обсяг закодованого файла.

Для уникнення цього явища запроваджують альтернативний комплексний алгоритм, заснований на представленні цифрового напівтонового зображення у вигляді набору бітових перетинів. Для цього вихідне зображення рівномірно квантують зазвичай на вісім бітових перерізів. Можливе також застосування нерівномірного квантування, що дозволить знизити необхідну кількість бітових перерізів для представлення зображення. Сусідні бітові перетини мають схожі області чи просто є інверсними копіями один одного. Особливо чітко даний момент простежується в старших бітових перетинах, що володіють високою просторовою кореляцією, як по рядках, так і по стовпцях зображення. У міру зниження розрядності бітового перетину середня протяжність областей однакової яскравості також знижується. Сильний кореляційний зв'язок між сусідніми бітовими перерізами дозволяє значно спростити процедуру пошуку, що збільшує компресію даних і підвищує швидкість кодування. У даному випадку в якості доменних блоків будуть області старшого (восьмого) бітового перерізу, оскільки просторова кореляція в ньому зазвичай має найбільше значення. Цей перетин буде опорним, що безпосередньо передається на приймаючий пристрій без кодування. Всі інші перетини розбиваються на рангові блоки, для яких проводиться відповідно до алгоритму пошук найкращого доменного блоку. Зі зменшенням розрядності бітового перетину ступінь подібності перерізів значно падає. Тому процес кодування обмежують тільки старшими чотирма бітами. У процесі порівняння рангова область зазнає різних функціональних перетворень, що дозволяють досягти схожості на початкових етапах кодування. Набір і кількість цих функціональних перетворень дозволяє регулювати швидкість кодування з одного боку і ступінь компресії зображення з іншого. Для простоти обчислень бітові перерізи вихідного зображення розбиваються на рангові та доменні області квадратної форми, кратні двом. У якості функціональних перетворень використовується інверсія і поворот області. Використання бінарних зображень значно спрощує процес порівняння на відміну від роботи алгоритму з напівтоновими областями, оскільки сигнал може приймати лише два значення, і даний алгоритм може бути легко апаратно реалізований. Якість відновленого зображення визначається ступенем схожості рангового і доменного блоків. Регулювання цього процесу здійснюється шляхом заздалегідь обраного порогового значення відповідності. Якщо в процесі перебору всіх доменних блоків потрібний так і не був знайдений, ранговий блок розбивається на частини, кожна з яких знову порівнюється з доменними областями. Даний процес триває до досягнення необхідного порогового рівня відповідності. Змінюючи це значення можна керувати як часом кодування, так і якістю відновленого зображення. Велика частина найбільш поширених алгоритмів стиснення застосовує не одну, а кілька методів стиснення, що дозволяє підлаштуватися до характеристик кодованого зображення. З цією ж метою файл, отриманий після безпосередньо фрактального алгоритму кодування, додатково стискається архіватором WINZIP. При цьому досягається значна ступінь компресії, тому що файл після фрактального етапу кодування містить повторюючу структуру.