Які ключові компоненти згорткової нейронної мережі (CNN) та їхні відповідні ролі в задачах розпізнавання зображень?

by Академія EITCA / Вівторок, 08 серпня 2023 / Published in Штучний Інтелект, EITC/AI/DLTF Глибоке навчання за допомогою TensorFlow, Свертові нейронні мережі в TensorFlow, Свертові нейронні мережі з TensorFlow, Екзаменаційний огляд

Згорточна нейронна мережа (CNN) — це тип моделі глибокого навчання, яка широко використовується в задачах розпізнавання зображень. Він спеціально розроблений для ефективної обробки та аналізу візуальних даних, що робить його потужним інструментом у програмах комп’ютерного зору. У цій відповіді ми обговоримо ключові компоненти CNN та їхні відповідні ролі в задачах розпізнавання зображень.

1. Згорткові шари: згорткові шари є будівельними блоками CNN. Вони складаються з набору навчальних фільтрів або ядер, які згортаються разом із вхідним зображенням для створення карт функцій. Кожен фільтр виявляє певний візерунок або функцію на зображенні, як-от краї, кути або текстури. Операція згортки передбачає переміщення фільтра по зображенню та обчислення скалярного добутку між ваговими коефіцієнтами фільтра та відповідним фрагментом зображення. Цей процес повторюється для кожного місця на зображенні, створюючи карту об’єктів, яка підкреслює наявність різних об’єктів.

Приклад: розглянемо фільтр 3×3, який виявляє горизонтальні краї. При згортанні з вхідним зображенням створюється карта функцій, яка підкреслює горизонтальні краї зображення.

2. Об’єднання шарів: Об’єднання шарів використовується для зменшення дискретизації карт функцій, створених згортковими шарами. Вони зменшують просторові розміри карт функцій, зберігаючи найважливішу інформацію. Найпоширенішою операцією об’єднання є максимальне об’єднання, яке вибирає максимальне значення у вікні об’єднання. Це допомагає зменшити обчислювальну складність мережі та робить її більш стійкою до невеликих просторових змін у вхідному зображенні.

Приклад: застосування максимального об’єднання з вікном об’єднання 2×2 на карті об’єктів вибере максимальне значення в кожній неперекриваючій області 2×2, фактично зменшуючи просторові розміри вдвічі.

3. Функції активації. Функції активації вводять нелінійність у CNN, дозволяючи їй вивчати складні моделі та робити прогнози. Найпоширенішою функцією активації в CNN є Rectified Linear Unit (ReLU), яка обчислює вихід як максимум нуля та входу. ReLU є кращим через його простоту та здатність полегшити проблему зникнення градієнта.

Приклад: якщо вихід нейрона негативний, ReLU встановлює його на нуль, фактично вимикаючи нейрон. Якщо результат позитивний, ReLU зберігає його незмінним.

4. Повністю підключені шари: повністю підключені шари відповідають за створення остаточних прогнозів на основі вилучених функцій. Вони беруть сплощені карти ознак із попередніх шарів і пропускають їх через серію повністю з’єднаних нейронів. Кожен нейрон повністю пов’язаного шару з’єднаний з кожним нейроном попереднього шару, що дозволяє вивчати складні зв’язки між функціями та робити точні прогнози.

Приклад: у завданні розпізнавання зображень повністю пов’язаний рівень може містити нейрони, що відповідають різним класам, наприклад «кішка», «собака» та «автомобіль». Вихід повністю зв’язаного шару можна інтерпретувати як ймовірності належності вхідного зображення до кожного класу.

5. Функція втрат: функція втрат вимірює розбіжність між прогнозованими виходами та основними мітками істинності. Він кількісно визначає, наскільки добре CNN виконує поставлене завдання, і надає сигнал для оновлення параметрів моделі під час навчання. Вибір функції втрат залежить від конкретного завдання розпізнавання зображень, наприклад, бінарна крос-ентропія для двійкової класифікації або категоріальна крос-ентропія для багатокласової класифікації.

Приклад: у завданні двійкової класифікації двійкова перехресна втрата ентропії порівнює прогнозовану ймовірність позитивного класу з істинною міткою (0 або 1) і штрафує великі розбіжності між ними.

Згорточна нейронна мережа (CNN) складається із згорткових шарів, шарів об’єднання, функцій активації, повністю зв’язаних шарів і функції втрат. Згорткові шари витягують значущі функції з вхідного зображення, а шари об’єднання зменшують дискретизацію карт функцій. Функції активації вводять нелінійність, а повністю пов’язані рівні роблять остаточні прогнози. Функція втрат вимірює розбіжність між прогнозованими результатами та базовими мітками істинності, керуючи процесом навчання.

Інші останні запитання та відповіді щодо Свертові нейронні мережі в TensorFlow:

Більше питань і відповідей:

Теги: Штучний Інтелект, CNN, Комп'ютерне бачення, Згортка нейронна мережа, Глибоке навчання, Розпізнавання зображень

Академія EITCA

Які ключові компоненти згорткової нейронної мережі (CNN) та їхні відповідні ролі в задачах розпізнавання зображень?

Інші останні запитання та відповіді щодо Свертові нейронні мережі в TensorFlow:

Більше питань і відповідей:

Академія EITCA є частиною Європейської системи ІТ-сертифікації

Право на участь у Академії EITCA 80% підтримки EITCI DSJC

Академія EITCA

УВІЙТИ СВІЙ ЗВ'ЯЗОК НА ВАШУ РАХУНКУ ЗА ВСІМ СВОЄМО ІНФОРМАЦІЄМОЮ ІЛИ електронною адресою

ЗАБУДУЙТЕ ДЕТАЛІ?

СТВОРИТИ АККАУНТ

Які ключові компоненти згорткової нейронної мережі (CNN) та їхні відповідні ролі в задачах розпізнавання зображень?

Інші останні запитання та відповіді щодо Свертові нейронні мережі в TensorFlow:

Більше питань і відповідей:

Право на участь у Академії EITCA 80% підтримки EITCI DSJC