Машинне навчання. Термінологія
Підкатегорії машинного навчання
- Контрольоване навчання
- Навчання без нагляду
Контрольоване машинне навчання використовує набір вхідних змінних для прогнозування значення вихідної змінної.
Машинне навчання без контролю використовує шаблони з будь-якого непозначеного набору даних, намагаючись зрозуміти шаблони (або групи) у даних.
Фази машинного навчання
Машинне навчання складається з двох основних фаз:
1. Навчання:
Вхідні дані використовуються для розрахунку параметрів моделі.
2. Висновок:
"Навчена" модель виводить правильні дані з будь-якого введення.
Моделі машинного навчання
Модель визначає зв’язок між міткою (y) і функціями (x).
У житті моделі є три етапи:
- Збір даних
- Тренінг
- Висновок
Тренінг машинного навчання
Мета тренінгу — створити модель, яка може відповісти на запитання. Наприклад, яка очікувана ціна будинку?
Висновок машинного навчання
Висновок — це коли навчена модель використовується для висновку (прогнозування) значень за допомогою поточних даних. Наприклад, запустити модель у виробництво.
Контрольоване навчання
Контрольоване навчання використовує мічені дані (дані з відомими відповідями), щоб навчити алгоритми:
- Класифікація даних
- Передбачення результатів
Контрольоване навчання може класифікувати такі дані, як "Що таке спам в електронній пошті", на основі відомих прикладів спаму.
Контрольоване навчання може передбачити результати, наприклад передбачити, яке відео вам подобається, на основі відео, які ви відтворили.
Навчання без нагляду
Неконтрольоване навчання використовується для передбачення невизначених зв’язків, як-от значущих шаблонів у даних.
Йдеться про створення комп’ютерних алгоритмів, які можуть самі вдосконалюватися.
Очікується, що машинне навчання зміниться на навчання без нагляду, щоб програмісти могли розв’язувати проблеми без створення моделей.
Навчання з підкріпленням
Навчання з підкріпленням базується на неконтрольованому навчанні, але отримує зворотний зв’язок від користувача незалежно від того, чи є рішення хорошими, чи поганими. Зворотній зв’язок сприяє вдосконаленню моделі.
Самоконтрольоване навчання
Самоконтрольоване навчання схоже на неконтрольоване навчання, оскільки воно працює з даними без доданих людиною міток.
Різниця полягає в тому, що неконтрольоване навчання використовує кластеризацію, групування та зменшення розмірності, тоді як самоконтрольоване навчання робить власні висновки для завдань регресії та класифікації.
Ключові термінології машинного навчання:
- Відносини
- Мітки
- Функції
- Моделі
- Навчання
- Висновок
Відносини
Системи машинного навчання використовують зв’язки між вхідними даними для створення прогнозів.
В алгебрі відношення часто записують як y = ax + b:
- y – це мітка, яку ми хочемо передбачити
- a – нахил лінії
- x – це вхідні значення
- b – перехоплення
У МН зв’язок записується як y = b + wx:
- y – це мітка, яку ми хочемо передбачити
- w – вага (нахил)
- x – це характеристики (вхідні значення)
- b – перехоплення
Мітки машинного навчання
У термінології машинного навчання мітка — це те, що ми хочемо передбачити.
Це схоже на y на лінійному графіку:
Алгебра | Машинне навчання |
y = ax + b | y = b + wx |
Функції машинного навчання
У термінології машинного навчання функції — це вхідні дані.
Вони схожі на значення x на лінійному графіку:
Алгебра | Машинне навчання |
y = ax + b | y = b + wx |
Іноді може бути багато ознак (вхідних значень) з різною вагою:
y = b + w1x1 + w2x2 + w3x3 + w4x4