НАЙКРАЩИЙ САЙТ ДЛЯ ВЕБ-РОЗРОБНИКІВ

HTML Набори символів

HTML Набір символів HTML ASCII HTML WIN-1252 HTML ISO-8859 HTML Символи HTML UTF-8

HTML UTF-8

Latin Основний Latin Додатковий Latin Розширений A Latin Розширений B Модифіковані літери Діакритичні мітки Грецька і коптська мови Кирилична основна Кирилична додаткова

HTML Символи

Загальна пунктуація Валютні символи Букви подібні до символів Стрілки Математичні оператори Блокові малюнки Блокові елементи Геометричні фігури Різні символи Дінгбати Емодзі Емодзі смайли Емодзі скінтони

HTML Сутності

HTML4 Сутності HTML5 Сутності A HTML5 Сутності B HTML5 Сутності C HTML5 Сутності D HTML5 Сутності E HTML5 Сутності F HTML5 Сутності G HTML5 Сутності H HTML5 Сутності I HTML5 Сутності J HTML5 Сутності K HTML5 Сутності L HTML5 Сутності M HTML5 Сутності N HTML5 Сутності O HTML5 Сутності P HTML5 Сутності Q HTML5 Сутності R HTML5 Сутності S HTML5 Сутності T HTML5 Сутності U HTML5 Сутності V HTML5 Сутності W HTML5 Сутності X HTML5 Сутності Y HTML5 Сутності Z

HTML Набори символів. Уроки W3Schools українською для початківців

En

HTML Набори символів


Щоб HTML сторінка відображалась коректно, браузер має знати, який набір символів (кодування) використовується:

Приклад

<meta charset="UTF-8">

HTML Набори символів

Специфікація HTML5 заохочує веброзробників використовувати набір символів UTF-8!

Так було не завжди. Кодування символів для раннього Інтернету було ASCII.

Пізніше, від HTML 2.0 до HTML 4.01, ISO-8859-1 вважався стандартним набором символів.

Починаючи з XML та HTML5 нарешті з’явився UTF-8 і вирішив багато проблем із кодуванням символів.


На початку: ASCII

Комп’ютерні дані зберігаються в електроніці як двійкові коди (01000101).

Для стандартизації зберігання тексту було створено Американський стандартний код для обміну інформацією (ASCII). Він визначив унікальне двійкове число для кожного символу, який можна зберегти, щоб підтримувати числа від 0 до 9, верхній і нижній регістри алфавіту (a-z, A-Z), а також спеціальні символи, такі як ! $ + - ( ) @ < > , .

Оскільки ASCII використовував 7 біт для символу, він міг представляти лише 128 різних символів.

Найбільшою слабкістю ASCII було те, що він виключав неанглійські літери.

ASCII все ще використовується сьогодні, особливо у великих мейнфреймах.

Для ближчого ознайомлення, перейдіть на Повний ASCII Довідник.


В Windows: Windows-1252

Windows-1252 був стандартним набором символів у Windows, аж до Windows 95.

Це розширення ASCII із додаванням міжнародних символів.

Він використовує повний байт (8 біт) для представлення 256 різних символів.

Оскільки Windows-1252 була стандартною в Windows, вона підтримується всіма браузерами.

Для ближчого ознайомлення, перейдіть на Повний Windows-1252 Довідник.


В HTML 4: ISO-8859-1

У HTML 4 найчастіше використовувався набір символів ISO-8859-1.

ISO-8859-1 є розширенням ASCII із доданими міжнародними символами.

Приклад

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">

У HTML 4 набір символів, відмінний від ISO-8859-1, можна вказати в <meta> тегу:

Приклад

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Усі процесори HTML 4 також підтримують UTF-8:

Приклад

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">

Коли браузер виявляє ISO-8859-1, він зазвичай використовує Windows-1252, оскільки Windows-1252 має ще 32 міжнародні символи.

Для ближчого ознайомлення, перейдіть на Повний ISO-8859-1 Довідник


В HTML5: Unicode UTF-8

Специфікація HTML5 заохочує веброзробників використовувати набір символів UTF-8.

Приклад

<meta charset="UTF-8">

Набір символів, відмінний від UTF-8, можна вказати в <meta> тегу:

Приклад

<meta charset="ISO-8859-1">

Консорціум Unicode розробив стандарти UTF-8 і UTF-16, оскільки набори символів ISO-8859 обмежені та несумісні з багатомовним середовищем.

Стандарт Unicode охоплює (майже) усі символи, розділові знаки та символи у світі.

Всі HTML5 та XML процесори підтримують UTF-8, UTF-16, Windows-1252 та ISO-8859.

Для кращого ознайомлення перейдіть на Повний Unicode Довідник.