کدگذاری نویسه ها (Charsets)
«کدگذاری نویسه ها (Charsets)» یعنی مرورگر بداند هر عدد چه حرفی است. بدون آن، متن به هم می ریزد. پس باید نویسه گان را درست مشخص کنیم.
ویژگی charset در HTML
برای نمایش دقیق، نویسه گان را با تگ «متا (meta)» تعیین کن.
<meta charset="UTF-8">
نکته: UTF-8 تقریبا همه زبان ها و نمادها را پوشش می دهد.
مجموعه نویسه ASCII
اِسکی (ASCII) استاندارد قدیمی است. فقط 128 نویسه پایه دارد. حروف لاتین، عدد و چند نشانه را دارد.
مجموعه نویسه ANSI (Windows-1252)
ANSI در ویندوز قدیمی استفاده می شد. آغازش مثل ASCII است؛ سپس چند نویسه اضافه دارد.
<meta charset="Windows-1252">
مجموعه نویسه ISO-8859-1
در HTML 4، مقدار پیش فرض ISO-8859-1 بود. 256 نویسه را پوشش می دهد.
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
<meta charset="ISO-8859-1">
چرا امروز UTF-8 بهتر است؟
UTF-8 با ASCII سازگار است. سپس تا زبان ها و نمادهای بسیار گسترش می یابد.
<meta charset="UTF-8">
گام های عملی تنظیم charset
- فایل HTML را باز کن.
- در <head> یک meta charset بگذار.
- UTF-8 را مقدار بده و ذخیره کن.
- صفحه را رفرش کن و متن را چک کن.
بخش های مرتبط: نهادها (Entities)، نمادها (Symbols)، و ایموجی ها (Emojis) برای نویسه های خاص.
جمع بندی سریع
- همیشه UTF-8 را تنظیم کن.
- meta charset در <head> باشد.
- ASCII محدود است؛ کافی نیست.
- ANSI و ISO قدیمی اند.
- UTF-8 تقریباً همه چیز را پوشش می دهد.