رمزگذاری (مجموعه کاراکترها) در HTML
برای نمایش صحیح یک صفحه HTML، مرورگر باید بداند از کدام مجموعه کاراکتر استفاده کند. این موضوع با ویژگی <meta charset>
مشخص می شود. معمولاً استفاده از UTF-8 توصیه می شود زیرا تقریباً تمام کاراکترها و نمادهای جهان را پوشش می دهد.
ویژگی charset در HTML
برای تعیین مجموعه کاراکتر در HTML کافی است از تگ متا استفاده کنید:
<meta charset="UTF-8">
نکته: در HTML5 استفاده از UTF-8
به عنوان پیش فرض توصیه می شود.
مجموعه کاراکتر ASCII
استاندارد ASCII اولین روش رمزگذاری کاراکترها بود. این استاندارد 128 کاراکتر را شامل می شد:
- حروف انگلیسی (A-Z, a-z)
- اعداد (0-9)
- برخی نمادهای خاص مانند ! $ + - @ # ?
مجموعه کاراکتر ANSI
ANSI یا Windows-1252 اولین مجموعه کاراکتر در ویندوز بود و از 256 کاراکتر پشتیبانی می کرد. نمونه کد:
<meta charset="Windows-1252">
مجموعه کاراکتر ISO-8859-1
در HTML 4، مجموعه کاراکتر پیش فرض ISO-8859-1 بود که 256 کاراکتر را پشتیبانی می کرد.
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
<meta charset="ISO-8859-1">
مجموعه کاراکتر UTF-8
UTF-8 رایج ترین استاندارد رمزگذاری در HTML است و قابلیت نمایش بیش از 10,000 کاراکتر مختلف را دارد.
<meta charset="UTF-8">
نکته: استفاده از UTF-8 باعث می شود زبان های مختلف از جمله فارسی به درستی نمایش داده شوند.
جمع بندی
برای طراحی مدرن وب همیشه توصیه می شود از UTF-8
استفاده کنید. برای آشنایی بیشتر می توانید به بخش ایموجی ها و موجودیت ها مراجعه کنید.