UTF-8 (8-Bit Unicode Transformation Format) ist ein Standard zur Codierung von Zeichen, der fast alle im Internet verwendeten Sprachen und Zeichensätze unterstützt. Bei HTML-Dokumenten wird UTF-8 oft als Zeichencodierung verwendet, da es eine breite Palette von Zeichen und Symbolen unterstützt.
Wenn eine Webseite mit UTF-8 codiert ist, kann sie Zeichen aus vielen verschiedenen Sprachen und Symbolsets beinhalten, einschließlich solche mit Akzenten und Sonderzeichen. Dies ist besonders wichtig für mehrsprachige Websites und Websites, die Information in verschiedenen Schriften darstellen müssen.
In HTML kann die Verwendung von UTF-8 im Meta-Tag des Headers angegeben werden:
Dies informiert den Browser darüber, dass der folgende Inhalt mit der UTF-8-Zeichencodierung interpretiert werden soll.