Kodowanie polskich znaków i języka strony
Standard kodowania znaków UTF-8
UTF-8 to uniwersalny standard kodowania znaków, który umożliwia prawidłowe wyświetlanie polskich znaków diakrytycznych (ą, ć, ę, ł, ń, ó, ś, ź, ż) oraz znaków z innych języków.
Rekomendowany do stosowania w nowoczesnych dokumentach HTML i systemach internetowych oraz gwarantujący kompatybilność z ASCII.
Jak ustawić UTF-8 w HTML
Najważniejszym krokiem jest dodanie w sekcji <head> pliku HTML deklaracji:
<meta charset="utf-8">
Powinna się ona znajdować w pierwszych linijkach kodu <head>, aby przeglądarka mogła poprawnie odczytać kodowanie przed renderowaniem tekstu.
Określenie języka strony
W elemencie <html> ustaw parametr odede>lang="pl", aby wskazać, że strona jest w języku polskim. Pomaga to przeglądarkom i narzędziom wspomagającym dostępność (np. czytnikom ekranu).
<html lang="pl">
Praktyczne porady
- Zawsze używaj UTF-8 zamiast starszych kodowań jak ISO-8859-2, aby uniknąć problemów z literami.
- Plik HTML musi być zapisany w UTF-8 (konfiguracja edytora lub IDE).
- Unikaj wpisywania polskich znaków w formie encji HTML (np. ą) jeśli możliwe jest wstawienie ich bezpośrednio w UTF-8.
Przykładowy szkielet strony z polskim kodowaniem
<!DOCTYPE html> <html lang="pl"> <head> <meta charset="utf-8"> <title>Przykład kodowania UTF-8</title> </head> <body> <p>Zażółć gęślą jaźń</p> </body> </html>
Ćwiczenia praktyczne
<!DOCTYPE html> <html lang="pl"> <head> <meta charset="utf-8"> <title>Test UTF-8</title> </head> <body> <p>Przykładowy tekst z polskimi znakami: ąćęłńóśźż</p> </body> </html>
Quiz — Sprawdź wiedzę
<meta charset="iso-8859-2">
<html lang="de">
Bo jest kompatybilne z ASCII
Podsumowanie
Kodowanie UTF-8 jest niezbędne dla poprawnej obsługi polskich liter i międzynarodowej kompatybilności stron WWW. Podstawowy sposób to deklaracja <meta charset="utf-8"> w nagłówku oraz ustawienie języka w <html lang="pl">.
Za pomocą tych ustawień unikniemy problemów z wyświetlaniem polskich znaków i zwiększymy dostępność strony.