Kodowanie polskich znaków

Programy komputerowe nie mogą poprawnie zinterpretować tekstu, jeśli nie znają metody jego kodowania. Najbardziej jest to widoczne w przypadku polskich znaków diakrytycznych, które zostaną błędnie wyświetlone, jeśli program próbujący je wyświetlić nie użyje odpowiedniego kodowania. Są różne metody kodowania tekstu i przy pisaniu stron WWW będzie trzeba wybrać i ustawić odpowiednią.

Unicode

Unicode jest uniwersalnym zbiorem znaków obejmującym praktycznie wszystkie używane rodzaje pisma i symbole. Istnieje kilka sposobów zapisu znaków Unicode (dostosowanych bardziej dla pism europejskich lub azjatyckich). W Internecie, dla języka polskiego, najodpowiedniejsza jest wersja UTF-8.

Unicode jest oczywistym zwycięzcą wśród standardów kodowania tekstu i polecamy go, jeśli Twój edytor potrafi go obsłużyć.

Norma ISO i Windows code-page

Starsze metody kodowania obejmują tylko zestawy kilkuset znaków. Przez to ograniczenie powstało ich bardzo wiele. Polskie znaki zawiera kodowanie ISO-8859-2, inaczej zwane ISO-Latin-2 (albo prześmiewczo izolatka).

Polska wersja Windows nie trzyma się normy ISO i używa własnego kodowania nazywanego Win1250 (lub cp1250). Jego stosowanie w Internecie, jak każde łamanie standardów, jest niemile widziane, dlatego polecamy użyć edytora, który potrafi zapisywać pliki używając UTF-8 lub ISO-8859-2.

Gdzie ustawić kodowanie?

W dwóch miejscach: edytorze tekstuw kodzie strony WWW. Jeśli jedno i drugie ustawienie nie będzie się zgadzać, to tekst zostanie wyświetlony nieprawidłowo. Jeśli nie wiesz jak ustawić kodowanie w edytorze, zerknij do jego instrukcji. Jeśli nie ma takiej opcji, to edytor najprawdopodobniej używa kodowania Win1250.

Konwersja kodowania znaków na UTF-8

Jeżeli posiadasz gotowe, statyczne pliki do wysłania na serwer, posiadające złe kodowanie — skonwertuj je. Do dalszego zapisywania skonwertowanych już stron będziesz potrzebować edytora obsługującego UTF-8.

Stosowana tutaj porada dotyczy programu Gżegżółka konwertującego kodowania różnych plików (.html, .txt itp.) . Koniecznie stosuj go gdy używasz Win1250 na swoich stronach.

  1. Najpierw odznacz checkbox „Twórz kopię zapasową” w menu Narzędzia — Opcje
  2. Alt+G żeby dodawać katalogi do konwersji
  3. Zaznacz „Wyszukuj uwzględniając podfoldery”
  4. Dodaj potrzebne Tobie maski
  5. Gdy powrócisz do głównego okna ustaw docelowe kodowanie znaków i wciśnij Start
Okno z dodawaniem katalogów do konwersji Okno główne Gżegżółki XP

Zmodyfikowano: 21.08.2009, 12:58
submit