Budowanie stron WWW

Podczas budowania chińskiej strony internetowej, webmaster na pewno napotka rożne problemy związane zarówno z kulturą jak i techniką. Na przykład z całą pewnością można powiedzieć, że chińskich gust dotyczący wyglądu strony internetowej nie jest taki sam jak europejski czy amerykański. Nie ma wątpliwości, że najważniejsza różnica mieści się w skrypcie, który wymaga całkowicie innego kodowania niż strony internetowe używające liter romańskich.

Kodowanie – teoria

Teksty, które zostały napisane za pomocą komputera są oparte na dwóch podstawowych jednostkach, bity i bajty. Bity mogą mieć postać 1 lub 0. osiem bitów stanowi jeden bajt. Czyli jeden bajt jest w rzeczywistości liczbą składająca się z ośmiu cyfr 0 i 1 (przykład 01110101). 0 i 1 mogą stworzyć aż 256 kombinacji ośmiocyfrowych liczb. Stąd jest 256 różnych bajtów. Jeden bajt odpowiada jednemu znakowi zarówno literze jak i znakowi specjalnemu ą , ó lub ć.

Międzynarodowa Organizacja Normalizacyjna uporządkowała 256 znaków po przez stworzenie tabeli ISO-8859-1. Tabela ta jest uznawana w całej europie i zawiera wszystkie powszechne znaki używane w europie: Alfabet, Niemieckie Umlaut, Francuskie znaki akcentowe, hiszpańskie znaki z tyldą jak i znaki używane w biznesie i w języku naukowym. W tabeli tej wszystkie dokładne informacje dotyczące konkretnego bajta nie są zawarte, zamiast tego tylko zawiera tylko skróconą wersje. Na przykład bajt zawierający ciąg 01100001 został przydzielony do liczby 97 , która z kolei została ustalona jako Kod litery „a” (01100001 = 97 = a).

Jednak tabela ISO 8859-1 nie jest jedyną tabelą. Istnieją także tabele MS-DOS-Code i Windows-Code. Mimo, że różne tabele mogą zwierać te same znaki, do których różne kodowanie mogłoby zostać przydzielone, mogą zawierać także rożne znaki. MS-DOS i Windows działają z innymi znakami. Dlatego istnieją całkowicie różne tabele, których użycie zależy od znaków, które mają być użyte i ich przeznaczenia.

Praca Webmastera nie rożni się niczym od przedstawionej powyżej. Pierwszym krokiem zdefiniowanie w kodzie źródłowym, która tabela będzie używana. W tym wypadku tabela zawierająca kodowanie chińskich znaków. W ten sposób przeglądarka będzie wiedzieć które kodowanie użyć aby wyświetlić poprawnie odpowiedni znak.

Kodowanie – konwersja

Obecnie uwzględniają język chiński należy wyróżnić klasyczny i nowoczesny chiński. Klasyczne znaki są powszechnie używane w Hong Kongu i na Tajwanie, natomiast chińczycy na lądzie stałym używają uproszczonych znaków. Dlatego też jest rzeczą jasną, potrzebują dwóch wersji tabeli kodów. Big5 jest najpopularniejszą tabelą tradycyjnych znaków, natomiast GuoBiao 2312 (BG) stał się najbardziej rozpoznawalnym kodem dla uproszczonych znaków.

Istnieje jeszcze jedna popularna – Unicode. Opiera się na zasadzie innej niż wspomniana powyżej. Zawiera większość języków świata w jednej tylko tabeli kodów zawierającej także kodowanie dla klasycznego i uproszczonego chińskiego. Unicode staje się coraz bardziej popularny. Ponieważ obecnie nie wszystkie przeglądarki obsługują ten kod, trzeba ciągle używać Big5 i BB.

Użytkownik może sam zadecydować, który kod przeglądarka obsługuj po przez dostosowanie ustawień przeglądarki. Jakkolwiek większość przeglądarek może ustalić używany kod automatycznie jeżeli tylko webmaster zamieścił odpowiednie informacje w tekście źródłowym odnośnie które kodowanie ma być użyte. Zrobić to można przez wstawienie meta-tag pomiędzy <head> i <⁄head> Następnie:<META HTTP-EQUIV=”content-type” CONTENT=”text/html;charset=charset_name”>.

Za charset_name należy wstawić nazwę tabeli kodów np. gb2312 or big5.

Budując europejską stronę internetową jest dość powszechnym adaptowanie czcionki (font style) za pomocą font tagu. Nie jest to polecane kiedy style css będą używane dla strony europejskiej i jej chińskiej wersji. Może to doprowadzić to sytuacji kiedy czcionka nie będzie rozpoznawać chińskich znaków. Internet Explorer zmieni czcionkę na inna natomiast inne przeglądarki wyświetlą ciąg kwadratów.

W przeszłości aczkolwiek również obecnie ale tylko na Tajwanie, Chiński był pisany pionowo. Oznacza to ze czytało się go od prawej do lewej, ale od góry do dołu. Od czasu Internet Explorer 5.5, stało się możliwym przedstawienie chińskiego w pionowej formie nawet w Internecie.

Jeżeli webmaster chce użyć programu do budowania stron np. Dreamweaver będzie mógł dostosować kodowanie odpowiedzialne za pisanie i wyświetlanie zawartości strony bezpośrednio w ustawieniach. W Dreamweaver ta opcja powinna być dostępna tutaj:
Modify -> site’s properties -> Title/coding.

O to kilka przykładów popularnych chińskich stron:

Leave a Reply