Bohaterem kolejnego odcinka Poradnika są daszki, akcenty, ogonki i inne zawijasy, które można znaleźć w adresie www. Mówiąc krótko, bierzemy pod lupę domeny IDN.
|
Spis treści: Ile znaków może mieć domena IDN? W jakich rozszerzeniach można używać polskich znaków? |
Zacznijmy od rozszyfrowania nazwy. IDN to skrót od angielskiego określenia Internationalized Domain Name czyli - w wolnym tłumaczeniu - nazwy domen ze znakami narodowymi.
Z technicznego punktu widzenia, domeny IDN to adresy internetowe zawierające znaki spoza kodu ASCII, czyli te litery i cyfry, których nie znajdziemy na standardowej klawiaturze. Rejestrując taką domenę możemy w swoim adresie użyć liter z alfabetów narodowych, np. polskich ż, niemieckich ä, czy czeskich ž.
Lista języków, w których można rejestrować domeny IDN stale się wydłuża i obejmuje nie tylko alfabety pochodzące od alfabetu łacińskiego. Poniżej znajduje się lista przykładowych domen IDN. W większości nowych przeglądarek po kliknięciu powinny wyświetlać się prawidłowo:
http://bücher.eu (jęz. niemiecki)
http://مثال.إختبار/ (jęz. arabski)
http://παράδειγμα.δοκιμή (jęz. grecki)
http://בײַשפּיל.טעסט (jęz. hebrajski)
http://例え.テスト/ (jęz. japoński)
Wprowadzenie tak dużej różnorodności znaków do systemu DNS byłoby trudne, dlatego domeny IDN są „tłumaczone" na siedmiobitowy kodu ASCII. To, co widzimy w pasku adresu jako adres śląsk.eu, przeglądarka odczytuje następująco: xn--lsk-ipa24b.eu. Domeny IDN są identyfikowane dzięki prefiksowi xn--. Jest to informacja dla przeglądarki, że adres zawiera znaki spoza kodu ASCII.
Wchodząc na stronę Krajowego Rejestru Domen możemy sprawdzić jak wybrana domena będzie wyglądać po konwersji do ASCII. Dzięki temu można w łatwy sposób linkować adresy stron internetowych zapisane w egzotycznych alfabetach. Przeglądarki interpretują obydwa sposoby zapisu. Nieważne czy w pasku adresu wpiszemy xn-lsk-ipa24b.eu czy śląsk.eu. Za każdym razem trafimy na tę samą stronę.
Nowe znaki dostępne w adresach www to nie tylko ułatwienie dla sporej grupy internautów, ale i okazja do nadużyć. Wszystko dzięki homografom. Są to litery z dwóch różnych alfabetów, które wyglądają bardzo podobnie do siebie. Przez to mogą być używane przez cyberprzestępców, którzy rejestrują domeny łudząco podobnych do adresów znanych stron internetowych, np. banków.
Przykładowy homograf:
Litera pisana cyrylicą: a (numer Unicode 0430)
Litera łacińska: a (numer Unicode 0061)
System DNS pozwala na rejestrowanie adresów o długości maks. 63 znaków (nie licząc przedrostka „www." oraz rozszerzenia, np. .com). Ten limit dotyczy również domen IDN, ale zapisanych po konwersji do ASCII. Wracając do przykładu ze śląską domeną, to co dla osób znających język polski wydaje się adresem zbudowanym z 5 znaków, w systemie DNS będzie liczone jako domena 14-znakowa:
slask.pl - zawiera 5 znaków
śląsk.pl - zawiera 14 znaków: xn-lsk-ipa24b.pl
domeny polskie: .pl, .com.pl i inne funkcjonalne oraz regionalne
domeny niemieckie .de
domeny .com
domeny .eu
domeny .net
domeny .tel
Najstarsze domeny .pl z polskimi ogonkami we wrześniu 2011 skończą 8 lat. Pomimo to, większość internautów wciąż jest przyzwyczajona do pomijania polskich liter przy wpisywaniu adresu strony. Dobrze widać to po wynikach eksperymentu, który przeprowadził autor bloga DNZ.pl. Adresy IDN mają mniejszy ruch bezpośredni niż ich odpowiedniki bez polskich znaków.
Dlatego najlepszym rozwiązaniem jest traktowanie domen z polskimi znakami jako uzupełnienia głównego adresu strony. O rejestracji domeny IDN powinni pomyśleć przede wszystkim właściciele witryn, które w swojej nazwie mają polskie znaki. Przykładowo, prowadząc sklep internetowy pod adresem CzesciSamochodowe.pl dobrym rozwiązaniem jest dodatkowo zarejestrować domenę CzęściSamochodowe.pl. Ta reguła obowiązuje również w przypadku tworzenia nowej strony.
Zabezpieczenie wersji IDN domeny ma dwie zasadnicze zalety:
1. internauci, którzy jednak wpiszą adres z polskimi znakami trafią na naszą stronę
2. unikniemy ryzyka, że ktoś zarejestruje domenę łudząco podobną do adresu naszej strony i będzie się pod nią podszywał
Z powodu nawyków polskich internautów, o których wspomnieliśmy powyżej, wciąż nie można traktować domen IDN jako zamiennika adresu pisanego bez polskich znaków. Wróćmy do przykładu ze sklepem z częściami samochodowymi.
Szukamy dobrego adresu i okazuje się, że domena CzesciSamochodowe.pl jest zajęta przez kogoś innego. W tej sytuacji zbudowanie strony pod domeną CzęściSamochodowe.pl będzie złym pomysłem. Promując nasz sklep robimy prezent właścicielowi domeny bez polskich znaków. Wielu potencjalnych klientów nie będzie wiedziało lub nie zwróci uwagi na to, że należy wpisać ę i ś w pasku adresu przeglądarki.
Jedyne co nam pozostaje w takim przypadku to zarejestrowanie innego adresu lub odkupienie domeny bez polskich znaków, jeżeli jest to możliwe.
Złym pomysłem jest również rejestrowanie wersji IDN adresów znanych serwisów. Przyczyna jest prosta - taką domenę można bardzo łatwo stracić. Dobrą ilustracją jest przypadek domeny świstak.pl. Przez pewien czas pod tym adresem można było znaleźć reklamy i linki do stron erotycznych.
Spółka Swistak.pl wniosła skargę do Sądu Polubownego ds. Domen Internetowych, wygrała sprawę i odzyskała domenę. Dziś obydwie wersje prowadzą do strony znanego portalu aukcyjnego.
|
W poprzednich odcinkach Poradnika: |
Czwartek, 19 Maja 2011