Stockholm Waterfront 23-24 november 2020

Näe, det finns en Bob redan! Du får heta Janne Långben i stället

Innan jag börjar måste jag varna för att detta inlägg snöar in på detaljer. Huvudtemat domännamn är insnöat som det är, nu gräver jag ner mig ytterligare. Likt ryska tjocka romaner kräver detta inlägg lite förklaringar och kanske till och med ett relationsschema. Detta inlägg handlar nämligen om konsekvenser för de nya IDN-toppdomänerna som ICANN godkänner allt eftersom. Redan här känner jag på mig att jag tappar läsare.

Okej, förenklat är ICANN är den organisation som bestämmer hur det skall funka med adressering på Internet. En toppdomän är de bokstäver som befinner sig efter punkten på ett domännamn. Det kan vara .com eller .nu eller varför inte .se, du överhajjar. IDN står för International Domain Name vilket i praktiken betyder webbadresser som innehåller landsspecifika bokstäver. Den svenska domänen .se är en IDN om den exempelvis innehåller bokstäverna å, ä, eller ö, till exempel rårörda-lingon.se. Så då var det avklarat, nu kommer det snåriga.

Vi i Sverige är ju vana med adresser på Internet som inte riktigt lirar, du har säkert hört sköna hänvisningar till ”sprakradet.se”, ”malarmastarna.se” och så vidare. Ingen big deal, bara lite prickar som saknas, till och med enkelt att skriva på tangentbordet. Men det är i Sverige.

De får byta teckentabell på tangentbordet varje gång de skall skriva ”www.google.ru” vilket måste vara tokjobbigt när man tänker efter

Det finns ju språk som innehåller helt andra tecken, till exempel ryska, arabiska eller varför inte kinesiska. Hur gör de när de skall gå in på Google när de saknar de rätta tangenterna på tangentbordet? Jo, de får byta teckentabell på tangentbordet varje gång de skall skriva ”www.google.ru” vilket måste vara tokjobbigt när man tänker efter.

Och det hjälper ju inget alls att delar av domännamnet till exempel är på ett annat språk när man måste byta för att skriva klart adressen (exempel www.икеа.com). Helt värdelöst. Det går heller inte att kommunicera, ”gå in på tecken-tecken-tecken-punkt, byt tangentbord, tecken-tecken-tecken, byt tillbaka tangentbord och fortsätt med punkt och tecken-tecken”, ja, du ser ju, det blir ju galet.

Om vi tar enbart kyrilliska alfabetet som exempel så berör det i runda slängar 300 miljoner människor i 17 länder

Hur många är det som måste hålla på och switcha tangentbord hela tiden? Om vi tar enbart kyrilliska alfabetet som exempel så berör det i runda slängar 300 miljoner människor i 17 länder. Mm, ni fattar att Internet kanske inte är samma sköna ”World Wide Web” överallt.

Det är nu ICANN-grabbarna kommer in i matchen igen. De har nu beslutat att hjälpa dessa länder med detta teckenhandikapp på Internet genom att tillåta länderna att ha sina egna tecken i hela adressen. Detta innebär ju att 300 miljoner tangentbordsbytare slipper byta tangentbord utan kan skriva med sitt eget språk överallt. Vilken revolution!

Detta skapar problem på Internet för då kan man lura användaren att adressen de klickade på i verkligheten går någon annanstans

Men… allt är inte riktigt så lyckligt. Det kyrilliska alfabetet innehåller nämligen bokstäver som liknar de vanliga bokstäverna (så kallad homoglyph och förekommer i kyrilliska, grekiska, armeniska, hebreiska), ibland identiska och ofta med en annan betydelse. Visst är det lurigt? Jupp, och värre blir det. Detta skapar problem på Internet för då kan man lura användaren att adressen de klickade på i verkligheten går någon annanstans.

Ryssland har toppdomänen .ru. Om man översätter detta till ryska blir .ру (р betyder r och у betyder u), men den kan de ju inte få tycken ICANN för den är ju för lik Paraguays toppdomän .py. Eller varför inte ta ett färskt exempel, Bulgarien har toppdomänen .bg men fick avslag då den bulgariska varianten .бг krockar med Brasiliens toppdomän .br, ja ni fattar nu.

Det är en styggelse att blanda bokstäver från olika teckentabeller i ett domännamn som förekommer, där kunde väl ICANN vara tydligare

Personligen tycker jag inte att man skall ta hänsyn till förväxlingar i domännamn. Om domännamnet är på ett annat språk så är det. Det vore ju som att Canon skulle varumärkesskydda sapop i Ryssland bara för att om man skriver sapop (сапоп) på ryska det ser ut som canon men det står inte det. Däremot tycker jag att det är en styggelse att blanda bokstäver från olika teckentabeller i ett domännamn som förekommer, där kunde väl ICANN vara tydligare tänker jag. Ett relativt uttjatat exempel detta ämne är domännamnet paypal.com (se artikel) där man just har blandat teckentabeller.

Hur har alla dessa människor i 17 länder som har kyrilliska alfabetet registrerat domännamn med ett annat alfabet hitintills? Jo, nu kommer det det lustiga, vi tar exemplet med det ryska ordet ”varumärke” som skrivs ”марка”, ordet kan ju skrivas så att det ser ut som ryska fast med latinska tecken ”mapka”.

Och då kan ju ryssarna registrera domännamnet mapka.ru som lättare kan kommuniceras, men pågår verkligen detta? Jomen visst. Och detta betyder att det finns en stor grupp domännamn i dessa länder och på respektive toppdomäner, dessa är ju redan idag förväxlingar eller hur? Tänkte grabbarna på ICANN på detta eller är det jag som missat något?

Klart jag missade en detalj. Detta med IDN-toppdomäner kanske inte alls är ett stort problem överhuvudtaget då användarnas beteenden förändras ständigt. Idag används sökmotorer i större och större utsträckning för att hitta till webbplatser man redan vet adressen till. Men då förstår jag inte alls varför man inte tekniskt skulle kunna skilja på två olika teckentabeller vid en sökning eller ännu bättre: identifiera dessa i webbläsaren?

Bild: Wikimedia Commons