Un symposium sur le multilinguisme était organisé la semaine dernière à Genève. De quoi prendre pleine conscience des problèmes auxquels se heurtent tous ces Internautes pour qui l'Anglais c'est… du chinois.
Du 9 au 11 mai s’est tenu à Genève un symposium UIT-Unesco sur le multilinguisme dans l’Internet. Situé en-dehors du processus SMSI-FGI il s’agissait de faire le point sur les problèmes soulevés par les locuteurs des langues non latine dans le monde. Chantal Lebrument, la responsable Internet du Groupe Safran, y était. Elle nous le raconte en nous faisant prendre conscience que l'Anglais ainsi que les limites du jeu de caractères ASCII constituent, pour beaucoup de gens dans le monde, une barrière quasi insurmontable à l'utilisation d'Internet.
Au menu de ce symposium : normes, standards et expériences menées par les pays et une découverte de ce qui est en cours de déploiement. Dès le début certaines certitudes ont été ébranlées dont celle du mythe de la prédominance de l’anglais sur la toile passé de 75% en 1998 à 45% en mars 2005 [1]. Ce ne sont pas les contenus anglophones qui ont diminués, mais ceux en langue locale qui ont totalement explosés. La langue, vecteur d’un système de valeur et d’identité… pour des contenus culturels certes mais il est bien connu que la langue du business, c’est l’anglais.
Dès l’ouverture, la représentante de l’Unesco enfonce le clou et rappelle que l’Internet est un instrument politique et commercial majeur, "lire un contenu dans sa langue est un facteur essentiel dans la prise de décision."
Un coréen a besoin de deux claviers pour utiliser Internet.
Mais les difficultés courantes ne sont rien comparées à celles rencontrées par les peuples utilisant des alphabets non latins. "Ah bon, c’est compliqué ?" demande un américain à un coréen. Ben, c’est juste qu’il faut sélectionner un clavier en ASCII pour taper l’URL et un autre clavier en coréen pour l'écrire !
Et le système des IDN vanté par l'ICANN est encore pire puisqu’il faut utiliser les deux claviers pour écrire une URL qui mixe les caractères locaux et ASCII.
Que dire de la langue arabe ou hébreu qui s’écrivent de droite à gauche ? Ce n’est pas une minorité que l’on peut facilement négliger, les caractères sur Internet étant identiques pour les langues arabes, farsi et urdu… cela fait près d’un milliard de locuteurs !
Six langues officielles en Suède.
Les auditeurs n’étaient pas au bout de leurs surprises en découvrant le cas de la "langue suédoise". La Suède à six langues officielles, les trois premières étant le finnois, le medinkiéli et le romani, le suédois n’arrivant qu’en sixième position après le yiddish, dans le peloton des "langues minoritaires", à égalité avec le farsi et l’arabe.
Le droit suédois oblige les institutions à tenir compte de ce multilinguisme, les bibliothèques devant avoir des sections pour chacune de ces langues. On comprend mieux pourquoi un des serveurs maîtres de l’Internet est implanté à Stockholm…
Mais la plus grande surprise de ce symposium c’est que l’on s’attendait à un frémissement d’une fragmentation de l’Internet. Ce fut le constat d’un mouvement irréversible de création d’Intranets locaux touchant tous les continents. La Chine, on s’y attendait, mais les chiffres sont renversants : 98% de contenus en mandarin au 31/12/05 pour 70% d’URL en langue locale. On parle d’une "résolution locale", cela évite de parler de racine alternative mais c’est vraiment pour la forme.
L’ensemble des Etats regroupés au sein de la Ligue Arabe est en cours d’expérimentation d’un système de "DNS Checker" permettant aux internautes arabisants de s’émanciper de la barrière d’une langue anglaise vraiment pas facile à manier. L’effet "miroir" est déroutant - tout est inversé – et les multiples orthographes possibles lors de la traduction d’un mot en arabe prêtent à confusion avec des translittérations hasardeuses.
Passage direct de l'oral à l'écran en Afrique.
Les expérimentations sont multiples, le dynamisme insufflé au SMSI a entraîné la communauté des chercheurs dans le sillage des politiciens. Le coréen Netpia (voir notre interview de Louis Pouzin sur le projet Netpia) a présenté un système ingénieux de mots-clés, simple d’utilisation, et déjà largement diffusé dans le pays. Toute la campagne présidentielle d’un candidat a été faite sur utilisant un mot-clé en coréen en guise d’URL. Ca a marché, il a été élu, largement. Le consortium NLIC se chargeant de diffuser le principe dans de nombreux territoires.
Les langues africaines ne sont pas en reste avec un étonnant travail sur la langue de Djibouti et son passage direct de l’oral à l’écran. D’autres travaux bien avancés également dans les langues swahili, japonais, cyrillic, tamoul, kirghiz, ethiopic, yiddish…
Pourtant, les travaux en cours s’appuient très largement sur des standards existants que ce soit avec les IDN (un produit jugé confus par le représentant de Verisign !) ou des mots-clés se situant au-dessus de l’URL. Bien sur, la localisation des interfaces pourrait sembler la solution idéale mais cela se heurte à des problématiques impossibles à résoudre : il faut IE7, actuellement toujours en version Beta (voir notre interview de Michel Suignard, directeur du programme Internet Explorer chez Microsoft) pour encoder en natif les IDN du code japonais… mais le Japon n’est qu’à la version 5 d’IE !
La solution UNICODE a également ses limites : en farsi et arabe on arrive au chiffre record de 12 formes possibles à déposer pour un seul nom ! Et comment faire quand le pays a un autre calendrier que le grégorien : 6 jours au lieu de 7 et 13 mois/an ??
A noter, les solutions recherchées pour le Web masquent la panne totale de l’utilisation du courriel dans les communautés linguistiques non latines. Les gens – notamment les jeunes - se retrouvent alors dans des blogs, comme en Chine, ou des applications sur mobile, au Japon.
L’interopérabilité de l’Internet sera-t-il préservé ? Cette perspective d’îlots flottants dans l’Internet mondial interpelle à peine l’ICANN, arqueboutée sur un immobilisme qui confine à l’autisme.
En conclusion de ces trois journées de symposium le président de l’UIT a suggéré que les travaux en cours soient intégrés au sein du processus en cours du FGI… parce qu’il s’agit d’un problème de gouvernance.
Retour à la case départ. Internet est vraiment devenu un champ de mines pour les américains.
[1] Les statistiques exactes ainsi que les protocoles de comptage sont à voir sur : http://funredes.org - http://dtil.unilat.org et http://www.language-observatory.org