Logo de l'OEP
Logo de l'OEP

Une langue de peu d’importance : que se passe-t-il lorsqu'on néglige les langues minoritaires ?

24/03/2022
Écrit par Jacqueline Rowe
Source : OpenGlobalRights

 

La plupart des grandes plateformes et services sur internet ne sont toujours disponibles ou fonctionnels que dans un petit nombres de langues géopolitiquement dominantes

 

La plupart du contenu, des services et des outils sur internet ne sont disponibles que dans une douzaine de langues au fort intérêt économique, laissant les locuteurs des langues marginalisées dans l’impossibilité de profiter de tous les avantages qu’un accès à internet peut leur offrir. Une collaboration entre les compagnies privées, les services publics et les initiatives citoyennes est urgente pour combler cette fracture linguistique digitale.


Internet et toutes les technologies qui y sont associées ont encouragé des myriades d'opportunités pour toutes les populations de la planète à produire, partager et consommer des informations et des idées. Ils reflètent aussi (et perpétuent de multiples manières) ces mêmes inégalités mondiales dans la production et l’accès au langage déjà présentes avant la révolution du numérique.


Beaucoup des technologies qui se trouvent à la base des communications sur internet (tel que les caractères Unicode, les claviers en QWERTY, les scripts informatiques et les langages de développement) ont été développées à la fois par les agences gouvernementales et les acteurs privés des états à grande puissance géopolitique et économique.


En tant que telles, ces technologies de base reflètent des choix de design faits pour des utilisateurs qui lisent de gauche à droite, parlent des langues occidentales utilisant l’alphabet latin. Ces technologies n’ont pas été conçues avec les locuteurs utilisant des alphabets ou des graphies différentes, des langues dont l’histoire est principalement orale, ou encore des langues dont l’accès requiert des paramètres particuliers.
De plus, alors qu’internet a joué peu à peu un rôle central dans notre vie professionnelle quotidienne et privée, ces mêmes états ont pu développer les infrastructures nécessaires à l’accès à internet, donner à leurs citoyens des moyens abordables pour accéder à des connections de plus en plus rapides, et ont intégré des cours d’informatique et de TIC (Technologie de l’Information et de la Communication) dans leurs programmes scolaires nationaux.


Ainsi les personnes habitant dans ces pays ont non seulement pu consommer ces contenus digitaux, mais elles ont aussi participé à l’élaboration de cet écosystème digital, et ce bien plus qu’aucun de leurs homologues des pays moins développés.

 
Les choses commencent à changer concernant l’accessibilité à internet. Aujourd’hui, 75% des cinq milliards internautes viennent des pays du Sud. Pourtant, en dépit du fait que ces régions soient le berceau de 90% des 7000 langues dans le monde, la plupart des grandes plateformes et des services ne sont disponibles que dans un petit nombre de langues géopolitiquement dominantes.


Un récent compte-rendu de Whose Knowledge, l’Oxford internet Institute et du Centre for internet and Society liste les différences linguistiques dans les interfaces des principales plateformes sur internet, dans la géographie de Google Maps et dans les écosystèmes de connaissances de Wikipédia. Les chercheurs ont démontré qu'à travers les études numériques, même les langues avec des dizaines et centaines de millions de locuteurs ont très peu de ressources en termes de volumes et de types de connaissances disponibles en ligne.


Bien que certains affirment que la plupart des internautes parlent une langue régionale ou internationale en plus de leur langue maternelle dans laquelle ils ont déjà accès à l’information, et dans laquelle ils peuvent s’exprimer, il faut tout de même préciser qu'atteindre une telle fluidité d’expression nécessite d’être exposé à la langue en question en y étant immergé ou en l’étudiant. Nombreux sont ceux de par le monde, surtout ceux qui sont les plus désavantagés dans d'autres domaines, qui n'ont accès à aucune de ces deux solutions.


De plus, l’absence de contenu digital sur internet dans les langues marginalisées entraîne l’absence de bases de données linguistiques nécessaires à mettre au point des logiciels de traitement automatique des langues comme les traducteurs en ligne , les correcteurs d’orthographe et de grammaire, et les moteurs de saisie automatique, les assistants virtuels, les réducteurs de texte, les recherches par mots clés, ou encore les dialogueurs. Ces outils d’assistances aident de plus en plus leurs utilisateurs des pays développés et utilisant une langue influente à gagner plus de temps et d’argent. Mais ces outils sont aussi vitaux dans la régulation des contenus dangereux et illicites sur les plateformes en ligne.


Et pourtant, et les outils et les bases de données, qui sont nécessaires à leur fonctionnement, n’existent pas pour ceux qui sont déjà « laissés pour comptes » de mille et une manière. Alors que ces fractures technologiques continuent de s’élargir, ce sont toujours ceux qui sont les moins susceptibles de profiter des avancées des outils d’automatisation linguistique qui paieront les pots cassés.


Ces énormes inégalités d’accès aux différents contenus, services, et systèmes de modérations se retrouvent, de plus en plus, en ligne de mire des institutions internationales. Les moyens légaux tels que la Déclaration des Nations Unies sur les Minorités et la Déclaration des Nations Unies sur les Droits des Peuples Autochtones a eu pour effet de mettre en avant les obligations en faveur de la protection et de la promotion des cultures minoritaires, y compris à travers l’éducation et le développement de nouvelles technologies.


L’un des buts du Plan d‘Action globale pour la Décennie Internationale des langues autochtones de l’UNESCO est lié à la construction d’infrastructures et de bases de données linguistiques digitales pour les langues marginalisées. Dans le même temps, l’équipe informatique du HCDH enquête sur la manière dont les Principes Directeurs relatifs aux Entreprises et aux Droits de l’Homme, énoncés par les Nations Unies s’appliquent aux entreprises technologiques, et l’obligation qu’elles ont de prendre en considération la manière dont leurs produits pourraient affecter les droits des groupes marginalisés ou dont ils exacerbent la discrimination ou contribuent à encourager la mutilation physique.


Cependant, l’écart entre théorie et mise en pratique est considérable. Nombre des pays qui ont plusieurs langues ont des ressources et des fonds limités pour atteindre ces objectifs, et beaucoup des plateformes , malgré leurs une influence globale et des budgets de plusieurs milliards de dollars, préfèrent acquérir des ressources des langues et des technologies linguistiques dont l'intérêt économique est important.
Les entreprises technologiques privées et les gouvernements ont la responsabilité de protéger les minorités, et de s’assurer que les locuteurs de ces langues puissent avoir accès aux droits qu’ouvrent les technologies numériques et internet.


À cet effet, les entreprises qui facilitent le partage d'information et de contenu en ligne doivent investir dans le développement d’infrastructures digitales et d'interfaces robustes pour toutes les langues de leurs utilisateurs et ainsi offrir des possibilités de création de contenu et de conservation des contenus en langue autochtone lorsque nécessaire. Cela pourrait inclure le soutien et l'association avec des initiatives de numérisation des langues menées et alimentées par des experts locaux. On peut citer le projet Open Speak de la O Fundation qui vise à donner aux militants linguistiques les outils et cadres nécessaires à la documentation audiovisuelle de leur langue. Une autre initiative que l'on peut aussi prendre comme exemple, c’est l’application Living dictionaries développée par The Living Tongues Institute for Endangered Languages (Institut des Langues Vivantes pour les langues menacées) qui cherche à assembler un dictionnaire numérique parcourable de l’ensemble des langues menacées de la planète.


Au niveau des États, une augmentation des fonds et des ressources dédiés à la construction de bases de données et de fonds de littératures dans ces langues marginalisées est plus que nécessaire afin d’assurer leur survie. Cela permettra aussi de poser les bases nécessaires au développement d’outils technologiques dans ces langues. Étendre et améliorer les programmes éducatifs sur les TIC pour les locuteurs de langues marginalisées est une solution plus que vitale. De la même manière, s’associer avec des agences de traduction pourrait tout compte fait se révéler être bénéfique à cet égard.


Sur le long terme, les plans d’action pour le digital (à la fois au niveau des pays et au niveau international) devraient prendre en compte et traiter les besoins spécifiques des communautés de locuteurs de langue marginalisées en matière d’accès et d’utilisation de leurs droits sur internet.

Traduit de l'anglais par Parmentier Vincent