DOI: https://doi.org/10.30564/fls.v6i5.7144 Received: 24 August 2024 | Revised: 4 September 2024 | Accepted: 14 September 2024 | Published Online: 6 November 2024
Abstract
The belief that English is and will remain largely dominant as the first language of the Internet in terms of content and is the natural lingua franca in cyberspace plays against the mobilization of human and funding resources to incorporate minority languages. We sustain that this belief stands on biased data and that multilingualism is more and more the nature of the Internet and translation its lingua franca. We challenge the validity of a source widely used, since 2011, to state that English represents a steady percentage of web contents over 50%. This business source, W3Techs, is well-famed and considered reliable for its surveys on web technologies, exploring a large sample of the Web. However, languages differ from other web technologies, in the fact than more than one language could be used on a website. Not taking into account the multilingual nature of the Web is a serious bias that leads to major errors. The study of the rate of multilingualism of the sample of websites used by W3Techs concludes that the percentage of English contents on the Web is within a 20%–30% range, a value coherent with the results from three referenced alternative methods. We plan for 2025 to create a tool for measurement of languages and rate of multilingualism in a series of websites, with thorough attention to list all the languages used within a website, a complex matter. This tool will be applied to the same sampling and should close definitively this matter.
Keywords:
Biases; Languages in the Web; Multilingualism; English; Lingua FrancaRésumé (via DeepL)
La conviction que l'anglais est et restera largement dominant en tant que première langue de l'internet en termes de contenu et qu'il est la lingua franca naturelle dans le cyberespace joue contre la mobilisation des ressources humaines et financières pour incorporer les langues minoritaires. Nous soutenons que cette croyance repose sur des données biaisées et que le plurilinguisme est de plus en plus la nature de l'Internet et la traduction sa lingua franca. Nous contestons la validité d'une source largement utilisée, depuis 2011, pour affirmer que l'anglais représente un pourcentage constant de plus de 50 % des contenus web. Cette source commerciale, W3Techs, est bien connue et considérée comme fiable pour ses enquêtes sur les technologies du web, explorant un large échantillon du web. Toutefois, les langues diffèrent des autres technologies web, dans la mesure où plus d'une langue peut être utilisée sur un site web. Ne pas prendre en compte la nature multilingue du web est un grave biais qui conduit à des erreurs majeures. L'étude du taux de multilinguisme de l'échantillon de sites web utilisé par W3Techs conclut que le pourcentage de contenus en anglais sur le web se situe dans une fourchette de 20 à 30 %, une valeur cohérente avec les résultats de trois méthodes alternatives référencées. Nous prévoyons pour 2025 la création d'un outil de mesure des langues et du taux de multilinguisme dans une série de sites web, avec une attention particulière pour répertorier toutes les langues utilisées dans un site web, ce qui est complexe. Cet outil sera appliqué au même échantillonnage et devrait clore définitivement cette question.
Mots clés :
Biais ; Langues sur le Web ; Multilinguisme ; Plurilinguisme, Anglais ; Lingua Franca