Aujourd’hui, plus besoin de prendre des notes pendant une visio : un résumé s’écrit tout seul. Des fautes dans un SMS ? La correction automatique vous sauve… sauf quand votre téléphone transforme « Salomé » en « Salope » (true story). Mais toutes ces technologies n’existent pas – encore – en alsacien !
« Le but était de créer des outils linguistiques pour contribuer à la vie des langues régionales », explique Sam Bigeard, ingénieur de recherche à l’Inria. L’idée ? Constituer des ressources textuelles et orales pour entraîner des systèmes de reconnaissance (sous-titres automatiques) et de synthèse de la parole (quand l’ordinateur « lit » un texte).
Pour participer, rendez-vous sur le site colaf.huma-num.fr/common-voice, créez votre compte et répondez aux questions en alsacien. Vos contributions, vérifiées et transcrites par d’autres participants, rejoignent ensuite une base de données collaborative.
En deux semaines, quatre heures de données ont déjà été collectées. « Les Alsaciens se sont déjà bien prêtés au jeu ! Une dizaine d’heures peuvent suffire pour faire des systèmes qui fonctionnent. Ce n’est pas un ChatGPT alsacien, mais un outil vocal adapté aux besoins d’un public régional », assure le chercheur.
Et la bonne nouvelle ? Toutes les données collectées sont en accès ouvert, librement réutilisables par les chercheurs, les développeurs ou les passionnés de langues. En valorisant les voix de chez nous, l’Alsace montre qu’elle a plus d’un accent d’avance.
Hopla Geiss !


