Neues KI-Programm übersetzt in fünf rätoromanische Idiome
Rätoromanisch hat fünf verschiedene Sprachvarianten – Sursilvan, Sutsilvan, Surmiran, Puter und Vallader –, die insgesamt von rund 100’000 Menschen gesprochen werden. Die Diversität dieser Idiome ist eine Herausforderung, wenn KI-Programme auch Rätoromanisch unterstützen sollen.
Um den Stand der Technik zu verbessern, kontaktierte die Lia Rumantscha, der Dachverband aller romanischen Sprachvereine, ein KI-Forschungsteam an der Universität Zürich. Gemeinsam haben sie nun das erste Übersetzungsprogramm entwickelt, das die fünf Idiome unterstützt. Es heisst «Alas» (rätoromanisch für ‹Flügel›) und kann Texte automatisch von Deutsch in die rätoromanischen Idiome übersetzen und zurück. Zusätzlich zu den Idiomen wird auch die Schriftsprache Rumantsch Grischun unterstützt.
Erstes Übersetzungsprogramm dieser Art
KI-Assistenten wie ChatGPT beherrschen zwar bereits heute zu einem gewissen Grad Rumantsch Grischun. So hat das UZH-Spin-off «Supertext» bereits vor vier Jahren ein Übersetzungsprogramm für die Schriftsprache auf den Markt gebracht. Doch die fünf Idiome des Rätoromanischen waren bis jetzt zu schwierig für die KI.
«Alas» wurde nun gezielt auf Tausenden von Beispieltexten trainiert. «Am Anfang brachte das KI-Modell die Idiome noch durcheinander», sagt Jannis Vamvas, Computerlinguist an der Universität Zürich, «doch im Lauf des Trainings wurde es immer besser darin, sie auseinanderzuhalten.» Zu Trainingszwecken übersetzte «Alas» Berichte von RTR und Zeitungsartikel, aber auch literarische Werke, Schulbücher, sowie Texte von Gemeinden und dem Kanton Graubünden.
Vielversprechender Blindtest
Nach dem Training von «Alas» lud das Forschungsteam Muttersprachler:innen der fünf Idiome zu einem Blindvergleich ein. Der Test wurde für Übersetzungen vom Deutschen ins Rätoromanisch durchgeführt, weil dort die meisten Schwierigkeiten bestehen. «Der Blindvergleich hat uns bestätigt, dass ‹Alas› deutlich bessere Übersetzungen produziert als bestehende KI-Assistenten», sagt Jannis Vamvas von der Universität Zürich. «Die Übersetzungen sind inhaltlich genauer und werden für idiomatischer befunden.» Noch besser schnitten nur von Menschen gemachte Übersetzungen ab.
Benutzen kann man das Übersetzungsprogramm «Alas» gratis über die Website alas.liarumantscha.ch. Für Technikprofis ist das zugrundeliegende KI-Modell zudem als Open-Source-Software zugänglich – sie können es unter die Lupe nehmen und gegebenenfalls weiterentwickeln.
Literatur:
Jannis Vamvas, Ignacio Pérez Prat, Angela Heldstab, Dominic P. Fischer, Sina Ahmadi, Rico Sennrich. Translation Asymmetry in LLMs as a Data Augmentation Factor: A Case Study for 6 Romansh Language Varieties. Preprint. 2026. Doi: 10.48550/arXiv.2603.25489https://arxiv.org/abs/2603.25489