Ein Forschungsteam am Institut für Informatik hat versucht, die KI mit Meenzer Dialekt zu füttern. Erst einmal wurde ein altes Wörterbuch digitalisiert - das waren mehr als 2.300 Wörter mit der hochdeutschen Übersetzung - darunter Begriffe wie Woi (Wein), Bangert (freches Kind) und Schlabbe (Hausschuhe).
KI-Sprachmodelle sollten Mainzer Dialekt erkennen
Dann wurden verschiedene KI-Sprachmodelle mit zwei Aufgaben gefüttert: Zum einen sollte die KI die Bedeutung der Mainzer Wörter erklären, zum anderen sollte sie aus den hochdeutschen Definitionen die passenden Begriffe im Mainzer Dialekt erzeugen.
KI erkennt weniger als 10 Prozent der Dialekt-Wörter
Das hat aber überhaupt nicht funktioniert: Entweder erkannte die KI die Wörter gar nicht oder sie hat sie falsch gedeutet. Studienleiter Min Duc Bui: "Die getesteten Modelle scheitern sowohl beim Verstehen als auch beim Produzieren des Dialekts."
Dialekte wichtiger Teil der kulturellen Identität
Das Forschungsteam sieht darin ein Problem: Dialekte seien ein wichtiger Teil kultureller Identität, würden aber gleichzeitig aus dem alltäglichen Gebrauch verschwinden. Deswegen müssten spezielle Datensätze entwickelt werden, um Dialekte besser in KI-Systeme einzubinden.