Metas neues Speech-to-Text-Modell versteht über 1600 Sprachen
Meta hat mit Omnilingual ASR ein neues Spracherkennungsmodell vorgestellt. Die Open-Source-Technologie unterstützt über 1600 Sprachen. Zwar versteht sie bislang kein Schweizerdeutsch, dafür gehört Rätoromanisch bereits zu ihrem Repertoire.
Meta hat mit Omnilingual ASR (Automatic Speech Recognition) ein neues mehrsprachiges Spracherkennungssystem vorgestellt. Die Open-Source-Technologie soll über 1600 Sprachen unterstützen, wie Meta in einem Blogbeitrag mitteilt. Damit deckt der Social-Media-Riese mehr Sprachen ab als alle bisher veröffentlichten Modelle und hängt beispielsweise auch das Modell Whisper von OpenAI ab, das laut "Venturebeat" lediglich 99 Sprachen beherrscht.
Omnilingual ASR lässt sich gemäss Meta auch auf neue Sprachen erweitern: Über eine Lernfunktion namens Zero-Shot-In-Context-Learning könne das System theoretisch auf bis zu 5400 Sprachen ausgeweitet werden. Laut Blogbeitrag können Entwicklerinnen und Entwickler das Speech-to-Text-Modell frei nutzen und an eigene Bedürfnisse anpassen - die Modelle stehen unter der offenen Apache-2.0-Lizenz auf Github bereit.
Durch die Zusammenarbeit mit lokalen Gemeinschaften soll die Technologie zugleich kulturell sensibel bleiben und den Zugang zu digitalen Diensten erweitern. Meta will demnach mit der Veröffentlichung "Sprachbarrieren abbauen und die Kommunikation zwischen Menschen unterschiedlicher sprachlicher und kultureller Herkunft ermöglichen", wie es im Blogbeitrag heisst. Schweizerdeutsch kann die KI bislang zwar noch nicht, dafür gehört jedoch Rätoromanisch zum sprachlichen Repertoire des Systems.

Metas Spracherkennung soll bereits die vierte (und seltenste) Landessprache der Schweiz beherrschen. (Source: Screenshot / Omnilingual ASR)
Spracherkennungssysteme machen generell grosse Fortschritte. In einer Studie Anfang Jahr hat die UZH-Computerlinguistin Eleanor Chodroff gemeinsam mit Chloe Patman von der Cambridge University untersucht, wie gut moderne ASR-Systeme mit herausfordernden Hörbedingungen umgehen. Lesen Sie hier mehr dazu.
Swico warnt vor Schweizer Sonderregeln für KI
SwissAI fordert Verankerung digitaler Souveränität in der öffentlichen Beschaffung
Cisco schliesst kritische Lücke in Secure Workload
Autonomes Fahrzeug von Planzer und Loxo erreicht nächste Automatisierungsstufe
Daten sammeln für die NASA
Flappie bedient seine ersten 2500 Kunden
Update: Var Group vollzieht Integration von 4IT Solutions
Schweizer Strafverfolger beteiligen sich an Europol-Aktion gegen cyberkriminelles VPN
Vango?! Weshalb nicht einfach jeder über niederländische Kunst reden kann