Metas neues Speech-to-Text-Modell versteht über 1600 Sprachen
Meta hat mit Omnilingual ASR ein neues Spracherkennungsmodell vorgestellt. Die Open-Source-Technologie unterstützt über 1600 Sprachen. Zwar versteht sie bislang kein Schweizerdeutsch, dafür gehört Rätoromanisch bereits zu ihrem Repertoire.
Meta hat mit Omnilingual ASR (Automatic Speech Recognition) ein neues mehrsprachiges Spracherkennungssystem vorgestellt. Die Open-Source-Technologie soll über 1600 Sprachen unterstützen, wie Meta in einem Blogbeitrag mitteilt. Damit deckt der Social-Media-Riese mehr Sprachen ab als alle bisher veröffentlichten Modelle und hängt beispielsweise auch das Modell Whisper von OpenAI ab, das laut "Venturebeat" lediglich 99 Sprachen beherrscht.
Omnilingual ASR lässt sich gemäss Meta auch auf neue Sprachen erweitern: Über eine Lernfunktion namens Zero-Shot-In-Context-Learning könne das System theoretisch auf bis zu 5400 Sprachen ausgeweitet werden. Laut Blogbeitrag können Entwicklerinnen und Entwickler das Speech-to-Text-Modell frei nutzen und an eigene Bedürfnisse anpassen - die Modelle stehen unter der offenen Apache-2.0-Lizenz auf Github bereit.
Durch die Zusammenarbeit mit lokalen Gemeinschaften soll die Technologie zugleich kulturell sensibel bleiben und den Zugang zu digitalen Diensten erweitern. Meta will demnach mit der Veröffentlichung "Sprachbarrieren abbauen und die Kommunikation zwischen Menschen unterschiedlicher sprachlicher und kultureller Herkunft ermöglichen", wie es im Blogbeitrag heisst. Schweizerdeutsch kann die KI bislang zwar noch nicht, dafür gehört jedoch Rätoromanisch zum sprachlichen Repertoire des Systems.

Metas Spracherkennung soll bereits die vierte (und seltenste) Landessprache der Schweiz beherrschen. (Source: Screenshot / Omnilingual ASR)
Spracherkennungssysteme machen generell grosse Fortschritte. In einer Studie Anfang Jahr hat die UZH-Computerlinguistin Eleanor Chodroff gemeinsam mit Chloe Patman von der Cambridge University untersucht, wie gut moderne ASR-Systeme mit herausfordernden Hörbedingungen umgehen. Lesen Sie hier mehr dazu.
Die neue Printausgabe des "IT-Markt" ist da
KI-Start-up Wonderful lässt sich in Zürich nieder
Kanton Schaffhausen führt Justitia.swiss für den digitalen Rechtsverkehr ein
TD Synnex listet Zubehör von Dbramante1928
Wie sich Phisher - mal wieder - im Namen von Behörden Vertrauen erschleichen
GenAI-User sind produktiver und verdienen mehr
Metas neues Speech-to-Text-Modell versteht über 1600 Sprachen
Star Trek - die Bluegrass-Generation
Gohack25 bringt Cybersecurity-Szene zusammen