Massive – Amazon legt Datensatz in 51 Sprachen für Alexa offen

0

„Stell dir vor, jeder Mensch auf der Welt könnte in seiner Muttersprache mit Amazon Alexa kommunizieren.“ So möchte es zumindest Amazon und legt einen großen Datensatz in 51 Sprachen offen. Bisher sind wir davon weit entfernt, denn Alexa gibt es nur in wenigen Sprachen im Gegensatz zu den Äußerungen im „Massive“-Datensatz.

Großer Datensatz „Massive“ für Sprachassistenten wie Alexa

Unter dem Namen „Massive“ hat Amazon einen riesigen Datensatz mit 51 Sprachen und Millionen von Sätzen/Satzteilen veröffentlicht. Dieser Datensatz steht unter einer freien Creative-Commons-Lizenz. Bisher steht Alexa in nur 9 Sprachen weltweit zur Verfügung. Durch das Erlernen einer gemeinsamen, sprachenübergreifenden Datenrepräsentation kann das Modell Wissen von Sprachen mit reichlich Trainingsdaten auf solche übertragen, für die es nur wenige Trainingsdaten gibt. 

Amazon hofft, das Entwickler die Chance erkennen und Alexa so in weitere Sprachen übersetzen. Nach der Idee soll etwa ein einziges Machine-Learning-Modell ausreichen, das dann in mehreren Sprachen funktioniert und notwendige Informationen von einer Sprache in eine andere übersetzt.

Info

Wenn du dich zum Thema austauschen willst, dann schau doch mal in unserer „Smart Speaker Gruppe“ auf Facebook vorbei. Dort findest du eine riesige Community, mit der du dich zu sämtlichen Smart Speaker Themen austauschen kannst!

Quelle

Hinterlasse uns einen Kommentar

Mit der Nutzung dieses Formulars, erklärst du dich mit der Speicherung und Verarbeitung deiner Daten durch diese Website einverstanden. Weitere Informationen kannst du der Datenschutzerklärung entnehmen.