Büro

Funktionsweise von Skype Translator

Inhaltsverzeichnis:

Anonim

Science-Fiction ist voll von Hinweisen auf technologisch fortschrittliche Geräte, deren Funktionsweise, um den mythischen Ausdruck zu paraphrasieren, nicht von Magie zu unterscheiden ist. Entstanden aus dem kreativen Geist ihrer Autoren, ist es schwer vorstellbar, wann solche Erfindungen in unseren Händen sein könnten und wir am Ende akzeptieren, dass ihre Existenz nicht Teil unseres Lebenszyklus werden wird. Aber hin und wieder schleicht sich einer von ihnen vorzeitig in unser Leben. Das ist der Fall bei der Echtzeitübersetzung, die Microsoft und Skype ermöglichen werden

"Die Aufgabe ist alles andere als einfach.Es umfasst die Fähigkeit von Skype zu Videokonferenzen, das riesige Netzwerk von Cloud-Servern von Microsoft Azure, die technologischen Innovationen von Microsoft Research und die jüngsten Fortschritte in mehreren Bereichen wie Statistik und maschinelles Lernen. All dies steht Ihnen zur Verfügung, damit das System, sobald Sie einen Satz in Ihrer Sprache aussprechen, Ihre Worte erkennt, übersetzt und in einer anderen Sprache an Ihren Kontakt übermittelt. Wie ist es möglich?"

Die Technologie, die es möglich macht

Skype Translator, der Name, unter dem die neue Funktionalität bekannt ist, ist keine Eintagsfliege, nicht einmal in einem Jahr . Skype Translator ist das Ergebnis jahrzehntelanger Forschung in den Bereichen Spracherkennung, maschinelle Übersetzung und Techniken des maschinellen Lernens. In all diesen Bereichen liegt der Betrieb eines Systems, das ohne die neuesten Fortschritte in ihnen nicht möglich gewesen wäre.

Skype Translator ist das Ergebnis jahrzehntelanger Forschung in den Bereichen Spracherkennung, maschinelle Übersetzung und Techniken des maschinellen Lernens.

Angefangen mit Spracherkennung, einer Technologie, die seit einiger Zeit untersucht wird, deren Einführung jedoch immer von der großen Anzahl betroffen war von Fehlern und Überempfindlichkeit bestehender Systeme. Eine Sekunde des Zweifels, kleine Variationen im Akzent oder ein minimales Rauschen reichten aus, um den Computer zu verwirren und ihm klarzumachen, was er wollte. So war es, bis die Entwicklung von „Deep Learning“-Techniken und die Schaffung künstlicher neuronaler Netze explodierten, von denen Microsoft Research etwas weiß. Dank ihnen war es möglich, die Fehlerquote erheblich zu reduzieren und die Zuverlässigkeit und Robustheit der Spracherkennung zu verbessern, ein notwendiger erster Schritt, damit Skype Translator funktioniert.

maschinelle Übersetzung ist die andere offensichtliche Säule, auf der Skype Translator ruht. Hier setzt Microsoft wieder auf hauseigene Technologie und nutzt die Bing-Übersetzungsmaschine, um Texte von einer Sprache in eine andere zu übersetzen.Sein System verwendet eine Kombination aus Syntaxerkennungstechniken und statistischen Modellen, um das Ergebnis zu verfeinern. Darüber hinaus wurde die Engine bei dieser Gelegenheit speziell darauf trainiert, die Art der Sprache zu erkennen, die in gesprochenen Gesprächen vorkommt, weit entfernt von der Korrektheit und Sauberkeit, die normalerweise beim Schreiben angenommen wird. Daher kombiniert das Skype Translator-System die umfangreiche Sprachwissensbasis von Bing Translator mit einer umfangreichen Schicht von Wörtern und Phrasen, die häufig in der Umgangssprache verwendet werden.

Aber Sprechen und Sprachen sind kompliziertes Terrain. Sie ändern sich ständig, es gibt sie in verschiedenen Geschmacksrichtungen und Varianten, jede Person hat ihren eigenen besonderen Stil usw. Skype Translator muss mit all dem Schritt h alten, was eine ständige Schulung und Optimierung sowohl der Spracherkennung als auch der maschinellen Übersetzung erfordert. Dazu wurde das System auf einer robusten Plattform für „maschinelles Lernen“ aufgebaut, einem Zweig der künstlichen Intelligenz, der darauf abzielt, Techniken zu entwickeln, mit denen Maschinen und Algorithmen lernen können durch Training mit Beispieldaten.Die Verwendung dieser im Bereich der Statistik üblichen Techniken ermöglicht es, den Dienst während der Nutzung zu verbessern, indem die bei der Verwendung generierten Daten genutzt werden, um die Spracherkennung und die automatische Übersetzung weiter zu verfeinern.

Einige dieser Testdaten werden automatisch aus einer Vielzahl von Quellen generiert, darunter soziale Netzwerke wie Facebook, übersetzte Webseiten, Videos mit Untertiteln oder sogar zu diesem Zweck erstellte Konversationen, die manuell transkribiert und übersetzt werden . Ein anderer Teil der Daten stammt jedoch aus tatsächlichen Gesprächen, die über den Dienst geführt werden. Dies ist wichtig, denn da Microsoft Sie bei jedem Anruf benachrichtigt, sollten Sie wissen, dass Skype Translator Gespräche aufzeichnen und anonym h alten kann, damit sie später von seinen Algorithmen analysiert werden können und in den Trainingsprozess ihrer statistischen Modelle eingeführt.

Skype Translator kann nur dann richtig funktionieren, wenn es in der Lage ist, durch einen Prozess zu lernen, der auf seiner Verwendung in echten menschlichen Gesprächen basiert

"

Ohne diesen Lernprozess könnte das System nicht funktionieren. Wenn Menschen sprechen, machen wir Pausen und wiederholen Dinge, machen Fehler und ändern unser Denken, während wir gehen, indem wir Ahs, Ähm, Uhms>einführen, nur wenn wir etwas über die tatsächliche Verwendung lernen, kann es besser werden "

In wenigen Sekunden von einer gesprochenen Sprache zur anderen

Unterstützt durch all diese Fortschritte, ist der Schlüssel, dass Skype Translator in der Lage ist, den gesamten Erkennungs- und Übersetzungsprozess schnell und transparent für den Benutzer auszuführen Jedes Mal, wenn wir sprechen, muss das System erkennen, was wir sagen, es in die Sprache des Empfängers übersetzen und es ihm auf eine Weise übermitteln, die dem treu bleibt, was wir ursprünglich zu kommunizieren versuchten.Je weniger wir die Zwischenschritte bemerken, desto besser.

Sobald das System erkennt, dass wir sprechen, beginnt es aufzuzeichnen, was wir sagen, und startet den Spracherkennungsprozess Dies ist nicht der Fall darum, nicht nur jedes Wort, das wir aussprechen, zu erkennen, sondern auch alles Überflüssige zu eliminieren, sinnlose Ausdrücke und Rauschen zu löschen, die Aufteilung des Textes in Sätze mit Einfügung von Satzzeichen und Großbuchstaben zu erkennen und mit einem Kontext zu versehen das hilft bei deiner Interpretation. Wenn man ein wenig darüber nachdenkt, merkt man, wie schwierig es ist, all dies anhand der gesprochenen Sprache zu bestimmen.

Skype Translator benötigt eine möglichst genaue Spracherkennung, denn was folgt, ist das Vorbereiten der gesammelten Informationen, um sie mit den statistischen Modellen zu vergleichen, die sich verbessert haben durch sein „maschinelles Lernen“-System.Hier besteht der Prozess darin, Ähnlichkeiten zwischen dem, was das System verstanden hat, das wir gesagt haben, und den in den Modellen enth altenen Wörtern und Kontexten zu finden, um anschließend zuvor erlernte Transformationen anzuwenden, die das Audio in Text umwandeln und in die Fremdsprache übersetzen.

Im letzten Schritt hat Skype ein Paar Bots mit weiblichen und männlichen Stimmen vorbereitet, die als Dolmetscher im Anruf fungieren Sobald einer vom Benutzer ausgewählt wurde, ist er dafür verantwortlich, unsere übersetzte Nachricht an den Empfänger zu übermitteln, sodass nicht nur die schriftlichen Transkriptionen und Übersetzungen auf dem Bildschirm erscheinen, sondern er sie auch laut hören kann, als wäre es ein dritter Mensch vermittelt zwischen uns. . Diese Bots sind in der Lage, die Nachricht schnell zu kommunizieren, sodass jeder, der auf der anderen Seite des Bildschirms zuhört, die Nachricht einige Sekunden, nachdem wir sie ausgesprochen haben, erhält.

Das Testprogramm als Ausgangspunkt

Gerade die Anwesenheit von Bots als Sprecher von Drittanbietern im Gespräch ist eines der Details, die noch ausgefeilt werden müssen. Microsoft erkennt an, dass die Anpassung an sie für Personen, die daran gewöhnt sind, über einen Dolmetscher zu sprechen, einfach ist, für andere jedoch eine Lernphase erforderlich ist. Und es ist so, dass Microsoft und Skype entschlossen sein mögen, das beste verfügbare Echtzeit-Übersetzungserlebnis zu schaffen, aber um dies zu tun müssen wir sowohl uns selbst als auch die Maschinen lernenDie Skype Translator-Vorschau ist nur ein weiterer Schritt in diesem Prozess.

Das Testprogramm ging Mitte Dezember live und führte gesprochene Übersetzung zwischen zwei Sprachen ein: Englisch und Spanisch, und schriftliche Übersetzung in mehr als 40 Um darauf zugreifen zu können, ist eine Einladung erforderlich, die wir anfordern können, indem wir uns auf der Website des Programms registrieren. Wenn wir damit gesegnet sind, können wir Skype Translator aus den Skype-Anwendungen für Windows 8 ausprobieren.1 oder Windows 10 Technical Preview. Andernfalls müssen wir warten, bis der Dienst verlängert und offiziell veröffentlicht wird.

"

Wie auch immer, Skype Translator hat gerade begonnen, als wir uns von 2014 verabschieden. Bevor Sie fertig sind, h alten Sie hier für eine Sekunde inne und denken Sie an das Jahr, das Sie gerade gelesen haben: zweitausendvierzehn>"

Über | Skype-Blogs I, II

Büro

Die Wahl des Herausgebers

Back to top button