Welches ist das ideale Interface zwischen Mensch und Maschine? Das ist eine Frage, mit der sich die IT-Branche seit der Erfindung moderner Computersysteme auseinandersetzt. In der digitalen Sprachlehre scheint klar zu sein: Die verbale Spracheingabe bietet LernerInnen einzigartige Möglichkeiten, welche mit schrift-basierten Tastatureingaben nicht zu erreichen sind. Frühe Versuche der Bildungsbranche, dieses Potential voll auszuschöpfen, scheiterten oft noch an unausgereiften Technologien.

Wie schafft es Avallain also heute, Lernerlebnisse und Lernergebnisse mit der Voice Technology von Avallain Author und Avallain Unity zu individualisieren und entscheidend zu verbessern?

So unterstützt Voice Technology den Lernfortschritt

Traditionelle, visuelle User Interfaces wie Tastaturen oder Touchscreens haben gerade im Bereich des Sprachtrainings einen Nachteil: NutzerInnen können ihre eigenen Worte nur in schriftlicher Form in die Lernsoftware einspeisen. Das bedeutet, dass sie zwar das Lesen, Hören und Schreiben einer Sprache, aber kaum das Sprechen trainieren können. Durch die Integration von Voice Technology ergeben sich für LernerInnen dementsprechend ganz neue Möglichkeiten:

  • Der verbale Sprachgebrauch kann aktiv trainiert werden.

  • LernerInnen können sofortiges, individuelles Feedback erhalten.

  • Aussprachefehler können erkannt werden, bevor sie sich verfestigen.

  • Die Sprachlehre muss nicht nur auf der Schriftsprache basieren​.

All diese Vorteile der Technologie hat Avallain früh erkannt. Wir begleiten das Feld schon seit vielen Jahren und halten Ausschau nach Voice Technology Entwicklungen, die wir sinnvoll in unsere Produkte integrieren können. Dabei verzichten wir bewusst darauf, immer nur dem gerade neuesten Ansatz blind zu folgen, da unausgereifte Technologien einen negativen Einfluss sowohl auf die User Experience als auch auf den eigentlichen Bildungszweck haben können.

Drei Meilensteine auf dem Weg zur ausgereiften Voice Technology

Dass die damals noch eher eingeschränkt nutzbare, nicht immer verlässliche Technologie der Spracherkennung bald Virtual Assistants wie Siri und Alexa hervorbringen würde, war vor 15 Jahren kaum vorstellbar. Heute werden diese Programme weltweit in den unterschiedlichsten Sprachen und Dialekten gesteuert und nach Informationen gefragt – und sie geben überraschend oft verlässlich passende Antworten.

Voice Technology hat mittlerweile einen Qualitätsstandard erreicht, der den NutzerInnen von Avallain Author und Avallain Unity jederzeit spürbar zugute kommt: Unsere beiden Produkte ermöglichen es BildungsexpertInnen, ineinandergreifende e-Learning-Möglichkeiten zur Verfügung zu stellen, über die noch in den 90ern höchstens spekuliert werden konnte. Und in den letzten Jahren scheint es, als sei sogar in einigen der komplexesten Teilbereichen der Voice Technology ein langersehnter Durchbruch gelungen.

Doch der Weg dorthin war anspruchsvoll und führte über drei entscheidende Meilensteine:

1. Meilenstein: Sprachaufzeichnung und -wiedergabe

Der erste und – aus heutiger Sicht – simpelste Aufgabenbereich von Voice Technology ist die Sprachaufzeichnung und -wiedergabe über das Internet. Diese Technologie bildet die Basis fast aller weiteren Entwicklungen in diesem Forschungsfeld. Und weil sie bereits 2002 unseren Qualitätsstandards entsprach, konnten wir sie bereits im Rahmen des Macmillan English Campus erfolgreich einsetzen.

Heute unterstützt unsere Software verschiedene Variationen der Sprachaufzeichnung und -wiedergabe. Mit Avallain Author lassen sich beispielsweise online und offline Nutzereingaben und vorher aufgezeichnete Daten zu ganzen Dialogen zusammenfügen. Die Aufnahmen können dann dank Avallain Unity direkt an die LehrerInnen gesendet werden – für Feedback oder zur verbalen Kommunikation ausserhalb räumlich gebundener Kurse.

2. Meilenstein: Synthetische Sprache

Das synthetische Erzeugen von Sprache als Audio ist im Verhältnis zum Aufnehmen und Wiedergeben gesprochener Sprache ein wesentlich komplexerer Themenbereich. Aus diesem Grund haben wir mit der Integration synthetischer Sprache bis 2004 gewartet, als die Technologie schliesslich ausgereift genug war. Schon damals knüpften wir Partnerschaften mit den Marktführern im Bereich Sprachproduktion, beispielsweise mit der Acapela Group. Im Zuge dieser Kooperationen konnten wir unseren KundInnen neue spannende Features zur Verfügung stellen, die allesamt auf dem Prinzip der synthetischen Sprache beruhen:

  • Übertragung redaktionell erstellter Texte in synthetische Sprechakte (Text-to-Speech).

  • Anpassung spezifischer Merkmale von Sprechakten – z.B. dialektale Anpassung an verschiedene Märkte.

  • Kontrollierbare und skalierbare Produktion von Tonaufzeichnungen.

  • LernerInnen können sich ihre eigenen Texteingaben über Text-to-Speech (TTS) direkt aussprechen lassen.

Heute ist unsere Voice Technology flexibel genug, um die unterschiedlichsten Sprachen und Dialekte authentisch wiederzugeben. Wie effektiv dadurch beispielsweise Alphabetisierungsprojekte auf der ganzen Welt unterstützt werden können, hält die UNESCO ab Seite 16 ihres Reports zu internationalen Bildungsprojekten fest. Unsere Voice Technology hatte hier einen entscheidenden Anteil an der erfolgreichen Bildung der kenianischen Küstenbevölkerung in Swahili.

3. Meilenstein: Spracherkennung

Bislang erforderte die Erkennung und Beurteilung von Sprache immer noch einen Menschen, insbesondere aufgrund der großen Vielfalt der möglichen Aussprachen. Und selbst die heutigen spezialisierten Software-Lösungen, die einen Nutzen für die automatisierte Analyse von Aussprache versprechen, lassen sich immer noch nur in sehr spezifischen Analyse-Szenarien anwenden.

Aufgrund dieser Einschränkungen lag unser Fokus immer schon auf der generellen Spracherkennung, also der Fähigkeit von Software, gesprochene Sprache zu erkennen und genau zu transkribieren. In der Frühzeit konnte hierbei selbst die Technologie von Vorreitern wie Microsoft, Apple und Google versagen, unabhängig von der Qualität der Aussprache. Es waren Nischen-Spezialisten wie Nuance, die hier zuerst Erfolge vorweisen konnten und auch heute noch in bestimmten Anwendungen führend sind – zum Beispiel im Bereich der Diktataufnahme und später der Automatisierung des Kundenservices. Dies erforderte jedoch lange Zeit, dass NutzerInnen im korrekten Umgang mit dem Programm spezifisch geschult werden.

Für uns waren diese Ansätze bei der Spracherkennung keine ideale Lösung für die Bildung – denn die extensive Schulung von LernerInnen in der Benutzung eines Lernprogramms erschafft nur zusätzliche Hürden. Aus diesem Grund konzentrierten wir uns zunächst auf weniger technisch ambitionierte, dafür intuitiv nutzbare Lösungen. Bei dem Lernportal iwdl.de haben wir beispielsweise den spielerischen Einsatz von Spracherkennung hinsichtlich einzelner Worte anstelle von ganzen Sätzen ermöglicht. Mit diesem Ansatz hat es iwdl.de bereits geschafft, als erstes digitales kurstragendes Lehrmittel überhaupt für die Integrationskurse des BAMF zugelassen zu werden.

2017 – Zukunftsvisionen werden Realität

Jetzt, da diese drei Meilensteine erfolgreich genommen sind, öffnet sich eine neue Welt voller spannender Möglichkeiten zur Nutzung von Sprachtechnologien für BildungsenthusiastInnen. So werden wir im Sommer 2017 erstmalig einen Activity Type einführen, bei dem LernerInnen vom Programm Feedback über ihre Aussprache von Texten innerhalb einer Activity erhalten. Der nächste wichtige Schritt der Entwicklung ist dann, die Nutzung verbaler Sprache in jeder Input-Activity zu erlauben: Textaufgaben, bei denen LernerInnen Elemente verbal einfügen, gamifizierte Aufgaben, bei denen LernerInnen Antworten auf Fragestellungen einfach aussprechen können – das sind für Avallain die Meilensteine der nahen Zukunft.

Um diese Ziele bereits 2017 zu erreichen, konzentrieren wir uns aktuell primär auf Google’s Speech API, werden jedoch in absehbarer Zeit mindestens 3 der Key-Player in diesem Bereich verwenden.

Was für Avallain danach kommt? Das entscheiden wir im Dialog mit unseren KundInnen. Fest steht jedoch: Wie bisher werden unsere NutzerInnen die ersten sein, die den technologischen Fortschritt vollumfänglich und verlässlich ihren EndnutzerInnen anbieten können. Damit wir gemeinsam die Bildung des Einzelnen in Zukunft noch umfassender, noch effizienter und noch spannender machen werden.

 

 

Kontakt

Daniel Seuling, Head of Communications, dseuling@avallain.com