Coursera ist eine der weltweit führenden Online-Lernplattformen, die sich dem Ziel verschrieben hat, universellen Zugang zu erstklassiger Bildung zu bieten. Mit mehr als 100 Millionen Lernenden, über 7.000 Kursen und Partnerschaften mit mehr als 300 führenden Universitäten und Unternehmen hat Coursera das Lernen im digitalen Zeitalter neu definiert.
Aber als sich die Plattform global ausweitete, tauchte eine entscheidende Herausforderung auf: Wie kann man wirklich lokalisierte, emotional ansprechende Lernerfahrungen für Schüler über Sprachen und Kulturen hinweg bieten, ohne die Authentizität zu beeinträchtigen oder untragbare Produktionskosten zu verursachen.
Mustafa Furniturewala, CTO bei Coursera, leitet das Ingenieurteam und die KI-Bemühungen von Coursera. Seine Arbeit konzentriert sich auf die Entwicklung generativer KI-Werkzeuge (wie KI-Synchronisation, Stimmklonung, Lippen-Synchronisation usw.) und darauf, sicherzustellen, dass technologische Fortschritte der Hauptmission dienen, personalisierte, zugängliche und effektive Bildung für jeden überall zu schaffen.
„Coursera hat es sich zur Aufgabe gemacht, Lernerfahrungen weltweit in großem Maßstab anzubieten“, sagte Mustafa. „Und um das effektiv zu tun, müssen wir Sprachbarrieren abbauen, das Lernen personalisieren und die Qualität und Absicht der ursprünglichen Anweisung bewahren. Hierbei war generative KI, und insbesondere HeyGen, bahnbrechend.“
Bereitstellung von immersiven, von Lehrkräften geleiteten Erfahrungen
Bevor HeyGen verwendet wurde, hatte Coursera künstliche Intelligenz erfolgreich eingesetzt, um Text- und Audioübersetzungen zu skalieren. Doch die Lokalisierung von Videos blieb ein gewaltiges Hindernis.
„Wir haben mit Text begonnen“, sagte Mustafa. „Das war machbar, aber als es darum ging, Videoinhalte mit dem Tonfall, der Emotion und den lippensynchron zum neuen Sprache übersetzten Lehrer zu übersetzen, war es einfach nicht machbar. Es war zu teuer und zu komplex, um es in großem Maßstab zu tun.“
Der Durchbruch gelang, als Mustafa und sein Team HeyGen entdeckten, insbesondere die Stimmklonung und Lippen-Synchronisation. Coursera implementierte HeyGen, um lokalisierte Versionen von von Dozenten geleiteten Videos auf Französisch, Spanisch, Deutsch und anderen Sprachen zu erstellen, wobei nicht nur der Inhalt, sondern auch die Art und Weise der Aussprache erhalten blieb.
„Am überraschendsten war, wie natürlich es sich anfühlte“, sagte Mustafa. „Wir konnten ein Video eines Instruktors, der Englisch spricht, so bearbeiten, dass es wirkte, als würde er Spanisch sprechen, während wir seinen Tonfall, sein Sprechtempo und seinen Gefühlsausdruck beibehielten.“
Diese Authentizität war für Coursera nicht verhandelbar. Das Team war immer vorsichtig mit von KI erzeugten Inhalten, die roboterhaft oder unverbunden wirkten. „Wir liefern nicht nur Informationen. Wir schaffen immersive, von Lehrkräften geleitete Erfahrungen“, erklärte Mustafa. „Wenn die Emotion verloren geht, leidet das Lernen.“
Die Fähigkeit von HeyGen, Qualität in großem Umfang zu liefern, ohne Emotionen oder die Präsenz des Lehrers zu opfern, war genau das, worauf Coursera gewartet hatte.
Den „magischen Moment“ mit HeyGen erleben
Mustafa stellte fest, dass das, was früher große Investitionen und Zeit erforderte, jetzt mit Agilität geschieht. „Wir dachten immer, dass die Übersetzung von Videos in großem Maßstab massive Investitionen in Produktion oder Technologie erfordern würde“, sagte er. „Als das Team dies in nur wenigen Sprints oder Wochen realisieren konnte, waren wir überrascht, wie schnell wir diese Art von Skalierung erreichen konnten.“
Für Dozenten war es eindrucksvoll zu sehen, dass ihre Stimme und Emotionen in übersetzten Videos erhalten blieben. „Es fühlte sich an wie sie selbst“, sagte Mustafa. „Die übersetzten Videos sahen immer noch aus und klangen wie unsere Lehrer, nur in einer anderen Sprache.“
Die technische Leistung wurde durch die emotionale Reaktion ergänzt. „Der magische Moment für uns war, als wir ein synchronisiertes Video mit perfektem Lippen-Synchron und bewahrter Emotion sahen“, erinnerte sich Mustafa. „Da wurde uns klar, dass dies nicht nur ein Werkzeug ist, es ist eine Plattform, um das Lernen zu skalieren, ohne das zu verlieren, was es menschlich macht.“
HeyGen hat nicht nur die Logistik verbessert, sondern auch neue kreative und betriebliche Möglichkeiten eröffnet. Die Ingenieure und Inhaltsentwickler von Coursera können jetzt sagen: „Ich habe das gemacht“, nicht nur, weil sie das Lehrmaterial erstellt haben, sondern auch, weil sie es selbst übersetzt und lokalisiert haben, ohne auf die Hilfe Dritter angewiesen zu sein.
„Das war schockierend“, sagte Mustafa. „Das Video war in einer völlig anderen Sprache, aber es vermittelte immer noch den Kontext, die Emotion und die instruktive Klarheit des Originals. Es wirkte natürlich.“
Verbesserung der Wiedergabezeiten und Abschlussquoten
Seit der Implementierung von HeyGen hat Coursera messbare Steigerungen bei der Lernerbeteiligung, der Plattformzugänglichkeit und den Bildungsergebnissen erzielt.
Schlüsselergebnisse:
- 40% Anstieg der Videowiedergabezeit – In Regionen wie Lateinamerika hat lokalisiertes Videoinhalte die Gesamtwiedergabezeit deutlich erhöht.
- 25% Steigerung der Kursabschlussquoten – Die Studierenden schlossen Kurse wahrscheinlicher ab, wenn Videoinhalte in ihrer Muttersprache angeboten wurden.
- Skalierbare, authentische Lokalisierung – Coursera bietet nun übersetzte Videoinhalte in verschiedenen Formaten und Sprachen an, ohne kostspielige Neuaufnahmen.
Mustafa ermutigt andere Teams, klein anzufangen. „Wir haben mit einem Video begonnen. Das war alles, was nötig war, um den Einfluss zu erkennen“, sagte er. „Wenn man es einmal erlebt hat, ist es offensichtlich, welche Möglichkeiten dadurch eröffnet werden.“
Er betonte auch, wie schnell sich die KI-Technologie, und insbesondere HeyGen, entwickelt. „Dieser Bereich entwickelt sich rasch. Wenn Sie jetzt nicht experimentieren, werden Sie später hinterherhinken. HeyGen ist zu einem kritischen Teil unserer Infrastruktur geworden.“







