Coursera jest jedną z wiodących na świecie platform do nauki online, zaangażowaną w zapewnianie powszechnego dostępu do edukacji na najwyższym poziomie. Dzięki ponad 100 milionom uczących się, ponad 7 000 kursów oraz partnerstwom z ponad 300 czołowymi uniwersytetami i firmami, Coursera na nowo zdefiniowała sposób, w jaki ludzie uczą się w erze cyfrowej.
Jednak w miarę globalnej ekspansji platformy pojawiło się kluczowe wyzwanie: jak zapewnić naprawdę zlokalizowane, emocjonalnie angażujące doświadczenia edukacyjne dla studentów z różnych języków i kultur, nie rezygnując przy tym z autentyczności ani nie ponosząc nieakceptowalnie wysokich kosztów produkcji.
Mustafa Furniturewala, CTO w Coursera, nadzoruje zespół inżynierów Coursera oraz inicjatywy związane ze sztuczną inteligencją. Jego praca koncentruje się na tworzeniu narzędzi generatywnej AI (takich jak dubbing AI, klonowanie głosu, synchronizacja ruchu ust itp.) oraz na zapewnieniu, że postęp technologiczny wspiera kluczową misję tworzenia spersonalizowanej, dostępnej i skutecznej edukacji dla wszystkich, wszędzie na świecie.
„Coursera ma misję dostarczania doświadczeń edukacyjnych na skalę globalną,” powiedział Mustafa. „Aby robić to skutecznie, musimy usuwać bariery językowe, personalizować naukę oraz zachowywać jakość i intencję oryginalnych treści. Właśnie tutaj generatywna sztuczna inteligencja, a w szczególności HeyGen, okazała się przełomowa.”
Zapewnianie wciągających, prowadzonych przez instruktorów doświadczeń edukacyjnych
Before using HeyGen, Coursera had successfully deployed AI to scale text and audio translations. But video localization remained a formidable obstacle.
„Zaczęliśmy od tekstu” – powiedział Mustafa. „To było do opanowania, ale kiedy przyszło do tłumaczenia treści wideo z zachowaniem tonu wykładowcy, emocji i synchronizacji ruchu ust z nowym językiem, stało się to po prostu niewykonalne. Było to zbyt drogie i zbyt skomplikowane, żeby robić to na dużą skalę.”
Przełom nastąpił, gdy Mustafa i jego zespół odkryli HeyGen, w szczególności funkcje klonowania głosu i synchronizacji ruchu ust. Coursera wdrożyła HeyGen, aby tworzyć zlokalizowane wersje prowadzonych przez instruktorów materiałów wideo w języku francuskim, hiszpańskim, niemieckim i innych językach, zachowując nie tylko to, co jest mówione, ale także sposób, w jaki jest to wypowiadane.
“What was most surprising was how natural it felt,” Mustafa said. “We were able to take a video of an instructor speaking English and make it feel like they were speaking Spanish while maintaining their tone, cadence, and emotional expression.”
That authenticity was non-negotiable for Coursera. The team had always been wary of AI-generated content that felt robotic or disconnected. “We’re not just delivering information. We’re creating immersive, instructor-led experiences,” Mustafa explained. “If the emotion gets lost, the learning suffers.”
Możliwość HeyGen dostarczania treści wysokiej jakości na dużą skalę, bez poświęcania emocji ani obecności instruktora, była dokładnie tym, na co Coursera czekała.
Realizing the “magic moment” with HeyGen
Mustafa zauważył, że to, co kiedyś wymagało dużych nakładów i czasu, teraz dzieje się z dużą zwinnością. „Zawsze myśleliśmy, że tłumaczenie wideo na dużą skalę będzie wymagało ogromnych inwestycji w produkcję lub technologię” – powiedział. „Kiedy zespół był w stanie zbudować to w ciągu zaledwie kilku sprintów czy tygodni, byliśmy zaskoczeni, jak szybko udało nam się osiągnąć taką skalę.”
Dla instruktorów widok własnego głosu i emocji zachowanych w przetłumaczonych filmach był niezwykle poruszający. „To wciąż byli oni” – powiedział Mustafa. „Przetłumaczone filmy nadal wyglądały i brzmiały jak nasi nauczyciele, tylko w innym języku.”
Techniczne osiągnięcie dorównało emocjonalnej reakcji. „Magiczny moment dla nas nastąpił, gdy zobaczyliśmy zdubbingowany film z idealną synchronizacją ruchu ust i zachowanymi emocjami” – wspominał Mustafa. „Wtedy zrozumieliśmy, że to nie jest tylko narzędzie, ale platforma do skalowania procesu uczenia się bez utraty tego, co czyni go ludzkim.”
HeyGen nie tylko usprawnił kwestie logistyczne, ale też otworzył nowe możliwości kreatywne i operacyjne. Inżynierowie i twórcy treści w Coursera mogą teraz powiedzieć: „To ja to zrobiłem”, nie tylko dlatego, że stworzyli materiał edukacyjny, lecz także dlatego, że samodzielnie go przetłumaczyli i zlokalizowali, bez polegania na pomocy zewnętrznych firm.
“That was shocking,” Mustafa said. “The video was in a completely different language, but it still carried the context, the emotion, and the instructional clarity of the original. It felt natural.”
Poprawa czasu oglądania i współczynnika ukończenia materiałów
Od czasu wdrożenia HeyGen, Coursera odnotowała wymierny wzrost zaangażowania uczestników, dostępności platformy oraz efektów edukacyjnych.
Kluczowe wyniki:
- 40% wzrost czasu oglądania wideo – W regionach takich jak Ameryka Łacińska zlokalizowane treści wideo znacząco wydłużyły łączny czas oglądania.
- 25% wzrost współczynnika ukończenia kursów – Studenci częściej kończyli kursy, gdy treści wideo były dostarczane w ich ojczystym języku.
- Skalowalna, autentyczna lokalizacja – Coursera dostarcza teraz przetłumaczone treści wideo w wielu formatach i językach, bez kosztownych ponownych nagrań.
Mustafa encourages other teams to start small. “We began with one video. That’s all it took to see the impact,” he said. “Once you experience it, it’s obvious what this can unlock.”
Podkreślił też, jak szybko rozwija się technologia AI, a w szczególności HeyGen. „To środowisko zmienia się błyskawicznie. Jeśli teraz nie eksperymentujesz, później będziesz w tyle. HeyGen stał się kluczowym elementem naszej infrastruktury.”






