Coursera es una de las principales plataformas de aprendizaje online del mundo, comprometida a brindar acceso universal a una educación de primer nivel. Con más de 100 millones de estudiantes, más de 7.000 cursos y alianzas con más de 300 universidades y empresas líderes, Coursera redefinió la forma en que la gente aprende en la era digital.
Pero a medida que la plataforma se expandía a nivel global, surgió un desafío clave: cómo ofrecer experiencias de aprendizaje realmente localizadas y emocionalmente significativas para estudiantes de distintos idiomas y culturas, sin perder autenticidad ni generar costos de producción insostenibles.
Mustafa Furniturewala, CTO en Coursera, lidera el equipo de ingeniería y las iniciativas de IA de Coursera. Su trabajo se centra en crear herramientas de IA generativa (como doblaje con IA, clonación de voz, sincronización labial, etc.) y en garantizar que los avances tecnológicos acompañen la misión central de ofrecer una educación personalizada, accesible y efectiva para todas las personas, en cualquier lugar.
“Coursera tiene la misión de ofrecer experiencias de aprendizaje a escala global”, dijo Mustafa. “Y para hacerlo de manera efectiva, tenemos que eliminar las barreras de idioma, personalizar el aprendizaje y preservar la calidad y la intención de la instrucción original. Ahí es donde la IA generativa, y en particular HeyGen, ha sido transformadora.”
Ofreciendo experiencias inmersivas guiadas por instructores
Antes de usar HeyGen, Coursera ya había implementado con éxito la IA para escalar las traducciones de texto y audio. Pero la localización de video seguía siendo un obstáculo enorme.
“Arrancamos con texto”, dijo Mustafa. “Eso era manejable, pero cuando se trató de traducir contenido en video manteniendo el tono, la emoción del instructor y la sincronización labial con el nuevo idioma, simplemente no era viable. Era demasiado caro y demasiado complejo para hacerlo a escala.”
El gran cambio llegó cuando Mustafa y su equipo descubrieron HeyGen, en particular la clonación de voz y el lip-sync. Coursera implementó HeyGen para generar versiones localizadas de videos dictados por instructores en francés, español, alemán y otros idiomas, preservando no solo lo que se dice, sino cómo se dice.
“Lo que más nos sorprendió fue lo natural que se sentía”, dijo Mustafa. “Pudimos tomar un video de una persona instructora hablando en inglés y hacer que pareciera que estaba hablando en español, manteniendo su tono, cadencia y expresión emocional.”
Esa autenticidad no era negociable para Coursera. El equipo siempre había sido cauteloso con el contenido generado con IA que se sentía robótico o desconectado. “No estamos solo entregando información. Estamos creando experiencias inmersivas guiadas por instructores”, explicó Mustafa. “Si se pierde la emoción, el aprendizaje se resiente.”
La capacidad de HeyGen para ofrecer calidad a escala sin sacrificar la emoción ni la presencia del instructor era justo lo que Coursera había estado esperando.
Descubriendo el “momento mágico” con HeyGen
Mustafa comentó que lo que antes requería grandes inversiones y mucho tiempo ahora sucede con agilidad. “Siempre pensamos que la traducción de video a gran escala iba a necesitar una inversión enorme en producción o tecnología”, dijo. “Cuando el equipo pudo construir esto en cuestión de unos pocos sprints o semanas, nos sorprendió lo rápido que llegamos a este nivel de escala.”
Para los instructores, ver que su voz y sus emociones se mantenían en los videos traducidos fue muy impactante. “Se sentía como si fueran ellos”, dijo Mustafa. “Los videos traducidos seguían viéndose y sonando como nuestros docentes, solo que en otro idioma.”
El logro técnico estuvo a la altura de la respuesta emocional. “El momento mágico para nosotros fue cuando vimos un video doblado con sincronización labial perfecta y la emoción preservada”, recordó Mustafa. “Ahí nos dimos cuenta de que esto no es solo una herramienta, es una plataforma para escalar el aprendizaje sin perder lo que lo hace humano.”
HeyGen no solo mejoró la logística, también desbloqueó nuevas posibilidades creativas y operativas. Ahora las personas ingenieras y creadoras de contenido de Coursera pueden decir “yo hice esto”, no solo porque crearon el material educativo, sino porque también lo tradujeron y lo localizaron ellas mismas, sin depender de ayuda de terceros.
“Fue impactante”, dijo Mustafa. “El video estaba en un idioma completamente distinto, pero seguía transmitiendo el contexto, la emoción y la claridad didáctica del original. Se sentía natural.”
Mejorar el tiempo de visualización y las tasas de finalización
Desde que implementó HeyGen, Coursera logró mejoras medibles en el compromiso de los estudiantes, la accesibilidad de la plataforma y los resultados educativos.
Resultados clave:
- 40% de aumento en el tiempo de reproducción de video – En regiones como Latinoamérica, el contenido de video localizado incrementó significativamente el tiempo total de visualización.
- 25% más de finalización de cursos – Los estudiantes tenían muchas más probabilidades de terminar los cursos cuando el contenido en video se entregaba en su idioma nativo.
- Localización auténtica y escalable – Coursera ahora entrega contenido de video traducido en múltiples formatos e idiomas sin costosos re-rodajes.
Mustafa anima a otros equipos a empezar de a poco. “Arrancamos con un solo video. Eso fue todo lo que hizo falta para ver el impacto”, dijo. “Una vez que lo probás, es obvio todo lo que puede desbloquear.”
También remarcó lo rápido que está evolucionando la tecnología de IA, y HeyGen en particular. “Este espacio se mueve muy rápido. Si no estás experimentando ahora, vas a quedar atrás después. HeyGen se volvió una parte clave de nuestra infraestructura.”






