Coursera è una delle principali piattaforme di apprendimento online al mondo, impegnata a offrire un accesso universale a un’istruzione di livello mondiale. Con oltre 100 milioni di studenti, più di 7.000 corsi e partnership con oltre 300 tra le più importanti università e aziende, Coursera ha ridefinito il modo in cui le persone imparano nell’era digitale.
Ma con l’espansione globale della piattaforma è emersa una sfida cruciale: come offrire esperienze di apprendimento davvero localizzate e dal forte impatto emotivo per studenti di lingue e culture diverse, senza compromettere l’autenticità né generare costi di produzione insostenibili.
Mustafa Furniturewala, CTO di Coursera, supervisiona il team di ingegneria e le iniziative di intelligenza artificiale di Coursera. Il suo lavoro è incentrato sulla creazione di strumenti di intelligenza artificiale generativa (come doppiaggio AI, clonazione vocale, sincronizzazione labiale, ecc.) e sul garantire che i progressi tecnologici supportino la missione principale di offrire un’istruzione personalizzata, accessibile ed efficace per tutti, ovunque.
«Coursera ha la missione di offrire esperienze di apprendimento su scala globale», ha detto Mustafa. «E per farlo in modo efficace, dobbiamo eliminare le barriere linguistiche, personalizzare l’apprendimento e preservare la qualità e l’intento dell’istruzione originale. È qui che l’IA generativa, e in particolare HeyGen, è stata trasformativa.»
Offrire esperienze immersive guidate da istruttori
Prima di utilizzare HeyGen, Coursera aveva già implementato con successo l’IA per scalare le traduzioni di testi e audio. Tuttavia, la localizzazione dei video rimaneva un ostacolo formidabile.
«Siamo partiti dal testo», ha detto Mustafa. «Quello era gestibile, ma quando si è trattato di tradurre i contenuti video mantenendo il tono, le emozioni dell’insegnante e la sincronizzazione delle labbra con la nuova lingua, non era semplicemente fattibile. Era troppo costoso e troppo complesso da scalare».
La svolta è arrivata quando Mustafa e il suo team hanno scoperto HeyGen, in particolare il voice cloning e il lip sync. Coursera ha implementato HeyGen per generare versioni localizzate dei video tenuti dagli istruttori in francese, spagnolo, tedesco e altre lingue, preservando non solo ciò che viene detto, ma anche il modo in cui viene detto.
«Ciò che ci ha sorpreso di più è stato quanto sembrasse naturale», ha detto Mustafa. «Siamo riusciti a prendere un video di un docente che parlava inglese e a farlo sembrare come se stesse parlando spagnolo, mantenendo il suo tono, il ritmo e l’espressione emotiva.»
Per Coursera, quell’autenticità era irrinunciabile. Il team è sempre stato diffidente nei confronti dei contenuti generati dall’IA che risultassero robotici o distaccati. “Non stiamo solo trasmettendo informazioni. Stiamo creando esperienze immersive guidate da istruttori”, ha spiegato Mustafa. “Se si perde l’emozione, ne risente l’apprendimento.”
La capacità di HeyGen di offrire contenuti di alta qualità su larga scala, senza sacrificare l’emozione o la presenza dell’istruttore, era esattamente ciò che Coursera stava aspettando.
Realizzare il “momento magico” con HeyGen
Mustafa ha osservato che ciò che prima richiedeva grandi investimenti e molto tempo ora avviene con grande agilità. «Abbiamo sempre pensato che la traduzione video su larga scala avrebbe richiesto enormi investimenti in produzione o tecnologia», ha detto. «Quando il team è riuscito a realizzare tutto questo nel giro di pochi sprint o settimane, siamo rimasti sorpresi da quanto velocemente siamo riusciti a raggiungere questo livello di scalabilità.»
Per i docenti, vedere la propria voce e le proprie emozioni preservate nei video tradotti è stato molto potente. «Sembrava proprio di vedere loro», ha detto Mustafa. «I video tradotti continuavano a sembrare e a suonare come i nostri insegnanti, solo in un’altra lingua.»
Il risultato tecnico è stato all’altezza della reazione emotiva. «Il momento magico per noi è stato quando abbiamo visto un video doppiato con un labiale perfetto e le emozioni intatte», ha ricordato Mustafa. «È allora che abbiamo capito che questo non è solo uno strumento, è una piattaforma per scalare l’apprendimento senza perdere ciò che lo rende umano».
HeyGen non si è limitato a migliorare la logistica: ha sbloccato nuove possibilità creative e operative. Gli ingegneri e i creatori di contenuti di Coursera ora possono dire: “L’ho fatto io”, non solo perché hanno realizzato il materiale didattico, ma perché lo hanno anche tradotto e localizzato personalmente, senza dover ricorrere a supporto esterno.
«È stato sconvolgente», ha detto Mustafa. «Il video era in una lingua completamente diversa, ma manteneva comunque il contesto, l’emozione e la chiarezza didattica dell’originale. Sembrava naturale.»
Migliorare i tempi di visualizzazione e i tassi di completamento
Da quando ha implementato HeyGen, Coursera ha ottenuto miglioramenti misurabili nel coinvolgimento degli studenti, nell’accessibilità della piattaforma e nei risultati formativi.
Risultati principali:
- Aumento del 40% del tempo di visualizzazione dei video – In regioni come l’America Latina, i contenuti video localizzati hanno aumentato in modo significativo il tempo di visione complessivo.
- Aumento del 25% nei tassi di completamento dei corsi – Gli studenti avevano maggiori probabilità di completare i corsi quando i contenuti video venivano erogati nella loro lingua madre.
- Localizzazione scalabile e autentica – Coursera ora offre contenuti video tradotti in più formati e lingue senza costosi nuovi girati.
Mustafa incoraggia gli altri team a partire in piccolo. “Abbiamo iniziato con un solo video. È stato sufficiente per vedere l’impatto”, ha detto. “Una volta che lo provi, è ovvio ciò che può sbloccare.”
Ha anche sottolineato la rapidità con cui si sta evolvendo la tecnologia AI, e HeyGen in particolare. “Questo settore si muove velocemente. Se non stai sperimentando adesso, resterai indietro in seguito. HeyGen è diventata una parte fondamentale della nostra infrastruttura.”






