Coursera è una delle principali piattaforme di apprendimento online al mondo, impegnata a fornire accesso universale a un'istruzione di livello mondiale. Con oltre 100 milioni di studenti, più di 7.000 corsi e partnership con oltre 300 università e aziende leader, Coursera ha ridefinito il modo in cui le persone apprendono nell'era digitale.
Ma con l'espansione globale della piattaforma, è emersa una sfida critica: come fornire esperienze di apprendimento veramente localizzate ed emotivamente risonanti per gli studenti di diverse lingue e culture senza compromettere l'autenticità o sostenere costi di produzione insostenibili.
Mustafa Furniturewala, CTO di Coursera, supervisiona il team di ingegneria e gli sforzi nell'intelligenza artificiale di Coursera. Il suo lavoro si concentra sulla creazione di strumenti di intelligenza artificiale generativa (come il doppiaggio AI, la clonazione vocale, il lip-sync, ecc.) e sull'assicurare che i progressi tecnologici servano la missione principale di creare un'educazione personalizzata, accessibile ed efficace per tutti, ovunque.
“Coursera ha la missione di fornire esperienze di apprendimento su scala globale,” ha detto Mustafa. “E per farlo in modo efficace, dobbiamo eliminare le barriere linguistiche, personalizzare l'apprendimento e preservare la qualità e l'intento dell'istruzione originale. È qui che l'intelligenza artificiale generativa, e in particolare HeyGen, è stata rivoluzionaria.”
Fornire esperienze immersive guidate da un istruttore
Prima di utilizzare HeyGen, Coursera aveva già impiegato con successo l'intelligenza artificiale per scalare le traduzioni di testi e audio. Tuttavia, la localizzazione dei video rimaneva un ostacolo imponente.
“Abbiamo iniziato con il testo,” ha detto Mustafa. “Quello era gestibile, ma quando si trattava di tradurre contenuti video mantenendo il tono, l'emozione e il sincronismo delle labbra dell'istruttore con la nuova lingua, semplicemente non era fattibile. Era troppo costoso e troppo complesso da realizzare su larga scala.”
La svolta è avvenuta quando Mustafa e il suo team hanno scoperto HeyGen, in particolare la clonazione vocale e il sincronismo labiale. Coursera ha implementato HeyGen per generare versioni localizzate dei video condotti dagli istruttori in francese, spagnolo, tedesco e altre lingue, preservando non solo ciò che viene detto, ma anche il modo in cui viene detto.
“Quello che è stato più sorprendente è stato quanto si sentisse naturale,” ha detto Mustafa. “Siamo stati in grado di prendere un video di un istruttore che parlava inglese e far sembrare che parlasse spagnolo mantenendo il loro tono, cadenza ed espressione emotiva.”
Quell'autenticità era non negoziabile per Coursera. Il team era sempre stato cauto riguardo ai contenuti generati dall'IA che sembravano robotici o scollegati. “Non stiamo solo trasmettendo informazioni. Stiamo creando esperienze immersive guidate dall'istruttore,” ha spiegato Mustafa. “Se l'emozione si perde, l'apprendimento ne risente.”
La capacità di HeyGen di fornire qualità su larga scala senza sacrificare l'emozione o la presenza dell'istruttore era ciò che Coursera stava aspettando.
Realizzare il “momento magico” con HeyGen
Mustafa rifletteva sul fatto che ciò che una volta richiedeva grandi investimenti e tempo ora avviene con agilità. “Abbiamo sempre pensato che la traduzione di video su larga scala avrebbe richiesto un massiccio investimento in produzione o tecnologia,” ha detto. “Quando il team è stato in grado di costruire questo in pochi sprint o settimane, siamo rimasti sorpresi dalla rapidità con cui siamo riusciti a raggiungere questa scala.”
Per gli istruttori, vedere la propria voce e le proprie emozioni conservate nei video tradotti è stato potente. “Sembrava di essere loro,” ha detto Mustafa. “I video tradotti sembravano ancora i nostri insegnanti, solo in un'altra lingua.”
Il risultato tecnico è stato eguagliato dalla risposta emotiva. “Il momento magico per noi è stato quando abbiamo visto un video doppiato con un perfetto sincronismo labiale e un'emozione preservata,” ha ricordato Mustafa. “È allora che abbiamo capito che non si tratta solo di uno strumento, ma di una piattaforma per scalare l'apprendimento senza perdere ciò che lo rende umano.”
HeyGen non ha solo migliorato la logistica, ha aperto nuove possibilità creative e operative. Gli ingegneri e i creatori di contenuti di Coursera ora possono dire: “L'ho fatto io”, non solo perché hanno creato il materiale didattico, ma perché lo hanno tradotto e localizzato personalmente, senza dipendere dall'aiuto di terzi.
“È stato scioccante,” ha detto Mustafa. “Il video era in una lingua completamente diversa, ma ha comunque trasmesso il contesto, l'emozione e la chiarezza didattica dell'originale. Sembrava naturale.”
Migliorare i tempi di visione e i tassi di completamento
Da quando ha implementato HeyGen, Coursera ha ottenuto guadagni misurabili nell'engagement degli studenti, nell'accessibilità della piattaforma e nei risultati educativi.
Risultati chiave:
- Aumento del 40% nel tempo di visione dei video – In regioni come l'America Latina, i contenuti video localizzati hanno significativamente aumentato il tempo totale di visione.
- Aumento del 25% nei tassi di completamento dei corsi – Gli studenti erano più propensi a terminare i corsi quando i contenuti video venivano forniti nella loro lingua madre.
- Localizzazione scalabile e autentica – Coursera offre ora contenuti video tradotti in più formati e lingue senza costose riprese.
Mustafa incoraggia le altre squadre a iniziare in piccolo. “Abbiamo iniziato con un video. È bastato quello per vedere l'impatto,” ha detto. “Una volta che lo provi, è evidente ciò che può scatenare.”
Ha anche sottolineato quanto velocemente la tecnologia AI, e in particolare HeyGen, si stia evolvendo. “Questo settore si muove rapidamente. Se non stai sperimentando ora, sarai indietro dopo. HeyGen è diventato una parte fondamentale della nostra infrastruttura.”







