Guidare il futuro della generazione di video con l’IA
Stiamo creando una tecnologia che sembra umana, entra in connessione profonda ed eleva il modo di raccontare le storie, portando un’intelligenza realistica in un mondo digitale in rapida evoluzione.

AI that connects, adapts, and inspires
At HeyGen, our AI research is driven by a mission to make visual storytelling accessible to everyone.

Incontra i nostri leader dell’IA
Innovare all’intersezione tra creatività, comunicazione e tecnologia.

Charly Hong, Head of AI Research
Charly Hong porta con sé oltre un decennio di esperienza nella computer vision e nell’IA, con un focus sulla modellazione e comprensione dell’essere umano e sulla generazione video. Ha pubblicato oltre 60 articoli e brevetti, a testimonianza del suo impegno per l’innovazione e soluzioni ad alto impatto. In HeyGen, Charly guida lo sviluppo di tecnologie di IA che collegano in modo fluido la ricerca al prodotto.

Rong Yan, CTO
Rong Yan è il CTO di HeyGen, impegnato a rendere lo storytelling visivo accessibile a tutti. In precedenza è stato VP of Engineering in HubSpot, dove guidava i prodotti di Data and Intelligence, e ha ricoperto ruoli di leadership in Snapchat, Square e Facebook. Rong ha conseguito il titolo di M.Sc. (2004) e il Ph.D. (2006) alla Carnegie Mellon. Ricercatore prolifico, vanta oltre 60 pubblicazioni, 35 brevetti ed è esperto di AI, data mining e computer vision.

Joshua Xu, CEO
Joshua Xu è co-fondatore e CEO di HeyGen e guida la missione di trasformare il visual storytelling grazie alla creazione di contenuti basata sull’AI. In precedenza è stato lead engineer in Snapchat (2014–2020), dove ha guidato innovazioni nel ranking delle inserzioni, nel machine learning e nella fotografia computazionale. Con un Master in Informatica conseguito alla Carnegie Mellon University, Joshua porta con sé una profonda esperienza in machine learning, computer vision e intelligenza artificiale generativa.

Jun-Yan Zhu, Advisor
Jun-Yan Zhu è Assistant Professor Michael B. Donohue di Informatica e Robotica alla Carnegie Mellon University, dove dirige il Generative Intelligence Lab. La sua ricerca si concentra su modelli generativi, visione artificiale e grafica, con l’obiettivo di dare più potere ai creatori attraverso i modelli generativi. Ha ricevuto il premio Samsung AI Researcher of the Year, la Packard Fellowship, la NSF CAREER Award, tra i vari riconoscimenti.
Our research pillars: shaping tomorrow’s AI
Redefining digital identity with precision and quality
Our focus on avatar generation emphasizes controllability, consistency, and unparalleled quality. By advancing AI-driven creation, we enable avatars to mirror human expressions and behaviors seamlessly, bridging the gap between reality and the digital world.
Multimodal language models powering video intelligence
We build multimodal language models that jointly reason over text, audio, and visual signals to better understand intent and context. This foundation powers video translation with improved semantic fidelity, enables avatar modeling that stays consistent across scenes, and unlocks video agents that can interpret goals and generate end-to-end content with higher reliability.
Breaking language barriers with multimodal solutions
Leveraging AI to create multimodal video translation solutions, we aim to make global communication more accessible. By seamlessly integrating text, voice, and visuals, we transform videos into universally understandable content, empowering cross-cultural connection.
Real-time engagement through multimodal innovation
Enabled by real-time rendering and advanced multimodal solutions, our interactive avatars bring conversations to life. These avatars not only respond dynamically but also redefine user interaction, making technology more engaging and human-like.
Emotion AI for expressive, realistic digital humans
Emotion AI helps our systems go beyond “talking” to truly communicating — by aligning what the script means with how it should feel. By coordinating tone and prosody in voice with on-point gestures and facial expressions, we generate avatars that maintain emotional coherence over time, closing the realism gap and pushing the frontier of human-like presence.
Agentic systems enabling video agents at scale
We develop agentic systems that turn video creation into a goal-driven workflow: planning, tool use, iteration, and verification. These capabilities power our video agent, allowing it to break down user intent into steps, make informed decisions along the way, and produce more controllable, consistent outcomes—while supporting safety and quality constraints in real production settings.
Rong Yan, Chief Technology Officer at HeyGen
"We’re engineering AI that is not only powerful but also trustworthy and easy to use. Our goal is to redefine what’s possible with AI video generation, making it indispensable for businesses and delightful for users."

Let's work together.
This could be the start of something special. Learn more about careers at HeyGen.
