Memimpin masa depan generasi video AI

Kami mengembangkan teknologi yang terasa manusiawi, membangun koneksi yang mendalam, dan mengangkat cara bercerita—membawa kecerdasan yang begitu hidup ke dalam dunia digital yang terus berkembang pesat.

AI yang terhubung, beradaptasi, dan menginspirasi

Di HeyGen, riset AI kami didorong oleh misi untuk menjadikan penceritaan visual dapat diakses oleh semua orang.

AI Connects

Temui para pemimpin AI kami

Berinovasi di persimpangan kreativitas, komunikasi, dan teknologi.

Charly Hong, Kepala Riset AI

Charly Hong, Kepala Riset AI

Charly Hong memiliki lebih dari satu dekade keahlian di bidang computer vision dan AI, dengan fokus pada pemodelan manusia, pemahaman, dan pembuatan video. Ia telah menulis lebih dari 60 publikasi dan paten, yang menegaskan komitmennya terhadap inovasi dan solusi yang berdampak. Di HeyGen, Charly memimpin pengembangan teknologi AI yang menjembatani riset dan produk secara mulus.

Rong Yan, CTO

Rong Yan, CTO

Rong Yan adalah CTO HeyGen, yang berdedikasi untuk membuat penceritaan visual dapat diakses oleh semua orang. Sebelumnya, ia menjabat sebagai VP of Engineering di HubSpot, memimpin produk Data and Intelligence, dan memegang berbagai posisi kepemimpinan di Snapchat, Square, dan Facebook. Rong meraih gelar M.Sc. (2004) dan Ph.D. (2006) dari Carnegie Mellon. Sebagai peneliti yang produktif, ia memiliki lebih dari 60 publikasi, 35 paten, serta keahlian di bidang AI, penambangan data, dan visi komputer.

Joshua Xu, CEO

Joshua Xu, CEO

Joshua Xu adalah Co-Founder dan CEO HeyGen, yang memimpin misi untuk mentransformasi visual storytelling melalui pembuatan konten berbasis AI. Sebelumnya, ia adalah lead engineer di Snapchat (2014–2020), mempelopori inovasi dalam ads ranking, machine learning, dan computational photography. Dengan gelar Magister Ilmu Komputer dari Carnegie Mellon, Joshua menghadirkan keahlian mendalam di bidang machine learning, computer vision, dan generative AI.

Jun-Yan Zhu, Penasihat

Jun-Yan Zhu, Penasihat

Jun-Yan Zhu adalah Michael B. Donohue Assistant Professor of Computer Science and Robotics di Carnegie Mellon University, tempat ia memimpin Generative Intelligence Lab. Penelitiannya berfokus pada model generatif, visi komputer, dan grafika, dengan misi memberdayakan para kreator melalui model generatif. Ia telah menerima penghargaan Samsung AI Researcher of the Year, Packard Fellowship, NSF CAREER Award, dan berbagai penghargaan lainnya.

Pilar riset kami: membentuk masa depan AI

Mendefinisikan identitas digital dengan presisi dan kualitas

Fokus kami pada pembuatan avatar menekankan kendali, konsistensi, dan kualitas yang tak tertandingi. Dengan memajukan kreasi berbasis AI, kami memungkinkan avatar untuk mencerminkan ekspresi dan perilaku manusia secara mulus, menjembatani kesenjangan antara dunia nyata dan dunia digital.

Model bahasa multimodal yang mendukung kecerdasan video

We build multimodal language models that jointly reason over text, audio, and visual signals to better understand intent and context. This foundation powers video translation with improved semantic fidelity, enables avatar modeling that stays consistent across scenes, and unlocks video agents that can interpret goals and generate end-to-end content with higher reliability.

Mematahkan hambatan bahasa dengan solusi multimodal

Dengan memanfaatkan AI untuk menciptakan solusi terjemahan video multimodal, kami bertujuan menjadikan komunikasi global lebih mudah diakses. Dengan mengintegrasikan teks, suara, dan visual secara mulus, kami mengubah video menjadi konten yang dapat dipahami secara universal, sehingga memperkuat koneksi lintas budaya.

Keterlibatan real-time melalui inovasi multimodal

Didukung oleh rendering real-time dan solusi multimodal canggih, avatar interaktif kami menghidupkan percakapan. Avatar ini tidak hanya merespons secara dinamis, tetapi juga mendefinisikan ulang interaksi pengguna, sehingga teknologi terasa lebih menarik dan lebih manusiawi.

Emotion AI untuk manusia digital yang ekspresif dan realistis

Emotion AI helps our systems go beyond “talking” to truly communicating — by aligning what the script means with how it should feel. By coordinating tone and prosody in voice with on-point gestures and facial expressions, we generate avatars that maintain emotional coherence over time, closing the realism gap and pushing the frontier of human-like presence.

Sistem agentik yang memungkinkan agen video dalam skala besar

We develop agentic systems that turn video creation into a goal-driven workflow: planning, tool use, iteration, and verification. These capabilities power our video agent, allowing it to break down user intent into steps, make informed decisions along the way, and produce more controllable, consistent outcomes—while supporting safety and quality constraints in real production settings.

Rong Yan, Chief Technology Officer di HeyGen

"Kami mengembangkan AI yang bukan hanya kuat, tetapi juga tepercaya dan mudah digunakan. Tujuan kami adalah mendefinisikan ulang apa yang mungkin dilakukan dengan pembuatan video berbasis AI, menjadikannya tak tergantikan bagi bisnis dan menyenangkan bagi para penggunanya."

Rong Yan message

Mari bekerja sama.

This could be the start of something special. Learn more about careers at HeyGen.

Lihat lowongan yang tersedia

AI Connects

Riset Video AI Generatif | Teknologi Video AI 2025 | HeyGen