Dẫn dắt tương lai của công nghệ tạo video bằng AI

Chúng tôi đang tạo ra công nghệ mang cảm giác gần gũi như con người, kết nối sâu sắc và nâng tầm nghệ thuật kể chuyện — đưa trí tuệ sống động vào một thế giới số đang phát triển nhanh chóng.

AI kết nối, thích ứng và truyền cảm hứng

Tại HeyGen, nghiên cứu AI của chúng tôi được thúc đẩy bởi sứ mệnh giúp việc kể chuyện bằng hình ảnh trở nên dễ tiếp cận với mọi người.

AI Connects

Gặp gỡ các lãnh đạo AI của chúng tôi

Đổi mới tại giao điểm giữa sáng tạo, giao tiếp và công nghệ.

Charly Hong, Head of AI Research

Charly Hong, Head of AI Research

Charly Hong brings over a decade of expertise in computer vision and AI, with a focus on human modeling, understanding, and video generation. He has authored over 60 publications and patents, underscoring his commitment to innovation and impactful solutions. At HeyGen, Charly drives advancements in AI technology that seamlessly bridge research and product.

Rong Yan, CTO

Rong Yan, CTO

Rong Yan is the CTO of HeyGen, dedicated to making visual storytelling accessible to all. Previously, he was VP of Engineering at HubSpot, leading Data and Intelligence products, and held leadership roles at Snapchat, Square, and Facebook. Rong earned his M.Sc. (2004) and Ph.D. (2006) from Carnegie Mellon. A prolific researcher, he has over 60 publications, 35 patents, and expertise in AI, data mining, and computer vision.


Joshua Xu, CEO

Joshua Xu, CEO

Joshua Xu is the Co-Founder and CEO of HeyGen, driving the mission to transform visual storytelling with AI-powered content creation. Previously, he was a lead engineer at Snapchat (2014–2020), spearheading innovations in ads ranking, machine learning, and computational photography. With a Master’s in Computer Science from Carnegie Mellon, Joshua brings deep expertise in machine learning, computer vision, and generative AI.

Jun-Yan Zhu, Advisor

Jun-Yan Zhu, Advisor

Jun-Yan Zhu is the Michael B. Donohue Assistant Professor of Computer Science and Robotics at Carnegie Mellon University, where he leads the Generative Intelligence Lab. His research focuses on generative models, computer vision, and graphics, with the mission of empowering creators with generative models. He has received the Samsung AI Researcher of the Year, the Packard Fellowship, the NSF CAREER Award, among other awards.

Các trụ cột nghiên cứu của chúng tôi: định hình tương lai của AI

Tái định nghĩa danh tính số với độ chính xác và chất lượng vượt trội

Chúng tôi tập trung vào việc tạo avatar với khả năng kiểm soát cao, tính nhất quán và chất lượng vượt trội. Bằng cách phát triển công nghệ sáng tạo dựa trên AI, chúng tôi giúp avatar phản chiếu một cách liền mạch biểu cảm và hành vi của con người, thu hẹp khoảng cách giữa thế giới thực và thế giới số.

Các mô hình ngôn ngữ đa phương thức cung cấp sức mạnh cho trí tuệ video

We build multimodal language models that jointly reason over text, audio, and visual signals to better understand intent and context. This foundation powers video translation with improved semantic fidelity, enables avatar modeling that stays consistent across scenes, and unlocks video agents that can interpret goals and generate end-to-end content with higher reliability.

Xóa bỏ rào cản ngôn ngữ với các giải pháp đa phương thức

Tận dụng trí tuệ nhân tạo để tạo ra các giải pháp dịch video đa phương thức, chúng tôi hướng tới mục tiêu giúp giao tiếp toàn cầu trở nên dễ tiếp cận hơn. Bằng cách tích hợp liền mạch văn bản, giọng nói và hình ảnh, chúng tôi chuyển đổi video thành nội dung mà ai cũng có thể hiểu, qua đó tăng cường kết nối giữa các nền văn hóa.

Tương tác theo thời gian thực thông qua đổi mới đa phương thức

Được hỗ trợ bởi khả năng kết xuất thời gian thực và các giải pháp đa phương thức tiên tiến, avatar tương tác của chúng tôi mang các cuộc trò chuyện trở nên sống động. Những avatar này không chỉ phản hồi một cách linh hoạt mà còn tái định nghĩa cách người dùng tương tác, giúp công nghệ trở nên hấp dẫn và gần gũi với con người hơn.

Emotion AI dành cho các nhân vật số biểu cảm và chân thực

Emotion AI helps our systems go beyond “talking” to truly communicating — by aligning what the script means with how it should feel. By coordinating tone and prosody in voice with on-point gestures and facial expressions, we generate avatars that maintain emotional coherence over time, closing the realism gap and pushing the frontier of human-like presence.

Các hệ thống tác tử cho phép triển khai tác tử video ở quy mô lớn

We develop agentic systems that turn video creation into a goal-driven workflow: planning, tool use, iteration, and verification. These capabilities power our video agent, allowing it to break down user intent into steps, make informed decisions along the way, and produce more controllable, consistent outcomes—while supporting safety and quality constraints in real production settings.

Rong Yan, Giám đốc Công nghệ tại HeyGen

"Chúng tôi đang phát triển các hệ thống AI không chỉ mạnh mẽ mà còn đáng tin cậy và dễ sử dụng. Mục tiêu của chúng tôi là định nghĩa lại những gì có thể làm được với công nghệ tạo video bằng AI, biến nó trở thành công cụ không thể thiếu cho doanh nghiệp và mang lại trải nghiệm thú vị cho người dùng."

Rong Yan message

Hãy cùng hợp tác với nhau.

Đây có thể là khởi đầu cho một điều thật đặc biệt. Tìm hiểu thêm về cơ hội nghề nghiệp tại HeyGen.

AI Connects