연결하고, 적응하며, 영감을 주는 AI
HeyGen에서 우리의 AI 연구는 모든 사람이 시각적 스토리텔링을 쉽게 활용할 수 있도록 한다는 사명에 의해 추진되고 있습니다.

AI 리더들을 소개합니다
창의성, 소통, 기술이 만나는 지점에서 혁신을 이끌어갑니다.

Charly Hong, Head of AI Research
Charly Hong brings over a decade of expertise in computer vision and AI, with a focus on human modeling, understanding, and video generation. He has authored over 60 publications and patents, underscoring his commitment to innovation and impactful solutions. At HeyGen, Charly drives advancements in AI technology that seamlessly bridge research and product.

Rong Yan, CTO
Rong Yan is the CTO of HeyGen, dedicated to making visual storytelling accessible to all. Previously, he was VP of Engineering at HubSpot, leading Data and Intelligence products, and held leadership roles at Snapchat, Square, and Facebook. Rong earned his M.Sc. (2004) and Ph.D. (2006) from Carnegie Mellon. A prolific researcher, he has over 60 publications, 35 patents, and expertise in AI, data mining, and computer vision.

Joshua Xu, CEO
Joshua Xu is the Co-Founder and CEO of HeyGen, driving the mission to transform visual storytelling with AI-powered content creation. Previously, he was a lead engineer at Snapchat (2014–2020), spearheading innovations in ads ranking, machine learning, and computational photography. With a Master’s in Computer Science from Carnegie Mellon, Joshua brings deep expertise in machine learning, computer vision, and generative AI.

Jun-Yan Zhu, Advisor
Jun-Yan Zhu is the Michael B. Donohue Assistant Professor of Computer Science and Robotics at Carnegie Mellon University, where he leads the Generative Intelligence Lab. His research focuses on generative models, computer vision, and graphics, with the mission of empowering creators with generative models. He has received the Samsung AI Researcher of the Year, the Packard Fellowship, the NSF CAREER Award, among other awards.
우리의 연구 축: 내일의 AI를 설계하다
정밀함과 품질로 디지털 아이덴티티를 재정의하다
아바타 생성에 대한 우리의 초점은 제어 가능성, 일관성, 그리고 타의 추종을 불허하는 품질에 있습니다. AI 기반 생성 기술을 발전시킴으로써, 우리는 아바타가 인간의 표정과 행동을 자연스럽게 반영하도록 하여 현실과 디지털 세계 사이의 간극을 메우고자 합니다.
비디오 인텔리전스를 구현하는 멀티모달 언어 모델
We build multimodal language models that jointly reason over text, audio, and visual signals to better understand intent and context. This foundation powers video translation with improved semantic fidelity, enables avatar modeling that stays consistent across scenes, and unlocks video agents that can interpret goals and generate end-to-end content with higher reliability.
멀티모달 솔루션으로 언어 장벽 허물기
우리는 AI를 활용한 멀티모달 영상 번역 솔루션을 통해 전 세계적인 소통을 더욱 쉽게 만드는 것을 목표로 합니다. 텍스트, 음성, 시각 요소를 매끄럽게 통합함으로써 영상을 누구나 이해할 수 있는 콘텐츠로 전환하여, 문화 간 연결을 강화합니다.
멀티모달 혁신을 통한 실시간 참여
실시간 렌더링과 고급 멀티모달 솔루션을 기반으로, 우리의 인터랙티브 아바타는 대화를 생동감 있게 만들어 줍니다. 이 아바타들은 상황에 따라 역동적으로 반응할 뿐만 아니라, 사용자 상호작용의 방식을 새롭게 정의하여 기술을 더욱 몰입감 있고 인간적인 경험으로 바꿔 줍니다.
표현력 있고 현실적인 디지털 휴먼을 위한 감성 AI
Emotion AI helps our systems go beyond “talking” to truly communicating — by aligning what the script means with how it should feel. By coordinating tone and prosody in voice with on-point gestures and facial expressions, we generate avatars that maintain emotional coherence over time, closing the realism gap and pushing the frontier of human-like presence.
대규모로 비디오 에이전트를 구현하는 에이전틱 시스템
We develop agentic systems that turn video creation into a goal-driven workflow: planning, tool use, iteration, and verification. These capabilities power our video agent, allowing it to break down user intent into steps, make informed decisions along the way, and produce more controllable, consistent outcomes—while supporting safety and quality constraints in real production settings.
HeyGen 최고기술책임자(CTO) 롱 얀
"우리는 강력할 뿐만 아니라 신뢰할 수 있고 사용하기 쉬운 AI를 개발하고 있습니다. 우리의 목표는 AI 영상 생성의 가능성을 새롭게 정의하여, 비즈니스에 꼭 필요한 도구이자 사용자에게는 즐거운 경험이 되도록 만드는 것입니다."

함께 일해 봅시다.
이곳에서 특별한 여정이 시작될 수 있습니다. HeyGen의 커리어 기회에 대해 더 알아보세요.

