자동 자막 생성기의 기능
오디오용 정확한 AI 음성 전사
MP4, MOV, WAV 또는 MP3 형식의 오디오 파일이나 동영상을 업로드하면, 자막 도구가 각 대사마다 자동으로 자막을 생성합니다. 음성 인식 기능이 단어, 문장 부호, 화자를 감지하므로, 대본을 수정하는 데 드는 시간을 줄이고 동영상에 정확한 캡션을 손쉽게 추가할 수 있습니다.

175개 이상의 언어로 자막을 번역하세요
어떤 시장의 영상이든 자막을 만들고, 다시 촬영할 필요 없이 자막이 입혀진 영상을 전 세계에 배포하세요. 언어를 선택한 뒤 AI 영상 번역기를 사용해 100개 이상의 언어로 자막을 번역하여 YouTube, TikTok, LinkedIn에서 여러분의 메시지를 효과적으로 전달할 수 있습니다.

온라인 자막 편집 및 스타일링 도구
에디터를 벗어나지 않고도 자막을 브랜드에 딱 맞게 맞춰 보세요. 온라인 자막 편집기를 사용하면 글꼴, 색상, 크기, 위치, 자막 템플릿, 애니메이션까지 한곳에서 모두 편집할 수 있습니다. TikTok용 다이내믹 자막이나 교육용 깔끔한 2줄 영상 자막을 AI 비디오 에디터 안에서 바로 시도해 보세요.

다중 화자 감지 및 깔끔한 편집
인터뷰, 팟캐스트, 패널 영상에 자막을 손쉽게 만들어 보세요. 이 도구는 화자 태그가 포함된 자동 자막을 생성해 주며, 자막 내용을 직접 편집하고 문장 하나하나를 세밀하게 다듬을 수 있습니다. 타임라인을 눌러 시작·종료 시간을 미세 조정하고, 한 줄을 나누거나 여러 줄을 합쳐 더 자연스러운 흐름을 만들 수 있습니다.

SRT, VTT, TXT 또는 MP4로 내보내기
YouTube, LMS 또는 동영상 편집기에 사용할 SRT, VTT, TXT 형식의 자막 파일을 다운로드하세요. 혹은 Reels, Shorts, 광고용으로 자막이 입혀진 MP4 동영상으로 바로 다운로드할 수도 있습니다. 이 자막 생성기는 여러분이 게시하는 모든 곳에서 닫힌 자막이 영상과 완벽하게 동기화되도록 유지해 줍니다.

사용 사례
Most social video viewers watch without sound. Add word-synced captions to your videos so the hook lands and keep viewers engaged. Generate, style, and export ready-to-post vertical video in minutes, formatted for every feed and aspect ratio you need.
Upload your podcast or interview and download a subtitle file for YouTube. Captions to videos improve watch time, viewing experience, and search ranking. Pair with the YouTube video translator to translate captions and grow international subscribers from one edit.
Make your video content accessible without manual transcribing or video editing crews. Add subtitles to onboarding clips, SOP walkthroughs, and policy refreshers. Match the workflow with HeyGen's training video toolkit and reach a multilingual, global workforce.
Course completion climbs when lessons are easier to follow on every screen. Caption many videos at once by adding subtitles to your video catalog, then translate. Use the course builder to ship captioned, multilingual lessons without re-recording.
Captioned ads outperform muted-frame video ads on every social platform. Burn branded subtitles for video into your hero cut, then spin localized variants. Repurpose one master into dozens of cuts with the AI ad maker for paid and organic.
Turn one long episode into short clips with captions ready for every social channel. Generate accurate transcripts, pull quote highlights, and publish across feeds in hours. The audio to video workflow handles audio-only podcast files too.
작동 방식
원본 영상을 업로드하는 것부터 완성도 높은 자막을 입힌 공유용 영상으로 내보내기까지, 네 단계만 거치면 됩니다.
MP4, MOV, WAV 또는 MP3 파일을 업로드하세요. 생성기가 오디오를 자동으로 감지하고 바로 전사를 시작합니다.
AI가 오디오를 전사하고, 모든 대사에 타임코드를 지정한 뒤, 화자별로 자동으로 자막을 생성합니다.
폰트, 애니메이션, 색상과 위치를 선택하세요. 어떤 단어든 클릭해 문구를 다듬거나 타이밍을 몇 초 만에 조정할 수 있습니다.
SRT, VTT, TXT 파일 또는 자막이 입혀진 MP4로 다운로드하세요. 175개 이상의 언어로 즉시 번역할 수 있습니다.




자동 자막 생성기는 영상 속 음성을 인식해 시간 코드가 포함된 자막을 만들어 주는 AI 캡션 생성기입니다. 영상을 업로드하면 도구가 자동으로 음성 인식을 수행하고, 사용자가 편집·번역하거나 SRT로 내보내거나 MP4에 바로 입힐 수 있는 정확한 자막을 제공합니다.
명확한 영어 음성에서는 정확도가 95% 이상을 기록하며, 다양한 억양, 시끄러운 배경 소음, 전문 용어가 포함된 경우에도 높은 수준을 유지합니다. 단어를 클릭해 개별적으로 수정할 수 있고, 타임라인에서 텍스트를 오디오와 정밀하게 맞출 수 있습니다. 또한 시스템이 신뢰도가 낮은 구절을 자동으로 표시해, 내보내기 전에 검토할 수 있도록 도와줍니다.
네. 무료 동영상 플랜을 사용하면 자동으로 자막을 생성하고 짧은 동영상에 대해 정확한 자막을 내보낼 수 있습니다. 유료 플랜을 이용하면 더 긴 동영상, 더 많은 언어, 워터마크 없는 내보내기, 브랜드 키트, 그리고 HeyGen 플랜 페이지에서 팀 협업 기능을 사용할 수 있습니다.
네. 동영상에 자막을 생성한 후, 클릭 한 번으로 175개 이상의 언어와 방언으로 자막을 번역할 수 있습니다. 결과물은 줄 단위 타이밍이 그대로 유지되므로, 번역된 자막을 동영상에 바로 적용하고 SRT 파일이나 자막이 입혀진 MP4 파일로 다운로드할 수 있습니다.
YouTube, 소셜 플랫폼, 영상 편집기 또는 LMS 시스템용으로 SRT, VTT, TXT 형식의 자막 파일을 다운로드할 수 있습니다. 또한 자막이 입혀진 MP4 파일을 바로 내보낼 수도 있습니다. SRT는 대부분의 플랫폼에서 사용 가능하며, VTT는 HTML5 비디오 플레이어에 가장 적합한 깔끔한 형식입니다.
네. 모든 단어를 수정할 수 있고, 모든 자막 줄을 이동할 수 있으며, 모든 타이밍 포인트는 파형에 맞춰 정렬됩니다. 단어를 클릭해 문구를 고치거나, 줄을 드래그해 타이밍을 조정하고, 두 줄을 합쳐 더 타이트한 리듬으로 만들 수 있습니다. 가장 자주 사용하는 자막 템플릿은 프리셋으로 저장됩니다.
네. 자막 편집기는 음성 변화를 감지해 화자를 구분하고, 각 줄에 태그를 달아 줍니다. 화자 이름을 바꾸거나, 색상으로 구분하거나, 같은 화자의 줄을 합칠 수 있습니다. 인터뷰, 패널 토론, 팟캐스트, 웨비나 녹화본에 가장 깔끔하게 어울리는 기능입니다.
일반적으로 5~10분 분량의 영상은 2분 이내에 전사가 완료됩니다. 더 긴 영상도 길이에 비례해 처리되며, 대부분의 1시간짜리 팟캐스트는 5~10분 안에 끝납니다. 전사 과정 내내 편집기 안에 머무르면서, 첫 자막이 나타나는 즉시 바로 스타일을 적용해 편집할 수 있습니다.
타임라인을 사용해 각 대사를 밀리초 단위로 미세 조정할 수 있습니다. 대사를 앞이나 뒤로 드래그하고, 커서 위치에서 한 줄을 분할하거나, 너무 잘게 나뉜 두 줄을 하나로 합칠 수 있습니다. 각 블록 아래의 파형을 통해 텍스트를 음성에 쉽게 맞출 수 있습니다.
네. 글꼴, 크기, 색상, 두께, 외곽선, 배경, 위치, 애니메이션까지 모두 직접 설정할 수 있습니다. 자막 템플릿을 저장해 모든 영상이 브랜드와 일관되도록 유지하세요. 숏폼 SNS용으로는 다이내믹한 키네틱 캡션을, 교육용 영상에는 깔끔한 2줄 블록 자막을 사용해 보세요. 애니메이션은 음성에 맞춰 자동으로 동기화됩니다.
네. 이미 SRT 또는 VTT 자막 파일이 있다면 업로드하면 에디터가 각 줄을 영상의 오디오에 자동으로 매핑합니다. 이후 자막의 스타일을 바꾸거나, 타이밍을 조정하거나, 거의 모든 언어로 번역할 수 있습니다. 이는 기존 스크립트를 새로운 편집본에 재활용할 수 있는 빠른 방법입니다.
자막을 생성하고, 9:16 형식을 선택한 뒤, 숏폼에 맞게 자막 스타일을 설정하고, 자막을 입힌 MP4 형식으로 영상을 내보내세요. 이렇게 만든 결과물은 TikTok, Reels, Shorts에 바로 업로드할 수 있습니다. 또한 SRT 파일을 다운로드해 각 플랫폼의 기본 자막 업로드 기능을 사용할 수도 있습니다.
HeyGen은 자동 자막에 AI 음성 클로닝, AI 더빙, 그리고 175개 이상의 언어 번역 기능을 결합합니다. Canva를 포함한 다른 자막 도구들은 캡션 제공에 그치지만, HeyGen은 하나의 프로젝트 안에서 전체 현지화된 영상 제작 워크플로우를 제공합니다.
네. Würth Group는 HeyGen을 활용해 65분 분량의 프레젠테이션을 4일 만에 8개 언어로 번역하고, 번역 비용을 80% 절감했습니다(사례 연구). 자막과 번역을 함께 사용하면, 추가 제작 인력 없이도 장편 콘텐츠까지 도달 범위를 대폭 확장할 수 있습니다.
AI 도구 더 탐색해보세요
Avatar IV를 사용하여 사진에 초현실적인 목소리와 움직임을 불어넣으세요.
