音声

ボイスモデルとは何ですか

コンテンツをもっと自然に、よりパーソナルに、あるいは特定のブランドボイスにより近づけたいと思ったことがあるなら、ボイスモデルを使えばそれが実現できます。

HeyGen では、音声が AI 生成のナレーションを通じて、あなたのスクリプトやアバターに命を吹き込みます。選択するそれぞれの音声は「ボイスエンジン」と呼ばれるモデルによって動作しており、自然で表現力があり、言語的に正確な音声を生成するよう設計されています。適切なエンジンを選ぶことで、メッセージのトーン、話す速さ、感情を理想的にマッチさせることができます。

音声モデルとは

A voice model is the underlying AI system that generates speech. It determines how a voice sounds, how expressive it is, how fast it speaks, and how well it performs across languages.

HeyGen では、トレーニング、マーケティング、ストーリーテリング、ローカライズなど、さまざまなユースケースに最適化された複数の音声エンジンを提供しています。

自動音声エンジン

Auto 設定を使うと、HeyGen が動画の言語や内容に基づいて最適なボイスエンジンを自動的に選択します。モデルを手動で選ばずに、安定した結果を得たい場合におすすめのオプションです。

ElevenLabs 音声エンジン

ElevenLabs delivers studio-quality narration across more than 70 languages, making it suitable for most video and voice projects.

If you’re using a custom voice, you can also choose which voice model powers it for greater control over tone and realism. By default, HeyGen uses the multilingual V3 model from ElevenLabs, which is known for natural expression and strong multilingual performance.

ターボ音声モデル

より高速な生成が必要なプロジェクトでは、Turbo モデルのいずれかに切り替えることができます。これらは待ち時間が短く処理も速い一方で、主に英語コンテンツ向けに最適化されています。

Starfish voice engine

Starfish は中国語、日本語、韓国語を含むアジアの言語向けに最適化されており、地域ごとのコンテンツに合わせて自然な発音と話す速度を実現します。

Pandaボイスエンジン

Panda は HeyGen の表現力豊かなエンジンであり、感情豊かな話し方と高度なコントロールのために設計されています。Voice Director や Voice Mirroring などの機能をサポートしており、タイミング、強調、声のトーンを細かく制御することができます。

Fishボイスエンジン

Fish, powered by fish.audio, focuses on expressive English voiceovers. It works well for storytelling, conversational videos, and content that benefits from nuanced delivery.

ボイスエンジンと音声モデルを組み合わせることで、トーンや感情、話す速さから言語の正確さに至るまで、動画のサウンドを思い通りにコントロールできます。