Academy decor
音声

音声モデルとは

コンテンツをもっと自然に、よりパーソナルに、あるいは特定のブランドボイスにより近づけたいと思ったことがあるなら、ボイスモデルを使えばそれが実現できます。

HeyGen では、音声が AI によるナレーションを通じて、あなたのスクリプトやアバターに命を吹き込みます。選択したすべての音声は「ボイスエンジン」と呼ばれるモデルによって動作しており、自然で表現力があり、言語的に正確な音声を生成するよう設計されています。適切なエンジンを選ぶことで、メッセージのトーン、話す速さ、感情を理想的な形で表現できます。

音声モデルとは何か

ボイスモデルとは、音声を生成する基盤となるAIシステムのことです。声の響きや表現力、話す速さ、そして複数の言語におけるパフォーマンスの良さを決定します。

HeyGen では、トレーニング、マーケティング、ストーリーテリング、ローカライズなど、さまざまなユースケースに最適化された複数の音声エンジンを提供しています。

自動音声エンジン

自動設定を使用すると、HeyGen が動画の言語やコンテンツに基づいて最適なボイスエンジンを自動的に選択します。モデルを手動で選ばずに、安定した結果を得たい場合に適したオプションです。

ElevenLabs ボイスエンジン

ElevenLabs は 70 を超える言語でスタジオ品質のナレーションを提供し、ほとんどの動画および音声プロジェクトに適したサービスです。

カスタムボイスを使用している場合、どのボイスモデルで動作させるかを選択できるため、声のトーンやリアリティをより細かくコントロールできます。デフォルトでは、HeyGen は ElevenLabs の多言語対応 V3 モデルを使用しており、自然な表現力と高い多言語性能で知られています。

ターボ音声モデル

より高速な生成が必要なプロジェクトでは、Turbo モデルのいずれかに切り替えることができます。これらはレイテンシが低く処理も高速ですが、主に英語コンテンツ向けに最適化されています。

Starfish ボイスエンジン

Starfish は、中国語、日本語、韓国語を含むアジアの言語向けに最適化されています。地域ごとのコンテンツに対して、自然な発音と話速を実現します。

Panda ボイスエンジン

Panda は HeyGen の表現力豊かな音声エンジンであり、感情豊かな読み上げと高度なコントロールのために設計されています。Voice Director や Voice Mirroring などの機能を備え、タイミング、強調、声のトーンを細かく制御することができます。

魚の音声エンジン

Fish は fish.audio を基盤とし、表現力豊かな英語のボイスオーバーに特化しています。物語性のあるコンテンツや会話形式の動画、繊細なニュアンス表現が求められるコンテンツとの相性がとても良好です。

ボイスエンジンと音声モデルを組み合わせることで、トーンや感情、話す速さから言語的な正確さに至るまで、動画のサウンドを思い通りにコントロールできます。