Was sind Sprachmodelle

Wenn Sie sich je gewuenscht haben, dass Ihre Inhalte natürlicher, persönlicher oder enger an einer bestimmten Markenstimme ausgerichtet klingen, machen Sprachmodelle das möglich.

In HeyGen erwecken Stimmen Ihre Skripte und Avatare mit KI-generierter Vertonung zum Leben. Jede von Ihnen gewählte Stimme wird von einer Voice-Engine angetrieben – einem Modell, das darauf ausgelegt ist, natürliche, ausdrucksstarke und sprachlich präzise Sprache zu erzeugen. Wenn Sie die richtige Engine wählen, können Sie Tonfall, Tempo und Emotion Ihrer Botschaft optimal abstimmen.

Was Sprachmodelle sind

Ein Sprachmodell ist das zugrunde liegende KI-System, das Sprache generiert. Es bestimmt, wie eine Stimme klingt, wie ausdrucksstark sie ist, wie schnell sie spricht und wie gut sie in verschiedenen Sprachen funktioniert.

HeyGen bietet mehrere Sprach-Engines, die jeweils für unterschiedliche Anwendungsfaelle wie Schulung, Marketing, Storytelling oder Lokalisierung optimiert sind.

Automatisierte Sprach-Engine

Die Auto-Einstellung erlaubt HeyGen, automatisch die beste Voice-Engine basierend auf der Sprache und dem Inhalt Ihres Videos auszuwählen. Dies ist eine gute Option, wenn Sie zuverlaessige Ergebnisse wuenschen, ohne das Modell manuell auswaehlen zu muessen.

ElevenLabs Sprach-Engine

ElevenLabs bietet Studio-Qualität bei der Vertonung in mehr als 70 Sprachen und eignet sich damit für die meisten Video- und Sprachprojekte.

Wenn Sie eine benutzerdefinierte Stimme verwenden, koennen Sie auch auswaehlen, welches Sprachmodell sie steuert, um den Tonfall und die Realitaetsnaehe noch praeziser zu kontrollieren. Standardmaessig verwendet HeyGen das mehrsprachige V3-Modell von ElevenLabs, das fuer natuerlichen Ausdruck und starke mehrsprachige Leistung bekannt ist.

Turbo-Stimmenmodelle

Für Projekte, die eine schnellere Generierung benötigen, können Sie auf eines der Turbo-Modelle wechseln. Diese bieten eine geringere Latenz und eine schnellere Verarbeitung, sind jedoch in erster Linie für englische Inhalte optimiert.

Starfish-Sprach-Engine

Starfish ist für asiatische Sprachen optimiert, darunter Chinesisch, Japanisch und Koreanisch. Es sorgt für eine natürliche Aussprache und ein passendes Sprechtempo für regionsspezifische Inhalte.

Panda-Sprach-Engine

Panda ist HeyGens ausdrucksstarker Engine, entwickelt für emotionale Wiedergabe und erweiterte Steuerung. Es unterstützt Funktionen wie Voice Director und Voice Mirroring und ermöglicht eine präzise Kontrolle von Timing, Betonung und Tonfall.

Fish Voice Engine

Fish, betrieben von fish.audio, konzentriert sich auf ausdrucksstarke englische Voiceovers. Es eignet sich gut für Storytelling, gesprochene Videos und Inhalte, die von einer nuancierten Darbietung profitieren.

Gemeinsam geben Ihnen Sprach-Engines und -Modelle die Kontrolle darueber, wie Ihre Videos klingen – von Tonfall und Emotion über Geschwindigkeit bis hin zur sprachlichen Praezision.