Các mô hình giọng nói là gì

Nếu bạn từng muốn nội dung của mình nghe tự nhiên hơn, mang tính cá nhân hơn hoặc phù hợp chặt chẽ hơn với một giọng thương hiệu cụ thể, thì các mô hình giọng nói sẽ giúp bạn làm được điều đó.

Trong HeyGen, giọng nói giúp kịch bản và avatar của bạn trở nên sống động thông qua lời thuyết minh được tạo bằng AI. Mỗi giọng nói bạn chọn đều được vận hành bởi một bộ máy giọng nói, tức một mô hình được thiết kế để tạo ra giọng đọc tự nhiên, giàu biểu cảm và chuẩn xác về ngôn ngữ. Việc chọn đúng bộ máy giúp bạn phù hợp với tông giọng, nhịp độ và cảm xúc của thông điệp.

Các mẫu giọng nói là gì

A voice model is the underlying AI system that generates speech. It determines how a voice sounds, how expressive it is, how fast it speaks, and how well it performs across languages.

HeyGen cung cấp nhiều công cụ giọng nói, mỗi công cụ được tối ưu cho các trường hợp sử dụng khác nhau như đào tạo, tiếp thị, kể chuyện hoặc bản địa hóa.

Công cụ giọng nói tự động

Cài đặt Auto cho phép HeyGen tự động chọn công nghệ giọng nói phù hợp nhất dựa trên ngôn ngữ và nội dung video của bạn. Đây là lựa chọn tốt nếu bạn muốn có kết quả ổn định mà không cần tự tay chọn từng mô hình.

ElevenLabs voice engine

ElevenLabs cung cấp giọng thuyết minh chất lượng phòng thu với hơn 70 ngôn ngữ, phù hợp cho hầu hết các dự án video và âm thanh.

Nếu bạn đang sử dụng giọng nói tùy chỉnh, bạn cũng có thể chọn mẫu giọng nói dùng để tạo ra nó, giúp kiểm soát tốt hơn về tông giọng và mức độ chân thực. Theo mặc định, HeyGen sử dụng mẫu giọng nói đa ngôn ngữ V3 từ ElevenLabs, nổi tiếng với khả năng biểu đạt tự nhiên và hiệu suất mạnh mẽ trên nhiều ngôn ngữ.

Mô hình giọng nói Turbo

For projects that need faster generation, you can switch to one of the Turbo models. These offer lower latency and quicker processing, but are primarily optimized for English content.

Starfish voice engine

Starfish được tối ưu cho các ngôn ngữ châu Á, bao gồm tiếng Trung, tiếng Nhật và tiếng Hàn. Công cụ này đảm bảo cách phát âm và nhịp điệu tự nhiên cho nội dung phù hợp với từng khu vực.

Công cụ giọng nói Panda

Panda is HeyGen’s expressive engine, designed for emotional delivery and advanced control. It supports features like Voice Director and Voice Mirroring, allowing precise control over timing, emphasis, and tone.

Fish voice engine

Fish, được hỗ trợ bởi fish.audio, tập trung vào các bản lồng tiếng tiếng Anh giàu cảm xúc. Nó hoạt động rất hiệu quả cho kể chuyện, video mang tính đối thoại và những nội dung cần cách truyền tải tinh tế, nhiều sắc thái.

Kết hợp lại, các công cụ và mô hình giọng nói cho bạn quyền kiểm soát cách video của bạn phát ra âm thanh, từ giọng điệu và cảm xúc đến tốc độ và độ chính xác ngôn ngữ.