Academy decor
Giọng nói

Các mô hình giọng nói là gì

Nếu bạn từng muốn nội dung của mình nghe tự nhiên hơn, mang tính cá nhân hơn, hoặc bám sát một giọng thương hiệu cụ thể hơn, thì các mô hình giọng nói có thể giúp bạn làm được điều đó.

Trong HeyGen, giọng nói giúp kịch bản và avatar của bạn trở nên sống động thông qua lời thuyết minh được tạo bằng AI. Mỗi giọng nói bạn chọn đều được vận hành bởi một bộ máy giọng nói, là mô hình được thiết kế để tạo ra giọng đọc tự nhiên, giàu biểu cảm và chuẩn xác về ngôn ngữ. Việc chọn đúng bộ máy giúp bạn phù hợp với tông giọng, nhịp độ và cảm xúc của thông điệp.

Mô hình giọng nói là gì

Mô hình giọng nói là hệ thống AI nền tảng tạo ra giọng nói. Nó quyết định giọng nói nghe như thế nào, mức độ biểu cảm ra sao, tốc độ nói nhanh hay chậm, và khả năng hoạt động tốt đến đâu trên nhiều ngôn ngữ khác nhau.

HeyGen cung cấp nhiều công cụ giọng nói, mỗi công cụ được tối ưu cho các trường hợp sử dụng khác nhau như đào tạo, tiếp thị, kể chuyện hoặc bản địa hóa.

Công cụ giọng nói tự động

Cài đặt Tự động cho phép HeyGen tự động chọn công cụ giọng nói phù hợp nhất dựa trên ngôn ngữ và nội dung video của bạn. Đây là một lựa chọn tốt nếu bạn muốn có kết quả ổn định mà không cần tự tay chọn mô hình.

Công cụ giọng nói ElevenLabs

ElevenLabs cung cấp giọng thuyết minh chất lượng phòng thu bằng hơn 70 ngôn ngữ, phù hợp cho hầu hết các dự án video và âm thanh.

Nếu bạn đang sử dụng giọng nói tùy chỉnh, bạn cũng có thể chọn mẫu giọng nói dùng để tạo ra nó, giúp bạn kiểm soát tốt hơn về tông giọng và mức độ chân thực. Theo mặc định, HeyGen sử dụng mẫu giọng nói đa ngôn ngữ V3 từ ElevenLabs, vốn nổi tiếng với khả năng diễn đạt tự nhiên và hiệu suất mạnh mẽ trên nhiều ngôn ngữ.

Mô hình giọng nói Turbo

Đối với các dự án cần tạo nội dung nhanh hơn, bạn có thể chuyển sang một trong các mô hình Turbo. Chúng mang lại độ trễ thấp hơn và xử lý nhanh hơn, nhưng chủ yếu được tối ưu cho nội dung tiếng Anh.

Công cụ giọng nói Starfish

Starfish được tối ưu cho các ngôn ngữ châu Á, bao gồm tiếng Trung, tiếng Nhật và tiếng Hàn. Công cụ này đảm bảo cách phát âm tự nhiên và nhịp điệu phù hợp cho nội dung theo từng khu vực.

Công cụ giọng nói Panda

Panda là công cụ giọng nói giàu biểu cảm của HeyGen, được thiết kế để truyền tải cảm xúc và mang lại khả năng điều khiển nâng cao. Nó hỗ trợ các tính năng như Voice Director và Voice Mirroring, cho phép kiểm soát chính xác thời gian, nhấn nhá và ngữ điệu.

Công cụ giọng nói Fish

Fish, được hỗ trợ bởi fish.audio, tập trung vào các giọng đọc tiếng Anh giàu biểu cảm. Nó hoạt động rất hiệu quả cho kể chuyện, video mang tính đối thoại và những nội dung cần cách truyền tải tinh tế, giàu sắc thái.

Kết hợp lại, các công cụ giọng nói và mô hình cho bạn quyền kiểm soát cách video của bạn phát ra âm thanh, từ giọng điệu và cảm xúc đến tốc độ và độ chính xác ngôn ngữ.