OpenAI разработала модель Voice Engine, способную имитировать голос человека на основе предоставленной аудиозаписи. Нейросеть можно использовать для озвучивания текстов на различных языках, включая английский, французский, испанский, китайский и другие. Voice Engine сохраняет особенности оригинального голоса, что позволяет генерировать речь с уникальным акцентом.
Нейросеть способна воссоздать голос на основе 15-секундной записи голоса человека.
Несмотря на широкие возможности Voice Engine, компания OpenAI пока не открывает общественного доступа к данному сервису в целях безопасности. Компания активно ведёт переговоры с партнёрами относительно вопросов прозрачности использования и защиты от потенциальных злоумышленников, внедряя различные меры безопасности, включая водяные знаки на аудиоданных.
Комментарии (0)