Понедельник, 1 июня, 2026
Google search engine
ДомойАвтоматизацияСлушайте ваше воображение: одиннадцать лабсов для запуска ИИ для звуковых эффектов

Слушайте ваше воображение: одиннадцать лабсов для запуска ИИ для звуковых эффектов


Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас


После овладания искусством клонирования и синтеза на основе искусства машинного обучения (ML), ElevenLabs, двухлетнего стартапа ИИ, основанного бывшими сотрудниками Google и Palantir, переезжает на расширение своего портфеля с помощью новой модели текста-звука.

Дразнив несколько часов назад, ИИ позволит создателям генерировать звуковые эффекты, просто описывая свое воображение словами. Ожидается, что он обогатит контент по-новому в эпоху цифрового опыта, управляемого искусственным интеллектом.

Модель не доступна публично, но ElevenLabs продемонстрировала свои возможности, выпустив типов в минуту с изображением видеороликов, созданных New Sora от Openai и расширенного со своими собственными звуками ИИ. Компания также настроила страницу регистрации и звонит потенциальным пользователям, чтобы присоединиться к списку ожидания раннего доступа для модели.

Выходя за рамки голоса с звуковыми эффектами ИИ

Основанная в 2022 году, ElevenLabs исследует ИИ для создания аудио и видеоконтента — от фильмов до подкастов — доступных между языками и географией. Компания дебютировала на целый ряд предложений для дальнейшего этого, включая модели текста в речь и речи к речи, которые могут создавать речь ИИ из данного фрагмента контента (текст/аудио/видео) на 29 различных языках, в то же время обеспечивая естественный голос и эмоции (оригинальный голос динамика в речи).

В то время как оба этих инструмента продолжают видеть широкое распространение со стороны предприятий и отдельных лиц, которые производят контент, также наблюдается рост полностью сгенерированного AI контента, благодаря таким инструментам, как взлетно-посадочная полоса, Pika и совсем недавно Openai (с Sora). Эти продукты генерируют реалистичные видео с искусственным интеллектом из простых текстовых подсказок, но им не хватает звука по умолчанию. Именно здесь появится новая модель ElevenLabs, что позволяет пользователям производить звуковые эффекты для своего контента, описывая то, что они хотят.

При использовании, это предложение может легко позволить создателям ИИ улучшить свою работу с помощью фоновых звуков, которые должны естественным образом поступать с ним. Звуковой эффект может быть чем угодно, от щебетающих птиц до движущихся транспортных средств и рогов. Это могут даже люди разговаривать, есть или ходить по оживленной улице.

«В ElevenLabs мы только когда-либо показывали наши модели текста в речь. Однако у нас гораздо больше в разработке. И когда Openai объявила о своей модели Sora-которая генерирует невероятные видео, но без звука-мы решили показать краткий обзор нашей новой линейки продуктов»,-Luke Harries, который возглавляет рост в Eledenlabs, написал, что в то время как упрощение x-rehignlablabs, в то время как он выступал в стиле «Увеличение сорта», в то время как он был упрощенно с помощью SORES-Gunse-Gense-Gense-Gunsedos. от модели компании.

Помимо контента, сгенерированного AI, звуки, изготовленные из новой модели, могут даже применяться к простой речи, произведенной из текста или любого другого видео-клипа Instagram, коммерческого или трейлера для видеоигр-который требует оттенка фонового звука. Еще неизвестно, как он используется и какое качество он обеспечивает.

Подпишитесь на ранний доступ

В то время как ElevenLabs не поделился, когда планирует публично запустить модель, компания открыла подписи для раннего доступа. Заинтересованные пользователи могут перейти на эту страницу и зарегистрироваться на своем имени и электронной почте, описывая, для чего им нужны звуковые эффекты. ElevenLabs также просит ранних добровольцев написать образец подсказки для звукового эффекта ИИ, потенциально для оптимизации ответов модели.

После завершения регистрации пользователь включен в список ожидания и получит доступ, когда модель станет доступной. Временная шкала, однако, остается неопределенной на этом этапе.

Новая технология текста к звучанию может дать ElevenLabs преимущество первопроходца, но важно отметить, что несколько других компаний, которые активно участвуют в речевом пространстве искусственного интеллекта, также могут отправиться в этот сегмент. Это включает в себя известных игроков, таких как Murf.ai, Play.ht и Wellsaid Labs.

По данным Market US, мировой рынок таких инструментов составил 1,2 млрд. Долл. США в 2022 году и, по оценкам, достиг почти 5 миллиардов долларов в 2032 году, при этом CAGR немного превышает 15,40%.



Источник
РЕКОМЕНДУЕМ

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

- Advertisment -
Google search engine

Популярное

Последние комментарии