Слушайте ваше воображение: одиннадцать лабсов для запуска ИИ для звуковых эффектов

04.08.2025

62

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

После овладания искусством клонирования и синтеза на основе искусства машинного обучения (ML), ElevenLabs, двухлетнего стартапа ИИ, основанного бывшими сотрудниками Google и Palantir, переезжает на расширение своего портфеля с помощью новой модели текста-звука.

Дразнив несколько часов назад, ИИ позволит создателям генерировать звуковые эффекты, просто описывая свое воображение словами. Ожидается, что он обогатит контент по-новому в эпоху цифрового опыта, управляемого искусственным интеллектом.

Модель не доступна публично, но ElevenLabs продемонстрировала свои возможности, выпустив типов в минуту с изображением видеороликов, созданных New Sora от Openai и расширенного со своими собственными звуками ИИ. Компания также настроила страницу регистрации и звонит потенциальным пользователям, чтобы присоединиться к списку ожидания раннего доступа для модели.

Мы были поражены объявлением Соры, но чувствовали, что это что -то нужно …

Что если бы вы могли описать звук и генерировать его с помощью ИИ? pic.twitter.com/hcuxq7wndg
— ElevenLabs (@ElevenLabsio) 18 февраля 2024 года

Выходя за рамки голоса с звуковыми эффектами ИИ

Основанная в 2022 году, ElevenLabs исследует ИИ для создания аудио и видеоконтента — от фильмов до подкастов — доступных между языками и географией. Компания дебютировала на целый ряд предложений для дальнейшего этого, включая модели текста в речь и речи к речи, которые могут создавать речь ИИ из данного фрагмента контента (текст/аудио/видео) на 29 различных языках, в то же время обеспечивая естественный голос и эмоции (оригинальный голос динамика в речи).

В то время как оба этих инструмента продолжают видеть широкое распространение со стороны предприятий и отдельных лиц, которые производят контент, также наблюдается рост полностью сгенерированного AI контента, благодаря таким инструментам, как взлетно-посадочная полоса, Pika и совсем недавно Openai (с Sora). Эти продукты генерируют реалистичные видео с искусственным интеллектом из простых текстовых подсказок, но им не хватает звука по умолчанию. Именно здесь появится новая модель ElevenLabs, что позволяет пользователям производить звуковые эффекты для своего контента, описывая то, что они хотят.

При использовании, это предложение может легко позволить создателям ИИ улучшить свою работу с помощью фоновых звуков, которые должны естественным образом поступать с ним. Звуковой эффект может быть чем угодно, от щебетающих птиц до движущихся транспортных средств и рогов. Это могут даже люди разговаривать, есть или ходить по оживленной улице.

«В ElevenLabs мы только когда-либо показывали наши модели текста в речь. Однако у нас гораздо больше в разработке. И когда Openai объявила о своей модели Sora-которая генерирует невероятные видео, но без звука-мы решили показать краткий обзор нашей новой линейки продуктов»,-Luke Harries, который возглавляет рост в Eledenlabs, написал, что в то время как упрощение x-rehignlablabs, в то время как он выступал в стиле «Увеличение сорта», в то время как он был упрощенно с помощью SORES-Gunse-Gense-Gense-Gunsedos. от модели компании.

Помимо контента, сгенерированного AI, звуки, изготовленные из новой модели, могут даже применяться к простой речи, произведенной из текста или любого другого видео-клипа Instagram, коммерческого или трейлера для видеоигр-который требует оттенка фонового звука. Еще неизвестно, как он используется и какое качество он обеспечивает.

В то время как ElevenLabs не поделился, когда планирует публично запустить модель, компания открыла подписи для раннего доступа. Заинтересованные пользователи могут перейти на эту страницу и зарегистрироваться на своем имени и электронной почте, описывая, для чего им нужны звуковые эффекты. ElevenLabs также просит ранних добровольцев написать образец подсказки для звукового эффекта ИИ, потенциально для оптимизации ответов модели.

После завершения регистрации пользователь включен в список ожидания и получит доступ, когда модель станет доступной. Временная шкала, однако, остается неопределенной на этом этапе.

Новая технология текста к звучанию может дать ElevenLabs преимущество первопроходца, но важно отметить, что несколько других компаний, которые активно участвуют в речевом пространстве искусственного интеллекта, также могут отправиться в этот сегмент. Это включает в себя известных игроков, таких как Murf.ai, Play.ht и Wellsaid Labs.

По данным Market US, мировой рынок таких инструментов составил 1,2 млрд. Долл. США в 2022 году и, по оценкам, достиг почти 5 миллиардов долларов в 2032 году, при этом CAGR немного превышает 15,40%.

Источник

Предыдущая статья

Как искусственный интеллект меняет образование, не вытесняя учителей

Следующая статья

Почему искусственный общий интеллект выходит за рамки глубокого обучения

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Пожалуйста, введите ваш комментарий!

пожалуйста, введите ваше имя здесь

Вы ввели неверный адрес электронной почты!

пожалуйста, введите свой адрес электронной почты здесь

Слушайте ваше воображение: одиннадцать лабсов для запуска ИИ для звуковых эффектов

Выходя за рамки голоса с звуковыми эффектами ИИ

Судья отклоняет большую часть иска о нарушении авторских прав Сары Сильверман против OpenAI

Исследователи Apple представляют «KeyFramer»: инструмент AI, который анимирует неподвижные изображения, используя LLMS

Salesforce выкатывает нативного генеративного ИИ внутри Slack: вот как это работает

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Популярное

Обновление Gemini AI убьет приватность на вашем Android?

Каким должен быть современный мессенджер

Топ-5 самых странных игровых консолей в истории — от 1970-х до 2020-х

Правила UEBA в SIEM-системе

Последние комментарии

ВЫБОР РЕДАКЦИИ

Как инструменты ИИ Гонга увеличивают ставки победы для команд продаж

Обзор realme C85 Pro: «неубиваемый» смартфон с огромной батареей

Как в Максе удалить контакт или добавить новый — простая инструкция

ПОПУЛЯРНОЕ

Обзор ИБП ДКС SMALL RACKMOUNT: серверы под надежной защитой

Первые впечатления от OpenAI o1: ИИ, созданный для глубоких размышлений

Operation ForumTroll: APT-атака с уязвимостью нулевого дня

КАТЕГОРИИ

О НАС

СЛЕДИТЕ ЗА НАМИ

Слушайте ваше воображение: одиннадцать лабсов для запуска ИИ для звуковых эффектов

Выходя за рамки голоса с звуковыми эффектами ИИ

Подпишитесь на ранний доступ

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Популярное

Последние комментарии

ВЫБОР РЕДАКЦИИ

ПОПУЛЯРНОЕ

КАТЕГОРИИ

О НАС

СЛЕДИТЕ ЗА НАМИ