Понедельник, 1 июня, 2026
Google search engine
ДомойАвтоматизацияApple делает крупный AI Advance с технологией генерации изображений, соперничающих с Dall-E...

Apple делает крупный AI Advance с технологией генерации изображений, соперничающих с Dall-E и Midjourney


Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас


Исследовательская группа Apple по машинному обучению разработала прорывную систему ИИ для создания изображений с высоким разрешением, которая может бросить вызов доминированию диффузионных моделей, технологии, обеспечивающие популярные генераторы изображений, такие как Dall-E и Midjourney.

Содействие, подробно описанное в исследовательской статье, опубликованной на прошлой неделе, представляет «Starflow», систему, разработанную исследователями Apple в сотрудничестве с академическими партнерами, которая сочетает в себе нормализацию потоков с авторегрессивными трансформаторами для достижения того, что команда называет «конкурентоспособными показателями» с современными моделями диффузии.

Прорыв наступает в критический момент для Apple, который столкнулся с растущей критикой за свою борьбу с искусственным интеллектом. На всемирной конференции разработчиков в понедельник компания представила только скромные обновления AI на своей платформе Apple Intelligence, подчеркивая конкурентное давление, стоящее перед компанией, которую многие считают отставшим в гонке AI Arms.

«Насколько нам известно, эта работа является первой успешной демонстрацией нормализации потоков, работающих эффективно в таком масштабе и разрешении», — написали исследовательскую группу, в которую входят исследователи Apple Machine Learning Jiatao Gu, Джошуа М. Суссинд и Шуанфей Чжай, а также академические сотрудники из таких учреждений, как Калифорнийский университет, Беркели и геордская технология.

Как Apple сопротивляется Openai и Google в войнах ИИ

Исследование Starflow представляет собой более широкие усилия Apple по разработке отличительных возможностей ИИ, которые могут отличить его продукты от конкурентов. В то время как такие компании, как Google и Openai, доминировали в заголовках с их генеративными достижениями искусственного интеллекта, Apple работает над альтернативными подходами, которые могут предложить уникальные преимущества.

Исследовательская группа решила фундаментальную проблему в генерации изображений искусственного интеллекта: масштабирование нормализации потоков для эффективной работы с изображениями с высоким разрешением. Нормализация потоков, тип генеративной модели, которая учится трансформировать простые распределения в сложные, традиционно омрачалась диффузионными моделями и генеративными состязательными сетями в приложениях синтеза изображений.

«Starflow достигает конкурентной работы как в задачах, так и в создании текстовых кондиционированных изображений, подходя к современным моделям диффузии в качеством выборки»,-пишет исследователи, демонстрируя универсальность системы по различным типам проблем синтеза изображений.

Внутри математического прорыва, который поддерживает новую систему ИИ от Apple

Исследовательская группа Apple представила несколько ключевых инноваций, чтобы преодолеть ограничения существующих нормализующих подходов к потоку. Система использует то, что исследователи называют «глубоким дизайном», используя «глубокий блок трансформатора (который) отражает большую часть модельного репрезентативного потенциала, дополненного несколькими мелкими блоками трансформатора, которые являются вычислительно эффективными, но существенно полезными».

Прорыв также включает в себя работу в «скрытом пространстве предварительных автоходоров, что оказывается более эффективным, чем прямое моделирование на уровне пикселей», согласно документу. Этот подход позволяет модели работать с сжатыми представлениями изображений, а не с необработанными пиксельными данными, значительно повышая эффективность.

В отличие от диффузионных моделей, которые полагаются на итерационные процессы двойного обзора, Starflow сохраняет математические свойства нормализации потоков, обеспечивая «точное максимальное обучение в непрерывных пространствах без дискретизации».

Что означает Starflow для будущих продуктов Apple iPhone и Mac

Исследование поступает, когда Apple сталкивается с растущим давлением, чтобы продемонстрировать значимый прогресс в искусственном интеллекте. Недавний анализ Bloomberg подчеркнул, как Apple Intelligence и Siri изо всех сил пытались конкурировать с конкурентами. Скромные объявления Apple в WWDC на этой неделе подчеркнули проблемы компании в пространстве искусственного интеллекта.

Для Apple точное обучение STARFLOW по точным вероятности может предложить преимущества в приложениях, требующих точного контроля над генерируемым контентом или в сценариях, где понимание неопределенности модели имеет решающее значение для принятия решений-потенциально ценных для предприятий и возможностей ИИ, которые подчеркнули Apple.

Исследование демонстрирует, что альтернативные подходы к диффузионным моделям могут достичь сопоставимых результатов, потенциально открывая новые возможности для инноваций, которые могут сыграть в сильных сторонах Apple в интеграции оборудования и обработки на устройстве.

Почему Apple делает ставки на университетские партнерские отношения, чтобы решить свою проблему ИИ

Исследование иллюстрирует стратегию Apple по сотрудничеству с ведущими академическими учреждениями для продвижения своих возможностей ИИ. Соавтор Tianrong Chen, докторант в Georgia Tech, который прошел стажировку в исследовательской группе Apple машинного обучения, обладает опытом в области стохастического оптимального контроля и генеративного моделирования.

Сотрудничество также включает в себя Руиксан Чжан из математического отделения Калифорнийского университета в Беркли и Лаврента Динха, исследователя машинного обучения, известного своей новаторской работой над моделями, основанными на потоках, в Google Brain и DeepMind.

«Крайне, наша модель остается сквозной нормализующим потоком»,-подчеркнули исследователи, отличая свой подход от гибридных методов, которые жертвуют математической трактацией для повышения производительности.

Полный исследовательский документ доступен на ARXIV, предоставляя технические детали для исследователей и инженеров, стремящихся создать эту работу в конкурентной области генеративного ИИ. В то время как Starflow представляет собой значительное техническое достижение, реальным тестом будет то, сможет ли Apple перевести такие исследования в исследования в такие функции искусственного интеллекта для потребителей, которые сделали конкурентов, таких как имена в домашних условиях CHATGPT. Для компании, которая когда -то революционизировала целые отрасли с такими продуктами, как iPhone, вопрос не в том, может ли Apple инновация в области искусственного интеллекта — это могут ли они сделать это достаточно быстро.



Источник
РЕКОМЕНДУЕМ

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

- Advertisment -
Google search engine

Популярное

Последние комментарии