Google DeepMind возвращается в гонку с открытым исходным кодом с новой моделью Gemma Gemma

03.08.2025

221

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас

Сегодня Google DeepMind представила Gemma, ее новые модели с открытым исходным кодом 2B и 7B, созданные из тех же исследований и технологий, которые использовались для создания недавно объявленных моделей Близнецов компании.

Google Deepmind сказал, что в сообщении в блоге сообщили, что модели GEMMA будут выпущены с предварительно обученными и настроенными на инструкциями. Веса модели будут выпущены с разрешающей коммерческой лицензией, а также новым ответственным генеративным инструментом ИИ.

Google также предоставляет инструменты для вывода и контролируемой тонкой настройки (SFT) во всех основных структурах: JAX, Pytorch и TensorFlow через Native Keras 3.0. Существуют готовые к использованию ноутбуки Colab и Kaggle, а Джемма интегрирована с обнимающим лицом, Maxtext и Nvidia Nemo. Предварительно обученные и настроенные инструкции модели Джеммы могут работать на ноутбуке, рабочей станции или Google Cloud с развертыванием на двигателе Vertex AI и Google Kubernetes.

Nvidia также объявила сегодня, что в сотрудничестве с Google он запустил оптимизацию на всех платформах NVIDIA AI, включая локальные ПК RTX AI, для ускорения производительности Gemma.

Google теперь предлагает как API, так и открытые модели для рабочего процесса

Джанин Бэнкс, вице -президент и генеральный менеджер по разработчику X и руководителям девеловых отношений в Google, заявила VentureBeat на брифинге для прессы, что модели Gemma «чувствовали себя как продолжение» после истории Google Open Sourcing Tech для разработки ИИ, от таких инструментов, как Tensorflow и Jax, до других моделей и систем ИИ, таких как Palm2 и AlphaFold, ведущий к Gemini.

Она также сказала, что благодаря обратной связи во время разработки моделей Близнецов Google DeepMind «получила ключевое понимание, которое, в некоторых случаях, разработчики будут использовать как открытые модели, так и API в дополнение к их рабочему процессу в зависимости от стадии рабочего потока, в котором они находятся».

По ее словам, поскольку разработчики экспериментируют и делают раннее прототипирование, может быть легко начать с API для проверки подсказок, а затем обратиться к настройке и точной настройке с открытыми моделями. «Мы чувствовали, что было бы идеально, если бы Google мог бы быть единственным поставщиком как API, так и открытых моделей, которые предложили самые широкие возможности для работы сообщества».

Google DeepMind выпустит полный набор тестов

Трис Варкентин, директор по управлению продуктами для Google DeepMind, заявила на брифинге VentureBeat, что компания выпустит полный набор тестов, оценивающих Джемму против других моделей, которые каждый может увидеть в плате лидеров OpenLLM.

«Мы сотрудничаем как с Nvidia, так и обнимающим лицом, так что почти любой эталон, который находится в общественной сфере, был вынесен против этих моделей», — сказал он. «Это полностью прозрачный и открытый общественный подход, так что мы на самом деле очень гордимся, потому что, когда вы смотрите на цифры, я думаю, что мы проделали чертовски хорошую работу».

Джемма называется «ответственным по дизайну»

Варкентин также подчеркнул безопасность Джеммы: «Все они были широко оценены как самые безопасные модели, которые мы могли бы выпустить на рынок в этих размерах, наряду с предварительным обучением и оценкой»,-сказал он.

В блоге Google DeepMind говорится, что «Gemma разработана с нашими принципами ИИ на переднем крае. В рамках того, чтобы сделать предварительно обученные модели Gemma безопасными и надежными, мы использовали автоматизированные методы для фильтрации определенной личной информации и других конфиденциальных данных из обучающих наборов. Кроме того, мы использовали обширные тонкие настройки и подкрепление к получению с обратной обратной связи (RLHF) для выравнивания наших инструкций с настройки с помощью призывных к примечанию с причастными к поведению в« Ответственные модели »с« Ответственными моделями ». Модели GEMMA, мы провели надежные оценки, включая ручную красную команду, автоматизированное состязательное тестирование и оценки модельных возможностей для опасных действий.

В дополнение к безопасности Варкентин подчеркнул роль открытой экосистемы в воспитании ответственного ИИ.

«Мы думаем, что это действительно важно — нам нужны разнообразные взгляды от разработчиков и исследователей по всему миру, чтобы получить правильную обратную связь и построить еще лучшие системы безопасности», — сказал он. «Таким образом, часть открытого модельного путешествия состоит в том, чтобы убедиться, что мы интегрируем (эти перспективы), и что обратная связь, общение с сообществом, является важной частью того, как мы рассматриваем ценность этого проекта».

Источник

Предыдущая статья

История одного инцидента: ransomware-атака на UnitedHealth

Следующая статья

От идеи до 17 миллионов пользователей: как Gamma меняет правила игры в мире презентаций

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Пожалуйста, введите ваш комментарий!

пожалуйста, введите ваше имя здесь

Вы ввели неверный адрес электронной почты!

пожалуйста, введите свой адрес электронной почты здесь

Google DeepMind возвращается в гонку с открытым исходным кодом с новой моделью Gemma Gemma

Google теперь предлагает как API, так и открытые модели для рабочего процесса

Google DeepMind выпустит полный набор тестов

Джемма называется «ответственным по дизайну»

Судья отклоняет большую часть иска о нарушении авторских прав Сары Сильверман против OpenAI

Исследователи Apple представляют «KeyFramer»: инструмент AI, который анимирует неподвижные изображения, используя LLMS

Salesforce выкатывает нативного генеративного ИИ внутри Slack: вот как это работает

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Популярное

Когда ИИ подменяет выбор: как цифровые помощники могут лишать человека автономии

Подписка или гадость? Следи за подписками с комфортом

Обзор 3D-принтера Bambu Lab P2S Combo: продвинутая модель с простыми настройками

Hioperator представляет QASCOUT, устанавливая новые стандарты в качестве поддержки клиентов

Последние комментарии

ВЫБОР РЕДАКЦИИ

Поддельные Green Pass из Интернета — что может пойти не так

Обзор смартфона HONOR 400: больше мегапикселей, больше нейросетей

Как не разориться на цифровизации в промышленности

ПОПУЛЯРНОЕ

Обзор HONOR 600 Lite: стильный смартфон для прагматиков

Атака инфостилера с маскировкой активности

Антропик только что сделал каждому пользователю Claude разработчиком приложений без кода

КАТЕГОРИИ

О НАС

СЛЕДИТЕ ЗА НАМИ