Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас
Сегодня Google DeepMind представила Gemma, ее новые модели с открытым исходным кодом 2B и 7B, созданные из тех же исследований и технологий, которые использовались для создания недавно объявленных моделей Близнецов компании.
Google Deepmind сказал, что в сообщении в блоге сообщили, что модели GEMMA будут выпущены с предварительно обученными и настроенными на инструкциями. Веса модели будут выпущены с разрешающей коммерческой лицензией, а также новым ответственным генеративным инструментом ИИ.
Google также предоставляет инструменты для вывода и контролируемой тонкой настройки (SFT) во всех основных структурах: JAX, Pytorch и TensorFlow через Native Keras 3.0. Существуют готовые к использованию ноутбуки Colab и Kaggle, а Джемма интегрирована с обнимающим лицом, Maxtext и Nvidia Nemo. Предварительно обученные и настроенные инструкции модели Джеммы могут работать на ноутбуке, рабочей станции или Google Cloud с развертыванием на двигателе Vertex AI и Google Kubernetes.
Nvidia также объявила сегодня, что в сотрудничестве с Google он запустил оптимизацию на всех платформах NVIDIA AI, включая локальные ПК RTX AI, для ускорения производительности Gemma.
Google теперь предлагает как API, так и открытые модели для рабочего процесса
Джанин Бэнкс, вице -президент и генеральный менеджер по разработчику X и руководителям девеловых отношений в Google, заявила VentureBeat на брифинге для прессы, что модели Gemma «чувствовали себя как продолжение» после истории Google Open Sourcing Tech для разработки ИИ, от таких инструментов, как Tensorflow и Jax, до других моделей и систем ИИ, таких как Palm2 и AlphaFold, ведущий к Gemini.
Она также сказала, что благодаря обратной связи во время разработки моделей Близнецов Google DeepMind «получила ключевое понимание, которое, в некоторых случаях, разработчики будут использовать как открытые модели, так и API в дополнение к их рабочему процессу в зависимости от стадии рабочего потока, в котором они находятся».
По ее словам, поскольку разработчики экспериментируют и делают раннее прототипирование, может быть легко начать с API для проверки подсказок, а затем обратиться к настройке и точной настройке с открытыми моделями. «Мы чувствовали, что было бы идеально, если бы Google мог бы быть единственным поставщиком как API, так и открытых моделей, которые предложили самые широкие возможности для работы сообщества».
Google DeepMind выпустит полный набор тестов
Трис Варкентин, директор по управлению продуктами для Google DeepMind, заявила на брифинге VentureBeat, что компания выпустит полный набор тестов, оценивающих Джемму против других моделей, которые каждый может увидеть в плате лидеров OpenLLM.
«Мы сотрудничаем как с Nvidia, так и обнимающим лицом, так что почти любой эталон, который находится в общественной сфере, был вынесен против этих моделей», — сказал он. «Это полностью прозрачный и открытый общественный подход, так что мы на самом деле очень гордимся, потому что, когда вы смотрите на цифры, я думаю, что мы проделали чертовски хорошую работу».
Джемма называется «ответственным по дизайну»
Варкентин также подчеркнул безопасность Джеммы: «Все они были широко оценены как самые безопасные модели, которые мы могли бы выпустить на рынок в этих размерах, наряду с предварительным обучением и оценкой»,-сказал он.
В блоге Google DeepMind говорится, что «Gemma разработана с нашими принципами ИИ на переднем крае. В рамках того, чтобы сделать предварительно обученные модели Gemma безопасными и надежными, мы использовали автоматизированные методы для фильтрации определенной личной информации и других конфиденциальных данных из обучающих наборов. Кроме того, мы использовали обширные тонкие настройки и подкрепление к получению с обратной обратной связи (RLHF) для выравнивания наших инструкций с настройки с помощью призывных к примечанию с причастными к поведению в« Ответственные модели »с« Ответственными моделями ». Модели GEMMA, мы провели надежные оценки, включая ручную красную команду, автоматизированное состязательное тестирование и оценки модельных возможностей для опасных действий.
В дополнение к безопасности Варкентин подчеркнул роль открытой экосистемы в воспитании ответственного ИИ.
«Мы думаем, что это действительно важно — нам нужны разнообразные взгляды от разработчиков и исследователей по всему миру, чтобы получить правильную обратную связь и построить еще лучшие системы безопасности», — сказал он. «Таким образом, часть открытого модельного путешествия состоит в том, чтобы убедиться, что мы интегрируем (эти перспективы), и что обратная связь, общение с сообществом, является важной частью того, как мы рассматриваем ценность этого проекта».
Источник


