Google представил Gemini, модель искусственного интеллекта (ИИ)
Новая большая языковая модель будет включать три варианта с разным масштабом решаемых задач: наиболее мощная Gemini Ultra; Gemini Pro (для широкого спектра задач) и Gemini Nano (для конкретных задач и мобильных устройств).
Google, в частности, продемонстрировала, что Gemini может сделать скриншот диаграммы, проанализировать сотни страниц исследования, а затем обновить диаграмму на основе анализа. Другим примером ее работы был анализ фотографии домашнего задания по математике, определение правильных ответов и указание на неправильные.
В сообщении компании в корпоративном блоге отмечается, что Gemini Ultra — первая модель, которая превосходит экспертов-людей по массовому пониманию языка в многозадачном режиме (MMLU) — использует комбинацию из 57 направлений знаний, таких как математика, физика, история, юриспруденция, медицина и этика. Вероятно, она сможет понимать нюансы и рассуждать по сложным предметам, полагают в компании.
«Gemini — это результат масштабных совместных усилий команд по всей Google, включая наших коллег из Google Research», — написал генеральный директор компании Сундар Пичаи в блоге. По его словам, новый ИИ «был создан с нуля как мультимодальный»: он может обобщать и легко понимать, оперировать и комбинировать различные типы информации, включая текст, код, аудио, изображения и видео. «Эта новая эра моделей представляет собой одно из крупнейших научных и инженерных достижений, которые мы предприняли как компания», — отметил Пичаи.