16.05.2024
650

Google I/O 2024: ключевые моменты

Сергей Островский
Главный редактор ApiX-Drive
Время прочтения: ~6 мин

Конференция Google I/O 2024 года отличилась несколькими интересными анонсами. Вот краткий обзор основных обновлений:

Gemini 1.5 Pro

Генеративная модель искусственного интеллекта Gemini была значительно обновлена, теперь она способна анализировать более длинные документы, кодовые базы, видео и аудиозаписи. Последняя версия, Gemini 1.5 Pro, представленная в приватном предварительном просмотре, может обрабатывать до 2 миллионов токенов, удваивая предыдущую мощность.

Gemini Live

Был представлен Gemini Live, позволяющий пользователям проводить голосовые чаты с Gemini на своих смартфонах. Пользователи могут прерывать чат-бот, чтобы задать уточняющие вопросы, а Gemini адаптируется к моделям речи в режиме реального времени. Кроме того, Gemini может видеть и реагировать на окружающую среду с помощью фотографий или видео, снятых камерами смартфонов.

Gemini on Android

В скором времени Gemini заменит Google Assistant на Android, глубоко интегрируясь с мобильной ОС и приложениями Google. Пользователи смогут перетаскивать изображения, созданные искусственным интеллектом, в Gmail, Google Messages и другие приложения. Пользователи YouTube смогут использовать функцию "Ask this video", чтобы найти определенную информацию в видео.

Gemini Nano

Google интегрирует Gemini Nano, свою младшую модель искусственного интеллекта, непосредственно в клиент Chrome, начиная с Chrome 126. Это позволит разработчикам использовать модель на устройстве для улучшения собственных функций искусственного интеллекта.

Veo

Veo – это модель искусственного интеллекта, создающая видеоролики 1080p продолжительностью до одной минуты из текстовой подсказки. Она использует различные визуальные и кинематографические стили, а также редактирует существующие кадры.

Firebase Genkit

Новый Firebase Genkit преследует цель упростить разработку ИИ-приложений на JavaScript/TypeScript, вскоре появится поддержка Go. Этот фреймворк с открытым кодом под лицензией Apache 2.0 позволяет разработчикам быстро интегрировать искусственный интеллект в новые и существующие программы.

Ask Photos

Позже этим летом будет запущена функция "Ask Photos" в Google Photos на основе искусственного интеллекта Gemini, которая позволит пользователям искать свои коллекции фотографий с помощью запросов на естественном языке.