16.05.2024
17

Google I/O 2024: aspectos más destacados

Sergej Ostrovskij
Editor jefe en ApiX-Drive
Tiempo de leer: ~2 min

La conferencia Google I/O 2024 mostró varios avances y anuncios interesantes. Aquí hay una breve descripción general de las principales actualizaciones:

Gemini 1.5 Pro

El modelo de IA generativa Gemini ha recibido una actualización significativa y ahora es capaz de analizar documentos, bases de código, vídeos y grabaciones de audio más extensos. La última versión, Gemini 1.5 Pro, revelada en un avance privado, puede procesar hasta 2 millones de tokens, duplicando la capacidad anterior.

Gemini Live

Se introdujo Gemini Live, que permite a los usuarios tener chats de voz "profundos" con Gemini en sus teléfonos inteligentes. Los usuarios pueden interrumpir para hacer preguntas aclaratorias y Gemini se adapta a sus patrones de habla en tiempo real. Además, Gemini puede ver y responder a su entorno a través de fotografías o vídeos capturados por las cámaras de los teléfonos inteligentes.

Gemini on Android

Gemini pronto reemplazará al Google Assistant en Android, integrándose profundamente con el sistema operativo móvil y las aplicaciones de Google. Los usuarios pueden arrastrar y soltar imágenes generadas por IA en Gmail, Google Messages y otras aplicaciones. Los usuarios de YouTube pueden utilizar la función "Ask this video" para encontrar información específica de los vídeos.

Gemini Nano

Google está integrando Gemini Nano, su modelo de IA más pequeño, directamente en el cliente de escritorio Chrome, comenzando con Chrome 126. Esto permitirá a los desarrolladores utilizar el modelo en el dispositivo para mejorar sus propias funciones de IA.

Veo

Veo es un modelo de inteligencia artificial que crea videoclips de 1080p de hasta un minuto de duración a partir de un mensaje de texto. Captura varios estilos visuales y cinematográficos, incluidos paisajes y lapsos de tiempo, y puede editar metraje existente.

Firebase Genkit

El nuevo Firebase Genkit tiene como objetivo simplificar el desarrollo de aplicaciones impulsadas por IA en JavaScript/TypeScript, y próximamente será compatible con Go. Este marco de código abierto bajo la licencia Apache 2.0 permite a los desarrolladores integrar rápidamente la IA en aplicaciones nuevas y existentes.

Ask Photos

Lanzada a finales de este verano, la función "Ask Photos" en Google Photos, impulsada por Gemini AI, permitirá a los usuarios buscar en sus colecciones de fotografías mediante consultas en lenguaje natural.

¡Manténgase actualizado con estos desarrollos innovadores de Google I/O 2024!