Google ha comenzado su conferencia anual de desarrolladores esta tarde, E/S de Google. Se trata de un evento cuyo protagonismo, tradicionalmente, ha estado monopolizado Androide y el ecosistema de aplicaciones de Google, pero el año pasado ya concedió una parte importante del espacio en la conferencia inaugural a la IA. En este 2024, prácticamente no se ha hablado más y ha dejado una importante ristra de anuncios. Muchos, como suele ocurrir en este campo, todavía tienen disponibilidad en el futuro o muy limitada en el presente, pero también ha habido productos específicos que ya se pueden utilizar.
AI Overviews, la IA ya está disponible en la Búsqueda de Google en Estados Unidos
Google anunció en el pasado I/O la llegada de la inteligencia artificial al buscador, lo que supone un cambio sustancial en el producto y en el modelo de negocio de Google basado en la publicidad. Durante el año pasado se le conoció como Experiencia generativa de búsqueda de Google, SGEy ha estado disponible para usuarios limitados en Buscar laboratorios. Ahora Se lanza en abierto para Estados Unidos y en inglésotros países e idiomas llegarán más tarde.
El buscador Google no renuncia a listas ordenadas de sitios web para que el usuario elija lo que le parece más adecuado, sino que incluye un nuevo módulo llamado AI Overviewsalgo así como IA Overview, que es una respuesta a la búsqueda del usuario en lenguaje natural y con enlaces. Utiliza una versión de Gemini adaptada para este fin y es multimodal. Es decir, puede comprender varios formatos de entrada, no sólo texto. También audio e imagen.
La duda que asalta a Google es Cómo la IA puede afectar su negocio publicitario. De acuerdo a Liz Reidvicepresidente de búsquedas de la empresa, Los enlaces mostrados por AI Overviews reciben más clics que los incluidos en la lista de resultados tradicionalpero vale la pena preguntarse por qué un usuario haría clic en el enlace y visitaría otro sitio web con más anuncios. si ya tienes la información que necesitas masticada por la IA y disponible en el motor de búsqueda. Otro caso es el de las búsquedas relacionadas con compras o reservasdonde encaja mejor la declaración de Reid.
También podrás responder preguntas complejas y multifacéticas. Por ejemplo, podrás preguntar sobre los mejores lugares para practicar Pilates en una ciudad, a qué distancia están y qué ofertas tienen para nuevos clientes, y AI Overviews proporcionará toda la información necesaria en lenguaje natural, requiriendo un mínimo esfuerzo cognitivo por parte del usuario. . .
Proyecto Astra
AbiertoAI Ayer presentó su nuevo modelo de lenguaje, GPT-4oy sus nuevas capacidades de voz que lo hacen parecer un asistente de IA muy similar al que jugaba Scarlett Johansson en la película Su de Spike Jonze. El producto que Google ha presentado en la misma línea es Proyecto Astraque difícilmente será su nombre comercial cuando esté disponible.
Es sobre un asistente virtual con inteligencia artificial que llegará en forma de aplicación móvil, pero no solo. Como se explica Demis Hassabiscofundador de Mente profunda que ahora es la división de IA de Google, podrá ver lo que hay a tu alrededor, identificarlo y responder preguntas al respecto.
Hassabis ha señalado lo que pretende Google con el Proyecto Astra es “Desarrollar agentes de IA universales que puedan ser útiles en nuestra vida diaria.”y puede comprender y responder como lo hacen los humanos. También “recuerda lo que ves y oyes para entender el contexto y actuar”.
En el ejemplo mostrado en la videoconferencia, no en directo, una persona utiliza el teléfono móvil para identificar lo que hay a su alrededor, por ejemplo, el barrio en el que se encuentra centrándose en una ventana. La sorpresa fue cuando le preguntó a la asistente dónde estaban sus lentes y luego resultó que estaban Gafas con cámara e integración con Project Astra.. Debería estar disponible antes de fin de año.
Géminis en fotos: Pregunte a Fotos
Google ha integrado Geminis en la aplicación Fotos. Preguntar fotos Se trata de una nueva función experimental, que llegará en los próximos meses, con la que será más sencillo recuperar imágenes perdidas de la galería.
Con Ask Photos, el usuario puede realizar cualquier búsqueda en su galería con preguntas en lenguaje natural. Por ejemplo, «muéstrame la mejor foto de todos los parques de diversiones que he visitado«, por lo que no tendrás que realizar la selección manualmente.
Veo e Imagen 3
Google también ha presentado Nuevos modelos de texto a imagen y de texto a vídeo.. El primero es Imagen 3que como su nombre indica es una evolución de modelos anteriores que ofrece Principalmente mejora su capacidad para generar texto en imágenes.algo que sigue siendo aleatorio en otros modelos como DALL-E y A mitad del viaje.
Veo que es la respuesta a nora, la IA de texto y vídeo de OpenAI que dejó a todos boquiabiertos hace unos meses. Esta IA podrá generar vídeos con resolución 1080p y 1 minuto de duración A partir del mensaje ingresado por el usuario, con un profundo conocimiento del lenguaje natural para producir videos que respondan exactamente a la solicitud, se pueden trabajar conceptos visuales como “time lapse” o “toma de paisaje aéreo” y momentos destacados. en simulación física en una escena. ¿Cuándo estarán disponibles? Tendremos que esperar.
Gemini 1.5 Pro con 2 millones de tokens, Gemini Flash
Géminis llegó el año pasado para sustituir bardo y lo hizo basándose en un nuevo modelo de lenguaje. Ahora bien, la nomenclatura que tenemos a estas alturas es complicada. Inicialmente fue lanzado Géminis Nano, Pro y Ultra. Nano para ejecutarse localmente en teléfonos móviles, como el Pixel 8, Pro con mejores capacidades que ese y Ultra el más avanzado, comparable a GPT-4.
Luego avanzó el Pro, pero no el Ultra, que pasó a ser Pro 1.5 con 1 millón de tokens de contexto. Los tokens se traducen en una cierta cantidad de palabras y significan la cantidad que una IA puede manejar en una conversación con el usuario, el contexto que puede adquirir. Pro ahora ha aumentado hasta 2 millones, lo que significa que puedes profundizar mucho más con él. Hasta ahora estaba disponible en suscripción. Géminis Avanzado en España, pero sólo en inglés. Gana el idioma español y puede realizar acciones como resumir un centenar de correos electrónicos del usuario o gestionar documentos de hasta 1.500 páginas.
A todo esto hay que sumar un nuevo miembro a la familia Géminis que es Destello de Géminis. Esta es una versión más ligera de Gemini Pro que ofrece Más rápido de ejecutar y más económico de ejecutar a gran escala. Por ahora, estará disponible para desarrolladores, no para el público en general.