Google acelera con su inteligencia artificial capaz de ver, oír, recordar y hablar
Aseguran que Gemini Ultra es el primer modelo que supera a los expertos humanos en comprensión masiva del lenguaje multitarea
Google ha presentado el Proyecto Astra, su asistente de inteligencia artificial (IA) con «habilidades humanas» que le permiten ver, oír, recordar, asimilar y hablar.
Google y OpenAI han decidido esta semana implementar nuevos cambios en sus inteligencias artificiales con cambios trascendentales con el objetivo de tomar posiciones de cara a lo que pueda presentar Apple en septiembre.
En ambos casos, una de las grandes novedades es que los usuarios podrán hacer una videollamada al asistente y preguntarle todo tipo de cuestiones.
Gemini vs. ChatGPT
Google mostró varios ejemplos que, según la compañía, se realizaban en directo y no manipulados, en los que una de sus trabajadoras en Londres preguntó al asistente qué apodo le pondría a una mascota, le pidió ayuda con programas de codificación y matemáticos, y también para encontrar sus gafas, tras mostrarle una habitación.
Otra cualidad que tienen estas tecnologías es que pueden ser interrumpidas durante sus respuestas para pasar al siguiente punto de la conversación, y pueden tener distintas personalidades, aunque en ambos ejemplos se usó la voz de una mujer.
«Estos agentes se crearon sobre nuestro modelo Gemini y otros modelos de tareas específicas, y fueron diseñados para procesar información más rápido codificando continuamente cuadros de vídeo, combinando la entrada de vídeo y voz en una línea de tiempo de eventos y almacenando en caché esta información para recuperarla de manera eficiente», explica la empresa en un comunicado.
Tres tamaños
Google presentó Gemini 1.0 en tres tamaños diferentes:
- Gemini Ultra: el modelo más potente y de mayor tamaño, para tareas de gran complejidad.
- Gemini Pro: para escalar en una amplia gama de tareas.
- Gemini Nano: más eficiente para ejecutar tareas directamente en un dispositivo.
Según Google, «con una puntuación del 90,0 %, Gemini Ultra es el primer modelo que supera a los expertos humanos en MMLU (comprensión masiva del lenguaje multitarea), que utiliza una combinación de 57 materias, como matemáticas, física, historia, derecho, medicina y ética, con las que se pone a prueba tanto el conocimiento del mundo como la capacidad de resolución de problemas».
Ecosistema Google
Gemini llegará a miles de millones de personas a través de los productos de Google. Desde ahora, Bard utilizará una versión perfeccionada de Gemini Pro para razonamientos más avanzados, planificación, comprensión y mucho más.
Estará disponible en inglés en más de 170 países y territorios, y Google tiene previsto ampliarlo a distintas modalidades y dar soporte a nuevos lugares e idiomas en el futuro.
También quieren incorporar Gemini a Pixel. Pixel 8 Pro es el primer smartphone diseñado para ejecutar Gemini Nano, que hace posibles nuevas funciones como Resumir en la Grabadora o utilizar la Respuesta inteligente de Gboard desde WhatsApp. En 2025 extenderán esta función a otras aplicaciones de mensajería.
En los próximos meses, Gemini estará disponible en otros productos y servicios como el Buscador, Ads, Chrome y Duet AI.