Google acelera con su inteligencia artificial capaz de ver, oír, recordar y hablar

Aseguran que Gemini Ultra es el primer modelo que supera a los expertos humanos en comprensión masiva del lenguaje multitarea

ChatGPT ahora traduce conversaciones en tiempo real, interpreta imágenes y percibe emociones

Google ha presentado el Proyecto Astra, su asistente de inteligencia artificial (IA) con «habilidades humanas» que le permiten ver, oír, recordar, asimilar y hablar.

Google y OpenAI han decidido esta semana implementar nuevos cambios en sus inteligencias artificiales con cambios trascendentales con el objetivo de tomar posiciones de cara a lo que pueda presentar Apple en septiembre.

En ambos casos, una de las grandes novedades es que los usuarios podrán hacer una videollamada al asistente y preguntarle todo tipo de cuestiones.

Gemini vs. ChatGPT

Google mostró varios ejemplos que, según la compañía, se realizaban en directo y no manipulados, en los que una de sus trabajadoras en Londres preguntó al asistente qué apodo le pondría a una mascota, le pidió ayuda con programas de codificación y matemáticos, y también para encontrar sus gafas, tras mostrarle una habitación.

Otra cualidad que tienen estas tecnologías es que pueden ser interrumpidas durante sus respuestas para pasar al siguiente punto de la conversación, y pueden tener distintas personalidades, aunque en ambos ejemplos se usó la voz de una mujer.

«Estos agentes se crearon sobre nuestro modelo Gemini y otros modelos de tareas específicas, y fueron diseñados para procesar información más rápido codificando continuamente cuadros de vídeo, combinando la entrada de vídeo y voz en una línea de tiempo de eventos y almacenando en caché esta información para recuperarla de manera eficiente», explica la empresa en un comunicado.

Tres tamaños

Google presentó Gemini 1.0 en tres tamaños diferentes:

Gemini Ultra: el modelo más potente y de mayor tamaño, para tareas de gran complejidad.
Gemini Pro: para escalar en una amplia gama de tareas.
Gemini Nano: más eficiente para ejecutar tareas directamente en un dispositivo.

Comparativa de los modelos de Gemini 1.0

Según Google, «con una puntuación del 90,0 %, Gemini Ultra es el primer modelo que supera a los expertos humanos en MMLU (comprensión masiva del lenguaje multitarea), que utiliza una combinación de 57 materias, como matemáticas, física, historia, derecho, medicina y ética, con las que se pone a prueba tanto el conocimiento del mundo como la capacidad de resolución de problemas».

Ecosistema Google

Gemini llegará a miles de millones de personas a través de los productos de Google. Desde ahora, Bard utilizará una versión perfeccionada de Gemini Pro para razonamientos más avanzados, planificación, comprensión y mucho más.

Estará disponible en inglés en más de 170 países y territorios, y Google tiene previsto ampliarlo a distintas modalidades y dar soporte a nuevos lugares e idiomas en el futuro.

También quieren incorporar Gemini a Pixel. Pixel 8 Pro es el primer smartphone diseñado para ejecutar Gemini Nano, que hace posibles nuevas funciones como Resumir en la Grabadora o utilizar la Respuesta inteligente de Gboard desde WhatsApp. En 2025 extenderán esta función a otras aplicaciones de mensajería.

En los próximos meses, Gemini estará disponible en otros productos y servicios como el Buscador, Ads, Chrome y Duet AI.

Temas

comentarios

Google acelera con su inteligencia artificial capaz de ver, oír, recordar y hablar

Aseguran que Gemini Ultra es el primer modelo que supera a los expertos humanos en comprensión masiva del lenguaje multitarea

ChatGPT ahora traduce conversaciones en tiempo real, interpreta imágenes y percibe emociones

Gemini vs. ChatGPT

Tres tamaños

Ecosistema Google

Google

Inteligencia Artificial (IA)

LO MÁS LEÍDO

Más de Tecnología

Comprar una casa en bitcoin: los motivos de los españoles para olvidarse de los bancos

Un virus en Facebook puede vaciarte la cuenta bancaria en segundos

La nueva función en Teams para hablar en nueve idiomas con la Inteligencia Artificial

La aplicación sanitaria de la Generalitat reforzará su seguridad tras detectar casos de «accesos ilícitos»

Esta es la forma más sencilla de migrar tus seguidores y contactos de X (Twitter) a Bluesky