Google lanza Gemini, la IA que promete ser la más poderosa del mundo

07 Dic 2023 9:45 am

Foto: Google

Google lanzó tres nuevas versiones de Gemini, una IA que pretende desbancar a ChatGPT. Este es el primer paso para volver a la tecnología un ser consciente.

Google lanzó esta mañana Gemini, un modelo de Inteligencia Artificial (IA) multimodal que puede generar y comprender, operar y combinar diferentes tipos de información. Esto incluye texto, imágenes, audios, videos y lenguajes de programación, según un comunicado de la compañía.

Alphabet decidió optimizar Gemini 1.0, la primera versión de esta herramienta IA, y adecuarla a tres tamaños diferentes:

Gemini Ultra: Es el modelo más grande y está diseñado para realizar tareas altamente complejas.
Pro: Tiene la capacidad de escalar en una amplia gama de tareas.
Gemini Nano: Este modelo de Gemini está hecho para utilizarse en cualquier dispositivo

¿Cómo empezar a utilizar Gemini 1.0 de Google?

A partir de hoy, Bard con Gemini Pro estará disponible en inglés en más de 170 países y territorios. La compañía explicó que esta herramienta tiene mayores capacidades de hacer tareas como comprender y resumir, razonar, generar ideas, escribir y planificar.

“Esta es la mayor mejora de calidad de Bard desde su lanzamiento”, mencionó Alphabet en un comunicado oficial.

Además, los usuarios podrán acceder a Gemini a través de Pixel. Pixel 8 Pro es el primer teléfono inteligente diseñado para ejecutar Gemini Nano. Este smartphone impulsa nuevas funciones como resumir en la aplicación de Grabadora e implementar Redacción Inteligente en Gboard.

A partir del 13 de diciembre, los internautas podrán acceder a Gemini Pro a través de la API de Gemini en Google AI Studio y en Vertex AI de Google Cloud.

“Esto es un hito importante en el desarrollo de la Inteligencia Artificial y el comienzo de una nueva era para Google, a medida que continúa innovando rápidamente y avanzando de manera responsable en las capacidades de cada uno de los nuevos modelos”.

Bard de Google quiere afianzarse en la carrera por la regulación de la IA

La promesa de volver a la tecnología un ser consciente

Hasta el momento, una de las grandes promesas que le hace Google a su público con esta herramienta es su capacidad de funcionar con imágenes, videos y audios. Esto la haría una de las IA más sofisticadas que existen en el mercado.

Hassabis comentó que las capacidades de razonamiento multimodal de Gemini 1.0 pueden ayudar a dar sentido a información visual y escrita compleja.

“Esto lo hace especialmente hábil para descubrir conocimientos que pueden ser difíciles de discernir en medio de grandes cantidades de datos”.

Durante su participación en Google I/O 2023, el cofundador de Google DeepMind mencionó el tipo de IA con la que sueña, una mucho más consciente.

“Con el tiempo, Gemini tendrá más sentidos, se volverá más consciente y será más preciso y arraigado en el proceso. Estos modelos simplemente entienden mejor el mundo que los rodea”.