Gemini, es la IA de Google. Puedes pedirle que te ayude a escribir, hacer planes o aprender, entre otras cosas.

Nace con el firme propósito de destronar a su principal competidor, ChatGPT, creado por el laboratorio OpenAI.

Es capaz de reconocer y comprender texto, imágenes, audio a la vez, por lo que comprende mejor la información matizada y puede responder preguntas relacionadas con temas complicados.

Esto lo hace especialmente bueno para explicar el razonamiento en materias complejas como matemáticas y física.

Otra gran ventaja de esta IA es que va a estar integrada en todas las herramientas de Google.

Gemini

¿Cómo funciona Gemini?

Cuando introduces una pregunta (prompt), te responde utilizando la información que ya conoce o que obtiene de otras fuentes, como otros servicios de Google.

Gemini te da acceso a modelos de lenguaje extenso. Los modelos de lenguaje aprenden «leyendo» billones de palabras que les ayudan a entender los patrones del lenguaje, lo que les permite comprender y responder tus preguntas según los patrones del lenguaje habituales.

Siempre están aprendiendo, lo que significa que también aprenden de tus peticiones, respuestas y comentarios.

Pero nunca debemos olvidarnos que estas IA también cometen errores, por lo que debemos ser prudentes con los resultados que arrojan a nuestras consultas, órdenes o preguntas.

¿Gemini o ChatGPT?

La principal diferencia entre ambas IA, es que Gemini ha sido construido desde cero para ser multimodal, lo que significa que puede generalizar y comprender, operar y combinar sin problemas diferentes tipos de información, incluidos texto, código, audio, imagen y video.

Ambas IA tienen distintas versiones. En ChatGPT encontramos las versiones ChatGPT 3.5 y GPT-4, y Gemini dispone de tres versiones diferentes:

  • Gemini Ultra : la versión más potente y capaz para tareas altamente complejas.
  • Gemini Pro : la versión para escalar en una amplia gama de tareas.
  • Gemini Nano : el modelo más eficiente para tareas integradas en los propios dispositivos.

 

En este vídeo se muestran algunas interacciones con la IA a través de indicaciones multimodales, mostrándole una imagen y pidiéndole que describa lo que ve.

El vídeo, que cuenta con millones de reproducciones, no es real. Es un vídeomontaje que muestra la capacidad de esta IA para interpretar indicaciones multimodales.

Si realmente quiere saber cómo se hizo y saber más sobre las indicaciones multimodales, échale un vistazo a este enlace: Interactuar con Gemini a través de indicaciones multimodales