Tecnología

Google presenta el modelo de IA Gemini, que espera derrotar a ChatGPT de OpenAI

Comparte

Google ha lanzado este miércoles lo que considera su modelo de inteligencia artificial más grande y capaz, al tiempo que aumenta la presión sobre la empresa para que responda cómo piensa hacer rentable la IA.

De acuerdo con CNBC, el gran modelo de lenguaje Gemini incluirá un conjunto de tres tamaños diferentes:

Gemini Ultra, su categoría más grande y capaz;
Gemini Pro, que se adapta a una amplia gama de tareas; y
Gemini Nano, que utilizará para tareas específicas y dispositivos móviles.
Google presenta el modelo de IA Gemini, que espera derrotar a ChatGPT de OpenAI

Por ahora, la empresa tiene previsto otorgar las licencias de Gemini a los clientes a través de Google Cloud para que las utilicen en sus propias aplicaciones.

A partir del 13 de diciembre, los desarrolladores y clientes empresariales podrán acceder a Gemini Pro mediante la API Gemini en Google AI Studio o Google Cloud Vertex AI. Los desarrolladores de Android también podrán desarrollarse con Gemini Nano.

Además, Gemini se utilizará para potenciar los productos de Google, como el chatbot Bard y Search Generative Experience, que intenta responder a las consultas de búsqueda con texto de estilo conversacional (SGE aún no está disponible de forma generalizada).

Puntuación del 90,04% en MMLU
Google explica que Gemini Ultra, con una puntuación del 90,04% en MMLU (comprensión lingüística multitarea masiva), es el primer modelo que supera a expertos humanos en una prueba que incluye 57 materias como física, historia, medicina o ética, junto con habilidades de resolución de problemas. En teoría, es capaz de comprender los matices y el razonamiento en materias complejas.

«Gemini es el resultado de los esfuerzos de colaboración a gran escala de los equipos de todo Google, incluidos nuestros colegas de Google Research», escribió el CEO Sundar Pichai en una entrada de blog el miércoles.

«Fue construido desde cero para ser multimodal, lo que significa que puede generalizar y comprender sin problemas, operar a través de combinar diferentes tipos de información, incluyendo texto, código, audio, imagen y vídeo».

A partir de hoy, el chatbot Bard de Google utilizará Gemini Pro para ayudar con el razonamiento avanzado, la planificación, la comprensión y otras capacidades.

A principios del próximo año, se lanzará «Bard Advanced», que utilizará Gemini Ultra, informaron los ejecutivos en una llamada con periodistas el martes. Se trata de la mayor actualización de Bard, un chatbot similar a ChatGPT.

Guerra de Inteligencia Artificial
La actualización se produce ocho meses después de que el gigante de las búsquedas lanzara por primera vez Bard y un año después de que OpenAI lanzara ChatGPT en GPT-3.5.

En marzo de este año, la startup dirigida por Sam Altman lanzó GPT-4. Los ejecutivos dijeron el martes que Gemini Pro superaba al GPT-3.5 de OpenAI, aunque evitaron responder acerca de cómo se comparaba con GPT-4.

Esta semana se ha revelado en bancaynegocios.com que Meta, IBM y otras 40 empresas quieren hacer que la inteligencia artificial sea de código abierto, dejando claro cómo las empresas están luchando por liderar el campo de la IA.

A la pregunta de si Google tiene planes de cobrar por el acceso a «Bard Advanced», la directora general de Google para Bard, Sissie Hsiao, dijo que están centrados en crear una buena experiencia y que aún no tienen detalles de cómo obtener beneficios económicos.

Cuando se le preguntó en una rueda de prensa si Gemini tiene alguna capacidad novedosa en comparación con la actual generación de LLM, Eli Collins, vicepresidente de producto de Google DeepMind, respondió: «Sospecho que sí», pero que aún se está trabajando para comprender las capacidades novedosas de Gemini Ultra.

Se dice que Google pospuso el lanzamiento de Gemini porque no estaba preparado, lo que trae a la memoria el accidentado lanzamiento de sus herramientas de IA a principios de año.

Varios periodistas preguntaron por el retraso, a lo que Collins respondió que las pruebas de los modelos más avanzados llevan más tiempo.

Google Gemini es el modelo de IA más probado
Collins afirmó que Gemini es el modelo de IA más probado que ha construido la empresa y que cuenta con «las evaluaciones de seguridad más exhaustivas» de todos los modelos de Google.

Collins dijo que a pesar de ser su modelo más grande, Gemini Ultra es significativamente más barato de atender. «No es sólo más capaz, es más eficiente», dijo.

«Seguimos necesitando una cantidad significativa de computación para entrenar Gemini, pero nos estamos volviendo mucho más eficientes en términos de nuestra capacidad para entrenar estos modelos».

Con información de Banca y Negocios