Google (GOOG, GOOGL) presentó el miércoles su nuevo modelo de inteligencia generativa basada en computadora Gemini. El escenario se completa como la respuesta de Google al GPT-4 de OpenAI respaldado por Microsoft (MSFT), y según el jefe de DeepMind, Demis Hassabis, es el "modelo general y en general adecuado" de la organización hasta el momento.
Se alude a Gemini como un modelo multimodal local, lo que significa que puede investigar texto, sonido, video, imágenes y código. Si bien existen otras contribuciones multimodales, Google dice que Gemini está separado porque el modelo estaba destinado a considerar esos medios desde el principio.
Las diferentes etapas, dijo la organización, entrenan modelos separados para manejar cosas como texto, video y fotografías y luego los unen en un solo modelo.
Esta distinción, según Hassabis, implica que Gemini puede comprender más fácilmente información multimodal y producir mejores resultados para todo, desde contenido escrito manualmente hasta imágenes y grabaciones.
Como parte de la declaración, Google entregó una serie de grabaciones que muestran las capacidades de Géminis. En un vídeo, un moderador mostró un programa ejecutando Gemini con un dibujo de un pato azul y un pato azul elástico, los cuales la inteligencia simulada tenía la opción de distinguir.
En otra exposición, el moderador mostró a la inteligencia artificial una imagen dibujada a mano de una emocionante atracción sin círculo y otra con círculo. Cuando el moderador preguntó cuál es razonablemente más tonto, la inteligencia artificial dijo el del círculo, que es la respuesta correcta, excepto si desdeñas eludir círculos o realizar paseos emocionantes en general.
Otro modelo demostró la forma en que los tutores pueden utilizar Gemini para ayudar a sus hijos con sus tareas escolares. La inteligencia informática no solo está lista para examinar las respuestas compuestas de un suplente a declaraciones numéricas, sino que también está lista para saber si son correctas o no y entender cómo el suplente se desvió del camino y por qué.
En el frente de la codificación, Google dijo que Gemini es uno de los principales modelos de codificación, lo que garantiza que la inteligencia artificial pueda comprender dialectos de programación como Python, Java, C++ y Go.
Google está lanzando tres variantes distintas de Gemini: Gemini Ultra, Gemini Ace y Gemini Nano. Gemini Ultra es la mejor adaptación de granja de servidores del modelo de inteligencia simulada implicado en lo que Google dice que son empresas excepcionalmente desconcertantes. Gemini Genius es la versión de gama media del modelo, mientras que Nano es la forma destinada a funcionar en dispositivos como el Pixel 8 Star de Google.
La compañía dice que el teléfono celular utilizará Gemini Nano para controlar Sum up en su aplicación Grabadora, lo que le permitirá reproducir contenido en una grabación y proporcionar una sinopsis con viñetas. La marca también controlará Savvy Answer en Gboard comenzando con WhatsApp y eventualmente llegará a otras aplicaciones dentro de un año.
Mientras tanto, Gemini Genius está disponible como componente de la versión en inglés del chatbot Troubadour de Google a partir de hoy. Según el elemento, Google mejorará Versifier en "comprender, resumir, pensar, codificar y organizar".
Dentro de un año, la organización dijo que llevará a cabo una forma de Minstrel controlada por Gemini Ultra llamada Versifier Progressed.
Significativamente, Google dijo que ahora está explorando diferentes vías con respecto a Gemini en la Búsqueda a través de su Hunt Generative Experience, una forma de Búsqueda de Google que agrega capacidades de inteligencia generativa creadas por el hombre. Según la organización, Gemini ha reducido la inactividad en la adaptación al idioma inglés de la aplicación en Estados Unidos en un 40%.
Gemini también llegará a Look, Chrome, Ads e inteligencia informática de armonía de dos componentes en los próximos meses.
Gemini es un esfuerzo enorme para Google, ya que representa la mejor oportunidad de la organización tanto para OpenAI como para su partidario Microsoft.
Desde que apareció OpenAI ChatGPT en noviembre de 2022, Google ha estado jugando a recuperar el tiempo perdido ante sus adversarios. Microsoft ha agregado previamente sus copilotos impulsados por GPT a algunas de sus administraciones, lo que le dio una ventaja temprana en las nuevas guerras de inteligencia simuladas. En cualquier caso, con Gemini, Google podría tener lo necesario para hacer e intentar superar a OpenAI y Microsoft.
Sin embargo, lo principal es de qué manera el modelo de inteligencia artificial se coordina bien con los productos de Google y si eso ayudará a impulsar a los inversores a seguir explotando plataformas como la Búsqueda de Google, las áreas de trabajo de Google, YouTube y otros productos.
Y teniendo en cuenta que probablemente no verás las progresiones desde el principio, Géminis está implícito con el fin de conseguir el predominio de Google en lo que está por venir. Es más, hay pocas posibilidades de que OpenAI y Microsoft no estén configurando por ahora sus propias reacciones a Gemini.