Google Gemini ha surgido como la cúspide de la innovación en inteligencia artificial, desafiando los límites establecidos por sus predecesores. Esta nueva joya de la tecnología representa un avance monumental en el campo de la IA y está diseñada para rivalizar con los modelos más prominentes disponibles en el mercado, incluido el reverenciado ChatGPT.
En el mundo de Google, Gemini se presenta como un modelo de inteligencia artificial multimodal, capaz de "generar y comprender, operar y combinar" una variedad de datos que van desde texto, imágenes, audios y videos hasta lenguajes de programación. En esencia, es la respuesta de Google a GPT-4, el formidable modelo de lenguaje de OpenAI que impulsa ChatGPT.
Lo que distingue a Gemini es su increíble versatilidad: puede desplegarse en una amplia gama de dispositivos, desde teléfonos móviles hasta centros de datos, convirtiéndolo en "el modelo más flexible hasta la fecha". Esta flexibilidad se manifiesta a través de sus tres versiones: Nano, Pro y Ultra.
Gemini Ultra representa el pináculo del poder de IA de Google hasta la fecha. Los resultados de las pruebas muestran que supera a GPT-4 y ChatGPT en múltiples aspectos. Con una puntuación de 90.04% en las pruebas de MMLU (Massively Multitasking Language Comprehension), supera significativamente el 86.4% de GPT-4. Además, según Google, Gemini es el primer modelo de IA en superar a expertos humanos en estas evaluaciones.
El enfoque innovador de Gemini radica en su naturaleza multimodal desde su inicio, lo que significa que tiene la capacidad intrínseca de manejar múltiples tipos de datos simultáneamente. Esta unicidad lo posiciona como un modelo de vanguardia en casi todos los aspectos, en comparación con los métodos convencionales que requieren la unión de componentes separados para lograr la multimodalidad.
Descubra las tendencias de IA en el sector médico.
La versión inicial, Gemini 1.0, ha sido entrenada para reconocer y comprender varios tipos de información, permitiéndole abordar preguntas complejas y explicar razonamientos en áreas como matemáticas y física. Esta innovación ya está integrada en varios servicios y plataformas de Google, siendo Bard uno de los principales beneficiarios. Bard con Gemini Pro ahora está disponible en inglés en México, ofreciendo a los usuarios la oportunidad de experimentar las nuevas capacidades de Gemini, especialmente enfocadas en "tareas complejas".
Gemini también marcará su presencia en dispositivos móviles. El Pixel 8 Pro será el primer smartphone en contar con Gemini Nano, permitiendo realizar tareas inteligentes como componer con Gboard en WhatsApp y resumir grabaciones de voz en la aplicación Recorder. Google planea implementar Gemini en servicios populares como su motor de búsqueda y Chrome.
La joya de la corona, Gemini Ultra, está programada para su lanzamiento en 2024. Este modelo superior de IA tomará un poco más de tiempo en llegar debido a las rigurosas verificaciones de confianza y seguridad requeridas por Google. Estará disponible para clientes, desarrolladores, socios y expertos en seguridad, permitiéndoles experimentar y proporcionar retroalimentación antes del lanzamiento oficial.
También en 2024, debutará Bard Advanced, una implementación que integra Gemini Ultra en Bard, ofreciendo acceso a "modelos y capacidades mejoradas". Con la llegada de Gemini, comienza una nueva era para Google, según Sundar Pichai, CEO de la compañía.
El surgimiento de Google Gemini promete redefinir los estándares en inteligencia artificial y podría inaugurar una transformación radical en la forma en que interactuamos con la tecnología. Este avance se considera un hito trascendental en la evolución de la IA, y su impacto se sentirá en todos los rincones del mundo digital.