

xAI presentado “Asimilar 4.1”una actualización que incluye mejoras en las áreas de creatividad, comprensión emocional y precisión.
El inicio se produjo entre 1 y 14 de noviembre de 2025 a través de una implementación gradual en grok.com, X y aplicaciones móviles. Durante este período, se realizaron evaluaciones ciegas del tráfico real para determinar el rendimiento del modelo.
La compañía afirma que estas mejoras se deben al uso de la misma infraestructura de aprendizaje por refuerzo que se utilizó para realizar ajustes en Grok 4. Estilo, personalidad y dirección.
LEER TAMBIÉN
Uso y primeros resultados.
Según el sitio web oficial de Grok, el proceso comenzó con versiones preliminares dirigidas a una porción cada vez mayor del tráfico de producción. La compañía asegura que según estas pruebas, el nuevo modelo fue preferido en el 64,78% de los casos respecto a la versión anterior.
Habilidades generales y clasificación.
Grok 4.1 logró un rendimiento sobresaliente Juicio ciego de las preferencias humanas. En LMArena Text Arena, la variante de pensamiento Grok 4.1 (Quasarflux) obtuvo 1483 puntos Elo, ocupando el primer lugar, mientras que el modo sin razonamiento (Tensor) logró 1465 puntos Elo, ocupando el segundo lugar.
Según la información proporcionada, esta última modalidad superó a otros modelos con plena justificación. Aparte de eso, Cabe señalar que Grok 4.1 superó significativamente los resultados de Grok 4.quien quedó en el puesto 33.
Puede usarse en modo automático o seleccionarse en el menú bajo el nombre “Grok 4.1”. Foto:xAI/EFE
LEER TAMBIÉN
Evaluaciones de inteligencia emocional, escritura creativa y reducción de alucinaciones.
Medir la inteligencia emocional
Examinar aspectos como la empatía, las habilidades interpersonales y la coherencia de la personalidad, xAI evaluó el modelo en EQ-Bench3, una prueba con 45 escenarios de juego de roles. Para la obtención de los resultados se utilizaron los parámetros estándar, el juez “Claude Sonnet 3.7” y el cálculo Elo normalizado.
Logro en escritura creativa.
Grok 4.1 también fue sometido Pruebe la escritura creativa v3que incluye 32 lemas desarrollados en tres iteraciones. Las calificaciones se determinaron mediante rúbricas y comparaciones pareadas y siguieron un sistema Elo normalizado similar al utilizado en la evaluación de la inteligencia emocional.
Esta actualización incluye mejoras en la creatividad, la comprensión emocional y la precisión. Foto:TwitterxAI
LEER TAMBIÉN
Control de alucinaciones
En cuanto a los errores fácticos, la información proporcionada sugiere que la formación posterior se centró en este Reducir las alucinaciones al buscar información.un punto crítico en modelos rápidos que funcionan con presupuestos limitados de llamadas de herramientas.
La compañía dice que midió la tasa de alucinaciones en el tráfico real y utilizó el índice FActScore, que consta de 500 preguntas biográficas, para validar las mejoras observadas.
Disponibilidad
Según el texto fuente Grok 4.1 ya está disponible para todos los usuarios en grok.com, X y las aplicaciones de iOS y Android. Puede usarse en modo automático o seleccionarse directamente en el menú bajo el nombre “Grok 4.1”.
*Este contenido fue creado utilizando inteligencia artificial y se basa en información de conocimiento público divulgada a los medios. Además, fue reseñado por el periodista y un editor.