GPT-4o ofrece la capacidad de aceptar combinaciones de texto, audio e imagen, proporcionando respuestas con una velocidad comparable a la de un ser humano. Sin embargo, la reciente actualización lanzada la semana pasada ha sido revertida tanto para los usuarios gratuitos como para aquellos suscritos a la versión Premium, a la espera de correcciones que ajusten la personalidad del modelo y permitan un relanzamiento exitoso.
OpenAI ha explicado en un comunicado que al eliminar la actualización "excesivamente halagadora", los usuarios están utilizando actualmente una versión anterior con un comportamiento más equilibrado. La compañía está probando activamente nuevas soluciones para evitar este comportamiento, priorizando la satisfacción del usuario a largo plazo e introduciendo más funciones de personalización que les permitan tener mayor control sobre el comportamiento de ChatGPT.
Respecto a las causas de este fallo en GPT-4o, OpenAI explicó que la actualización incluía ajustes destinados a mejorar la personalidad predeterminada del modelo, buscando ofrecer una experiencia "más intuitiva y efectiva" en la ejecución de tareas. Para modelar el comportamiento, se basaron en las instrucciones de su Especificación del modelo e incorporaron señales de usuario, como comentarios positivos o negativos en las respuestas de ChatGPT.
Sin embargo, la compañía se centró en utilizar comentarios a corto plazo, lo que llevó a que el modelo no considerara "cómo evolucionan las interacciones de los usuarios con ChatGPT a lo largo del tiempo". Como resultado, el modelo terminó inclinándose hacia respuestas "demasiado favorables, pero poco sinceras". OpenAI subrayó la importancia de la personalidad del chatbot, ya que afecta la forma en que los usuarios interactúan con él. "Las interacciones aduladoras pueden ser incómodas, inquietantes y causar angustia", afirmó la compañía.
Para solucionar este comportamiento, OpenAI está implementando medidas como el refinamiento de las técnicas de entrenamiento y las indicaciones del sistema, con el objetivo de alejar al modelo de la adulación. Además, se están construyendo más barreras de seguridad para aumentar la honestidad y la transparencia.
Los usuarios también podrán controlar el comportamiento del chatbot de manera más sencilla mediante funciones como instrucciones personalizadas, permitiendo dar retroalimentación en tiempo real para influir en las interacciones de ChatGPT y elegir entre personalidades predeterminadas. Con estas mejoras, OpenAI espera ofrecer una experiencia más satisfactoria y alineada con las expectativas de los usuarios.