¿Cuál es la capacidad de memoria a largo plazo de ChatGPT?

ChatGPT, desarrollado por OpenAI, no tiene una “memoria” en el sentido convencional de la palabra. En su lugar, tiene un estado interno que cambia a medida que procesa texto, pero este estado no se mantiene entre las diferentes interacciones que un usuario puede tener con la IA. Por lo tanto, cualquier persona que interactúe con el ChatGPT comienza con una especie de “página en blanco”. Sin embargo, durante la duración de una sola interacción en particular o una “sesión”, ChatGPT conserva la información en su memoria.

Además de esta falta de una “memoria a largo plazo”, ChatGPT tampoco tiene una “memoria a corto plazo” directamente. No tiene la capacidad de recordar información de una sesión a otra. Por ejemplo, si le pides que recuerde cierto número de palabras, lo olvidará tan pronto como pases a otra tarea o finalices la sesión.

La capacidad de recordación de ChatGPT está basada en su contexto de entrada. El modelo recuerda el texto de entrada, y este puede ser hasta 2048 tokens de longitud (un token puede ser tan corto como una letra o tan largo como una palabra). Si el texto de entrada es más largo, se trunca a los 2048 tokens más recientes. Los detalles que están fuera de este contexto de entrada son “olvidados” por el modelo.

Cualquier “aprendizaje” que haga ChatGPT también está limitado por este contexto. La IA no tiene la capacidad de aprendizaje en línea, lo que significa que no puede aprender a partir de nuevas informaciones después de ser entrenada inicialmente. Fue entrenada con un gran conjunto de datos en un momento determinado en el pasado y no puede adquirir ni retener nueva información más allá de lo que se le dio durante ese entrenamiento.

Para más información sobre la capacidad de memoria de ChatGPT, puedes revisar la documentación oficial de OpenAI en la que se basan estos detalles.

Fuentes:
1. OpenAI. (2021). “ChatGPT: Su nuevo y asombroso asistente de IA.” Recuperado de: https://openai.com/research/chatgpt
2. OpenAI. (2021). “Preguntas frecuentes sobre los modelos de OpenAI.” Recuperado de: https://www.openai.com/faq/
3. Gurav, H. (2021). “La guía definitiva para comprender GPT-3.” Analytics Vidhya. Recuperado de: https://www.analyticsvidhya.com/blog/2020/07/openais-gpt3-a-brief-guide-to-understand-the-worlds-most-powerful-language-model/