Comment est-ce que ChatGPT a appris à générer du texte ?

ChatGPT a été formé à partir d’un processus en deux étapes, à savoir la préformation suivie par l’ajustement fin.

Au cours de la préformation, ChatGPT a été formé sur un large éventail de données Internet. Cependant, il ne sait pas exactement d’où proviennent ces informations ou quelles sont les spécificités des documents formés. Il n’a pas la capacité de comprendre ou d’accéder à des informations non fournies pendant la formation. En particulier, il n’a jamais été formé sur des données spécifiques comme les bases de données, les livres, les schémas, les tableaux de données, etc.

Ensuite, vient l’étape d’ajustement fin, où ChatGPT est formé sur un ensemble de données spécifique, généré avec l’aide de réviseurs humains qui suivent certaines directives fournies par OpenAI. Les données d’ajustement fin comprenaient des instructions explicites sur la façon de traiter une variété de situations, y compris comment éviter les contenus inappropriés et comment répondre à des sujets qu’il ne comprend pas ou dont il ne dispose pas d’informations précises.