Comment améliorer la diversité des sorties générées par les LLMs

Pour améliorer la diversité des sorties générées par les modèles de langage de grande taille (LLMs – Large Language Models), plusieurs approches peuvent être utilisées, selon des recherches et des recommandations d’experts dans le domaine de l’intelligence artificielle. Voici quelques stratégies pertinentes, accompagnées d’exemples et des sources qui ont contribué à cette analyse :

1. Réglage des paramètres de génération :
- Température : L’ajustement du paramètre de température pendant la génération de texte peut influencer la diversité. Une température plus élevée (par exemple, entre 1.0 et 1.5) peut encourager le modèle à prendre des décisions plus variées et moins prévisibles, conduisant ainsi à une sortie plus diversifiée.
- Nucleus Sampling (p-sampling) : Cette technique sélectionne des mots selon une distribution cumulative et exclut les moins probables jusqu’à un certain seuil ((p)) de probabilité cumulative. Un seuil plus bas ((p \approx 0.9)) pourrait améliorer la diversité tout en maintenant la cohérence.

1. Utilisation de techniques de regroupement et de rééchantillonnage :
- Regroupement des sorties : Générer plusieurs sorties puis les regrouper en clusters distincts peut aider à identifier les variations et les combinaisons uniques parmi les réponses générées.
- Rééchantillonnage : Générer plusieurs échantillons indépendants et choisir celui qui est le plus distinct des précédents.

1. Apprentissage par renforcement avec un modèle de récompense diversifié :
- Un modèle de récompense peut être conçu pour favoriser les sorties qui sont non seulement pertinentes mais aussi inédites par rapport aux précédentes. Cela peut guider le modèle à explorer des segments moins conventionnels du langage.

1. Incorporation de données supplémentaires variées :
- Enrichissement des données d’entraînement : Incorporer des textes provenant d’une large gamme de sources (littérature, articles scientifiques, dialogues informels, etc.) peut aider à diversifier les réponses.
- Représentations multiples de scénarios similaires : Présenter différentes formulations d’un même concept dans les données d’entraînement.

Exemples pratiques :

1. Lorsque vous ajustez la température à 1.2, un modèle GPT-3 pourrait passer d’une réponse classique comme “Le soleil brille aujourd’hui” à quelque chose de plus original comme “Les rayons dorés perlent à travers les arbres, illuminant la journée.”

1. En utilisant le nucleus sampling avec (p = 0.85), une génération de texte initialement prévue pour produire “Il commença sa journée par une marche” pourrait devenir “Il débuta son voyage matinal avec une promenade contemplative.”

Sources :

1. Holtzman, A., Buys, J., Du, L., Forbes, M., & Choi, Y. (2020). “The Curious Case of Neural Text Degeneration”. arXiv preprint arXiv:1904.09751.
2. Radford, A., Wu, J., Amodei, D., et al. (2019). “Language Models are Unsupervised Multitask Learners”. OpenAI Blog.
3. Fan, A., Lewis, M., & Dauphin, Y. (2018). “Hierarchical Neural Story Generation”. Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (ACL).
4. Shelton, C. R., & Koop, A. (2011). “Monte Carlo methods for multi-agent decision making with applications to robot soccer”. Springer Netherlands.

En somme, la diversité des sorties générées par les LLMs peut être significativement améliorée par une combinaison d’ajustements de paramètres de génération, l’utilisation de techniques de regroupement et de rééchantillonnage, l’apprentissage par renforcement, et l’enrichissement des données d’entraînement. Ces méthodes, soutenues par des recherches académiques reconnues, permettent d’élargir les capacités des modèles et de produire des textes plus variés et créatifs.

Comment améliorer la diversité des sorties générées par les LLMs ?