Utiliser le paramètre `max_responses` afin de contrôler le nombre de réponses générées par chaque appel API. Par défaut, l’API renvoie une réponse à chaque appel. En augmentant le paramètre `max_responses`, l’API retournera plusieurs réponses, bien que le tarif sera plus élevé car il est basé sur le nombre de tokens générés.
Par exemple, si vous voulez obtenir trois réponses à chaque appel API, vous pouvez le définir comme suit en Python :
```
import openai
openai.ChatCompletion.create(
model=“gpt-3.5-turbo”,
messages=[
{“role”: “system”, “content”: “You are a helpful assistant.”},
{“role”: “user”, “content”: “Who won the world series in 2020?”},
],
max_responses=3
)
```
Notez que `max_responses` est sujet à un certain plafond. Actuellement, il ne peut pas être fixé à plus de 4. De plus, en augmentant ce paramètre, l’appel API peut prendre plus de temps pour être exécuté.