OpenAI ha lanzado recientemente un mecanismo de moderación de contenido para la API de ChatGPT. La guía de moderación de OpenAI detalla cómo se pueden añadir parámetros de filtrado para el contenido que se genera a través de la API.
Para utilizarlo, necesitarás añadir la opción `“temperature”` y `“max tokens”` a tu llamada de API. La `temperature` influirá en el azar de la respuesta generada (valores más bajos producirán respuestas más coherentes y centradas, mientras que valores más altos resultarán en respuestas más aleatorias). `Max tokens` limitará la longitud de la respuesta generada.
Además de estos parámetros, puedes filtrar la salida de la API de ChatGPT utilizando el siguiente método:
```python
def filter_output(text):
# Lista de malas palabras o frases que quieres filtrar
banned_words = [‘badword1’, ‘badword2’, ‘badphrase1’]
Esta es una manera simple de filtrar el contenido con una lista de palabras o frases prohibidas predefinidas. No obstante, este método está basado en palabras clave y puede no captar todas las instancias de contenido inapropiado. Un enfoque más sofisticado puede requerir el uso de modelos de lenguaje entrenados para detectar y filtrar contenido inapropiado.
También es importante tener en cuenta la respuesta de la comunidad y las prácticas estándar a la hora de decidir qué contenido filtrar. Notificar a los usuarios de la razón por la que cierto contenido está siendo censurado puede ser una buena práctica para evitar malentendidos y mejorar la. experiencia del usuario.
OpenAI también ha proporcionado un ejemplo de cómo podrías añadir un filtro de contenido al output del modelo:
```python
import openai
openai.ChatCompletion.create(
model=“gpt-3.5-turbo”,
messages=[
{“role”: “system”, “content”: “You are a helpful assistant.”},
{“role”: “user”, “content”: “Who won the world series in 2020?”},
],
filter_content={“use_chat_model”: True}
)
```
Usando `use_chat_model` se utiliza un modelo de chat GPT para filtrar y moderar el contenido generado. Por ahora, se recomienda siempre usar `use_chat_model=True`.