Logit_bias es un parámetro opcional que modifica la probabilidad de que determinados tokens aparezcan en una salida generada por el modelo.

Este parámetro acepta un objeto JSON que asigna tokens a un valor de sesgo asociado de -100 (lo que en la mayoría de los casos bloqueará la generación de ese token) a 100 (selección exclusiva del token, lo que hace más probable que se genere). Los valores moderados, como -1 y 1, cambiarán en menor medida la probabilidad de que se seleccione un token.

Como el parámetro recibe tokens, no texto, te conviene usar una herramienta de tokenización para convertir texto en ID de token. Veamos algunos ejemplos.

Ejemplo 1: eliminar «time»

Si llamamos al punto de acceso Completions con el prompt «Once upon a,», es muy probable que el completado empiece por « time.»

La palabra «time» se tokeniza con el ID 2435 y la palabra « time» (que tiene un espacio al principio) se tokeniza con el ID 640. Podemos pasar estos tokens por logit_bias con -100 para prohibir que aparezcan en el completado, así:

completion = client.chat.completions.create( 
  model="gpt-3.5-turbo", 
  messages=[{"role": "system", "content": "Completas las frases del usuario."},
             "role": "user", "content": "Once upon a"} ] 
  logit_bias={2435:-100, 640:-100}
)

Ahora, el prompt «Once upon a» genera el completado «midnight dreary, while I pondered, weak and weary.»

Observa que la palabra «time» no aparece por ninguna parte, porque hemos prohibido de forma efectiva ese token mediante logit_bias.

Ejemplo 2: orientar con valores específicos de logit_bias

Veamos otro ejemplo, con un prompt de generador de recetas.

Muchas recetas sugieren usar ollas, pero supongamos que no tenemos una olla. Querremos impedir que la palabra pot se genere como parte de nuestro completado. «Pot» se tokeniza como 1787, así que podemos eliminarlo de nuestra generación configurando logit_bias como se muestra a continuación.

logit_bias={1787:-100}

Ahora, nuestro completado podría incluir en su lugar la palabra «saucepan». ¡Perfecto!

Ejemplo 3: aumentar las probabilidades de que aparezca una palabra

Supongamos que queremos aumentar la probabilidad de que aparezca una palabra.

Por ejemplo, quizá gestionemos un sitio que ofrece recetas que puedes preparar con un microondas, así que queremos asegurarnos de que la palabra «microwave» aparezca en la receta. Microwave se tokeniza con el ID 27000. Podemos aumentar la probabilidad de que aparezca este token estableciendo un logit_bias positivo, así:

logit_bias={27000:5}

Ahora, es más probable que nuestro completado incluya la palabra «microwave».

Establecemos logit_bias en 5, ya que comprobamos que establecer logit_bias en 1 a menudo no hacía que la palabra «microwave» apareciera en el completado, mientras que valores de logit_bias más altos, como 10, hacían que la palabra « microwave» apareciera en el completado con demasiada frecuencia.

Uso de logit bias para alterar la probabilidad de tokens con la API de OpenAI

Ejemplo 1: eliminar «time»

Ejemplo 2: orientar con valores específicos de logit_bias

Ejemplo 3: aumentar las probabilidades de que aparezca una palabra

¿Te ha resultado útil este artículo?