A partir de 11 de março de 2025, lançamos os blocos de construção da nossa nova plataforma de Agents. Para mais detalhes, consulte nossa documentação da API para a Responses API, as ferramentas, incluindo Web Search, File Search e Computer Use, além do nosso Agents SDK com Tracing.
Tokens de prompt são os tokens que você insere no modelo. Esse é o número de tokens no seu prompt.
Tokens de conclusão são quaisquer tokens que o modelo gera em resposta à sua entrada. Em uma solicitação padrão, esse é o número de tokens na conclusão.
A maioria dos modelos que oferecemos tem tanto limites para a quantidade de tokens que podem receber (tokens de prompt) quanto para a quantidade de tokens que podem gerar na saída (tokens de conclusão ou tokens de amostras).
Isso também inclui quaisquer tokens gerados ao usar um valor mais alto de best_of ou n. Por exemplo, se você estiver gerando 3 conclusões candidatas usando best_of = 3, o número de tokens amostrados será, no máximo, 3 * max_tokens.
Você pode ler mais sobre como gerenciar tokens no nosso guia de geração de texto.
