Veelgestelde vragen over embeddings

Op 25 januari 2024 hebben we twee nieuwe embeddingmodellen uitgebracht: text-embedding-3-small en text-embedding-3-large. Dit zijn onze nieuwste en best presterende embeddingmodellen, met lagere kosten, betere meertalige prestaties en een nieuwe parameter om embeddings in te korten. Lees meer.

Wat is er anders aan de nieuwste embeddingmodellen?

Onze nieuwste v3-modellen bieden betere prestaties op gangbare benchmarks tegen een lagere prijs. Je kunt meer lezen over de prestatieverbeteringen in het aankondigingsblogbericht en de ontwikkelaarsdocumentatie.

Hoe kan ik bepalen hoeveel tokens een tekenreeks zal hebben voordat ik die probeer te embedden?

Je kunt het Tiktoken-pakket van OpenAI gebruiken om te controleren hoeveel tokens een tekenreeks zal hebben. Lees meer in onze ontwikkelaarsgids voor embeddings.

Hoe kan ik snel de K dichtstbijzijnde embeddingvectoren ophalen?

Voor snel zoeken in veel vectoren raden we aan een vectordatabase te gebruiken.

Welke afstandsfunctie moet ik gebruiken?

Embeddinguitvoer van de OpenAI API is standaard L2-genormaliseerd tot lengte 1, ook na inkorten met de parameter dimensions, wat betekent dat:

OpenAI-embeddings zijn genormaliseerd tot lengte 1, wat betekent dat:

Cosinusgelijkenis kan iets sneller worden berekend met alleen een dotproduct
Cosinusgelijkenis en Euclidische afstand leveren identieke rangschikkingen op

Veelgestelde vragen over embeddings

Wat is er anders aan de nieuwste embeddingmodellen?

Hoe kan ik bepalen hoeveel tokens een tekenreeks zal hebben voordat ik die probeer te embedden?

Hoe kan ik snel de K dichtstbijzijnde embeddingvectoren ophalen?

Welke afstandsfunctie moet ik gebruiken?

Was dit artikel nuttig?