API 플랫폼의 스케일 등급을 사용하면 하나의 전용 모델 스냅샷에 액세스하기 위해, 분당 API 입력 및 출력 토큰 수(‘토큰 유닛’)를 미리 구매할 수 있습니다. 각 토큰 유닛은 최소 30일 단위로 구매해야 합니다.
주문서를 체결한 이후에는 API 플랫폼 계정을 통해 토큰 유닛을 추가하거나 제거할 수 있습니다. 스케일 등급 설정을 확인하고 입력 및 출력 토큰 유닛을 구매할 수 있는 권한은 조직 소유자와 승인된 사용자에게만 부여됩니다.
스케일 등급 설정에 액세스하려면 어떻게 해야 하나요?
API 플랫폼 조직 소유자는 페이지 오른쪽 상단의 설정 아이콘을 선택한 뒤, 화면 왼쪽 메뉴의 ‘조직’ 섹션에서 스케일 등급을 선택해 설정에 액세스할 수 있습니다.
스케일 등급 설정 페이지에서는 용량 추가, 입력 토큰 사용량 확인, 용량 계획 수립, 할당된 토큰 확인, 승인된 구매자 검토 등을 수행할 수 있습니다.
추가 용량은 어떻게 구매하나요?
스케일 등급 페이지 오른쪽 상단의 ‘용량 추가’ 버튼을 선택해 용량을 구매할 수 있습니다. 입력 및 출력 토큰 유닛별 TPM 권한에 대한 최신 정보는 스케일 등급 메인 페이지를 참고하세요.
구매할 토큰 유형을 선택한 후, 수량을 직접 입력하거나 슬라이더를 이동해 원하는 토큰 수를 선택할 수 있습니다. 슬라이더를 사용하면 토큰 수를 변경할 때 요약 영역에서 TPM 변화를 쉽게 확인할 수 있습니다. 또한 최근 30일간의 트래픽을 기준으로 필요한 권장 유닛 수를 함께 제안합니다.
선택을 완료한 후, 다음 모달에서 결제를 선택해 구매를 확정하세요.
요약에 표시되는 가격은 기본 요금이며, 조직의 주문서에서 협의된 할인은 포함되어 있지 않습니다. 적용 가능한 할인은 조직에 발행되는 인보이스에 반영됩니다. 구매한 유닛은 다음 인보이스 기간이 시작될 때까지 활성 상태로 유지되며, 이후에는 일 단위로 갱신됩니다.
스케일 등급 토큰을 사용하도록 호출을 활성화하려면 어떻게 하나요?
프로젝트 설정에서 스케일 등급 활성화 토글을 켜야 합니다.
Completions API를 사용하는 경우 service_tier 키에 대한 문서를 참고해, 이를 수동으로 설정할지 기본 동작을 사용할지 결정하세요.
Responses API 호출은 기본적으로 service_tier=auto로 설정됩니다. 프로젝트에서 스케일 등급이 활성화되어 있고 service_tier를 생략하거나 자동으로 설정한 경우, 사용 가능한 스케일 등급 할당량이 있을 때 기본적으로 스케일 등급이 적용됩니다. service_tier=default로 설정된 요청은 공유/PAYG 컴퓨팅을 사용합니다.
구매 내역 및 만료된 토큰은 어떻게 확인하나요?
스케일 등급 페이지에서 할당된 토큰 아래의 모델을 선택하면 구매 내역을 확인할 수 있습니다.
모델을 선택하면 페이지 하단에서 만료된 토큰과 이전 거래 내역을 확인할 수 있습니다.
토큰 용량은 어떻게 수정하나요?
스케일 등급 페이지에서 할당된 토큰 아래의 모델을 선택해 해당 모델의 토큰 용량을 수정할 수 있습니다. 모델을 선택한 후 활성 섹션에서 해당 구매 항목을 찾고, 옆의 취소를 선택해 수정할 수 있습니다.
모달에서 취소할 유닛 수를 직접 입력하거나 슬라이더를 사용해 선택에 따른 TPM 변화를 확인할 수 있습니다.
스케일 등급의 RPM/TPM 및 사용량은 어떻게 확인하나요?
스케일 등급 페이지에서 조직의 API 사용량 요약을 확인할 수 있습니다. 모든 날짜와 시간은 UTC 기준이며, 데이터는 최대 5분 지연될 수 있습니다.
모델 드롭다운에서 스케일 등급 모델을 선택하면 활동 사용량 대시보드에서 사용량을 확인할 수 있습니다. 데이터는 30일, 1일, 15분 단위로 확인할 수 있습니다. 사용량 데이터는 스택 형태로 표시되며, 스케일 등급으로 처리된 사용량과 계정 요금제로 처리된 사용량을 함께 비교해 보여줍니다.
사용량 대시보드는 조직 소유자만 확인할 수 있습니다.
토큰 용량 변경 사항은 언제 사용량 대시보드에 반영되나요?
변경 사항이 반영되기까지 최대 24시간이 소요될 수 있습니다. 단, 변경 자체는 거의 즉시 적용됩니다.
