Wierzymy w odpowiedzialne, iteracyjne tworzenie i wdrażanie jako sposób na osiągnięcie bezpiecznej ogólnej sztucznej inteligencji. Zanim udostępnimy model publicznie, przeprowadzamy wiele testów oraz działań ograniczających ryzyko dotyczących bezpieczeństwa i zgodności, a także korzystamy z systemów automatycznych i pracy ludzi, aby pomagać w wykrywaniu problematycznych treści pojawiających się w naszych usługach dla osób indywidualnych, takich jak ChatGPT i GPT. Poniżej przedstawiamy część tych działań.

ChatGPT i ImageGen

Korzystamy z narzędzi automatycznych, takich jak wewnętrzna wersja naszego interfejsu API /moderations, aby wykrywać treści (polecenia, odpowiedzi, przesłane materiały), które mogą być szkodliwe lub naruszać nasze Zasady użytkowania. Jeśli wykryjemy problematyczne treści, zwykle ostrzeżemy Cię, że Twoje treści mogą naruszać nasze zasady użytkowania, albo zablokujemy modelowi możliwość odpowiedzi na Twoje polecenie. Możemy też uniemożliwić udostępnienie czatu z problematycznym poleceniem lub odpowiedzią. W bardzo ograniczonych okolicznościach możemy również zablokować Twoje konto za rażące zachowanie.

Przyjmujemy też zgłoszenia od użytkowników dotyczące problematycznych treści w ChatGPT. Do analizowania tych zgłoszeń używamy połączenia zautomatyzowanych systemów i wyszkolonego zespołu ekspertów.

ChatGPT: Jeśli ktoś udostępni czat, który Twoim zdaniem zawiera problematyczne treści, możesz również zgłosić go nam.

Więcej informacji o zgłaszaniu treści bezpośrednio w ChatGPT znajdziesz w tym artykule.

GPT

Korzystamy też z narzędzi automatycznych, takich jak nasz interfejs API /moderation, aby sprawdzać, czy GPT jest potencjalnie problematyczny. Jeśli wykryjemy problematyczne treści powiązane z GPT, podejmiemy działania, na przykład uniemożliwiając jego dystrybucję. Twórca może edytować konfigurację GPT lub API, aby usunąć problematyczne treści, albo odwołać się od decyzji w ramach procesu dostępnego w produkcie. W bardzo ograniczonych okolicznościach możemy również zablokować konto twórcy za rażące zachowanie.

Przyjmujemy też zgłoszenia od użytkowników dotyczące problematycznych GPT. Jeśli zobaczysz GPT, który Twoim zdaniem narusza nasze zasady użytkowania lub w inny sposób zawiera problematyczne treści, możesz również zgłosić go nam. Do analizowania tych zgłoszeń używamy połączenia zautomatyzowanych systemów i wyszkolonego zespołu ekspertów.

Jak identyfikujemy problematyczne treści w naszych usługach dla użytkowników indywidualnych

ChatGPT i ImageGen

GPT

Czy ten artykuł był pomocny?