OpenAI
หน้านี้แปลด้วยระบบอัตโนมัติ ดูต้นฉบับภาษาอังกฤษ.

โมเดล open-weight ของ OpenAI (gpt-oss)

เรียนรู้เกี่ยวกับโมเดล open‑weight ของ OpenAI (gpt-oss) และช่องทางรับการสนับสนุน

อัปเดตล่าสุด: 4 days ago

หมายเหตุ: บทความนี้ให้ภาพรวมในระดับสูง ข้อมูลสำหรับการตั้งค่าทางเทคนิคดูได้ที่ เว็บไซต์ gpt-oss, GitHub, Hugging Face และ OpenAI Cookbooks.

ภาพรวม

ขอแนะนำโมเดลการให้เหตุผลแบบ open‑weight สองรุ่น: gpt‑oss‑120b และ gpt‑oss‑20b โดยสามารถรันบนโครงสร้างพื้นฐานที่คุณควบคุมเอง หรือผ่านผู้ให้บริการโฮสติ้งได้

หมายเหตุ: โมเดลเหล่านี้ไม่ได้ให้บริการผ่าน OpenAI API และไม่มีใน ChatGPT

ทำไมต้อง open-weights

  • ทางเลือกและการควบคุม: รันโมเดลภายในองค์กรหรือบน private cloud ของคุณ รักษาถิ่นที่อยู่ของข้อมูล และปรับประสิทธิภาพให้เหมาะกับความต้องการของคุณ

  • การปรับแต่ง: ปรับจูนละเอียดหรือดัดแปลงโมเดลด้วยเครื่องมือแบบเปิดที่คุณต้องการ

การใช้งานได้และการอนุญาตให้ใช้สิทธิ์

  • ใบอนุญาต: Apache 2.0 อนุญาตให้ใช้งาน แก้ไข และแจกจ่ายต่อได้อย่างกว้างขวาง รวมถึงเชิงพาณิชย์ (ภายใต้นโยบายการใช้งาน gpt-oss ของเรา usage policy)

  • การให้บริการ: ไม่มีให้ใช้งานผ่าน OpenAI API ดังนั้นราคา API และขีดจำกัดอัตราการใช้งานจึงไม่เกี่ยวข้อง

  • ความเข้ากันได้: สามารถรันด้วยสแตกอนุมานแบบเปิดที่ใช้กันทั่วไป เช่น vLLM, Ollama, llama.cpp และบนคลาวด์หรือสภาพแวดล้อม GPU ที่จัดการเอง

เริ่มต้นใช้งาน

หากต้องการรับน้ำหนักโมเดลและทรัพยากรสนับสนุน คุณสามารถ:

  • ไปที่ เว็บไซต์ gpt-oss เพื่อดูภาพรวมและลิงก์โดยตรง

  • ดาวน์โหลด weights จากคอลเลกชัน Hugging Face — ศูนย์กลางชุมชนที่คุณสามารถค้นหาได้ทั้งสองโมเดล ดูตัวอย่างการใช้งาน และเลือกเรียกใช้การอนุมานโดยตรงผ่านบริการของ Hugging Face ได้

  • เข้าถึง GitHub repo ของเราเพื่อดูโค้ดอ้างอิงสำหรับการอนุมาน

  • ใช้คู่มือใน OpenAI Cookbook สำหรับการตั้งค่ากับรันไทม์ที่รองรับ เช่น Ollama, vLLM และ Transformers โดย Cookbook ยังมีคำแนะนำทีละขั้นตอนสำหรับการรันในเครื่อง การใช้รันไทม์ทั่วไป และ—ในกรณีที่รองรับ—การปรับจูนละเอียดโมเดล gpt‑oss

gpt‑oss‑safeguard (พรีวิวงานวิจัย)

gpt‑oss‑safeguard คือโมเดลการให้เหตุผลด้านความปลอดภัยแบบ open‑weight สองรุ่นที่สร้างต่อยอดจาก gpt‑oss โดยออกแบบมาสำหรับการจัดประเภทความปลอดภัยตามนโยบาย และงาน trust & safety ที่เกี่ยวข้อง ซึ่งคุณรันบนโครงสร้างพื้นฐานที่คุณควบคุมเอง เช่นเดียวกับโมเดล gpt‑oss อื่นๆ weights เหล่านี้ไม่ได้ให้บริการผ่าน OpenAI API หรือ ChatGPT

  • โมเดลข้อความเท่านั้น พร้อม Schema ผลลัพธ์แบบมีโครงสร้างอ้างอิง (เช่น คำตัดสินตามนโยบาย เหตุผลประกอบ)

  • ใช้นโยบายของคุณเอง: โมเดลจะตีความนโยบายที่คุณเขียน เพื่อให้ทั่วไปใช้ได้ข้ามผลิตภัณฑ์ด้วยงานวิศวกรรมเพียงเล็กน้อย

  • การตัดสินใจแบบมีเหตุผล: มี reasoning traces แบบเลือกใช้เพื่อช่วยในการดีบักและการตรวจสอบ (มีไว้สำหรับนักพัฒนาและผู้ปฏิบัติงานด้านความปลอดภัย ไม่ใช่เพื่อแสดงให้ผู้ใช้ปลายทางเห็น)

  • ระดับการให้เหตุผลที่กำหนดได้: เลือก low / medium / high เพื่อแลกเปลี่ยนระหว่างความหน่วงกับความลึก

  • ใบอนุญาต: Apache 2.0 (ดู การใช้งานได้และการอนุญาตให้ใช้สิทธิ์ ด้านล่าง)

gpt‑oss‑safeguard เหมาะอย่างยิ่งสำหรับการกรองอินพุต/เอาต์พุตสำหรับ LLM การติดป้ายกำกับเนื้อหาออนไลน์ และเวิร์กโฟลว์การติดป้ายกำกับหรือการตรวจทานแบบแบตช์ออฟไลน์ สำหรับแอปพลิเคชันทั่วไป (แชต, เอเจนต์ ฯลฯ) เราแนะนำโมเดล gpt‑oss หลัก

คุณสามารถปรับ Schema ให้ตรงกับความต้องการของคุณได้ โปรดดู OpenAI Cookbook สำหรับคู่มือการเขียนคำสั่งและตัวอย่าง

รุ่นของโมเดลและขนาด

โมเดลการใช้งานที่ตั้งใจไว้หมายเหตุ
gpt‑oss‑safeguard‑120bใช้งานจริง การให้เหตุผลด้านความปลอดภัยความจุสูง117B พารามิเตอร์ (≈5.1B ที่ทำงานอยู่) ออกแบบให้พอดีกับ GPU 80 GB เพียงตัวเดียว (เช่น NVIDIA H100; และยังรันได้บน GPU หน่วยความจำสูงกว่า เช่น AMD MI300X)
gpt‑oss‑safeguard‑20bสภาพแวดล้อมที่ต้องการความหน่วงต่ำกว่า / มีข้อจำกัด21B พารามิเตอร์ (≈3.6B ที่ทำงานอยู่)

ทั้งสองโมเดลได้รับการปรับจูนละเอียดจาก gpt‑oss โดยไม่มีการเปลี่ยนแปลงสถาปัตยกรรม ใช้เทมเพลตแชตเดียวกับ gpt‑oss ดังนั้นคุณสามารถใช้การตั้งค่าเดิมของคุณได้ รูปแบบการเขียนคำสั่งที่แนะนำคือใส่นโยบายของคุณไว้ในข้อความนักพัฒนา และใส่เนื้อหาที่ต้องประเมินไว้ในข้อความผู้ใช้

การสนับสนุนและชุมชน

การปรับใช้แบบ open‑weight เป็นการจัดการและให้บริการด้วยตนเอง ต่อไปนี้คือช่องทางรับการสนับสนุน:

  • คำถาม การพูดคุย เคล็ดลับ: ใช้ หน้ารวมโมเดลของ Hugging Face เพื่อพูดคุยกับชุมชน

  • บั๊กที่ทำซ้ำได้ในโค้ดอ้างอิงการอนุมานของ OpenAI: เปิด issue ใน GitHub repo ของ gpt-oss

  • ปัญหากับรันไทม์ของบุคคลที่สาม (เช่น vLLM, Ollama, llama.cpp): ใช้ตัวติดตาม issue ฟอรัม หรือกระบวนการสนับสนุนของแต่ละโครงการ

OpenAI ไม่ ให้ความช่วยเหลือ การลงมือช่วยติดตั้งใช้งาน หรือการสนับสนุนการดีบัก สำหรับการตั้งค่า คอนฟิกูเรชัน สภาพแวดล้อม หรือแอปพลิเคชันแบบ open‑weight ที่โฮสต์เองหรือโฮสต์โดยบุคคลที่สามใดๆ

เราจะพัฒนาร่วมกับชุมชนต่อไปเพื่อปรับปรุงเครื่องมือความปลอดภัยแบบเปิด รวมถึงผ่าน ROOST Model Community (RMC) โดย RMC รวบรวมผู้ปฏิบัติงานและนักวิจัยด้านความปลอดภัยเพื่อแบ่งปันแนวทางปฏิบัติที่ดีที่สุดสำหรับการนำโมเดล AI โอเพนซอร์สไปใช้ในเวิร์กโฟลว์ด้านความปลอดภัย รวมถึงผลการประเมินและข้อเสนอแนะต่อโมเดล ไปที่ GitHub repo ของ RMC เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับความร่วมมือนี้และวิธีเข้าร่วม

การสนับสนุนและชุมชน

การปรับใช้แบบ open‑weight เป็นการจัดการและให้บริการด้วยตนเอง ต่อไปนี้คือช่องทางรับการสนับสนุน:

  • คำถาม การพูดคุย เคล็ดลับ: ใช้ หน้ารวมโมเดลของ Hugging Face เพื่อพูดคุยกับชุมชน

  • บั๊กที่ทำซ้ำได้ในโค้ดอ้างอิงการอนุมานของ OpenAI: เปิด issue ใน GitHub repo ของ gpt-oss

  • ปัญหากับรันไทม์ของบุคคลที่สาม (เช่น vLLM, Ollama, llama.cpp): ใช้ตัวติดตาม issue ฟอรัม หรือกระบวนการสนับสนุนของแต่ละโครงการ

OpenAI ไม่ ให้ความช่วยเหลือ การลงมือช่วยติดตั้งใช้งาน หรือการสนับสนุนการดีบัก สำหรับการตั้งค่า คอนฟิกูเรชัน สภาพแวดล้อม หรือแอปพลิเคชันแบบ open‑weight ที่โฮสต์เองหรือโฮสต์โดยบุคคลที่สามใดๆ

ความเป็นส่วนตัวและความปลอดภัย

ความเป็นส่วนตัวและข้อมูล

โมเดลเหล่านี้ออกแบบมาให้รันบนโครงสร้างพื้นฐานที่คุณควบคุมเอง (ภายในองค์กร หรือบนคลาวด์หรือพาร์ทเนอร์โฮสติ้งของคุณ) OpenAI จะไม่ได้รับหรือประมวลผลข้อมูลที่คุณส่งไปยังโมเดลที่โฮสต์เองเหล่านี้ เว้นแต่คุณจะแชร์ข้อมูลนั้นกับ OpenAI อย่างชัดแจ้ง หรือใช้พาร์ทเนอร์โฮสติ้งแบบจัดการของเรา

ความปลอดภัย

โมเดลเหล่านี้ผ่านการฝึกและทดสอบด้านความปลอดภัยอย่างเข้มข้น สำหรับรายละเอียดเพิ่มเติม โปรดดู เอกสารกำกับโมเดล และ รายงานทางเทคนิค

การรายงานการละเมิดด้านเนื้อหา

หากคุณเชื่อว่าเนื้อหาที่สร้างด้วยโมเดล gpt‑oss ละเมิดนโยบายของเรา คุณสามารถรายงานได้ผ่าน แบบฟอร์ม Report Content โปรดระบุรายละเอียดให้มากที่สุดเพื่อช่วยให้ทีมของเราตรวจสอบการส่งเรื่องของคุณได้

คำถามที่พบบ่อย

โมเดลเหล่านี้ใช้ฟรีหรือไม่?

weights ของโมเดล gpt-oss ดาวน์โหลดและใช้งานได้ฟรีภายใต้ใบอนุญาต Apache 2.0 และ usage policy ของ gpt-oss อย่างไรก็ตาม คุณต้องรับผิดชอบค่าใช้จ่ายใดๆ ที่เกี่ยวข้องกับการรันโมเดลเหล่านี้ เช่น ค่าคอมพิวต์ ค่าจัดเก็บ หรือค่าบริการโฮสติ้งของบุคคลที่สาม โดยราคาจะขึ้นอยู่กับโครงสร้างพื้นฐานหรือผู้ให้บริการที่คุณเลือก

โมเดลเหล่านี้เป็น “โอเพนซอร์ส” หรือไม่?

เราใช้คำว่า open models หรือ open-weight เพื่อระบุว่า weights ที่ฝึกแล้วเปิดให้สาธารณะใช้งานภายใต้ใบอนุญาต Apache 2.0 ที่ยืดหยุ่นและ usage policy ของ gpt-oss ซึ่งหมายความว่าคุณสามารถดาวน์โหลดโมเดล รันบนโครงสร้างพื้นฐานของคุณเองหรือด้วยเฟรมเวิร์กโฮสติ้งที่รองรับ และปรับแต่งหรือปรับจูนละเอียดได้

Open models ให้การควบคุมและความยืดหยุ่นมากขึ้นแก่ทั้งนักพัฒนาและองค์กร คุณสามารถเลือกสถานที่โฮสต์ ปรับโมเดลสำหรับกรณีใช้งานเฉพาะ และได้รับประโยชน์จากใบอนุญาตที่อนุญาตให้ใช้งาน แก้ไข และแจกจ่ายต่อได้อย่างกว้างขวาง แม้ว่า weights ที่ฝึกแล้วจะเปิด แต่โครงสร้างพื้นฐานหรือเครื่องมือรอบด้านบางส่วนอาจยังเป็นกรรมสิทธิ์ของผู้ให้บริการนั้นๆ

ฉันสามารถเข้าถึงโมเดลเหล่านี้ผ่าน OpenAI API หรือ ChatGPT ได้หรือไม่?

ไม่ได้ โมเดลเหล่านี้ไม่ได้ให้บริการใน OpenAI API และไม่ปรากฏใน ChatGPT

ฉันสามารถปรับจูนละเอียดโมเดลได้หรือไม่?

ได้ คุณสามารถปรับจูนละเอียดโดยใช้เครื่องมือโอเพนซอร์สและโครงสร้างพื้นฐานที่คุณต้องการ เราไม่มีบริการปรับจูนละเอียดผ่าน OpenAI APIs สำหรับโมเดลเหล่านี้

โมเดล open‑weight ถูกกว่าการใช้ API หรือไม่?

ค่าใช้จ่ายแตกต่างกันไปตามโครงสร้างพื้นฐาน ปริมาณงาน และแนวทางการปฏิบัติงาน การโฮสต์เองอาจถูกกว่าในบางกรณี ขณะที่ API Platform ของเราอาจมีประสิทธิภาพกว่าหากคำนึงถึงการโฮสต์ การบำรุงรักษา และการอัปเกรด

โมเดลเหล่านี้รองรับฟีเจอร์อะไรบ้าง?

ขณะนี้โมเดลเหล่านี้เป็นโมเดลการให้เหตุผลแบบข้อความเท่านั้น รันไทม์ทั่วไปมักรองรับการสตรีม Function Calling และผลลัพธ์แบบมีโครงสร้าง ตรวจสอบเอกสารของรันไทม์ของคุณสำหรับความสามารถที่แน่นอน

สิ่งนี้แตกต่างจาก ModAPI อย่างไร?

นี่คือโมเดลการให้เหตุผลที่มีความสามารถสูงซึ่งให้คุณนำนโยบายของคุณเองมาใช้ได้ โดยสามารถทำงานร่วมกับ ModAPI ได้ แต่มีแนวโน้มว่าจะไม่ใช่ตัวทดแทนสำหรับกรณีใช้งานที่ต้องการความหน่วงต่ำ

บทความนี้มีประโยชน์หรือไม่