หมายเหตุ: บทความนี้ให้ภาพรวมในระดับสูง ข้อมูลสำหรับการตั้งค่าทางเทคนิคดูได้ที่ เว็บไซต์ gpt-oss, GitHub, Hugging Face และ OpenAI Cookbooks.
ภาพรวม
ขอแนะนำโมเดลการให้เหตุผลแบบ open‑weight สองรุ่น: gpt‑oss‑120b และ gpt‑oss‑20b โดยสามารถรันบนโครงสร้างพื้นฐานที่คุณควบคุมเอง หรือผ่านผู้ให้บริการโฮสติ้งได้
หมายเหตุ: โมเดลเหล่านี้ไม่ได้ให้บริการผ่าน OpenAI API และไม่มีใน ChatGPT
ทำไมต้อง open-weights
ทางเลือกและการควบคุม: รันโมเดลภายในองค์กรหรือบน private cloud ของคุณ รักษาถิ่นที่อยู่ของข้อมูล และปรับประสิทธิภาพให้เหมาะกับความต้องการของคุณ
การปรับแต่ง: ปรับจูนละเอียดหรือดัดแปลงโมเดลด้วยเครื่องมือแบบเปิดที่คุณต้องการ
การใช้งานได้และการอนุญาตให้ใช้สิทธิ์
ใบอนุญาต: Apache 2.0 อนุญาตให้ใช้งาน แก้ไข และแจกจ่ายต่อได้อย่างกว้างขวาง รวมถึงเชิงพาณิชย์ (ภายใต้นโยบายการใช้งาน gpt-oss ของเรา usage policy)
การให้บริการ: ไม่มีให้ใช้งานผ่าน OpenAI API ดังนั้นราคา API และขีดจำกัดอัตราการใช้งานจึงไม่เกี่ยวข้อง
ความเข้ากันได้: สามารถรันด้วยสแตกอนุมานแบบเปิดที่ใช้กันทั่วไป เช่น vLLM, Ollama, llama.cpp และบนคลาวด์หรือสภาพแวดล้อม GPU ที่จัดการเอง
เริ่มต้นใช้งาน
หากต้องการรับน้ำหนักโมเดลและทรัพยากรสนับสนุน คุณสามารถ:
ไปที่ เว็บไซต์ gpt-oss เพื่อดูภาพรวมและลิงก์โดยตรง
ดาวน์โหลด weights จากคอลเลกชัน Hugging Face — ศูนย์กลางชุมชนที่คุณสามารถค้นหาได้ทั้งสองโมเดล ดูตัวอย่างการใช้งาน และเลือกเรียกใช้การอนุมานโดยตรงผ่านบริการของ Hugging Face ได้
เข้าถึง GitHub repo ของเราเพื่อดูโค้ดอ้างอิงสำหรับการอนุมาน
ใช้คู่มือใน OpenAI Cookbook สำหรับการตั้งค่ากับรันไทม์ที่รองรับ เช่น Ollama, vLLM และ Transformers โดย Cookbook ยังมีคำแนะนำทีละขั้นตอนสำหรับการรันในเครื่อง การใช้รันไทม์ทั่วไป และ—ในกรณีที่รองรับ—การปรับจูนละเอียดโมเดล gpt‑oss
gpt‑oss‑safeguard (พรีวิวงานวิจัย)
gpt‑oss‑safeguard คือโมเดลการให้เหตุผลด้านความปลอดภัยแบบ open‑weight สองรุ่นที่สร้างต่อยอดจาก gpt‑oss โดยออกแบบมาสำหรับการจัดประเภทความปลอดภัยตามนโยบาย และงาน trust & safety ที่เกี่ยวข้อง ซึ่งคุณรันบนโครงสร้างพื้นฐานที่คุณควบคุมเอง เช่นเดียวกับโมเดล gpt‑oss อื่นๆ weights เหล่านี้ไม่ได้ให้บริการผ่าน OpenAI API หรือ ChatGPT
โมเดลข้อความเท่านั้น พร้อม Schema ผลลัพธ์แบบมีโครงสร้างอ้างอิง (เช่น คำตัดสินตามนโยบาย เหตุผลประกอบ)
ใช้นโยบายของคุณเอง: โมเดลจะตีความนโยบายที่คุณเขียน เพื่อให้ทั่วไปใช้ได้ข้ามผลิตภัณฑ์ด้วยงานวิศวกรรมเพียงเล็กน้อย
การตัดสินใจแบบมีเหตุผล: มี reasoning traces แบบเลือกใช้เพื่อช่วยในการดีบักและการตรวจสอบ (มีไว้สำหรับนักพัฒนาและผู้ปฏิบัติงานด้านความปลอดภัย ไม่ใช่เพื่อแสดงให้ผู้ใช้ปลายทางเห็น)
ระดับการให้เหตุผลที่กำหนดได้: เลือก low / medium / high เพื่อแลกเปลี่ยนระหว่างความหน่วงกับความลึก
ใบอนุญาต: Apache 2.0 (ดู การใช้งานได้และการอนุญาตให้ใช้สิทธิ์ ด้านล่าง)
gpt‑oss‑safeguard เหมาะอย่างยิ่งสำหรับการกรองอินพุต/เอาต์พุตสำหรับ LLM การติดป้ายกำกับเนื้อหาออนไลน์ และเวิร์กโฟลว์การติดป้ายกำกับหรือการตรวจทานแบบแบตช์ออฟไลน์ สำหรับแอปพลิเคชันทั่วไป (แชต, เอเจนต์ ฯลฯ) เราแนะนำโมเดล gpt‑oss หลัก
คุณสามารถปรับ Schema ให้ตรงกับความต้องการของคุณได้ โปรดดู OpenAI Cookbook สำหรับคู่มือการเขียนคำสั่งและตัวอย่าง
รุ่นของโมเดลและขนาด
| โมเดล | การใช้งานที่ตั้งใจไว้ | หมายเหตุ |
| gpt‑oss‑safeguard‑120b | ใช้งานจริง การให้เหตุผลด้านความปลอดภัยความจุสูง | 117B พารามิเตอร์ (≈5.1B ที่ทำงานอยู่) ออกแบบให้พอดีกับ GPU 80 GB เพียงตัวเดียว (เช่น NVIDIA H100; และยังรันได้บน GPU หน่วยความจำสูงกว่า เช่น AMD MI300X) |
| gpt‑oss‑safeguard‑20b | สภาพแวดล้อมที่ต้องการความหน่วงต่ำกว่า / มีข้อจำกัด | 21B พารามิเตอร์ (≈3.6B ที่ทำงานอยู่) |
ทั้งสองโมเดลได้รับการปรับจูนละเอียดจาก gpt‑oss โดยไม่มีการเปลี่ยนแปลงสถาปัตยกรรม ใช้เทมเพลตแชตเดียวกับ gpt‑oss ดังนั้นคุณสามารถใช้การตั้งค่าเดิมของคุณได้ รูปแบบการเขียนคำสั่งที่แนะนำคือใส่นโยบายของคุณไว้ในข้อความนักพัฒนา และใส่เนื้อหาที่ต้องประเมินไว้ในข้อความผู้ใช้
การสนับสนุนและชุมชน
การปรับใช้แบบ open‑weight เป็นการจัดการและให้บริการด้วยตนเอง ต่อไปนี้คือช่องทางรับการสนับสนุน:
คำถาม การพูดคุย เคล็ดลับ: ใช้ หน้ารวมโมเดลของ Hugging Face เพื่อพูดคุยกับชุมชน
บั๊กที่ทำซ้ำได้ในโค้ดอ้างอิงการอนุมานของ OpenAI: เปิด issue ใน GitHub repo ของ gpt-oss
ปัญหากับรันไทม์ของบุคคลที่สาม (เช่น vLLM, Ollama, llama.cpp): ใช้ตัวติดตาม issue ฟอรัม หรือกระบวนการสนับสนุนของแต่ละโครงการ
OpenAI ไม่ ให้ความช่วยเหลือ การลงมือช่วยติดตั้งใช้งาน หรือการสนับสนุนการดีบัก สำหรับการตั้งค่า คอนฟิกูเรชัน สภาพแวดล้อม หรือแอปพลิเคชันแบบ open‑weight ที่โฮสต์เองหรือโฮสต์โดยบุคคลที่สามใดๆ
เราจะพัฒนาร่วมกับชุมชนต่อไปเพื่อปรับปรุงเครื่องมือความปลอดภัยแบบเปิด รวมถึงผ่าน ROOST Model Community (RMC) โดย RMC รวบรวมผู้ปฏิบัติงานและนักวิจัยด้านความปลอดภัยเพื่อแบ่งปันแนวทางปฏิบัติที่ดีที่สุดสำหรับการนำโมเดล AI โอเพนซอร์สไปใช้ในเวิร์กโฟลว์ด้านความปลอดภัย รวมถึงผลการประเมินและข้อเสนอแนะต่อโมเดล ไปที่ GitHub repo ของ RMC เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับความร่วมมือนี้และวิธีเข้าร่วม
การสนับสนุนและชุมชน
การปรับใช้แบบ open‑weight เป็นการจัดการและให้บริการด้วยตนเอง ต่อไปนี้คือช่องทางรับการสนับสนุน:
คำถาม การพูดคุย เคล็ดลับ: ใช้ หน้ารวมโมเดลของ Hugging Face เพื่อพูดคุยกับชุมชน
บั๊กที่ทำซ้ำได้ในโค้ดอ้างอิงการอนุมานของ OpenAI: เปิด issue ใน GitHub repo ของ gpt-oss
ปัญหากับรันไทม์ของบุคคลที่สาม (เช่น vLLM, Ollama, llama.cpp): ใช้ตัวติดตาม issue ฟอรัม หรือกระบวนการสนับสนุนของแต่ละโครงการ
OpenAI ไม่ ให้ความช่วยเหลือ การลงมือช่วยติดตั้งใช้งาน หรือการสนับสนุนการดีบัก สำหรับการตั้งค่า คอนฟิกูเรชัน สภาพแวดล้อม หรือแอปพลิเคชันแบบ open‑weight ที่โฮสต์เองหรือโฮสต์โดยบุคคลที่สามใดๆ
ความเป็นส่วนตัวและความปลอดภัย
ความเป็นส่วนตัวและข้อมูล
โมเดลเหล่านี้ออกแบบมาให้รันบนโครงสร้างพื้นฐานที่คุณควบคุมเอง (ภายในองค์กร หรือบนคลาวด์หรือพาร์ทเนอร์โฮสติ้งของคุณ) OpenAI จะไม่ได้รับหรือประมวลผลข้อมูลที่คุณส่งไปยังโมเดลที่โฮสต์เองเหล่านี้ เว้นแต่คุณจะแชร์ข้อมูลนั้นกับ OpenAI อย่างชัดแจ้ง หรือใช้พาร์ทเนอร์โฮสติ้งแบบจัดการของเรา
ความปลอดภัย
โมเดลเหล่านี้ผ่านการฝึกและทดสอบด้านความปลอดภัยอย่างเข้มข้น สำหรับรายละเอียดเพิ่มเติม โปรดดู เอกสารกำกับโมเดล และ รายงานทางเทคนิค
การรายงานการละเมิดด้านเนื้อหา
หากคุณเชื่อว่าเนื้อหาที่สร้างด้วยโมเดล gpt‑oss ละเมิดนโยบายของเรา คุณสามารถรายงานได้ผ่าน แบบฟอร์ม Report Content โปรดระบุรายละเอียดให้มากที่สุดเพื่อช่วยให้ทีมของเราตรวจสอบการส่งเรื่องของคุณได้
คำถามที่พบบ่อย
โมเดลเหล่านี้ใช้ฟรีหรือไม่?
weights ของโมเดล gpt-oss ดาวน์โหลดและใช้งานได้ฟรีภายใต้ใบอนุญาต Apache 2.0 และ usage policy ของ gpt-oss อย่างไรก็ตาม คุณต้องรับผิดชอบค่าใช้จ่ายใดๆ ที่เกี่ยวข้องกับการรันโมเดลเหล่านี้ เช่น ค่าคอมพิวต์ ค่าจัดเก็บ หรือค่าบริการโฮสติ้งของบุคคลที่สาม โดยราคาจะขึ้นอยู่กับโครงสร้างพื้นฐานหรือผู้ให้บริการที่คุณเลือก
โมเดลเหล่านี้เป็น “โอเพนซอร์ส” หรือไม่?
เราใช้คำว่า open models หรือ open-weight เพื่อระบุว่า weights ที่ฝึกแล้วเปิดให้สาธารณะใช้งานภายใต้ใบอนุญาต Apache 2.0 ที่ยืดหยุ่นและ usage policy ของ gpt-oss ซึ่งหมายความว่าคุณสามารถดาวน์โหลดโมเดล รันบนโครงสร้างพื้นฐานของคุณเองหรือด้วยเฟรมเวิร์กโฮสติ้งที่รองรับ และปรับแต่งหรือปรับจูนละเอียดได้
Open models ให้การควบคุมและความยืดหยุ่นมากขึ้นแก่ทั้งนักพัฒนาและองค์กร คุณสามารถเลือกสถานที่โฮสต์ ปรับโมเดลสำหรับกรณีใช้งานเฉพาะ และได้รับประโยชน์จากใบอนุญาตที่อนุญาตให้ใช้งาน แก้ไข และแจกจ่ายต่อได้อย่างกว้างขวาง แม้ว่า weights ที่ฝึกแล้วจะเปิด แต่โครงสร้างพื้นฐานหรือเครื่องมือรอบด้านบางส่วนอาจยังเป็นกรรมสิทธิ์ของผู้ให้บริการนั้นๆ
ฉันสามารถเข้าถึงโมเดลเหล่านี้ผ่าน OpenAI API หรือ ChatGPT ได้หรือไม่?
ไม่ได้ โมเดลเหล่านี้ไม่ได้ให้บริการใน OpenAI API และไม่ปรากฏใน ChatGPT
ฉันสามารถปรับจูนละเอียดโมเดลได้หรือไม่?
ได้ คุณสามารถปรับจูนละเอียดโดยใช้เครื่องมือโอเพนซอร์สและโครงสร้างพื้นฐานที่คุณต้องการ เราไม่มีบริการปรับจูนละเอียดผ่าน OpenAI APIs สำหรับโมเดลเหล่านี้
โมเดล open‑weight ถูกกว่าการใช้ API หรือไม่?
ค่าใช้จ่ายแตกต่างกันไปตามโครงสร้างพื้นฐาน ปริมาณงาน และแนวทางการปฏิบัติงาน การโฮสต์เองอาจถูกกว่าในบางกรณี ขณะที่ API Platform ของเราอาจมีประสิทธิภาพกว่าหากคำนึงถึงการโฮสต์ การบำรุงรักษา และการอัปเกรด
โมเดลเหล่านี้รองรับฟีเจอร์อะไรบ้าง?
ขณะนี้โมเดลเหล่านี้เป็นโมเดลการให้เหตุผลแบบข้อความเท่านั้น รันไทม์ทั่วไปมักรองรับการสตรีม Function Calling และผลลัพธ์แบบมีโครงสร้าง ตรวจสอบเอกสารของรันไทม์ของคุณสำหรับความสามารถที่แน่นอน
สิ่งนี้แตกต่างจาก ModAPI อย่างไร?
นี่คือโมเดลการให้เหตุผลที่มีความสามารถสูงซึ่งให้คุณนำนโยบายของคุณเองมาใช้ได้ โดยสามารถทำงานร่วมกับ ModAPI ได้ แต่มีแนวโน้มว่าจะไม่ใช่ตัวทดแทนสำหรับกรณีใช้งานที่ต้องการความหน่วงต่ำ
