หมายเหตุ: บทความนี้ให้ภาพรวมระดับสูง ข้อมูลสำหรับการตั้งค่าทางเทคนิคดูได้ที่ เว็บไซต์ gpt-oss, GitHub, Hugging Face และ OpenAI Cookbooks
ภาพรวม
ขอแนะนำโมเดลการให้เหตุผลแบบ open-weight สองรุ่น: gpt‑oss‑120b และ gpt‑oss‑20b โมเดลเหล่านี้ทำงานบนโครงสร้างพื้นฐานที่คุณควบคุม หรือผ่านผู้ให้บริการโฮสติ้ง
หมายเหตุ: โมเดลเหล่านี้ไม่ได้ให้บริการผ่าน OpenAI API และไม่มีใน ChatGPT
เหตุผลที่ใช้ open-weights
ทางเลือกและการควบคุม: รันโมเดลในองค์กรหรือในคลาวด์ส่วนตัวของคุณ รักษาถิ่นที่อยู่ของข้อมูล และปรับประสิทธิภาพให้ตรงกับความต้องการของคุณ
การปรับแต่ง: Fine-tune หรือปรับโมเดลด้วยเครื่องมือแบบเปิดที่คุณต้องการ
ความพร้อมใช้งานและการให้สัญญาอนุญาต
สัญญาอนุญาต: Apache 2.0 อนุญาตให้ใช้งาน แก้ไข และแจกจ่ายต่อได้อย่างกว้างขวาง รวมถึงการใช้งานเชิงพาณิชย์ (ภายใต้นโยบายการใช้งาน gpt-oss ของเรา)
การให้บริการ: ไม่มีให้ใช้งานผ่าน OpenAI API ดังนั้นราคา API และลิมิตการใช้งานจึงไม่เกี่ยวข้อง
ความเข้ากันได้: สามารถรันกับสแต็กการอนุมานแบบเปิดที่ใช้กันทั่วไป เช่น vLLM, Ollama, llama.cpp และบนสภาพแวดล้อม GPU บนคลาวด์หรือที่จัดการเอง
เริ่มต้นใช้งาน
ในการรับน้ำหนักโมเดลและทรัพยากรสนับสนุน คุณสามารถ:
ไปที่เว็บไซต์ gpt-ossเพื่อดูภาพรวมและลิงก์โดยตรง
ดาวน์โหลดน้ำหนักจากคอลเลกชัน Hugging Face — ฮับชุมชนที่คุณค้นหาโมเดลทั้งสอง ดูตัวอย่างการใช้งาน และเลือกเรียกอนุมานโดยตรงผ่านบริการของ Hugging Face ได้
เข้าถึงGitHub repoของเราสำหรับโค้ดอนุมานอ้างอิง
ใช้คู่มือในOpenAI Cookbookสำหรับการตั้งค่ากับรันไทม์ที่รองรับ เช่น Ollama, vLLM และ Transformers Cookbook ยังมีคำแนะนำทีละขั้นสำหรับการรันในเครื่อง การใช้รันไทม์ทั่วไป และ—เมื่อรองรับ—การ fine-tune โมเดล gpt‑oss
gpt‑oss‑safeguard (ตัวอย่างงานวิจัย)
gpt‑oss‑safeguard คือคู่ของโมเดลการให้เหตุผลด้านความปลอดภัยแบบ open-weightที่สร้างบน gpt‑oss โมเดลเหล่านี้ออกแบบมาสำหรับการจำแนกความปลอดภัยตามนโยบายและงานด้านความน่าเชื่อถือและความปลอดภัยที่เกี่ยวข้อง ซึ่งคุณรันบนโครงสร้างพื้นฐานที่คุณควบคุม เช่นเดียวกับโมเดล gpt‑oss อื่นๆ น้ำหนักเหล่านี้ไม่ได้ให้บริการผ่าน OpenAI API หรือ ChatGPT
โมเดลแบบข้อความเท่านั้นพร้อม Schema อ้างอิงสำหรับผลลัพธ์แบบมีโครงสร้าง (เช่น คำตัดสินตามนโยบาย เหตุผลประกอบ)
นำ Policy ของคุณมาใช้เอง: โมเดลตีความนโยบายที่คุณเขียน เพื่อให้ปรับใช้ข้ามผลิตภัณฑ์ได้โดยใช้วิศวกรรมน้อยที่สุด
การตัดสินใจที่มีเหตุผล: มีร่องรอยการให้เหตุผลเป็นตัวเลือกเพื่อช่วยดีบักและตรวจสอบ (มุ่งสำหรับนักพัฒนาและผู้ปฏิบัติงานด้านความปลอดภัย ไม่ใช่สำหรับแสดงต่อผู้ใช้ปลายทาง)
ปรับระดับการให้เหตุผลได้: เลือกต่ำ / กลาง / สูง เพื่อแลกระหว่างเวลาแฝงกับความลึก
สัญญาอนุญาต: Apache 2.0 (ดูความพร้อมใช้งานและการให้สัญญาอนุญาตด้านล่าง)
gpt‑oss‑safeguard เหมาะสำหรับการกรองอินพุต/เอาต์พุตของ LLM การติดป้ายกำกับเนื้อหาออนไลน์ และเวิร์กโฟลว์การติดป้ายกำกับหรือรีวิวแบบแบตช์ออฟไลน์ สำหรับแอปพลิเคชันทั่วไป (แชต เอเจนต์ ฯลฯ) เราแนะนำโมเดล gpt‑oss หลัก
คุณสามารถปรับ Schema ให้ตรงกับความต้องการของคุณได้ โปรดดูOpenAI Cookbookสำหรับคู่มือการเขียนคำสั่งและตัวอย่าง
รุ่นย่อยของโมเดลและขนาด
| โมเดล | การใช้งานที่ตั้งใจไว้ | หมายเหตุ |
|---|---|---|
| gpt‑oss‑safeguard‑120b | การให้เหตุผลด้านความปลอดภัยสำหรับการใช้งานจริง ความจุสูง | พารามิเตอร์ 117B (ใช้งานอยู่ ≈5.1B) ออกแบบมาให้พอดีกับ GPU 80 GB เพียงตัวเดียว (เช่น NVIDIA H100; และยังรันบน GPU หน่วยความจำสูงกว่า เช่น AMD MI300X ได้) |
| gpt‑oss‑safeguard‑20b | เวลาแฝงต่ำกว่า / สภาพแวดล้อมที่มีข้อจำกัด | พารามิเตอร์ 21B (ใช้งานอยู่ ≈3.6B) |
โมเดลทั้งสอง fine-tune มาจาก gpt‑oss โดยไม่มีการเปลี่ยนแปลงสถาปัตยกรรม โมเดลเหล่านี้ใช้เทมเพลตแชตเดียวกับ gpt‑oss คุณจึงคงการตั้งค่าที่มีอยู่ได้ รูปแบบคำสั่งที่แนะนำคือใส่นโยบายของคุณในข้อความสำหรับนักพัฒนา และใส่เนื้อหาที่ต้องประเมินในข้อความของผู้ใช้
การสนับสนุนและชุมชน
การปรับใช้แบบ open-weight ต้องจัดการและให้บริการด้วยตนเอง ช่องทางรับการสนับสนุนมีดังนี้:
คำถาม การสนทนา เคล็ดลับ: ใช้หน้าโมเดลบน Hugging Faceเพื่อมีส่วนร่วมกับชุมชน
บั๊กที่ทำซ้ำได้ในโค้ดอนุมานอ้างอิงของ OpenAI: เปิด issue ใน gpt-oss GitHub repo
ปัญหาเกี่ยวกับรันไทม์ของบุคคลที่สาม (เช่น vLLM, Ollama, llama.cpp): ใช้ระบบติดตามปัญหา ฟอรัม หรือกระบวนการสนับสนุนของโปรเจกต์นั้นๆ
OpenAI ไม่ให้ความช่วยเหลือ การลงมือใช้งานให้ หรือการสนับสนุนการดีบักสำหรับการตั้งค่า การกำหนดค่า สภาพแวดล้อม หรือแอปพลิเคชันแบบ open-weight ที่โฮสต์เองหรือโฮสต์โดยบุคคลที่สาม
เราจะทำงานร่วมกับชุมชนต่อไปเพื่อปรับปรุงเครื่องมือความปลอดภัยแบบเปิด รวมถึงผ่าน ROOST Model Community (RMC) RMC รวบรวมผู้ปฏิบัติงานและนักวิจัยด้านความปลอดภัยเพื่อแบ่งปันแนวทางปฏิบัติที่ดีที่สุดในการนำโมเดล AI โอเพนซอร์สไปใช้ในเวิร์กโฟลว์ความปลอดภัย รวมถึงผลการประเมินและข้อเสนอแนะต่อโมเดล ไปที่RMC GitHub repoเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับความร่วมมือนี้และวิธีเข้าร่วม
การสนับสนุนและชุมชน
การปรับใช้แบบ open-weight ต้องจัดการและให้บริการด้วยตนเอง ช่องทางรับการสนับสนุนมีดังนี้:
คำถาม การสนทนา เคล็ดลับ: ใช้หน้าโมเดลบน Hugging Faceเพื่อมีส่วนร่วมกับชุมชน
บั๊กที่ทำซ้ำได้ในโค้ดอนุมานอ้างอิงของ OpenAI: เปิด issue ใน gpt-oss GitHub repo
ปัญหาเกี่ยวกับรันไทม์ของบุคคลที่สาม (เช่น vLLM, Ollama, llama.cpp): ใช้ระบบติดตามปัญหา ฟอรัม หรือกระบวนการสนับสนุนของโปรเจกต์นั้นๆ
OpenAI ไม่ให้ความช่วยเหลือ การลงมือใช้งานให้ หรือการสนับสนุนการดีบักสำหรับการตั้งค่า การกำหนดค่า สภาพแวดล้อม หรือแอปพลิเคชันแบบ open-weight ที่โฮสต์เองหรือโฮสต์โดยบุคคลที่สาม
ความเป็นส่วนตัวและความปลอดภัย
ความเป็นส่วนตัวและข้อมูล
โมเดลเหล่านี้ออกแบบมาให้รันบนโครงสร้างพื้นฐานที่คุณควบคุม (ในองค์กร หรือในคลาวด์หรือพาร์ทเนอร์โฮสติ้งของคุณ) OpenAI จะไม่รับหรือประมวลผลข้อมูลที่คุณส่งไปยังโมเดลที่โฮสต์เองเหล่านี้ เว้นแต่คุณจะแชร์กับ OpenAI อย่างชัดเจน หรือใช้พาร์ทเนอร์โฮสติ้งที่มีการจัดการของเรา
ความปลอดภัย
โมเดลเหล่านี้ผ่านการฝึกอบรมและการทดสอบด้านความปลอดภัยอย่างครอบคลุม ดูรายละเอียดเพิ่มเติมได้ในเอกสารกำกับโมเดลและรายงานทางเทคนิคของเรา
การรายงานการละเมิดเนื้อหา
หากคุณเชื่อว่าเนื้อหาที่สร้างด้วยโมเดล gpt‑oss ละเมิดนโยบายของเรา คุณสามารถรายงานผ่านแบบฟอร์มรายงานเนื้อหาของเรา โปรดให้รายละเอียดมากที่สุดเท่าที่เป็นไปได้เพื่อช่วยให้ทีมของเราตรวจสอบการส่งของคุณ
คำถามที่พบบ่อย
โมเดลเหล่านี้ฟรีหรือไม่
น้ำหนักโมเดล gpt-oss ดาวน์โหลดและใช้งานได้ฟรีภายใต้สัญญาอนุญาต Apache 2.0 และนโยบายการใช้งาน gpt-oss อย่างไรก็ตาม คุณต้องรับผิดชอบค่าใช้จ่ายใดๆ ที่เกี่ยวข้องกับการรันโมเดลเหล่านี้ — เช่น ค่า compute ค่าพื้นที่จัดเก็บ หรือค่าบริการโฮสติ้งของบุคคลที่สาม ราคาสำหรับสิ่งเหล่านั้นจะขึ้นอยู่กับโครงสร้างพื้นฐานหรือผู้ให้บริการที่คุณเลือก
โมเดลเหล่านี้เป็น “โอเพนซอร์ส” หรือไม่
เราใช้คำว่า open models หรือ open-weight เพื่อระบุว่าน้ำหนักที่ฝึกแล้วมีให้สาธารณะภายใต้สัญญาอนุญาต Apache 2.0 แบบผ่อนปรน และนโยบายการใช้งาน gpt-oss ซึ่งหมายความว่าคุณสามารถดาวน์โหลดโมเดล รันบนโครงสร้างพื้นฐานของคุณเองหรือด้วยเฟรมเวิร์กโฮสติ้งที่รองรับ และปรับแต่งหรือ fine-tune โมเดลได้
Open models ช่วยให้นักพัฒนาและองค์กรมีการควบคุมและความยืดหยุ่นมากขึ้น คุณสามารถเลือกสถานที่โฮสต์ ปรับโมเดลสำหรับกรณีใช้งานเฉพาะ และได้รับประโยชน์จากสัญญาอนุญาตที่เปิดให้ใช้งาน แก้ไข และแจกจ่ายต่อได้อย่างกว้างขวาง แม้น้ำหนักที่ฝึกแล้วจะเป็นแบบเปิด แต่โครงสร้างพื้นฐานหรือเครื่องมือบางส่วนที่เกี่ยวข้องอาจยังเป็นกรรมสิทธิ์ของผู้ให้บริการ
ฉันสามารถเข้าถึงโมเดลเหล่านี้ผ่าน OpenAI API หรือ ChatGPT ได้หรือไม่
ไม่ได้ โมเดลเหล่านี้ไม่ได้ให้บริการใน OpenAI API และไม่ปรากฏใน ChatGPT
ฉันสามารถ fine-tune โมเดลได้หรือไม่
ได้ คุณสามารถ fine-tune ด้วยเครื่องมือโอเพนซอร์สและโครงสร้างพื้นฐานที่คุณต้องการ เราไม่ให้บริการ fine-tuning ผ่าน OpenAI APIs สำหรับโมเดลเหล่านี้
โมเดลแบบ open-weight ถูกกว่าการใช้ API หรือไม่
ค่าใช้จ่ายแตกต่างกันไปตามโครงสร้างพื้นฐาน ปริมาณงาน และแนวทางการดำเนินงาน การโฮสต์เองอาจถูกกว่าในบางกรณี ขณะที่แพลตฟอร์ม APIของเราอาจมีประสิทธิภาพกว่าเมื่อคำนึงถึงโฮสติ้ง การบำรุงรักษา และการอัปเกรด
โมเดลเหล่านี้รองรับฟีเจอร์ใดบ้าง
ปัจจุบันโมเดลเหล่านี้เป็นโมเดลการให้เหตุผลแบบข้อความเท่านั้น รันไทม์ทั่วไปรองรับการสตรีม, Function Calling และผลลัพธ์แบบมีโครงสร้าง ตรวจสอบเอกสารของรันไทม์ของคุณเพื่อดูความสามารถที่แน่นอน
สิ่งนี้แตกต่างจาก ModAPI อย่างไร
นี่คือโมเดลการให้เหตุผลที่มีความสามารถสูง ซึ่งให้คุณนำนโยบายของคุณมาใช้เองได้ สามารถทำงานร่วมกับ ModAPI ได้ แต่มีแนวโน้มว่าจะไม่ใช่ตัวแทนสำหรับกรณีใช้งานที่ต้องการเวลาแฝงต่ำ
