OpenAI
หน้านี้แปลด้วยระบบอัตโนมัติ ดูต้นฉบับภาษาอังกฤษ.

โมเดล open-weight ของ OpenAI (gpt-oss)

เรียนรู้เกี่ยวกับโมเดล open‑weight ของ OpenAI (gpt-oss) และช่องทางรับการสนับสนุน

อัปเดตล่าสุด: 3 days ago

หมายเหตุ: บทความนี้ให้ภาพรวมระดับสูง ข้อมูลสำหรับการตั้งค่าทางเทคนิคดูได้ที่ เว็บไซต์ gpt-oss, GitHub, Hugging Face และ OpenAI Cookbooks

ภาพรวม

ขอแนะนำโมเดลการให้เหตุผลแบบ open-weight สองรุ่น: gpt‑oss‑120b และ gpt‑oss‑20b โมเดลเหล่านี้ทำงานบนโครงสร้างพื้นฐานที่คุณควบคุม หรือผ่านผู้ให้บริการโฮสติ้ง

หมายเหตุ: โมเดลเหล่านี้ไม่ได้ให้บริการผ่าน OpenAI API และไม่มีใน ChatGPT

เหตุผลที่ใช้ open-weights

  • ทางเลือกและการควบคุม: รันโมเดลในองค์กรหรือในคลาวด์ส่วนตัวของคุณ รักษาถิ่นที่อยู่ของข้อมูล และปรับประสิทธิภาพให้ตรงกับความต้องการของคุณ

  • การปรับแต่ง: Fine-tune หรือปรับโมเดลด้วยเครื่องมือแบบเปิดที่คุณต้องการ

ความพร้อมใช้งานและการให้สัญญาอนุญาต

  • สัญญาอนุญาต: Apache 2.0 อนุญาตให้ใช้งาน แก้ไข และแจกจ่ายต่อได้อย่างกว้างขวาง รวมถึงการใช้งานเชิงพาณิชย์ (ภายใต้นโยบายการใช้งาน gpt-oss ของเรา)

  • การให้บริการ: ไม่มีให้ใช้งานผ่าน OpenAI API ดังนั้นราคา API และลิมิตการใช้งานจึงไม่เกี่ยวข้อง

  • ความเข้ากันได้: สามารถรันกับสแต็กการอนุมานแบบเปิดที่ใช้กันทั่วไป เช่น vLLM, Ollama, llama.cpp และบนสภาพแวดล้อม GPU บนคลาวด์หรือที่จัดการเอง

เริ่มต้นใช้งาน

ในการรับน้ำหนักโมเดลและทรัพยากรสนับสนุน คุณสามารถ:

  • ไปที่เว็บไซต์ gpt-ossเพื่อดูภาพรวมและลิงก์โดยตรง

  • ดาวน์โหลดน้ำหนักจากคอลเลกชัน Hugging Face — ฮับชุมชนที่คุณค้นหาโมเดลทั้งสอง ดูตัวอย่างการใช้งาน และเลือกเรียกอนุมานโดยตรงผ่านบริการของ Hugging Face ได้

  • เข้าถึงGitHub repoของเราสำหรับโค้ดอนุมานอ้างอิง

  • ใช้คู่มือในOpenAI Cookbookสำหรับการตั้งค่ากับรันไทม์ที่รองรับ เช่น Ollama, vLLM และ Transformers Cookbook ยังมีคำแนะนำทีละขั้นสำหรับการรันในเครื่อง การใช้รันไทม์ทั่วไป และ—เมื่อรองรับ—การ fine-tune โมเดล gpt‑oss

gpt‑oss‑safeguard (ตัวอย่างงานวิจัย)

gpt‑oss‑safeguard คือคู่ของโมเดลการให้เหตุผลด้านความปลอดภัยแบบ open-weightที่สร้างบน gpt‑oss โมเดลเหล่านี้ออกแบบมาสำหรับการจำแนกความปลอดภัยตามนโยบายและงานด้านความน่าเชื่อถือและความปลอดภัยที่เกี่ยวข้อง ซึ่งคุณรันบนโครงสร้างพื้นฐานที่คุณควบคุม เช่นเดียวกับโมเดล gpt‑oss อื่นๆ น้ำหนักเหล่านี้ไม่ได้ให้บริการผ่าน OpenAI API หรือ ChatGPT

  • โมเดลแบบข้อความเท่านั้นพร้อม Schema อ้างอิงสำหรับผลลัพธ์แบบมีโครงสร้าง (เช่น คำตัดสินตามนโยบาย เหตุผลประกอบ)

  • นำ Policy ของคุณมาใช้เอง: โมเดลตีความนโยบายที่คุณเขียน เพื่อให้ปรับใช้ข้ามผลิตภัณฑ์ได้โดยใช้วิศวกรรมน้อยที่สุด

  • การตัดสินใจที่มีเหตุผล: มีร่องรอยการให้เหตุผลเป็นตัวเลือกเพื่อช่วยดีบักและตรวจสอบ (มุ่งสำหรับนักพัฒนาและผู้ปฏิบัติงานด้านความปลอดภัย ไม่ใช่สำหรับแสดงต่อผู้ใช้ปลายทาง)

  • ปรับระดับการให้เหตุผลได้: เลือกต่ำ / กลาง / สูง เพื่อแลกระหว่างเวลาแฝงกับความลึก

  • สัญญาอนุญาต: Apache 2.0 (ดูความพร้อมใช้งานและการให้สัญญาอนุญาตด้านล่าง)

gpt‑oss‑safeguard เหมาะสำหรับการกรองอินพุต/เอาต์พุตของ LLM การติดป้ายกำกับเนื้อหาออนไลน์ และเวิร์กโฟลว์การติดป้ายกำกับหรือรีวิวแบบแบตช์ออฟไลน์ สำหรับแอปพลิเคชันทั่วไป (แชต เอเจนต์ ฯลฯ) เราแนะนำโมเดล gpt‑oss หลัก

คุณสามารถปรับ Schema ให้ตรงกับความต้องการของคุณได้ โปรดดูOpenAI Cookbookสำหรับคู่มือการเขียนคำสั่งและตัวอย่าง

รุ่นย่อยของโมเดลและขนาด

โมเดลการใช้งานที่ตั้งใจไว้หมายเหตุ
gpt‑oss‑safeguard‑120bการให้เหตุผลด้านความปลอดภัยสำหรับการใช้งานจริง ความจุสูงพารามิเตอร์ 117B (ใช้งานอยู่ ≈5.1B) ออกแบบมาให้พอดีกับ

GPU 80 GB เพียงตัวเดียว
(เช่น NVIDIA H100; และยังรันบน GPU หน่วยความจำสูงกว่า เช่น AMD MI300X ได้)
gpt‑oss‑safeguard‑20bเวลาแฝงต่ำกว่า / สภาพแวดล้อมที่มีข้อจำกัดพารามิเตอร์ 21B (ใช้งานอยู่ ≈3.6B)

โมเดลทั้งสอง fine-tune มาจาก gpt‑oss โดยไม่มีการเปลี่ยนแปลงสถาปัตยกรรม โมเดลเหล่านี้ใช้เทมเพลตแชตเดียวกับ gpt‑oss คุณจึงคงการตั้งค่าที่มีอยู่ได้ รูปแบบคำสั่งที่แนะนำคือใส่นโยบายของคุณในข้อความสำหรับนักพัฒนา และใส่เนื้อหาที่ต้องประเมินในข้อความของผู้ใช้

การสนับสนุนและชุมชน

การปรับใช้แบบ open-weight ต้องจัดการและให้บริการด้วยตนเอง ช่องทางรับการสนับสนุนมีดังนี้:

  • คำถาม การสนทนา เคล็ดลับ: ใช้หน้าโมเดลบน Hugging Faceเพื่อมีส่วนร่วมกับชุมชน

  • บั๊กที่ทำซ้ำได้ในโค้ดอนุมานอ้างอิงของ OpenAI: เปิด issue ใน gpt-oss GitHub repo

  • ปัญหาเกี่ยวกับรันไทม์ของบุคคลที่สาม (เช่น vLLM, Ollama, llama.cpp): ใช้ระบบติดตามปัญหา ฟอรัม หรือกระบวนการสนับสนุนของโปรเจกต์นั้นๆ

OpenAI ไม่ให้ความช่วยเหลือ การลงมือใช้งานให้ หรือการสนับสนุนการดีบักสำหรับการตั้งค่า การกำหนดค่า สภาพแวดล้อม หรือแอปพลิเคชันแบบ open-weight ที่โฮสต์เองหรือโฮสต์โดยบุคคลที่สาม

เราจะทำงานร่วมกับชุมชนต่อไปเพื่อปรับปรุงเครื่องมือความปลอดภัยแบบเปิด รวมถึงผ่าน ROOST Model Community (RMC) RMC รวบรวมผู้ปฏิบัติงานและนักวิจัยด้านความปลอดภัยเพื่อแบ่งปันแนวทางปฏิบัติที่ดีที่สุดในการนำโมเดล AI โอเพนซอร์สไปใช้ในเวิร์กโฟลว์ความปลอดภัย รวมถึงผลการประเมินและข้อเสนอแนะต่อโมเดล ไปที่RMC GitHub repoเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับความร่วมมือนี้และวิธีเข้าร่วม

การสนับสนุนและชุมชน

การปรับใช้แบบ open-weight ต้องจัดการและให้บริการด้วยตนเอง ช่องทางรับการสนับสนุนมีดังนี้:

  • คำถาม การสนทนา เคล็ดลับ: ใช้หน้าโมเดลบน Hugging Faceเพื่อมีส่วนร่วมกับชุมชน

  • บั๊กที่ทำซ้ำได้ในโค้ดอนุมานอ้างอิงของ OpenAI: เปิด issue ใน gpt-oss GitHub repo

  • ปัญหาเกี่ยวกับรันไทม์ของบุคคลที่สาม (เช่น vLLM, Ollama, llama.cpp): ใช้ระบบติดตามปัญหา ฟอรัม หรือกระบวนการสนับสนุนของโปรเจกต์นั้นๆ

OpenAI ไม่ให้ความช่วยเหลือ การลงมือใช้งานให้ หรือการสนับสนุนการดีบักสำหรับการตั้งค่า การกำหนดค่า สภาพแวดล้อม หรือแอปพลิเคชันแบบ open-weight ที่โฮสต์เองหรือโฮสต์โดยบุคคลที่สาม

ความเป็นส่วนตัวและความปลอดภัย

ความเป็นส่วนตัวและข้อมูล

โมเดลเหล่านี้ออกแบบมาให้รันบนโครงสร้างพื้นฐานที่คุณควบคุม (ในองค์กร หรือในคลาวด์หรือพาร์ทเนอร์โฮสติ้งของคุณ) OpenAI จะไม่รับหรือประมวลผลข้อมูลที่คุณส่งไปยังโมเดลที่โฮสต์เองเหล่านี้ เว้นแต่คุณจะแชร์กับ OpenAI อย่างชัดเจน หรือใช้พาร์ทเนอร์โฮสติ้งที่มีการจัดการของเรา

ความปลอดภัย

โมเดลเหล่านี้ผ่านการฝึกอบรมและการทดสอบด้านความปลอดภัยอย่างครอบคลุม ดูรายละเอียดเพิ่มเติมได้ในเอกสารกำกับโมเดลและรายงานทางเทคนิคของเรา

การรายงานการละเมิดเนื้อหา

หากคุณเชื่อว่าเนื้อหาที่สร้างด้วยโมเดล gpt‑oss ละเมิดนโยบายของเรา คุณสามารถรายงานผ่านแบบฟอร์มรายงานเนื้อหาของเรา โปรดให้รายละเอียดมากที่สุดเท่าที่เป็นไปได้เพื่อช่วยให้ทีมของเราตรวจสอบการส่งของคุณ

คำถามที่พบบ่อย

โมเดลเหล่านี้ฟรีหรือไม่

น้ำหนักโมเดล gpt-oss ดาวน์โหลดและใช้งานได้ฟรีภายใต้สัญญาอนุญาต Apache 2.0 และนโยบายการใช้งาน gpt-oss อย่างไรก็ตาม คุณต้องรับผิดชอบค่าใช้จ่ายใดๆ ที่เกี่ยวข้องกับการรันโมเดลเหล่านี้ — เช่น ค่า compute ค่าพื้นที่จัดเก็บ หรือค่าบริการโฮสติ้งของบุคคลที่สาม ราคาสำหรับสิ่งเหล่านั้นจะขึ้นอยู่กับโครงสร้างพื้นฐานหรือผู้ให้บริการที่คุณเลือก

โมเดลเหล่านี้เป็น “โอเพนซอร์ส” หรือไม่

เราใช้คำว่า open models หรือ open-weight เพื่อระบุว่าน้ำหนักที่ฝึกแล้วมีให้สาธารณะภายใต้สัญญาอนุญาต Apache 2.0 แบบผ่อนปรน และนโยบายการใช้งาน gpt-oss ซึ่งหมายความว่าคุณสามารถดาวน์โหลดโมเดล รันบนโครงสร้างพื้นฐานของคุณเองหรือด้วยเฟรมเวิร์กโฮสติ้งที่รองรับ และปรับแต่งหรือ fine-tune โมเดลได้

Open models ช่วยให้นักพัฒนาและองค์กรมีการควบคุมและความยืดหยุ่นมากขึ้น คุณสามารถเลือกสถานที่โฮสต์ ปรับโมเดลสำหรับกรณีใช้งานเฉพาะ และได้รับประโยชน์จากสัญญาอนุญาตที่เปิดให้ใช้งาน แก้ไข และแจกจ่ายต่อได้อย่างกว้างขวาง แม้น้ำหนักที่ฝึกแล้วจะเป็นแบบเปิด แต่โครงสร้างพื้นฐานหรือเครื่องมือบางส่วนที่เกี่ยวข้องอาจยังเป็นกรรมสิทธิ์ของผู้ให้บริการ

ฉันสามารถเข้าถึงโมเดลเหล่านี้ผ่าน OpenAI API หรือ ChatGPT ได้หรือไม่

ไม่ได้ โมเดลเหล่านี้ไม่ได้ให้บริการใน OpenAI API และไม่ปรากฏใน ChatGPT

ฉันสามารถ fine-tune โมเดลได้หรือไม่

ได้ คุณสามารถ fine-tune ด้วยเครื่องมือโอเพนซอร์สและโครงสร้างพื้นฐานที่คุณต้องการ เราไม่ให้บริการ fine-tuning ผ่าน OpenAI APIs สำหรับโมเดลเหล่านี้

โมเดลแบบ open-weight ถูกกว่าการใช้ API หรือไม่

ค่าใช้จ่ายแตกต่างกันไปตามโครงสร้างพื้นฐาน ปริมาณงาน และแนวทางการดำเนินงาน การโฮสต์เองอาจถูกกว่าในบางกรณี ขณะที่แพลตฟอร์ม APIของเราอาจมีประสิทธิภาพกว่าเมื่อคำนึงถึงโฮสติ้ง การบำรุงรักษา และการอัปเกรด

โมเดลเหล่านี้รองรับฟีเจอร์ใดบ้าง

ปัจจุบันโมเดลเหล่านี้เป็นโมเดลการให้เหตุผลแบบข้อความเท่านั้น รันไทม์ทั่วไปรองรับการสตรีม, Function Calling และผลลัพธ์แบบมีโครงสร้าง ตรวจสอบเอกสารของรันไทม์ของคุณเพื่อดูความสามารถที่แน่นอน

สิ่งนี้แตกต่างจาก ModAPI อย่างไร

นี่คือโมเดลการให้เหตุผลที่มีความสามารถสูง ซึ่งให้คุณนำนโยบายของคุณมาใช้เองได้ สามารถทำงานร่วมกับ ModAPI ได้ แต่มีแนวโน้มว่าจะไม่ใช่ตัวแทนสำหรับกรณีใช้งานที่ต้องการเวลาแฝงต่ำ

บทความนี้มีประโยชน์หรือไม่