| หมายเหตุ : การเก็บรักษาข้อมูลสำหรับบริการบางอย่างอาจได้รับผลกระทบจากพัฒนาการทางกฎหมายล่าสุด โปรดดูรายละเอียดเพิ่มเติมใน บล็อกโพสต์ ของเรา |
|---|
โมเดลพื้นฐานของ OpenAI รวมถึงโมเดลที่ขับเคลื่อน ChatGPT ได้รับการพัฒนาโดยใช้แหล่งข้อมูลหลักสามแหล่ง ได้แก่ (1) ข้อมูลที่เผยแพร่ต่อสาธารณะบนอินเทอร์เน็ต (2) ข้อมูลที่เราเป็นพันธมิตรกับบุคคลที่สามเพื่อเข้าถึง และ (3) ข้อมูลที่ผู้ใช้ ผู้ฝึกสอนที่เป็นมนุษย์ และนักวิจัยของเราให้ไว้หรือสร้างขึ้น
บทความนี้ให้ภาพรวมของข้อมูลที่เผยแพร่ต่อสาธารณะที่เราใช้เพื่อช่วยพัฒนาโมเดลเหล่านี้ รวมถึงวิธีที่เราเก็บรวบรวมและใช้ข้อมูลดังกล่าวให้สอดคล้องกับกฎหมายความเป็นส่วนตัว หากต้องการทำความเข้าใจว่าเราเก็บรวบรวมและใช้ข้อมูลจากผู้ใช้บริการของเราอย่างไร รวมถึงวิธีเลือกไม่ให้ใช้บทสนทนาใน ChatGPT เพื่อช่วยสอนโมเดลของเรา โปรดดูนโยบายความเป็นส่วนตัวของเราและบทความศูนย์ช่วยเหลือนี้
ChatGPT คืออะไรและทำงานอย่างไร
ChatGPT เป็นบริการที่ใช้ปัญญาประดิษฐ์ ซึ่งคุณสามารถเข้าถึงได้ผ่านอินเทอร์เน็ต คุณสามารถใช้ ChatGPT ทำงานได้หลากหลาย รวมถึงการจัดระเบียบและสรุปข้อมูล ช่วยแปล วิเคราะห์หรือสร้างรูปภาพ จุดประกายความคิดสร้างสรรค์และไอเดีย ตลอดจนกิจกรรมประจำวันอื่นๆ ChatGPT ได้รับการออกแบบมาให้เข้าใจและตอบคำถามกับคำสั่งของผู้ใช้ โดยเรียนรู้รูปแบบจากข้อมูลจำนวนมาก รวมถึงข้อความ รูปภาพ เสียง และวิดีโอ ระหว่างการเทรน โมเดลจะวิเคราะห์ความสัมพันธ์ภายในข้อมูลนี้ เช่น วิธีที่คำต่างๆ มักปรากฏร่วมกันในบริบท แล้วใช้ความเข้าใจนั้นคาดการณ์คำถัดไปที่น่าจะเป็นไปได้มากที่สุดเมื่อสร้างคำตอบ ทีละคำ ในทำนองเดียวกัน โมเดลที่สร้างเนื้อหารูปแบบอื่น เช่น รูปภาพ จะเรียนรู้รูปแบบว่าพิกเซลสัมพันธ์กันอย่างไร และสัมพันธ์กับคำบรรยายที่เกี่ยวข้องในข้อมูลการเทรนอย่างไร
ตัวอย่างเช่น ระหว่างกระบวนการเรียนรู้ของโมเดล (เรียกว่า “การเทรน”) โมเดลอาจได้รับมอบหมายให้เติมประโยคให้สมบูรณ์ เช่น “แทนที่จะเลี้ยวซ้าย เธอกลับเลี้ยว ___” ในช่วงแรกของการเทรน คำตอบของโมเดลส่วนใหญ่จะเป็นแบบสุ่ม อย่างไรก็ตาม เมื่อโมเดลประมวลผลและเรียนรู้จากข้อความปริมาณมาก โมเดลจะเก่งขึ้นในการจดจำรูปแบบและคาดการณ์คำถัดไปที่น่าจะเป็นไปได้มากที่สุด กระบวนการนี้จะทำซ้ำกับประโยคนับล้านเพื่อปรับแต่งความเข้าใจและปรับปรุงความแม่นยำของโมเดล
เนื่องจากมีหลายวิธีที่เป็นไปได้ในการเติมประโยคให้สมบูรณ์ เช่น “แทนที่จะเลี้ยวซ้าย เธอกลับเลี้ยวขวา” “กลับหลัง” หรือ “ถอยหลัง” จึงมีองค์ประกอบของความสุ่มอยู่โดยธรรมชาติในวิธีที่โมเดลตอบสนอง ด้วยเหตุนี้ คำถามเดียวกันอาจให้คำตอบที่ต่างกันในการถามแต่ละครั้ง
โมเดลแมชชีนเลิร์นนิงประกอบด้วยชุดตัวเลขขนาดใหญ่ที่เรียกว่า “ค่าน้ำหนัก” หรือ “พารามิเตอร์” พร้อมกับโค้ดที่ตีความและใช้ตัวเลขเหล่านั้น โมเดลเหล่านี้ไม่ได้จัดเก็บหรือเก็บสำเนาของข้อมูลที่ใช้เทรนไว้ แต่เมื่อโมเดลเรียนรู้ ค่าพารามิเตอร์ของโมเดลจะถูกปรับเล็กน้อยเพื่อสะท้อนรูปแบบที่โมเดลระบุได้ ในตัวอย่างก่อนหน้านี้ โมเดลพัฒนาจากการคาดการณ์คำแบบสุ่มไปสู่การคาดการณ์ที่แม่นยำขึ้น ไม่ใช่โดยการจัดเก็บประโยคการเทรน แต่โดยการอัปเดตพารามิเตอร์ภายในของโมเดล โมเดลไม่ได้เก็บสำเนาของประโยค รูปภาพ หรือเสียงที่ประมวลผลระหว่างการเทรนไว้ ChatGPT ไม่ได้ “คัดลอกและวาง” จากข้อมูลการเทรน คล้ายกับครูที่หลังจากศึกษาอย่างกว้างขวางแล้ว สามารถอธิบายแนวคิดได้โดยเข้าใจความสัมพันธ์ระหว่างไอเดียต่างๆ โดยไม่ต้องจดจำหรือทำซ้ำเนื้อหาต้นฉบับแบบคำต่อคำ เมื่อสร้างคำตอบต่อคำขอของผู้ใช้ โมเดลจะใช้ค่าน้ำหนักที่เรียนรู้เหล่านี้เพื่อคาดการณ์และสร้างเนื้อหาใหม่
ข้อมูลสาธารณะประเภทใดที่ใช้สอน ChatGPT
สำหรับเนื้อหาบนอินเทอร์เน็ตที่เผยแพร่ต่อสาธารณะ เราใช้เฉพาะข้อมูลที่เข้าถึงได้อย่างเสรีและเปิดเผยบนอินเทอร์เน็ต เราไม่ได้จงใจรวบรวมข้อมูลจากแหล่งที่ทราบว่าอยู่หลังเพย์วอลล์หรือจากดาร์กเว็บ นอกจากนี้ เรายังใช้ตัวกรองเพื่อนำเนื้อหาที่เราไม่ต้องการให้โมเดลของเราเรียนรู้ออก เช่น วาจาสร้างความเกลียดชัง เนื้อหาสำหรับผู้ใหญ่ เว็บไซต์ที่รวบรวมข้อมูลส่วนบุคคล และสแปม จากนั้นข้อมูลที่เหลือจะถูกใช้เพื่อเทรนโมเดลของเรา
มีการใช้ข้อมูลส่วนบุคคลเพื่อสอน ChatGPT หรือไม่
เนื้อหาออนไลน์ส่วนสำคัญเกี่ยวข้องกับข้อมูลเกี่ยวกับผู้คน ดังนั้นข้อมูลการเทรนของเราอาจมีข้อมูลส่วนบุคคลรวมอยู่โดยบังเอิญ อย่างไรก็ตาม เราไม่ได้จงใจเก็บรวบรวมข้อมูลส่วนบุคคลเพื่อวัตถุประสงค์ในการเทรนโมเดลของเรา
เราใช้ข้อมูลการเทรนเพื่อพัฒนาความสามารถของโมเดล เช่น การคาดการณ์ การให้เหตุผล และการแก้ปัญหา ไม่ใช่เพื่อสร้างโปรไฟล์ผู้ใช้ ติดต่อบุคคล หรือเป็นส่วนหนึ่งของความพยายามด้านโฆษณาหรือการตลาดของเรา
ในบางกรณี โมเดลอาจเรียนรู้จากข้อมูลส่วนบุคคลเพื่อทำความเข้าใจว่าองค์ประกอบอย่างชื่อและที่อยู่ทำงานอย่างไรในภาษา หรือเพื่อจดจำบุคคลสาธารณะและองค์กรหรือสิ่งที่เป็นที่รู้จักอย่างแพร่หลาย สิ่งนี้ช่วยให้โมเดลสร้างคำตอบที่แม่นยำขึ้นและเหมาะสมกับบริบทมากขึ้น
เราดำเนินการอย่างจริงจังเพื่อจำกัดการประมวลผลข้อมูลส่วนบุคคลระหว่างการเทรน ตัวอย่างเช่น เราไม่รวมแหล่งที่รวบรวมข้อมูลส่วนบุคคลจำนวนมาก และเราเทรนโมเดลของเราให้หลีกเลี่ยงการตอบคำขอข้อมูลส่วนตัวหรือข้อมูลที่ละเอียดอ่อนเกี่ยวกับบุคคล
การพัฒนา ChatGPT สอดคล้องกับกฎหมายความเป็นส่วนตัวอย่างไร
เราใช้ข้อมูลการเทรนอย่างถูกต้องตามกฎหมาย โมเดลพื้นฐานของเราขับเคลื่อนแอปพลิเคชันที่เป็นประโยชน์หลากหลาย ตั้งแต่การสร้างเนื้อหาและการสนับสนุนลูกค้า ไปจนถึงการพัฒนาซอฟต์แวร์ การศึกษาที่ปรับให้เหมาะกับแต่ละบุคคล และการวิจัยทางวิทยาศาสตร์ ความสามารถเหล่านี้ต้องอาศัยข้อมูลสำหรับการเทรนโมเดลขนาดใหญ่ ข้อมูลที่ใช้ในการเทรนโมเดลของเราเป็นข้อมูลที่เผยแพร่ต่อสาธารณะ และไม่ได้มีเจตนาก่อให้เกิดอันตรายต่อบุคคล เราอาศัยผลประโยชน์โดยชอบด้วยกฎหมายภายใต้กฎหมายความเป็นส่วนตัว เช่น GDPR เป็นฐานในการเก็บรวบรวมและใช้ข้อมูลส่วนบุคคลที่รวมอยู่ในข้อมูลการเทรน ตามที่อธิบายรายละเอียดเพิ่มเติมในนโยบายความเป็นส่วนตัวของเรา เราได้จัดทำการประเมินผลกระทบด้านการคุ้มครองข้อมูลเรียบร้อยแล้ว เพื่อช่วยให้มั่นใจว่าเรากำลังเก็บรวบรวมและใช้ข้อมูลนี้อย่างถูกต้องตามกฎหมายและมีความรับผิดชอบ
เราตอบสนองต่อคำขอคัดค้านและสิทธิที่คล้ายกัน. จากการเรียนรู้ภาษา บางครั้งคำตอบของ ChatGPT อาจมีข้อมูลส่วนบุคคลเกี่ยวกับบุคคลที่ข้อมูลส่วนบุคคลของเขาปรากฏหลายครั้งบนอินเทอร์เน็ตสาธารณะ (เช่น บุคคลสาธารณะ) บุคคลในบางเขตอำนาจศาลสามารถคัดค้านการประมวลผลข้อมูลส่วนบุคคลของตนโดยโมเดลของเรา หรือยื่นคำขอใช้สิทธิของเจ้าของข้อมูลอื่นๆ ผ่านพอร์ทัลความเป็นส่วนตัวของเรา คุณยังสามารถใช้สิทธิเหล่านี้ได้โดยติดต่อ dsar@openai.com
โปรดทราบว่า ตามกฎหมายความเป็นส่วนตัว สิทธิบางอย่างอาจไม่ใช่สิทธิที่เด็ดขาด เราอาจปฏิเสธคำขอหากเรามีเหตุผลที่ชอบด้วยกฎหมายในการทำเช่นนั้น อย่างไรก็ตาม เรามุ่งมั่นที่จะให้ความสำคัญกับการคุ้มครองข้อมูลส่วนบุคคล และปฏิบัติตามกฎหมายความเป็นส่วนตัวที่เกี่ยวข้องทั้งหมด หากคุณรู้สึกว่าเราไม่ได้จัดการปัญหาอย่างเพียงพอ คุณมีสิทธิยื่นเรื่องร้องเรียนต่อหน่วยงานกำกับดูแลในพื้นที่ของคุณ
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับแนวปฏิบัติของ OpenAI เกี่ยวกับข้อมูลส่วนบุคคลที่เราเก็บรวบรวมจากคุณหรือเกี่ยวกับคุณเมื่อคุณใช้เว็บไซต์ แอปพลิเคชัน และบริการของเรา โปรดดูนโยบายความเป็นส่วนตัวของเรา
