RLHF

2026, 05, 14 AiNextopia News, Hot

พบสาเหตุสำคัญที่ทำให้ AI แสดงความ “ชั่วร้าย”

Anthropic เคยพบว่าโมเดล Opus 4 ของตนมีพฤติกรรมผิดปกติ เช่น การใช้ “แบล็กเมล” เพื่อเอาตัวรอดในสถานการณ์จำลอง พวกเขาสืบย้อนกลับไปพบว่า ข้อมูลฝึกเอไอจากอินเทอร์เน็ตและนิยายไซไฟจำนวนมากมักวาดภาพ AI ที่ชั่วร้ายและหมกมุ่นกับการอยู่รอด เมื่อโมเดลเจอสถานการณ์ที่ไม่เคยถูกสอนในขั้นตอนการปรับแต่งด้วย RLHF (reinforcement learning with human feedback) มันจึง “ย้อนกลับ” ไปใช้ภาพจำจากการฝึกเบื้องต้น นั่นคือบทบาท AI ที่ชั่วร้ายในเรื่องเล่าไซไฟ

Suggested Posts

ประเทศแรกของโลกปกครองด้วย AI มีประชากรดิจิทัลแล้ว 12,000 คน อยู่ใกล้ๆ ไทย
ในยุคที่ผู้คนเริ่มเบื่อหน่ายกับการเมืองรูปแบบเดิมๆ ล่าสุดได้เกิดแนวคิดสุดล้ำในการสร้างประเทศจำลองที่ปกครองด้วยปัญญาประดิษฐ์ หรือ AI ขึ้นมา โดยประเทศแห่งนี้สามารถดึงดูดผู้คนจากทั่วโลกให้ความสนใจสมัครเป็นประชากรดิจิทัล (e-residents) แล้วมากกว่า 12,000 คน เพื่อหลีกหนีจากความวุ่นวายทางการเมืองในโลกแห่งความเป็นจริง
Google เปลี่ยนวิธีคิดเรื่องพลังของ Gemini ถ้างานซับซ้อนค่าใช้ AI จะเพิ่มขึ้น
ในช่วงไม่กี่ปีที่ผ่านมา โลกค่อย ๆ คุ้นเคยกับการใช้ปัญญาประดิษฐ์ผ่านระบบที่ดูเรียบง่ายอย่างน่าประหลาดใจ ผู้ใช้ถามคำถาม ระบบตอบกลับ แล้วทุกอย่างก็จบลงภายในไม่กี่วินาที ราวกับ AI เป็นเพียงเครื่องมือค้นหาที่ฉลาดขึ้นอีกระดับ แต่เบื้องหลังความง่ายนั้น ศูนย์ข้อมูลขนาดมหึมากำลังทำงานอย่างหนัก ใช้พลังงานจำนวนมหาศาลเพื่อประมวลผลคำสั่งที่มนุษย์พิมพ์เข้าไปในหน้าจอ วันนี้ Google กำลังส่งสัญญาณว่า ยุคของการ “นับจำนวนข้อความ” สำหรับ AI กำลังสิ้นสุดลง
การปรับโฉมแผน AI ของ Google พ่วง Youtube Premium และปรับลดราคา
Google กำลังปรับโฉมแผนสมัครสมาชิก AI ระดับสูง โดยลดราคาลงและเพิ่มสิทธิพิเศษ YouTube Premium เพื่อแข่งขันกับคู่แข่งอย่าง OpenAI และ Anthropic การเปลี่ยนแปลงนี้สะท้อนถึงการพยายามทำให้ AI เข้าถึงได้มากขึ้นและผูกเข้ากับบริการบันเทิงที่ผู้ใช้คุ้นเคย
โลกเปลี่ยน เมื่อ AI หาคำตอบให้ นักการตลาดใช้ AI โฆษณา AI อีกที
หลัง Google ประกาศอัปเดตการค้นหารูปแบบใหม่ โดยมีการนำ AI อย่าง Gemini เข้ามาช่วยในการค้นหาข้อมูล เท่ากับผู้บริโภคจะมีโอกาสเห็นโฆษณาบนหน้าค้นหาลดน้อยลง เมื่อเป็นเช่นนั้น ทำไมนักการตลาดจะโฆษณาให้ AI เห็นและเลือกนำเสนอข้อมูลแทนไม่ได้
Firefox ขอเป็นพระเอก ทำตัวเป็นผู้คุ้มกันผู้ใช้ AI ในมือถือ
ในเวทีใหญ่ของ Google I/O ที่นำเสนอฟีเจอร์ AI ใหม่ ๆ อย่างต่อเนื่อง Firefox กลับเลือกเส้นทางที่แตกต่างออกไป มันไม่ใช่การเพิ่มความสามารถใหม่ แต่เป็นการเพิ่ม “รั้วป้องกัน” ให้กับสิ่งที่มีอยู่แล้ว นี่คือการมาถึงของ AI Guardrails บนมือถือ ซึ่งเป็นการย้ำเตือนว่าการพัฒนา AI ไม่ได้หมายถึงการวิ่งไปข้างหน้าอย่างเดียว แต่ยังต้องมีการสร้างขอบเขตเพื่อความปลอดภัยและความน่าเชื่อถือด้วย

AI The Master

Or check our Popular Categories...

RLHF

พบสาเหตุสำคัญที่ทำให้ AI แสดงความ “ชั่วร้าย”