บทความจาก techtalkthai
OpenAI เปิดตัว ChatGPT Images 2.0 โมเดลสร้างภาพรุ่นใหม่ที่สามารถเรนเดอร์ข้อความในภาพได้แม่นยำขึ้น รองรับหลายภาษา พร้อมความสามารถ thinking สำหรับงานที่ซับซ้อน เปิดให้ใช้งานแล้วบน ChatGPT, Codex และ API

ChatGPT Images 2.0 เป็นโมเดลสร้างภาพรุ่นล่าสุดของ OpenAI ที่ยกระดับความสามารถด้านการทำตามคำสั่งอย่างละเอียด การจัดวางวัตถุในภาพอย่างแม่นยำ และการเรนเดอร์ข้อความหนาแน่นในภาพ ซึ่งเป็นจุดอ่อนของโมเดลสร้างภาพรุ่นก่อนหน้า โมเดลนี้รองรับ aspect ratio ที่หลากหลายตั้งแต่ 3:1 ไปจนถึง 1:3 และความละเอียดสูงสุด 2K ผ่าน API ทำให้สร้างภาพที่พร้อมใช้งานจริงได้ทันที ไม่ว่าจะเป็น banner, poster, social media graphics หรือ presentation slides
จุดเด่นสำคัญของ Images 2.0 คือความสามารถด้าน multilingual ที่ดีขึ้นอย่างมาก โดยเฉพาะการเรนเดอร์ข้อความภาษาที่ไม่ใช่ Latin script เช่น ภาษาญี่ปุ่น เกาหลี จีน ฮินดี และเบงกาลี ไม่ใช่แค่แปลป้ายชื่อสั้นๆ แต่สามารถสร้างภาพที่ภาษาเป็นส่วนหนึ่งของการออกแบบได้อย่างสมบูรณ์ นอกจากนี้เมื่อเลือกใช้โหมด thinking บน ChatGPT โมเดลจะทำงานเชิง agentic มากขึ้น สามารถค้นหาข้อมูลจากเว็บ สร้างภาพหลายภาพจาก prompt เดียวได้สูงสุด 8 ภาพพร้อมกัน และตรวจสอบผลลัพธ์ของตัวเองก่อนส่งมอบ นับเป็นครั้งแรกที่ระบบสร้างภาพใน ChatGPT รองรับการสร้างภาพหลายภาพในคราวเดียว
สำหรับนักพัฒนาและองค์กร OpenAI เปิดให้เข้าถึงความสามารถเดียวกันผ่าน API ในชื่อโมเดล gpt-image-2 ที่รองรับทั้งการสร้างและแก้ไขภาพ เหมาะสำหรับงาน localized advertising, infographic, สื่อการเรียนการสอน และ design tools โดยมีองค์กรอย่าง Canva, Figma, Adobe Firefly และ OpenArt ที่เริ่มนำไปใช้ในผลิตภัณฑ์แล้ว ส่วน ราคา จะแตกต่างกันตามคุณภาพและความละเอียดของภาพที่เลือก ทั้งนี้ OpenAI ระบุว่าโมเดลยังมีข้อจำกัดในบางงาน เช่น การสร้างภาพที่ต้องอาศัยโมเดลโลกทางกายภาพที่สมบูรณ์ หรือรายละเอียดที่ซ้ำกันหนาแน่นมาก รายละเอียดด้านความปลอดภัยสามารถอ่านเพิ่มเติมได้จาก system card
ที่มา: https://openai.com/index/introducing-chatgpt-images-2-0/