ไมโครซอฟท์เปิดตัว MAI-Image-2 โมเดล AI เน้นความสมจริงและแก้ปัญหาการแสดงผลข้อความ

Microsoft ได้ประกาศเปิดตัว MAI-Image-2 ซึ่งเป็นโมเดลแปลงข้อความเป็นภาพ (text-to-image) รุ่นล่าสุดที่พัฒนาขึ้นเองภายในบริษัท โดยมีเป้าหมายเพื่อสร้างภาพที่สมจริงและสามารถนำไปใช้งานจริงในงานสร้างสรรค์ได้ดียิ่งขึ้น ซึ่งถืออีกก้าวของบริษัทในการพัฒนาเทคโนโลยีสร้างภาพของตนเองต่อจาก MAI-Image-1

ชูจุดเด่นด้านความสมจริงและลดเวลาการทำงาน

ไมโครซอฟท์วางตำแหน่ง MAI-Image-2 ให้เป็นเครื่องมือสำหรับ Workflow งานสร้างสรรค์ในโลกแห่งความเป็นจริง มากกว่าจะเป็นเพียงการทดลองทางภาพถ่าย เน้นไปที่ ความสมจริง (Photorealism) เช่น การให้แสงที่เป็นธรรมชาติ สีผิวที่แม่นยำ และสภาพแวดล้อมที่ดูเหมือนมีคนอาศัยอยู่จริง ซึ่งจะช่วยให้ครีเอเตอร์ ลดเวลาในการแก้ไขงานหลังการผลิต (post-production) และมีเวลาในการสร้างสรรค์ผลงานมากขึ้น โดยการพัฒนานี้ได้รับคำแนะนำโดยตรงจากช่างภาพ นักออกแบบ และนักเล่าเรื่องด้วยภาพ เพื่อแก้ปัญหาข้อจำกัดของเครื่องมือ AI ในปัจจุบัน

  • ไฮไลต์ในการอัปเกรตคือความสามารถในการ สร้างภาพที่มีข้อความ (Text Rendering) ที่มักเป็นจุดอ่อนของโมเดล AI ส่วนใหญ่
  • ไมโครซอฟท์ระบุว่าโมเดลนี้สามารถสร้างภาพที่มีองค์ประกอบของข้อความ เช่น โปสเตอร์ อินโฟกราฟิก สไลด์ และไดอะแกรม ได้อย่างแม่นยำและตรงตามคำสั่ง (prompt) มากขึ้น

MAI-Image-2 ได้ไต่อันดับขึ้นมาอยู่ใน 3 อันดับแรกของโลก (Top 3) ในกลุ่มแล็บพัฒนา AI สร้างภาพจากข้อความบน Arena.ai แม้ว่าในปัจจุบันจะยังคงตามหลังคู่แข่งอย่างโมเดล Gemini ของ Google และระบบ GPT-Image ของ OpenAI แต่ก็นับเป็นการพัฒนาที่ก้าวกระโดดจากรุ่นแรกอย่างเห็นได้ชัด

ปัจจุบันผู้ใช้งานสามารถทดสอบ MAI-Image-2 ได้แล้วที่ MAI Playground และกำลังเริ่มทยอยเปิดให้ใช้งานบน Copilot และ Bing Image Creator สำหรับลูกค้าองค์กรบางกลุ่มสามารถเข้าถึงได้ผ่าน API และจะเปิดให้นักพัฒนาทั่วไปใช้งานผ่าน Foundry ในเร็วๆ นี้

การเปิดตัวครั้งนี้ยังตอกย้ำถึงกลยุทธ์ของไมโครซอฟท์ที่หันมามุ่งเน้นการ พัฒนาโมเดล AI ของตนเองภายในบริษัท แทนที่จะพึ่งพาเพียงความร่วมมือกับ OpenAI เพียงอย่างเดียว

ที่มา : https://www.eweek.com/news/microsoft-mai-image-2-ai-image-model-launch/

Admin