การทดสอบครั้งนี้สะท้อนให้เห็นว่า ChatGPT Images 2.0 คือผู้ชนะที่แท้จริงในสนามสร้างภาพด้วย AI ไม่เพียงแต่ทำคะแนนสูงกว่า แต่ยังแสดงถึงความเข้าใจในบริบท ความสามารถในการจัดการข้อความ และการเคารพข้อจำกัดด้านลิขสิทธิ์
ในขณะที่ Nano Banana แม้จะยังคงมีจุดเด่นด้านความสวยงาม แต่กลับสะดุดในเรื่องความแม่นยำและความปลอดภัยของข้อมูล
เมื่อโลกของปัญญาประดิษฐ์ก้าวเข้าสู่ยุคใหม่ การสร้างภาพด้วย AI ไม่ได้เป็นเพียงการทดลองเชิงศิลป์อีกต่อไป แต่กลายเป็นเครื่องมือที่สามารถสะท้อนความสามารถของโมเดลได้อย่างแท้จริง บทความนี้เล่าถึงการทดสอบเชิงลึกระหว่าง ChatGPT Images 2.0 ของ OpenAI และ Gemini Nano Banana ของ Google ซึ่งถูกนำมาทดสอบในสถานการณ์จริง 9 รูปแบบ เพื่อดูว่าใครคือผู้ชนะในสนามสร้างภาพที่ซับซ้อนและท้าทายที่สุด
การทดสอบเริ่มต้นจากโจทย์ที่ดูเรียบง่าย เช่น การใส่ชุดเครื่องแบบทหารเรือให้กับบุคคลในภาพ ไปจนถึงการสร้างโปสเตอร์ภาพยนตร์ที่ไม่เคยมีอยู่จริงอย่าง Back to the Future ภาค 4 แต่ละโจทย์ถูกออกแบบมาเพื่อวัดความสามารถของ AI ในการรักษารายละเอียด ความสมจริง และการตีความตามบริบทที่ซับซ้อน
... คลิกเพื่ออ่านต่อ
ผลลัพธ์ที่ได้ชี้ชัดว่า ChatGPT Images 2.0 ก้าวกระโดดจากเวอร์ชันก่อนหน้าอย่างมหาศาล หากย้อนกลับไปในปี 2025 Nano Banana เคยทำคะแนนสูงถึง 93% ขณะที่ ChatGPT รุ่นก่อนหน้าทำได้เพียง 74% เนื่องจากข้อจำกัดในการสร้างภาพที่เกี่ยวข้องกับวัฒนธรรมสมัยนิยม แต่ในการทดสอบล่าสุด ChatGPT Images 2.0 ทำคะแนนรวมได้ถึง 97% ขณะที่ Nano Banana ลดลงเหลือ 85%
สิ่งที่น่าสนใจคือความแตกต่างในรายละเอียดของแต่ละโจทย์ ตัวอย่างเช่น ในการฟื้นฟูภาพถ่ายขาวดำ ChatGPT สามารถรักษารายละเอียดและเพิ่มความคมชัดได้อย่างเป็นธรรมชาติ ขณะที่ Nano Banana แม้จะทำได้ดี แต่กลับมีปัญหาในการตีความสีและข้อความที่ปรากฏบนภาพ
อีกกรณีหนึ่งคือการสร้างภาพบุคคลในสไตล์ Tim Burton ซึ่งทั้งสองโมเดลทำได้ดี แต่ Nano Banana กลับใส่รายละเอียดส่วนตัวของผู้ทดสอบลงไปในภาพโดยไม่ได้รับการร้องขอ นำไปสู่คำถามใหญ่เกี่ยวกับ ความเป็นส่วนตัวและการใช้ข้อมูลของผู้ใช้
การทดสอบยังเผยให้เห็นความสามารถใหม่ของ ChatGPT ในการจัดการกับข้อความบนภาพ ซึ่งเคยเป็นจุดอ่อนสำคัญในอดีต แต่ครั้งนี้สามารถสร้างข้อความที่อ่านได้ชัดเจนและสอดคล้องกับบริบท เช่น โปสเตอร์ภาพยนตร์ที่มีการออกแบบตัวอักษรอย่างสมจริง ขณะที่ Nano Banana มีปัญหาซ้ำซากกับการสร้างข้อความที่ซ้อนหรือผิดเพี้ยน
แม้ว่า Nano Banana จะยังคงมีจุดแข็งในด้านความสว่างและความสวยงามของภาพ แต่ความผิดพลาดในการตีความรายละเอียดและการดึงข้อมูลส่วนตัวโดยไม่ตั้งใจ ทำให้คะแนนรวมลดลงอย่างเห็นได้ชัด
ในทางกลับกัน ChatGPT Images 2.0 ไม่เพียงแต่พัฒนาความสามารถด้านเทคนิค แต่ยังแสดงให้เห็นถึงการจัดการข้อจำกัดทางกฎหมายและลิขสิทธิ์ด้วยการสร้างภาพที่เป็น “สไตล์ใหม่” แทนการลอกเลียนแบบโดยตรง
Key Takeaways
ChatGPT Images 2.0 ทำคะแนนรวมได้ 97% แสดงถึงการพัฒนาที่ก้าวกระโดดจากรุ่นก่อนหน้า
Gemini Nano Banana ลดลงเหลือ 85% สะท้อนถึงปัญหาในการตีความรายละเอียดและการจัดการข้อความ
ความเป็นส่วนตัวคือประเด็นสำคัญ เมื่อ Nano Banana ดึงข้อมูลส่วนตัวมาใช้โดยไม่ได้รับอนุญาต
ChatGPT Images 2.0 แก้จุดอ่อนเรื่องข้อความบนภาพได้สำเร็จ และสามารถสร้างงานที่สมจริงและใช้งานได้จริง
การทดสอบในโลกจริงสำคัญกว่าคะแนน Benchmark เพราะเผยให้เห็นพฤติกรรมที่ไม่คาดคิดของโมเดล AI
…..
เรียบเรียงโดย AiNextopia
อ้างอิง : I tested ChatGPT Images 2.0 vs. Gemini Nano Banana to see which is better – this model wins | ZDNET
Post navigation
Suggested Posts
ในช่วงไม่กี่ปีที่ผ่านมา ปัญญาประดิษฐ์ (AI) ได้กลายเป็นคำที่ถูกพูดถึงอย่างกว้างขวางในทุกวงการ ตั้งแต่บอร์ดประชุมของบริษัทยักษ์ใหญ่ ไปจนถึงโต๊ะทำงานของพนักงานทั่วไป ผู้บริหารจำนวนมากเชื่อมั่นว่า AI คือเครื่องมือมหัศจรรย์ที่จะพลิกโฉมการทำงาน เพิ่มประสิทธิภาพ และลดต้นทุน แต่เมื่อมองจากมุมของพนักงานที่ต้องใช้เครื่องมือเหล่านี้จริง ๆ ภาพที่ปรากฏกลับแตกต่างออกไปอย่างสิ้นเชิง ความตื่นเต้นของผู้บริหารอาจเป็นเพียงภาพลวงตา ขณะที่พนักงานจำนวนมากกลับรู้สึกว่า AI ไม่ได้ช่วยให้ชีวิตง่ายขึ้นเลย
การมาถึงของ ClawBot ไม่ได้เกิดขึ้นอย่างไร้บริบท โลกเทคโนโลยีกำลังแข่งขันกันอย่างดุเดือดเพื่อสร้าง “AI agents” ที่ไม่เพียงตอบคำถาม แต่ยังสามารถ ลงมือทำงานแทนมนุษย์ ได้จริง ตั้งแต่จัดการอีเมล ไปจนถึงจัดระเบียบไฟล์ หรือแม้แต่ควบคุมเวิร์กโฟลว์ในองค์กร
ในช่วงสองทศวรรษที่ผ่านมา โลกดิจิทัลได้เปลี่ยนวิธีที่มนุษย์เชื่อมโยงกันอย่างสิ้นเชิง โซเชียลมีเดียและแพลตฟอร์มออนไลน์ต่าง ๆ ถูกออกแบบมาเพื่อดึงดูดความสนใจและสร้างการมีส่วนร่วมสูงสุด แต่ผลลัพธ์กลับกลายเป็นการเสพติด การแข่งขัน และการลดทอนคุณภาพของความสัมพันธ์จริงในชีวิตประจำวัน
การเปิดตัวของ Manus โดยสตาร์ทอัพจากอู่ฮั่นชื่อ Butterfly Effect ได้สร้างแรงสั่นสะเทือนครั้งใหญ่ในวงการ AI ทั่วโลก ภายในเวลาเพียงไม่กี่วันหลังเปิดตัว มันถูกพูดถึงอย่างกว้างขวางทั้งในจีนและต่างประเทศ เสียงชื่นชมจากบุคคลสำคัญในวงการเทคโนโลยี เช่น Jack Dorsey และ Victor Mustar ยิ่งทำให้ Manus กลายเป็นกระแสที่ทุกคนจับตามอง หลายคนถึงกับเรียกมันว่า “DeepSeek ลำดับสอง” เพราะความสามารถที่เหนือความคาดหมายและต้นกำเนิดจากจีน
หากเปรียบวงการโฆษณาและการตลาดเป็นสนามแข่งรถ ความเร็วและความคล่องตัวคือสิ่งที่ตัดสินชัยชนะ และสิ่งที่น่าสนใจคือ เอเจนซี่อิสระขนาดเล็ก กำลังวิ่งนำหน้าบริษัทเครือข่ายขนาดใหญ่ ด้วยพลังของ AI ที่พวกเขากล้าใช้และกล้าทดลองก่อนใคร
ในเช้าวันหนึ่งของอนาคตอันใกล้ คุณอาจไม่ได้เป็นคนเลือกโรงแรมสำหรับทริปสุดสัปดาห์ของตัวเองอีกต่อไป ผู้ช่วย AI ส่วนบุคคลของคุณจะเป็นผู้จัดการทุกอย่าง ตั้งแต่ค้นหาที่พักที่ตรงใจที่สุด ไปจนถึงจองห้องและชำระเงินเสร็จสรรพภายในไม่กี่วินาที สิ่งที่น่าสนใจกว่านั้นคือ โรงแรมเองก็อาจใช้ AI ของพวกเขาในการ “โน้มน้าว” ผู้ช่วยของคุณให้เลือกข้อเสนอของตน
ในโลกที่การเล่าเรื่องด้วยภาพเคลื่อนไหวกลายเป็นภาษาสากลของยุคดิจิทัล Google กำลังพลิกโฉมการสร้างวิดีโอด้วยเครื่องมือใหม่ที่ชื่อ Google Vids ซึ่งตัวอัปเดตล่าสุดได้ผสานพลังของโมเดล AI อย่าง Veo 3.1 และ Lyria 3 เพื่อให้ทุกคนสามารถสร้างวิดีโอคุณภาพสูงได้ฟรี พร้อมดนตรีประกอบที่แต่งขึ้นเฉพาะกิจ และตัวละครเสมือนที่กำกับได้ราวกับนักแสดงจริง ๆ
โลกของปัญญาประดิษฐ์ (AI) ไม่เคยหยุดนิ่ง และทุกปีเรามักเห็นการเปลี่ยนแปลงที่พลิกโฉมทั้งอุตสาหกรรม เทคโนโลยี และชีวิตประจำวัน ปี 2025 ที่ผ่านมาได้พิสูจน์แล้วว่า AI ไม่ใช่เพียงเครื่องมือ แต่กำลังกลายเป็นโครงสร้างพื้นฐานใหม่ของเศรษฐกิจและสังคม ปี 2026 จึงถูกจับตามองอย่างยิ่งว่า AI จะเดินไปในทิศทางใด และจะสร้างผลกระทบอย่างไรต่อโลกที่เรากำลังอยู่
ท่ามกลางแสงสลัวของหน้าจอคอมพิวเตอร์ในห้องพักที่มอนทรีออล ศาสตราจารย์ฌอง-อูเกส รัว (Jean-Hugues Roy) นักวิชาการด้านวารสารศาสตร์ กำลังทำบททดสอบที่ฟังดูเหมือนนิยายไซไฟสยองขวัญ เขาตัดสินใจตัดขาดจากแหล่งข่าวที่เขียนโดยมนุษย์เป็นเวลาหนึ่งเดือนเต็ม แล้วหันไปพึ่งพา "สมองกล" หรือ AI Chatbots เพียงอย่างเดียวเพื่อติดตามความเป็นไปของโลก
ในเช้าวันหนึ่งของเดือนธันวาคม 2025 คลิปวิดีโอความยาวไม่ถึงหนึ่งนาทีได้เปลี่ยนบทสนทนาในวงการหุ่นยนต์ทั่วโลก หุ่นยนต์รูปร่างมนุษย์สีเงินเงา สูงพอ ๆ กับคนจริง กำลังกระโดดหมุนตัว เตะสูงแบบกังฟู และลงพื้นอย่างมั่นคงราวกับนักกีฬามืออาชีพ คลิปนั้นถูกแชร์ไปทั่วโลกภายในไม่กี่ชั่วโมง และชื่อของมันก็กลายเป็นไวรัลทันที มันคือ T800