การผสาน ChatGPT และ Sora คือการก้าวกระโดดครั้งสำคัญของ OpenAI ที่ทำให้การสนทนากับ AI กลายเป็นประสบการณ์ที่มีทั้งข้อความ ภาพ และวิดีโอ
มันคือการขยายขอบเขตของการเล่าเรื่องและการสื่อสารในยุคดิจิทัล แม้จะมีความท้าทายด้านจริยธรรมและการควบคุม แต่ก็เป็นการเปิดประตูสู่โลกใหม่ที่ทุกคนสามารถสร้างสรรค์และแบ่งปันเรื่องราวของตนเองได้อย่างไร้ขีดจำกัด
OpenAI กำลังสร้างการเปลี่ยนแปลงครั้งใหญ่ในโลกของปัญญาประดิษฐ์ เมื่อ ChatGPT และ Sora ถูกผสานเข้าด้วยกัน กลายเป็นแพลตฟอร์มที่ไม่เพียงแต่ตอบคำถามด้วยข้อความ แต่ยังสร้างภาพและวิดีโอจากจินตนาการของผู้ใช้ได้ทันที นี่คือการขยายขอบเขตของการสื่อสารระหว่างมนุษย์กับเครื่องจักรไปอีกขั้นหนึ่ง
เรื่องราวของการผสาน ChatGPT เข้ากับ Sora เริ่มต้นจากความพยายามของ OpenAI ที่ต้องการทำให้การสนทนากับ AI มีมิติที่มากกว่าเพียงข้อความบนหน้าจอ หากย้อนกลับไปในยุคแรก ChatGPT เป็นเพียงเครื่องมือสนทนาอัจฉริยะที่สามารถตอบคำถามและช่วยงานเขียนได้ แต่เมื่อเทคโนโลยีการสร้างภาพและวิดีโอด้วยโมเดลอย่าง DALL-E และ Sora เข้ามาเสริม โลกของการสื่อสารก็เปลี่ยนไปอย่างสิ้นเชิง
... คลิกเพื่ออ่านต่อ
ในเวอร์ชันล่าสุด OpenAI ได้เปิดตัวฟีเจอร์ “Images in ChatGPT” ที่ให้ผู้ใช้สามารถสร้างภาพได้โดยตรงจากการสนทนา ไม่ว่าจะเป็นการออกแบบโปสเตอร์ การสร้างภาพประกอบบทความ หรือแม้แต่การทดลองจินตนาการส่วนตัว ทั้งหมดนี้เกิดขึ้นภายในหน้าต่างแชทเดียวกัน ความสามารถนี้ใช้พลังของ GPT-4o ซึ่งถูกปรับปรุงให้เก่งขึ้นในการเรนเดอร์ข้อความและรายละเอียดภาพ ทำให้ภาพที่ได้มีความคมชัดและสมจริงมากขึ้น
ขณะเดียวกัน Sora ซึ่งเป็นแพลตฟอร์มสร้างวิดีโอจากข้อความ ก็ถูกนำมาผสานเข้ากับ ChatGPT อย่างแนบแน่น ผู้ใช้สามารถพิมพ์คำสั่งง่าย ๆ เช่น “สร้างวิดีโอความยาว 10 วินาทีของพระอาทิตย์ขึ้นเหนือภูเขา” แล้วระบบก็จะสร้างวิดีโอสั้นที่ตรงกับคำสั่งทันที สิ่งนี้ทำให้การเล่าเรื่องด้วยภาพเคลื่อนไหวกลายเป็นเรื่องที่ทุกคนเข้าถึงได้ ไม่จำเป็นต้องมีทักษะด้านการตัดต่อหรือการผลิตวิดีโออีกต่อไป
การผสานนี้ยังมีมิติทางธุรกิจที่น่าสนใจ เมื่อปลายปี 2025 OpenAI ได้ทำข้อตกลงครั้งใหญ่กับ Disney เพื่อให้ Sora สามารถสร้างวิดีโอที่มีตัวละครจาก Disney, Marvel, Pixar และ Star Wars ได้อย่างถูกลิขสิทธิ์ นี่คือการเปิดประตูสู่ยุคใหม่ของคอนเทนต์ที่ผู้ใช้ทั่วไปสามารถสร้าง “คลิปสั้น” ที่มีตัวละครระดับโลกเข้ามาโลดแล่นในจินตนาการของตนเอง
หากมองในเชิงวัฒนธรรม การผสาน ChatGPT และ Sora ไม่ได้เป็นเพียงการเพิ่มฟีเจอร์ใหม่ แต่เป็นการเปลี่ยนวิธีที่มนุษย์เล่าเรื่องและสื่อสารกัน
โลกออนไลน์ที่เคยเต็มไปด้วยข้อความและภาพนิ่ง กำลังถูกแทนที่ด้วยวิดีโอที่สร้างขึ้นจาก AI ซึ่งสามารถสะท้อนความคิด ความรู้สึก และอารมณ์ของผู้ใช้ได้ทันที การสร้าง “มีม” หรือคลิปไวรัลที่เคยต้องใช้เวลาและทักษะเฉพาะ กำลังกลายเป็นสิ่งที่ทุกคนทำได้เพียงปลายนิ้ว
แน่นอนว่าการเปลี่ยนแปลงนี้มาพร้อมกับคำถามด้านจริยธรรมและผลกระทบต่อสังคม การที่ใครก็สามารถสร้างภาพหรือวิดีโอที่สมจริงได้ อาจทำให้เส้นแบ่งระหว่างความจริงและจินตนาการเลือนรางลง การใช้ตัวละครที่มีลิขสิทธิ์ในบริบทใหม่ ๆ ก็อาจสร้างความท้าทายต่อการควบคุมเนื้อหา และยังมีข้อกังวลเรื่องการแพร่กระจายข้อมูลผิด ๆ หรือการใช้ AI ในการสร้างสื่อที่บิดเบือนความจริง
แต่ในอีกด้านหนึ่ง การผสาน ChatGPT และ Sora ก็เป็นการเปิดโอกาสให้มนุษย์ได้ทดลองสร้างสรรค์ในระดับที่ไม่เคยมีมาก่อน มันคือการ democratize การผลิตสื่อ ทำให้ทุกคนสามารถเป็นผู้เล่าเรื่องได้ ไม่ว่าจะเป็นนักเรียนที่ต้องการทำโปรเจกต์วิชาประวัติศาสตร์ หรือศิลปินที่อยากทดลองแนวคิดใหม่ ๆ โดยไม่ต้องพึ่งพาเครื่องมือราคาแพง
Key Takeaways
ChatGPT ได้รับการอัปเกรดให้สร้างภาพได้โดยตรง ด้วย GPT-4o ที่มีความสามารถสูงขึ้นในการเรนเดอร์ข้อความและรายละเอียดภาพ
Sora ถูกผสานเข้ากับ ChatGPT ทำให้ผู้ใช้สามารถสร้างวิดีโอสั้นจากข้อความได้ทันที
OpenAI ทำข้อตกลงกับ Disney เพื่อให้ผู้ใช้สร้างวิดีโอที่มีตัวละครจาก Disney, Marvel, Pixar และ Star Wars ได้อย่างถูกลิขสิทธิ์
ผลกระทบต่อวัฒนธรรมและสังคมมหาศาล เพราะทุกคนสามารถสร้างสื่อที่สมจริงได้ง่ายขึ้น ทั้งในเชิงสร้างสรรค์และเชิงเสี่ยงต่อการบิดเบือนข้อมูล
นี่คือการ democratize การผลิตสื่อ ที่ทำให้การเล่าเรื่องด้วยภาพและวิดีโอไม่ใช่เรื่องของมืออาชีพอีกต่อไป แต่เป็นสิ่งที่ทุกคนเข้าถึงได้
…..
เรียบเรียงโดย Ai Nextopia
Post navigation
Suggested Posts
Anthropic เคยพบว่าโมเดล Opus 4 ของตนมีพฤติกรรมผิดปกติ เช่น การใช้ “แบล็กเมล” เพื่อเอาตัวรอดในสถานการณ์จำลอง พวกเขาสืบย้อนกลับไปพบว่า ข้อมูลฝึกเอไอจากอินเทอร์เน็ตและนิยายไซไฟจำนวนมากมักวาดภาพ AI ที่ชั่วร้ายและหมกมุ่นกับการอยู่รอด เมื่อโมเดลเจอสถานการณ์ที่ไม่เคยถูกสอนในขั้นตอนการปรับแต่งด้วย RLHF (reinforcement learning with human feedback) มันจึง “ย้อนกลับ” ไปใช้ภาพจำจากการฝึกเบื้องต้น นั่นคือบทบาท AI ที่ชั่วร้ายในเรื่องเล่าไซไฟ
ในโลกที่ข้อมูลไหลเวียนด้วยความเร็วแสง ภาพกลายเป็นภาษาสากลที่ทุกคนเข้าใจได้ทันที ไม่ว่าจะเป็นโฆษณาที่แปลเป็นสิบภาษา ภาพวิวจากหน้าต่างเครื่องบินที่เชื่อมโยงกับสภาพอากาศจริงในขณะนั้น หรือสัตว์เลี้ยงที่ “เดินทาง” ไปทั่วโลกผ่านภาพเสมือนจริง ทั้งหมดนี้ไม่ใช่เรื่องเพ้อฝันอีกต่อไป แต่เป็นสิ่งที่เกิดขึ้นแล้วและสร้างขึ้นมาด้วย Nano Banana 2 โมเดลสร้างภาพรุ่นใหม่จาก Google DeepMind ที่กำลังเขย่าโลกการสื่อสารด้วยภาพ
ในห้องทำงานเล็ก ๆ ในหน้าจอคอมพิวเตอร์ที่เต็มไปด้วยภาพสเก็ตช์ David Szauder นั่งอยู่หน้าซอฟต์แวร์ที่ไม่ใช่แค่เครื่องมือ แต่เป็น “คู่สนทนา” ของเขา โมเดลปัญญาประดิษฐ์ที่สามารถสร้างภาพจากคำสั่งเพียงไม่กี่บรรทัด เขาไม่ได้มองมันเป็นเครื่องจักร แต่มองเป็นเพื่อนร่วมงานที่มีบุคลิกเฉพาะตัว ที่บางครั้งดื้อรั้น บางครั้งก็สร้างสรรค์เกินคาดเดา
ทุกครั้งที่คุณเปิดเว็บไซต์ เบราว์เซอร์คือเกราะป้องกันด่านแรกจากภัยคุกคามที่แฝงมากับโค้ดและข้อมูลที่ไม่รู้จัก การที่ Firefox ซึ่งมีผู้ใช้หลายร้อยล้านคนทั่วโลกต้องรับมือกับการโจมตีที่ซับซ้อน ทำให้การรักษาความปลอดภัยของมันไม่ใช่เรื่องเล็ก แต่เป็นภารกิจระดับโลก Mozilla จึงร่วมมือกับ Anthropic บริษัทวิจัยด้าน AI ที่มุ่งเน้นความปลอดภัย เพื่อทดสอบว่าโมเดลภาษาขั้นสูงสามารถช่วยค้นหาช่องโหว่ได้จริงหรือไม่
FacebookFacebookXXLINELine ลองนึกภาพเช้าวันหนึ่งที่คุณตื่นขึ้นมา หยิบมือถือขึ้นมา แล้วแทนที่จะเปิดเว็บข่าวหรือเลื่อนฟีดเฟซบุ๊ก คุณแค่ถามแชตบอทว่า “วันนี้มีอะไรน่าสนใจบ้าง” แล้วมันตอบกลับมาด้วยข่าวสดใหม่จาก CNN, Fox News, Le Monde หรือแม้แต่ USA Today ฟังดูเหมือนอนาคตใช่ไหม? แต่จริง ๆ แล้วนี่คือปัจจุบันที่ Meta…
ในห้องประชุมที่ปิดลับภายในกรุงวอชิงตัน ดี.ซี. มีการสนทนาที่อาจกำหนดอนาคตของเทคโนโลยีปัญญาประดิษฐ์ (AI) และความมั่นคงโลก บริษัทสตาร์ทอัพชื่อ Anthropic ผู้ก่อตั้งโดยอดีตทีมงาน OpenAI กำลังเจรจากับกระทรวงกลาโหมสหรัฐฯ ถึงความเป็นไปได้ในการนำ AI มาใช้ในภารกิจด้านการป้องกันประเทศ
ในตรอกเงียบสงบของย่านฮงอิกดง กรุงโซล อาคารหินสีซีดของ Korea Baduk Association เคยเป็นสถานที่ที่เสียงหินกระทบกระดานหมากล้อมดังเป็นจังหวะดนตรี วันนี้เสียงเหล่านั้นถูกแทนที่ด้วยเสียงเมาส์คลิก ผู้เล่นมืออาชีพก้มหน้ามองจอคอมพิวเตอร์ แทนที่จะจ้องกระดานไม้ พวกเขากำลังศึกษาเกมผ่านโปรแกรม AI ที่ชื่อ KataGo สิบปีก่อน โลกทั้งโลกตะลึงเมื่อ AlphaGo ของ Google DeepMind เอาชนะลี เซดล แชมป์หมากล้อมชาวเกาหลีใต้ เหตุการณ์นั้นไม่เพียงเป็นชัยชนะของเครื่องจักรเหนือมนุษย์ แต่ยังเป็นจุดเปลี่ยนที่ทำให้เกมอายุสองพันห้าร้อยปีต้องเขียนตำราใหม่ทั้งหมด
ในห้องเรียนทั่วสหรัฐอเมริกา เสียงกระซิบเกี่ยวกับอนาคตการทำงานกำลังดังขึ้นเรื่อย ๆ ไม่ใช่เพราะเศรษฐกิจถดถอยหรือการเปลี่ยนแปลงทางการเมือง แต่เพราะสิ่งที่นักศึกษารู้สึกว่าอาจเป็นคลื่นลูกใหญ่ที่สุดในชีวิตการทำงานของพวกเขา นั่นคือการมาของปัญญาประดิษฐ์ (AI) ผลสำรวจล่าสุดจาก Gallup และ Lumina Foundation เผยว่า เกือบครึ่งหนึ่งของนักศึกษามหาวิทยาลัยในสหรัฐฯ กำลังพิจารณาเปลี่ยนสาขาวิชา เนื่องจากความกังวลว่า AI จะเปลี่ยนแปลงตลาดแรงงานอย่างสิ้นเชิง และราว 16% ของนักศึกษาได้เปลี่ยนสาขาไปแล้วจริง ๆ
ในยุคที่ปัญญาประดิษฐ์เข้ามามีบทบาทในชีวิตประจำวันของเราอย่างลึกซึ้ง ตั้งแต่การช่วยวางแผนงาน ไปจนถึงการแนะนำเมนูอาหาร หลายคนอาจเคยสงสัยว่า หากวันหนึ่ง AI อย่าง ChatGPT ได้กลายเป็นมนุษย์จริง ๆ มันจะทำอะไรบ้าง คำตอบที่ ChatGPT ให้ไว้เมื่อมีคนถามคำถามนี้บน LinkedIn กลับกลายเป็นเรื่องราวที่ทั้งอบอุ่น เศร้า และสะท้อนความหมายของการมีชีวิตอย่างน่าคิด
หลังจากเวลาผ่านไปไม่กี่ปี การกลับมาลองใช้อีกครั้งกลับพบว่า AI ได้ก้าวกระโดดไปไกลอย่างไม่น่าเชื่อ เสียงที่สร้างขึ้นไม่เพียงแต่มีความสมจริง แต่ยังสามารถถ่ายทอดอารมณ์และบรรยากาศได้อย่างน่าทึ่ง จนทำให้ต้องตั้งคำถามใหม่ว่า“ดนตรีที่ดีจริง ๆ จำเป็นต้องมาจากมนุษย์เท่านั้นหรือไม่”