MIT ทดสอบ AI กับงานจริง 11,000 ชิ้น ผลคือยังเป็นแค่ ‘เด็กฝึกงาน’ ผ่านเกณฑ์แค่ 65%

2026, 04, 11 AI Re-News

บทความจาก techsauce

คนทำงานออฟฟิศที่เคยลองใช้ AI ช่วยงาน อาจเคยรู้สึกหวั่น ๆ ว่าสักวันจะโดนแทนที่ แต่งานวิจัยล่าสุดจาก MIT บอกเราว่าตอนนี้ AI ยังทำงานได้แค่ระดับพอผ่านเท่านั้น ถ้าเปรียบเทียบก็เหมือนเด็กฝึกงานที่ทำงานส่งได้ แต่หัวหน้าต้องมานั่งแก้ทุกครั้ง

MIT ทดสอบอะไร แล้วทดสอบอย่างไร ?

ทีมวิจัยจาก MIT เอาโมเดล AI มา 41 ตัว ซึ่งรวมทั้ง Claude, Gemini และ ChatGPT แล้วให้ทำงานจริง ๆ ที่เป็นงานเขียนเป็นหลักมากกว่า 11,000 tasks ตามตำแหน่งงานต่าง ๆ ที่กระทรวงแรงงานสหรัฐฯ ระบุไว้

จากนั้นให้คนที่ทำงานจริงในสายนั้น ๆ มาให้คะแนน ไม่ใช่ให้ AI ตรวจ AI เอง แต่เอาคนที่มีประสบการณ์ตรงมาตัดสินว่าผลงานที่ AI ทำออกมา ถ้าส่งให้หัวหน้าโดยไม่ต้องแก้อะไรเลย จะผ่านไหม แล้วคุณภาพเป็นอย่างไร

ผลออกมา 65% ของงานทั้งหมด AI ทำได้แค่ ‘พอใช้ได้’

MIT ใช้สเกลให้คะแนน 1-9 โดยที่คะแนน 7 หมายถึงพอใช้ได้ คือส่งงานได้โดยไม่ต้องแก้ แต่ก็ไม่ได้ดีเด่นอะไร ผลคือ ณ ปลายปี 2025 ที่ผ่านมา AI ทำคะแนนถึง 7 ได้ใน ราว ๆ 65% ของงานทั้งหมด ฟังดูเหมือนเยอะ แต่ถ้าคิดกลับกันหมายความว่ายังมีอีก 35% ที่ AI ยังทำไม่ถึงเกณฑ์ขั้นต่ำด้วยซ้ำ

พองานยากขึ้น AI ยิ่งสู้ไม่ไหว

ส่วนที่น่าสนใจที่สุดคือ เมื่อยกมาตรฐานขึ้นไปที่คะแนน 9 หรือระดับยอดเยี่ยม โอกาสที่ AI จะทำได้ ไม่เคยเกิน 50% เลย ไม่ว่าจะให้เวลาเท่าไหร่ก็ตาม พูดให้เข้าใจ คือถ้างานต้องใช้หลายขั้นตอน ต้องใช้ความคิดสร้างสรรค์ หรือต้องการความแม่นยำสูง AI ก็มีโอกาสพลาดมากกว่าสำเร็จ

งานไหนที่ AI ทำได้ งานไหนยังต้องพึ่งคน

ข้อมูลจาก MIT ชี้ว่า AI ทำงานที่เป็นพื้นฐานในสายงานก่อสร้างและงานซ่อมบำรุงได้ค่อนข้างดี เพราะงานเหล่านี้มักเป็นงานที่มีรูปแบบชัดเจน ทำตามขั้นตอนได้ แต่พอเป็นงานที่ต้องใช้ทักษะเฉพาะทางอย่างเช่น งานกฎหมาย หรือ งาน IT คะแนนเฉลี่ยที่ออกมากลับต่ำกว่า สะท้อนว่า AI ยังรับมือกับงานที่ต้องตีความ วิเคราะห์ หรือตัดสินใจที่ซับซ้อนได้ไม่ดี

ซึ่งตรงนี้สอดคล้องกับสิ่งที่เราเห็นในตลาดแรงงานจริง ๆ ว่าบริษัทส่วนใหญ่เอา AI ไปแทนงาน routine หรืองาน entry-level ก่อน ขณะที่คนที่มีทักษะเฉพาะทาง โดยเฉพาะด้านดิจิทัลกลับได้ค่าตอบแทนสูงขึ้น

เคสจริงที่ AI ทำพลาดก็มีให้เห็น

เรื่องนี้ไม่ใช่แค่ตัวเลขในงานวิจัย แต่มีตัวอย่างจริงให้เห็นแล้ว

Deloitte เคยใช้ AI ทำรายงานให้ลูกค้าภาครัฐในออสเตรเลียและแคนาดา แล้วพบว่ารายงานเต็มไปด้วย ข้อมูลที่ AI แต่งขึ้นมาเอง
สื่ออย่าง CNET และ Sports Illustrated ก็เคยถูกจับได้ว่าใช้ AI เขียนบทความที่มีข้อมูลผิด แถมใส่ชื่อนักเขียนปลอม
ในวงการกฎหมาย ก็มีกรณีที่สำนักงานทนายต้องออกมาขอโทษต่อสาธารณะ หลังจากเอกสารที่ยื่นต่อศาลมีการอ้างอิงคดีที่ AI สร้างขึ้นมา ซึ่งไม่มีอยู่จริง

แต่ตอนนี้ AI กำลังเก่งขึ้นเร็วมาก

ถึง AI จะยังไม่สมบูรณ์แบบ แต่สิ่งที่ปฏิเสธไม่ได้คือมันกำลังดีขึ้นอย่างรวดเร็ว

ทีม MIT ประเมินว่าอัตราความสำเร็จของ AI เพิ่มขึ้นสูงสุดถึง 11 เปอร์เซ็นต์ต่อปี จากโมเดลที่ฉลาดขึ้นเรื่อย ๆ และคาดการณ์ว่าภายในปี 2029 AI จะสามารถทำงานเขียนได้ 80-95% ในระดับ ‘พอใช้ได้’ แต่คำถามสำคัญคือ AI จะไปถึงระดับยอดเยี่ยมได้หรือไม่ ตรงนี้ทีมวิจัยยังไม่ฟันธง โดยเฉพาะในงานที่ผิดพลาดไม่ได้ อย่างเช่น งานกฎหมาย งานการแพทย์ หรืองานการเงิน การจะปล่อยให้ AI ทำเองทั้งหมดยังเป็นเรื่องที่อีกไกล

สรุป

ถ้าเปรียบ AI ตอนนี้เป็นพนักงาน AI คือพนักงานที่ร่างอีเมลได้ สรุปข้อมูลได้ กรอกตัวเลขได้ แต่ถ้าจะให้ทำงานที่ต้องคิด ตัดสินใจ หรืองานที่ถ้าผิดพลาดแล้วจะเจ็บหนัก งานเหล่านี้ยังต้องมีคนมาคุมอยู่ดี

สิ่งที่เราเห็นจากงานวิจัยนี้ชัดเจนว่าคนที่รู้จักใช้ AI เป็นเครื่องมือจะได้เปรียบกว่าคนที่ปล่อยให้ AI ทำเองทั้งหมด ทักษะในการตรวจสอบ แก้ไข และตัดสินใจว่าอะไรดี อะไรยังไม่ได้ ยังเป็นสิ่งที่ AI ทำแทนไม่ได้

อ้างอิง: fortune

Admin

Suggested Posts

2026, 03, 06 AI Re-News

เมื่อ AI กลายเป็นผู้ช่วยวางแผนการเงินของคนรุ่นใหม่

ทุกครั้งที่พูดถึง AI หลายคนมักตั้งคำถามว่า “งานของเราจะถูกแทนที่หรือไม่” แต่มีอีกหนึ่งคำถามที่สำคัญไม่แพ้กัน คือ AI กำลังเปลี่ยนวิธีที่เราคิดเรื่องเงินอยู่หรือไม่ เพราะในขณะที่ AI ถูกพูดถึงในบริบทของการทำงาน เทคโนโลยีเดียวกันกำลังค่อย ๆ เปลี่ยนพฤติกรรมทางการเงินของผู้คนในชีวิตประจำวัน ตั้งแต่การวิเคราะห์รายจ่าย การวางแผนออม ไปจนถึงการตัดสินใจเลือกเครื่องมือทางการเงิน

2026, 05, 21 AI Re-News

Google กำลังทำให้การค้นหากลายเป็นการสนทนากับ AI ด้วยภาษาพูดเหมือนการคุยกัน

Google ได้เพิ่ม “AI Agent” เข้าไปในระบบค้นหา ซึ่งถือเป็นการเปลี่ยนแปลงครั้งใหญ่ที่อาจพลิกโฉมวิธีที่ผู้คนทั่วโลกรวมทั้งผู้ใช้ในไทยเข้าถึงข้อมูลออนไลน์ โดย AI Agent นี้ไม่เพียงแต่ช่วยค้นหา แต่ยังสามารถโต้ตอบ วิเคราะห์ และสังเคราะห์คำตอบได้อย่างใกล้เคียงกับผู้ช่วยส่วนตัวอัจฉริยะ

2026, 03, 29 AI Re-News

AI มันทุกอย่าง Mark Zuckerberg จะนำ AI มาช่วยตัดสินใจในฐานะซีอีโอ

The Wall Street Journal เปิดเผยว่า Mark Zuckerberg ซีอีโอของบริษัท Meta เจ้าของแพลตฟอร์มโซเชียลมีเดียยอดนิยม กำลังทดสอบระบบ AI Agent ตัวใหม่ ที่ได้รับการออกแบบมาเพื่อทำงานและตัดสินใจแทนตำแหน่งความรับผิดชอบของ CEO เพื่อให้การดำเนินงานของบริษัทมีประสิทธิภาพ

2026, 04, 27 AI Re-News

“โทเค็น” เครื่องมือที่จีนใช้พลิกเกมโลก เมื่อ AI กลายเป็นสินค้าราคาถูกที่เข้าถึงได้ทุกคน

ปฏิเสธไม่ได้ว่า จีนคือมหาอำนาจในการส่งออกสินค้ารายใหญ่ของโลก แต่ในยุคที่ AI กำลังเข้ามาเป็นส่วนหนึ่งในชีวิตของผู้คน จีนก็ยังคงเป็นหนึ่งในผู้ส่งออกเทคโนโลยี AI ที่สำคัญของโลก โดย South China Morning Post (SCMP) ชี้ให้เห็นปรากฎการณ์ที่น่าสนใจ เมื่อบริษัทเทคโนโลยีของจีนกำลังหันมาส่งออก “โทเค็น (Token)” โดยข้อมูลจาก OpenRouter แพลตฟอร์มรวมโมเดล AI ระดับโลกชี้ให้เห็นว่า ในช่วงเดือนมีนาคม-เมษายน 2026 โมเดล AI จากจีนสามารถครองแชมป์ยอดการใช้งานโทเค็นได้ถึง 4 อันดับจาก 10...

2026, 03, 04 AI Re-News

“MWC 2026” เปิดฉากยิ่งใหญ่ ! ยกทัพ “AI” และ “หุ่นยนต์มนุษย์” แห่งอนาคต

งานแสดงเทคโนโลยีระดับโลก โมบาย เวิลด์ คองเกรส (Mobile World Congress - MWC) ประจำปี 2026 เริ่มต้นอย่างคึกคัก ณ เมืองบาร์เซโลนา ประเทศสเปน โดยในปีนี้เหล่าผู้เชี่ยวชาญและบริษัทเทคโนโลยีจากทั่วโลกต่างตบเท้าเข้าร่วมงานจัดแสดงเทคโนโลยีสื่อสารที่ใหญ่ที่สุดในโลก ซึ่งถือเป็นการฉลองครบรอบ 20 ปีของการจัดงานที่เมืองแห่งนี้ด้วย

2026, 01, 13 AI Re-News

ผลสำรวจเผยคน 97% แยกไม่ออกว่าอันไหนเพลง AI หรือเพลงที่คนแต่งจริง ๆ

Deezer บริการสตรีมเพลงออนไลน์สัญชาติฝรั่งเศส จับมือกับบริษัทวิจัยการตลาดอย่าง Ipsos เผยผลสำรวจของผู้ใช้งานเกี่ยวกับทัศนคติที่มีต่อเพลงซึ่งถูกสร้างด้วย AI เพื่อสะท้อนภาพรวมในปัจจุบันที่ Generative AI เข้ามามีบทบาทในวงการเพลงมากขึ้น

2026, 02, 09 AI Re-News

โลกอนาคตหรือเรื่องตลกร้าย? เว็บไซต์ “RentAHuman.ai” ให้ AI เช่าร่างมนุษย์ไปทำงานในโลกจริง

เว็บไซต์ "RentAHuman.ai" AI เช่าร่างมนุษย์ไปทำงาน ทำให้ดูเหมือนว่าอนาคตแบบไซเบอร์พังค์ (Cyberpunk) จะมาถึงเร็วกว่าที่คิด โดยเว็บไซต์แห่งนี้อนุญาตให้ปัญญาประดิษฐ์ (AI Agents) สามารถเช่าร่างกายมนุษย์ให้ทำงานในโลกกายภาพ (Physical World)โดยมาพร้อมสโลแกนชวนขนลุกว่า "หุ่นยนต์ต้องการร่างกายของคุณ" หรือ Robots need your body

2026, 05, 24 AI Re-News

ซัมซุง จับมือ Google เปิดตัว “แว่นตาอัจฉริยะ AI” รุ่นใหม่ผ่านความร่วมมือกับ Gentle Monster และ Warby Parker

ซัมซุง ร่วมกับ Google เปิดตัวแว่นตาอัจฉริยะ1 AI รุ่นใหม่เป็นครั้งแรก ภายในงาน Google I/O 2026 พร้อมเผยดีไซน์สุดพรีเมียม 2 รุ่นด้วยกัน ซึ่งพัฒนาร่วมกับแบรนด์แว่นตาชั้นนำระดับโลกอย่าง Gentle Monster และ Warby Parker โดยได้รับการออกแบบให้ทำงานร่วมกับสมาร์ทโฟนในรูปแบบ Companion Device ซึ่งช่วยให้ผู้ใช้งานสามารถเข้าถึงข้อมูล ความช่วยเหลือ และฟีเจอร์ต่าง ๆ ได้อย่างสะดวกสบายผ่านการสั่งงานด้วยเสียง พร้อมเชื่อมต่อการทำงานกับสมาร์ทโฟนได้อย่างไร้รอยต่อ ภายใต้ดีไซน์ที่คุ้นเคย...

2025, 11, 18 AI Re-News

ครั้งแรก… เด็กไทยโชว์สกิล AI ออกแบบกระปุกออมสินแห่งโลกยุคดิจิทัล

เนื่องในวันออมแห่งชาติ 31 ตุลาคม 2568 ที่ผ่านมา ซึ่งถือเป็นครั้งแรกที่ธนาคารออมสินเปิดเวทีประกวดออกแบบกระปุกออมสินในรูปแบบใหม่ โดยนำเทคโนโลยี AI เข้ามาผสานกับความคิดสร้างสรรค์อย่างเต็มรูปแบบ พร้อมทั้งเปิดโอกาสให้ประชาชนทุกเพศทุกวัยเข้าร่วมการแข่งขัน

2026, 01, 16 AI Re-News

ซัมซุง มุ่งดันไทยเป็นศูนย์กลาง AI ระดับภูมิภาค เร่งขับเคลื่อนวิสัยทัศน์ “Your Companion to AI Living” สู่การใช้งานจริง

จากเวทีระดับโลก The First Look ในงาน CES 2026 ซัมซุงได้ประกาศวิสัยทัศน์ “Your Companion to AI Living” ตอกย้ำบทบาทของ AI ในฐานะหัวใจสำคัญขององค์กร ไม่ใช่เพียงเทคโนโลยีแห่งอนาคต แต่คือ “เพื่อนคู่คิด” ที่เข้าใจผู้คนอย่างแท้จริง โดยวิสัยทัศน์นี้ถูกหลอมรวมอยู่ในทุกมิติของการดำเนินงาน ตั้งแต่การวิจัยและพัฒนา การออกแบบนวัตกรรม การบริหารองค์กร ไปจนถึงประสบการณ์การใช้งานจริง เพื่อสร้าง AI Ecosystem ที่เชื่อมโยงกันอย่างครบวงจร และยกระดับคุณภาพชีวิตในทุกวัน

AI The Master

Or check our Popular Categories...

MIT ทดสอบ AI กับงานจริง 11,000 ชิ้น ผลคือยังเป็นแค่ ‘เด็กฝึกงาน’ ผ่านเกณฑ์แค่ 65%

MIT ทดสอบอะไร แล้วทดสอบอย่างไร ?

พองานยากขึ้น AI ยิ่งสู้ไม่ไหว

งานไหนที่ AI ทำได้ งานไหนยังต้องพึ่งคน

เคสจริงที่ AI ทำพลาดก็มีให้เห็น

แต่ตอนนี้ AI กำลังเก่งขึ้นเร็วมาก

สรุป

Admin

MIT ทดสอบ AI กับงานจริง 11,000 ชิ้น ผลคือยังเป็นแค่ ‘เด็กฝึกงาน’ ผ่านเกณฑ์แค่ 65%

MIT ทดสอบอะไร แล้วทดสอบอย่างไร ?

พองานยากขึ้น AI ยิ่งสู้ไม่ไหว

งานไหนที่ AI ทำได้ งานไหนยังต้องพึ่งคน

เคสจริงที่ AI ทำพลาดก็มีให้เห็น

แต่ตอนนี้ AI กำลังเก่งขึ้นเร็วมาก

สรุป

Share this:

Admin

Suggested Posts