คุยกับ ‘ไต้ฝุ่น’ เอไอภาษาไทย ย้ำจุดยืนต้องเป็น ‘ผู้สร้าง’ ไม่ใช่แค่ผู้ใช้

แม้ปีนี้โลกธุรกิจกำลังเดินหน้าสู่การใช้งานปัญญาประดิษฐ์ (เอไอ) แบบ Agentic AI ซึ่งเป็นเอไอที่ตัดสินใจได้ในลูปงานซ้ำ ๆ เข้ามาทดแทนคนมากขึ้น เนื่องจากโมเดลเอไอพื้นฐานทางภาษา (LLMs) ที่จุดพลุขึ้นมาตั้งแต่ปลายปี 2022 ฉลาดขึ้นอย่างก้าวกระโดด จนแทบไม่มีใครทำโมเดลพื้นฐานแข่งกับรายใหญ่

แต่ปัญหาคือไม่ได้สร้างบนพื้นฐานความเข้าใจในบริบททางวัฒนธรรมของภาษาไทย ทำให้เมื่อมีการนำมาต่อยอด “ยูสเคส” เกิดปัญหาในการใช้งานยิบย่อย หลายโปรเจ็กต์ไม่ผ่านการทดสอบเชิงคอนเซ็ปต์ด้วยซ้ำ

นั่นทำให้ SCB 10X บริษัทในกลุ่ม SCBX ครีเอตโปรเจ็กต์ “ไต้ฝุ่น” เพื่อพัฒนาโมเดลภาษาไทย และถือเป็นบริษัทไทยหนึ่งเดียวจากภูมิภาคเอเชียตะวันออกเฉียงใต้ที่เข้าร่วมโครงการ AWS Generative AI Accelerator 2025

“ประชาชาติธุรกิจ” มีโอกาสพูดคุยกับ “กสิมะ ธารพิพิธชัย” หัวหน้าฝ่ายกลยุทธ์ด้านปัญญาประดิษฐ์ SCB 10X ถึงความก้าวหน้าของโมเดล “ไต้ฝุ่น” การนำไปใช้จริงในภาคธุรกิจ และมุมมองต่ออนาคตในยุคเอไอ

กดปุ่มโมเดลภาษาไทย

“กสิมะ” เล่าว่า ไต้ฝุ่น (Typhoon) คือโครงการวิจัยและพัฒนาของ SCB 10X ที่มุ่งสร้างเทคโนโลยีภาษาแบบ Open-Source สำหรับภาษาไทยโดยเฉพาะ ซึ่งเริ่มมาตั้งแต่เห็นการเปิดตัวโมเดลภาษา LLM GPT ของ Open AI ที่จุดพลุกระแส Generative AI ไปทั่วโลก

“เราเริ่มเห็นว่าการพึ่งพาโมเดล LLM ระดับโลกต้องเผชิญกับปัญหาเชิงกลยุทธ์ ที่จะมีความแม่นยำต่ำในงานเฉพาะทาง ขาดความเข้าใจในภาษา และวัฒนธรรมท้องถิ่น และอาจเป็นต้นทุนแฝงในการใช้งานระดับองค์กร แม้ค่าบริการรายเดือนอาจดูไม่สูง แต่เมื่อคำนวณตามจำนวนพนักงานหลักร้อยหรือหลักพันคน ค่าใช้จ่ายรวมจะกลายเป็นต้นทุนมหาศาลที่เป็นอุปสรรคต่อการขยายผลในวงกว้าง”

นำไปสู่การพัฒนา ภายใต้หลักการ “Open Research” และ “Open Knowledge” เพื่อเปิดกว้างให้นักพัฒนาและองค์กรต่าง ๆ เข้าถึงโมเดล และเครื่องมือที่จะนำไปต่อยอดนวัตกรรม เริ่มต้นจากการพัฒนาโมเดลภาษาแบบข้อความ (Text-based LLMs) ก่อนขยายขอบเขตเชิงกลยุทธ์ไปสู่โมเดลด้านเสียงและภาพ (Multimodal Models) เพื่อตอบสนองต่อช่องว่างในตลาดเทคโนโลยีของไทยที่ยังไม่รองรับด้านนี้

อีกส่วนคือ การที่ต้องมี “อธิปไตยทางเทคโนโลยี” (Technical Sovereignty) โดยเฉพาะการทำงานภายใต้ SCB ซึ่งเป็นแบงก์ที่ต้องยึดมั่นในการเก็บรักษาข้อมูล และปกป้องลูกค้า

“อธิปไตยในข้อมูล และเทคโนโลยี ไม่ใช่ทางเลือก แต่คือความจำเป็นเชิงกลยุทธ์สำหรับประเทศไทย การพึ่งพาโมเดลภาษาขนาดใหญ่จากต่างประเทศ ไม่เพียงจำกัดประสิทธิภาพ แต่ยังก่อให้เกิดความเสี่ยงในการสูญเสียความสามารถในการแข่งขันทางเศรษฐกิจ และวัฒนธรรม”

Typhoon 2.5

จากแนวคิดที่ว่า “ภาษาคือรากฐานของวัฒนธรรม” การมอบหมายให้เทคโนโลยีจากภายนอกเป็นผู้ตีความและสร้างปฏิสัมพันธ์ทางภาษา จึงเท่ากับมอบอำนาจในการกำหนดบริบททางธุรกิจและอัตลักษณ์ของชาติให้ผู้อื่น เพราะโมเดลเหล่านี้มีข้อจำกัดที่ชัดเจนในการตอบสนองต่อความซับซ้อนของภาษาและสังคมไทย สร้างอุปสรรค และต้นทุนแฝงมหาศาลแก่องค์กร

“ไต้ฝุ่น” ได้พัฒนาโมเดลหลัก Text Models Typhoon 2.5 : โมเดลภาษาขนาดใหญ่ที่มีความคล่องแคล่วในการใช้ภาษาไทยสูง และเน้นประสิทธิภาพสำหรับงานประเภท Agentic AI รวมถึงมี Multimodal

Models Typhoon OCR : โมเดลสำหรับอ่าน และแปลงข้อมูลจากเอกสารและรูปภาพ มีความแม่นยำสูงกับบริบทภาษาไทย

Typhoon ASR โมเดลรู้จำเสียงพูดภาษาไทยแบบเรียลไทม์ (Real-time) สำหรับการถอดเสียง

Specialized Models Typhoon Translate โมเดลขนาดเล็กที่เชี่ยวชาญด้านการแปลไทย-อังกฤษโดยเฉพาะ

Typhoon Isan ASR โมเดลรู้จำเสียงพูดสำหรับภาษาอีสานโดยเฉพาะ ซึ่งได้รับการยอมรับในเวทีสากล โดยผลงานวิจัยของทีม“ไต้ฝุ่น” ได้รับการตีพิมพ์ และนำเสนอในเวทีประชุมวิชาการชั้นนำระดับโลก

ประหยัดกว่า 400 เท่า

“กสิมะ” เน้นว่า จุดเด่นของไต้ฝุ่น คือ ประสิทธิภาพในการใช้ภาษา การตีความภาษาไทยที่แม่นยำ และความคุ้มค่าในการนำไปใช้งานจริง

“โมเดลจากต่างประเทศมักทำงานผิดพลาดกับข้อมูลที่มีลักษณะเฉพาะของไทย เช่น อ่านข้อมูลเอกสารที่ไม่สามารถตรวจจับเลขไทยได้แม่นยำ หรือจัดการกับคำทับศัพท์และชื่อเฉพาะของไทยไม่ได้ เพราะไม่ได้สร้างมารองรับความหลากหลายทางภาษาในไทย โดยเฉพาะภาษาถิ่นอย่างภาษาอีสาน ทั้งไม่สามารถจัดการกับการสลับภาษา ซึ่งเป็นพฤติกรรมที่พบได้ทั่วไปของคนไทยได้”

อีกส่วนคือมีการใช้นักภาษาศาสตร์ที่เชี่ยวชาญเป็นโดเมนเฉพาะคอยเทรนเอไอ และปรับแต่ง ทั้งในเชิงตัวอักษรและเสียง ผลที่ออกมาในโมเดลการรู้จำเสียง Typhoon ASR ไปติดตั้งใช้งานเอง (Self-hosted) ประหยัดค่าใช้จ่ายได้มากกว่าโมเดลต่างชาติถึง 400 เท่า เปลี่ยนแปลงสมการคำนวณผลตอบแทนจากการลงทุน (ROI) สำหรับระบบอัตโนมัติด้านเสียงโดยสิ้นเชิง

“เทียบค่าบริการ API สำหรับถอดเสียง 1 ชั่วโมง โมเดลต่างประเทศคิดค่าบริการประมาณ 1 USD ขณะที่ไต้ฝุ่นมีค่าใช้จ่ายเพียง 0.0023 USD หากมีการแปลงเสียงเป็นข้อความในปริมาณ 500,000 นาที (หรือ 8,333 ชั่วโมง) และเลือกรันผ่านระบบของ AWS โดยใช้ไต้ฝุ่น ค่าใช้จ่ายที่เกิดขึ้นอาจอยู่ที่ประมาณ 12 ดอลลาร์เท่านั้น”

ผลักดันสู่ “ยูสเคส” จริง

ภารกิจหลักในปัจจุบันของทีมวิจัยและพัฒนาในโครงการไต้ฝุ่น คือการขยายการเข้าถึงโมเดลพื้นฐานให้องค์กร และนักพัฒนารายอื่น ๆ ก่อนที่จะพัฒนาเป็นโปรดักต์ยูสเคสกับธุรกิจจริงในปี 2569

“กสิมะ” กล่าวว่า การเข้าสู่ตลาดต้องมีพันธมิตรทางเทคโนโลยีที่แข็งแกร่งพอ จึงเลือก AWS เพื่อใช้โครงสร้างพื้นฐานในการทำตลาด และขยายบริการ (Scale)

“การโฮสต์บน AWS ซึ่งมีคลาวด์ภูมิภาคตั้งอยู่ในไทย ช่วยลดความหน่วง ซึ่งสำคัญมากสำหรับ Use Case เช่น Voice Agent ภาษาไทย โดยแผน Go-to-Market จะใช้ AWS Marketplace เป็นช่องทางในการเผยแพร่โมเดลในวงกว้างขึ้น ทั้งในรูปแบบ API และ Containerized Deployments”

สำหรับกลุ่มเป้าหมายครอบคลุมอุตสาหกรรมต่าง ๆ ทั้งภาคเอกชน และรัฐ โดยเฉพาะองค์กรขนาดใหญ่ที่เกี่ยวข้องกับเอกสารจำนวนมาก และต้องการลดค่าใช้จ่าย เช่น Toyota Leasing Thailand ใช้ OCR แปลงเอกสารสัญญาเป็นดิจิทัล หรือองค์กรที่งานเกี่ยวข้องกับเสียง เช่น Call Center ก็อาจใช้โมเดลเสียง (ASR)

นอกจากนี้ยังร่วมกับสภาการศึกษา เพื่อพัฒนาแชตบอตช่วยเตรียมสอบ PISA และ TDRI ใช้ API ของไต้ฝุ่นเพื่อวิเคราะห์ข้อมูลตลาดแรงงาน รวมถึงภาคการแพทย์ใน รพ. ศิริราช ที่ใช้โมเดลไปสร้างแชตบอตตอบคำถามสำหรับบุคลากร ซึ่งควบคุมความเป็นส่วนตัว และผูกกับฐานข้อมูลของโรงพยาบาลได้

ต่อยอดได้ ขับเคลื่อนประเทศได้

“กสิมะ” กล่าวต่อว่า ยุทธศาสตร์เอไอของ SCB 10X ไม่ใช่แค่การสร้างโมเดลภาษาไทย แต่คือการสร้างเครื่องมือทางเศรษฐกิจที่ช่วยลดต้นทุน เพิ่มประสิทธิภาพ และจากแนวโน้มของปีหน้าจะเห็นว่า เทรนด์ Agentic AI กำลังเกิดขึ้น และจะเข้ามาทดแทนงานส่วนต่าง ๆ ในองค์กร แต่ต้องเน้นย้ำว่า Agentic AI ไม่ใช่โมเดลเอไอพื้นฐานที่ต้องสร้างใหม่ เพียงใช้เครื่องมือที่เหมาะสม ออกแบบระบบงานเวิร์กโหลด แล้วใช้ได้เลย

“องค์กรต่าง ๆ ไม่ต้องกังวลเรื่อง Agent AI ไม่ต้องสร้างใหม่ สามารถนำ Open Model อย่างไต้ฝุ่นไปปรับแต่ง หรือทำ Fine-tune ให้เข้ากับข้อมูลเฉพาะของบริษัทได้ แต่สิ่งที่องค์กรต้องมี คือบุคคลที่เชี่ยวชาญในงานนั้น ๆ หรือ Domain Expertise เพื่อปรับแต่งโมเดลให้เข้ากับงานขององค์กร ไม่ใช่แค่นำเอไอเอเย่นต์ต่างชาติมาใช้”

“กสิมะ” ทิ้งท้ายด้วยว่า ประเทศไทยเป็นผู้ใช้เทคโนโลยีมาโดยตลอด จึงควรเป็น “ผู้สร้าง” เทคโนโลยีให้มากขึ้น ไม่ใช่แค่ “ผู้ใช้” เพราะอาจเสียการควบคุมเทคโนโลยี โดยเฉพาะในบริบทของภาษาและวัฒนธรรม อีกทั้งการเป็นผู้ใช้เป็นการส่งมูลค่าทางเศรษฐกิจไปให้บริษัทนอกประเทศ ขณะที่การเป็นผู้สร้างจะช่วยให้มูลค่านั้นยังอยู่และหมุนเวียนภายในประเทศไทย

Admin