กลุ่มเอสซีบีเอกซ์ (SCBX) เผยความสำเร็จของทีมนักวิจัยในองค์กร หลังผลงานวิจัยรวม 5 ฉบับได้รับการตอบรับให้ร่วมนำเสนอใน 4 เวทีประชุมวิชาการด้านเทคโนโลยีระดับโลก ประจำปี 2569 ได้แก่ ACL 2026 (Main Conference), EACL 2026 (Main Conference), ICLR 2026 Workshop: Principled Design for Trustworthy AI และ ICLR 2026 Blogposts Track
ความสำเร็จในครั้งนี้เป็นผลงานร่วมของทีมวิจัยภายในกลุ่ม ได้แก่ SCBX และ SCB DataX โดยมุ่งเน้นการพัฒนาเทคโนโลยี AI ใน 3 แนวทางหลัก คือ 1) ประสิทธิภาพและความปลอดภัยของ AI ในภาษาและวัฒนธรรมไทย 2) ความสามารถด้าน Audio-Language สำหรับการใช้งานจริง และ 3) งานวิจัยพื้นฐานด้านการให้เหตุผล (Reasoning) ของโมเดลภาษาขนาดใหญ่ ทั้งนี้ เวที ACL และ EACL เป็นงานประชุมวิชาการในสาขา Natural Language Processing (NLP) ขณะที่ ICLR เป็นเวทีด้าน Machine Learning และ Deep Learning
กวีวุฒิ เต็มภูวภัทร Chief Innovation Officer บริษัท เอสซีบี เอกซ์ จำกัด (มหาชน) (SCBX) และประธานเจ้าหน้าที่บริหาร บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) กล่าวว่า ผลงานทั้ง 5 ชิ้นแสดงให้เห็นถึงแนวทางการพัฒนา AI ที่ให้ความสำคัญใน 3 มิติ คือ การเข้าใจบริบทการใช้งานจริงของผู้ใช้ชาวไทยทั้งด้านภาษาและความปลอดภัย การขยายขีดความสามารถสู่โมเดลเสียง (Audio-Language) และการทำวิจัยพื้นฐานเพื่อยกระดับ AI ทั้งระบบ ซึ่งเป็นปัจจัยสำคัญในการนำ AI ไปใช้ในภาคธุรกิจ โดยเฉพาะอุตสาหกรรมการเงินที่ต้องการความน่าเชื่อถือสูง โดยกลุ่ม SCBX ยังคงสนับสนุนแนวทางการวิจัยแบบเปิด (Open Research) เพื่อร่วมยกระดับศักยภาพนักวิจัยไทย
5 ผลงานวิจัยไทยของกลุ่มเอสซีบีเอกซ์บนเวทีระดับโลก
สำหรับรายละเอียดของผลงานวิจัยทั้ง 5 ฉบับ มีดังนี้:
1) Language-Aware Token Boosting (LATB): เปิดทางให้ AI “เข้าใจและตอบภาษาไทย” ได้แม่นยำยิ่งขึ้น โดยไม่ต้องเทรนโมเดลใหม่
ผลงานวิจัยที่ได้รับการตอบรับใน ACL 2026 (Main Conference) นำเสนอเทคนิคใหม่ Language-Aware Token Boosting (LATB) ที่ช่วยแก้ปัญหาการใช้งาน LLM ในภาษาไทย ซึ่งมักเกิดอาการ “หลงภาษา” เช่น ตอบเป็นภาษาอังกฤษหรือสลับภาษา แม้ผู้ใช้ตั้งคำถามเป็นภาษาไทย ทำให้ประสบการณ์การใช้งานไม่เป็นธรรมชาติ โดย LATB สามารถลดปัญหาดังกล่าวได้อย่างมีนัยสำคัญ โดยไม่จำเป็นต้องนำโมเดลกลับไปฝึกใหม่ (fine-tune) ช่วยลดต้นทุนและเพิ่มประสิทธิภาพในการนำไปใช้งานจริง
2) ThaiSafetyBench: มาตรฐานใหม่ในการวัดความปลอดภัย AI ในบริบทภาษาและวัฒนธรรมไทย
ผลงานวิจัยที่ได้รับการตอบรับใน ICLR 2026 Workshop “Principled Design for Trustworthy AI” โดยได้ทำการเปิดตัว ThaiSafetyBench ซึ่งเป็นชุดทดสอบความปลอดภัยของ LLM ที่ออกแบบเฉพาะสำหรับบริบทภาษาและวัฒนธรรมไทย ปัจจุบันการประเมินความปลอดภัยของ AI ระดับโลกพึ่งพา benchmark ภาษาอังกฤษเป็นหลัก ทำให้ความเสี่ยงเฉพาะในบริบทไทย เช่น ประเด็นทางสังคม วัฒนธรรม และค่านิยมเฉพาะของไทย ไม่เคยถูกประเมินอย่างเป็นระบบ ส่งผลให้องค์กรในประเทศไทยขาดเครื่องมือมาตรฐานในการตรวจสอบว่าโมเดล AI ใด “ปลอดภัยเพียงพอ” สำหรับบริบทของคนไทย
ThaiSafetyBench ประกอบด้วยชุดข้อมูลทดสอบ 1,954 ตัวอย่างในภาษาไทย ครอบคลุม 6 กลุ่มความเสี่ยง 17 ประเภทอันตราย โดยทีมวิจัยได้ทำการทดสอบโมเดล AI ชั้นนำของโลกกว่า 24 โมเดล ไม่ว่าจะเป็น Claude 4.5 Sonnet, GPT-5, Gemini, Llama, Gemma, Qwen รวมถึงโมเดลที่พัฒนาในประเทศไทยอย่าง Typhoon และ OpenThaiGPT ผลการศึกษาพบว่าการโจมตีที่อิงบริบทวัฒนธรรมไทยมีอัตราความสำเร็จสูงกว่าการโจมตีทั่วไปอย่างชัดเจน สะท้อนให้เห็นช่องโหว่สำคัญในการพัฒนา AI ที่ยังไม่ได้รับการแก้ไขในระดับสากล
ทั้งนี้ ทีมวิจัยได้เปิดให้ชุดข้อมูล leaderboard และเครื่องมือคัดกรองเนื้อหาอันตราย (ThaiSafetyClassifier) ใช้งานในรูปแบบ open-source เพื่อสนับสนุนการยกระดับมาตรฐานความปลอดภัย AI ของไทยร่วมกับชุมชนนักวิจัยและนักพัฒนาทั่วประเทศ
3) AudioJudge: กรอบการประเมินคุณภาพเสียงแบบ Unified ด้วย Large Audio Models
ผลงานวิจัยที่ได้รับการตอบรับใน EACL 2026 (Main Conference) จากทีม Typhoon (SCB DataX) นำเสนอ AudioJudge ซึ่งเป็นการศึกษาแนวทางการใช้ Large Audio Models (LAMs) เป็น “ผู้ตัดสิน” (Judge) เพื่อประเมินคุณภาพเสียงในหลากหลายมิติพร้อมกัน ทั้งการออกเสียง (Pronunciation) อัตราเร็วในการพูด (Speaking Rate) การระบุตัวตนผู้พูด (Speaker Identification) และ คุณภาพเสียง (Speech Quality) แทนการใช้ระบบเฉพาะทางแยกกันสำหรับแต่ละด้าน โดยทีมวิจัยได้นำเสนอเทคนิค Multi-aspect Ensemble AudioJudge ที่มีความใกล้เคียงกับการตัดสินของมนุษย์ (Spearman Correlation) มากถึง 0.91 ในเกณฑ์มาตรฐานการจัดอันดับระบบ นับเป็นก้าวสำคัญในการสร้างเครื่องมือวัดผลที่สอดคล้องกับการรับรู้ของมนุษย์อย่างแท้จริง
4) Extending Audio Context for Long-Form Understanding: ปลดล็อกความเข้าใจเสียงระยะยาวของโมเดล Audio-Language
อีกหนึ่งผลงานจากทีม Typhoon (SCB DataX) ที่ได้รับการตอบรับใน EACL 2026 (Main Conference) มุ่งแก้ปัญหา “คอขวด” สำคัญของ Large Audio-Language Models (LALMs) ซึ่งมักถูกจำกัดด้วยความสามารถในการประมวลผลเสียงที่จำกัด เช่น 30 วินาที แม้โมเดลภาษาตัวหลักจะรองรับบริบทได้ยาวกว่าก็ตาม ทีมวิจัยได้นำเสนอ Partial YaRN ซึ่งเป็นวิธีขยาย Context แบบ Modality-decoupled ที่ปรับเฉพาะตำแหน่งของ Audio Token โดยไม่กระทบความสามารถด้านข้อความเดิม รวมถึง Virtual Longform Audio Training (VLAT) ที่ช่วยให้โมเดลเข้าใจเสียงยาวที่ไม่เคยพบมาก่อนได้อย่างมีประสิทธิภาพ ผลงานนี้เปิดทางให้ระบบ Audio-Language สามารถก้าวข้ามขีดจำกัดของคลิปเสียงสั้นไปสู่การใช้งานจริงที่ต้องประมวลผลเสียงระยะยาว เช่น การประชุม การให้บริการคอลเซ็นเตอร์ และคอนเทนต์เสียงทุกรูปแบบ
5) Wait, Do We Need to Wait? Revisiting Budget Forcing for Sequential Test-Time Scaling
ผลงานที่ได้รับการตอบรับใน ICLR 2026 Blogposts Track ตั้งคำถามและตรวจสอบเทคนิค Budget Forcing ซึ่งเป็นแนวทางสำคัญในการเพิ่มความสามารถการให้เหตุผลของ LLM ผ่านการควบคุม “งบการคิด” (Thinking Budget) และการเติมคำว่า “Wait” เพื่อกระตุ้นให้โมเดลคิดต่อ ทีมวิจัยได้ทดลองอย่างเป็นระบบกับโมเดลหลากหลายตระกูล ทั้ง Qwen, Llama, Gemma และ Mistral และค้นพบประเด็นสำคัญหลายข้อ อาทิ เทคนิคนี้ไม่ได้ให้ผลเป็นเชิงเส้นอย่างที่งานวิจัยต้นฉบับเสนอ และคำว่า “Wait” ไม่ใช้คำกระตุ้นที่ดีที่สุดเสมอไป คำที่โมเดลใช้บ่อยตามธรรมชาติของตัวเอง เช่น “Let” หรือ “Perhaps” มักให้ผลลัพธ์ที่ดีกว่า ผลงานนี้ให้แนวทางปฏิบัติที่ชัดเจน (Practical Guidelines) สำหรับนักพัฒนาในการนำเทคนิค Test-Time Scaling ไปใช้จริง พร้อมเปิดมุมมองใหม่ต่อความเข้าใจของชุมชนวิจัยระดับโลก
ข่าวอื่น ๆ ที่น่าสนใจ
VST ECS รุกตลาดหุ่นยนต์ฮิวแมนนอยด์ ชู Embodied AI เจาะกลุ่ม B2B และภาคองค์กร
SCBX AI Outlook 2026: 6 แนวโน้มสำคัญของ AI ในยุคใหม่



