Share on

[seed_social]

Botnoi Group พลิกโฉมเทคโนโลยีเสียง AI สู่เครื่องมือที่เข้าใจทุกสำเนียง

ท่ามกลางความก้าวหน้าของปัญญาประดิษฐ์ (AI) ที่เข้ามาเป็นส่วนหนึ่งของชีวิตประจำวัน เทคโนโลยี “AI Voice” ได้กลายเป็นหนึ่งในนวัตกรรมที่น่าจับตามองมากที่สุด จากเสียงสังเคราะห์ที่เคยไร้ชีวิตชีวาในอดีต ปัจจุบันได้ถูกพัฒนาจนมีความสมจริงทั้งในด้านน้ำเสียงและอารมณ์เทียบเท่ามนุษย์ 

ดร.วินน์ วรวุฒิคุณชัย Founder & CEO และ กิตติ ชุมเกสรกูลกิจ Head of AI & Data Science สองผู้บริหารจาก Botnoi Group ร่วมกันนำเสนอวิสัยทัศน์และศักยภาพของเทคโนโลยี AI สัญชาติไทย ที่ไม่ได้หยุดอยู่แค่การสร้างเสียง แต่มุ่งมั่นที่จะสร้างเครื่องมือที่เข้าใจวัฒนธรรมและสร้างโอกาสใหม่ ๆ ให้กับสังคม

จากวิสัยทัศน์ สู่การสร้างชาติด้วย AI: เจาะลึกเส้นทาง ‘บอทน้อย’ และ ดร.วินน์ วรวุฒิคุณชัย

ความโดดเด่นที่สะท้อนถึงความเข้าใจในบริบทของสังคมไทยอย่างลึกซึ้ง คือความสามารถในการพัฒนา AI Voice ที่ลงรายละเอียดถึงระดับ “สำเนียงประจำจังหวัด” ซึ่งเป็นผลมาจากการรับฟังความคิดเห็นของผู้ใช้งานที่ชี้ว่าภาษาถิ่นเดียวกันอย่างภาษาอีสานก็ยังมีความแตกต่างกันในแต่ละพื้นที่ เช่น สำเนียงนครพนมและโคราช แนวคิดนี้จึงเป็นมากกว่าแค่ความก้าวหน้าทางเทคโนโลยี แต่ยังเป็นการเคารพความหลากหลายทางวัฒนธรรม และเป็นเครื่องยืนยันความตั้งใจในการพัฒนานวัตกรรมเพื่อคนไทยอย่างแท้จริง

เบื้องหลังความสามารถนี้คือรากฐานทางเทคโนโลยีที่พัฒนามาอย่างต่อเนื่อง จากยุคเริ่มต้นของเสียงสังเคราะห์ในระบบ GPS และ Siri สู่การมาถึงของเทคโนโลยีสำคัญอย่าง Neural Network ที่เลียนแบบการทำงานของสมองมนุษย์ และจุดเปลี่ยนที่สำคัญที่สุดคือ Transformer Architecture ซึ่งทำให้ AI สามารถเข้าใจ “บริบท” ของการสื่อสารได้อย่างซับซ้อน ประกอบกับเทคโนโลยี Vocoder หรือ “voice encoder” เป็นเทคโนโลยีที่ใช้ในการวิเคราะห์และสังเคราะห์เสียงมนุษย์ เพื่อสร้างเอฟเฟกต์เสียงที่หลากหลาย โดยเฉพาะอย่างยิ่งเสียงแบบหุ่นยนต์หรือเสียงที่ผิดเพี้ยนไปจากเสียงต้นฉบับ ที่ช่วยขัดเกลาเสียงให้มีความคมชัดและสมจริง ทำให้ผลลัพธ์ที่ได้มีความเป็นธรรมชาติอย่างยิ่ง

ด้วยศักยภาพทางเทคโนโลยีนี้ มุมมองของผู้คนต่อ AI จึงเริ่มเปลี่ยนไป จากความกังวลว่าจะเข้ามาทดแทนแรงงานมนุษย์กลายเป็นการมองเห็นโอกาสในการนำมาใช้เป็นเครื่องมือเสริมศักยภาพ ตัวอย่างที่ชัดเจนคือกรณีของ “เบลล์ ขอบสนาม” คอนเทนต์ครีเอเตอร์ชื่อดังที่มองเห็นแนวทางในการใช้ AI เสียงของตนเองเพื่อสร้างคอนเทนต์อัตโนมัติในปริมาณมหาศาล 

หรือแม้กระทั่งสร้างสรรค์เนื้อหาเฉพาะบุคคล (Personalize) เช่น การอวยพรวันเกิดให้แฟนคลับแต่ละคน ซึ่งเป็นสิ่งที่ทำได้ยากในเชิงปฏิบัติหากไม่มีเทคโนโลยีเข้ามาช่วยในภาคธุรกิจเอง เทคโนโลยี Voicebot ก็ได้เข้ามามีบทบาทในการช่วยเหลือผู้ประกอบการ SME ผ่านการสร้างระบบตอบรับโทรศัพท์อัตโนมัติ เช่น การรับจองห้องพักในโรงแรมซึ่งช่วยลดข้อจำกัดด้านบุคลากรและเพิ่มประสิทธิภาพในการบริการลูกค้า

ไม่เพียงเท่านั้น วิสัยทัศน์ดังกล่าวยังขยายไปสู่การสร้างผลกระทบเชิงบวกต่อสังคมในมิติอื่น ๆ ทั้งการเปิดให้ภาคการศึกษาสามารถเข้าถึงเทคโนโลยี AI Voice ได้โดยไม่มีค่าใช้จ่าย เพื่อนำไปพัฒนาสื่อการเรียนการสอนที่มีคุณภาพ และการนำเทคโนโลยีไปใช้เพื่อการอนุรักษ์วัฒนธรรมผ่านการเก็บรักษาภาษาและสำเนียงที่หายาก 

นอกจากนี้ Botnoi ยังได้นำเสนอภาพอนาคตของการสื่อสารไร้พรมแดน ผ่านเทคโนโลยีการแปลภาษาแบบเรียลไทม์ที่สามารถรักษาน้ำเสียงและอัตลักษณ์ของผู้พูดไว้ได้ 

“ลองจินตนาการถึงโลก Metaverse ที่เราสามารถพูดภาษาไทย แต่คู่สนทนาชาวต่างชาติจะได้ยินเป็นภาษาของเขาด้วยเสียงที่เป็นเอกลักษณ์ของเรา ซึ่งจะช่วยทลายกำแพงทางภาษาและเปิดประตูสู่การสื่อสารระดับโลกได้อย่างแท้จริง”

เป้าหมายสำคัญของ Botnoi คือการทำให้เทคโนโลยีที่ซับซ้อนนี้เป็นเรื่องง่ายและเข้าถึงได้สำหรับทุกคน ผ่านความร่วมมือกับแพลตฟอร์มอย่าง Canva ที่ช่วยให้ผู้ใช้งานทั่วไป แม้กระทั่งเด็ก ๆ ก็สามารถสร้างสรรค์ผลงานที่มีเสียงพากย์คุณภาพสูงได้ด้วยตนเอง 

สิ่งนี้คือบทสรุปที่ชัดเจนว่า AI Voice ในวิสัยทัศน์ของ Botnoi ไม่ใช่เพียงนวัตกรรมสำหรับคนกลุ่มใดกลุ่มหนึ่ง แต่เป็นเครื่องมืออันทรงพลังที่พร้อมจะสร้างโอกาสและขับเคลื่อนศักยภาพของคนไทยไปสู่ระดับสากล

ข่าวอื่น ๆ ที่น่าสนใจ

ธุรกิจไทยในสนามรบ AI: Demand คือหัวใจนำสู่ความสำเร็จ

เยาวชนไทยโชว์ผลงาน ‘Happy Gloves’ จับมือ UNIQLO ผลิต-ส่งมอบถุงมือแก่เด็กพิการทางสมอง

ผู้เขียน