ในยุคที่เทคโนโลยีปัญญาประเดิษฐ์ หรือ AI ได้กลายเป็นเครื่องมือที่ช่วยยกระะดับการใช้ชีวิตของคนไทย ไม่ว่าจะเป็นเรื่องเรียนหรือการทำงาน
แต่ปัจจุบัน AI ที่คนไทยใช้ล้วนเป็นเทคโนโลยีจากต่างชาติทั้งหมด การวางรากฐานโครงสร้างพื้นฐานด้านปัญญาประดิษฐ์ของประเทศ เพื่อลดการพึ่งพิงต่างประเทศ ด้วยการสร้างโมเดล AI ของไทย จึงเป็นสิ่งจำเป็น
โดยเฉพาะเรื่อง “AI Sovereignty” หรือ อธิปไตยทางปัญญาประดิษฐ์ ที่ประเทศสามารถสร้าง พัฒนา และกำกับดูแล เอไอ ของตนเอง โดยไม่ต้องพึ่งพาเทคโนโลยีจากต่างชาติเพียงอย่างเดียว ถูกหยิบยกมาพูดถึงกันอย่างมากในช่วงที่ผ่านมา
ปัจจุบันประเทศไทย ได้เริ่มสร้างโมเดล AI ของไทย มาระยะหนึ่งแล้ว ซึ่งก็คือโครงการ “ThaiLLM” เป็นความร่วมมือระหว่าง สถาบันข้อมูลขนาดใหญ่ (BDI) , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC), สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT), สถาบันวิทยสิริเมธี (VISTEC), สมาคมปัญญาประดิษฐ์ประเทศไทย (AIAT), จุฬาลงกรณ์มหาวิทยาลัย และมหาวิทยาลัยมหิดล

โดยโครงการนี้ได้รับการสนับสนุนจากกองทุนพัฒนาดิจิทัลเพื่อเศรษฐกิจและสังคม (DEF) เพื่อสร้างกลไกในการพัฒนา Large Language Model สำหรับภาษาไทย โดยคนไทย เพื่อให้ประเทศไทยมีขีดความสามารถในการพัฒนาโมเดลภาษาขนาดใหญ่ที่เข้าใจภาษา วัฒนธรรม บริบท และความต้องการของสังคมไทยอย่างแท้จริง
“พชร อนันตศิลป์” ปลัดกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม (ดีอี) บอกว่า กระทรวงดีอี ให้ความสำคัญกับการวางรากฐานด้าน AI ของประเทศ ไม่ใช่เพียงการนำเทคโนโลยีมาใช้ แต่รวมถึงการสร้างขีดความสามารถที่ประเทศเป็นเจ้าของ เพื่อให้ประเทศไทยสามารถกำหนดทิศทางการพัฒนา AI ได้ด้วยตนเอง ไม่ใช่เพียง “ผู้รับเทคโนโลยี” จากภายนอก ซึ่งเทคโนโลยีประเภท Large Language Model หรือ LLM มีบทบาทเพิ่มขึ้นอย่างต่อเนื่อง แต่การจะใช้ประโยชน์จากเทคโนโลยีนี้อย่างเต็มศักยภาพ ไม่ใช่เพียงเรื่องของการเข้าถึงเครื่องมือ แต่เป็นเรื่องของ “ความเข้าใจ” ในภาษาที่ใช้จริงในบริบทเฉพาะของสังคมไทย และในวิธีที่คนไทยสื่อสารกัน ซึ่งเป็นสิ่งที่โมเดลจากต่างประเทศยังไม่สามารถตอบโจทย์ได้อย่างเพียงพอ
“เป้าหมายของ ThaiLLM ไม่ใช่การสร้าง “โมเดลทางภาษาอีกโมเดลหนึ่ง” เพื่อแข่งขันกับเทคโนโลยีระดับโลก แต่เป็นการสร้าง “โครงสร้างพื้นฐานด้าน AI ของประเทศ” โดยการพัฒนาครอบคลุมตั้งแต่ข้อมูลภาษาไทยคุณภาพสูง โมเดลที่เข้าใจบริบทสังคมไทย ไปจนถึงแพลตฟอร์ม ThaiLLM Playground ที่เปิดให้ประชาชนและนักพัฒนาเข้าถึงโดยไม่เสียค่าใช้จ่าย รวมถึงการเร่งพัฒนาบุคลากรด้าน AI เพื่อสร้างความได้เปรียบทางการแข่งขัน และลดการพึ่งพาเทคโนโลยีจากต่างประเทศในระยะยาว คือการวางรากฐาน “อธิปไตยทางเทคโนโลยี AI” ของประเทศไทย ไม่ใช่การทดแทนเทคโนโลยีจากภายนอก แต่เป็นการเสริมศักยภาพให้ประเทศมีทางเลือก มีความสามารถในการกำหนดเงื่อนไขของตนเอง และมีรากฐานให้การพัฒนาด้าน AI เป็นไปได้อย่างยั่งยืน”

ขณะที่ทางหน่วยงานอย่าง “บีดีไอ” ภายใต้กระทรวงดีอี ซึ่งเป็นหน่วยงานกลางบูรณาการความร่วมมือ และร่วมวางมาตรฐานการพัฒนา AI ภาษาไทย ในโครงการนี้
ทางผู้บริหารหน่วยงาน คือ “ธีรณี อจลากุล” ผู้อำนวยการ บีดีไอ บอกว่า ปัจจุบัน AI กลายเป็นส่วนหนึ่งในชีวิตของคนไทย แต่ข้อมูลส่วนใหญ่ที่ AI ใช้ฝึกฝนนั้นมาจากอินเทอร์เน็ต ซึ่งจากสถิติแล้วมีข้อมูลภาษาอังกฤษจำนวนมหาศาล คิดเป็นสัดส่วนมากกว่า 40% ของข้อมูลทั้งหมด ขณะที่ข้อมูลภาษาไทยมีสัดส่วนเพียง 0.4% เท่านั้น ซึ่งถือว่ามีจำนวนน้อยมาก การนำข้อมูลเหล่านี้มาใช้งานจึงอาจทำให้ไม่สามารถสะท้อนบริบทของไทยได้อย่างครบถ้วน ทำให้ประเทศไทยขาดโมเดลภาษาที่ “เข้าใจบริบท” ของคนไทยอย่างแท้จริง การพัฒนา ThaiLLM ไม่ได้เป็นเพียงการสร้างโมเดลภาษา แต่เป็นภารกิจของประเทศในการวาง “โครงสร้างพื้นฐานปัญญาประดิษฐ์ด้านภาษา” เพื่อให้ประเทศไทยสามารถพัฒนาและใช้งาน AI ได้อย่างสอดคล้องกับบริบทของตนเอง
“ปัจจุบัน ThaiLLM ได้ก้าวไปอีกขั้นด้วยการเปิดตัว “ThaiLLM Playground” พื้นที่กลางบนเว็บสำหรับทดลองใช้งานโมเดลภาษาไทย ที่ช่วยให้ทั้งนักพัฒนา นักวิจัย และผู้ที่สนใจ สามารถเข้ามาทดสอบ เปรียบเทียบผลลัพธ์ และต่อยอดแนวคิดการใช้งานได้ทันที โดยไม่จำเป็นต้องจัดเตรียมทรัพยากรด้านโครงสร้างพื้นฐาน หรือระบบคำนวณด้วยตนเองในระยะเริ่มต้น”

สำหรับภายใน ThaiLLM Playground ได้รวบรวมโมเดลภาษาไทยที่พัฒนาต่อยอดจาก ThaiLLM foundation model โดยความร่วมมือจากหลายภาคส่วนใน ecosystem อาทิ PathummaLLM (NECTEC), THaLLE (KBTG), Typhoon (SCB DataX) และ OpenThaiGPT (AIEAT) ซึ่งสะท้อนแนวคิดและแนวทางการพัฒนา AI ภาษาไทยที่หลากหลาย ทำให้แพลตฟอร์มนี้ไม่เพียงเป็นพื้นที่ทดลองเทคโนโลยี แต่ยังเป็นกลไกสำคัญในการเปิดโอกาสให้ ecosystem ของ AI ภาษาไทยได้เรียนรู้ร่วมกัน และเร่งการพัฒนาให้สามารถนำไปใช้งานได้จริงในระดับประเทศอย่างเป็นรูปธรรม
โครงการ ThaiLLM มีการพัฒนา Foundation Model ThaiLLM ขนาด 8B และ ขนาด 30B ในลักษณะ open license และ open-weight ที่นักพัฒนาสามารถดาวน์โหลดไปใช้พัฒนาต่อยอดเป็น Fine-tuned Model เฉพาะทาง โดยใช้ข้อมูลสาธารณะ และจากความร่วมมือจากภาคส่วนต่าง ๆ ทั้งจากภาครัฐและเอกชน ซึ่งเป็นข้อมูลที่เกี่ยวข้องกับกฎหมาย ข้อมูลวิจัย และข้อมูลข่าวสารในบริบทไทย

โครงการยังได้มีการทดลองต่อยอดโมเดลที่ถูกพัฒนาขึ้นในบริบทการแพทย์ ทั้งการพัฒนาโมเดลเฉพาะทาง และแชทบอทช่วยคัดกรองอาการและให้คำแนะนำเบื้องต้น นอกจากนี้ ทางโครงการได้มีการสร้างความร่วมมือกับหลายภาคส่วนเพื่อทดลองพัฒนาโมเดลภาษาไทยต่อยอดจาก ThaiLLM foundation model ในบริบทต่าง ๆ และได้มีการพัฒนาแพลตฟอร์ม ThaiLLM Playground ให้บริการโมเดลเหล่านี้ ทั้งในรูปแบบ API สำหรับนักพัฒนาและ Chat Sandbox สำหรับทดลองใช้งานในรูปบทสนทนา โดยแพลตฟอร์ดังกล่าวได้รับการสนับสนุนด้านโครงสร้างพื้นฐาน ทั้งทรัพยากรคำนวณสำหรับการพัฒนาและให้บริการแพลตฟอร์มจาก NT และ บริษัท SIAM.AI CLOUD

“ปัจจุบันมีนักพัฒนาและผู้สนใจเข้ามาทดลองใช้งานแพลตฟอร์ม ThaiLLM Playground แล้วกว่า 8,000 ราย ตั้งแต่ช่วงต้นปี 69 ซึ่งสะท้อนถึงความสนใจในการทดลองต่อยอด AI ไทยในบริบทเฉพาะที่หลากหลาย การมีทรัพยากรข้อมูลภาษาไทยที่ประชาชนสามารถเข้าถึงได้ การมีเครื่องมือและทรัพยากรด้านปัญญาประดิษฐ์ที่ส่งเสริมการใช้งานในบริบทไทย และการมีบุคลากรพร้อมด้วยทักษะและความสนใจในการพัฒนาปัญญาประดิษฐ์นี้ เป็นรากฐานสำคัญในด้าน AI Sovereignty มุ่งให้ประเทศไทยสามารถพัฒนา ควบคุม และใช้ประโยชน์จาก AI ได้ด้วยตนเอง บนฐานข้อมูลภาษาไทยที่มีคุณภาพและเข้าใจบริบทของประเทศ”
สุดท้ายผู้บริหาร บีดีอี บอกว่า โครงการ ThaiLLM ถือว่าเป็นจุดเริ่มต้นที่น่าพึงพอใจ ความสำเร็จที่เกิดขึ้นเป็นผลจากความร่วมมือของภาครัฐ เอกชน และภาคการศึกษา ที่ร่วมกันสร้างกลไกขับเคลื่อน AI Sovereignty เพื่อลดการพึ่งพาเทคโนโลยีต่างชาติ
พร้อมยกระดับขีดความสามารถทางการแข่งขัน และสร้างโอกาสใหม่ทางเศรษฐกิจและสังคมให้กับประเทศไทยต่อไป.
Cyber Daily



