ชีวิตติด TECH- มาทำความรู้จัก...“ThaiLLM” โมเดล AI ระดับชาติของไทย

กำลังกลายเป็นประเด็นที่ถูกพูดถึงอย่างกว้างขวางกับโครงการ TH-AI Passport ของกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม (ดีอี) ที่แจก AI เวอร์ชั่น Pro ให้กับคนไทย 5 ล้านสิทธิ์ ด้วยงบกว่า 1,600 ล้านบาท

โดยหลายฝ่ายมองถึงความคุ้มค่า และตั้งคำถามว่าทำไม? ไม่นำงบมาพัฒนา AI ของไทย หรือ “ThaiLLM” (Thai Large Language Model) ซึ่งจริงๆแล้ว การพัฒนา AI ภาษาไทยได้เริ่มพัฒนามาได้ระยะหนึ่งและได้เปิดให้นักพัฒนาและผู้สนใจเข้ามาทดลองใช้งานแพลตฟอร์ม ตั้งแต่ช่วงต้นปี 69 ที่ผ่านมา

ซึ่งการใช้งาน AI ของคนไทยในโครงการ TH-AI Passport ที่จะเกิดขึ้น ก็มีการวางแผนให้นำข้อมูลการใช้งาน รวบรวมมาเพื่อใช้ในการป้อนให้ระบบ “ThaiLLM” ได้เรียนรู้พฤติกรรมและภาษาไทยเชิงลึกด้วย เพื่อนำไปสู่การพัฒนา “ระบบอธิปไตยทางดิจิทัล” ของประเทศไทยให้ก้าวหน้าและรวดเร็วยิ่งขึ้น

วันนี้ทาง คอลัมน์ “ชีวิตติด TECH” ได้มีโอกาสคุยกับ “ธีรณี อจลากุล” ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ หรือ BDI ถึงโครงการ “ThaiLLM” โมเดลปัญญาประดิษฐ์ภาษาไทยระดับชาติที่กำลังเป็นกระแสพูดถึงอย่างในเวลานี้

โดยโครงการ “ThaiLLM” เป็นความร่วมมือระหว่าง สถาบันข้อมูลขนาดใหญ่ (BDI) , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC), สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT), สถาบันวิทยสิริเมธี (VISTEC), สมาคมปัญญาประดิษฐ์ประเทศไทย (AIAT), จุฬาลงกรณ์มหาวิทยาลัย และมหาวิทยาลัยมหิดล

ได้รับการสนับสนุนจากกองทุนพัฒนาดิจิทัลเพื่อเศรษฐกิจและสังคม (DEF) เพื่อสร้างกลไกในการพัฒนา Large Language Model สำหรับภาษาไทย โดยคนไทย เพื่อให้ประเทศไทยมีขีดความสามารถในการพัฒนาโมเดลภาษาขนาดใหญ่ที่เข้าใจภาษา วัฒนธรรม บริบท และความต้องการของสังคมไทย

“ธีรณี อจลากุล” บอกว่า โครงการ ThaiLLM ถูกวางโครงสร้างให้เป็นระบบนิเวศ AI ภาษาไทยที่เปิดกว้าง มีความน่าเชื่อถือสูง และทุกคนสามารถเข้าถึงได้ โดยมีหมุดหมายสำคัญคือ การช่วยลดต้นทุนและระยะเวลาในการพัฒนาเทคโนโลยี AI ของคนไทย ช่วยเพิ่มอำนาจอธิปไตยทางข้อมูลให้กับประเทศ เปิดโอกาสให้ภาคประชาชนและภาคธุรกิจไทยสามารถหยิบจับเทคโนโลยีล้ำสมัยนี้ไปใช้งานได้ง่ายขึ้น และยกระดับความสามารถในการแข่งขันของประเทศไทยบนเวทีโลก

แกนหลักของโครงการนี้เริ่มต้นจากการสร้าง AI-Ready Data Bank หรือคลังข้อมูลภาษาไทยที่พร้อมใช้งาน ซึ่งเป็นการรวบรวมข้อมูลดิบจากภาครัฐ เอกชน ข้อมูลสาธารณะ รวมถึงกลุ่มนักพัฒนาโอเพนซอร์ส มารวมกันเพื่อใช้เป็นฐานรากในการพัฒนาโมเดลภาษาไทยให้มีความแม่นยำและเข้าใจบริบทความเป็นไทยมากที่สุด ก่อนจะต่อยอดความสำเร็จออกมาเป็นโมเดลพื้นฐานอย่าง ThaiLLM-8B และ ThaiLLM-30B ซึ่งเป็น Foundation Model ภาษาไทยประเภท Open-weight ที่เปิดกว้างให้ผู้มีความสามารถทางเทคนิคสามารถดาวน์โหลดไปใช้งาน ปรับแต่ง หรือพัฒนาเป็นโมเดลเฉพาะทางต่อยอดได้ทันที

“โครงการ ThaiLLM ก็ไม่ได้ถูกออกแบบมาเพื่อให้หน่วยงานภาครัฐเพียงฝ่ายเดียว แต่รองรับผู้ใช้หลักถึง 4 กลุ่มในระบบนิเวศ ได้แก่ องค์กรธุรกิจขนาดใหญ่ ที่ต้องการสร้างผลิตภัณฑ์อัจฉริยะและเพิ่มประสิทธิภาพการทำงานภายใน, กลุ่มสตาร์ตอัปและเอสเอ็มอี ที่ต้องการลดต้นทุนมหาศาลในการเข้าถึงข้อมูลและโมเดลระดับโลก, กลุ่มนักพัฒนาและนักศึกษา ที่ต้องการพื้นที่ปลอดภัยในการเรียนรู้ ทดลอง และสร้างนวัตกรรมต้นแบบผ่านระบบ ThaiLLM Playground ซึ่งปัจจุบันมีผู้เข้ามาทดลองใช้งานทะลุ 10,121 คนไปแล้ว และกลุ่มสุดท้ายคือ หน่วยงานภาครัฐ ที่ต้องการยกระดับการให้บริการประชาชนและการตัดสินใจเชิงนโยบายด้วยฐานข้อมูลที่แม่นยำ”

ในมุมนี้ ThaiLLM จึงทำหน้าที่เป็น “ฐานกลาง” ที่ทุกภาคส่วนสามารถนำไปต่อยอดใช้ประโยชน์ได้จริง ตั้งแต่ระบบแชทบอทอัจฉริยะ ระบบสรุปเนื้อหาเอกสาร ระบบแปลภาษา ระบบตอบคำถามอัตโนมัติจากฐานข้อมูล ไปจนถึงการช่วยเขียนโค้ดคอมพิวเตอร์หรือวิเคราะห์ข้อมูลเฉพาะทาง

“ธีรณี อจลากุล” บอกต่อว่า ทาง BDI ได้มองประเด็นเรื่อง Sovereign AI หรือ อธิปไตยทางปัญญาประดิษฐ์ โดยยอมรับว่า ประเทศไทยยังไม่มีศักยภาพพอที่จะเป็นเจ้าของเทคโนโลยี AI ได้ครบทุกชั้น (Layers) โดยเฉพาะในส่วนของชิปประมวลผลกราฟิก (GPU) และระบบคลาวด์ประมวลผลขนาดใหญ่ ซึ่งเป็นส่วนที่ต้องใช้เงินลงทุนมหาศาล ในเทคโนโลยีขั้นสูง และพึ่งพาระบบนิเวศระดับโลก ดังนั้น เป้าหมายที่ทำได้จริงและจับต้องได้ในระยะแรก คือการทำให้ประเทศไทยมีคลังข้อมูลภาษาไทย มีโมเดลภาษาไทย และมีเครื่องมือกลางที่สามารถนำไปต่อยอดได้จริง เพื่อลดการเริ่มต้นจากศูนย์และลดการพึ่งพาโมเดลจากค่ายเทคโนโลยียักษ์ใหญ่ต่างชาติทั้งหมด

“ ตอนนี้บริการด้านดิจิทัลระดับโลกจำนวนมากมักจะเริ่มต้นด้วยกลยุทธ์ตั้งราคาบริการที่ต่ำมาก หรือเปิดให้ใช้ฟรีในช่วงแรก เพื่อเร่งดึงดูดผู้ใช้งาน และสร้างสภาวะ “การเสพติดพึ่งพา” แต่คนใช้งานติดแล้ว ก็มีอำนาจในการขึ้นราคาได้ เช่นเดียวกับ AI ที่ราคาที่ให้บริการอยู่ทุกวันนี้ เป็นราคาที่ถูกกว่าราคาจริง หรือต้นทุนหลายเท่า เมื่อคนใช้จนเคยชิน แพลตฟอร์มก็จะขึ้นราคาได้ตามต้องการ คนใช้ ก็จำเป็นต้องจ่ายราคาสูงขึ้น แบบปฎิเสธไม่ได้”

ดังนั้น หากรัฐและเอกชนไทยพึ่งพาโมเดล AI ต่างชาติมากเกินไป โดยไม่มีโมเดลภาษาไทยหรือโครงสร้างพื้นฐานของตัวเองไว้เป็นทางเลือกสำรอง ประเทศไทยอาจไม่ได้เสี่ยงแค่เรื่องภัยความมั่นคงจากข้อมูลรั่วไหลออกนอกประเทศเท่านั้น แต่ยังเสี่ยงต่อการถูก “ล็อกค่าบริการ” ในอนาคต ในวันที่บริการ AI กลายเป็นสิ่งจำเป็นขั้นพื้นฐานของทุกองค์กร และราคาที่เห็นว่าถูกในวันนี้ อาจกลายเป็นภาระค่าใช้จ่ายก้อนโตที่ปฏิเสธไม่ได้ในวันข้างหน้า

“ธีรณี อจลากุล” บอกว่า สำหรับภาคธุรกิจในปัจจุบัน ThaiLLM ได้เปิดทางเลือกในการใช้งานไว้ 2 รูปแบบหลักๆ คือ Fine-tune & Self-host สำหรับองค์กรธุรกิจที่ต้องการควบคุมความปลอดภัยของข้อมูลอย่างเบ็ดเสร็จและปรับแต่งโมเดลให้เข้ากับหน้างานเฉพาะทาง เช่น งานสรุปเอกสารภายในองค์กร หรือบริการที่เกี่ยวข้องกับข้อมูลที่มีความอ่อนไหวสูง และรูปแบบ Build Applications via API สำหรับองค์กรที่ต้องการพัฒนาแอปพลิเคชัน AI อย่างรวดเร็วทันใจ โดยไม่ต้องควักกระเป๋าลงทุนในโครงสร้างพื้นฐานขนาดใหญ่ด้วยตัวเอง

ThaiLLM ยังถูกนำไปต่อยอดเป็นโมเดลเฉพาะทางในหลายๆ ด้าน โดยได้พยายามสร้างระบบนิเวศที่เปิดกว้างให้คนไทยเข้ามามีส่วนร่วม เช่น ความร่วมมือระหว่าง VISTEC และโรงพยาบาลศิริราช ในการนำ Foundation Model ของ ThaiLLM ไปปรับแต่ง (Fine-tune) เพื่อใช้สนับสนุนบริการทางการแพทย์ ช่วยซักประวัติ คัดกรองอาการเบื้องต้น และประเมินระดับความเร่งด่วนในการเข้าพบแพทย์ แต่ยังอยู่ภายใต้การกำกับของผู้เชี่ยวชาญ เพราะข้อมูลสุขภาพเป็นข้อมูลอ่อนไหว

นอกจากด้านการแพทย์แล้ว ยังมีโอกาสขยายผลไปสู่งานกฎหมาย งานศาล และงานราชการที่ต้องจมอยู่กับกองเอกสารจัดซื้อจัดจ้างจำนวนมหาศาล ซึ่งล้วนต้องการ AI ที่เข้าใจภาษาไทยขั้นสูงและอ้างอิงแหล่งข้อมูลได้อย่างถูกต้อง แม่นยำ

อย่างไรก็ตามอย่างที่บอกว่า การพัฒนา AI จำเป็นต้องพึ่งพา GPU Cloud และศูนย์ดาต้าเซ็นเตอร์ แต่ไทยมีศักยภาพเพียงพอหรือไม่? ในมุมมองนี้ ทาง“ธีรณี อจลากุล” บอกว่า บริษัท โทรคมนาคมแห่งชาติ จำกัด (มหาชน) หรือ NT ที่เป็นผู้พัฒนาโครงสร้างพื้นฐานของประเทศ สามารถจะเป็นแกนหลักสร้างโครงสร้างพื้นฐาน AI กลางของภาครัฐ ทั้งดาต้าเซ็นเตอร์ประสิทธิภาพสูงและระบบคลาวด์ประมวลผล เพื่อให้หน่วยงานรัฐสามารถแชร์ใช้บริการร่วมกัน ลดความซ้ำซ้อนในการจัดซื้อจัดเช่าระบบจากต่างชาติได้

แต่โจทย์นี้ก็ไม่ใช่เรื่องง่าย เพราะเทคโนโลยีด้าน GPU เปลี่ยนแปลงเร็วมาก หากรัฐลงทุนช้าอุปกรณ์อาจตกรุ่น หรือหากลงทุนน้อยเกินไปก็จะไม่พอกับการใช้งานจริง อีกทั้งดาต้าเซ็นเตอร์ AI ยังเป็นระบบที่กินพลังงานไฟฟ้าและใช้น้ำในการระบายความร้อนสูงมาก รัฐจึงต้องวางแผนเรื่องพลังงานสะอาดควบคู่ไปด้วย

ขณะที่ในเชิงนโยบาย “คณะกรรมการ AI แห่งชาติ” จำเป็นต้องกำกับทิศทางและนโยบาย โดยมีกระทรวงดีอีและกระทรวง อว. ร่วมกันผลักดันข้อเสนอเต่อรัฐบาล ทั้งการเร่งวางแผนลงทุนโครงสร้างพื้นฐาน AI ระดับชาติให้ชัดเจน ควบคู่ไปกับการเร่งสร้าง “บุคลากรสายเทค” เช่น AI Engineer, Cloud Engineer ที่ไทยยังขาดแคลนอยู่มาก

สุดท้ายแล้ว การที่ประเทศไทยมีคลังข้อมูล มีโมเดลภาษาไทย มีโครงสร้างพื้นฐาน และมี “คนไทย” ที่เก่งพอจะดูแลและกำหนดอนาคตทางเทคโนโลยีได้ด้วยตัวเอง จึงเป็นแนวทางที่ต้องเร่งส่งเสริมให้เกิดขึ้นโดยเร็ว.

Cyber Daily

ข่าวยอดนิยมในหมวดหมู่

ข่าวล่าสุด

ข่าว

บันเทิง

กีฬา

เศรษฐกิจ

ต่างประเทศ

บทความ

ไลฟ์สไตล์

ท่องเที่ยว-ที่พัก

หวย

ดวง-มูเตลู

PEOPLE

ติดตามเราได้ที่