ปัจจุบันเรื่อง “Big Data” หรือ “ข้อมูลขนาดใหญ่” กำลังเข้ามามีบทบาทในทุกอุตสาหกรรม เพราะข้อมูลต่างๆ ได้ถูกสร้างขึ้นอย่างมหาศาล สามารถนำไปต่อยอดเพื่อใช้ประโยชน์ได้ทั้งในส่วนของภาครัฐและเอกชน
สำหรับประเทศไทย กำลังเข้าสู่การเปลี่ยนผ่านสู่ยุคดิจิทัลที่ข้อมูลและปัญญาประดิษฐ์ หรือ AI เป็นเครื่องมือสนับสนุน ให้รัฐบาลได้ขับเคลื่อนนโยบายดิจิทัล อย่างบูรณาการกับหน่วยงานทุกภาคส่วน ผ่านการผลักดันแผนยุทธศาสตร์การใช้ประโยชน์จากข้อมูลขนาดใหญ่ เพื่อขับเคลื่อนเศรษฐกิจดิจิทัลของประเทศ
โดยมีสถาบันข้อมูลขนาดใหญ่ หรือ บีดีไอ(BDI) เป็นหน่วยงานที่มีบทบาทเป็นองค์กรรัฐในการขับเคลื่อนข้อมูลของประเทศ ให้เป็นรูปธรรม คือ การทำให้ข้อมูลจากทุกภาคส่วน ไม่เพียงแค่ถูกจัดเก็บอย่างมีระบบ แต่สามารถนำไปใช้งานได้จริง เป็นเครื่องมือในการกำหนดนโยบาย ยกระดับบริการสาธารณะ และพัฒนานวัตกรรมที่ตอบสนองต่อความต้องการของประชาชนได้อย่างแท้จริง

“ธีรณี อจลากุล” ผู้อำนวยการสถาบันข้อมูลขนาดใหญ่ หรือ บีดีไอ บอกว่า จัดตั้งขึ้นมาครบ 2 ปี ภายใต้ กระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม(ดีอี) การขับเคลื่อนประเทศไทยด้วย Big Data และ AI จะผ่าน 3 แกนหลัก คือ 1.แพลตฟอร์มการเชื่อมโยงและวิเคราะห์ข้อมูลขนาดใหญ่ (ดีทู) 2. ThaiLLM โครงสร้างพื้นฐาน AI ภาษาไทยแบบโอเพนซอร์ส และ 3.การพัฒนากำลังคนด้านข้อมูลและปัญญาประดิษฐ์ เพื่อสร้างกลไกในการขับเคลื่อนเศรษฐกิจ และสังคม พลิกโฉมหน่วยงานรัฐ สู่ระบบที่ใช้ข้อมูลอย่างมีประสิทธิภาพ
ผอ.บีดีไอ บอกถึงการพัฒนา โครงการ แพลตฟอร์มการเชื่อมโยงและวิเคราะห์ข้อมูลขนาดใหญ่ (ดีทู) (Data Integration and Intelligence Platform (D-II)) ว่า D-II ไม่ได้เป็นการสร้างระบบข้อมูลขึ้นมาใหม่ แต่ทำหน้าที่บูรณาการและเชื่อมโยงข้อมูลที่มีอยู่แล้วจากหลายภาคส่วนของหน่วยงานต่างๆ รวมถึงการให้บริการวิเคราะห์ข้อมูลบนแพลตฟอร์มโดยทีมนักวิทยาศาสตร์ข้อมูลของ บีดีไอ เพื่อสนับสนุนการวางแผนเชิงนโยบายที่มีประสิทธิภาพ และขับเคลื่อนประเทศไทยสู่การเป็น “Data-Driven Nation” อย่างแท้จริง
“เป้าหมายสูงสุดของโครงการนี้ คือ การใช้ประโยชน์จากข้อมูลเพื่อการพัฒนาเศรษฐกิจและสังคมที่ยั่งยืน ผ่านบริการสำคัญ อาทิ การสร้างถนนทางเทคโนโลยีของข้อมูล หรือ Data Linkage Engine เพื่อรองรับการเชื่อมโยงและใช้งานร่วมกับ D-II Data Catalog ระบบบัญชีข้อมูล และ D-II Analytics Services ทั้งที่มีอยู่แล้วในปัจจุบัน และที่จะเกิดขึ้นในอนาคต เพื่อให้เครือข่ายของถนนพร้อมรับการเชื่อมต่อกับระบบข้อมูลจากประตูของหน่วยงานฯ นอกจากนี้ยังมี Dashboard and Analytics Tools ซึ่งเป็นเครื่องมือที่ช่วยให้หน่วยงานต่าง ๆ สามารถวิเคราะห์ข้อมูลเชิงลึกและตัดสินใจบนพื้นฐานของข้อมูลจริงที่ถูกเชื่อมโยงเข้าสู่ระบบฯ รวมถึง Central Hashing กระบวนการแทนค่าข้อมูลสำคัญ โดยที่ไม่สามารถถอดรหัสหรือกระทำการใดๆ เพื่อที่จะกลับไปยังข้อมูลต้นฉบับได้หากไม่ได้รับอนุญาต เพื่อการปกป้องข้อมูลตามกฎหมายฯ”

ส่วนการพัฒนา “ ThaiLLM หรือ Thai Large Language Model “ ซึ่งเป็นโครงสร้างพื้นฐานปัญญาประดิษฐ์สำหรับภาษาไทย แบบ Open Source/Open License นั้น ทาง ผอ.บีดีไอ บอกว่า โครงการนี้ได้รับงบประมาณสนับสนุนจาก กองทุนพัฒนาดิจิทัลเพื่อเศรษฐกิจและสังคม(กองทุนดีอีฉ โดยทาง บีดีไอ ได้ร่วมมือกับ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) สถาบันวิทยสิริเมธี (VISTEC) สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) สมาคมปัญญาประดิษฐ์ประเทศไทย (AIAT) ThaiLLM
“โครงการนี้ถือเป็นจุดเริ่มต้นสำคัญของความร่วมมือกับหน่วยงานผู้นำด้าน AI ของประเทศไทย ที่รวมกันพัฒนาโครงสร้างพื้นฐาน AI ภาษาไทย ที่เข้าใจบริบทของภาษาและวัฒนธรรมไทย เพื่อให้ทั้งภาครัฐ ภาคเอกชน และนักเทคโนโลยี สามารถนำไปใช้งานและต่อยอดได้อย่างกว้างขวาง”
โดยปัจจุบันโครงการ ThaiLLM ดำเนินการมาแล้ว 3 เดือน สามารถรวบรวมข้อมูลภาษาไทยจากกระทรวงดีอี สำนักงานคณะกรรมการกฤษฎีกา และเอกสารที่หอสมุดแห่งชาติเป็นผู้ถือสิทธิ์ได้แล้วเสร็จ รวมถึงมีการพัฒนาและใช้งาน ThaiLLM Data Bank ซึ่งมีปริมาณข้อมูลภาษาไทยมากกว่า 245 GB และดำเนินการให้อยู่ในรูปแบบของโทเคนได้ประมาณ 55 ล้านล้านโทเคน หรือคิดเป็น 55% ของปริมาณเป้าหมายเพื่อทำการพัฒนาโมเดลขนาดเล็ก และขนาดกลางเบื้องต้น
ส่วนการพัฒนากำลังคนด้านข้อมูลและปัญญาประดิษฐ์ นั้น ทาง “ธีรณี อจลากุล” บอกว่า ได้มีการออกแบบร่างหลักสูตร เรียนรู้ด้าน AI และ LLM เพื่อเตรียมความพร้อมบุคลากรไทยให้สามารถเข้าใจ ออกแบบ และประยุกต์ใช้เทคโนโลยีเชิงลึกผ่านการเรียนรู้ที่สามารถนำไปปฏิบัติได้จริงในชีวิตประจำวัน โดยเน้นการเรียนการสอน และการประเมินทักษะแบบ Micro-Credentials เพื่อปูรากฐานให้เข้าใจถึงประโยชน์ของการนำข้อมูลมาวิเคราะห์ และสามารถนำความรู้ไปประยุกต์ใช้ให้สอดคล้องกับความเปลี่ยนแปลงของโลก

“โครงการนี้จะเป็นกลไกสำคัญในการส่งเสริมความร่วมมือด้านปัญญาประดิษฐ์ของประเทศไทย (Thai AI Collaboration) และสร้างระบบนิเวศ AI ของประเทศ (AI Ecosystem) ให้เข้มแข็งตามแนวทางการดำเนินงานที่กำหนดไว้ในที่ประชุมคณะกรรมการ AI แห่งชาติ หรือ บอร์ด AI แห่งชาติ ซึ่งจะสามารถช่วยให้ประเทศไทย ลดการพึ่งพาเทคโนโลยีจากต่างประเทศ และผลักดันให้ประเทศไทยก้าวขึ้นเป็นหนึ่งใน ผู้เล่นสำคัญในระดับภูมิภาคด้าน AI”
“ธีรณี อจลากุล” บอกอีกว่า ทาง บีดีไอยังให้ความสำคัญกับการออกแบบกลไกการแลกเปลี่ยนข้อมูลอย่างมีธรรมาภิบาล ซึ่งจะเป็นเครื่องมือหลักในการลดอุปสรรคด้านการแบ่งปันข้อมูลระหว่างหน่วยงานภาครัฐ และระหว่างรัฐกับเอกชน โดยมีกลไกกลางที่ชัดเจน มีมาตรฐานการรักษาความปลอดภัย และมีเอกสารแม่แบบรองรับการแลกเปลี่ยนข้อมูลอย่างมีธรรมาภิบาล (Data Governance)
สุดท้ายแล้วหวังว่า การขับเคลื่อน “Big Data” และ “AI” ผ่าน 3 แกนหลัก ดังกล่าว จะช่วยให้ประเทศไทยสามารถใช้ประโยชน์จากข้อมูลอย่างเต็มศักยภาพ สร้างความเปลี่ยนแปลงในการพัฒนาประเทศได้อย่างเป็นรูปธรรม
จิราวัฒน์ จารุพันธ์