การวิเคราะห์แนวโน้มเทคโนโลยีในปี 2567 ของ เวอร์เนอร์ โวเกลส์ (Werner Vogels) ซีทีโอของบริษัท Amazon ได้คาดการณ์ไว้ว่า Generative AI จะสามารถรับรู้ด้านวัฒนธรรมมากขึ้น โดยการเทรนโมเดลภาษาขนาดใหญ่ (Large language models: LLM) ซึ่งเป็นแขนงหนึ่งในหมวดหมู่ของเทคโนโลยีปัญญาประดิษฐ์ (Artificial intelligence: AI) ด้วยข้อมูลที่หลากหลาย จึงนำไปสู่ผลลัพธ์ที่ลึกซึ้งและแม่นยำยิ่งขึ้น เป้าหมายหลักคือการทำให้ Generative AI เข้าถึงผู้คนหลากหลายกลุ่มและเป็นประโยชน์แก่ผู้ใช้ทั่วโลก

อย่างไรก็ตาม LLM นั้นพึ่งพาข้อมูลที่ได้รับจากอินเทอร์เน็ต ซึ่งส่วนใหญ่มักเป็นในรูปแบบภาษาและอักษรที่ถูกใช้จำนวนมาก อย่างเช่นภาษาอังกฤษ ที่มีข้อมูลสำหรับการประมวลผลภาษาธรรมชาติ (Natural language processing: NLP) อยู่มากมาย สิ่งสำคัญที่องค์กรต่างๆ มองข้ามไม่ได้คือความสามารถในการดัดแปลง LLM ด้วยข้อมูลและภาษาท้องถิ่น เพื่อส่งเสริมความมีส่วนร่วมในสังคม กระตุ้นการเติบโตทางเศรษฐกิจด้วยการเปิดตลาดใหม่ๆ และสร้างประสบการณ์ที่ดียิ่งขึ้นให้กับประชาชน

วัฒนธรรมมีผลในทุกๆ อย่าง นี่เป็นสิ่งมีผลให้ AI สิงค์โปร์ (AI Singapore: AISG) ซึ่งเป็นโครงการของภาครัฐริเริ่มโดยมูลนิธิเพื่อการวิจัยแห่งชาติของสิงค์โปร์ (National Research Foundation) เพื่อเสริมสร้างศักยภาพของประเทศในด้าน AI และทำให้ LLM มีความแม่นยำตรงกับบริบททางวัฒนธรรมของแต่ละประเทศมากยิ่งขึ้น โดยเฉพาะสำหรับประเทศในภูมิภาคเอเชียตะวันออกเฉียงใต้

โครงการ SEA-LION – โครงการแรกสำหรับภูมิภาค

ต่อยอดจากโครงสร้างพื้นฐานของ AWS ที่มีความยืดหยุ่นในการปรับขนาดได้อย่างง่ายดาย AISG ได้พัฒนา SEA-LION ซึ่งเป็นโครงการด้าน LLM ที่ถูกเทรนและรับคำสั่งเฉพาะเจาะจงสำหรับภาษาและวัฒนธรรมจากประเทศในเอเชียตะวันออกเฉียงใต้ (การเทรนล่วงหน้าและรับคำสั่งแบบ instruct-tuned เป็นวิธีการที่ช่วยให้สามารถควบคุมพฤติกรรม LLM ได้ดียิ่งขึ้น) โครงการแรกในภูมิภาค SEA-LION ยังทำหน้าที่เป็นรากฐานสำหรับโครงการ National Multimodal LLM ของสิงคโปร์ ซึ่งมีส่วนสนับสนุนในการวิจัยและนวัตกรรมด้าน AI ของประเทศอีกด้วย โครงการนี้เป็นส่วนหนึ่งของ National AI Strategy 2.0 ซึ่งเป็นแผนการใช้เทคโนโลยี AI ในสิงคโปร์ให้ลึกซึ้งยิ่งขึ้น

โมเดลนี้จะมุ่งเน้นไปที่ภาษาที่มีการใช้งานอย่างแพร่หลายในเอเชียตะวันออกเฉียงใต้ เช่น บาฮาซาอินโดนีเซีย บาฮาซามลายู ไทย และเวียดนาม และในระยะยาวจะถูกขยายไปยังภาษาอื่นๆ ในเอเชียตะวันออกเฉียงใต้เข้ามา เช่น เมียนมาและลาว

การสร้าง LLM ที่ครอบคลุมหลายประเทศในระดับภูมิภาคนั้นต้องใช้ข้อมูลเชิงลึก และเจาะจง กับท้องถิ่นในภาษาที่เกี่ยวข้องอีกด้วย ตัวอย่างของความแตกต่างทางภาษาท้องถิ่นคือคำว่า “LOL” (คำย่อของ “laughing out loud” ในภาษาอังกฤษ) ในประเทศไทยคนมักใช้ “55555” ในขณะที่ชาวอินโดนีเซียมักใช้ “wkwkwk” LLM ที่ได้รับการเทรนด้วยข้อมูลที่หลากหลายทางวัฒนธรรม เช่น SEA-LION ช่วยเพิ่มความสามารถของแอปพลิเคชัน Generative AI ให้เข้าใจแง่มุมที่ละเอียดอ่อน เหมาะแก่ประสบการณ์ใช้งานของมนุษย์ อีกทั้งยังสามารถเข้าใจความซับซ้อนทางสังคมที่อาจเป็นอุปสรรคอีกด้วย

เร่งพัฒนา Generative AI แบบเจาะจงในแต่ละท้องถิ่น (Hyper-local)

SEA-LION พร้อมใช้งานแล้วบน Amazon SageMaker JumpStart รวมทั้งโมเดลที่ได้รับการเทรนล่วงหน้า (pre-trained models) และเปิดให้ใช้งานแบบสาธารณะ เพื่อช่วยลูกค้าทั่วโลกในการเริ่มต้นใช้งานกับแมชชีนเลิร์นนิง (ML) โมเดล SEA-LION ที่ได้เปิดตัวไปแล้วมีขนาดที่ค่อนข้างเล็กด้วยพารามิเตอร์ขนาด 3 พันล้านและ 7 พันล้าน และได้รับการเทรนโดยใช้ Amazon EC2 ซึ่งเป็นบริการที่ให้ความสามารถในการประมวลผลที่ปรับขนาดได้บนคลาวด์ โมเดลรุ่นเล็กๆ เหล่านี้มีความยืดหยุ่นและเข้าถึงได้ง่ายกว่า LLM ที่ใช้กันทั่วไปในตลาดปัจจุบัน ซึ่งโดยปกติแล้วจะมีขนาดหลายแสนล้านพารามิเตอร์

ในช่วงปลายเดือนมกราคม 2567 AISG ได้ทำการเปิดตัวโมเดล SEA-LION เชิงพาณิชย์ ด้วยพารามิเตอร์เพื่อรองรับการปรับแต่งคำสั่งและจะมีความสามารถมากขึ้นในการจับความแตกต่างทางภาษาในเอเชียตะวันออกเฉียงใต้ รวมไปถึงปรับปรุงความเข้าใจในบริบทต่าง ๆ พัฒนาการใช้เหตุผลในหลายภาษา และสร้างผลลัพธ์ที่มีบริบทมากยิ่งขึ้น

ML และการประมวลผลที่คุ้มค่า

การสร้าง การเทรน และการใช้งาน LLM ต้องใช้เวลา ทรัพยากรการประมวลผลจำนวนมาก และความเชี่ยวชาญ AISG จึงได้ร่วมมือกับ AWS เพื่อจัดการกับความท้าทายเหล่านี้ โดยการใช้ประสิทธิภาพอันทรงพลังของคลาวด์สำหรับงานต่าง ๆ เช่น การเทรน ML และการประมวลผลประสิทธิภาพสูงโดยใช้ NVIDIA A100 Tensor Core GPU ซึ่งมอบผลลัพธ์ระดับสูงสุดพร้อมเครือข่ายที่รวดเร็วและตอบสนองไว

ขนาดที่กะทัดรัดของ SEA-LION ทำให้มีความคุ้มค่าและประสิทธิภาพมากกว่า LLM ขนาดใหญ่ ที่มีพารามิเตอร์มากกว่าหลายร้อยเท่า LLM ขนาดเล็กช่วยให้นักพัฒนาสามารถใช้งานได้เร็วขึ้น ปรับแต่งได้ในราคาที่ถูกกว่า และดำเนินการได้รวดเร็วยิ่งขึ้นในระหว่างการเทรน ความง่ายในการปรับใช้ LLM ขนาดเล็กบนอุปกรณ์เคลื่อนที่หรือที่ Edge ยังช่วยให้ธุรกิจต่าง ๆ สามารถนำมาใช้และสร้างแอปพลิเคชันได้ง่ายขึ้นอีกด้วย

เอลซี่ ตัน ผู้จัดการประจำประเทศสิงคโปร์ ฝ่ายภาครัฐทั่วโลก ที่ AWS กล่าวว่า “LLM ที่มีความเฉพาะด้านภาษาและวัฒนธรรม เช่น SEA-LION ของ AISG จะช่วยให้การสื่อสารและความเข้าใจระหว่างวัฒนธรรมราบรื่นยิ่งขึ้น และช่วยให้ภาครัฐและธุรกิจสามารถให้บริการประชาชนและลูกค้าในเอเชียตะวันออกเฉียงใต้ได้ดีขึ้น