หอสมุดแห่งชาติสวีเดน สอน AI ให้เข้าใจภาษาสมัยไวกิ้ง

15 views
September 18, 2023

หอสมุดแห่งชาติสวีเดนเก็บรวบรวมสิ่งพิมพ์และเอกสารดิจิทัลไว้กว่า 18 ล้านรายการ ต้นฉบับเก่าแก่ที่สุดมีอายุราวศตวรรษที่ 9-11 หรือในสมัยไวกิ้ง ทรัพยากรเหล่านี้เป็นสิ่งทรงคุณค่าทางประวัติศาสตร์ ทว่ายังมีข้อจำกัดในการเข้าถึงเพื่อศึกษาค้นคว้าทางวิชาการ หอสมุดจึงพัฒนา AI เพื่อช่วยให้การสืบค้นและนำสารสนเทศไปใช้ประโยชน์สะดวกและกว้างขวางยิ่งขึ้น

หนึ่งในความสำเร็จในการพัฒนา AI ของหอสมุดแห่งชาติสวีเดน คือ Swedish Language Models (SweLL) ซึ่งใช้ระบบคอมพิวเตอร์ที่เรียนรู้เองได้ (Machine Learning) ในการประมวลผลข้อความ โมเดลนี้เข้าใจรูปแบบและไวยากรณ์ภาษาสวีดิชซึ่งมีความหลากหลาย ทั้งภาษาเก่าแก่นับพันปี ภาษาถิ่นแต่ละภูมิภาค ภาษาที่เป็นทางการและไม่เป็นทางการ SweLL ยังสามารถดัดแปลงเอกสารโบราณที่เขียนขึ้นด้วยลายมือให้กลายเป็นข้อความดิจิทัล แก้ไขข้อผิดพลาดในการสะกดคำ รวมทั้งสามารถสร้างแท็กและจัดหมวดหมู่ข้อความอัตโนมัติ ตามหัวข้อ ช่วงเวลา และผู้แต่ง

AI โมเดลดังกล่าวถูกพัฒนาขึ้นโดย ‘KBLab’ ซึ่งเป็นหน่วยงานในสังกัดหอสมุดแห่งชาติสวีเดนที่มีบทบาทเฉพาะในการวิเคราะห์ข้อมูลดิจิทัลขนาดใหญ่และพัฒนาปัญญาประดิษฐ์ โดยมีการพัฒนา AI แล้วมากกว่า 24 โมเดล อาทิ AI ที่สามารถแปลงเสียงเป็นข้อความดิจิทัล ทำให้ห้องสมุดสามารถถอดเสียงจากรายการวิทยุจำนวนมาก AI ที่สามารถประมวลผลวิดีโอและสร้างคำอธิบายอัตโนมัติของเนื้อหาได้ และกำลังอยู่ระหว่างพัฒนา AI ที่มีความสามารถในการเขียนข้อความเชิงสร้างสรรค์

ปัญญาประดิษฐ์เหล่านี้เป็นโอเพนซอสซึ่งอนุญาตให้นักวิจัยนำไปสร้างชุดข้อมูลพิเศษเพื่อการศึกษาวิเคราะห์ได้เอง ทั้งยังช่วยให้ผู้ที่ไม่ใช่นักวิชาการสามารถนำข้อมูลดิจิทัลของหอสมุดไปใช้ได้ง่ายขึ้น เช่น นักข่าวสามารถป้อนคำถามเพื่อหาคำตอบว่า พาดหัวข่าวในหนังสือพิมพ์ช่วงเวลาที่ผ่านมากล่าวถึงความขัดแย้งในยูเครนอย่างไร โดยผู้ใช้บริการไม่ต้องเข้าถึงข้อมูลต้นฉบับ ซึ่งหากเป็นก่อนหน้านี้พวกเขาจะต้องขอเรียกดูทรัพยากรทีละชิ้น

ปัจจุบัน KBLab กำลังมีความร่วมมือกับมหาวิทยาลัยโกเทนเบิร์กในการพัฒนาห้องปฏิบัติการเพื่อทำการวิจัยทางภาษาศาสตร์ และสนับสนุนการทำงานของ Swedish Academy เพื่อนำข้อมูลด้านภาษาที่อัปเดตไปใช้เพื่อพัฒนาพจนานุกรมภาษาสวีดิช

หอสมุดแห่งชาติสวีเดนประเมินว่า การลงทุนด้านการพัฒนาปัญญาประดิษฐ์ช่วยลดเวลาและค่าใช้จ่ายในการประมวลผลข้อมูล ซึ่งเคยใช้เวลานานและใช้ทรัพยากรมาก และนำไปสู่การค้นพบข้อมูลเชิงลึกใหม่ๆ เกี่ยวกับประวัติศาสตร์และวัฒนธรรมของชาติ รวมทั้งเกิดประโยชน์ที่คาดไม่ถึงกับห้องสมุดท้องถิ่น หน่วยงานรัฐ และเอกชน เช่น ลดภาระงานด้านเอกสารราชการของเจ้าหน้าที่ศาลและตำรวจ

Photo: National Library of Sweden


ที่มา

บทความ “In English – Kungliga biblioteket – Sveriges nationalbibliotek” จาก kb.se (Online)

บทความ “How the National Library of Sweden harnessed AI to unlock centuries of language data” จาก itpro.com (Online)

บทความ “Sweden’s National Library trains AI on 500 years of data” จาก the-decoder.com (Online)

บทความ “Sweden’s National Library Turns Page to A” จาก blogs.nvidia.com (Online)

แหล่งชุมนุมความคิดเรื่องพื้นที่สาธารณะเพื่อการเรียนรู้
และห้องสมุดกับการเปลี่ยนแปลงสังคม

                                                                                            

The KOMMON มีการใช้คุกกี้ เพื่อเก็บข้อมูลการใช้งานเว็บไซต์ไปวิเคราะห์และปรับปรุงการให้บริการที่ดียิ่งขึ้น คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

อนุญาตทั้งหมด
Manage Consent Preferences
  • คุกกี้ที่จำเป็น
    Always Active

    ประเภทของคุกกี้มีความจำเป็นสำหรับการทำงานของเว็บไซต์ เพื่อให้คุณสามารถใช้ได้อย่างเป็นปกติ และเข้าชมเว็บไซต์ คุณไม่สามารถปิดการทำงานของคุกกี้นี้ในระบบเว็บไซต์ของเราได้

  • คุกกี้สำหรับการวิเคราห์

    คุกกี้นี้เป็นการเก็บข้อมูลสาธารณะ สำหรับการวิเคราะห์ และเก็บสถิติการใช้งานเว็บภายในเว็บไซต์นี้เท่านั้น ไม่ได้เก็บข้อมูลส่วนตัวที่ไม่เป็นสาธารณะใดๆ ของผู้ใช้งาน

บันทึก