การรักษามรดกทางปัญญาของประเทศในรูปแบบออนนไลน์

ข้อมูลทางประวัติศาสตร์ ศิลปวัฒนธรรม ภูมิปัญญา รวมทั้งเอกสารหายากต่างๆ ถือเป็นมรดกอันล้ำค่าในการสืบสานความเป็นเอกลักษณ์ของประเทศ หากแต่ในปัจจุบัน ข้อมูลและองค์ความรู้เหล่านี้ยังคงบันทึกอยู่ในรูปแบบของเอกสารและหนังสือ ซึ่งสามารถเสื่อมสลายไปพร้อมกาลเวลา การรักษามรดกทางปัญญาของประเทศ ให้คงอยู่ ระบบการจัดเก็บและสะสมข้อมูล จึงต้องมีวิธีการจัดการที่สามารถแปลง ข้อมูลจากเอกสารต้นฉบับ มาสู่รูปแบบดิจิทัลที่สามารถเก็บรวบรวมข้อมูล ได้อย่างต่อเนื่อง และที่สำคัญครอบคลุมการเก็บรายละเอียดได้ครบถ้วนและไม่ทำลายต้นฉบับเดิม

เนคเทคได้ร่วมกับกระทรวงวัฒนธรรม ในการแปลงและจัดเก็บหนังสือสำคัญของ หอสมุดแห่งชาติให้อยู่ในรูปดิจิทัล เพื่อให้ง่ายต่อการสืบค้นผ่านระบบเครือข่าย คอมพิวเตอร์ โดยได้พัฒนาขั้นตอนการแปลงข้อมูลที่เน้นความสำคัญกับการรักษา เอกสารต้นฉบับ เดิมที่มี การเก็บรักษามาอย่า่งยาวนานไม่ใ่ห้ถูก ทำลายไปด้วยการพัฒนา เครื่องสแกนเอกสารแบบตัววี (V-Shape Scanner) ที่สามารถรักษา และคงสภาพของหนังสือในขณะที่สแกนข้อมูลเข้าสู่ระบบคอมพิวเตอร์

โดยปกติ การสแกนหนังสือด้วยเครื่องสแกนเนอร์ ต้องอาศัยการวางหนังสือ ในแนวราบเพื่อให้ได้ภาพสแกนที่มีข้อมูลครบถ้วนทั่วทั้งหน้า วิธีดังกล่าวจะมีผล ต่อการสแกนหนังสือที่มีอายุยาวนาน ซึ่งอาจเกิดการชำรุดหรือขาดหายไปใน ระหว่างการสแกนได้ การพัฒนาเครื่องสแกนเอกสารแบบตัววี โดยหน่วยปฏิบัติการวิจัยเทคโนโลยีภาพ เนคเทค จึงเข้ามาช่วยรักษาและคงสภาพหนังสือเก่า ด้วยลักษณะการสแกนที่หนังสือแต่ละหน้าจะไม่ถูกดึงออกจากกันจนอาจเกิด
การชำรุดได้

นอกจากนี้ การสร้างระบบคลังข้อมูลดิจิทัลยังต้องอาศัยเทคโนโลยีรู้จำตัวอักษร (Optical Character Recognition: OCR) ที่ช่วยในการแปลงไฟล์ภาพเอกสารต่างๆ ที่ผ่านการสแกนมาเป็นไฟล์ข้อความที่ผู้ใช้สามารถแก้ไขข้อความได้ทีมวิจัยจาก หน่วยปฏิบัติการวิจัยเทคโนโลยีภาพจึงได้พัฒนาต่อยอดระบบ OCR ที่ปัจจุบัน มีการใช้ในเชิงพาณิชย์ภายใต้ชื่อซอฟต์แวร์อ่านไทย ซึ่งแม้มีความถูกต้อง ในการรู้จำตัวอักษรประมาณ 95 เปอร์เซ็นต์ แต่ซอฟต์แวร์ดังกล่าวยังไม่สามารถเรียนรู้ฟอนต์ใหม่ๆ ได้ด้วยตัวเอง เมื่อนำมาใช้แปลงไฟล์เอกสารที่มีฟอนต์แตกต่างจากที่ฝึกสอนไว้ อาจจะได้ผลการรู้จำไม่แม่นยำเท่าที่ควร

This entry was posted in แนะนำบริการ and tagged . Bookmark the permalink.

Comments are closed.