TH | EN
TH | EN
spot_imgspot_imgspot_img
หน้าแรกColumnistมิติคุณภาพข้อมูล Timeliness Data ที่หลายองค์กรละเลย

มิติคุณภาพข้อมูล Timeliness Data ที่หลายองค์กรละเลย

คำว่า “ข้อมูลไม่สะอาด” กลายเป็นข้อจำกัดของหลายองค์กรที่ต้องการนำข้อมูลมาใช้ แต่มีเพียงไม่กี่องค์กรที่ให้ความสำคัญจริง ๆ และเริ่มแก้ไขปัญหาเหล่านี้ 

ในคำว่า “ไม่สะอาด” ควรมีการขยายความหมาย ว่ามันไม่สะอาดอย่างไร ทำไมถึงไม่สะอาด 

ตัวอย่างเช่น 

ข้อมูลจำนวนพนักงาน ที่มีจำนวนไม่ถูกต้อง บางคนลาออกไปแล้วไม่ได้นำชื่อออก บางคนมาใหม่แต่ไม่มีรายชื่อในฐานข้อมูล เป็นต้น 

ในกรณีนี้ การที่ข้อมูลถูกต้อง หรือครบถ้วน อาจจะเกิดเพราะไม่มีการ Update ข้อมูลให้เป็นปัจจุบันก็เป็นได้ 

ความเป็นปัจจุบัน (Timeliness)  สำนักงานพัฒนารัฐบาลดิจิทัล (องค์การมหาชน) สพร. หรือ DGA  คือ “ข้อมูลเป็นปัจจุบันทันสมัยเพียงพอต่อการใช้งาน และพร้อมใช้งานตามที่กำหนดและในกรอบเวลาที่กำหนดไว้ หรือมีข้อมูลทันต่อการใช้งานทุกครั้งตามที่ผู้ใช้ต้องการ” 

ในทางปฏิบัติจำเป็นต้องมีตัวชี้วัดที่ระบุสถานะความเป็นปัจจุบันของชุดข้อมูล เช่น ชุดข้อมูลนี้มีการปรับปรุงทุกวัน ข้อมูลนี้มีการปรับปรุงทุก 1 ชั่วโมง เป็นต้น เพื่อให้ระบบสามารถเก็บ Log ความเคลื่อนไหว และสามารถประเมินได้ว่า ชัดข้อมูลนี้มีการปรังปรุง หรือ Update ล่าสุดเมื่อไหร่ เป็นไปตามตัวชี้วัดที่กำหนดเอาไว้หรือไม่ ซึ่งสามารถคำนวณความเป็นปัจจุบันในรูปแบบของร้อยละได้ ตัวอย่างเช่น ชุดข้อมูลที่มีกำหนดการปรังปรุงทุกชั่วโมง แต่ล่าสุดในระบบมีการปรับปรุงข้อมูลเมื่อ 70 นาทีที่แล้ว แสดงว่าข้อมูลชุดนี้มีการล่าช้าในการปรับปรุงข้อมูลเกิดขึ้น 70-60 = 10 นาที ข้อมูลชุดนี้จึงมีร้อยละความเป็นปัจจุบันอยู่ที่ 98.33% 

ข้อมูลบางชุดอาจไม่มีการกำหนดความถี่ในการ Update ที่แน่นอน เพราะเป็นข้อมูลไม่ค่อยมีความเคลื่อนไหว เช่น ข้อมูล HR ของบริษัทขนาดเล็ก ที่อาจไม่มีความเคลื่อนไหวบ่อยครั้ง ในกรณีนี้ อาจสามารถกำหนดความถี่ในการ Update ขึ้นมาเป็นตัวตั้งต้น เช่น เดือนละ 1 ครั้ง และหากข้อมูลในเดือนล่าสุดไม่มีการเปลี่ยนแปลง ก็คือว่า ข้อมูลนั้นก็ยังถือว่าเป็นข้อมูลที่ Update ล่าสุด 

ถ้าไม่มีการวางกระบวนการในการตรวจสอบ และปิดช่องว่างในมิติคุณภาพข้อมูล ปัญหาข้อมูลไม่สะอาด ก็จะยังคงเป็นปัญหาที่ไม่มีจบสิ้น และมีโอกาสที่ข้อมูลจะไม่สะอาดมากขึ้นเรื่อย ๆ เพราะข้อมูลก็ยังคงเกิดขึ้นอยู่เรื่อย ๆ 

มิติความเป็นปัจจุบัน เป็นเพียง 1 ในหลายมิติ ในกระบวนการตรวจสอบคุณภาพของข้อมูล ซึ่งมิตินี้ ถือเป็นมิติที่ตรวจสอบได้ค่อนข้างง่าย เพราะเป็นการเช็ค log เวลาในการรับส่งข้อมูล อย่างไรก็ตาม ตัวชุดข้อมูลจะถูกต้องหรือไม่ อาจจะต้องมีการตรวจสอบในมิติอื่นเพิ่มเติม 

ตัวอย่างเช่น ข้อมูล HR ได้รับการ Update ล่าสุดเมื่อวานนี้ ซึ่งถือว่า Update ล่าสุด แต่รายละเอียดในข้อมูล ยังไม่ถูกต้อง เช่น ยังมีข้อมูลนามสกุลไม่ครบ เป็นต้น กรณีนี้ ในมิติ Timeliness ถือว่ามีความเป็นปัจจุบัน แต่ยังมีมิติความครบถ้วน ที่ยังไม่ถูกต้อง นั่นเอง 

เพื่อให้ข้อมูลในองค์กร มีคุณภาพพร้อมใช้ จะต้องมีกระบวนการในการตรวจสอบคุณภาพของข้อมูลในมิติต่าง ๆ ซึ่งต้องมีการกำหนดมาตรฐานกลาง เพื่อบังคับใช้ในแต่ละองค์กร 

ถ้าไม่ทำให้เกิดขึ้น ข้อมูลที่เก็บเอาไว้ จะมีความน่าเชื่อถือได้อย่างไร?

บทความอื่น ๆ ของผู้เขียน

CHATGPT แตกต่างจาก CHATBOT ตัวอื่นอย่างไร คุ้มสำหรับการลงทุนหรือไม่

AI ควรพัฒนาเองหรือใช้สำเร็จรูป

ความท้าทายในการกำกับดูแลข้อมูลในหน่วยงานภาครัฐ 

STAY CONNECTED

0แฟนคลับชอบ
440ผู้ติดตามติดตาม
spot_img

Lastest News

MUST READ