TH | EN
TH | EN
หน้าแรกColumnistData ในองค์กรไม่พร้อมใช้ เพราะไม่มี Data Hub

Data ในองค์กรไม่พร้อมใช้ เพราะไม่มี Data Hub

Data Hub คือสถานที่สำหรับจัดเก็บ และรวบรวมข้อมูลที่กระจัดกระจายตามระบบต่าง ๆ ขององค์กรไว้ภายในที่เดียว เพื่อให้ข้อมูลมีความพร้อมใช้มากที่สุด ซึ่ง Data Hub ประกอบไปด้วย Data Lake, Data Warehouse และ Data Mart

ความแตกต่างของทั้ง 3 ตัวนี้ คือ 

  • Data Lake คือ ถังกลางในการเก็บข้อมูลดิบจากทุกแหล่งข้อมูล ทั้งข้อมูลมีโครงสร้าง และไม่มีโครงสร้าง ไม่ว่าจะเป็นข้อมูลที่จะใช้หรือไม่คิดว่าจะใช้
  • Data Warehouse คือ พื้นที่เก็บข้อมูลที่มีโครงสร้างชัดเจน และมักเป็นข้อมูลที่มีเป้าหมายในการใช้งาน 
  • Data Mart คือ พื้นที่ ที่เก็บเฉพาะผลลัพธ์ หรือข้อมูลที่พร้อมจะนำไปแสดงผล เพื่อเพิ่มประสิทธิภาพในการดึงข้อมูลออกจาก Database

เมื่อไม่มี Data Hub ก็กลายเป็นว่า ไม่มีพื้นที่สำหรับการนำข้อมูลจากระบบต่าง ๆ ที่อยู่กระจัดกระจายมารวมกันไว้ที่ส่วนกลาง

หลายองค์กรอ้างว่า มีระบบแล้ว มี Data Warehouse แล้วก็น่าจะเพียงพอ เพราะเมื่อใดก็ตามที่ต้องการใช้ข้อมูลก็แค่ไป Export ออกมาจากระบบก็ได้ ซึ่งความเป็นจริงการทำงานแบบนี้ เป็นการทำงานแบบ Manual และ Offline อีกทั่งข้อมูลจากระบบต่าง ๆ ก็จะมีโครงสร้างที่ต่างกัน ซึ่งเมื่อต้องนำข้อมูลไปใช้ต่อ จะเกิดความยากลำบาก

ตัวอย่างง่าย ๆ ก็คือ รูปแบบการเก็บวันที่ ที่แต่ละระบบอาจจะมีรูปแบบการเก็บข้อมูลประเภทวันที่ไม่เหมือนกัน เช่น 20 กันยายน 2566 กับ 20-9-2023 เป็นต้น อีกตัวอย่างหนึ่ง คือ การทำโครงการ Smart City ที่มีการติดตั้งกล้องวงจรปิดเอาไว้หลายที่ แต่เป็นการติดกล้องที่ต่างวาระกัน ทำให้มี spec ที่แตกต่างกัน เมื่อจำเป็นต้องนำภาพมาวิเคราะห์ เช่น วิเคราะห์ความหนาแน่นของประชากร ก็ทำได้ยาก โดยเฉพาะเมื่อไม่มี Data Hub ที่รวมข้อมูลที่จำเป็นต้องใช้ไว้ที่ส่วนกลาง ส่งผลให้ข้อมูลกระจัดกระจาย

เหตุผลที่ว่า ทำไมองค์กรต่าง ๆ ไม่ลงทุนด้าน Data Hub อาจเป็นเพราะองค์กรคิดว่าค่าใช้จ่ายสูง และไม่มี ROI ที่ชัดเจน เพราะไม่รู้ว่าจะเอาข้อมูลทำอะไรต่อ นอกจากนี้ ทีม IT ของหลายองค์กรยังไม่สามารถพัฒนา Data Hub ได้เอง เพราะความเป็นจริงแล้ว ทีม IT อาจจะไม่คุ้นเคยกับทำ Data Pipeline เพราะทีม IT มักจะมีทักษะในการดูแลระบบใดระบบหนึ่ง มากกว่าการนำข้อมูลจากหลายระบบมาจัดทำโครงสร้างใหม่ ทั้งนี้ทีมจะทำได้หรือไม่ขึ้นอยู่กับนโยบายการ Reskill / Upskill ของทีม IT ภายในองค์กร หากทีม IT คุ้นชินแค่เครื่องมือใดเครื่องมือหนึ่ง หรือไม่สามารถปรับเปลี่ยนตัวเองให้เข้ากับเทคโนโลยีใหม่ๆก็อาจะสร้างความเสี่ยงให้กับองค์กรได้

รวมถึงปัญหาองค์กรไม่มี Change management ที่ดี กลัวการเปลี่ยนแปลง หรือ user ไม่อยากเรียนรู้อะไรใหม่ ๆ เพราะอาจคิดว่าการทำแบบเดิม ก็ดีอยู่แล้วเลยไม่ให้ความสำคัญกับการทำ Transformation ก็เป็นอีกอุปสรรคหนึ่งที่สำคัญ

นอกจากนี้ ในมุมของผู้บริหาร การไม่ลุงทุนใน Data Hub เพราะไม่สามารถคำนวณ ROI ได้ เป็นการตัดสินใจที่ผิดมาก แม้ว่า Data Hub จะให้ ROI ไม่ได้ แต่โครงการอื่น ๆ ที่สามารถต่อยอดจากข้อมูลใน Data Hub สามารถให้ ROI ได้อย่างมหาศาล นอกจากนี้ ยังพบว่า ผู้บริหารมีความเข้าใจผิดที่ว่าหากมี Data Lake, Data Warehouse หรือ Data Mart อย่างใดอย่างหนึ่งไว้จัดเก็บข้อมูลทั้งหมดก็เพียงพอแล้ว โดยเฉพาะองค์กรที่มี Data Warehouse เดิมอยู่แล้ว ก็คิดว่าตัวเองมี Data Hub แล้ว ซึ่งความจริงข้อมูลใน Data Warehouse ควรเป็นข้อมูลที่ผ่าน Process หรือ การ Transform มาแล้ว

ในขณะที่ Data Lake จะเก็บข้อมูลดิบ ๆ จากแหล่งข้อมูลต่าง ๆ เอาไว้ ดังนั้น ถ้ามีแต่ Data Warehouse จะทำให้ข้อมูลที่ไม่เข้าพวก หรือไม่สามารถนำมาเก็บไว้ที่ Warehouse กระจัดกระจาย เช่น เก็บในรูปแบบ Excel ที่อยู่ในเครื่องคอมพิวเตอร์ของ User สุดท้ายก็จะไม่สามารถแก้ปัญหาข้อมูลกระจัดกระจาย อีกทั้งเกิด Human Error และปัญหาข้อมูลไม่เชื่อมโยง ทำให้องค์กรไม่สามารถก้าวข้ามเป็น Data Driven Organizations ต่อไปได้

บทความอื่น ๆ ที่น่าสนใจของผู้เขียน

ความท้าทายในการกำกับดูแลข้อมูลในหน่วยงานภาครัฐ 

การลงทุนด้านเทคโนโลยีที่ผิดพลาดในยุค DATA-DRIVEN

ความแตกต่างระหว่าง DIGITIZATION, DIGITALIZATION และ DIGITAL TRANSFORMATION

STAY CONNECTED

0แฟนคลับชอบ
440ผู้ติดตามติดตาม
spot_img

Lastest News

MUST READ