ปัจจุบันมีการนำ Data มาช่วยขับเคลื่อนธุรกิจ ซึ่งแหล่งข้อมูลมาจากหลายที่ และมีจำนวนมหาศาล แต่จะทำอย่างไรให้สามารถนำข้อมูลไปใช้ได้อย่างรวดเร็ว และถูกต้องตามวัตถุประสงค์ของผู้ใช้งาน?
วันนี้กูรูด้าน Data คุณแจ็คพอต พงศกร Data Engineer จาก SCB TechX มีเคล็ดลับที่ช่วยให้ทุกคนในองค์กรนำชุดข้อมูลไปใช้ได้อย่างมั่นใจ รวดเร็ว และมีประสิทธิภาพด้วยการทำความเข้าใจ Data Dictionary ก่อนนั่นเอง
Data Dictionary คือพจนานุกรม หรือ แหล่งรวมคำอธิบายของชุดข้อมูลเพื่อให้ทราบว่าข้อมูลนั้นๆคืออะไร ซึ่งมีความสำคัญมากต่อการทำความเข้าใจข้อมูล และวิเคราะห์ข้อมูลให้ถูกต้อง อาทิ รายละเอียดด้านต่าง ๆ ทางธุรกิจ ค่าที่ได้จากการคำนวณ รวมถึงรายละเอียดทางเทคนิคของการเก็บข้อมูล ซึ่งหัวข้อที่มักพบใน Data Dic มีดังนี้
- ชื่อระบบที่ดึงข้อมูลมา เช่น ระบบ CRM… ของทีมการตลาด
- รูปแบบไฟล์ที่ส่งข้อมูลมา เช่น .CSV
- ความถี่ในการนำข้อมูลเข้า เช่น Daily, Monthly หรือส่งทุกวันจันทร์
- รูปแบบของการส่งข้อมูล เช่น ส่งข้อมูลทั้งหมด (Full Dump), ส่งเฉพาะข้อมูลใหม่ (Transaction)
- ชื่อ Database, Table, Column ของต้นทางที่ดึงข้อมูลมา
- ชื่อ Database, Table, Column ของปลายทางที่ถูกจัดเก็บ
- รายละเอียดของคอลัมน์ หรือสมการในการคำนวณ เช่น “customer_tel คือ ข้อมูลเบอร์โทรศัพท์ของลูกค้า ที่ลูกค้าให้ความยินยอมในการจัดเก็บและสามารถติดต่อลูกค้าได้ หากลูกค้าไม่ให้ความยินยันคอลัมน์นี้จะถูกจัดเก็บเป็นค่า Null”, “total_sales คือยอดขายรวมของ Transaction นั้น ๆ โดยคำนวณจาก จำนวนขาย * ราคาต่อหน่วย” เป็นต้น
นอกจากนี้ยังมีข้อมูลอื่น ๆ ได้อีก ขึ้นอยู่กับแต่ละองค์กรว่ามีความต้องการเก็บข้อมูลที่ระดับใด จากการมี Data Dic ของชุดข้อมูลนี้ จะช่วยทำให้ทุกคนในองค์กรเข้าใจที่มา และความหมายของชุดข้อมูล สามารถนำข้อมูลไปใช้ต่อยอดได้อย่างรวดเร็ว และมีประสิทธิภาพ ใครกำลังสนใจเรื่อง Data เริ่มจากเข้าใจ Data Dic นี้ก่อนจะช่วยได้เยอะเลยค่ะ
ท้ายนี้บริษัท SCB TechX เปิดให้บริการด้าน Data Platform ที่เป็น Solution ด้านการจัดการข้อมูลแบบครบวงจร หากท่านใดสนใจให้ทาง SCB TechX ช่วยเป็นที่ปรึกษา หรือจัดการด้านข้อมูลให้แก่องค์กรของท่าน สามารถสอบถามรายละเอียดได้เลยนะคะที่ contact@scbtechx.io