เมื่อพูดถึงคำว่า “ข้อมูล” (Data) เราปฏิเสธไม่ได้เลยว่าในปัจจุบัน การตลาด การทำธุรกิจ เศรษฐกิจ และชีวิตประจำวันแทบทุกด้านล้วนอาศัยข้อมูลทั้งสิ้น อีกทั้งในทางการตลาดก็ได้เกิดแนวคิด Marketing 5.0 ขึ้นมาในปัจจุบัน และแน่นอนได้เกิด Big Data ขึ้นมาอีกด้วย อย่างไรก็ตาม การนำข้อมูลเหล่านี้มาใช้งานในด้านใดก็ตาม ธุรกิจจำเป็นต้องมีวิธีการรวบรวมและจัดเก็บให้ดีเสียก่อน ซึ่ง Data Warehouse คือ หนึ่งในเทคโนโลยีที่เกิดขึ้นมาเพื่อจัดการกับข้อมูลจำนวนมหาศาล และเป็นที่พูดถึงอย่างมากในทุกวันนี้นั่นเอง
ใครที่สงสัยว่า Data Warehouse คืออะไร? สำคัญต่อธุรกิจมากน้อยแค่ไหน? ในบทความนี้ SCB TechX จะมาเฉลยคำตอบให้รู้ ตามทันเทรนด์การใช้ Data ไม่มีตกรถแน่นอน
ชวนมารู้จักประเภทของ Data
อันดับแรกก่อนไปทำความรู้จัก Data Warehouse ขอแนะนำให้ทุกคนคุ้นเคยกับประเภทของ “ข้อมูล” เพื่อให้เราทำความเข้าใจเรื่องของคลังข้อมูลได้ง่ายขึ้น โดย Data สามารถแบ่งออกเป็น 3 รูปแบบหลัก ดังนี้
1. Structured Data หรือ ข้อมูลที่มีโครงสร้างชัดเจน
คือ ข้อมูลที่ที่มีการจัดเก็บไว้ในรูปแบบหรือโครงสร้างที่ชัดเจน ง่ายต่อการตรวจสอบและนำไปใช้งาน ตัวอย่างที่หลายคนคุ้นเคยกันดีก็คงหนีไม่พ้นตาราง Excel, Google Sheet หรือไฟล์ CSV นั่นเอง ซึ่งข้อมูลในรูปแบบนี้จะอยู่ในรูปแบบตาราง มีการแบ่ง Column แบ่ง Row ชัดเจนและเป็นระเบียบ เช่น ชื่อ อายุ น้ำหนัก ส่วนสูง เบอร์ติดต่อ อีเมล ฯลฯ
อีกหนึ่งสิ่งที่น่ารู้คือข้อมูลประเภทนี้เป็นข้อมูลก่อนเริ่มยุค Big Data มีปริมาณน้อย เนื่องจากเป็นข้อมูลที่ถูกกำหนดโครงสร้างชัดเจนและเก็บตามความจำเป็น จึงอาจไม่เพียงพอสำหรับองค์กรในการนำไปใช้งานในอนาคต
2. Unstructured Data หรือ ข้อมูลที่ไม่มีโครงสร้างชัดเจน
ตรงข้ามกับประเภทแรก ข้อมูลที่ไม่มีโครงสร้างชัดเจน หรือไม่มีโครงสร้างใดๆ เลย ไม่ถูกจัดเรียงหรือจัดเก็บเป็นระเบียบแต่อย่างใด ยกตัวอย่างให้เห็นภาพง่ายๆ เช่น รูปภาพ คลิปวิดีโอ ไฟล์เสียง ข้อความบนโซเชียล หรือแม้แต่ไฟล์ข้อมูลเอกสาร PDF ก็เช่นกัน แต่ก็เป็นข้อมูลที่นำไปใช้งานลำบาก ใช้เวลาจัดระเบียบนาน และหลายครั้งมันก็มีข้อมูลใหม่ๆ หรือแปลกๆ เกิดขึ้นตลอด
นอกจากนี้ ด้วยการมาถึงของอินเทอร์เน็ต ผู้คนสามารถเข้าถึงโลกออนไลน์และแอปฯ ต่างๆ ได้ง่าย ส่งผลให้เกิดข้อมูล Unstructured Data มากขึ้นเรื่อยๆ พูดได้ว่าข้อมูลประเภทนี้ส่งผลให้เกิดคำว่า Big Data ขึ้นมาก็เลยว่าได้
3. Semi-structed Data หรือ ข้อมูลกึ่งโครงสร้าง
คือ รูปแบบข้อมูลที่เป็นกึ่งกลางระหว่าง Structured Data และ Unstructured Data ที่เอาข้อดีของรูปแบบข้อมูลทั้งสองมารวมกัน โดย ใช้การเก็บข้อมูลในรูปแบบของ Unstructured Data ที่เก็บข้อมูลได้ทุกอย่าง แต่ทำให้อยู่ในรูปแบบที่นำไปใช้งานง่ายเหมือนกับ Structure Data เพียงผ่านขั้นตอนการเตรียมข้อมูลให้พร้อมในรูปแบบ อาทิ XML, CSV หรือ JSON
ยกตัวอย่างข้อมูล Semi-structed Data เช่น Web Log บันทึกว่าใครเข้าชมเว็บไซต์เมื่อไหร่ ผ่านอะไร หรือ โพสต์ในโซเชียลที่มีการติด Hashtag ก็เป็นการจัดระเบียบโครงสร้างข้อมูลทำให้เวลาใช้งานสามารถเลือกโพสต์ที่เฉพาะเจาะจงได้
Data Warehouse คืออะไร?
Data Warehouse คือ “คลังข้อมูล” หรือ ระบบจัดการข้อมูลประเภทหนึ่งที่มีขนาดใหญ่ สามารถเก็บรวบรวมข้อมูลจากแหล่งต่างๆ ในหลายช่วงเวลา อีกทั้งมีความสามารถในการเรียก/สืบค้นข้อมูล (Query) และรวบรวมข้อมูลในอดีต (Historical data) จำนวนมาก โดยข้อมูลที่เก็บรวบรวมบนคลังข้อมูลนี้จะอยู่ในรูปแบบของ Structured Data ที่ผ่านการวิเคราะห์มาแล้วเรียบร้อย หรือข้อมูลประเภท Semi-structed Data
โดยหลักๆ แล้ว Data Warehouse คือ ระบบที่ถูกออกแบบมาเพื่อสนับสนุนการสร้าง Business Intelligence (BI) และการวิเคราะห์ข้อมูล (Data Analysis) ผ่านข้อมูลที่เก็บรวบรวมจากหลายแหล่ง ไม่ว่าจะเป็นข้อมูลภายในองค์กร ข้อมูลภายนอก ไปจนถึง API จาก Third Party ต่างๆ ช่วยให้มองเห็นภาพรวมธุรกิจได้กว้างขึ้น
สุดท้ายนี้ Data Scientist สามารถนำข้อมูลเหล่านี้ไปวิเคราะห์ ค้นหา Insight ของผู้บริโภค กำหนด Data Strategy และช่วยให้ตัดสินใจทางธุรกิจอย่างมีประสิทธิภาพมากขึ้น
Database กับ Data Lake เหมือน Data Warehouse หรือเปล่า?
ต้องตอบว่า ไม่เหมือนกัน ถึงแม้ทั้ง Data Warehouse, Database และ Data Lake จะเป็นระบบจัดเก็บข้อมูล แต่ก็มีความแตกต่างและความสามารถที่แตกต่างกันไป
Database
Database คือ ฐานข้อมูลที่มีขนาดเล็กที่สุดจากทั้งสามระบบ และเก็บรวบรวมได้เฉพาะ Structured Data ที่มีโครงสร้างชัดเจนเท่านั้น ซึ่งองค์กรหรือธุรกิจส่วนมากมักใช้ Database ในการเขียน-อ่าน-แก้ไข-ลบข้อมูล (CRUD) เช่น การลงทะเบียนข้อมูลสมาชิก การบันทึกข้อมูลการสั่งสินค้าบนเว็บไซต์อีคอมเมิร์ซ เป็นต้น แต่พอมีข้อมูลจำนวนมากขึ้น การดึงข้อมูลเหล่านั้นอาจใช้เวลานาน จึงมีข้อจำกัดด้านปริมาณข้อมูลและความยืดหยุ่นในการใช้งาน ไม่สามารถตอบรับกับ Big Data ในทุกวันนี้ได้
Data Lake
Data Lake ถือเป็นวิธีการเก็บข้อมูลที่ยืดหยุ่น และเป็นระบบที่เป็นที่จับตามองของหลายธุรกิจทั่วโลก เพราะ Data Lake สามารถเก็บข้อมูล Big Data ได้ทุกรูปแบบ ตั้งแต่ Structured Data, Unstructured Data, Semi-structured Data ไปจนถึง Raw Data หรือข้อมูลดิบที่ที่ไม่มีการเปลี่ยนรูปแบบใดๆ อย่างไรก็ตาม จำนวนข้อมูลที่มาก ทำให้เกิดความซับซ้อนในการใช้งานข้อมูล จึงต้องอาศัยผู้เชี่ยวชาญอย่าง Data Engineer เข้ามาช่วยดูแลระบบ และ Data Analysis เข้ามาวิเคราะห์ข้อมูลนั่นเอง
ถ้าใครยังสับสนอยู่ ให้ลองคิดง่ายๆ ว่า Database เป็นห้องเก็บของเล็กๆ ที่มีการจัดเรียงกล่องเอกสารไว้อย่างดี ส่วน Data Warehouse คือ คลังสินค้าขนาดใหญ่ที่มีสินค้าจำนวนมากเข้ามาจากหลายที่ และ Data Lake เปรียบเป็นทะเลสาบขนาดยักษ์ที่มีสัตว์น้ำหลายชนิดว่ายวนรอให้ตกขึ้นมา
ประโยชน์ของ Data Warehouse ที่มีต่อธุรกิจ
คลังข้อมูลที่มีชื่อเรียกว่า Data Warehouse นั้นมีข้อดีหลายด้านที่สามารถช่วยยกระดับการดำเนินธุรกิจในยุคดิจิทัลได้ โดย SCB TechX ขอยกตัวอย่าง 3 ประโยชน์หลัก ได้แก่
1. พัฒนา Business Intelligence และตอบคำถามทางธุรกิจ
Data Warehouse สามารถเก็บรวบรวมข้อมูลแบบมีโครงสร้างและกึ่งโครงสร้างได้จำนวนมาก ช่วยให้ Data Scientist และ Business Analyst สามารถนำข้อมูลมาวิเคราะห์ เพื่อค้นหา Insight ทางธุรกิจด้านต่างๆ และนำเสนอออกมาได้แม่นยำมากขึ้น
2. รองรับข้อมูลจากหลายแหล่ง
อย่างที่กล่าวไปข้างต้น Data Warehouse มีความสามารถในการเก็บรวบรวมข้อมูลได้จากหลายๆ ที่ ซึ่งแน่นอนว่าเป็นประโยชน์ต่อธุรกิจอย่างมาก โดยเฉพาะเมื่อมี Customer Touchpoint หลายจุดที่สามารถให้ข้อมูลกับธุรกิจ เช่น ระบบ POS หน้าร้าน ระบบ CRM ไปจนถึงข้อมูลที่รวบรวมได้จาก Cookies เว็บไซต์และแอปพลิเคชัน เปิดโอกาสให้องค์กรเห็นภาพรวมข้อมูลแบบ Unified View
ถึงแม้ Data Warehouse จะไม่สามารถเก็บรวบรวมข้อมูล Unstructed Data ได้แบบ Data Lake แต่ทุกวันนี้ก็มีโซลูชันจากผู้ให้บริการมากมายเข้ามาอุดรอยรั่วนี้ได้
3. มีแหล่งข้อมูลเป็นของตัวเอง
ข้อมูลได้กลายเป็น “ทรัพยากร” ที่มีมูลค่าอย่างมาก ทั้งนี้ด้วยความตื่นตัวด้านความปลอดภัยของข้อมูลส่วนบุคคล ประกอบกับกฎหมาย PDPA ทำให้การเก็บรวบรวม 2nd Party Data หรือ 3rd Party Data เป็นไปได้ยาก อีกทั้งยังผิดข้อกฎหมายด้วย ดังนั้นการพัฒนาระบบ Data Warehouse เป็นของตัวเอง เพื่อเก็บข้อมูล 1st Party Data หรือ Zero Party Data ที่มีแต่ละเพิ่มมูลค่าและสร้างประโยชน์ให้ธุรกิจในระยะยาว
การที่องค์กรจะพัฒนา Data Warehouse ของตัวเอง ก็อาจมีค่าใช้จ่ายเพิ่มเข้ามา จึงควรสำรวจความพร้อมของธุรกิจ อีกทั้งควรมี Data Engineer ที่มีความชำนาญเข้ามาจัดการดูแลระบบโดยรวม สุดท้ายนี้ต้องไม่ลืมว่า Data Warehouse ที่ดีต้องมี Scalability หรือสามารถเติบโตไปพร้อมกับธุรกิจได้ด้วยนั่นเอง
ทั้งหมดที่แนะนำไปในบทความนี้ก็เป็นเรื่องน่ารู้เกี่ยวกับ Data Warehouse ที่เรียกได้ว่ากลายมาเป็นส่วนสำคัญของการดำเนินธุรกิจยุคดิจิทัลไปแล้ว หากสนใจเรียนรู้เกี่ยวกับ Data เพิ่มเติมหรือต้องการอัปเดตข่าวสารในแวดวงดิจิทัล สามารถอ่านเพิ่มเติมได้ที่ scbtechx.io/th/blog
TechX Data Platform จาก SCB TechX
ในยุคดิจิทัลที่ธุรกิจต้องอาศัย “ข้อมูล” เพื่อสร้างข้อได้เปรียบในการแข่งขันในตลาด โดยเฉพาะการเข้ามาของ Big Data ที่มีข้อมูลจำนวนมากเกิดขึ้นตลอดเวลา อาจทำให้ธุรกิจไม่สามารถจัดการกับข้อมูลในรูปแบบเดิมๆ ได้อีกต่อไป ดังนั้น SCB TechX จึงได้คิดค้นพัฒนาแพลตฟอร์มการจัดการข้อมูลแบบครบวงจร TechX Data Platform ขึ้น เพื่อช่วยตอบโจทย์ แก้ปัญหา และนำเสนอโซลูชันให้แก่ธุรกิจได้อย่างตรงจุดครอบคลุมรอบด้าน
บริการ TechX Data Platform จาก SCB TechX คือ โซลูชันสำหรับองค์กรที่เข้ามาช่วย บริหาร เก็บรวบรวม วิเคราะห์ และนำข้อมูลไปใช้อย่างมีประสิทธิภาพ โดยผู้เชี่ยวชาญด้านเทคโนโลยีชั้นนำของเมืองไทย
ทำไมต้องเลือก TechX Data Platform?
- One-Stop Solution สำหรับธุรกิจ
บริการ Data Platform ของเราครอบคลุมทุกโซลูชันด้านการจัดการข้อมูล ไม่ว่าจะเป็น การบริหารจัดการข้อมูล (Data Management) การรวบรวมข้อมูล ( Data Integration) การจัดเก็บข้อมูล (Data Storage) การดูแลระบบฐานข้อมูล (Data Administration) การวิเคราะห์ข้อมูล (Data Analytics) ไปจนถึงการรักษาความปลอดภัยของข้อมูล (Governance Security) ด้วยเทคโนโลยีชาญฉลาดอย่าง AI และ Machine Learning ยกระดับประสิทธิภาพการทำ Data Analysis ขึ้นไปอีกขั้น - Tailor-Made เพื่อทุกธุรกิจทุกขนาด
TechX Data Platform เป็นแพลตฟอร์มที่สามารถปรับแต่ง (Customize) ให้เหมาะสมกับความต้องการใช้ข้อมูลของธุรกิจทุกขนาด ไม่ว่าจะเป็นสตาร์ทอัพ เอสเอ็มอี (SME) หรือองค์กรใหญ่ ปรับแต่งได้ตามความต้องการ ธุรกิจจึงสามารถจัดการข้อมูลที่ทันสมัยและเหมาะสมกับขนาดองค์กรที่สุด - Low-Code Solution เข้าถึงง่าย
Data Platform สามารถเชื่อมต่อเข้ากับซอฟต์แวร์หรือระบบต่างๆ ได้อย่างง่ายดาย ช่วยให้ธุรกิจโอนข้อมูล พร้อมทำงานร่วมกับเครื่องมือที่ธุรกิจคุ้นเคยอยู่แล้วได้ เช่น Power BI หรือ Tableau ได้อย่างสะดวก นอกจากนี้ Data Platform เป็นแพลตฟอร์มที่ออกแบบมาเพื่อใช้งานง่าย ผู้ใช้ไม่จำเป็นต้องมีความรู้ด้านการเขียน Code มาก ก็สามารถใช้งานแพลตฟอร์ม และเข้าถึงข้อมูลได้อย่างเต็มประสิทธิภาพ - ปลอดภัยและเชื่อถือได้
SCB TechX ร่วมมือกับผู้ให้บริการด้านข้อมูลและคลาวด์ชั้นนำระดับโลก เช่น Databricks, AWS, Microsoft Azure และ Google Cloud Platform อีกทั้งได้รับใบรับรองมาตรฐานสากล ISO/IEC 27001:2013 ด้านความมั่นคงปลอดภัยสารสนเทศ จึงมั่นใจได้ในการดูแลความปลอดภัยของข้อมูล (Security and Reliability)
นอกจากนี้ TechX Data Platform ยังพร้อมรองรับการจัดการข้อมูลตามกรอบการกำกับดูแลข้อมูล (Data Governance Framework) และพระราชบัญญัติคุ้มครองข้อมูลส่วนบุคคล พ.ศ.2562 (PDPA) ให้แก่ลูกค้าด้วย
SCB TechX พร้อมให้บริการ Data Platform ทั้งรูปแบบ Platform as a Service และ Software as a Service ตอบโจทย์ที่แตกต่างตามความต้องการสำหรับธุรกิจคุณ
หากสนใจดูรายละเอียดบริการ แพลตฟอร์มการจัดการข้อมูล TechX Data Platform (คลิก)
สอบถามบริการด้าน Data Platform, บริการ eKYC และ โซลูชันอื่นๆเพิ่มเติม ได้ที่ Email: contact@scbtechx.io
ติดตาม SCB TechX เพื่ออัปเดตข่าวสารใหม่ๆ ก่อนใคร
Facebook: SCB TechX
Medium: medium.com/scb-techx
LinkedIn: www.linkedin.com/company/scb-tech-x/
YouTube: SCB TechX