โลกของเทคโนโลยีในปัจจุบันมีการเติบโตอย่างก้าวกระโดดและพัฒนาอย่างต่อเนื่อง นับวันยิ่งมีข้อมูลจำนวนมหาศาลหรือที่เราเรียกว่า “Big Data” เกิดขึ้น แล้วสำหรับธุรกิจและผู้ประกอบการยุคนี้ ข้อมูลถือเป็นกุญแจสำคัญเพื่อนำไปใช้ต่อยอดการพัฒนาธุรกิจ สินค้า รวมไปถึงการบริการลูกค้า แต่ด้วยจำนวนข้อมูลที่เกิดขึ้นแทบทุกวินาที เจ้าของธุรกิจและผู้ประกอบการธุรกิจจำเป็นต้องมีวิธีการจัดเก็บและจัดการข้อมูลที่มีอยู่ ก่อนที่จะนำไปใช้ประโยชน์ด้านต่างๆ อย่างเต็มที่
ดังนั้น SCB TechX ขอชวนทุกท่านมาเรียนรู้เกี่ยวกับการเก็บข้อมูลเพิ่มเติม โดยในวันนี้จะพามาหาคำตอบว่า Data Lake คืออะไร? ส่งผลดีต่อธุรกิจอย่างไร?
เตือนความจำ! Database ดั้งเดิมเป็นแบบไหน?
อันดับแรก ก่อนเข้าเรื่อง Data Lake เราขอมาเตือนความจำกันก่อน จำได้ไหมว่า “Database” ที่เราคุ้นเคยนั้นเป็นอย่างไร? โดย Database คือ ที่จัดเก็บกลุ่มของข้อมูลทั่วไปรวมไว้ในที่เดียวกัน โดยมีการระบุความสัมพันธ์กันระหว่างข้อมูล ระบบดังกล่าวถูกออกแบบมาให้รองรับการทำธุรกรรมทางธุรกิจ ซึ่งข้อมูลที่จัดเก็บใน Database จะเป็นในรูปแบบของข้อมูลที่มีโครงสร้าง (Structured Data) เท่านั้น หรือก็คือ ข้อมูลที่มีการจัดเก็บและจัดรูปแบบให้อยู่ในรูปที่มีระเบียบและโครงสร้างชัดเจนให้มีความพร้อมใช้งาน มักจัดเก็บในรูปแบบตาราง (Table) เช่น ข้อมูลในไฟล์ Excel หรือข้อมูลเชิงสัมพันธ์ต่างๆ
โดยที่องค์กรส่วนใหญ่จะใช้ Database ในการเขียน-อ่าน-แก้ไข-ลบข้อมูล หรือ Create-Read-Update-Delete (CRUD) เช่น การลงทะเบียนข้อมูลสมาชิก การบันทึกข้อมูลการสั่งสินค้าบนเว็บไซต์อีคอมเมิร์ซ เป็นต้น
อย่างไรก็ตาม Database จะมีประสิทธิภาพสูงสุดกับข้อมูลที่มีจำนวนไม่มาก และเป็นข้อมูลที่เฉพาะเจาะจง มีโครงสร้างข้อมูลชัดเจน ซึ่งถ้ามีข้อมูลเยอะขึ้น มีการจัดกลุ่มของข้อมูลในปริมาณที่มาก ก็จะใช้เวลาในการดึงข้อมูลนั้นๆ นานมากขึ้นกว่าเดิม
Data Warehouse ที่ใหญ่ขึ้นกว่า Database
สำหรับองค์กรขนาดใหญ่ที่ต้องจัดการดูแลชุดข้อมูลจำนวนมากอยู่แล้ว และมีงบประมาณในการลงทุนมากพอ อาจเลือกใช้ Data Warehouse หรือก็คือ ที่จัดเก็บข้อมูลที่มีขนาดใหญ่มากขึ้น จัดเก็บข้อมูลได้จากหลายแหล่ง และรวบรวมข้อมูลในรูปแบบ Structured Data เหมือนเดิม ซึ่งธุรกิจอาจมีการลงทุนสร้าง Server และสร้าง Data Schema เป็นของตัวเอง โดยการจัดเก็บข้อมูลใน Data Warehouse นั้นมีจุดประสงค์เพื่อให้นักวิเคราะห์ข้อมูล (Data Analyst) และนักวิเคราะห์ธุรกิจ (Business Analyst) ดึงข้อมูลเหล่านั้นมาวิเคราะห์ Insight ของข้อมูลได้ทันที สำหรับใช้ในการตัดสินใจด้านธุรกิจ เนื่องจาก Data Warehouse เป็นรูปแบบการจัดเก็บที่มีประสิทธิภาพสูงสำหรับการค้นหาข้อมูล
และวิเคราะห์ข้อมูลแบบมีโครงสร้างที่มีจำนวนมาก
ทั้งนี้การจัดเก็บข้อมูลแบบ Database และ Data Warehouse ก็มีข้อจำกัดสำคัญ คือ สามารถเก็บข้อมูลที่มีโครงสร้างได้เท่านั้น และโซลูชันที่จะเข้ามาอุดรอยรั่วตรงนี้ก็คือ Data Lake นั่นเอง
Data Lake คืออะไร?
Data Lake คือ รูปแบบการเก็บข้อมูลที่สามารถเก็บข้อมูล Big Data ได้ทุกรูปแบบจากหลายแหล่ง ไม่ว่าจะเป็นข้อมูลที่มีโครงสร้าง (Structured Data) ข้อมูลกึ่งโครงสร้าง (Semi-Structured Data) และข้อมูลที่ไม่มีโครงสร้าง (Unstructured Data) ซึ่งโดยทั่วไปจะเป็นข้อมูลดิบ (Raw Data) ที่ไม่มีการเปลี่ยนรูปแบบใดๆ เลย และข้อมูลเหล่านี้ก็จะอยู่บน Cloud อีกด้วย
ข้อดี Data Lake
ข้อดีของ Data Lake ที่เป็นเอกลักษณ์คือ ความยืดหยุ่นในการรองรับข้อมูลทุกรูปแบบ ไม่ว่าจะเป็นข้อมูลจากไฟล์ Excel ข้อมูลเชิงสัมพันธ์ ข้อมูลชนิด JSON, XML หรือไฟล์ Log ไปจนถึงข้อมูลที่ไม่มีโครงสร้างอย่าง อีเมล ไฟล์ PDF โพสต์บนโซเชียล หรือมัลติมีเดียต่างๆ ก็สามารถเก็บรวบรวมไว้ใน Data Lake ได้
อย่างไรก็ตาม ส่วนสำคัญของ Data Lake คือ การรวบรวมข้อมูลดิบ จึงทำให้ข้อมูลมีความซับซ้อน ผู้ที่เข้าถึงข้อมูลจะต้องมีทักษะในการประมวลผลข้อมูล อย่างนักวิทยาศาสตร์ข้อมูล (Data Scientist) ที่สามารถสร้างโมเดล และวิเคราะห์ข้อมูลแบบเรียลไทม์ (Real-Time) ได้ นอกจากนี้ หาก User ทั่วไปต้องการเข้าถึงข้อมูลจาก Data Lake อาจจะต้องมีผู้เชี่ยวชาญเข้ามาช่วยสร้างระบบที่มีการจัดการ มีการวางระบบ Security และ Privacy ประกอบกับแปลงรูปแบบข้อมูลให้เข้าใจง่ายก่อน
Data Lake กับ eKYC
ในส่วนของการใช้งาน Data Lake ควบคู่กับการทำ eKYC หรือการระบุและพิสูจน์ตัวตนลูกค้าผ่านระบบอิเล็กทรอนิกส์ ธุรกิจสามารถใช้ Data Lake เป็นฐานข้อมูลรวมสำหรับเก็บรักษาและวิเคราะห์ข้อมูลลูกค้าได้ ซึ่งมีประโยชน์ในหลายด้าน เช่น
1. การนำเข้าข้อมูลที่ยืดหยุ่น
Data Lake สามารถรับข้อมูลจากแหล่งต่างๆ ได้ ไม่ว่าจะเป็นแบบฟอร์มลงทะเบียนออนไลน์ ข้อมูลทางชีวมิติ (Biometric) หรือข้อมูลจากระบบ OCR ซึ่งสามารถเก็บรักษาในรูปแบบเดิมภายใน Data Lake ได้
2. การรวบรวมข้อมูลจากหลายแหล่ง
แน่นอนว่ายุคนี้มี Customer Touchpoint หลายจุดที่สามารถให้ข้อมูลกับธุรกิจได้ ไม่ว่าจะเป็น POS, CRM หรือแอปพลิเคชันต่างๆ ซึ่งการรวบรวมไว้ใน Data Lake จะทำให้ธุรกิจมองเห็นภาพรวมของข้อมูลได้แบบ Unified View และตัดสินใจทางธุรกิจได้ดีขึ้น
3. รองรับข้อมูลที่เกิดขึ้นเร็ว
ข้อมูล Big Data นอกจากมีปริมาณมหาศาล (Volume) ยังเป็นข้อมูลที่เกิดขึ้นตลอดเวลาแทบทุกวินาที ซึ่งใน Data Lake จะมีเทคโนโลยีการทำ Data Streaming ซึ่งสามารถจับข้อมูลที่เกิดขึ้นแบบ Real-Time เพื่อนำมาประมวลผลได้ ซึ่งยิ่งธุรกิจมีข้อมูลมาก ก็ยิ่งได้เปรียบ Data Lake จึงตอบโจทย์ในการเก็บข้อมูล “เผื่อ” สำหรับใช้ในอนาคต
อีกหนึ่งสิ่งสำคัญที่ผู้ประกอบธุรกิจทุกท่านควรคำนึงเอาไว้ก็คือ ความปลอดภัยและความเป็นส่วนตัวของข้อมูล (Data Security & Privacy) เพราะอย่างที่ทราบกันดีว่าข้อมูลของลูกค้าที่ใช้ในกระบวนการ eKYC ล้วนเป็นข้อมูลส่วนบุคคลที่มีความอ่อนไหว ฉะนั้นในการออกแบบ Data Lake ควรวาง Security Protocol ที่รัดกุม รวมถึงการควบคุมการเข้าถึงข้อมูล การเข้ารหัสข้อมูล การติดตามการใช้งาน และเก็บข้อมูลอย่างเป็นไปตามกฎหมาย PDPA หรือ พ.ร.บ.คุ้มครองข้อมูลส่วนบุคคล
สรุปแล้ว Data Lake เป็นรูปแบบการเก็บข้อมูลที่ยืดหยุ่น และตอบโจทย์องค์กรในยุคปัจจุบัน ทั้งในด้านการเก็บ รวบรวม และวิเคราะห์ Big Data เพื่อค้นหา Insight และพัฒนาต่อในอนาคต สร้างข้อได้เปรียบแก่ธุรกิจท่ามกลางภูมิทัศน์ทางธุรกิจ (Business Landscape) ที่มีการเปลี่ยนแปลงอยู่ทุกวัน
TechX Data Platform จาก SCB TechX
ในยุคดิจิทัลที่ธุรกิจต้องอาศัย “ข้อมูล” เพื่อสร้างข้อได้เปรียบในการแข่งขันในตลาด โดยเฉพาะการเข้ามาของ Big Data ที่มีข้อมูลจำนวนมากเกิดขึ้นตลอดเวลา อาจทำให้ธุรกิจไม่สามารถจัดการกับข้อมูลในรูปแบบเดิมๆ ได้อีกต่อไป ดังนั้น SCB TechX จึงได้คิดค้นพัฒนาแพลตฟอร์มการจัดการข้อมูลแบบครบวงจร TechX Data Platform ขึ้น เพื่อช่วยตอบโจทย์ แก้ปัญหา และนำเสนอโซลูชันให้แก่ธุรกิจได้อย่างตรงจุดครอบคลุมรอบด้าน
บริการ TechX Data Platform จาก SCB TechX คือ โซลูชันสำหรับองค์กรที่เข้ามาช่วย บริหาร เก็บรวบรวม วิเคราะห์ และนำข้อมูลไปใช้อย่างมีประสิทธิภาพ โดยผู้เชี่ยวชาญด้านเทคโนโลยีชั้นนำของเมืองไทย
ทำไมต้องเลือก TechX Data Platform?
1. One-Stop Solution สำหรับธุรกิจ
บริการ Data Platform ของเราครอบคลุมทุกโซลูชันด้านการจัดการข้อมูล ไม่ว่าจะเป็น การบริหารจัดการข้อมูล (Data Management) การรวบรวมข้อมูล ( Data Integration) การจัดเก็บข้อมูล (Data Storage) ดูแลระบบฐานข้อมูล (Data Administration) การวิเคราะห์ข้อมูล (Data Analytics) ไปจนถึงการรักษาความปลอดภัยของข้อมูล (Governance Security) ด้วยเทคโนโลยีชาญฉลาดอย่าง AI และ Machine Learning ยกระดับประสิทธิภาพการทำ Data Analysis ขึ้นไปอีกขั้น
2. Tailor-Made เพื่อทุกธุรกิจทุกขนาด
TechX Data Platform เป็นแพลตฟอร์มที่สามารถ ปรับแต่ง (Customize) ให้เหมาะสมกับความต้องการใช้ข้อมูลของธุรกิจทุกขนาด ไม่ว่าจะเป็น สตาร์ทอัพ เอสเอ็มอี (SME) หรือองค์กรใหญ่ ปรับแต่งได้ตามความต้องการ ธุรกิจจึงสามารถจัดการข้อมูลที่ทันสมัยและเหมาะสมกับขนาดองค์กรที่สุด
3. Low-Code Solution เข้าถึงง่าย
Data Platform สามารถเชื่อมต่อเข้ากับซอฟต์แวร์หรือระบบต่างๆ ได้อย่างง่ายดาย ช่วยให้ธุรกิจโอนข้อมูล พร้อมทำงานร่วมกับเครื่องมือที่ธุรกิจคุ้นเคยอยู่แล้วได้ เช่น Power BI หรือ Tableau ได้อย่างสะดวก นอกจากนี้ Data Platform เป็นแพลตฟอร์มที่ออกแบบมาเพื่อใช้งานง่าย ผู้ใช้ไม่จำเป็นต้องมีความรู้ด้านการเขียน Code มาก ก็สามารถใช้งานแพลตฟอร์ม และเข้าถึงข้อมูลได้อย่างเต็มประสิทธิภาพ
4. ปลอดภัยและเชื่อถือได้
SCB TechX ร่วมมือกับผู้ให้บริการด้านข้อมูลและคลาวด์ชั้นนำระดับโลก เช่น Databricks, AWS, Microsoft Azure และ Google Cloud Platform จึงมั่นใจได้ในการดูแลความปลอดภัยของข้อมูล (Security and Reliability) TechX Data Platform ยังพร้อมรองรับการจัดการข้อมูลตามกรอบการกำกับดูแลข้อมูล (Data Governance Framework) และพระราชบัญญัติคุ้มครองข้อมูลส่วนบุคคล พ.ศ.2562 (PDPA) ด้วย
SCB TechX พร้อมให้บริการ Data Platform ทั้งรูปแบบ Platform as a Service และ Software as a Service ตอบโจทย์ที่แตกต่างตามความต้องการสำหรับธุรกิจคุณ
หากสนใจดูรายละเอียดบริการ แพลตฟอร์มการจัดการข้อมูล TechX Data Platform (คลิก)
สอบถามบริการด้าน Data Platform, บริการ eKYC และ โซลูชันอื่นๆเพิ่มเติม ได้ที่
Email: contact@scbtechx.io
ติดตาม SCB TechX เพื่อข่าวสารและอัปเดตใหม่ๆ ก่อนใคร
Facebook: SCB TechX
Medium: medium.com/scb-techx
LinkedIn: www.linkedin.com/company/scb-tech-x/
YouTube: SCB TechX