ปัจจุบันการพัฒนาตัวโมเดลที่ใช้วิเคราะห์ข้อมูลมีความซับซ้อน โมเดลส่วนใหญ่จึงมีความซับซ้อนตามไปด้วย ไม่สามารถอธิบายการทำงานได้แม้ผลลัพธ์จะถูกก็ตาม ทำให้ขาดความน่าเชื่อถือ เช่น Deep Learning Model ที่นำรูปมาทำนายมะเร็งปอด แม้ผลจะถูกต้อง แต่ไม่สามารถให้เหตุผลการวินิจฉัยได้ วันนี้เลยขอชวนกูรูด้าน Data คุณ แบงค์ ภูมิพงศ์ แก้วอำไพ Senior Data Scientist จาก SCB TechX มาแชร์เทคนิคการแก้ปัญหานี้ด้วย Lime สั้นๆเพียง 1 นาที
เรานิยมนำเทคนิค LIME (Local Interpretable Model-Agnostic Explanations) มาใช้แก้ปัญหาเพราะ LIME เป็นเหมือนล่ามแปลภาษาที่ซับซ้อนให้เข้าใจง่ายขึ้น โดยขั้นตอนการทำงานของ LIME มีเพียง 4 ขั้นตอนดังนี้
- เลือกจุดตัวอย่าง: นำจุดตัวอย่างหรือบางส่วนของข้อมูลเดิมมาสร้างเป็นข้อมูลชุดใหม่ โดยใช้โมเดลเดิมทำนายผล
- ให้ค่าน้ำหนัก: ถ้าข้อมูลชุดใหม่มีความคล้ายข้อมูลชุดเดิมมาก ให้ค่าน้ำหนักสูง
- สร้างโมเดลใหม่: นำข้อมูลที่มีน้ำหนักสูงจากข้อ 2 มาสร้างโมเดลใหม่ที่อธิบายได้อย่างแม่นยำ เช่น Linear Model, Decision Tree
- อธิบายผลการทำนาย: นำโมเดลใหม่ที่ได้จากข้อ 3 ไปอธิบายจุดตัวอย่างของข้อมูลที่เราเลือกมาจากข้อ 1
เทคนิค LIME เหมาะกับการอธิบายจุดตัวอย่างที่เราเลือก ช่วยให้เข้าใจการทำงานของโมเดลง่ายขึ้น ตัดสินใจดีขึ้น และเพิ่มความน่าเชื่อถือ แต่ไม่เหมาะกับการใช้อธิบายข้อมูลทั้งชุด
ท้ายนี้บริษัท SCB TechX ให้บริการด้านการจัดการข้อมูลแบบครบวงจร TechX Data Platform ที่คิดค้นและออกแบบโดยผู้เชี่ยวชาญที่มีประสบการณ์ตรงในการพัฒนา และ Deliver Data ให้แก่องค์กรชั้นนำมากมาย
Credit: https://bit.ly/3u1p2H5
หากท่านใดสนใจสามารถสอบถามข้อมูลเพิ่มเติมได้ที่ contact@scbtechx.io
อ่านรายละเอียดเพิ่มเติมที่ https://bit.ly/3Q2a9vd