Feature Engineering เป็นขั้นตอนสำคัญของการ Collect Data เพื่อพัฒนา Machine Learning ให้ Model ทำนายผลได้แม่นยำมากขึ้น คอลัมภ์ Tech Tips วันนี้จึงขอเชิญ Data Scientist จาก SCB TechX คุณแจน คุลิกา กิจสโชค มาช่วยแนะนำเทคนิคการทำ Feature Engineering หากท่านใดสนใจนำไปใช้โปรดคลิกอ่าน Tips 1 นาทีนี้กันได้เลยค่ะ โดยเคล็ดลับทำ Feature Engineering มี 5 ขั้นดังนี้
1. Imputation: ให้แทนข้อมูลที่มีค่าว่าง (Null) ด้วยค่า Mode, Mean, Median หรือ 0
2. Log Transform: ลดการเบ้ของข้อมูล โดยการ Take Log ไปที่ตัวแปรนั้นๆ โดยจะใช้กับข้อมูลเชิงตัวเลขที่มีช่วงของข้อมูลกว้างมากๆ เช่น ยอดขาย
3. One-Hot Encoding: Transfrom ข้อมูลที่เป็น Categorical ในแนวแถว ให้เป็นแนวคอลัมน์ และใส่ 1 หากมีค่าตรงกับข้อมูลนั้น และใส่ 0 ในคอลัมน์อื่นๆ
4. Handling Outliers: ตัดข้อมูลที่ค่าสูงหรือต่ำกว่าข้อมูลส่วนใหญ่ โดยพิจารณาจาก Quartilesหรือ Percentiles
5. Binning: จัดข้อมูลตัวเลขออกเป็นกลุ่มๆ เช่น ข้อมูลรายได้ ให้จัดออกมาเป็นกลุ่ม High, Medium หรือ Low
ใช้เทคนิคเพียงเท่านี้ก็ช่วยขจัดข้อมูล Error พร้อมเพิ่มประสิทธิภาพของโมเดลให้ทำนายได้แม่นยำ เหมาะแก่การนำไปใช้กับงานและธุรกิจ
ท้ายนี้บริษัท SCB TechX ให้บริการด้านการจัดการข้อมูลแบบครบวงจร TechX Data & AI Solutions ที่คิดค้นและออกแบบโดยผู้เชี่ยวชาญที่มีประสบการณ์ตรงในการพัฒนา และ Deliver Data ให้แก่องค์กรชั้นนำมากมาย
หากท่านใดสนใจสามารถสอบถามข้อมูลเพิ่มเติมได้ที่ 👉 contact@scbtechx.io
อ่านรายละเอียดเพิ่มเติมที่👉 https://bit.ly/3Q2a9vd