5-ways-boost-model-performance

5 วิธีมาลองเพิ่ม Performance ให้ Model กัน 😁

🚀 Accuracy พุ่งปรี๊ดดดดด ปร๋าดดดดดด 😋


✅ 1. Handling Missing Values

ลองจัดการกับ Missing Value ดูสิ
มีตั้งหลายวิธีช่วยเราจัดการกับปัญหาเหล่านี้นะ
เพราะเจ้าข้อมูลที่หายไปนี่แหละ เราไม่รู้ค่าที่แท้จริง
ถ้าจัดการรูปแบบต่างๆกันไป
ก็จะช่วยให้ Model เราเก่งขึ้นมาเลยล่ะ
วิธีการ Handling
🔹 ลองตัดแถวที่พบว่ามี Missing Value ทิ้งไปไปเลย
🔹 Impute หรือเติม Missing Value ผ่านตัวที่มีลักษณะข้อมูลคล้ายกัน ผ่าน KNN imputation
🔹 Impute หรือเติม Missing Value ผ่านการสร้าง Model ใหม่เพื่อมาเติมค่าว่างโดยเฉพาะไปเลย


✅ 2. Feature Engineering


สมมติเรามีข้อมูลอยู่เพียงไม่กี่ Features
Model คงเรียนรู้ได้ไม่เยอะมากนัก
เพราะข้อมูล หรือ Features เราไม่พอ
เราลองเพิ่มง่ายๆได้เช่น
🔹 การแปลง Datetime หรือ Timestamp เป็น ช่วงเช้า ช่วงกลางวัน หรือช่วงเย็น หรืออาจจะเป็น Workday, Workend ก็ยังได้
🔹 การปรับช่วงของ Numerical Data ให้กลายเป็นช่วงๆ หรือการทำ Discretization
🔹 การรวมกันของ Features 2 หรือ 3 Features เข้าด้วยกันผ่าน Function หนึ่ง เพื่อเกิดเป็นค่าให้ Column ใหม่


✅ 3. Feature Selection


Features น้อยไป Model ก็งอแงเรียนรู้แบบงูๆปลาๆ
Features เยอะไป Model ก็งอแงอีก เพราะเยอะไปสับสนไปหมด
การที่เราลด Features ลงบ้างเพื่อเน้นแต่ตัวที่สำคัญๆ ให้ Model ก็เป็นอีกทางเลือกที่ดีครับ
🔹 ลองใช้ Feature Importance จาก Model
🔹 ลองใช้ Dimensional Reduction เพื่อลด Features


✅ 4. Ensemble Learning Algorithms


เมื่อใช้ Model เดียวแล้วให้ผลไม่ดีเท่าที่ต้องการ
ทำไมไม่ลองใช้หลายๆ Model ช่วยกันไปเลยล่ะ
ง่ายๆแค่เนี้ย !!!!
และตัวที่เห็นภาพชัดสุดคงเป็น
การเปลี่ยนจาก Decision Tree เป็น Random Forest
ต้นเดียวเป็นหลายต้นไปเล้ยยยยย !!


✅ 5. Adjusting Hyper-parameters


Model ก็เหมือนกับเครื่องมือซักอย่างนี่แหละ
ในการจะดึงศักยภาพของแต่ละ Model
ให้ออกมาได้อย่างมีประสิทธิภาพนั้น
จริงๆแล้วเราก็เพียงต้องมานั่งปรับค่าบางค่าเพิ่มนิสหน่อยเอง
การใช้แต่ละ Model เพื่อรันกับ Data ที่แตกต่างไปนั้น
เราเพียงแค่ใช้ Hyper-parameters Tuning ให้เป็น
เช่นใน Decision Tree
เราต้องการกี่ใบ ?
ต้องการกี่ชั้น ?
ใช้เกณฑ์ใดในการแยก Class ถึงจะดี ?

❗ หมายเหตุ – ข้อแนะนำและควรระวังเพิ่มเติม ⚡

👉 ทั้ง 5 ข้อนี้เป็นเพียงส่วนหนึ่งที่ช่วยให้ Performance Model ดีขึ้น
👉 ยังมีอีกหลายวิธีในการ Boost Performance Model
👉 Accuracy เป็น Matrix ตัวนึงที่ไว้ใช้วัด Model ในโจทย์ปัญหา Classification
👉 โดยทั่วไปโจทย์ Regression จะใช้ RMSE หรือ Matrix ตัวอื่นๆแล้วแต่ความเหมาะสมของงานนั้นๆฮับ
👉 ในการทำ Model ควรระวังเรื่องของปัญหา Imbalanced Data ด้วย และจะอันตรายมากหากวัดผลโดยใช้ Accuracy กับ Data ที่ Imbalanced Data ฮับ


ติดตาม Tip & Tricks ง่ายๆไปด้วยกันได้ที่ BigData RPG
ส่งต่อบทความดีดี และมีประโยชน์ให้เพื่อนได้ง่ายๆ
เพียงคนละ 1 Like | 1 Share | 1 Comments
ขอบคุงมากเลยคร้าบ
❤️🙋‍♂️🙋‍♀️🍺🍣🍱🚀


Reference:

https://towardsdatascience.com/how-i-consistently-improve-my-machine-learning-models-from-80-to-over-90-accuracy-6097063e1c9a

=================================
เปิดแล้ว Road to Data Scientist and Data Analyst 🚀

Road to Data Scientist and Data Analyst


สอนทั้งฝั่ง Technical และ Business เย้
ได้ทั้ง Programming | Math | Machine Learning | Business
ครบครันพร้อม Boost ทักษะให้เพื่อนๆเห็นภาพชัดเจน
พร้อมทำ Projects, Research ในสายงาน Data Science
หรือนำทักษะไปประยุกต์ใช้ในสายงานที่ทำอยู่เดิมได้ทันทีเลย


📚 เรียนรวม 40++ ชั่วโมง 🚀
เฉลี่ยชั่วโมงละ 100 กว่าบาท คุ้มสุดๆ
ทั้งเนื้อหาเรียนสดด้วยกันตลอด 1 เดือน
และเนื้อหาเสริมปรับพื้นฐานให้เพื่อนๆ
สมัครได้แล้วตอนนี้

>> http://bit.ly/roadtodsda
🔥 เรามีส่วนลดให้ Early Bird เปิดตัวสูงถึง 40%
🔥 Early Bird ถึงวันที่ 15 กันยายน

🎥 เนื้อหาจัดเต็ม 🚀


✅ สัปดาห์ 1
🟣 พาไปเรียนรู้ Machine Learning และ Algorithm ในแบบต่างๆ
🟣 การเช็คคุณภาพข้อมูลรวมถึง การ Transform Data รูปแบบต่างๆ
🟣 พาไปเรียนรู้ Machine Learning และ Algorithm ในแบบต่างๆ
🟣 เรียนรู้ Customer Analytics ในมุมมองต่างๆ


✅ สัปดาห์ 2
🟣 การจัดการ Data ที่ไม่ปกติ หรือมีจำนวนน้อยมากๆ
🟣 การ Tuning Model ให้มีประสิทธิภาพดีขึ้น
🟣 การสร้าง Pipeline สำหรับการทำ Machine Leaning Model
🟣 การอธิบาย Model ในมุม Business
🟣 เรียนรู้ Marketing Analytics ในมุมมองต่างๆ


✅ สัปดาห์ 3
🟣 เรามาทำความเข้าใจ Deep Learning Model ในรูปแบบต่างๆ
🟣 Business model ของ Supply Chain
🟣 การวางแผนกลยุทธ์ ให้ Demand และ Supply
🟣 การทำ Demand Forecast


✅ สัปดาห์ 4
🟣 Projects ในการนำ Machine Learning และ Deep Learning
มาใช้ในการช่วยแก้ปัญหา Business รวมถึงการนำมาช่วยเพิ่ม Value ให้กับ Business
🟣 การนำเสนอข้อมูล และ Present เพื่อนำเสนอฝั่ง Business


นอกจากนี้ยังมี Video ปรับพื้นฐานให้เพื่อนๆด้วย
🐍 Python for Everyone
🔵 Basic Python Programming
🔵 NumPy for Linear Algebra
🔵 Pandas for Data Manipulation
🔵 Data Visualization with Seaborn


🐍 Math and Statistics for Machine Learning
🔵 Linear Algebra
🔵 Calculus
🔵 Probability

สมัครได้เลยตอนนี้
🔥 เรามีส่วนลดให้ Early Bird เปิดตัวสูงถึง 40%
🔥 Early Bird ถึงวันที่ 15 กันยายน
>> http://bit.ly/roadtodsda
.
แล้วเจอกันครับ ^^
แอดบอยด์ 🙋‍♂️
แอดเมย์ 🙋‍♀️

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  เปลี่ยนแปลง )

Google photo

You are commenting using your Google account. Log Out /  เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out /  เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out /  เปลี่ยนแปลง )

Connecting to %s