5 วิธีมาลองเพิ่ม Performance ให้ Model กัน 😁

5-ways-boost-model-performance

🚀 Accuracy พุ่งปรี๊ดดดดด ปร๋าดดดดดด 😋


✅ 1. Handling Missing Values

ลองจัดการกับ Missing Value ดูสิ
มีตั้งหลายวิธีช่วยเราจัดการกับปัญหาเหล่านี้นะ
เพราะเจ้าข้อมูลที่หายไปนี่แหละ เราไม่รู้ค่าที่แท้จริง
ถ้าจัดการรูปแบบต่างๆกันไป
ก็จะช่วยให้ Model เราเก่งขึ้นมาเลยล่ะ
วิธีการ Handling
🔹 ลองตัดแถวที่พบว่ามี Missing Value ทิ้งไปไปเลย
🔹 Impute หรือเติม Missing Value ผ่านตัวที่มีลักษณะข้อมูลคล้ายกัน ผ่าน KNN imputation
🔹 Impute หรือเติม Missing Value ผ่านการสร้าง Model ใหม่เพื่อมาเติมค่าว่างโดยเฉพาะไปเลย


✅ 2. Feature Engineering


สมมติเรามีข้อมูลอยู่เพียงไม่กี่ Features
Model คงเรียนรู้ได้ไม่เยอะมากนัก
เพราะข้อมูล หรือ Features เราไม่พอ
เราลองเพิ่มง่ายๆได้เช่น
🔹 การแปลง Datetime หรือ Timestamp เป็น ช่วงเช้า ช่วงกลางวัน หรือช่วงเย็น หรืออาจจะเป็น Workday, Workend ก็ยังได้
🔹 การปรับช่วงของ Numerical Data ให้กลายเป็นช่วงๆ หรือการทำ Discretization
🔹 การรวมกันของ Features 2 หรือ 3 Features เข้าด้วยกันผ่าน Function หนึ่ง เพื่อเกิดเป็นค่าให้ Column ใหม่


✅ 3. Feature Selection


Features น้อยไป Model ก็งอแงเรียนรู้แบบงูๆปลาๆ
Features เยอะไป Model ก็งอแงอีก เพราะเยอะไปสับสนไปหมด
การที่เราลด Features ลงบ้างเพื่อเน้นแต่ตัวที่สำคัญๆ ให้ Model ก็เป็นอีกทางเลือกที่ดีครับ
🔹 ลองใช้ Feature Importance จาก Model
🔹 ลองใช้ Dimensional Reduction เพื่อลด Features


✅ 4. Ensemble Learning Algorithms


เมื่อใช้ Model เดียวแล้วให้ผลไม่ดีเท่าที่ต้องการ
ทำไมไม่ลองใช้หลายๆ Model ช่วยกันไปเลยล่ะ
ง่ายๆแค่เนี้ย !!!!
และตัวที่เห็นภาพชัดสุดคงเป็น
การเปลี่ยนจาก Decision Tree เป็น Random Forest
ต้นเดียวเป็นหลายต้นไปเล้ยยยยย !!


✅ 5. Adjusting Hyper-parameters


Model ก็เหมือนกับเครื่องมือซักอย่างนี่แหละ
ในการจะดึงศักยภาพของแต่ละ Model
ให้ออกมาได้อย่างมีประสิทธิภาพนั้น
จริงๆแล้วเราก็เพียงต้องมานั่งปรับค่าบางค่าเพิ่มนิสหน่อยเอง
การใช้แต่ละ Model เพื่อรันกับ Data ที่แตกต่างไปนั้น
เราเพียงแค่ใช้ Hyper-parameters Tuning ให้เป็น
เช่นใน Decision Tree
เราต้องการกี่ใบ ?
ต้องการกี่ชั้น ?
ใช้เกณฑ์ใดในการแยก Class ถึงจะดี ?

❗ หมายเหตุ – ข้อแนะนำและควรระวังเพิ่มเติม ⚡

👉 ทั้ง 5 ข้อนี้เป็นเพียงส่วนหนึ่งที่ช่วยให้ Performance Model ดีขึ้น
👉 ยังมีอีกหลายวิธีในการ Boost Performance Model
👉 Accuracy เป็น Matrix ตัวนึงที่ไว้ใช้วัด Model ในโจทย์ปัญหา Classification
👉 โดยทั่วไปโจทย์ Regression จะใช้ RMSE หรือ Matrix ตัวอื่นๆแล้วแต่ความเหมาะสมของงานนั้นๆฮับ
👉 ในการทำ Model ควรระวังเรื่องของปัญหา Imbalanced Data ด้วย และจะอันตรายมากหากวัดผลโดยใช้ Accuracy กับ Data ที่ Imbalanced Data ฮับ


ติดตาม Tip & Tricks ง่ายๆไปด้วยกันได้ที่ BigData RPG
ส่งต่อบทความดีดี และมีประโยชน์ให้เพื่อนได้ง่ายๆ
เพียงคนละ 1 Like | 1 Share | 1 Comments
ขอบคุงมากเลยคร้าบ
❤️🙋‍♂️🙋‍♀️🍺🍣🍱🚀


Reference:

https://towardsdatascience.com/how-i-consistently-improve-my-machine-learning-models-from-80-to-over-90-accuracy-6097063e1c9a

=================================
เปิดแล้ว Road to Data Scientist and Data Analyst 🚀

Road to Data Scientist and Data Analyst


สอนทั้งฝั่ง Technical และ Business เย้
ได้ทั้ง Programming | Math | Machine Learning | Business
ครบครันพร้อม Boost ทักษะให้เพื่อนๆเห็นภาพชัดเจน
พร้อมทำ Projects, Research ในสายงาน Data Science
หรือนำทักษะไปประยุกต์ใช้ในสายงานที่ทำอยู่เดิมได้ทันทีเลย


📚 เรียนรวม 40++ ชั่วโมง 🚀
เฉลี่ยชั่วโมงละ 100 กว่าบาท คุ้มสุดๆ
ทั้งเนื้อหาเรียนสดด้วยกันตลอด 1 เดือน
และเนื้อหาเสริมปรับพื้นฐานให้เพื่อนๆ
สมัครได้แล้วตอนนี้

>> http://bit.ly/roadtodsda
🔥 เรามีส่วนลดให้ Early Bird เปิดตัวสูงถึง 40%
🔥 Early Bird ถึงวันที่ 15 กันยายน

🎥 เนื้อหาจัดเต็ม 🚀


✅ สัปดาห์ 1
🟣 พาไปเรียนรู้ Machine Learning และ Algorithm ในแบบต่างๆ
🟣 การเช็คคุณภาพข้อมูลรวมถึง การ Transform Data รูปแบบต่างๆ
🟣 พาไปเรียนรู้ Machine Learning และ Algorithm ในแบบต่างๆ
🟣 เรียนรู้ Customer Analytics ในมุมมองต่างๆ


✅ สัปดาห์ 2
🟣 การจัดการ Data ที่ไม่ปกติ หรือมีจำนวนน้อยมากๆ
🟣 การ Tuning Model ให้มีประสิทธิภาพดีขึ้น
🟣 การสร้าง Pipeline สำหรับการทำ Machine Leaning Model
🟣 การอธิบาย Model ในมุม Business
🟣 เรียนรู้ Marketing Analytics ในมุมมองต่างๆ


✅ สัปดาห์ 3
🟣 เรามาทำความเข้าใจ Deep Learning Model ในรูปแบบต่างๆ
🟣 Business model ของ Supply Chain
🟣 การวางแผนกลยุทธ์ ให้ Demand และ Supply
🟣 การทำ Demand Forecast


✅ สัปดาห์ 4
🟣 Projects ในการนำ Machine Learning และ Deep Learning
มาใช้ในการช่วยแก้ปัญหา Business รวมถึงการนำมาช่วยเพิ่ม Value ให้กับ Business
🟣 การนำเสนอข้อมูล และ Present เพื่อนำเสนอฝั่ง Business


นอกจากนี้ยังมี Video ปรับพื้นฐานให้เพื่อนๆด้วย
🐍 Python for Everyone
🔵 Basic Python Programming
🔵 NumPy for Linear Algebra
🔵 Pandas for Data Manipulation
🔵 Data Visualization with Seaborn


🐍 Math and Statistics for Machine Learning
🔵 Linear Algebra
🔵 Calculus
🔵 Probability

สมัครได้เลยตอนนี้
🔥 เรามีส่วนลดให้ Early Bird เปิดตัวสูงถึง 40%
🔥 Early Bird ถึงวันที่ 15 กันยายน
>> http://bit.ly/roadtodsda
.
แล้วเจอกันครับ ^^
แอดบอยด์ 🙋‍♂️
แอดเมย์ 🙋‍♀️

Published by BigData RPG

I'm just Ordinary Data Scientist who love in A.I., Machine learning, Deep Learning, and Business.

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out /  เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out /  เปลี่ยนแปลง )

Connecting to %s

%d bloggers like this: