Data Scientist เป็นอาชีพที่ต้องใช้ทักษะที่หลากหลาย
เช่น Coding, Stats, Machine Learning
และยังมี Soft Skils อีกหลายอย่างในการทำงาน
วันนี้แอดไปเจอบทความนึงน่าสนใจ
เกี่ยวกับการเพิ่ม Skills ให้กับอาชีพ Data Scientist
ซึ่งบทความเค้าบอกมาเพียง 3 ข้อ
แต่ต้องบอกก่อนว่า Skills ที่เพิ่ม Values
บนโลกนี้มันมีเยอะมากๆเลยนะ
ดังนั้นอย่าจดจ่อกับพัฒนาเพียงแค่ 3 ทักษะนี้
แต่ถ้าเพื่อนๆยังไม่มี 3 สิ่งนี้
ก็ถือว่าเป็นโอกาสที่ดีงามเลย
ในการพัฒนาทักษะ หรือ Skills เหล่านี้ไปด้วยกัน
🔨 ข้อที่ 1. การสร้าง Data Pipeline
Data Pipeline เป็นกระบวนการเตรียมข้อมูล
เพื่อใช้งานตามวัตถุประสงค์ที่เราต้องการ
หลายๆที่ก็ให้ตัวย่อนิยามสั้นๆว่า ETL
หรือบางที่ก็อาจจะเรียงเป็น ELT
โดยที่แต่ละแบบก็มีประโยชน์แตกต่างกันไป
ซึ่ง Data Pipeline คือการนำ Data ที่จะใช้งานมารวมกัน
ทำการ Validate Data, Cleaning, Transforming
และ Loading เก็บไว้ใน Storage ที่พร้อมใช้งาน
..
ทั้งนี้ในมุมของ Data Scientist อย่างเราๆ
ก็ทำการเตรียม Data เพื่อใช้ในการทำ ML
เพื่อลดเวลาในการเตรียม Data
และทำให้งาน Data Scalable
รวมถึงเพิ่ม Productivity ของงาน ML อีกด้วย
นอกจากนี้ ยังช่วยในเรื่องของการทำ Datat Analytics
และยังเป็นส่วนที่ช่วย Generate New Features
หรือการทำ Features Engineering เพิ่มนั่นเอง
👷♀ข้อที่ 2 คือ Feature Engineering
การ Transform Data ที่มีสกัดมันออกมาให้ได้อีกชุด
โดย Data ใหม่ก็มีลักษณะใหม่ที่ช่วยในการทำ ML
FE หรือ Feature Engineering นั้นมีส่วนสำคัญมากๆ
ในการเพิ่มประสิทธิภาพในการทำ Model
ทั้งในเรื่องของ Performance
และการทำ Explainability เพื่ออธิบายโมเดล
..
FE มีประโยชน์มากๆในการ Transform ข้อมูล
โดยเฉพาะอย่างยิ่งข้อมูลจำพวก Time series
หรือข้อมูลที่มีความสัมพันธ์ต่อเนื่องซึ่งกันและกัน
สิ่งสำคัญที่อยากฝากไว้ของการทำ FE
คือการทำ FE นั้น Feature ใหม่ที่ได้
มันอธิบายได้ไหมว่าคืออะไร
แล้วเราทำไปทำไม
..
FE บางครั้งก็ทำออกมาเพื่อให้ Model เก่งขึ้น
แต่ก็ไม่สามารถอธิบายได้ว่าทำไม
แต่ FE ที่สามารถอธิบายได้
ว่ามันคือ Feature อะไรนั้น
ยิ่งเป็นเรื่องที่ดีในการนำไปใช้งานต่อ
..
ยกตัวอย่างเช่น
FE ที่สร้างจากการเฉลี่ยของข้อมูลย้อนหลัง 2 นาที
FE ที่สร้างจากการเฉลี่ยของข้อมูลย้อนหลัง 3 นาที
FE ที่สร้างจากการเฉลี่ยของข้อมูลย้อนหลัง 4 นาที
แต่ละตัวก็มีความแตกต่างกัน
และทำให้เราเข้าใจถึงความสำคัญของ Feature
กับการใช้สร้าง Model ทำนายอนาคตอีกด้วย
👩🔬 ข้อที่ 3 Deep Dives Analysis
คือการค้นหาความจริงเบื้องหลังคำถามที่เราตั้งไว้
เช่น ทำไมค่าครองชีพสูงขึ้น 20% เมื่อเทียบกับเดือนที่แล้ว
ยิ่งเราค้นหาคำตอบได้ลึกเท่าไหร่ เราก็ยิ่งเข้าใจ
ว่าทำไมค่าครองชีพถึงสูงขึ้น 20% เมื่อเทียบกับเดือนที่แล้ว
..
(เรื่องสมมตินะครับ ไม่เกิดขึ้นกับประเทศเราหร่อก) 🤫
..
ดังนั้นยิ่งเราสงสัยมากเท่าไหร่
ยิ่งทำให้เราเจอคำตอบที่ชัดเจนมากยิ่งขึ้น
แต่สำคัญเลยคือการตั้งคำถามที่ละเอียด
และครอบคลุมสิ่งที่เราจะไปค้นหาต่อ
ในบางครั้งการที่เราขุดลึกไปเรื่อยๆ
ก็ยิ่งทำให้เราเจอข้อมูลที่เราอาจจะไม่เคยคิดถึงมาก่อน
หรืออาจจะเจอโอกาสทองใหม่ๆ
ที่สามารถช่วยในเรื่องอื่นๆ
เช่น Business Improvement ก็เป็นไปได้
..
การขุดลึกลงไปเพื่อตอบความสงสัย
ก็ยังมอบโอกาสให้เราได้เข้าใจ Products
เช่น
“ทำไมในประเทศถึงมีคนเรียนจบปริญญาเอกเป็นสัดส่วนน้อยมากเพียง 1 % เมื่อเทียบกับนักเรียนที่จบปริญญาตรี”
..
แต่ทั้งนี้การทำ Deep Dive Analysis ก็ไม่ได้ง่าย
มันจึงสร้าง Values ให้กับอาชีพ DS อย่างมาก
มันช่วยตอบความสงสัยไคร่รู้ในการทำงาน
และช่วยเพิ่ม Business Values ในมุมที่ซ่อนอยู่ด้วยนั่นเอง