โดดเด่นขึ้นด้วย 3 ทักษะ

Data Scientist เป็นอาชีพที่ต้องใช้ทักษะที่หลากหลาย
เช่น Coding, Stats, Machine Learning
และยังมี Soft Skils อีกหลายอย่างในการทำงาน

วันนี้แอดไปเจอบทความนึงน่าสนใจ
เกี่ยวกับการเพิ่ม Skills ให้กับอาชีพ Data Scientist
ซึ่งบทความเค้าบอกมาเพียง 3 ข้อ
แต่ต้องบอกก่อนว่า Skills ที่เพิ่ม Values
บนโลกนี้มันมีเยอะมากๆเลยนะ
ดังนั้นอย่าจดจ่อกับพัฒนาเพียงแค่ 3 ทักษะนี้
แต่ถ้าเพื่อนๆยังไม่มี 3 สิ่งนี้
ก็ถือว่าเป็นโอกาสที่ดีงามเลย
ในการพัฒนาทักษะ หรือ Skills เหล่านี้ไปด้วยกัน

🔨 ข้อที่ 1. การสร้าง Data Pipeline

Data Pipeline เป็นกระบวนการเตรียมข้อมูล
เพื่อใช้งานตามวัตถุประสงค์ที่เราต้องการ
หลายๆที่ก็ให้ตัวย่อนิยามสั้นๆว่า ETL
หรือบางที่ก็อาจจะเรียงเป็น ELT
โดยที่แต่ละแบบก็มีประโยชน์แตกต่างกันไป
ซึ่ง Data Pipeline คือการนำ Data ที่จะใช้งานมารวมกัน
ทำการ Validate Data, Cleaning, Transforming
และ Loading เก็บไว้ใน Storage ที่พร้อมใช้งาน
..
ทั้งนี้ในมุมของ Data Scientist อย่างเราๆ
ก็ทำการเตรียม Data เพื่อใช้ในการทำ ML
เพื่อลดเวลาในการเตรียม Data
และทำให้งาน Data Scalable
รวมถึงเพิ่ม Productivity ของงาน ML อีกด้วย
นอกจากนี้ ยังช่วยในเรื่องของการทำ Datat Analytics
และยังเป็นส่วนที่ช่วย Generate New Features
หรือการทำ Features Engineering เพิ่มนั่นเอง

👷‍♀ข้อที่ 2 คือ Feature Engineering

การ Transform Data ที่มีสกัดมันออกมาให้ได้อีกชุด
โดย Data ใหม่ก็มีลักษณะใหม่ที่ช่วยในการทำ ML
FE หรือ Feature Engineering นั้นมีส่วนสำคัญมากๆ
ในการเพิ่มประสิทธิภาพในการทำ Model
ทั้งในเรื่องของ Performance
และการทำ Explainability เพื่ออธิบายโมเดล
..
FE มีประโยชน์มากๆในการ Transform ข้อมูล
โดยเฉพาะอย่างยิ่งข้อมูลจำพวก Time series
หรือข้อมูลที่มีความสัมพันธ์ต่อเนื่องซึ่งกันและกัน
สิ่งสำคัญที่อยากฝากไว้ของการทำ FE
คือการทำ FE นั้น Feature ใหม่ที่ได้
มันอธิบายได้ไหมว่าคืออะไร
แล้วเราทำไปทำไม
..
FE บางครั้งก็ทำออกมาเพื่อให้ Model เก่งขึ้น
แต่ก็ไม่สามารถอธิบายได้ว่าทำไม
แต่ FE ที่สามารถอธิบายได้
ว่ามันคือ Feature อะไรนั้น
ยิ่งเป็นเรื่องที่ดีในการนำไปใช้งานต่อ
..
ยกตัวอย่างเช่น
FE ที่สร้างจากการเฉลี่ยของข้อมูลย้อนหลัง 2 นาที
FE ที่สร้างจากการเฉลี่ยของข้อมูลย้อนหลัง 3 นาที
FE ที่สร้างจากการเฉลี่ยของข้อมูลย้อนหลัง 4 นาที
แต่ละตัวก็มีความแตกต่างกัน
และทำให้เราเข้าใจถึงความสำคัญของ Feature
กับการใช้สร้าง Model ทำนายอนาคตอีกด้วย

👩‍🔬 ข้อที่ 3 Deep Dives Analysis

คือการค้นหาความจริงเบื้องหลังคำถามที่เราตั้งไว้
เช่น ทำไมค่าครองชีพสูงขึ้น 20% เมื่อเทียบกับเดือนที่แล้ว
ยิ่งเราค้นหาคำตอบได้ลึกเท่าไหร่ เราก็ยิ่งเข้าใจ
ว่าทำไมค่าครองชีพถึงสูงขึ้น 20% เมื่อเทียบกับเดือนที่แล้ว
..
(เรื่องสมมตินะครับ ไม่เกิดขึ้นกับประเทศเราหร่อก) 🤫
..
ดังนั้นยิ่งเราสงสัยมากเท่าไหร่
ยิ่งทำให้เราเจอคำตอบที่ชัดเจนมากยิ่งขึ้น
แต่สำคัญเลยคือการตั้งคำถามที่ละเอียด
และครอบคลุมสิ่งที่เราจะไปค้นหาต่อ
ในบางครั้งการที่เราขุดลึกไปเรื่อยๆ
ก็ยิ่งทำให้เราเจอข้อมูลที่เราอาจจะไม่เคยคิดถึงมาก่อน
หรืออาจจะเจอโอกาสทองใหม่ๆ
ที่สามารถช่วยในเรื่องอื่นๆ
เช่น Business Improvement ก็เป็นไปได้
..
การขุดลึกลงไปเพื่อตอบความสงสัย
ก็ยังมอบโอกาสให้เราได้เข้าใจ Products
เช่น
“ทำไมในประเทศถึงมีคนเรียนจบปริญญาเอกเป็นสัดส่วนน้อยมากเพียง 1 % เมื่อเทียบกับนักเรียนที่จบปริญญาตรี”
..
แต่ทั้งนี้การทำ Deep Dive Analysis ก็ไม่ได้ง่าย
มันจึงสร้าง Values ให้กับอาชีพ DS อย่างมาก
มันช่วยตอบความสงสัยไคร่รู้ในการทำงาน
และช่วยเพิ่ม Business Values ในมุมที่ซ่อนอยู่ด้วยนั่นเอง

Reference

https://towardsdatascience.com/3-most-valuable-data-science-skills-that-increased-my-salary-by-60-89b4bbe0b34f

Published by BigData RPG

I'm just Ordinary Data Scientist who love in A.I., Machine learning, Deep Learning, and Business.

ใส่ความเห็น

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  เปลี่ยนแปลง )

Twitter picture

You are commenting using your Twitter account. Log Out /  เปลี่ยนแปลง )

Facebook photo

You are commenting using your Facebook account. Log Out /  เปลี่ยนแปลง )

Connecting to %s

%d bloggers like this: