ครั้งแรกที่แอดสัมภาษณ์งาน ก็นานมาแล้ว 🍭
สมัยก่อนอาจจะไม่ได้มีการสัมโหดเท่าสมัยนี้
ดังนั้น เมื่อเวลาผ่านไปเรามาดูกันดีกว่า
ว่ามีสิ่งใดบ้างที่เราควรเก็บค่าประสบการณ์
ก่อนการสัมภาษณ์ในครั้งหน้าที่จะถึง
🐣 เริ่มต้นกันที่ ทฤษฎี ก่อนเลย
🍣 1 Part ของสถิติ
- จงบอกความแตกต่างของ Population และ Sample
- อะไรคือ Hypothesis Testing
- P-value คืออะไร ไว้วัดอะไร
- อะไรคือความแตกต่างของ Type I และ Type II Error
- จะเกิดอะไรขึ้นถ้าตัวแปร X และ Y เป็นอิสระต่อกัน (Independent)
- อะไรคือ Central Limit Theorem
- อธิบายความแตกต่างของ Correlation และ Covariance
- อะไรคือ Law of Large number
- เรามีวิธีจัดการ Outlier ได้อย่างไร
- เรามีวิธีจัดการ Missing Value ได้อย่างไร
ตอบถูกกันกี่ข้อเอ่ยยยยยย
ขอไหนตอบไม่ได้จดไว้แล้วไปหาคำตอบต่อได้เลยนะ เอออ
อย่าปล่อยเลยไป 😉
⭐ 2 Part Machine Learning
- อะไรคือความแตกต่างระหว่าง Supervised และ Unsupervised Learning
- อะไรคือ Confusion Matrix อธิบายออกมา
- อธิบายถึงการวัด Accuracy, Precision, Recall และ F1-Score
- อะไรคือความแตกต่างระหว่าง Decision Tree และ Random Forest
- Random Forest มีการสร้างต้นไม้ใหม่อย่างไร
- ยกตัวอย่างการนำ Logistic Regression ไปใช้ใน Business 2 เคส
- อะไรคือ Bias-variance trade-off แล้วมีวิธีแก้อย่างไร
- มีวิธีแก้ Overfitting อย่างไร
- LightGBM ต่างกันกับ Random Forest อย่างไร
- อะไรคือ Bagging และ Boosting Algorithms ต่างกันอย่างไร
📸 3 Part Deep Learning
- Deep Learning มีการทำงานอย่างไร
- ทำไม Deep Learning ถึงเป็นที่นิยม
- ข้อจำกัดของ Deep Leaning มีอะไรบ้าง
- อธิบายวิธีคำนวณ Backpropagation
- อธิบายการทำงานของ Gradient Decent
- การเลือก Optimizer ที่ต่างกันส่งผลอย่างไรบ้างต่อ Model
- Batch Normalization คืออะไร
- อะไรคือ Regularization
- วิธีในการเลือก Parameter ที่เหมาะสมสำหรับ Model
- อธิบาย Grid Search แตกต่างจาก Random Search อย่างไร
❄ 4 Part Technology ที่ใช้
- SQL, Python กับการนำไปใช้งาน
- การใช้งาน Git
- อะไรคือ Docker และการใช้งาน
- อะไรคือ Orchrestration Tools ยกตัวอย่างและการใช้งาน
- อะไรคือ API
- การใช้งาน Cloud ในงาน DS Projects
🥋 5 Part Use case
- อธิบายการ Implement Recommendation System และการวัดผล
- A/B Testing คืออะไร และการวัดผล
- ให้โจทย์ Business ไปแล้ว อธิบายการ Implement เลย
Part นี้ค่อนข้าง Applied
ดังนั้นต้องพยายามอ่าน Use case เยอะๆ
ทั้งด้าน Architecture และการวัดผลแต่ละงาน
🐣 ต่อมาก็ Coding กันจริงๆละ
ก็จะเจอคำถามเช่น SQL และ Python เป็นหลัก
บางที่อาจจะเจอแค่ Python
บางที่ก็เจอทั้งสองเลย
ทั้งนี้บางที่ก็อาจจะให้ Test กลับไปทำ
หรือบางที่ก็ Live Coding กันสดๆไปเลย
เขียนต่อหน้ากันเลย (อันนี้แอดเคยเจอมา 😱)
แต่ส่วนใหญ่จะเป็น Test Coding บนเวปไซต์นะ
😎 คำเตือนก่อนการสัมภาษณ์
🟢 แต่ละบริษัทมีการถามที่ไม่เหมือนกัน
🟢 แม้บางครั้งจ้างเราไปเป็น DS แต่งานทำเป็น ตำแหน่งอื่นก็มี ดังนั้นคำถามจึงอาจจะเกินขอบเขตได้
🟢 ขนาดของบริษัทก็มีผลกับคำถาม
🟢 บริษัทที่สัมนั้นเป็น Business จ๋าาไหม หรือเข้าไปทำ Product ด้าน AI !? ก็ต่างกันละเรื่องคำถาม
🟢 เราเข้าไปในระดับไหน Junior, Senior, หรือ Lead แต่ละระดับก็มีคำถามแตกต่างกันไปอีก
🟢 ในความเป็นจริงเราอาจจะเจอคำถามมากกว่านี้ได้ หรืออาจจะไม่เจอคำถามเลยก็ได้เช่นเดียวกัน !
🟢 DS บางตำแหน่งเน้นไปยังเฉพาะด้าน เช่น NLP, Computer Vision, IoT และอื่นๆ ดังนั้นอาจจะเจอคำถามที่ลึกกว่านี้
🟢 บางที่ก็อยากเห็นแนวคิดทาง Business เรา ก็จะให้ dataset มาแล้วส่ง Code และผลนำเสนอไปให้เขา
🟢 ถ้าเจอคำถามที่ไม่รู้จริงๆ อย่าแถ อันตรายมาก
🟢 ถ้าพอจะจำคำตอบได้แต่ไม่แน่ใจ ค่อยๆอธิบาย และบอกตามความเป็นจริงที่เข้าใจ
ถึงตรงนี้แล้วอย่าพึ่งดีใจกับคะแนนที่มาก
หรือเสียใจว่าตอบไม่ได้เลย
ให้ลองจดในสิ่งที่ทำไม่ได้ และค้นหาเพิ่มเติม
ส่วนคนที่ทำได้ ก็อาจจะไปเจอคำถามอื่นก็ได้ ใครจะรู้
และ Data Scientist ก็มีคำถามที่หลากหลายมาก
ดังนั้น การเตรียมพร้อมพื้นฐานที่ดีสำคัญมากๆ
แอดเองก็ตอบไม่ได้ครบทุกข้อนะเออ
ข้อไหนไม่รู้ ก็แค่ไปหาเพิ่มเอง
สมัยนี้มีความรู้เยอะแยะเลยนะเอออ
แอดเป็นกำลังใจให้เพื่อนๆทุกคนที่เตรียมสัมภาษณ์นะครัช
ขอให้ได้งานใหม่สมใจหมายทุกคนคร้าบบบบ ⭐😉