2. ML Terminology and Model Evaluation
2.1 Agenda
Estimated reading time: ~12 minutes
Learning Outcomes
- Define and correctly use essential ML terminology in context
- Explain overfitting and underfitting with concrete (cụ thể) examples
- Interpret (giải thích) a confusion matrix and derive key metrics from it
- Distinguish (phân biệt) classification metrics from regression metrics
2.2 Glossary
| Term | Quick Explanation |
|---|---|
| Training Data | Tập dữ liệu huấn luyện — dùng để dạy model học pattern. |
| Validation Data | Tập dữ liệu kiểm thử trong quá trình phát triển — dùng để chọn hyperparameter (siêu tham số) tốt nhất. |
| Test Data | Tập dữ liệu kiểm tra cuối cùng — chỉ dùng một lần để đánh giá (evaluate) hiệu năng thực sự của model. |
| Overfitting | Học quá khớp — model "thuộc lòng" training data, mất khả năng tổng quát hóa (generalize) sang dữ liệu mới. |
| Underfitting | Học chưa đủ — model quá đơn giản (simple), không nắm bắt được pattern thực sự trong dữ liệu. |
| Bias | Sai số hệ thống (systematic error) — model liên tục dự đoán sai theo cùng một hướng. |
| Variance | Phương sai — model nhạy cảm (sensitive) quá mức với nhiễu (noise) trong training data. |
| Confusion Matrix | Ma trận nhầm lẫn — bảng so sánh nhãn dự đoán (predicted) vs. nhãn thực (actual) cho bài toán classification. |
| Precision | Độ chính xác — trong số những gì model dự đoán là Positive, bao nhiêu % thực sự là Positive? |
| Recall | Độ nhạy — trong số tất cả Positive thực sự, model phát hiện được bao nhiêu %? |
| F1-score | Trung bình điều hòa (harmonic mean) của Precision và Recall — cân bằng cả hai. |
| MAE | Mean Absolute Error — trung bình sai số tuyệt đối (absolute error) trong regression. |
| RMSE | Root Mean Squared Error — tương tự MAE nhưng phạt nặng (penalizes) các sai số lớn hơn. |