Học máy cho Khoa học Dữ liệu
Thông tin Chung
Mã môn học: | DSP303x |
Tên môn học: | Học máy cho Khoa học Dữ liệu |
Số tín chỉ: | 3 |
Thời gian học: | 6 tuần |
Môn học thứ 3 của chương trình Data Science đi sâu vào các phần kiến thức cơ bản của học máy và ứng dụng của nó trong các lĩnh vực khác nhau như chăm sóc sức khỏe, ngân hàng, viễn thông, v.v. Bạn sẽ tìm hiểu về các kỹ thuật học máy hiệu quả nhất, cách sử dụng và tinh chỉnh các mô hình học máy cho bài toán cụ thể mà bạn cần giải quyết. Quan trọng hơn, bạn sẽ học không chỉ về nền tảng lý thuyết mà còn học được bí quyết thực tế cần thiết để áp dụng nhanh chóng và mạnh mẽ các kỹ thuật này vào các vấn đề mới.
Để bắt đầu, chúng tôi khuyên bạn nên dành một vài phút để khám phá trang web khóa học. Xem lại tài liệu chúng tôi sẽ đề cập mỗi tuần và xem trước các bài tập / dự án / câu hỏi bạn cần hoàn thành để vượt qua khóa học.
Các khái niệm chính được truyền tải thông qua các video, các bản demo và các bài tập thực hành.
MỤC TIÊU MÔN HỌC
- Có cái nhìn tổng quan về các định nghĩa và các chủ đề khác nhau trong Machine Learning: học có giám sát, học không giám sát.
- Có cái nhìn tổng quan và kiến thức cơ bản về Hồi quy, Phân loại, Phân cụm và Hệ thống Đề xuất, ARIMA, sau đó áp dụng được các loại thuật toán ở trên vào giải quyết các bài toán thực tế.
- Thao tác thành thạo các thư viện điển hình và cơ bản trong học máy với Python: Numpy, sklearn, pandas, matplotlib.
- Hiểu các phương pháp đánh giá và số liệu trong các vấn đề và bài toán khác nhau của học máy.
- Có thể áp dụng Ensemble Learning (Học máy kết hợp) trong việc tăng độ chính xác của mô hình.
CẤU TRÚC MÔN HỌC
Phần 1 - Học máy là gì?
- Bài 1 - Giới thiệu về Machine Learning
Phần 2 - Hồi quy
- Bài 2 - Hồi quy tuyến tính
- Lab 1 - Hồi quy tuyến tính cơ bản
- Bài 3 - Hồi quy nâng cao
- Lab 2 - Hồi quy nâng cao
Project 1 - Dự đoán số người trúng tuyển American College
Phần 3 - Phân loại
- Bài 4 - Tổng quan về phân loại
- Lab 3 - KNN
- Bài 5 - Hồi quy logistic
- Lab 4 - Liệu khách hàng có quay lưng với chúng ta?
- Bài 6 - Cây quyết định
- Lab 5 - Phân loại nấm Bắc Mỹ sử dụng DT
- Bài 7 - Support Vector Machine
- Lab 6 - Dự đoán bệnh nhân mắc Parkinson với SVM
Project 2 - Dự đoán khả năng mắc bệnh tiểu đường loại 2 tại Arizona
Phần 4 - Phân cụm
- Bài 8 - Phân cụm k-Means
- Lab 7 - Sử dụng k-Means để phân tập khách hàng
- Bài 9 - Phân cụm phân cấp
- Lab 8 - Agglomerative clustering
- Bài 10 - DBSCAN
- Lab 9 - Quan sát kết quả phân cụm với DBSCAN
Project 3 - Phân cụm hành vi di chuyển dựa theo dữ liệu điện thoại
Phần 5 - Hệ thống Đề xuất
- Bài 11 - Hệ thống khuyến nghị dựa trên nội dung
- Lab 10 - Xây dựng RS đề xuất các mặt hàng cho người dùng dựa theo nội dung mặt hàng
- Bài 12 - Lọc cộng tác
- Lab 11: Xây dựng RS đề xuất các mặt hàng cho người dùng dựa theo lọc cộng tác
Phần 6 - Dự báo chuỗi thời gian
- Bài 13 - ARIMA
ĐỘI NGŨ THIẾT KẾ MÔN HỌC
THIẾT KẾ MÔN HỌC
M.Sc. Nguyễn Hải Nam
|
M.S. Vũ Thương Huyền
|
CHUYÊN GIA PHẢN BIỆN
Chuyên gia phản biện chi tiết
|
Kiểm thử
|
||
Ph.D. Đặng Hoàng Vũ |
|
B.A. Hồ Quốc Bảo |
|
Assoc. Prof. Từ Minh Phương |
Ph.D. Nguyễn Văn Vinh |
Ph.D. Trần Thế Trung |
|
|
|
NGUỒN HỌC LIỆU
Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.
Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nghiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.
Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: Coursera, edX training, tutorialpoints, Machine Learning cơ bản, Towards Data Science, Ông Xuân Hồng, Medium, Data Novia.
Kênh phản hồi
FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email [email protected].