Data Engineer Projects
Giới thiệu về Machine Learning
Xin chào các bạn!
Học máy (Machine learning) là ứng dụng của trí tuệ nhân tạo (AI) cung cấp cho máy móc khả năng tự động học hỏi và cải thiện mà không cần được lập trình rõ ràng cho từng tác vụ. Trọng tâm chính của Machine learning là cung cấp các thuật toán để xây dựng và huấn luyện các hệ thống để chúng có thể giải quyết các vấn đề trong thực tế.
Chương trình Machine Learning trang bị các kiến thức cơ bản về hồi quy, phân loại, học sâu, phân cụm và xử lý dữ liệu cho bài toán ML để sinh viên có được hiểu biết cơ bản về Machine Learning và ứng dụng trong các lĩnh vực về AI.
Bạn hãy tưởng tượng, để trở thành một cây cổ thụ thì điều cần thiết nhất chính là một bộ rễ chắc chắn bám sâu vào lòng đất. Chính vì điều đó, chứng chỉ này được thiết kế nhằm giúp bạn có một bộ rễ kiến thức, đây sẽ là nền tảng để bạn dần cao lớn hơn trong tương lai. Khoá học cung cấp rất nhiều bài tập thực hành thực tế giúp bạn có cái nhìn từ tổng quan đến chi tiết vào những dự án có thật . Sau khoá học các bạn sẽ phải hoàn thành các dự án sau:
- Tính toán và phân tích điểm thi (Test Grade Calculator)
- Phân tích cảm xúc và ví dụ về phân loại hình ảnh
- Dự đoán số lượng bình luận trên Facebook
- Dự đoán giá nhà với các kỹ thuật hồi quy nâng cao
- Dự đoán thời tiết ngày mai
- Dự đoán mức độ hài lòng của khách hàng với các dịch vụ của ngân hàng
- Xây dựng một hệ thống đề xuất phim
- Tăng cường Phân loại theo Topic Modeling
- Nhận diện đeo khẩu trang
- Phân loại bình luận độc hại
- Xây dựng mô hình gợi ý phim
- Xây dựng mô hình gợi ý phim xử dụng mô hình kết hợp
Chúng tôi hy vọng bạn sẽ hoàn thành xuất sắc khóa học để có thể thành thạo và tự tin trong lĩnh vực Machine Learning!
Chúc các bạn học tốt!
MỤC TIÊU MÔN HỌC
Sau khi học xong môn này, học viên sẽ đạt được các chuẩn kiến thức, kỹ năng đầu ra như sau:
- Hiểu các khái niệm cơ bản của ML.
- Hiểu các khái niệm cơ bản liên quan đến ML về Giải tích, Đại số tuyến tính và Xác suất thống kê.
- Ôn lại và thực hành lập trình Python cơ bản, các cấu trúc dữ liệu trong Python, làm việc với Pandas and Numpy, Lớp và Tính kế thừa.
- Hiểu và thực hành các công cụ của Machine learning: Sklearn, Jupyter Notebook.
- Nắm được những kiến thức cơ bản về Học tập có giám sát và không giám sát trong Machine Learning với các Case study.
- Nắm rõ mục tiêu và các phương pháp tiếp cận giải bài toán hồi quy.
- Triển khai được các thuật toán thông dụng để giải bài toán hồi quy: 1 biến, đa biến, Lasso, Ridge.
- Giải quyết các vấn đề underfit và overfit trong bài toán hồi quy.
- Thành thạo các phương pháp trích xuất và chọn lọc đặc trưng từ dữ liệu.
- Làm quen với các thuật toán hồi quy nâng cao: SVR, Tree, Random Forest.
- Nắm được thuật toán ARIMA trong bài toán dự báo chuỗi thời gian.
- Có thể thực thi được 1 pipeline hoàn chỉnh để giải quyết bài toán hồi quy và tối ưu được với độ chính xác theo model và data.
- Nắm rõ mục tiêu và các phương pháp tiếp cận giải bài toán phân loại.
- Triển khai được các thuật toán thông dụng để giải bài toán phân loại: Hồi quy Logistic, mạng nơron nông và sâu (DNN), cây quyết định (DT), SVM.
- Giải quyết các vấn đề underfit, overfit, optimization và regularization trong bài toán phân loại.
- Thành thạo các phương pháp trích xuất và chọn lọc đặc trưng từ dữ liệu cho bài toán phân loại.
- Làm quen với các thuật toán phân loại nâng cao: Adaboost, Random Forest.
- Xử lý được vấn đề mất cân bằng dữ liệu trong bài toán phân loại.
- Nắm được các phương pháp ensemble khác nhau cho các bài toán ML và cách áp dụng chúng: Ensembling, boosting, bagging, stacking.
- Có thể thực thi được 1 pipeline hoàn chỉnh để giải quyết bài toán phân loại.
- Có năng lực về chuẩn hóa dữ liệu, xây dựng và đánh giá, phân tích lỗi, cải thiện và tối ưu model trong các bài toán ML.
- Có cái nhìn chung về Phân cụm và Trích xuất
- Hiểu các thuật toán tìm kiếm lân cận gần nhất (Nearest Neighbor Search Algorithm)
- Hiểu Thuật toán K-means và hiểu cách hoạt động của nó
- Hiểu ý tưởng mô hình hỗn hợp (Mixture Model)
- Biết được cách kết hợp giữa Mixed Membership Modelling (Mô hình Mixed Membership) và Lattent Dirichlet Allocation (Phân bổ Dirichlet Lattent)
- Nắm được một phương pháp khác và tìm ra nhiều cách hơn để giải bài toán Phân cụm
- Hiểu một phương pháp khác để giải quyết bài toán phân cụm và áp dụng nó vào các dự án thực tế
- Nắm được khái niệm cơ bản, ứng dụng và vai trò của Deep Learning hiện nay trong thị giác máy tính và xử lý ngôn ngữ tự nhiên.
- Nắm được các ứng dụng của DL vào trong thị giác máy tính thông qua kiến trúc mạng CNN (CNN, VGG, Resnet, Inception, MobileNet, EfficientNet): Bài toán phân loại hình ảnh, nhận diện vật thể, phân vùng theo nhóm, nhận diện khuôn mặt.
- Nắm được ứng dụng của DL vào trong xử lý ngôn ngữ tự nhiên thông qua các kiến trúc mạng về RNN (RNN, LSTM, GRU, Attention và Transformation): Nhận diện cảm xúc thông qua văn bản, dịch máy, xây dựng và sử dụng Word Embedding.
- Sử dụng được Tensorflow để xây dựng một dự án hoàn chỉnh về Machine Learning và Deep Learning.
- Có năng lực về chuẩn hóa dữ liệu, xây dựng và đánh giá, phân tích lỗi, cải thiện và tối ưu model trong các dự án ML/DL.
- Nắm rõ các định nghĩa, chủ đề, ứng dụng và vai trò của Recommender Systems trong hiện nay.
- Nắm được kiến thức về Non-Personalized Recommender và ứng dụng vào thực tế.
- Nắm được kiến thức về Content-Based Filtering và ứng dụng vào thực tế.
- Nắm được kiến thức về Nearest Neighbor Collaborative Filtering và ứng dụng vào thực tế.
- Nắm được kiến thức về cách đánh giá và metric để đánh giá Recommender Systems trong thực tế.
- Xây dựng engine cơ bản về Recommender Systems, dùng để thử nghiệm và đánh giá các thuật toán về recommnender.
- Nắm được kiến thức về Matrix Factorization và ứng dụng vào thực tế.
- Nắm được kiến thức cơ bản về toàn bộ hệ thống hệ gợi ý, triển khai mô hình gợi ý trên Apache spark và ứng dụng vào thực tế.
TRẢI NGHIỆM HỌC TẬP
Để bắt đầu, các bạn nên dành một vài phút khám phá môn học và cấu trúc chung. Môn học sẽ bao gồm 10 dự án. Các bạn sẽ dựa vào link các MOOC trên khoá và phần hướng dẫn hoàn thành dự án để làm các bài tập lớn (Project). Việc làm các dự án lớn sẽ giúp các bạn phát huy được khả năng và có nhiều kinh nghiệm làm việc từ các bài toán thực tế. Để việc học tập được hiệu quả, hãy luôn trau dồi kiến thức, không ngừng học hỏi, nghiên cứu và lập cho mình một kế hoạch học tập hợp lý để hoàn thành khóa học một cách xuất sắc.
Trong thời gian học, việc phân bổ tuần học là rất quan trọng. Nếu các bạn có bất cứ câu hỏi nào hãy kết nối với Mentor để được giải đáp.
CẤU TRÚC MÔN HỌC
- Assignment 1: Tính toán và phân tích điểm thi (Test Grade Calculator)
- Assignment 2: Phân tích cảm xúc và ví dụ về phân loại hình ảnh
- Assignment 3: Dự đoán số lượng bình luận trên Facebook
- Assignment 4: Dự đoán giá nhà với các kỹ thuật hồi quy nâng cao
- Assignment 5: Dự đoán thời tiết ngày mai
- Assignment 6: Dự đoán mức độ hài lòng của khách hàng với các dịch vụ của ngân hàng
- Assignment 7: Xây dựng một hệ thống đề xuất phim
- Assignment 8 - Tăng cường Phân loại theo Topic Modeling
- Assignment 9 - Nhận diện đeo khẩu trang
- Assignment 10 - Phân loại bình luận độc hại
- Assignment 11 - Xây dựng mô hình gợi ý phim
- Assignment 12 - Xây dựng mô hình gợi ý phim xử dụng mô hình kết hợp
CHUYÊN GIA THIẾT KẾ VÀ PHẢN BIỆN MÔN HỌC
THIẾT KẾ MÔN HỌC: TS. Nguyễn Văn Vinh
- Giảng viên & thành viên cốt lõi của Phòng thí nghiệm AI, Đại học Công nghệ - VNU
- Chuyên gia tư vấn AI cho DPS & Fsoft
- Tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
PHẢN BIỆN MÔN HỌC: TS. Trần Tuấn Anh
- Giảng viên Đại học Khoa học Tự nhiên - ĐHQG-HCM
- Tiến sĩ Khoa học Máy tính, Đại học Quốc gia Chonnam, Hàn Quốc
- Thạc sĩ Toán học ứng dụng về AI & Machine Learning, Đại học Orleans, Pháp
NGUỒN HỌC LIỆU
Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.
Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nhiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.
Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: Coursera, tutorialspoint, edX Training, or Udemy.
KÊNH PHẢN HỒI
FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email [email protected]