Skip to main content

Phân tích Dữ liệu với Python

Thông tin chung 

Mã môn học: DSP302x
Tên môn học: Phân tích Dữ liệu với Python
Số tín chỉ: 3
Thời gian học: 6 tuần

Là một phần quan trọng trong Chứng chỉ của chúng tôi về Khoa học dữ liệu, khóa học này bao gồm các mục cơ bản về sử dụng SQL để truy cập dữ liệu, trực quan hóa dữ liệu và khám phá phân tích dữ liệu (exploratory data analysis – EDA).

Phân tích dữ liệu là một quá trình nhận vào dữ liệu thô và chuyển đổi nó thành thông tin hữu ích cho việc ra quyết định của người dùng. Trên thế giới dữ liệu cần để làm đầu vào cho việc phân tích phần lớn được lưu trong cơ sở dữ liệu. Trích xuất dữ liệu từ cơ sở dữ liệu bằng SQL là một kỹ thuật quan trọng bạn phải học nếu bạn muốn trở thành một nhà khoa học dữ liệu. Sau đó, dữ liệu thu được ban đầu phải được xử lý hoặc tổ chức và làm sạch để phân tích. Khóa học này hứa hẹn sẽ mang đến cho bạn kiến thức về sắp xếp dữ liệu và khám phá dữ liệu bằng cách sử dụng thư viện trong Python, như Numpy, Pandas.

Một trong những kỹ năng chính của một nhà khoa học dữ liệu là khả năng kể câu chuyện bằng dữ liệu, trực quan hóa dữ liệu giúp cho người theo hứng thú và dễ tiếp cận. Các kỹ thuật khác nhau với ứng dụng Tableau sẽ được đưa ra để giúp bạn trình bày dữ liệu một cách trực quan nhất.

Ngoài ra, khóa học này sẽ cung cấp cho bạn các kỹ năng cần thiết để tận dụng dữ liệu nhằm tìm ra những hiểu biết có giá trị và thúc đẩy sự nghiệp của bạn.

MỤC TIÊU MÔN HỌC

  • Nắm được tổng quát về SQL, áp dụng câu lệnh SQL từ cơ bản đến nâng cao để truy vấn dữ liệu.
  • Thành thục các thao tác làm việc với dữ liệu trên Python với Pandas: Tổng hợp và làm sạch dữ liệu, xử lý dữ liệu bị thiếu.
  • Nắm được các bước/quy trình và kỹ thuật thường được sử dụng trong phân tích dữ liệu thăm dò - EDA: ANOVA, Chi-Square, Correlation.
  • Hiểu trực quan hóa dữ liệu và thực hành với Matplotlib, Seaborn và Plotly trên Python.
  • Áp dụng các phương pháp trực quan hóa dữ liệu cơ bản với Tableau để nâng cao khả năng kể chuyện bằng dữ liệu.

CẤU TRÚC MÔN HỌC

Phần 1: Khái niệm phân tích dữ liệu
  • Bài 1: Đặt câu hỏi đúng

Phần 2: Cơ sở dữ liệu và SQL cho Khoa học Dữ liệu
  • Bài 2 - Giới thiệu về Cơ sở dữ liệu và SQL Cơ bản
  • Lab 1: SQL cơ bản
  • Bài 3: SQL nâng cao
  • Lab 2: SQL nâng cao
  • Bài 4: Truy cập cơ sở dữ liệu bằng Python
  • Lab 3: Làm việc với Cơ sở dữ liệu
Project 1 - Truy xuất và phân tích dữ liệu bóng đá châu Âu

Phần 3: Phân tích dữ liệu với Python
  • Bài 5: Làm việc với dữ liệu
  • Lab 4: Thao tác dữ liệu bằng gấu trúc
  • Bài 6: Phân tích dữ liệu thăm dò
  • Lab 5: EDA trong vấn đề dự đoán giá

Phần 4: Trực quan hóa dữ liệu với Python
  • Bài 7: Giới thiệu về Trực quan hóa Dữ liệu
  • Bài 8: Các công cụ trực quan hóa cơ bản
  • Lab 6: Matplotlib cơ bản
  • Bài 9: Công cụ trực quan hóa nâng cao
  • Lab 7: Hình ảnh hóa nâng cao với Python
  • Bài 10: Hình ảnh tương tác với Plotly
  • Lab 8: Thực hành với Plotly
Assignment 2 - Phân tích dữ liệu Covid-19

Phần 5: Trực quan hóa dữ liệu với Tableau
  • Bài 11: Giới thiệu về Tableau
  • Bài 12: Hình dung cơ bản với Tableau
  • Lab 9: Tableau cơ bản
  • Bài 13: Thao tác dữ liệu động trong Tableau
  • Bài 14: Trình bày trong Tableau
  • Lab 10: Thao tác với dữ liệu tùy biến và trình bày trong Tableau
  • Bài 15: Trực quan hóa dữ liệu và giao tiếp với Tableau

ĐỘI NGŨ THIẾT KẾ MÔN HỌC

THIẾT KẾ MÔN HỌC

M.S. Vũ Thương Huyền

  • Nhà khoa học dữ liệu tại FPT Software - FPT
  • Thạc sĩ Kỹ thuật phần mềm, Đại học Công nghệ, Đại học Quốc gia Hà Nội
  • Cử nhân Kỹ thuật, Toán ứng dụng và Tin học, Đại học Bách Khoa Hà Nội
  • Lĩnh vực nghiên cứu: Machine learning, Deep learning, Reinforcement Learning, Natural Language Processing…
  • Profile online: https://www.linkedin.com/in/thuong-huyen-3969747a/ 

M.Sc. Nguyễn Hải Nam

  • Chief mentor & chuyên gia thiết kế khóa học tại FUNiX
  • Thạc sĩ Khoa học Máy tính, Đại học Cassino, Ý
  • Cử nhân Khoa học ứng dụng, Kỹ thuật viễn thông, PTIT
  • Lĩnh vực nghiên cứu: Deep Learning, Computer vision, Handwritting OCR, Abnormal detection
  • Online profile: https://www.linkedin.com/in/hai-nam-nguyen-474587119/ 

CHUYÊN GIA PHẢN BIỆN 

Chuyên gia phản biện chi tiết

 

 

Kiểm thử

 

 

Ph.D. Đặng Hoàng Vũ

  • Giám đốc khoa học FPT
  • Tiến sĩ Toán học, Đại học Cambridge
  • Thành viên nòng cốt của các hoạt động R&D tại Tập đoàn FPT
  • Chịu trách nhiệm chính trong lĩnh vực phân tích của Platform quản lý dữ liệu  và nghiên cứu khoa học dữ liệu của FPT

B.A. Hồ Quốc Bảo

  • Trợ lý Nghiên cứu, học viên cao học về Công nghệ Micro và Nano, Đại học Đông Nam, Na Uy 
  • Học viên Cao học Kỹ thuật Viễn thông, ĐHBK HCM
  • Cử nhân Kỹ thuật Điện tử Viễn thông, ĐHBK
  • Lĩnh vực nghiên cứu: Signal Processing, Modelling, Machine Learning, Optical cable, Ultrasound Signal
  • Hồ sơ online: https://www.linkedin.com/in/quoc-bao-ho-bb239288/

Chuyên gia phản biện khung chương trình

 Assoc. Prof. Từ Minh Phương

Ph.D. Nguyễn Văn Vinh

Ph.D. Trần Thế Trung

  • Trưởng khoa CNTT, Đại học Bưu chính viễn thông (PTIT)
  • Chuyên gia tư vấn công nghệ AI & machine learning
  • Trưởng phòng Lab Học máy & Ứng dụng của PTIT
  • Giảng viên & thành viên cốt lõi của Phòng thí nghiệm AI, Đại học Công nghệ - VNU
  • Chuyên gia  tư vấn AI cho DPS, Fsoft
  • Bằng tiến sĩ Khoa học máy tính, Viện Khoa học và Công nghệ tiên tiến Nhật Bản
  • Cử nhân CNTT, Đại học Công nghệ, VNU
  • Viện trưởng Viện nghiên cứu công nghệ FPT, Đại học FPT
  • Bằng tiến sĩ Vật lý tính toán, UVSQ Université de Versailles 
  • Thạc sĩ Vật lý thiên văn, Đại học Pierre & Marie Curie
  • Cử nhân Vật lý lý thuyết và Toán học, Đại học Melbourne

NGUỒN HỌC LIỆU

      Trong thời đại hiện nay, mỗi môn học đều có nhiều nguồn tài liệu liên quan kể cả sách in và online, FUNiX Way không quy định một nguồn học liệu cụ thể mà khuyến cáo để học viên chọn được nguồn phù hợp nhất cho mình. Trong quá trình học từ nhiều nguồn khác nhau theo lựa chọn cá nhân đó, khi sinh viên phát sinh câu hỏi thì sẽ được kết nối nhanh nhất với mentor để được giải đáp. Toàn bộ phần đánh giá bao gồm các câu hỏi trắc nghiệm, bài tập, dự án và thi vấn đáp do FUNiX thiết kế, xây dựng và thực hiện.

      Các môn học của FUNiX không quy định bắt buộc tài liệu học tập, sinh viên có thể chủ động tìm và học từ bất kỳ nguồn nào phù hợp, kể cả sách in hay nguồn học liệu online (MOOC) hay các website. Việc sử dụng các nguồn đó do học viên chịu trách nghiệm và đảm bảo tuân thủ các chính sách của chủ sở hữu nguồn, trừ trường hợp họ có sự hợp tác chính thức với FUNiX. Nếu cần hỗ trợ, học viên có thể liên hệ phòng đào tạo FUNiX để được hướng dẫn.

      Dưới đây là một số nguồn học liệu của môn học mà học viên có thể tham khảo sử dụng. Việc liệt kê nguồn dưới đây không nhất thiết hàm ý rằng FUNiX có sự hợp tác chính thức với chủ sở hữu của nguồn: CourseraedXtrainingtutorialpointsUdemyseabornAnalytics VidhyaBokehkaggle.


      Kênh phản hồi

      FUNiX sẵn sàng đón nhận và trao đổi về mọi ý kiến góp ý, phản hồi liên quan đến học liệu qua email [email protected].

      Enroll