Không có dữ liệu nào là sạch, nhưng hầu hết đều hữu ích.
Đây là khóa học thứ tư trong Chứng chỉ Google Data Analytics. Trong khóa học này, bạn sẽ tiếp tục nâng cao hiểu biết của mình về phân tích dữ liệu cũng như các khái niệm và công cụ mà nhà phân tích dữ liệu sử dụng trong công việc của họ. Bạn sẽ tìm hiểu cách kiểm tra và làm sạch dữ liệu của mình bằng bảng tính và SQL cũng như cách xác minh và báo cáo kết quả làm sạch dữ liệu của bạn. Các nhà phân tích dữ liệu hiện tại của Google sẽ tiếp tục hướng dẫn và cung cấp cho bạn những cách thực hành để hoàn thành các nhiệm vụ phân tích dữ liệu phổ biến bằng các công cụ và tài nguyên tốt nhất. Những người học hoàn thành chương trình chứng chỉ này sẽ được trang bị để ứng tuyển vào các công việc ở cấp độ cơ bản với tư cách là nhà phân tích dữ liệu.
Khi kết thúc khóa học này, người học sẽ:
- Kiểm tra tính toàn vẹn của dữ liệu.
- Áp dụng kỹ thuật làm sạch dữ liệu bằng bảng tính.
- Phát triển các truy vấn SQL cơ bản để sử dụng trên cơ sở dữ liệu.
- Sử dụng các hàm SQL cơ bản để dọn dẹp và chuyển đổi dữ liệu.
- Kiểm tra kết quả làm sạch dữ liệu.
- Viết báo cáo làm sạch dữ liệu hiệu quả.
Học phần 01: Tầm quan trọng của tính toàn vẹn dữ liệu
Tính toàn vẹn dữ liệu là rất quan trọng để phân tích thành công. Trong phần này của khóa học, bạn sẽ khám phá các phương pháp mà các nhà phân tích thực hiện để kiểm tra tính toàn vẹn dữ liệu của họ. Điều này bao gồm việc biết phải làm gì khi bạn không có đủ dữ liệu. Bạn cũng sẽ tìm hiểu về các mẫu ngẫu nhiên và hiểu cách tránh sai lệch lấy mẫu. Tất cả những phương pháp này cũng sẽ giúp bạn đảm bảo phân tích của mình thành công.
Mục tiêu của học phần 01:
- Mô tả các biện pháp thống kê liên quan đến tính toàn vẹn dữ liệu bao gồm sức mạnh thống kê, kiểm tra giả thuyết và biên độ sai số.
- Mô tả các chiến lược có thể được sử dụng để giải quyết vấn đề thiếu dữ liệu.
- Thảo luận về tầm quan trọng của không gian mẫu có liên quan đến độ lệch mẫu và mẫu ngẫu nhiên.
- Mô tả mối quan hệ giữa dữ liệu và các mục tiêu kinh doanh liên quan.
- Xác định tính toàn vẹn dữ liệu bằng việc xem xét kiểu dữ liệu và các rủi ro.
- Thảo luận về tầm quan trọng của các hoạt động làm sạch lần đầu.
Học phần 02: Làm sạch dữ liệu để có thông tin chính xác, chi tiết hơn
Mọi nhà phân tích dữ liệu đều muốn phân tích dữ liệu sạch. Trong phần này của khóa học, bạn sẽ tìm hiểu sự khác biệt giữa dữ liệu sạch và dữ liệu bẩn. Sau đó, bạn sẽ thực hành làm sạch dữ liệu trong bảng tính và các công cụ khác.
Mục tiêu của học phần 02:
- Phân biệt dữ liệu sạch và dữ liệu bẩn.
- Giải thích các đặc điểm của dữ liệu bẩn.
- Mô tả các kỹ thuật làm sạch dữ liệu có tham chiếu đến việc xác định lỗi, dự phòng, tính tương thích và giám sát liên tục.
- Xác định những cạm bẫy thường gặp khi làm sạch dữ liệu.
- Thể hiện sự hiểu biết về việc sử dụng bảng tính để làm sạch dữ liệu.
Học phần 03: Làm sạch dữ liệu bằng SQL
Biết nhiều cách khác nhau để làm sạch dữ liệu có thể giúp công việc của nhà phân tích dữ liệu dễ dàng hơn nhiều. Trong phần này của khóa học, bạn sẽ sử dụng SQL để xóa dữ liệu khỏi cơ sở dữ liệu. Đặc biệt, bạn sẽ khám phá cách sử dụng các truy vấn và hàm SQL để làm sạch và chuyển đổi dữ liệu của bạn trước khi phân tích.
Mục tiêu của học phần 03:
- Mô tả cách SQL có thể được sử dụng để làm sạch các tập dữ liệu lớn.
- So sánh các hàm làm sạch dữ liệu của bảng tính với các hàm được liên kết với SQL trong cơ sở dữ liệu.
- Phát triển các truy vấn SQL cơ bản để sử dụng với cơ sở dữ liệu.
- Áp dụng các hàm SQL cơ bản để sử dụng trong việc dọn dẹp các biến chuỗi trong cơ sở dữ liệu.
- Áp dụng các hàm SQL cơ bản để chuyển đổi các biến dữ liệu.
Học phần 04: Xác minh và báo cáo kết quả làm sạch
Khi bạn xóa dữ liệu, bạn sẽ thực hiện các thay đổi đối với tập dữ liệu gốc. Điều quan trọng là phải xác minh tính chính xác của những thay đổi bạn thực hiện và thông báo cho đồng đội của bạn biết về những thay đổi đó. Trong phần này của khóa học, bạn sẽ học cách xác minh rằng dữ liệu sạch và báo cáo kết quả làm sạch dữ liệu của mình. Với dữ liệu sạch đã được xác minh, bạn đã sẵn sàng bắt đầu phân tích!
Mục tiêu của học phần 04:
- Mô tả quá trình liên quan đến việc xác minh kết quả làm sạch dữ liệu.
- Mô tả những gì liên quan đến việc làm sạch dữ liệu theo cách thủ công.
- Thảo luận về các yếu tố và tầm quan trọng của báo cáo làm sạch dữ liệu.
- Mô tả lợi ích của việc ghi lại quá trình làm sạch dữ liệu.
Học phần 05: Thêm dữ liệu vào sơ yếu lý lịch của bạn
Tạo một sơ yếu lý lịch hiệu quả sẽ giúp ích cho bạn trong sự nghiệp phân tích dữ liệu. Trong phần này của khóa học, bạn sẽ tìm hiểu tất cả về quy trình xin việc. Trọng tâm của bạn sẽ là xây dựng một bản lý lịch làm nổi bật những điểm mạnh và kinh nghiệm liên quan của bạn.
Mục tiêu của học phần 05:
- Xác định các yếu tố chính của sơ yếu lý lịch phân tích dữ liệu.
- Thể hiện sự hiểu biết về cách bổ sung kinh nghiệm trước đây vào sơ yếu lý lịch.
- Thảo luận cách mô tả công việc của nhà phân tích dữ liệu có thể được liên kết với một lĩnh vực quan tâm cụ thể.
Kết thúc khóa học bạn sẽ hiểu được:
- Tính toàn vẹn và tuân thủ quy định về dữ liệu.
- Mục tiêu và dữ liệu phù hợp.
- Cách xử lý dữ liệu không đầy đủ.
- Không gian mẫu và các tính chất liên quan.
- Các loại dữ liệu bẩn.
- Những lỗi cần tránh khi làm sạch dữ liệu
- Nắm được các kỹ thuật làm sạch dữ liệu.
- Sử dụng công cụ truy xuất dữ liệu BigQuery.
- Quy trình làm sạch dữ liệu.
- Các kỹ năng làm đẹp hồ sơ xin việc.
Để vượt qua khóa học bạn phải hoàn thành các bài kiểm tra có điểm số tối thiểu là 80%, bạn cũng có thể thi cải thiện kết quả với số lần giới hạn.
Nhận xét
Đăng nhận xét