Chuyển đến nội dung chính

Khóa 04 - Process Data from Dirty to Clean

Không có dữ liệu nào là sạch, nhưng hầu hết đều hữu ích.
Đây là khóa học thứ tư trong Chứng chỉ Google Data Analytics. Trong khóa học này, bạn sẽ tiếp tục nâng cao hiểu biết của mình về phân tích dữ liệu cũng như các khái niệm và công cụ mà nhà phân tích dữ liệu sử dụng trong công việc của họ. Bạn sẽ tìm hiểu cách kiểm tra và làm sạch dữ liệu của mình bằng bảng tính và SQL cũng như cách xác minh và báo cáo kết quả làm sạch dữ liệu của bạn. Các nhà phân tích dữ liệu hiện tại của Google sẽ tiếp tục hướng dẫn và cung cấp cho bạn những cách thực hành để hoàn thành các nhiệm vụ phân tích dữ liệu phổ biến bằng các công cụ và tài nguyên tốt nhất. Những người học hoàn thành chương trình chứng chỉ này sẽ được trang bị để ứng tuyển vào các công việc ở cấp độ cơ bản với tư cách là nhà phân tích dữ liệu. 
Khi kết thúc khóa học này, người học sẽ: 
  • Kiểm tra tính toàn vẹn của dữ liệu.
  • Áp dụng kỹ thuật làm sạch dữ liệu bằng bảng tính.
  • Phát triển các truy vấn SQL cơ bản để sử dụng trên cơ sở dữ liệu.
  • Sử dụng các hàm SQL cơ bản để dọn dẹp và chuyển đổi dữ liệu.
  • Kiểm tra kết quả làm sạch dữ liệu.
  • Viết báo cáo làm sạch dữ liệu hiệu quả.

Học phần 01: Tầm quan trọng của tính toàn vẹn dữ liệu

Tính toàn vẹn dữ liệu là rất quan trọng để phân tích thành công. Trong phần này của khóa học, bạn sẽ khám phá các phương pháp mà các nhà phân tích thực hiện để kiểm tra tính toàn vẹn dữ liệu của họ. Điều này bao gồm việc biết phải làm gì khi bạn không có đủ dữ liệu. Bạn cũng sẽ tìm hiểu về các mẫu ngẫu nhiên và hiểu cách tránh sai lệch lấy mẫu. Tất cả những phương pháp này cũng sẽ giúp bạn đảm bảo phân tích của mình thành công.

Mục tiêu của học phần 01:

  • Mô tả các biện pháp thống kê liên quan đến tính toàn vẹn dữ liệu bao gồm sức mạnh thống kê, kiểm tra giả thuyết và biên độ sai số.
  • Mô tả các chiến lược có thể được sử dụng để giải quyết vấn đề thiếu dữ liệu.
  • Thảo luận về tầm quan trọng của không gian mẫu có liên quan đến độ lệch mẫu và mẫu ngẫu nhiên.
  • Mô tả mối quan hệ giữa dữ liệu và các mục tiêu kinh doanh liên quan.
  • Xác định tính toàn vẹn dữ liệu bằng việc xem xét kiểu dữ liệu và các rủi ro.
  • Thảo luận về tầm quan trọng của các hoạt động làm sạch lần đầu.

Học phần 02: Làm sạch dữ liệu để có thông tin chính xác, chi tiết hơn

Mọi nhà phân tích dữ liệu đều muốn phân tích dữ liệu sạch. Trong phần này của khóa học, bạn sẽ tìm hiểu sự khác biệt giữa dữ liệu sạch và dữ liệu bẩn. Sau đó, bạn sẽ thực hành làm sạch dữ liệu trong bảng tính và các công cụ khác.

Mục tiêu của học phần 02:

  • Phân biệt dữ liệu sạch và dữ liệu bẩn.
  • Giải thích các đặc điểm của dữ liệu bẩn.
  • Mô tả các kỹ thuật làm sạch dữ liệu có tham chiếu đến việc xác định lỗi, dự phòng, tính tương thích và giám sát liên tục.
  • Xác định những cạm bẫy thường gặp khi làm sạch dữ liệu.
  • Thể hiện sự hiểu biết về việc sử dụng bảng tính để làm sạch dữ liệu.

Học phần 03: Làm sạch dữ liệu bằng SQL

Biết nhiều cách khác nhau để làm sạch dữ liệu có thể giúp công việc của nhà phân tích dữ liệu dễ dàng hơn nhiều. Trong phần này của khóa học, bạn sẽ sử dụng SQL để xóa dữ liệu khỏi cơ sở dữ liệu. Đặc biệt, bạn sẽ khám phá cách sử dụng các truy vấn và hàm SQL để làm sạch và chuyển đổi dữ liệu của bạn trước khi phân tích.

Mục tiêu của học phần 03:

  • Mô tả cách SQL có thể được sử dụng để làm sạch các tập dữ liệu lớn.
  • So sánh các hàm làm sạch dữ liệu của bảng tính với các hàm được liên kết với SQL trong cơ sở dữ liệu.
  • Phát triển các truy vấn SQL cơ bản để sử dụng với cơ sở dữ liệu.
  • Áp dụng các hàm SQL cơ bản để sử dụng trong việc dọn dẹp các biến chuỗi trong cơ sở dữ liệu.
  • Áp dụng các hàm SQL cơ bản để chuyển đổi các biến dữ liệu.

Học phần 04: Xác minh và báo cáo kết quả làm sạch

Khi bạn xóa dữ liệu, bạn sẽ thực hiện các thay đổi đối với tập dữ liệu gốc. Điều quan trọng là phải xác minh tính chính xác của những thay đổi bạn thực hiện và thông báo cho đồng đội của bạn biết về những thay đổi đó. Trong phần này của khóa học, bạn sẽ học cách xác minh rằng dữ liệu sạch và báo cáo kết quả làm sạch dữ liệu của mình. Với dữ liệu sạch đã được xác minh, bạn đã sẵn sàng bắt đầu phân tích!

Mục tiêu của học phần 04:

  • Mô tả quá trình liên quan đến việc xác minh kết quả làm sạch dữ liệu.
  • Mô tả những gì liên quan đến việc làm sạch dữ liệu theo cách thủ công.
  • Thảo luận về các yếu tố và tầm quan trọng của báo cáo làm sạch dữ liệu.
  • Mô tả lợi ích của việc ghi lại quá trình làm sạch dữ liệu.

Học phần 05: Thêm dữ liệu vào sơ yếu lý lịch của bạn

Tạo một sơ yếu lý lịch hiệu quả sẽ giúp ích cho bạn trong sự nghiệp phân tích dữ liệu. Trong phần này của khóa học, bạn sẽ tìm hiểu tất cả về quy trình xin việc. Trọng tâm của bạn sẽ là xây dựng một bản lý lịch làm nổi bật những điểm mạnh và kinh nghiệm liên quan của bạn.

Mục tiêu của học phần 05:

  • Xác định các yếu tố chính của sơ yếu lý lịch phân tích dữ liệu.
  • Thể hiện sự hiểu biết về cách bổ sung kinh nghiệm trước đây vào sơ yếu lý lịch.
  • Thảo luận cách mô tả công việc của nhà phân tích dữ liệu có thể được liên kết với một lĩnh vực quan tâm cụ thể.

Kết thúc khóa học bạn sẽ hiểu được:

  • Tính toàn vẹn và tuân thủ quy định về dữ liệu.
  • Mục tiêu và dữ liệu phù hợp.
  • Cách xử lý dữ liệu không đầy đủ.
  • Không gian mẫu và các tính chất liên quan.
  • Các loại dữ liệu bẩn.
  • Những lỗi cần tránh khi làm sạch dữ liệu
  • Nắm được các kỹ thuật làm sạch dữ liệu.
  • Sử dụng công cụ truy xuất dữ liệu BigQuery.
  • Quy trình làm sạch dữ liệu.
  • Các kỹ năng làm đẹp hồ sơ xin việc.
Để vượt qua khóa học bạn phải hoàn thành các bài kiểm tra có điểm số tối thiểu là 80%, bạn cũng có thể thi cải thiện kết quả với số lần giới hạn.



Nhận xét

Bài đăng phổ biến từ blog này

Khóa 01 - Foundations: Data, Data, Everywhere

Chúng ta được bao quanh bởi dữ liệu nhưng lại thiếu hiểu biết sâu sắc. Đây là khóa học đầu tiên trong Chứng chỉ Google Data Analytics. Các tổ chức thuộc mọi loại hình đều cần các nhà phân tích dữ liệu để giúp họ cải thiện quy trình, xác định cơ hội và xu hướng, ra mắt sản phẩm mới và đưa ra quyết định sáng suốt. Trong khóa học này, bạn sẽ được giới thiệu về t phâhế giớin tích dữ liệu thông qua chương trình giảng dạy thực hành do Google phát triển. Tài liệu được chia sẻ bao gồm nhiều chủ đề phân tích dữ liệu quan trọng và được thiết kế để cung cấp cho bạn cái nhìn tổng quan về những nội dung sẽ có trong Chứng chỉ Google Data Analytics. Các nhà phân tích dữ liệu hiện tại của Google sẽ hướng dẫn và cung cấp cho bạn những cách thực hành để hoàn thành các nhiệm vụ phân tích dữ liệu phổ biến bằng cách sử dụng các công cụ và tài nguyên tốt nhất. Những người học hoàn thành chương trình chứng chỉ này sẽ được trang bị để ứng tuyển vào các công việc ở cấp độ cơ bản với tư cách là nhà phân tích dữ...

Khóa 02 - Ask Questions to Make Data-Driven Decisions

Khoa học dữ liệu là việc đặt những câu hỏi thú vị dựa trên dữ liệu bạn có—hoặc thường là dữ liệu bạn không có. Đây là khóa học thứ hai trong Chứng chỉ Google Data Analytics. Bạn sẽ xây dựng sự hiểu biết của mình về các chủ đề đã được giới thiệu trong khóa học đầu tiên của chương trình chứng chỉ này. Tài liệu này sẽ giúp bạn tìm hiểu cách đặt câu hỏi hiệu quả, đưa ra quyết định dựa trên dữ liệu và đáp ứng nhu cầu của các bên liên quan. Các nhà phân tích dữ liệu hiện tại của Google sẽ hướng dẫn và cung cấp cho bạn những cách thực hành để hoàn thành các nhiệm vụ phân tích dữ liệu phổ biến. Những người học hoàn thành chương trình chứng chỉ này sẽ được trang bị để ứng tuyển vào các công việc ở cấp độ cơ bản với tư cách là nhà phân tích dữ liệu. Không có kinh nghiệm nào trước đây là cần thiết. Đến cuối khóa học này, bạn sẽ: Tìm hiểu về các kỹ thuật đặt câu hỏi hiệu quả có thể giúp hướng dẫn phân tích. Hiểu biết về việc ra quyết định dựa trên dữ liệu và cách các nhà phân tích dữ liệu trình bà...

Giới thiệu chứng chỉ Google Data Analytics

Phân tích dữ liệu là tương lai và tương lai là NGAY BÂY GIỜ! Mỗi cú nhấp chuột, nhấn nút bàn phím, vuốt hoặc chạm đều được sử dụng để định hình các quyết định kinh doanh. Ngày nay mọi thứ đều xoay quanh dữ liệu. Dữ liệu là thông tin và thông tin là sức mạnh. Chứng chỉ Google Data Analytics là một trong những chứng chỉ quan trọng trong lĩnh vực phân tích dữ liệu và khoa học dữ liệu. Được cung cấp bởi Google từ năm 2021, chứng chỉ này đã thu hút sự quan tâm của nhiều người mong muốn phát triển sự nghiệp trong lĩnh vực Data Analytics. 1. Giới thiệu chứng chỉ Google Data Analytics Chứng chỉ Google Data Analytics tập trung vào việc sử dụng công cụ và kỹ năng phân tích dữ liệu để đưa ra quyết định kinh doanh thông minh. Nó giúp bạn nắm bắt thông tin cần thiết từ dữ liệu, tạo ra báo cáo thống kê, và đưa ra những dự đoán dựa trên dữ liệu. Điều này giúp doanh nghiệp và tổ chức hiểu rõ hơn về khách hàng của họ, cải thiện dịch vụ, và tối ưu hóa chiến lược kinh doanh. Tại sao nên lựa chọn chứn...