Chuyển đến nội dung chính

Khóa 03 - Prepare Data for Exploration

Dữ liệu giống như rác. Tốt nhất là bạn nên biết mình sẽ làm gì trước khi thu thập nó.
Đây là khóa học thứ ba trong Chứng chỉ Google Data Analytics. Khi bạn tiếp tục nâng cao hiểu biết của mình về các chủ đề từ hai khóa học đầu tiên, bạn sẽ được giới thiệu các chủ đề mới giúp bạn đạt được các kỹ năng phân tích dữ liệu thực tế. Bạn sẽ tìm hiểu cách sử dụng các công cụ như bảng tính và SQL để trích xuất và sử dụng dữ liệu phù hợp cho mục tiêu của mình cũng như cách tổ chức và bảo vệ dữ liệu của bạn. Các nhà phân tích dữ liệu hiện tại của Google sẽ tiếp tục hướng dẫn và cung cấp cho bạn những cách thực hành để hoàn thành các nhiệm vụ phân tích dữ liệu phổ biến bằng các công cụ và tài nguyên tốt nhất. Những người học hoàn thành chương trình chứng chỉ này sẽ được trang bị để ứng tuyển vào các công việc ở cấp độ cơ bản với tư cách là nhà phân tích dữ liệu. Không có kinh nghiệm nào trước đây là cần thiết. 
Khi kết thúc khóa học này, người học sẽ: 
  • Tìm hiểu cách các nhà phân tích quyết định dữ liệu nào cần thu thập để phân tích.
  • Tìm hiểu về dữ liệu có cấu trúc và không cấu trúc, các kiểu dữ liệu và định dạng dữ liệu.
  • Khám phá cách xác định các loại sai lệch khác nhau trong dữ liệu để giúp đảm bảo độ tin cậy của dữ liệu.
  • Khám phá cách các nhà phân tích sử dụng bảng tính và SQL trong cơ sở dữ liệu và tập dữ liệu.
  • Kiểm tra dữ liệu mở và mối quan hệ giữa và tầm quan trọng của đạo đức dữ liệu và quyền riêng tư dữ liệu.
  • Hiểu cách truy cập cơ sở dữ liệu và trích xuất, lọc và sắp xếp dữ liệu trong đó.
  • Tìm hiểu các phương pháp hay nhất để tổ chức dữ liệu và giữ an toàn cho dữ liệu.

Học phần 01: Kiểu và cấu trúc dữ liệu

Một lượng lớn dữ liệu được tạo ra mỗi ngày. Trong phần này của khóa học, bạn sẽ khám phá cách tạo ra dữ liệu này và cách các nhà phân tích quyết định sử dụng dữ liệu nào để phân tích. Bạn cũng sẽ tìm hiểu về dữ liệu có cấu trúc và không cấu trúc, kiểu dữ liệu và định dạng dữ liệu khi bạn bắt đầu nghĩ về cách chuẩn bị dữ liệu để phân tích.

Mục tiêu của học phần 01:

  • Giải thích cách Kaggle có thể mang lại lợi ích cho nhà phân tích dữ liệu.
  • Giải thích cách dữ liệu được tạo ra như một phần trong hoạt động hàng ngày của chúng tôi có liên quan đến các loại dữ liệu được tạo ra.
  • Giải thích các yếu tố cần được xem xét khi đưa ra quyết định về việc thu thập dữ liệu.
  • Giải thích sự khác biệt giữa dữ liệu có cấu trúc và không có cấu trúc.
  • Thảo luận về sự khác biệt giữa dữ liệu và kiểu dữ liệu.
  • Giải thích mối quan hệ giữa các kiểu dữ liệu, trường và giá trị.
  • Thảo luận về các định dạng dữ liệu rộng và dài có tham chiếu đến tổ chức và mục đích.

Học phần 02: Trách nhiệm với dữ liệu

Trước khi làm việc với dữ liệu, bạn phải xác nhận rằng dữ liệu đó không thiên vị và đáng tin cậy. Suy cho cùng, nếu bạn bắt đầu phân tích với dữ liệu không đáng tin cậy, bạn sẽ không thể tin tưởng vào kết quả của mình. Trong phần này của khóa học, bạn sẽ học cách xác định thành kiến ​​trong dữ liệu và cách đảm bảo dữ liệu của bạn đáng tin cậy. Bạn cũng sẽ khám phá dữ liệu mở và tầm quan trọng của đạo đức dữ liệu và quyền riêng tư dữ liệu.

Mục tiêu của học phần 02:

  • Giải thích những gì liên quan đến việc xem xét dữ liệu để xác định sai lệch.
  • Thảo luận về sự khác biệt giữa dữ liệu thiên vị và không thiên vị.
  • Xác định các loại sai lệch khác nhau bao gồm sai lệch xác nhận, diễn giải và sai lệch của người quan sát.
  • Thảo luận về đặc điểm của các nguồn dữ liệu đáng tin cậy, bao gồm cả việc tham chiếu đến dữ liệu không rõ ràng.
  • Giải thích khái niệm dữ liệu mở có liên quan đến cuộc tranh luận đang diễn ra trong phân tích dữ liệu.
  • Xác định đạo đức dữ liệu và quyền riêng tư dữ liệu.
  • Giải thích mối quan hệ giữa đạo đức dữ liệu và quyền riêng tư dữ liệu.
  • Thể hiện sự hiểu biết về lợi ích của việc ẩn danh dữ liệu.
  • Thể hiện nhận thức về các vấn đề về khả năng tiếp cận liên quan đến dữ liệu mở.

Học phần 03: Sự cần thiết của cơ sở dữ liệu

Khi bạn phân tích các tập dữ liệu lớn, bạn sẽ truy cập được nhiều dữ liệu từ cơ sở dữ liệu. Trong phần này của khóa học, bạn sẽ tìm hiểu về cơ sở dữ liệu, bao gồm cách truy cập và trích xuất, lọc cũng như sắp xếp dữ liệu trong đó. Bạn cũng sẽ khám phá siêu dữ liệu để khám phá nhiều khía cạnh của siêu dữ liệu và cách các nhà phân tích sử dụng siêu dữ liệu để hiểu rõ hơn về dữ liệu của họ.

Mục tiêu của học phần 03:

  • Mô tả cơ sở dữ liệu với các tham chiếu đến chức năng và thành phần của chúng.
  • Giải thích siêu dữ liệu vì nó liên quan đến cơ sở dữ liệu.
  • Thảo luận tầm quan trọng của siêu dữ liệu và nó liên quan như thế nào đến công việc của nhà phân tích dữ liệu.
  • Nhớ lại các vấn đề và các bước liên quan đến việc truy cập dữ liệu từ nhiều nguồn.
  • Giải thích việc sử dụng các bộ lọc và chức năng sắp xếp trong bảng tính.
  • Trình bày cách sử dụng chức năng bảng tính để nhập và kiểm tra một bộ dữ liệu nhất định.
  • Trình bày cách sử dụng các hàm SQL để trích xuất dữ liệu từ cơ sở dữ liệu nhất định.

Học phần 04: Tổ chức và bảo vệ dữ liệu

Kỹ năng tổ chức tốt là một phần quan trọng của hầu hết các loại công việc, đặc biệt là phân tích dữ liệu. Trong phần này của khóa học, bạn sẽ tìm hiểu các phương pháp hay nhất để sắp xếp và bảo mật dữ liệu. Bạn cũng sẽ hiểu cách các nhà phân tích sử dụng quy ước đặt tên tệp để giúp họ sắp xếp công việc của mình một cách ngăn nắp.

Mục tiêu của học phần 04:

  • Giải thích các bước có thể được thực hiện để bảo mật dữ liệu.
  • Thảo luận về việc sử dụng quy ước đặt tên tệp của các nhà phân tích dữ liệu.
  • Mô tả các phương pháp hay nhất để tổ chức dữ liệu.

Học phần 05: Tham gia vào cộng đồng dữ liệu

Sự hiện diện trực tuyến mạnh mẽ có thể giúp ích rất nhiều cho những người tìm việc thuộc mọi loại hình. Trong phần này của khóa học, bạn sẽ khám phá cách quản lý sự hiện diện trực tuyến của mình. Bạn cũng sẽ khám phá những lợi ích của việc kết nối với các chuyên gia phân tích dữ liệu khác.

Mục tiêu của học phần 05:

  • Áp dụng các phương pháp hay nhất để phát triển mạng lưới..
  • Giải thích tầm quan trọng của việc kết nối với các nhà phân tích dữ liệu khác, bao gồm cả việc tham khảo về cố vấn và giao tiếp.
  • Áp dụng các phương pháp hay nhất để quản lý sự hiện diện trực tuyến chuyên nghiệp.
  • Mô tả các phương pháp xây dựng sự hiện diện trực tuyến với tư cách là nhà phân tích dữ liệu.

Kết thúc khóa học bạn sẽ hiểu được:

  • 05 cách chọn dữ liệu phù hợp.
  • Các định dạng dữ liệu trong thực tế
  • Các định nghĩa về sự thiên vị trong dữ liệu
  • Những yêu cầu về mặt đạo đức khi phân tích dữ liệu
  • Những yêu cầu về quyền riêng tư và bảo mật dữ liệu
  • Các khái niệm và nguyên tắc cơ bản khi làm việc với cơ sở dữ liệu
  • Quản lý dữ liệu bằng siêu dữ liệu
  • Cách tổ chức, quản lý và lưu trữ hiệu quả
  • Cách khai thác các nguồn dữ liệu mở
  • Xử lý BigData với SQL
Để vượt qua khóa học bạn phải hoàn thành các bài kiểm tra có điểm số tối thiểu là 80%, bạn cũng có thể thi cải thiện kết quả với số lần giới hạn.


Nhận xét

Bài đăng phổ biến từ blog này

Khóa 01 - Foundations: Data, Data, Everywhere

Chúng ta được bao quanh bởi dữ liệu nhưng lại thiếu hiểu biết sâu sắc. Đây là khóa học đầu tiên trong Chứng chỉ Google Data Analytics. Các tổ chức thuộc mọi loại hình đều cần các nhà phân tích dữ liệu để giúp họ cải thiện quy trình, xác định cơ hội và xu hướng, ra mắt sản phẩm mới và đưa ra quyết định sáng suốt. Trong khóa học này, bạn sẽ được giới thiệu về t phâhế giớin tích dữ liệu thông qua chương trình giảng dạy thực hành do Google phát triển. Tài liệu được chia sẻ bao gồm nhiều chủ đề phân tích dữ liệu quan trọng và được thiết kế để cung cấp cho bạn cái nhìn tổng quan về những nội dung sẽ có trong Chứng chỉ Google Data Analytics. Các nhà phân tích dữ liệu hiện tại của Google sẽ hướng dẫn và cung cấp cho bạn những cách thực hành để hoàn thành các nhiệm vụ phân tích dữ liệu phổ biến bằng cách sử dụng các công cụ và tài nguyên tốt nhất. Những người học hoàn thành chương trình chứng chỉ này sẽ được trang bị để ứng tuyển vào các công việc ở cấp độ cơ bản với tư cách là nhà phân tích dữ...

Khóa 02 - Ask Questions to Make Data-Driven Decisions

Khoa học dữ liệu là việc đặt những câu hỏi thú vị dựa trên dữ liệu bạn có—hoặc thường là dữ liệu bạn không có. Đây là khóa học thứ hai trong Chứng chỉ Google Data Analytics. Bạn sẽ xây dựng sự hiểu biết của mình về các chủ đề đã được giới thiệu trong khóa học đầu tiên của chương trình chứng chỉ này. Tài liệu này sẽ giúp bạn tìm hiểu cách đặt câu hỏi hiệu quả, đưa ra quyết định dựa trên dữ liệu và đáp ứng nhu cầu của các bên liên quan. Các nhà phân tích dữ liệu hiện tại của Google sẽ hướng dẫn và cung cấp cho bạn những cách thực hành để hoàn thành các nhiệm vụ phân tích dữ liệu phổ biến. Những người học hoàn thành chương trình chứng chỉ này sẽ được trang bị để ứng tuyển vào các công việc ở cấp độ cơ bản với tư cách là nhà phân tích dữ liệu. Không có kinh nghiệm nào trước đây là cần thiết. Đến cuối khóa học này, bạn sẽ: Tìm hiểu về các kỹ thuật đặt câu hỏi hiệu quả có thể giúp hướng dẫn phân tích. Hiểu biết về việc ra quyết định dựa trên dữ liệu và cách các nhà phân tích dữ liệu trình bà...

Giới thiệu chứng chỉ Google Data Analytics

Phân tích dữ liệu là tương lai và tương lai là NGAY BÂY GIỜ! Mỗi cú nhấp chuột, nhấn nút bàn phím, vuốt hoặc chạm đều được sử dụng để định hình các quyết định kinh doanh. Ngày nay mọi thứ đều xoay quanh dữ liệu. Dữ liệu là thông tin và thông tin là sức mạnh. Chứng chỉ Google Data Analytics là một trong những chứng chỉ quan trọng trong lĩnh vực phân tích dữ liệu và khoa học dữ liệu. Được cung cấp bởi Google từ năm 2021, chứng chỉ này đã thu hút sự quan tâm của nhiều người mong muốn phát triển sự nghiệp trong lĩnh vực Data Analytics. 1. Giới thiệu chứng chỉ Google Data Analytics Chứng chỉ Google Data Analytics tập trung vào việc sử dụng công cụ và kỹ năng phân tích dữ liệu để đưa ra quyết định kinh doanh thông minh. Nó giúp bạn nắm bắt thông tin cần thiết từ dữ liệu, tạo ra báo cáo thống kê, và đưa ra những dự đoán dựa trên dữ liệu. Điều này giúp doanh nghiệp và tổ chức hiểu rõ hơn về khách hàng của họ, cải thiện dịch vụ, và tối ưu hóa chiến lược kinh doanh. Tại sao nên lựa chọn chứn...