Dữ liệu giống như rác. Tốt nhất là bạn nên biết mình sẽ làm gì trước khi thu thập nó.
Đây là khóa học thứ ba trong Chứng chỉ Google Data Analytics. Khi bạn tiếp tục nâng cao hiểu biết của mình về các chủ đề từ hai khóa học đầu tiên, bạn sẽ được giới thiệu các chủ đề mới giúp bạn đạt được các kỹ năng phân tích dữ liệu thực tế. Bạn sẽ tìm hiểu cách sử dụng các công cụ như bảng tính và SQL để trích xuất và sử dụng dữ liệu phù hợp cho mục tiêu của mình cũng như cách tổ chức và bảo vệ dữ liệu của bạn. Các nhà phân tích dữ liệu hiện tại của Google sẽ tiếp tục hướng dẫn và cung cấp cho bạn những cách thực hành để hoàn thành các nhiệm vụ phân tích dữ liệu phổ biến bằng các công cụ và tài nguyên tốt nhất. Những người học hoàn thành chương trình chứng chỉ này sẽ được trang bị để ứng tuyển vào các công việc ở cấp độ cơ bản với tư cách là nhà phân tích dữ liệu. Không có kinh nghiệm nào trước đây là cần thiết.
Khi kết thúc khóa học này, người học sẽ:
- Tìm hiểu cách các nhà phân tích quyết định dữ liệu nào cần thu thập để phân tích.
- Tìm hiểu về dữ liệu có cấu trúc và không cấu trúc, các kiểu dữ liệu và định dạng dữ liệu.
- Khám phá cách xác định các loại sai lệch khác nhau trong dữ liệu để giúp đảm bảo độ tin cậy của dữ liệu.
- Khám phá cách các nhà phân tích sử dụng bảng tính và SQL trong cơ sở dữ liệu và tập dữ liệu.
- Kiểm tra dữ liệu mở và mối quan hệ giữa và tầm quan trọng của đạo đức dữ liệu và quyền riêng tư dữ liệu.
- Hiểu cách truy cập cơ sở dữ liệu và trích xuất, lọc và sắp xếp dữ liệu trong đó.
- Tìm hiểu các phương pháp hay nhất để tổ chức dữ liệu và giữ an toàn cho dữ liệu.
Học phần 01: Kiểu và cấu trúc dữ liệu
Một lượng lớn dữ liệu được tạo ra mỗi ngày. Trong phần này của khóa học, bạn sẽ khám phá cách tạo ra dữ liệu này và cách các nhà phân tích quyết định sử dụng dữ liệu nào để phân tích. Bạn cũng sẽ tìm hiểu về dữ liệu có cấu trúc và không cấu trúc, kiểu dữ liệu và định dạng dữ liệu khi bạn bắt đầu nghĩ về cách chuẩn bị dữ liệu để phân tích.
Mục tiêu của học phần 01:
- Giải thích cách Kaggle có thể mang lại lợi ích cho nhà phân tích dữ liệu.
- Giải thích cách dữ liệu được tạo ra như một phần trong hoạt động hàng ngày của chúng tôi có liên quan đến các loại dữ liệu được tạo ra.
- Giải thích các yếu tố cần được xem xét khi đưa ra quyết định về việc thu thập dữ liệu.
- Giải thích sự khác biệt giữa dữ liệu có cấu trúc và không có cấu trúc.
- Thảo luận về sự khác biệt giữa dữ liệu và kiểu dữ liệu.
- Giải thích mối quan hệ giữa các kiểu dữ liệu, trường và giá trị.
- Thảo luận về các định dạng dữ liệu rộng và dài có tham chiếu đến tổ chức và mục đích.
Học phần 02: Trách nhiệm với dữ liệu
Trước khi làm việc với dữ liệu, bạn phải xác nhận rằng dữ liệu đó không thiên vị và đáng tin cậy. Suy cho cùng, nếu bạn bắt đầu phân tích với dữ liệu không đáng tin cậy, bạn sẽ không thể tin tưởng vào kết quả của mình. Trong phần này của khóa học, bạn sẽ học cách xác định thành kiến trong dữ liệu và cách đảm bảo dữ liệu của bạn đáng tin cậy. Bạn cũng sẽ khám phá dữ liệu mở và tầm quan trọng của đạo đức dữ liệu và quyền riêng tư dữ liệu.
Mục tiêu của học phần 02:
- Giải thích những gì liên quan đến việc xem xét dữ liệu để xác định sai lệch.
- Thảo luận về sự khác biệt giữa dữ liệu thiên vị và không thiên vị.
- Xác định các loại sai lệch khác nhau bao gồm sai lệch xác nhận, diễn giải và sai lệch của người quan sát.
- Thảo luận về đặc điểm của các nguồn dữ liệu đáng tin cậy, bao gồm cả việc tham chiếu đến dữ liệu không rõ ràng.
- Giải thích khái niệm dữ liệu mở có liên quan đến cuộc tranh luận đang diễn ra trong phân tích dữ liệu.
- Xác định đạo đức dữ liệu và quyền riêng tư dữ liệu.
- Giải thích mối quan hệ giữa đạo đức dữ liệu và quyền riêng tư dữ liệu.
- Thể hiện sự hiểu biết về lợi ích của việc ẩn danh dữ liệu.
- Thể hiện nhận thức về các vấn đề về khả năng tiếp cận liên quan đến dữ liệu mở.
Học phần 03: Sự cần thiết của cơ sở dữ liệu
Khi bạn phân tích các tập dữ liệu lớn, bạn sẽ truy cập được nhiều dữ liệu từ cơ sở dữ liệu. Trong phần này của khóa học, bạn sẽ tìm hiểu về cơ sở dữ liệu, bao gồm cách truy cập và trích xuất, lọc cũng như sắp xếp dữ liệu trong đó. Bạn cũng sẽ khám phá siêu dữ liệu để khám phá nhiều khía cạnh của siêu dữ liệu và cách các nhà phân tích sử dụng siêu dữ liệu để hiểu rõ hơn về dữ liệu của họ.
Mục tiêu của học phần 03:
- Mô tả cơ sở dữ liệu với các tham chiếu đến chức năng và thành phần của chúng.
- Giải thích siêu dữ liệu vì nó liên quan đến cơ sở dữ liệu.
- Thảo luận tầm quan trọng của siêu dữ liệu và nó liên quan như thế nào đến công việc của nhà phân tích dữ liệu.
- Nhớ lại các vấn đề và các bước liên quan đến việc truy cập dữ liệu từ nhiều nguồn.
- Giải thích việc sử dụng các bộ lọc và chức năng sắp xếp trong bảng tính.
- Trình bày cách sử dụng chức năng bảng tính để nhập và kiểm tra một bộ dữ liệu nhất định.
- Trình bày cách sử dụng các hàm SQL để trích xuất dữ liệu từ cơ sở dữ liệu nhất định.
Học phần 04: Tổ chức và bảo vệ dữ liệu
Kỹ năng tổ chức tốt là một phần quan trọng của hầu hết các loại công việc, đặc biệt là phân tích dữ liệu. Trong phần này của khóa học, bạn sẽ tìm hiểu các phương pháp hay nhất để sắp xếp và bảo mật dữ liệu. Bạn cũng sẽ hiểu cách các nhà phân tích sử dụng quy ước đặt tên tệp để giúp họ sắp xếp công việc của mình một cách ngăn nắp.
Mục tiêu của học phần 04:
- Giải thích các bước có thể được thực hiện để bảo mật dữ liệu.
- Thảo luận về việc sử dụng quy ước đặt tên tệp của các nhà phân tích dữ liệu.
- Mô tả các phương pháp hay nhất để tổ chức dữ liệu.
Học phần 05: Tham gia vào cộng đồng dữ liệu
Sự hiện diện trực tuyến mạnh mẽ có thể giúp ích rất nhiều cho những người tìm việc thuộc mọi loại hình. Trong phần này của khóa học, bạn sẽ khám phá cách quản lý sự hiện diện trực tuyến của mình. Bạn cũng sẽ khám phá những lợi ích của việc kết nối với các chuyên gia phân tích dữ liệu khác.
Mục tiêu của học phần 05:
- Áp dụng các phương pháp hay nhất để phát triển mạng lưới..
- Giải thích tầm quan trọng của việc kết nối với các nhà phân tích dữ liệu khác, bao gồm cả việc tham khảo về cố vấn và giao tiếp.
- Áp dụng các phương pháp hay nhất để quản lý sự hiện diện trực tuyến chuyên nghiệp.
- Mô tả các phương pháp xây dựng sự hiện diện trực tuyến với tư cách là nhà phân tích dữ liệu.
Kết thúc khóa học bạn sẽ hiểu được:
- 05 cách chọn dữ liệu phù hợp.
- Các định dạng dữ liệu trong thực tế
- Các định nghĩa về sự thiên vị trong dữ liệu
- Những yêu cầu về mặt đạo đức khi phân tích dữ liệu
- Những yêu cầu về quyền riêng tư và bảo mật dữ liệu
- Các khái niệm và nguyên tắc cơ bản khi làm việc với cơ sở dữ liệu
- Quản lý dữ liệu bằng siêu dữ liệu
- Cách tổ chức, quản lý và lưu trữ hiệu quả
- Cách khai thác các nguồn dữ liệu mở
- Xử lý BigData với SQL
Để vượt qua khóa học bạn phải hoàn thành các bài kiểm tra có điểm số tối thiểu là 80%, bạn cũng có thể thi cải thiện kết quả với số lần giới hạn.
Nhận xét
Đăng nhận xét