Hiểu biết về dữ liệu là khả năng đọc, hiểu, làm việc với dữ liệu, phân tích và lập luận dựa vào dữ liệu, và đưa ra được những thông tin có ý nghĩa từ dữ liệu thô. Hiểu biết về dữ liệu không chỉ đơn giản là khả năng đọc bản văn mà bao gồm cả các kỹ năng định lượng và phân tích (như toán học và thống kê) để có thể đọc và hiểu được dữ liệu.
Chính vì vậy, hiểu biết về dữ liệu sẽ giúp chúng ta có thể đưa ra các nhận định hoặc kể chuyện sâu sắc và có căn cứ hơn giúp các nhà nghiên cứu, các nhà hoạch định chính sách và nhà báo có thể giao tiếp một cách hiệu quả hơn với công chúng.
Từ thực tế đó, Sáng kiến phát triển mở (ODI) phối hợp cùng Trung tâm Con người và Thiên nhiên (PanNature) tổ chức chuỗi tập huấn Hiểu biết về Dữ liệu. Chuỗi tập huấn gồm 3 đợt, mỗi đợt kéo dài 5 ngày nhằm từng bước trang bị cho người tham gia những kiến thức và kỹ năng về hiểu biết dữ liệu và kể chuyện dựa trên dữ liệu.
Giáo trình tập huấn được Việt hóa từ Chương trình tập huấn Hiểu biết dữ liệu của Ngân hàng thế giới. Chương trình tập huấn cho phép người học thực hành kĩ lưỡng, vận dụng những kiến thức được học vào các dự án theo nhóm về dữ liệu trong ngành lâm nghiệp. Đồng thời, chương trình giới thiệu rất nhiều các nền tảng, phần mềm mới về xử lý, minh họa dữ liệu mở, miễn phí và cập nhật nhất hiện nay, ví dụ như OpenRefine, Table, Data wrapper, Flourish, Piktochart.
Chuỗi tập huấn bao gồm 6 hợp phần:
- Hợp phần 1: Từ bằng chứng đến câu chuyện – giới thiệu về dữ liệu và cách thức sử dụng dữ liệu để tạo ra các câu chuyện, thông tin về dữ liệu mở cũng như phân tích một số trường hợp điển hình.
- Hợp phần 2: Tìm kiếm thu thập dữ liệu và các dạng dữ liệu – thảo luận về các dạng dữ liệu, các kỹ thuật để tìm kiếm, xử lý số liệu trực tuyến và cách thức biến dữ liệu thành các câu chuyện thông qua việc đưa ra các giả định và câu hỏi.
- Hợp phần 3: Hiểu dữ liệu – đưa ra các khái niệm về làm sạch và tổ chức sắp xếp dữ liệu, cũng như đánh giá chất lượng và nguồn dữ liệu; các kỹ năng tính toán và phân tích dữ liệu. Các vấn đề về đạo đức hay những cạm bẫy khi làm việc với dữ liệu.
- Hợp phần 4: Trực quan hóa dữ liệu – giới thiệu các công cụ để minh họa, trực quan dữ liệu một cách sinh động.
- Hợp phần 5: Suy nghĩ như một nhà báo dữ liệu – Ứng dụng các kiến thức và kỹ năng để làm dự án theo nhóm theo chủ đề tự chọn để kể chuyện.
- Hợp phần 6: Quyền trong số hóa và Bảo mật dữ liệu – đưa ra các thực hành về đảm bảo bảo mật, an ninh mạng trong quá trình làm việc với dữ liệu trên công cụ cá nhân cũng như trên Internet.
Đợt tập huấn thứ nhất với 2 hợp phần đầu tiên được tổ chức tại Hạ Long, từ ngày 06 – 10/07/2020 với sự tham gia của gần 30 thành viên đến từ các tổ chức, đơn vị khác nhau tại nhiều tỉnh thành trên cả nước. Do ảnh hưởng của dịch covid-19 nên một số chuyên gia trong khu vực không thể tới Việt Nam giảng dạy, vì thế chương trình tập huấn kết hợp 02 hình thức trực tiếp lẫn trực tuyến.
Hoạt động được thực hiện trong khuôn khổ dự án Tiếng nói vì Rừng Mê Kông (Voice for Mekong Forests – V4MF) do Liên minh Châu Âu (EU) tài trợ.
Một số hình ảnh trong đợt tập huấn đầu tiên:
Tài liệu tập huấn
Giới thiệu khóa tập huấn Hiểu biết về Dữ liệu
Sự giao nhau của Câu chuyện, Dữ liệu và Chính sách
Sử dụng dữ liệu hiệu quả để kể chuyện
Câu chuyện từ dữ liệu cụ thể theo ngành
Các định dạng dữ liệu thường gặp
Thảo luận sơ bộ về ý tưởng dự án và ví dụ