[go: up one dir, main page]

Bước tới nội dung

Thu thập dữ liệu

Bách khoa toàn thư mở Wikipedia
Ví dụ về thu thập dữ liệu trong khoa học sinh học: Chim cánh cụt Adélie được xác định và được cân mỗi khi chúng đi qua cầu cân tự động trên đường đến hoặc từ biển.[1]

Thu thập dữ liệu là quá trình thu thập và đo lường thông tin về các biến được nhắm mục tiêu trong một hệ thống đã được thiết lập, sau đó cho phép một người trả lời các câu hỏi có liên quan và đánh giá kết quả. Thu thập dữ liệu là một thành phần của nghiên cứu trong tất cả các lĩnh vực nghiên cứu bao gồm khoa học vật lý và xã hội, nhân văn,[2] và trong kinh doanh. Trong khi các phương pháp thay đổi theo kỷ luật, sự nhấn mạnh vào việc đảm bảo bộ sưu tập chính xác và trung thực vẫn giống nhau. Mục tiêu của tất cả việc thu thập dữ liệu là thu thập bằng chứng chất lượng cho phép phân tích dẫn đến việc đưa ra các câu trả lời thuyết phục và đáng tin cậy cho các câu hỏi đã được đặt ra.

Tầm quan trọng

[sửa | sửa mã nguồn]

Bất kể lĩnh vực nghiên cứu hoặc ưu tiên xác định dữ liệu (định lượng hoặc định tính), thu thập dữ liệu chính xác là điều cần thiết để duy trì tính toàn vẹn của nghiên cứu. Việc lựa chọn các công cụ thu thập dữ liệu phù hợp (hiện có, sửa đổi hoặc mới được phát triển) và các hướng dẫn được phân định rõ ràng để sử dụng đúng cách của dữ liệu làm giảm khả năng xảy ra lỗi đo lường.

Một quy trình thu thập dữ liệu chính thức là cần thiết vì nó đảm bảo rằng dữ liệu được thu thập đều được xác định và chính xác. Bằng cách này, các quyết định tiếp theo sẽ dựa trên các lập luận thể hiện trong các phát hiện được thực hiện bằng cách sử dụng dữ liệu hợp lệ.[3] Quá trình này cung cấp cả một đường cơ sở để đo lường và trong một số trường hợp nhất định, chỉ ra những gì cần cải thiện.

Có 5 phương pháp thu thập dữ liệu phổ biến; khảo sát kết thúc và các câu đố, khảo sát và câu hỏi kết thúc mở, phỏng vấn 1 đối 1, các nhóm tập trung và quan sát trực tiếp.[4]

Vấn đề toàn vẹn dữ liệu [5]

[sửa | sửa mã nguồn]

Lý do chính để duy trì tính toàn vẹn dữ liệu là để hỗ trợ quan sát các lỗi trong quy trình thu thập dữ liệu. Những lỗi đó có thể được thực hiện có chủ ý (cố ý làm sai lệch) hoặc không cố ý (lỗi ngẫu nhiên hoặc hệ thống).

Có hai cách tiếp cận có thể bảo vệ tính toàn vẹn dữ liệu và bảo đảm giá trị khoa học của kết quả nghiên cứu được phát minh bởi Craddick, Crawford, Rhodes, Redican, Rukenbrod và Laws năm 2003:

  • Đảm bảo chất lượng - tất cả các hành động được thực hiện trước khi thu thập dữ liệu
  • Kiểm soát chất lượng - tất cả các hành động được thực hiện trong và sau khi thu thập dữ liệu

Đảm bảo chất lượng

[sửa | sửa mã nguồn]

Trọng tâm chính của đảm bảo chất lượng là phòng ngừa mà chủ yếu là một hoạt động hiệu quả chi phí để bảo vệ tính toàn vẹn của việc thu thập dữ liệu. Tiêu chuẩn hóa giao thức thể hiện tốt nhất hoạt động hiệu quả chi phí này, được phát triển trong một hướng dẫn thủ tục toàn diện và chi tiết để thu thập dữ liệu. Nguy cơ không xác định được các vấn đề và sai sót trong quá trình nghiên cứu rõ ràng là do các hướng dẫn bằng văn bản là kém. Được liệt kê là một số ví dụ về những thất bại như vậy:

  • Sự không chắc chắn về thời gian, phương pháp và nhận dạng của người chịu trách nhiệm
  • Danh sách một phần của các mặt hàng cần phải được thu thập
  • Mô tả mơ hồ về các công cụ thu thập dữ liệu thay vì hướng dẫn từng bước nghiêm ngặt về quản lý kiểm tra
  • Không nhận ra nội dung và chiến lược chính xác để đào tạo và đào tạo lại các nhân viên chịu trách nhiệm thu thập dữ liệu
  • Hướng dẫn không rõ ràng để sử dụng, điều chỉnh và hiệu chỉnh thiết bị thu thập dữ liệu
  • Không có cơ chế được xác định trước để ghi lại các thay đổi trong quy trình xảy ra trong quá trình điều tra

Kiểm soát chất lượng

[sửa | sửa mã nguồn]

Vì các hành động kiểm soát chất lượng xảy ra trong hoặc sau khi thu thập dữ liệu, tất cả các chi tiết đều được ghi lại cẩn thận. Cần có một cấu trúc truyền thông được xác định rõ ràng là tiền đề để thiết lập các hệ thống giám sát. Sự không chắc chắn về luồng thông tin không được khuyến nghị vì cấu trúc truyền thông được tổ chức kém dẫn đến giám sát lỏng lẻo và cũng có thể hạn chế các cơ hội phát hiện lỗi. Kiểm soát chất lượng cũng chịu trách nhiệm xác định các hành động cần thiết để sửa chữa các hoạt động thu thập dữ liệu bị lỗi và cũng giảm thiểu các sự cố như vậy trong tương lai. Một nhóm có nhiều khả năng không nhận ra sự cần thiết phải thực hiện các hành động này nếu quy trình của họ được viết một cách mơ hồ và không dựa trên phản hồi hoặc giáo dục.

Vấn đề trong việc thu thập dữ liệu đòi hỏi phải hành động kịp thời bao gồm:

  • Lỗi hệ thống
  • Vi phạm giao thức
  • Gian lận hoặc hành vi sai trái khoa học
  • Lỗi trong các mục dữ liệu cá nhân
  • Lỗi cá nhân của nhân viên hoặc vấn đề hiệu suất tại địa điểm thu thập

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ Lescroël, A. L.; Ballard, G.; Grémillet, D.; Authier, M.; Ainley, D. G. (2014). Descamps, Sébastien (biên tập). “Antarctic Climate Change: Extreme Events Disrupt Plastic Phenotypic Response in Adélie Penguins”. PLoS ONE. 9 (1): e85291. doi:10.1371/journal.pone.0085291. PMC 3906005. PMID 24489657.
  2. ^ Vuong, Quan-Hoang; La, Viet-Phuong; Vuong, Thu-Trang; Ho, Manh-Toan; Nguyen, Hong-Kong T.; Nguyen, Viet-Ha; Pham, Hiep-Hung; Ho, Manh-Tung (ngày 25 tháng 9 năm 2018). “An open database of productivity in Vietnam's social sciences and humanities for public use”. Scientific Data. 5: 180188. doi:10.1038/sdata.2018.188. PMC 6154282. PMID 30251992.
  3. ^ Data Collection and Analysis By Dr. Roger Sapsford, Victor Jupp ISBN 0-7619-5046-X
  4. ^ Jovancic, Nemanja. “5 Data Collection Methods for Obtaining Quantitative and Qualitative Data”. LeadQuizzes. LeadQuizzes. Lưu trữ bản gốc ngày 23 tháng 2 năm 2020. Truy cập ngày 23 tháng 2 năm 2020.
  5. ^ Northern Illinois University (2005). “Data Collection”. Responsible Conduct in Data Management. Lưu trữ bản gốc ngày 5 tháng 10 năm 2020. Truy cập ngày 8 tháng 6 năm 2019.