Thuật ngữ dữ liệu, bắt nguồn từ mốc thời gian Latinh, đề cập đến thông tin cung cấp quyền truy cập vào kiến thức chính xác và cụ thể. Mặt khác, thống kê là những gì được liên kết với thống kê : chuyên ngành toán học thu hút các số liệu để tạo ra các kết luận hoặc phản ánh định lượng một hiện tượng.
Dữ liệu thống kê, trong khung này, là các giá trị thu được khi thực hiện một nghiên cứu thống kê. Nó là sản phẩm của việc quan sát hiện tượng đó được dự định phân tích.
Giả sử một nhà báo thể thao muốn nghiên cứu hiệu suất của một tay vợt dựa trên kết quả anh ta đạt được trong năm qua. Trong khoảng thời gian đó, người chơi đã chơi 15 trận, trong đó anh ta thắng 5 và thua 10 . Dữ liệu thống kê thu được từ việc quan sát các trận đấu như sau: thất bại - thất bại - thất bại - chiến thắng - chiến thắng - chiến thắng - thất bại - thất bại - thất bại - thất bại - thất bại - chiến thắng.
Để có ích, dữ liệu thống kê phải được tổ chức và xem xét từ một bối cảnh . Quay trở lại ví dụ trước, những dữ liệu này sẽ có giá trị nếu bạn biết họ thuộc về tay vợt nào và trong khoảng thời gian hoặc khoảng thời gian mà vận động viên đó có được.
Điều quan trọng là phải nhớ rằng việc xử lý dữ liệu thống kê là những gì tạo ra thông tin . Các dữ liệu, được coi là cô lập, thiếu quan tâm.
Việc thu thập và xử lý dữ liệu thống kê là những nhiệm vụ rất quan trọng để ra quyết định trong các lĩnh vực khác nhau. Một chính phủ, ví dụ, cần phải có dữ liệu thống kê đáng tin cậy để quyết định chính sách kinh tế của mình.