Thống kê mô tả descriptive statistics là gì?

Descriptive statistics là gì?

Descriptive statistics có nghĩa là thống kê mô tả tóm tắt và sắp xếp các đặc điểm của một tập dữ liệu. Tập dữ liệu là tập hợp các câu trả lời hoặc quan sát từ một mẫu hoặc toàn bộ tập hợp.

Trong nghiên cứu định lượng, sau khi thu thập dữ liệu, bước đầu tiên của phân tích thống kê là mô tả đặc điểm của từng mục, chẳng hạn như giá trị trung bình của một biến (ví dụ: tuổi) hoặc mối quan hệ giữa hai biến (ví dụ: tuổi và khả năng sáng tạo).

Bước tiếp theo là thống kê suy luận, giúp bạn quyết định xem dữ liệu của bạn xác nhận hay bác bỏ giả thuyết của bạn và liệu nó có thể khái quát hóa cho một nhóm lớn hơn hay không.

“Thống kê mô tả tóm tắt hoặc mô tả các đặc điểm của tập dữ liệu.”

Phân loại thống kê mô tả

Phân phối tần suất

Được sử dụng cho cả dữ liệu định lượng và định tính, phân bố tần suất mô tả tần suất hoặc số lượng các kết quả khác nhau trong một tập dữ liệu. Phân bố tần suất thường được trình bày dưới dạng bảng hoặc đồ thị. Mỗi mục nhập trong bảng hoặc biểu đồ được đi kèm với số lượng hoặc tần suất xuất hiện của các giá trị trong một khoảng, phạm vi hoặc nhóm cụ thể.

Phân phối tần suất về cơ bản là một bản trình bày hoặc tóm tắt dữ liệu được phân loại dựa trên các lớp loại trừ lẫn nhau và số lần xuất hiện trong mỗi lớp tương ứng. Nó giúp trình bày dữ liệu thô một cách có hệ thống.

Phân bố tần suất được sử dụng trong biểu đồ thanh, biểu đồ hình tròn và biểu đồ đường thẳng.

Xu hướng tập trung

Xu hướng trung tâm đề cập đến tóm tắt mô tả của tập dữ liệu bằng cách sử dụng một giá trị duy nhất phản ánh điểm chính của phân phối dữ liệu. Các thước đo về xu hướng trung tâm còn được gọi là các thước đo về vị trí trung tâm. Giá trị trung bình, trung vị và chế độ là các thước đo của xu hướng trung tâm.

Giá trị trung bình được coi là thước đo phổ biến nhất của xu hướng trung tâm, là giá trị trung bình hoặc giá trị phổ biến nhất trong một tập dữ liệu. Trung vị đề cập đến điểm giữa cho một tập dữ liệu theo thứ tự tăng dần. Chế độ này đề cập đến điểm số hoặc giá trị thường xuyên nhất trong một tập dữ liệu.

Độ biến thiên

Thước đo độ biến thiên là một thống kê tóm tắt phản ánh mức độ phân tán trong một tập hợp. Các phép đo độ biến thiên xác định khoảng cách các điểm dữ liệu rời ra khỏi trung tâm.

Độ phân tán, độ lan truyền và độ biến thiên đều đề cập đến và biểu thị phạm vi và độ rộng của việc phân phối các giá trị trong một tập dữ liệu. Phạm vi, độ lệch chuẩn và phương sai được sử dụng tương ứng để mô tả các thành phần và khía cạnh khác nhau của chênh lệch.

Phạm vi mô tả mức độ phân tán giữa các giá trị cao nhất và thấp nhất trong một tập dữ liệu. Độ lệch chuẩn được sử dụng để xác định phương sai trung bình trong một tập dữ liệu và cung cấp thông tin chi tiết về khoảng cách hoặc sự khác biệt giữa giá trị trong tập dữ liệu và giá trị trung bình của cùng tập dữ liệu. Phương sai phản ánh mức độ chênh lệch và về cơ bản là giá trị trung bình của các độ lệch bình phương.

Tầm quan trọng của thống kê mô tả descriptive statistics là gì?

Như đã nói ở phần descriptive statistics là gì thì thống kê mô tả cho phép dễ dàng trực quan hóa dữ liệu. Nó cho phép dữ liệu được trình bày một cách có ý nghĩa và dễ hiểu, từ đó có thể giải thích tập dữ liệu được đề cập theo cách đơn giản nhất. Dữ liệu thô sẽ khó phân tích và việc xác định xu hướng và mô hình có thể khó thực hiện. Ngoài ra, dữ liệu thô khiến việc hình dung dữ liệu đang hiển thị trở nên khó khăn.

Hãy xem xét ví dụ sau:

Có 100 sinh viên đăng ký cho một học phần cụ thể. Để tìm thành tích tổng thể của các sinh viên tham gia học phần tương ứng và phân bố điểm, phải sử dụng thống kê mô tả. Lấy điểm dưới dạng dữ liệu thô sẽ chứng minh việc xác định hiệu suất tổng thể và phân phối điểm là một thách thức.

Hơn nữa, thống kê mô tả cho phép tập hợp dữ liệu được tóm tắt và trình bày thông qua sự kết hợp của các mô tả dạng bảng và đồ thị và thảo luận về các kết quả được tìm thấy. Thống kê mô tả được sử dụng để tóm tắt dữ liệu định lượng phức tạp.

Sự khác biệt giữa thống kê mô tả và thống kê tham chiếu là gì?

Thống kê tham chiếu lấy một mẫu dữ liệu ngẫu nhiên từ một phần trong tập hợp và mô tả và đưa ra suy luận về toàn bộ tập hợp. Ví dụ, khi hỏi 50 người xem họ có thích bộ phim mà họ vừa xem hay không, thống kê suy luận sẽ xây dựng dựa trên điều đó và giả định rằng những kết quả đó sẽ phù hợp với phần còn lại của lượng người xem phim nói chung.

Do đó, nếu bạn đứng bên ngoài rạp chiếu phim đó và khảo sát 50 người vừa xem bộ phim X và 38 người trong số họ không thích nó (khoảng 76%), bạn có thể ngoại suy rằng 76% phần còn lại của thế giới xem phim cũng sẽ không thích nó, mặc dù bạn không có phương tiện, thời gian và cơ hội để hỏi tất cả mọi người.

Nói một cách đơn giản: Thống kê mô tả cung cấp cho bạn một bức tranh rõ ràng về những gì dữ liệu hiện tại của bạn hiển thị. Thống kê tham chiếu đưa ra dự đoán dựa trên dữ liệu đó.

Trên đây là những chia sẻ về descriptive statistics là gì cũng như phân loại và sự khác biệt với thống kê tham chiếu, hi vọng bạn đã có được những thông tin thực sự hữu ích.

Trâm Nguyễn

Sao chép thành công