Tạo bảng thống kê mô tả cho tập số liệu trong Excel

Bổ sung thư viện hàm cho Excel
1.Khởi động Microsoft Excel
2.Vào thực đơn Tools
3.Chọn Add-Ins…
4.Chọn Analysis ToolPak
5.Nhấp nút OK.

Tạo bảng thông số thống kê mô tả (Descriptive statistics)

Ví dụ: Xét tập số liệu Dataset.xls, lập bảng các thông số thống kê mô tả cho biến “Age” của các quan sát thu thập được.
B1. Chọn vùng địa chỉ B1:B203 trong bảng tính Dataset
B2. Chọn thực đơn Tools, chọn Data Analysis…

Hộp thoại các công cụ phân tích dữ liệu của Excel​


B3.
 Chọn Descriptive Statistic và nhấp nút OK.
Tại Input Range nhập vùng địa chỉ dữ liệu cần thống kê là B1:B203
Chọn Column tại Group By vì dữ liệu nguồn bố trí theo cột.
Chọn Labels infirst row vì vùng địa chỉ khai báo tại Input Range bao gồm cả nhãn.
Có 3 lựa chọn cho nơi chứa kết quả tổng hợp:

  • Output Range (xác định một ô tại trái-trên mà bảng báo cáo sẽ đặt tại đó, có thể đặt bảng báo cáo trong cùng worksheet với tập dữ liệu);
  • New Worksheet Ply (báo cáo sẽ chứa trong một worksheet mới với tên do bạn qui định);
  • New Workbook (báo cáo sẽ chứa trong một workbook – tập tin Excel mới).

Chọn các thông số cần báo cáo: hãy chọn

  • Summary statistics (các thông số thống kê tổng hợp),
  • Confidence Level of Mean (Độ tin cậy của giá trị trung bình),
  • Kth Largest (Tìm giá trị lớn thứ k trong tập dữ liệu) và
  • Kth Smallest (Tìm giá trị nhỏ thứ k trong tập dữ liệu).

B4. Nhấp nút OK sau khi hoàn tất khai báo các thông số và dưới là bảng kết quả:

Một số khái niệm

Tập hợp chính (Populations): Tập hợp chính là tập hợp tất cả các đối tượng mà ta quan tâm nghiên cứu trong một vấn đề nào đó. Số phần tử của tập hợp chính được ký hiệu là N.
Mẫu (Sample): Mẫu là tập hợp con của tập hợp chính. Mẫu gồm một số hữu hạn n phần tử. Số n được gọi là cỡ mẫu.
Tần số (Frequency): Gọi xi là các giá trị quan sát được của biến ngẫu nhiên X (i = 1, 2, … l). Số lần xuất hiện của giá trị xi trong khối dữ liệu được gọi là tần số của xi và được ký hiệu là fi.
Tần số tích lũy (Cumulative Frequency): Tần số tích lũy của một giá trị xi là tổng số tần số của giá trị này với tần số của các giá trị nhỏ hơn xi.
Các số định tâm (Measure of Central Tendency): Số định tâm của nhóm dữ liệu là số đại diện cho tất cả các dữ liệu đó, nó thể hiện vai trò trung tâm của nhóm dữ liệu. Có các loại số định tâm sau: số trung bình (Mean), trung bình trọng số (Weighted mean) số trung vị (Median) và số yếu vị (Mode).
Các số phân tán (Measure of Dispersion): Số phân tán dùng để thể hiện sự khác biệt giữa các số trong khối Dữ liệu đối với số định tâm: Khoảng (Range), độ lệch chuẩn (Standard deviation) và phương sai (variance).

Nhận xét bài viết