Mục lục:
Để ước tính về dân số, các nhà thống kê sử dụng một đại diện mẫu ngẫu nhiên của dân số. Ví dụ: nếu bạn nặng 50 phụ nữ Mỹ ngẫu nhiên, bạn có thể ước tính cân nặng của tất cả phụ nữ Mỹ dựa trên cân nặng trung bình của họ. Lỗi lấy mẫu xảy ra khi kết quả mẫu của bạn lệch khỏi giá trị dân số thực. Đó là, nếu 50 phụ nữ của bạn mang lại trọng lượng trung bình 135 pound khi trung bình thực là 150 pound, thì sai số lấy mẫu của bạn là -15 (thực tế trừ đi quan sát được), nghĩa là bạn đã đánh giá thấp giá trị thực 15 điểm. Vì giá trị thực hiếm khi được biết đến, các nhà thống kê sử dụng các ước tính khác như sai số chuẩn và khoảng tin cậy để ước tính sai số lấy mẫu.
Bậc thang
Tính tỷ lệ phần trăm bạn đang đo. Chẳng hạn, nếu bạn muốn biết bao nhiêu phần trăm học sinh tại một trường học hút thuốc lá, sau đó lấy một mẫu ngẫu nhiên (giả sử n, cỡ mẫu của chúng tôi, bằng 30), yêu cầu họ điền vào một khảo sát ẩn danh và tính tỷ lệ phần trăm Những sinh viên nói họ hút thuốc. Vì lợi ích minh họa, giả sử sáu sinh viên nói họ hút thuốc. Sau đó, tỷ lệ người hút thuốc = (# người hút thuốc) / (tổng số # sinh viên đo được) x 100% = 6/30 x 100% = 20%.
Bậc thang
Tính sai số chuẩn. Vì chúng tôi không biết tỷ lệ phần trăm sinh viên hút thuốc thực tế, chúng tôi chỉ có thể ước tính sai số lấy mẫu bằng cách tính sai số chuẩn. Trong thống kê, chúng tôi sử dụng tỷ lệ, p, thay vì tỷ lệ phần trăm cho các phép tính, vì vậy hãy chuyển đổi 20% thành tỷ lệ. Chia 20% cho 100%, bạn nhận được p = 0,20. Lỗi tiêu chuẩn (SE) cho kích thước mẫu lớn = sqrt p x (1 - p) / n, trong đó sqrt x có nghĩa là lấy căn bậc hai của x. Trong ví dụ này, chúng ta nhận được SE = sqrt 0,2 x (0,8) / 30 = sqrt 0,00533? 0,073.
Bậc thang
Tạo khoảng tin cậy. Giới hạn dưới: tỷ lệ ước tính - 1,96 x SE = 0,2 - 1,96 (0,073) = 0,0569 Giới hạn trên: tỷ lệ ước tính + 1,96 x SE = 0,2 + 1,96 (0,073) = 0,343 Vì vậy, chúng tôi sẽ nói rằng chúng tôi tin tưởng 95% tỷ lệ thực sự của người hút thuốc nằm trong khoảng 0,0569 đến 0,343, hoặc theo tỷ lệ phần trăm, 5,69% hoặc 34,3% học sinh hút thuốc. Mức chênh lệch rộng này cho thấy khả năng xảy ra lỗi lấy mẫu khá lớn.
Bậc thang
Đo lường tất cả mọi người để tính toán sai số lấy mẫu chính xác. Làm cho tất cả học sinh trong trường hoàn thành khảo sát ẩn danh và tính tỷ lệ phần trăm học sinh cho biết họ hút thuốc. Giả sử có 120 trên 800 sinh viên nói rằng họ hút thuốc, thì tỷ lệ phần trăm của chúng tôi là 120/800 x 100% = 15%. Do đó, "lỗi lấy mẫu" của chúng tôi = (ước tính) - (thực tế) = 20 - 15 = 5. Càng gần 0, ước tính của chúng tôi càng tốt và sai số lấy mẫu của chúng tôi càng nhỏ. Tuy nhiên, trong một tình huống thực tế, bạn không có khả năng biết giá trị thực và sẽ phải dựa vào SE và khoảng tin cậy để giải thích.