Interquartile range là gì

Related Articles

***Ta biết rằng 4 nghành tương quan của khám phá tài liệu gồm thống kê ( statistics ), Máy học ( Machine Learning ), Cơ sở tài liệu ( Database ) và biễu diễn tri thức ( Visualization ). Trong 4 nghành này thì thống kê đóng vài trò rất quan trọng trong quy trình khám phá tài liệu nhất là trong kiểm định tác dụng của quy mô và trong nhìn nhận tri thức phát hiện được .Bạn đang xem : Interquartile range là gìBài viết này trình làng sơ lược về những khái niệm cơ bản của thống kê dùng trong diễn đạt tài liệu như những tham số đo lường và thống kê khuynh hướng tập trung chuyên sâu của tài liệu ( mean, Median, mode ) và thống kê giám sát sự biến thiên của tài liệu ( Rang, Variance và Standard Deviation, Standard Error ) .

Để dễ hình dung, ta bắt đầu với ví dụ đơn giản sau:

Giả sử rằng bạn chạy 100 m trong sáu lần, mỗi lần chạy bạn dùng đồng hồ đeo tay đo lại thời hạn chạy ( tính bằng giây ) và tác dụng 6 lần chạy của bạn gồm sáu giá trị ( còn gọi là quan sát ) như sau 😡 = { 25.1, 21.2, 17.9, 23.0, 24.6, 19.5 }Dữ liệu này cho bạn biết những thông tin gì ? Sau đây là 1 số ít thống kê đơn thuần của tài liệu về thời hạn chạy 100 m của bạn :- Thời gian chạy trung bình ( mean ) là 21.9 giây- Giá trị giữa ( còn gọi là trung vị – median ) là 22.1 giây- Thời gian chạy nhiều nhất ( maximum ) là 25.1 giây và thời hạn chạy tối thiểu ( minimum ) là 17.9 giây. Nếu so sánh với kỷ lục quốc tế về 100 m là 9.78 giây thì bạn biết rằng mình chạy để tập thể dục cho khỏe chứ không phải là vận động viên điền kinh chuyên nghiệp !- Phương sai ( variance ) là 8.2 giây bình phương và độ lệch chuẩn ( standard Deviation ) là 2.9 giây

Đo lường số đo xu hướng tập trung (Central Tendency)

Để đo lường và thống kê xu thế tập trung chuyên sâu của tài liệu người ta thường dùng 3 tham số đó là số trung bình ( trung bình số học – Arithmetic mean hay average ), số trung vị ( median ) và số mode .

Mean (số trung bình):Trung bình số học được tính đơn giản bằng tổng của tất cả các giá trị của dữ liệu trong mẫu chia cho kích thước mẫu.

*Với tài liệu về chạy 100 m trên ta có*

Median (trung vị):

Trong lý thuyết xác suất và thống kê, số trung vị (Median) là giá trị giữa trong một phân bố chia phân bố thành 2 nhóm mà trong đó số các số trong mỗi nhóm bằng nhau. Nói cách khác, nếu m là trung vị của một phân bố nào đó thì 1/2 cá thể trong phân bố đó có giá trị nhỏ hơn hay bằng m và một nửa còn lại có giá trị bằng hoặc lớn hơn m.

Median được tính như sau: Sắp xếp dữ liệu và lấy giá trị ở giữa. Nếu số giá trị là một số chẳn thì median là trung bình của 2 giá trị ở giữa. Với số liệu trên ta có median=22.1

*

*

Ký hiệu: *floor function). *ceiling function) x ( p ) : Trả về giá trị tại vị trí p trong mẫu x sau khi đã sắp xếp x tăng dần. Trong ví dụ trên ta có n = 6 ,

*

Mode (Yếu vị)

Mode là số có tần suất xuất hiện nhiều nhất trong mẫu. Nếu trong mẫu không có số nào xuất hiện lặp lại thì không có mode.

Với mẫu dữ liệu trên thì không có mode.

So sánh giữa Mean, Median và Mode

Trong 3 tham số Mean, Mode và Median thì Median có khả năng đo lường xu hướng tập trung của dữ liệu mạnh nhất.Xem thêm : Ntn Vlogs Là Ai ? Ntn Vlogs Youtube Channel

Trở lại ví dụ chạy 100 m trên, giả sử sau khi chạy hết 6 lần, bạn chạy tiếp lần thứ 7. Lần này đùng một cái chân bạn bị đau và bạn đi bộ thay vì chạy và tác dụng thời hạn của lần này là 79.9 giây. Bạn cố gắng nỗ lực thử thêm lần nữa và tác dụng vẫn 79.9 giây. Bây giờ ta có Sample về 8 lần chạy như sau :

x={25.1, 21.2, 17.9, 23.0, 24.6, 19.5, 79.9, 79.9}

Các giá trị Mean, Median và Mode so sánh giữa 2 Sample như sau:

Central tendency

6 measurements

8 measurements

More on this topic

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Advertismentspot_img

Popular stories