Hướng dẫn cách tính độ trải giữa (IQR)

Nếu đang học và tìm hiểu về phân tích thống kê, hẳn bạn sẽ phải làm quen với các kiến thức về khoảng biến thiên, phương sai, độ lệch chuẩn, và độ trải giữa. Bài viết này sẽ đề cập đến khái niệm và cách tính độ trải giữa, hay Interquartile Range.

1. Độ trải giữa là gì? 

Độ trải giữa ( còn gọi là khoảng chừng tứ phân vị ) là một đại lượng số thống kê giám sát mức độ phân tán của tập dữ liệu. Đại lượng này được tính ra bằng cách lấy giá trị tứ phân vị thứ ba trừ đi giá trị tứ phân vị thứ nhất .

tinh độ trải giữa

Nói cách khác, Về cơ bản, độ trải giữa thể hiện khoảng rộng hay “sự phân tán” của tập số. Khoảng tứ phân vị được xác định bằng sự chênh lệch giữa điểm tứ phân vị trên (25% cao nhất) và điểm tứ phân vị dưới (25% thấp nhất) của tập dữ liệu.

Điểm tứ phân vị dưới thường được ký hiệu là Q1, điểm tứ phân vị trên là Q3 – vậy trung điểm của tập dữ liệu sẽ là Q2 và cao nhất là Q4. Bạn hoàn toàn có thể chia list ra làm bốn phần bằng nhau. Mỗi phần sẽ là một “ tứ phân vị ”. Ví dụ như trong tập tài liệu : 1, 2, 3, 4, 5, 6, 7, 8 .

  • 1 và 2 là tứ phân vị thứ nhất – Q1
  • 3 và 4 là tứ phân vị thứ hai – Q2
  • 5 và 6 là tứ phân vị thứ ba – Q3
  • 7 và 8 là tứ phân vị thứ tư – Q4

2. Cách tính độ trải giữa

Để xác lập độ chênh lệch giữa tứ phân vị trên và dưới, bạn cần lấy phân vị thứ 75 ( Q3 ) trừ cho phân vị thứ 25 ( Q1 ) .

Thể hiện qua công thức như sau :

IQR = Q3 – Q1

Để hoàn toàn có thể tính được IQR chuẩn xác, bạn sẽ cần thực thi lần lượt theo những bước sau :

Bước 1: sắp xếp tập dữ liệu theo thứ tự tăng dần, hay thứ tự từ bé đến lớn.

Bước 2: Tìm midpoint – điểm ở giữa, hay trung điểm, của tập dữ liệu

  • Với số dữ liệu chẵn: trung điểm sẽ nằm giữa hai số ở trung tâm
  • Với số dữ liệu lẻ: chọn chính xác số nằm giữa

Bước 3: Tìm trung vị của nửa trên và nửa dưới trong tập hợp dữ liệu.

  • Với số dữ liệu chẵn: chọn chính xác các trung vị tương đối của tập hợp con trên và dưới
  • Với số dữ liệu lẻ: loại trừ số ở giữa

Bước 4: Áp dụng công thức IQR = Q3 – Q1 để tìm độ trải giữa

Xem thêm: flattering tiếng Anh là gì?

3. Ví dụ minh họa tính IQR

Ví dụ 1: Cho một tập hợp số dữ liệu chẵn (A): 4 7 9 11 12 20.

Khi đó, trung điểm ( midpoint ) của tập hợp sẽ nằm giữa 9 và 11 như sau :
4 7 9 | 11 12 20
Từ đó, suy ra :

  • Trung vị của nửa dưới = 7 (Q1)
  • Trung vị của nửa trên = 12 (Q3)

Như vậy, độ trải giữa ( IQR ) của tập hợp sẽ là : 12 – 7 = 5

Ví dụ 2: Cho một tập hợp số dữ liệu lẻ (B): 5 8 10 10 15 18 23.

Khi đó, trung điểm ( midpoint ) của tập hợp sẽ là 10, bộc lộ như sau :
5 8 10 ( 10 ) 15 18 23
Từ đó, suy ra :

  • Trung vị của nửa dưới = 8 (Q1)
  • Trung vị của nửa trên = 18 (Q3)

(Vì tập hợp số dữ liệu lẻ, ta loại bỏ midpoint để tìm được trung vị tương đối)

Như vậy, độ trải giữa ( IQR ) của tập hợp này là : 18 – 8 = 10

Xem thêm: Cách tính khoảng cách giữa hai điểm

Trên đây là kiến thức cơ bản nhất về tính độ trải giữa IQR. Phép tính các giá trị trong phân tích thống kê thực chất không quá khó, tuy nhiên bạn phải hiểu được cách tính và xác định được các khái niệm thật chuẩn xác để áp dụng nhanh chóng.

Rate this post
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments