Логотип

BasedCalc

Межквартильный размах

Введение

Межквартильный размах (Interquartile Range, IQR) — это статистическая мера, показывающая уровень рассеивания или разброса в центральной части набора данных. Он определяется как разница между третьим квартилем (Q3) и первым квартилем (Q1) и представляет собой диапазон, в котором находится середина 50% данных. IQR используется для обнаружения выбросов и понимания распределения данных.

Операция

Для вычисления межквартильного размаха выполните следующие шаги:

  1. Упорядочьте данные по возрастанию.
  2. Нахождение первого квартиля (Q1), который является медианой первой половины данных.
  3. Нахождение третьего квартиля (Q3), который является медианой второй половины данных.
  4. IQR определяется как разность между третьим и первым квартилем: IQR=Q3Q1\text{IQR} = Q3 - Q1

Пример

Рассмотрим набор данных: 4, 7, 10, 15, 18, 21, 30.

  1. Упорядоченные данные: 4, 7, 10, 15, 18, 21, 30.
  2. Первый квартиль (Q1) — медиана первых четырёх значений: Q1=(7+10)/2=8.5Q1 = (7 + 10)/2 = 8.5
  3. Третий квартиль (Q3) — медиана последних четырёх значений: Q3=(18+21)/2=19.5Q3 = (18 + 21)/2 = 19.5
  4. Межквартильный размах: IQR=19.58.5=11\text{IQR} = 19.5 - 8.5 = 11

Свойства

  • Устойчивость к выбросам: IQR более устойчив к выбросам, чем стандартное отклонение и диапазон.
  • Описание распределения: Он показывает, насколько плотно или разреженно данные распределены вокруг медианы.
  • Важен для построения боксплотов: Визуальное представление данных, где IQR помогает обнаружить выбросы.

Примеры использования

Пример 1

Рассмотрим заработные платы в компании: 40k,50k,60k,70k,80k40k, 50k, 60k, 70k, 80k. Квартильные значения:

  • Q1=50kQ1 = 50k, Q3=70kQ3 = 70k
  • IQR = 70k50k=20k70k - 50k = 20k

Пример 2

Анализ учеников по баллам: 55, 60, 65, 65, 70, 75, 80, 85.

  • Q1=(60+65)/2=62.5Q1 = (60+65)/2 = 62.5
  • Q3=(75+80)/2=77.5Q3 = (75+80)/2 = 77.5
  • IQR = 77.562.5=1577.5 - 62.5 = 15

Часто задаваемые вопросы (FAQ)

  • Что такое межквартильный размах? Это разность между третьим и первым квартилем, показывающая разброс центральных 50% данных.

  • Почему IQR важен? Он помогает выявлять выбросы и оценивать разброс данных, не подверженный влиянию экстремальных значений.

  • Как связаны IQR и выбросы? Данные считаются выбросами, если они находятся за пределами 1.5×IQR1.5 \times \text{IQR} от первого и третьего квартилей.

Примеры из жизни

  • Анализ цен недвижимости: IQR позволяет увидеть распределение цен в центральной части рынка, игнорируя экстремальные значения.
  • Образование: Оценка разброса баллов студентов в классе.
  • Биомедицинские исследования: Анализ биологических измерений для выявления аномальных значений.

Ссылки на литературу и ресурсы