Квартиль

алгоритмічна торгівля : Квартиль
Що таке Квартиль?

Квартиль - це статистичний термін, що описує поділ спостережень на чотири визначені інтервали на основі значень даних та їх порівняння з усім набором спостережень.

Розуміння квартілів

Щоб зрозуміти квартиль, важливо розуміти медіану як міру центральної тенденції. Медіана в статистиці - це середнє значення набору чисел. Це точка, в якій рівно половина даних лежить нижче і вище центрального значення.

Отже, враховуючи набір з 13 чисел, медіана була б сьомим числом. Шість чисел, що передують цьому значенню, є найнижчими числами в даних, а шість цифр після медіани - найвищі числа в даному наборі даних. Оскільки на медіану не впливають екстремальні величини чи переживачі, то іноді її віддають перевагу середній величині.

Медіана є надійною оцінкою місця розташування, але нічого не говорить про те, як поширюються чи розповсюджуються дані по будь-якій стороні її значення. Ось де відбувається крокетний крок. Квартиль вимірює поширення значень вище та нижче середнього, діливши розподіл на чотири групи.

Ключові вивезення

  • Квартиль вимірює поширення значень вище та нижче середнього, діливши розподіл на чотири групи.
  • Квартиль ділить дані на три точки - нижній квартал, медіану та верхній квартал - для формування чотирьох груп набору даних.
  • Квартілі використовуються для обчислення міжквартильного діапазону, який є мірою мінливості навколо медіани.

Як працюють квартілі

Подібно до того, як медіана ділить дані навпіл, так що 50% вимірювання лежить нижче медіани і 50% лежить над нею, четвертиль розбиває дані на чверті, так що 25% вимірювання менше, ніж нижній квартиль, 50 % менше середнього, а 75% менше, ніж верхній квартал.

Квартиль ділить дані на три точки - нижній квартал, медіану та верхній квартал - для формування чотирьох груп набору даних. Нижній квартал або перший квартал позначається як Q1 і є середнім числом, яке падає між найменшим значенням набору даних та медіаною. Другий квартал, Q2, також є медіаною. Верхня або третя чверть, позначена як Q3, є центральною точкою, що лежить між медіаною та найбільшою кількістю розподілу.

Тепер ми можемо відзначити чотири групи, утворені з квартилів. Перша група значень містить найменше число до Q1; друга група включає Q1 до медіани; третій набір - медіана до Q3; четверта категорія включає Q3 до найвищої точки даних усього набору.

Кожен квартал містить 25% від загальних спостережень. Як правило, дані розташовані від найменших до найбільших:

  1. Перший квартал: найнижчі 25% чисел
  2. Другий квартал: від 25, 1% до 50% (до медіани)
  3. Третій квартал: 51% до 75% (вище медіани)
  4. Четвертий квартал: найвищі 25% чисел

Квартильний приклад

Давайте попрацюємо з прикладом. Припустимо, розподіл математичних балів у класі 19 учнів у порядку зростання:

59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98

Спочатку відмітьте медіану Q2, яка в цьому випадку є десятим значенням: 75.

Q1 - центральна точка між найменшою оцінкою та медіаною. У цьому випадку Q1 потрапляє між першою та п'ятою оцінкою: 68. [Зверніть увагу, що медіана також може бути включена при обчисленні Q1 або Q3 для непарного набору значень. Якби ми включали медіану по обидві сторони від середньої точки, то Q1 буде середнім значенням між першим та десятим балом, що є середнім значенням п'ятого та шостого балів - (п'ятий + шостий) / 2 = (68 + 69) / 2 = 68, 5].

Q3 - середнє значення між Q2 та найвищим балом: 84. [Або якщо включити медіану, Q3 = (82 + 84) / 2 = 83].

Тепер, коли у нас є свої квартилі, давайте інтерпретувати їх кількість. Оцінка 68 (Q1) являє собою перший квартал і є 25- м перцентилем. 68 - медіана нижньої половини балу, встановлена ​​в доступних даних, тобто медіана балів від 59 до 75.

Q1 говорить нам, що 25% балів менше 68, а 75% балів за клас більше. Q2 (медіана) - 50- й перцентиль і показує, що 50% балів менше 75, а 50% балів вище 75. Нарешті, Q3, 75- й перцентиль, показує, що 25% балів - це більше і на 75% менше 84.

Спеціальні міркування

Якщо точка даних для Q1 віддалена від медіани, ніж Q3, від медіани, то можна сказати, що серед менших значень набору даних більша дисперсія, ніж серед більших значень. Ця ж логіка застосовується, якщо Q3 далі від Q2, ніж Q1 - від медіани.

Крім того, якщо є парне число точок даних, медіана буде середнім середніми двома числами. У нашому прикладі вище, якби у нас було 20 учнів замість 19, медіана їх балів буде середньоарифметичним числом десятого та одинадцятого числа.

Квартілі використовуються для обчислення міжквартильного діапазону, який є мірою мінливості навколо медіани. Інтерквартильний діапазон просто обчислюється як різниця між першим і третім кварталом: Q3 - Q1. Насправді саме діапазон середньої половини даних показує, наскільки розподілені дані.

Для великих наборів даних Microsoft Excel має функцію QUARTILE для обчислення квартилів.

Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.

Пов'язані умови

Як працює кількісний метод децилу Дециль - це кількісний метод розподілу набору даних про ранжирування на 10 підрозділів однакового розміру. Цей тип ранжування даних проводиться як частина багатьох наукових та статистичних досліджень у галузі фінансів та економіки. докладніше Описова статистика Описова статистика - це набір коротких описових коефіцієнтів, які підсумовують даний набір даних, що репрезентує цілу чи вибіркову сукупність. детальніше Визначення Квінтилів Квінтил - це статистичне значення набору даних, яке становить 20% від даної сукупності. докладніше Як використовувати середню винзированную середню Винсорізована середня - це метод усереднення, який спочатку замінює найменші та найбільші величини найближчими до них спостереженнями. Це робиться для обмеження впливу аномальних екстремальних значень або переживаючих на обчислення. більше Межі з трьома знаками: Що потрібно знати, три знаки - це статистичний розрахунок, який стосується даних у межах трьох стандартних відхилень від середнього. детальніше Визначення стандартного відхилення Стандартне відхилення - це статистика, яка вимірює дисперсію набору даних щодо його середнього значення та обчислюється як квадратний корінь дисперсії. Він обчислюється як квадратний корень дисперсії шляхом визначення варіації між кожною точкою даних щодо середнього. більше Посилання партнерів
Рекомендуємо
Залиште Свій Коментар