Головна » лідери бізнесу » Квадрат Chi (χ2) Статистичне визначення

Квадрат Chi (χ2) Статистичне визначення

лідери бізнесу : Квадрат Chi (χ2) Статистичне визначення
Що таке статистика квадратних чи?

Квадратура чі ( χ 2 ) статистика - це тест, який вимірює порівняння очікувань із фактично спостережуваними даними (або результатами моделі). Дані, що використовуються при обчисленні статистики квадратних чі, повинні бути випадковими, необробленими, взаємовиключними, виведеними з незалежних змінних та отриманими з достатньо великої вибірки. Наприклад, результати кидання монети в 100 разів відповідають цим критеріям.

Квадратні тести часто використовуються при тестуванні гіпотез.

Формула для квадрата Чи є

χc2 = ∑ (Oi − Ei) 2Всюди: c = ступінь свободиO = спостережуване значення (s) E = очікуване значення (s) \ початок {вирівняне} & \ chi ^ 2_c = \ сума \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {де:} \\ & c = \ текст {ступені свободи} \\ & O = \ текст {спостережуване значення (і)} \\ & E ​​= \ текст {очікуване значення (s )} \\ \ кінець {вирівняно} χc2 = ∑Ei (Oi −Ei) 2, де: c = ступінь свободиO = спостережуване значення (s) E = очікуване значення (s)

Що говорить вам статистика квадратних чи?

Існує два основні типи квадратних тестів чи: тест на незалежність, який задає питання про взаємозв'язок, наприклад, "Чи існує взаємозв'язок між гендерними та показниками САТ?"; і тест на придатність, який запитує щось на кшталт "Якщо монету кинуть 100 разів, чи підійдуть голови 50 разів, а хвости - 50 разів?"

Для цих тестів ступеня свободи використовується, щоб визначити, чи можна відкинути певну нульову гіпотезу на основі загальної кількості змінних та зразків в рамках експерименту.

Наприклад, якщо враховувати вибір студентів та вибір курсу, розмір вибірки 30 або 40 студентів, ймовірно, недостатньо великий, щоб генерувати значні дані. Отримання однакових або подібних результатів дослідження з використанням вибірки розміром 400 або 500 учнів є більш достовірним.

В іншому прикладі розглянемо метання монети 100 разів. Очікуваний результат відкидання справедливої ​​монети в 100 разів - це те, що голови підійдуть 50 разів, а хвости підійдуть в 50 разів. Фактичним результатом може бути те, що голови піднімаються в 45 разів, а хвости - 55 разів. Статистика квадратних чі показує будь-які розбіжності між очікуваними результатами та фактичними результатами.

Ключові вивезення

  • Квадратура чі (χ 2 ) statistic - це тест, який вимірює порівняння очікувань із фактично спостережуваними даними.
  • Існує два основні типи квадратних тестів чи: тест на незалежність даних та тести на придатність моделі.
  • Ці тести можуть бути використані для визначення того, чи можна певну нульову гіпотезу відхилити при тестуванні гіпотез.

Приклад тесту на квадрат Chi

Уявіть, що було проведено випадкове опитування серед 2000 різних виборців, як чоловіків, так і жінок. Люди, які відповіли, були класифіковані за їхньою статтю та чи були вони республіканськими, демократичними чи незалежними. Уявіть сітку із стовпцями, що позначаються республіканською, демократською та незалежною, та двома рядами, на яких позначено чоловіки та жінки. Припустимо, дані 2000 респондентів наступні:

РеспубліканськийДемократНезалежнийВсього
Чоловік400300100800
Жіночий5006001001200
Всього9009002002000 рік

Перший крок для обчислення статистичної статистики чі - це пошук очікуваних частот. Вони обчислюються для кожної "комірки" в сітці. Оскільки є дві категорії гендерних і три категорії політичних поглядів, існує шість загальних очікуваних частот. Формула очікуваної частоти:

E (r, c) = n (r) × c (r) ніде: r = рядок у questionc = стовпець у questionn = відповідний загальний \ початок {вирівняно} & E (r, c) = \ frac {n (r) \ times c (r)} {n} \\ & \ textbf {де:} \\ & r = \ текст {рядок, про який йдеться} \\ & c = \ текст {стовпець, про який йдеться} \\ & n = \ текст {відповідний загальний } \\ \ кінець {вирівняно} E (r, c) = nn (r) × c (r) де: r = рядок у questionc = стовпець у questionn = відповідний загальний

У цьому прикладі очікувані частоти:

  • E (1, 1) = (900 х 800) / 2 000 = 360
  • Е (1, 2) = (900 х 800) / 2 000 = 360
  • Е (1, 3) = (200 х 800) / 2 000 = 80
  • E (2, 1) = (900 x 1200) / 2000 = 540
  • Е (2, 2) = (900 х 1200) / 2 000 = 540
  • Е (2, 3) = (200 х 1200) / 2 000 = 120

Далі ці значення використовуються для обчислення статистичної статистики чи, використовуючи наступну формулу:

Chi-квадрат = ∑ [O (r, c) −E (r, c)] 2E (r, c) де: O (r, c) = спостережувані дані для даного рядка та стовпця \ start {align} & \ text {Chi-squared} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {where:} \\ & O (r, c) = \ текст {спостережувані дані для даного рядка та стовпця} \\ \ кінець {вирівняні} Chi-квадрат = ∑E (r, c) [O (r, c) −E (r, в)] 2 де: O (r, c) = спостережувані дані для даного рядка та стовпця

У цьому прикладі вираз для кожного спостережуваного значення:

  • O (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • O (1, 3) = (100 - 80) 2/80 = 5
  • O (2, 1) = (500 - 540) 2/540 = 2, 96
  • O (2, 2) = (600 - 540) 2/540 = 6, 67
  • O (2, 3) = (100 - 120) 2/120 = 3, 33

Статистична статистика chi тоді дорівнює сумі цих значень або 32, 41. Тоді ми можемо подивитися на статистичну таблицю чи-ква, щоб побачити, враховуючи ступінь свободи в нашій програмі, чи результат є статистично значущим чи ні.

Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.

Пов'язані умови

Визначення ступенів свободи Ступені свободи - це максимальна кількість логічно незалежних значень, які є вибірками, які мають свободу змінюватись у вибірці даних. більше Визначення T-тесту Т-тест - це тип інфекційної статистики, який використовується для визначення, чи є значна різниця між засобами двох груп, яка може бути пов'язана за певними ознаками. докладніше, що нам говорить обернена кореляція Зворотна кореляція, також відома як негативна кореляція, є протилежним співвідношенням між двома змінними, так що вони рухаються в протилежних напрямках. докладніше, як працює залишкове стандартне відхилення Залишкове стандартне відхилення - це статистичний термін, що використовується для опису різниці стандартних відхилень спостережуваних значень від прогнозованих значень, як показано балами регресійного аналізу. докладніше, як працює аналіз варіації (ANOVA) Аналіз дисперсії (ANOVA) - це інструмент статистичного аналізу, який розділяє загальну мінливість, виявлену в наборі даних, на два компоненти: випадкові та систематичні фактори. більше Кореляція Кореляція - це статистичний показник того, як дві цінні папери рухаються один щодо одного. більше Посилання партнерів
Рекомендуємо
Залиште Свій Коментар