Т-тест

Що таке Т-тест?

Т-тест - це тип інфекційної статистики, який використовується для визначення, чи є значна різниця між засобами двох груп, яка може бути пов'язана за певними ознаками. В основному використовується, коли набори даних, як набір даних, записаних як результат від перегортання монети 100 разів, слідкували за звичайним розповсюдженням і можуть мати невідомі відмінності. Т-тест використовується як інструмент тестування гіпотез, який дозволяє перевірити припущення, застосовне до сукупності.

Т-тест розглядає t-статистику, значення розподілу t і ступеня свободи для визначення ймовірності різниці між двома наборами даних. Для проведення тесту з трьома або більше змінними необхідно використовувати аналіз дисперсії.

1:38

Т-тест

Пояснення Т-тесту

По суті, t-тест дозволяє нам порівнювати середні значення двох наборів даних та визначати, чи походять вони з однієї сукупності. У наведених вище прикладах, якби ми брали вибірку учнів з класу А та іншої вибірки учнів з класу В, ми не очікували б, що вони матимуть абсолютно однакове середнє та стандартне відхилення. Аналогічно, зразки, взяті з контрольної групи, що приймали плацебо, та відібрані з групи, призначеної препаратом, повинні мати дещо інше середнє та стандартне відхилення.

Математично t-тест бере вибірку з кожного з двох наборів і встановлює постановку задачі, приймаючи нульову гіпотезу про те, що два засоби рівні. На основі застосовних формул певні значення обчислюються та порівнюються зі стандартними значеннями, і припущена нульова гіпотеза приймається або відхиляється відповідно.

Якщо нульова гіпотеза може бути відхилена, це вказує на те, що читання даних є сильним і не випадковим. Т-тест - лише один із багатьох тестів, які використовуються для цієї мети. Статистики повинні додатково використовувати тести, окрім t-тесту, щоб вивчити більше змінних та тести з більшими розмірами вибірки. Для великого розміру вибірки статистики використовують z-тест. Інші варіанти тестування включають тест чи-квадрата та f-тест.

Існує три типи t-тестів, і вони класифікуються як залежні та незалежні t-тести.

Ключові вивезення

Т-тест - це тип інфекційної статистики, який використовується для визначення, чи є значна різниця між засобами двох груп, яка може бути пов'язана за певними ознаками.
T-тест - один із багатьох тестів, що використовуються для тестування гіпотез у статистиці.
Для розрахунку t-тесту потрібно три ключових значення даних. Вони включають різницю між середніми значеннями кожного набору даних (називають середньою різницею), стандартним відхиленням кожної групи та кількістю значень даних кожної групи.
Існує кілька різних типів t-тесту, які можна виконати залежно від необхідних даних та типу аналізу.

Неоднозначні результати тесту

Подумайте, що виробник ліків хоче протестувати щойно винайдене ліки. Дотримується стандартної процедури випробування препарату на одній групі пацієнтів та надання плацебо іншій групі, що називається контрольною групою. Плацебо, що надається контрольній групі, є речовиною, що не має терапевтичного значення, і служить орієнтиром для вимірювання того, як реагує інша група, на яку вводиться фактичний препарат.

Після випробування препаратами члени контрольної групи, що годували плацебо, повідомили про збільшення середньої тривалості життя на три роки, тоді як члени групи, яким призначають новий препарат, повідомляють про збільшення середньої тривалості життя на чотири роки. Миттєве спостереження може свідчити про те, що препарат справді працює, оскільки результати краще для групи, яка вживає препарат. Однак можливо також, що спостереження може бути наслідком випадкового виникнення, особливо дивного удачі. Т-тест корисний для висновку, чи результати справді правильні та застосовні для всієї сукупності.

У школі 100 учнів класу А набрали в середньому 85% при стандартному відхиленні 3%. Ще 100 учнів, що належать до класу В, набрали в середньому 87% при стандартному відхиленні 4%. Незважаючи на те, що середнє значення класу В є кращим, ніж у класі А, можливо, невірно перейти до висновку, що загальна ефективність учнів класу В краща, ніж у учнів класу А. Це тому, що поряд з мається на увазі, стандартне відхилення класу В також вище, ніж у класу А. Це вказує на те, що їхні крайні відсотки на нижній та вищій стороні були набагато більш розкиданими порівняно з показниками класу А. Т-тест може допомогти визначити який клас пішов краще.

Припущення Т-тесту

Перше припущення, зроблене щодо t-випробувань, стосується шкали вимірювання. Припущення для t-тесту полягає в тому, що масштаб вимірювань, застосований до зібраних даних, слід за суцільною або порядковою шкалою, такою як бали для тесту на IQ.
Друге зроблене припущення - це просте випадкове вибірка, що дані збираються з репрезентативної, випадково вибраної частини всієї сукупності.
Третє припущення - це дані, коли нанесені графіки, призводять до нормального розподілу, дзвіноподібної кривої розподілу.
Четверте припущення - використовується досить великий розмір вибірки. Більший розмір вибірки означає, що розподіл результатів повинен наближатися до звичайної кривої дзвоникової форми.
Остаточне припущення - однорідність дисперсії. Однорідна або однакова дисперсія існує, коли стандартні відхилення зразків приблизно рівні.

Розрахунок Т-тестів

Для розрахунку t-тесту потрібно три ключових значення даних. Вони включають різницю між середніми значеннями кожного набору даних (називають середньою різницею), стандартним відхиленням кожної групи та кількістю значень даних кожної групи.

Результат t-тесту виробляє значення t. Це обчислене t-значення потім порівнюється зі значенням, отриманим з таблиці критичного значення (називається Таблицею розподілу T). Це порівняння допомагає визначити, наскільки ймовірна різниця між засобами, що сталася випадково, чи чи справді набори даних мають внутрішні відмінності. Т-тест задає питання, чи є різниця між групами справжньою різницею у дослідженні чи це, ймовірно, безглузда статистична різниця.

Таблиці розподілу T

Таблиця розподілу Т доступна у форматі з одним хвостиком та двома хвостами. Перший використовується для оцінки випадків, які мають фіксовану величину або діапазон з чітким напрямком (позитивним чи негативним). Наприклад, яка ймовірність того, що значення виходу залишатиметься нижче -3, або отримує більше семи під час прокатки пари кісток? Останній використовується для аналізу, пов'язаного з діапазоном, наприклад, запитання, чи не відповідають координати між -2 і +2.

Розрахунки можна проводити за допомогою стандартних програмних програм, які підтримують необхідні статистичні функції, наприклад, такі, що знаходяться в MS Excel.

T-цінності та ступені свободи

Тест t дає два значення як t-значення та ступінь свободи. Значення t - це відношення різниці між середнім значенням двох наборів вибірки та різницею, що існує в наборах вибірки. Незважаючи на те, що значення чисельника (різниця між середнім значенням двох вибіркових наборів) є простим для обчислення, знаменник (різниця, що існує у наборах вибірки) може стати трохи складнішим залежно від типу значень даних. Знаменник співвідношення - це вимірювання дисперсії або мінливості. Більш високі значення t-значення, які також називаються t-балами, вказують на існування великої різниці між двома наборами вибірки. Чим менше значення t, тим більше подібності між двома наборами вибірки.

Великий t-бал вказує на те, що групи різні.
Невеликий t-бал вказує на те, що групи схожі.

Ступені свободи стосуються цінностей у дослідженні, які мають свободу змінюватись і є важливими для оцінки важливості та обґрунтованості нульової гіпотези. Обчислення цих значень зазвичай залежить від кількості записів даних, наявних у наборі вибірки.

Корельований (або парний) Т-тест

Корельований t-тест проводиться, коли зразки, як правило, складаються із зіставлених пар подібних одиниць або коли є випадки повторних заходів. Наприклад, можуть бути випадки, коли одні й ті ж пацієнти повторно обстежуються - до та після того, як вони отримували певне лікування. У таких випадках кожного пацієнта використовують як контрольний зразок проти себе.

Цей метод також застосовується у випадках, коли зразки пов'язані певним чином або мають відповідні характеристики, як порівняльний аналіз, що включає дітей, батьків чи братів і сестер. Корельовані або парні t-тести залежать від типу, оскільки вони включають випадки, коли два набори зразків пов'язані.

Формула для обчислення t-значення та ступенів свободи для парного t-тесту:

Середнє значення1 і середнє значення2 є середніми значеннями кожного з наборів вибірки, тоді як var1 і var2 являють собою дисперсію кожного з наборів вибірки.

Решта двох типів належать до незалежних t-тестів. Зразки цих типів вибираються незалежно один від одного, тобто набір даних у двох групах не відноситься до однакових значень. Вони включають такі випадки, як група з 100 пацієнтів, розділених на два групи по 50 пацієнтів. Одна з груп стає контрольною і отримує плацебо, а інша отримує призначене лікування. Це утворює дві незалежні вибіркові групи, які не мають між собою пар.

Т-тест на рівну варіативність (або в сукупності)

T-тест на рівну дисперсію використовується, коли кількість зразків у кожній групі однакова або дисперсія двох наборів даних однакова. Для розрахунку t-значення та ступенів свободи для t-тесту рівномірної дисперсії використовується наступна формула:

T-значення = середнє1-середнє2 (n1−1) × var12 + (n2−1) × var22n1 + n2−2 × 1n1 + 1n2, де: середнє значення1 і середнє значення 2 = середні значення для вибірки множиниvar1 і var2 = відмінність кожного з зразок setn1 і n2 = Кількість записів у кожному наборі зразків \ start {вирівнювання} & \ текст {T-значення} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ times var1 ^ 2 + (n2 - 1) \ раз var2 ^ 2} {n1 + n2 - 2}} \ раз \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}}} \\ & \ textbf { де:} \\ & mean1 \ текст {і} mean2 = \ текст {Середні значення кожного} \\ & \ текст {зразків наборів} \\ & var1 \ text {і} var2 = \ text {Варіант кожного з вибіркові набори} \\ & n1 \ текст {і} n2 = \ текст {Кількість записів у кожному наборі зразків} \\ \ кінець {вирівняно} T-значення = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 середнє1 - середнє2, де: середнє значення1 та середнє значення 2 = середні значення для наборів зразківvar1 та var2 = Варіантність кожного з наборів наборів n1 та n2 = Кількість записів у кожному зразку набір

і,

Градуси свободи = n1 + n2−2 десь: n1 і n2 = Кількість записів у кожному наборі зразків \ початок {вирівняне} & \ текст {Градуси свободи} = n1 + n2 - 2 \\ & \ textbf {де:} \\ & n1 \ текст {і} n2 = \ текст {Кількість записів у кожному наборі зразків} \\ \ кінець {вирівняно} Ступені свободи = n1 + n2−2 десь: n1 і n2 = Кількість записів у кожному наборі вибірки Нямецкімі мовамі

Т-тест на нерівну варіативність

Т-тест на неоднакову дисперсію застосовується, коли кількість вибірок у кожній групі різна, а дисперсія двох наборів даних також різна. Цей тест називають також тестом Велча. Для розрахунку t-значення та ступенів свободи для t-тесту неоднакової дисперсії використовується наступна формула:

T-значення = середнє значення1 середнє значення212121 вар22n2, де: середнє значення1 і середнє значення 2 = середні значення для наборів вибіркиvar1 і var2 = Варіантність кожного набору вибіркиn1 і n2 = Кількість записів у кожній множині вибірки \ початок {узгоджений} & \ текст {T-значення} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}}} \\ & \ textbf {де:} \ \ & mean1 \ text {і} mean2 = \ text {Середні значення кожного} \\ & \ текст {вибіркових наборів} \\ & var1 \ text {і} var2 = \ text {Варіант кожного зразків наборів} \ \ & n1 \ текст {і} n2 = \ текст {Кількість записів у кожному наборі зразків} \\ \ кінець {вирівняно} значення T = n1var12 + n2var22 середнє1 - середнє значення2, де: середнє значення1 і середнє значення2 = середні значення з різних наборів зразківvar1 і var2 = Варіант кожного з набору вибірки n1 і n2 = Кількість записів у кожному наборі вибірки

і,

Ступені свободи = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1 десь: var1 і var2 = Варіант кожного з наборів наборів n1 і n2 = Кількість записів у кожному наборі вибірки \ початок {вирівняно } & \ текст {Градуси свободи} = \ frac {\ зліва (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ праворуч) ^ 2} {\ frac {\ зліва ( \ frac {var1 ^ 2} {n1} \ праворуч) ^ 2} {n1 - 1} + \ frac {\ вліво (\ frac {var2 ^ 2} {n2} \ праворуч) ^ 2} {n2 - 1}} \\ & \ textbf {де:} \\ & var1 \ текст {і} var2 = \ текст {Варіант кожного з наборів наборів вибірків} \\ & n1 \ текст {і} n2 = \ текст {Кількість записів у кожному наборі зразків } \\ \ кінець {вирівняно} Ступені свободи = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 де: var1 і var2 = Відмінність кожного вибіркових множин n1 і n2 = Кількість записів у кожній множині вибірки

Визначення правильного використання Т-тесту

Наступна блок-схема може бути використана для визначення того, який т-тест слід використовувати на основі характеристик наборів зразків. Основні елементи, які слід враховувати, включають, чи схожі записи зразків, кількість записів даних у кожному наборі вибірки та дисперсія кожного набору вибірки.

Зображення Джулі Банг © Інвестопедія 2019

Приклад тесту нерівномірної варіації

Припустимо, що ми проводимо діагональне вимірювання картин, отриманих в художній галереї. Одна група зразків включає 10 картин, а інша включає 20 картин. Набори даних із відповідними середніми та дисперсійними значеннями є такими:

	Набір 1	Набір 2
	19.7	28.3
	20.4	26.7
	19.6	20.1
	17.8	23.3
	18.5	25.2
	18.9	22.1
	18.3	17.7
	18.9	27.6
	19.5	20.6
	21, 95	13.7
		23.2
		17.5
		20.6
		18
		23.9
		21.6
		24.3
		20.4
		23.9
		13.3
Середній	19.4	21.6
Варіантність	1.4	17.1

Незважаючи на те, що середнє значення набору 2 вище, ніж у набору 1, ми не можемо зробити висновок, що всі картини мають середню довжину близько 21, 6 одиниць, оскільки дисперсія множини 2 значно більша за задану 1. Це випадково чи дійсно існують відмінності у цілій популяції всіх картин, отриманих в картинній галереї ">

Оскільки кількість записів даних різна (n1 = 10 і n2 = 20) і дисперсія також відрізняється, t-значення та ступінь свободи обчислюються для вищенаведеного набору даних, використовуючи формулу, згадану в T-тесті нерівної варіації. розділ.

Значення t становить -2, 24787. Оскільки знак мінус можна ігнорувати при порівнянні двох t-значень, обчислене значення становить 2, 224787.

Значення ступенів свободи становить 24, 38 і знижується до 24, завдяки визначенню формули, що вимагає округлення значення до найменшого можливого цілого значення.

Щоразу, коли передбачається нормальний розподіл, можна визначити рівень ймовірності (рівень альфа, рівень значущості, р ) як критерій прийняття. У більшості випадків можна припустити значення 5%.

Використовуючи ступінь значення свободи як 24 та 5% рівень значущості, погляд на таблицю розподілу t-значень дає значення 2, 064. Порівнюючи це значення з обчисленим значенням 2, 224 вказує на те, що обчислене t-значення перевищує табличне значення при рівні значущості 5%. Тому безпечно відкинути нульову гіпотезу про відсутність різниці між засобами. Набір населення має внутрішні відмінності, і вони не випадкові.

Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.

Пов'язані умови

Як працює аналіз варіації (ANOVA) Аналіз дисперсії (ANOVA) - це інструмент статистичного аналізу, який розділяє загальну мінливість, виявлену в наборі даних, на два компоненти: випадкові та систематичні фактори. детальніше Розуміння розподілу T Розподіл AT - це тип функції ймовірності, який підходить для оцінки параметрів сукупності для невеликих розмірів вибірки або невідомих дисперсій. більше Визначення ступенів свободи Ступінь свободи відноситься до максимальної кількості логічно незалежних значень, що є значеннями, що мають свободу змінюватись у вибірці даних. докладніше, як працює залишкове стандартне відхилення Залишкове стандартне відхилення - це статистичний термін, що використовується для опису різниці стандартних відхилень спостережуваних значень від прогнозованих значень, як показано балами регресійного аналізу. докладніше Як працює статистика квадратів Чі Статистика статистики квадрата хі (χ2) - це тест, який вимірює порівняння очікувань із фактичними спостережуваними даними (або результатами моделі). Дані, що використовуються при обчисленні статистики квадратних чі, повинні бути випадковими, необробленими, взаємовиключними, виведеними з незалежних змінних та отриманими з достатньо великої вибірки. докладніше Як використовується тест Вілкоксона Тест Вілкоксона, який стосується або тесту Ранкової суми, або тестування підписаного рангу, є непараметричним тестом, який порівнює дві парні групи. більше Посилання партнерів

← Графік прибутку та обсягу (PV)

5 речей, які потрібно знати про фондові індекси →

Рекомендуємо

Залиште Свій Коментар