Головна » алгоритмічна торгівля » Тестування гіпотез з фінансів: концепція та приклади

Тестування гіпотез з фінансів: концепція та приклади

алгоритмічна торгівля : Тестування гіпотез з фінансів: концепція та приклади

Ваш консультант з інвестицій пропонує вам щомісячний інвестиційний план, який обіцяє змінну віддачу кожного місяця. Ви інвестуватимете в нього лише у тому випадку, якщо вам буде забезпечено середній дохід у розмірі 180 доларів США. Ваш радник також розповідає, що за останні 300 місяців у схемі були інвестиційні прибутки із середньою вартістю 190 доларів та стандартним відхиленням 75 доларів. Чи варто інвестувати в цю схему? На допомогу такому прийняттю рішень приходить тестування гіпотез.

Ця стаття передбачає ознайомлення читачів з поняттями звичайної таблиці розподілу, формулою, значенням p та пов'язаними з ними основами статистики.

Що таке тестування гіпотези?

Гіпотеза або тестування значимості - це математична модель для тестування претензії, ідеї чи гіпотези щодо параметра, що цікавить дану сукупність сукупності, використовуючи дані, виміряні у наборі вибірки. Розрахунки проводяться на відібраних зразках для збору більш рішучої інформації про характеристики всієї сукупності, що дозволяє систематично перевіряти твердження або уявлення про весь набір даних.

Ось простий приклад: директор школи повідомляє, що учні в її школі оцінюють в середньому 7 з 10 іспитів. Щоб перевірити цю «гіпотезу», ми записуємо оцінку 30 учнів (вибірку) від усього учнівського населення школи (скажімо, 300) та обчислюємо середнє значення для цього зразка. Потім ми можемо порівняти середню (обчислену) вибірку із середньою (зареєстрованою) сукупністю та спробувати підтвердити гіпотезу.

Якщо взяти інший приклад, річна віддача певного взаємного фонду становить 8%. Припустимо, що взаємний фонд існує вже 20 років. Ми беремо випадкову вибірку річної віддачі пайового фонду за, скажімо, п’ять років (вибірку) і обчислюємо її середню. Потім ми порівнюємо середню (обчислену) вибірку із середньою (заявленою) сукупністю для перевірки гіпотези.

Критерії прийняття рішень повинні базуватися на певних параметрах наборів даних.

Для тестування гіпотез існують різні методології, але в цьому процесі беруть участь однакові чотири основні етапи:

Крок 1: Визначте гіпотезу

Зазвичай повідомлене значення (або статистика претензій) заявляється як гіпотеза і вважається істинним. Для наведених вище прикладів гіпотеза буде:

  • Приклад A: Учні в школі оцінюють в середньому 7 з 10 на іспитах.
  • Приклад B: Щорічна дохідність пайового фонду становить 8% річних.

Цей викладений опис є " нікчемною гіпотезою (H 0 ) " і вважається істинним - спосіб, коли підсудний у судовому засіданні присяжних вважається невинним, доки не буде доведено вину за доказами, представленими в суді. Аналогічно тестування гіпотез починається з викладення та припущення "нульової гіпотези", а потім процес визначає, чи припущення може бути правдивим чи помилковим.

Важливим моментом, який слід зазначити, є те, що ми перевіряємо нульову гіпотезу, оскільки є елемент сумніву в її обґрунтованості. Будь-яка інформація, яка суперечить заявленій нульовій гіпотезі, міститься в Альтернативній гіпотезі (H 1 ). Для наведених вище прикладів альтернативною гіпотезою буде:

  • Студенти оцінюють середнє значення, яке не дорівнює 7.
  • Щорічна дохідність пайового фонду не дорівнює 8% річних.

Іншими словами, альтернативна гіпотеза - це пряме протиріччя нульової гіпотези.

Як і під час судового розгляду, присяжні припускають невинність підсудного (нульова гіпотеза). Прокурор повинен довести інше (альтернативна гіпотеза). Так само дослідник повинен довести, що нульова гіпотеза є істинною, або хибною. Якщо прокурор не зможе довести альтернативну гіпотезу, присяжні повинні відпустити підсудного (ґрунтуючись на рішенні на нікчемній гіпотезі). Аналогічно, якщо досліднику не вдасться довести альтернативну гіпотезу (або просто нічого не робить), то нульова гіпотеза вважається істинною.

Крок 2: Встановіть критерії

Критерії прийняття рішень повинні базуватися на певних параметрах наборів даних, і саме тут з'являється з'єднання з нормальним розподілом.

Згідно зі стандартним постулатом статистики щодо розподілу вибірки: "Для будь-якого розміру вибірки n розподіл вибірки X̅ є нормальним, якщо популяція X, з якої береться вибірка, зазвичай розподіляється". Отже, ймовірність усіх інших можливих вибірок означає, що можна було вибрати, як правило, розподіляються.

Наприклад, визначте, чи середня щоденна прибутковість будь-яких акцій, котируваних на фондовій біржі XYZ, навколо Нового року перевищує 2%.

H 0 : нульова гіпотеза: середнє = 2%

Н 1 : Альтернативна гіпотеза: середня> 2% (це ми хочемо довести)

Візьміть зразок (скажімо, 50 запасів із загальної кількості 500) та обчисліть середнє значення для вибірки.

Для нормального розподілу 95% значень лежать в межах двох стандартних відхилень середньої сукупності. Отже, це нормальне припущення щодо розподілу та граничного граничного набору даних для вибірки дозволяє нам встановити 5% як рівень значущості. Це має сенс, оскільки, згідно з цим припущенням, існує менше 5% ймовірності (100-95) отримання людей, що перевищують два стандартних відхилення від середнього значення. Залежно від характеру наборів даних, інші рівні значущості можуть бути прийняті на рівні 1%, 5% або 10%. Для фінансових розрахунків (включаючи поведінкові фінанси) 5% - це загальновизнаний ліміт. Якщо ми знайдемо будь-які розрахунки, що виходять за рамки звичайних двох стандартних відхилень, то у нас є вагомий випадок випадкових випадків, щоб відкинути нульову гіпотезу.

Графічно він представлений так:

У наведеному вище прикладі, якщо середнє значення вибірки значно більше 2% (скажімо 3, 5%), ми відкидаємо нульову гіпотезу. Прийнято альтернативну гіпотезу (середнє> 2%), що підтверджує, що середньодобова віддача запасів дійсно перевищує 2%.

Однак якщо середня кількість вибірки, ймовірно, не буде значно більшою, ніж 2% (і залишається, скажімо, близько 2, 2%), то ми НЕ МОЖЕМ відкинути нульову гіпотезу. Завдання постає перед тим, як приймати рішення щодо таких близьких випадків. Щоб зробити висновок з обраних вибірок та результатів, слід визначити рівень значущості, що дозволяє зробити висновок про нульову гіпотезу. Альтернативна гіпотеза дозволяє встановити рівень значущості або «критичну цінність» для вирішення таких випадків близького діапазону.

Згідно зі стандартним визначенням підручника, «Критичне значення - це значення відсічення, яке визначає межі, за якими можна отримати менше 5% вибіркових засобів, якщо нульова гіпотеза є істинною. Засіб вибірки, отримане поза критичним значенням, призведе до рішення про відхилення нульової гіпотези. "У наведеному вище прикладі, якщо ми визначили критичне значення як 2, 1%, а обчислене середнє значення дорівнює 2, 2%, ми відкидаємо нульову гіпотезу Критичне значення встановлює чітке розмежування щодо прийняття чи відхилення.

Крок 3: Обчисліть статистику

Цей крок включає обчислення необхідної цифри (цифр), відомої як тестова статистика (як середнє значення, z-оцінка, p-значення тощо) для обраного зразка. (Ми до них звернемось у наступному розділі.)

Крок 4: Отримайте висновок

За допомогою обчислених значень вирішуйте нульову гіпотезу. Якщо ймовірність отримати середню вибірку менше 5%, то висновок полягає у відхиленні нульової гіпотези. В іншому випадку прийміть і збережіть нульову гіпотезу.

Види помилок

У прийнятті рішень на основі вибірки можуть бути чотири можливі результати, що стосується правильного застосування до всього населення:

Рішення про збереження


Рішення про відхилення


Застосовується для всього населення


Правильно


Неправильно

(Помилка TYPE 1 - a)


Не стосується всього населення


Неправильно

(Помилка TYPE 2 - b)


Правильно


"Правильні" випадки - це ті, де рішення, прийняті за зразками, справді застосовні до всієї сукупності. Випадки помилок виникають, коли хтось вирішує зберегти (або відхилити) нульову гіпотезу на основі вибіркових розрахунків, але це рішення насправді не стосується всієї сукупності. Ці випадки становлять помилки типу 1 (альфа) та типу 2 (бета), як зазначено в таблиці вище.

Вибір правильного критичного значення дозволяє усунути помилки альфа типу 1 або обмежити їх до прийнятного діапазону.

Альфа позначає помилку за рівнем значущості і визначається дослідником. Для підтримки стандартного 5% значущості або рівня довіри для ймовірних обчислень це зберігається на рівні 5%.

Відповідно до застосовних орієнтирів та визначення рішень:

  • "Цей критерій (альфа) зазвичай встановлюється на рівні 0, 05 (a = 0, 05), і ми порівнюємо рівень альфа з р-значенням. Коли ймовірність помилки типу I менше 5% (p <0, 05), ми вирішуємо відхилити нульову гіпотезу; інакше ми зберігаємо нульову гіпотезу ».
  • Технічний термін, що використовується для цієї ймовірності, є р-значенням . Він визначається як "ймовірність отримання вибіркового результату, враховуючи, що значення, вказане в нульовій гіпотезі, є істинним. Р-значення для отримання вибіркового результату порівнюється з рівнем значущості ".
  • Помилка типу II, або бета-помилка, визначається як "ймовірність неправильного збереження нульової гіпотези, якщо вона фактично не стосується всієї сукупності".

Ще кілька прикладів демонструють цей та інші розрахунки.

Приклад 1

Є щомісячна схема інвестиційного доходу, яка обіцяє змінну щомісячну дохідність. Інвестор інвестуватиме в нього лише за умови, що він буде забезпечений середнім доходом у розмірі 180 доларів США. Він має вибірку 300-місячної віддачі, середня сума - 190 доларів США, а стандартне відхилення - 75 доларів. Чи варто інвестувати в цю схему ">

Давайте встановимо проблему. Інвестор вкладе кошти в схему, якщо він або вона буде впевнена у бажаній середній дохідності в розмірі 180 доларів.

Н 0 : Нульова гіпотеза: середнє = 180

Н 1 : Альтернативна гіпотеза: середнє значення> 180

Метод 1: Підхід до критичної цінності

Визначте критичне значення X L для середньої вибірки, яке достатньо велике, щоб відхилити нульову гіпотезу - тобто відхилити нульову гіпотезу, якщо середня вибірка> = критичне значення X L

P (ідентифікуйте альфа-помилку типу I) = P (відхиліть H 0, враховуючи, що H 0 відповідає дійсності),

Цього можна досягти, коли середня вибірка перевищує критичні межі.

= P (з огляду на те, що H 0 є істинним) = альфа

Графічно це виглядає так:

Беручи альфа = 0, 05 (тобто 5% рівень значущості), Z 0, 05 = 1, 645 (з таблиці Z або нормальної таблиці розподілу)

=> X L = 180 + 1.645 * (75 / sqrt (300)) = 187.12

Оскільки середнє значення вибірки (190) більше критичного значення (187, 12), нульова гіпотеза відхиляється, і робиться висновок, що середньомісячна дохідність дійсно перевищує 180 доларів, тому інвестор може розглянути можливість інвестування в цю схему.

Спосіб 2: Використання стандартизованої статистики тестів

Можна також використовувати стандартизоване значення z.

Статистика тесту, Z = (середнє значення вибірки - середнє значення сукупності) / (std-dev / sqrt (кількість вибірок).

Тоді область відхилення стає такою:

Z = (190 - 180) / (75 / sqrt (300)) = 2, 309

Наша область відхилення на рівні 5% значущості Z> Z 0, 05 = 1, 645.

Оскільки Z = 2, 309 більше 1, 645, нульова гіпотеза може бути відхилена з аналогічним висновком, згаданим вище.

Метод 3: Розрахунок величини Р

Ми прагнемо ідентифікувати Р (середнє значення вибірки> = 190, коли середнє = 180).

= P (Z> = (190-180) / (75 / sqrt (300))

= P (Z> = 2, 309) = 0, 0084 = 0, 84%

У наступній таблиці для отримання розрахунків p-величини робиться висновок про наявність підтверджених доказів того, що середньомісячні прибутки перевищують 180:

р-значення


Висновок


менше 1%


Підтверджені докази, що підтверджують альтернативну гіпотезу


від 1% до 5%


Вагомі докази, що підтверджують альтернативну гіпотезу


від 5% до 10%


Слабкі докази, що підтверджують альтернативну гіпотезу


більше 10%


Немає доказів, що підтверджують альтернативну гіпотезу


Приклад 2

Новий біржовий брокер (XYZ) стверджує, що його плата за брокерство нижча, ніж у поточного біржового посередника (ABC). Дані, отримані від незалежної дослідницької фірми, вказують на те, що середній і std-dev для всіх клієнтів брокера ABC становить 18 та 6 доларів США відповідно.

Відбирається зразок 100 клієнтів ABC, а посередницькі збори розраховуються за новими тарифами брокера XYZ. Якщо середнє значення вибірки становить 18, 75 дол. США, а std-dev - те саме (6 доларів), чи можна зробити якийсь висновок про різницю середньої брокерської накладної між брокером ABC та XYZ ">

Н 0 : Нульова гіпотеза: середнє = 18

Н 1 : Альтернативна гіпотеза: середня 18 (Це ми хочемо довести.)

Область відхилення: Z <= - Z 2, 5 і Z> = Z 2, 5 (якщо припустити 5% рівень значущості, розділити 2, 5 на кожну сторону).

Z = (середнє значення вибірки - середнє значення) / (std-dev / sqrt (кількість зразків))

= (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25

Це обчислене значення Z падає між двома межами, визначеними:

- Z 2, 5 = -1, 96 і Z 2, 5 = 1, 96.

Звідси випливає висновок, що недостатньо доказів для висновку про різницю між тарифами вашого існуючого брокера та нового брокера.

Як варіант, значення р = P (Z1.25)

= 2 * 0, 1056 = 0, 2112 = 21, 12%, що більше 0, 05 або 5%, що призводить до того ж висновку.

Графічно він представлений наступним:

Бали критики щодо методу гіпотетичного тестування:

  • Статистичний метод, заснований на припущеннях
  • Схильний до помилок, як детально з точки зору альфа-та бета-помилок
  • Інтерпретація p-значення може бути неоднозначною, що призводить до заплутаних результатів

Суть

Тестування гіпотез дозволяє математичній моделі перевірити твердження або ідею з певним рівнем довіри. Однак, як і більшість статистичних інструментів та моделей, він пов'язаний кількома обмеженнями. Використання цієї моделі для прийняття фінансових рішень слід розглядати критично, враховуючи всі залежності. Альтернативні методи, такі як Байєсова висновок, також варто вивчити для подібного аналізу.

Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.
Рекомендуємо
Залиште Свій Коментар