Головна » алгоритмічна торгівля » Основи регресії для аналізу бізнесу

Основи регресії для аналізу бізнесу

алгоритмічна торгівля : Основи регресії для аналізу бізнесу

Якщо ви коли-небудь замислювалися про те, як два чи більше фрагментів даних стосуються один одного (наприклад, як на ВВП впливають зміни безробіття та інфляції), або якщо у вас коли-небудь було начальника, попросіть створити прогноз або проаналізувати прогнози на основі щодо взаємозв'язків між змінними, то вивчення регресійного аналізу цілком варто вашому часу.

У цій статті ви дізнаєтесь основи простої лінійної регресії, яку іноді називають «звичайними найменшими квадратами» або регресією OLS - інструментом, який зазвичай використовується в прогнозуванні та фінансовому аналізі. Ми почнемо з вивчення основних принципів регресії, спочатку дізнаємось про коваріацію та кореляцію, а потім переходимо до побудови та інтерпретації результатів регресії. Популярне бізнес-програмне забезпечення, таке як Microsoft Excel, може зробити для вас всі розрахунки та результати регресії, але все ж важливо вивчити основні механізми.

Змінні

В основі моделі регресії лежить залежність між двома різними змінними, які називаються залежними та незалежними змінними. Наприклад, припустимо, що ви хочете прогнозувати продажі для вашої компанії, і ви зробили висновок, що продажі вашої компанії зростають та зменшуються залежно від змін ВВП.

Продажі, які ви прогнозуєте, були б залежною змінною, оскільки їх значення "залежить" від величини ВВП, а ВВП був би незалежною змінною. Тоді вам слід визначити міцність зв’язку між цими двома змінними, щоб прогнозувати продажі. Якщо ВВП збільшується / зменшується на 1%, на скільки ваші продажі збільшаться чи зменшаться?

Коваріація

Cov (x, y) = ∑ (xn − xu) (yn −uu) N \ start {вирівняний} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ кінець {вирівняний} Cov (x, y) = ∑N (xn −xu) (yn −yu)

Формула для обчислення зв'язку між двома змінними називається коваріацією. Цей розрахунок показує вам напрямок відносин. Якщо одна змінна збільшується, а інша змінна також збільшується, коваріація буде позитивною. Якщо одна змінна йде вгору, а інша має тенденцію до зниження, коваріація буде негативною.

Дійсне число, яке ви отримуєте від обчислення цього, важко інтерпретувати, оскільки воно не стандартизоване. Наприклад, коваріація з п'яти може бути інтерпретована як позитивна залежність, але міцність відносин може бути сказана лише сильнішою, ніж якби число було чотирма або слабкішими, ніж якщо число було шість.

Коефіцієнт кореляції

Кореляція = ρxy = Covxysxsy \ початок {вирівняний} & Кореляція = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ кінець {вирівняний} Кореляція = ρxy = sx sy Covxy Нямецкімі мовамі

Нам потрібно стандартизувати коваріацію, щоб ми могли краще інтерпретувати та використовувати її для прогнозування, а результат - кореляційний розрахунок. Кореляційний розрахунок просто приймає коваріацію і ділить її на добуток стандартного відхилення двох змінних. Це пов'яже співвідношення між значенням -1 та +1.

Кореляція +1 може бути інтерпретована таким чином, що дозволяє припустити, що обидві змінні ідеально позитивно рухаються між собою, а -1 означає, що вони абсолютно негативно співвідносяться. У нашому попередньому прикладі, якщо співвідношення дорівнює +1, а ВВП збільшується на 1%, то продажі зростуть на 1%. Якщо співвідношення становить -1, збільшення ВВП на 1% призведе до зниження продажів на 1% - прямо навпаки.

Рівняння регресії

Тепер, коли ми знаємо, як обчислюється відносна залежність між двома змінними, ми можемо розробити рівняння регресії для прогнозування або прогнозування бажаної змінної. Нижче наведена формула простої лінійної регресії. "Y" - це значення, яке ми намагаємось прогнозувати, "b" - це нахил лінії регресії, "x" - це значення нашого незалежного значення, а "a" являє собою y-перехоплення. Рівняння регресії просто описує залежність між залежною змінною (y) і незалежною змінною (x).

y = bx + a \ begin {вирівняно} & y = bx + a \\ \ кінець {вирівняно} y = bx + a

Перехоплення або "a" - це значення y (залежна змінна), якщо значення x (незалежна змінна) дорівнює нулю, і тому іноді просто називається "константа". Тож якби не було зміни ВВП, ваша компанія все одно здійснила б деякі продажі - ця величина, коли зміна ВВП дорівнює нулю, є перехопленням. Подивіться на графік нижче, щоб побачити графічне зображення рівняння регресії. У цьому графіку є лише п'ять точок даних, представлених п'ятьма точками на графіку. Лінійна регресія намагається оцінити лінію, яка найкраще відповідає даним (лінія, що найкраще підходить), і рівняння цієї лінії призводить до рівняння регресії.

Рисунок 1: Найкраще підійде лінія

Джерело: Інвестопедія

Регресії в Excel

Тепер, коли ви зрозуміли деякі передумови, що переходять до регресійного аналізу, давайте зробимо простий приклад, використовуючи регресійні інструменти Excel. Ми будемо спиратися на попередній приклад спроби прогнозувати продажі на наступний рік на основі зміни ВВП. Наступна таблиця перераховує деякі штучні точки даних, але ці цифри можуть бути легко доступними в реальному житті.

РікПродажіВВП
2014 рік1001, 00%
2015 рік2501, 90%
2016 рік2752, 40%
2017 рік2002, 60%
2018 рік3002, 90%

Тільки оглянувши таблицю, ви можете побачити, що між продажами та ВВП буде позитивна кореляція. Обидва мають тенденцію йти разом. За допомогою Excel все, що вам потрібно зробити, це натиснути спадне меню Інструменти, вибрати Аналіз даних і звідти вибрати Регресію . Спливаюче вікно легко заповнити звідти; діапазон Input Y - це ваш стовпець "Продажі", а діапазон Input X - це зміна стовпця ВВП; виберіть діапазон виводу, де ви хочете, щоб дані відображалися у вашій електронній таблиці, і натисніть OK. Ви повинні побачити щось подібне до того, що наведено в таблиці нижче:

Коефіцієнти регресійної статистики

Кілька R0, 8292243Перехоплення34.58409

Площа R


0, 687613ВВП88.15552
Налагоджено
Площа R


0, 583484

-


-


Стандартна помилка51.021807-

-


Спостереження5

-


-


Інтерпретація

Основними результатами, про які слід потурбувати для простої лінійної регресії, є R-квадрат, перехоплення (константа) та бета (b) коефіцієнт ВВП. Кількість R-квадрата в цьому прикладі становить 68, 7% - це показує, наскільки добре наша модель прогнозує або прогнозує майбутні продажі, що дозволяє припустити, що пояснювальні змінні в моделі передбачили 68, 7% від зміни залежної змінної. Далі ми маємо перехоплення 34, 58, що говорить про те, що якби прогнозувати зміну ВВП дорівнюватиме нулю, наші продажі становитимуть близько 35 одиниць. І нарешті, бета-коефіцієнт ВВП або коефіцієнт кореляції 88, 15 говорить про те, що якщо ВВП збільшиться на 1%, продажі, ймовірно, збільшаться приблизно на 88 одиниць.

Суть

То як би ви використовували цю просту модель у своєму бізнесі ">

Звичайно, це просто проста регресія, і є моделі, які можна побудувати, використовуючи кілька незалежних змінних, званих множинними лінійними регресіями. Але декілька лінійних регресій є складнішими і мають декілька питань, які потребують ще однієї статті для обговорення.

Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.
Рекомендуємо
Залиште Свій Коментар