Грізна кореляція
Що таке помилкова кореляціяУ статистиці фальшива кореляція, або хибність, посилається на зв'язок між двома змінними, що виявляється причинним, але не є. Хибні стосунки часто мають вигляд однієї змінної, що впливає на іншу. Ця хибна кореляція часто викликана третім фактором, який не виявляється під час експертизи, який іноді називають заплутаним фактором.
Ключові вивезення
- Грізна кореляція або хибність - це коли два фактори виявляються випадково пов'язаними, але не є.
- Поява причинно-наслідкових зв’язків часто пояснюється подібним рухом на графіку, який виявляється випадковим або спричиненим третім "заплутаним" фактором.
- Помилкова кореляція часто може бути викликана невеликими розмірами вибірки або довільними кінцевими точками.
Як працює згубна кореляція
Коли дві випадкові величини уважно відслідковують одна одну на графіку, легко підозрювати кореляцію чи взаємозв'язок двох факторів, коли зміна впливає на іншу. Відкидаючи іншу тему «причинно-наслідкової зв’язки», це спостереження може змусити читача діаграми вважати, що рух змінної A пов'язаний з рухом у змінній B або навпаки. але іноді, при більш детальному статистичному дослідженні, вирівняні рухи збігаються або викликаються третім фактором, який впливає на перші два. Це хибна кореляція. Дослідження, проведені з невеликими розмірами вибірки або довільними кінцевими точками, є особливостями, сприйнятливими до помилковості.
Приклад хибних співвідношень
Виявити цікаві співвідношення не надто складно. Хоча багато хто виявиться хибним. Для чоловічих видів на Уолл-стріті два популярні хибні кореляції стосуються жінок та спорту. Починаючи з 1920-х років, є теорія довжини спідниці, яка стверджує, що довжина спідниці та напрямок фондового ринку співвідносяться. Якщо довжина спідниці довга, це означає, що фондовий ринок знижується; якщо вони короткі, ринок іде вгору. Приблизно в кінці січня говорять про так званий показник Super Bowl, який говорить про те, що перемога команди AFC, ймовірно, означає, що фондовий ринок знизиться в наступному році, тоді як перемога команди NFC передвіщає зростання ринок. Починаючи з 1966 р. Показник має точність 80%. Це весела розмова, але, мабуть, не те, що серйозний фінансовий радник рекомендував би як інвестиційну стратегію для клієнтів.
Ось ще кілька прикладів поширених хибних кореляцій:
- Утопчення ростуть, коли продажі морозива зростають. Може здатися, що збільшення продажів морозива викликає більше утоплення, але насправді підвищення температури може змусити більше людей плавати, а також купувати більше морозива.
- Рівень вбивств у США з 2006-2011 рр. Знизився на той самий показник, що й використання Microsoft Internet Explorer.
- Керівники, які говорять, будь ласка, і дякують, частіше насолоджуються кращою продуктивністю.
- Люди, які носять екіпіровку команди Oakland Raiders, швидше скоюють злочини.
Як виявити хибні кореляції
Статистики та інші вчені, які аналізують дані, повинні постійно шукати помилкові стосунки. Існує численні методи, якими вони користуються, зокрема:
- Забезпечення належного репрезентативного зразка.
- Отримання адекватного розміру вибірки.
- Будьте обережні до довільних кінцевих точок.
- Управління якомога більше зовнішніх змінних.
- Використання нульової гіпотези та перевірка на сильне p-значення.