Головна » алгоритмічна торгівля » Непараметрична статистика

Непараметрична статистика

алгоритмічна торгівля : Непараметрична статистика
Що таке непараметрична статистика?

Непараметрична статистика стосується статистичного методу, в якому дані не потрібні для нормального розподілу. Непараметрична статистика використовує дані, які часто є порядковими, це означає, що вона не покладається на числа, а на ранжирування чи порядок сортування. Наприклад, опитування, що передає переваги споживачів у межах від подібних до неприязні, вважатиметься порядковими даними.

Непараметрична статистика включає непараметричну описову статистику, статистичні моделі, умовиводи та статистичні тести. Структура моделі непараметричних моделей не задається апріорі, а натомість визначається з даних. Термін непараметричний не означає, що в таких моделях повністю відсутні параметри, а скоріше, що кількість і характер параметрів є гнучкими і не зафіксовані заздалегідь. Гістограма - приклад непараметричної оцінки розподілу ймовірностей.

Розуміння непараметричної статистики

У статистиці параметрична статистика включає такі параметри, як середнє значення, медіана, стандартне відхилення, дисперсія тощо. Ця форма статистики використовує спостережувані дані для оцінки параметрів розподілу. У параметричній статистиці дані передбачають, що вони відповідають нормальному розподілу з невідомими параметрами μ (середнє значення сукупності) та σ 2 (дисперсія популяції), які потім оцінюються за допомогою середньої вибірки та дисперсії вибірки.

Непараметрична статистика не передбачає припущення щодо розміру вибірки або чи є спостережувані дані кількісними.

Непараметрична статистика не передбачає, що дані беруться з нормального розподілу. Натомість форма розподілу оцінюється за цією формою статистичного вимірювання. Хоча існує багато ситуацій, в яких можна припустити нормальний розподіл, є також деякі сценарії, в яких неможливо визначити, чи буде нормально поширюватися дані.

Приклади непараметричної статистики

У першому прикладі розглянемо дослідника, який хоче, щоб оцінка кількості немовлят у Північній Америці, народжених карими очима, може вирішити взяти зразок у 150 000 немовлят та провести аналіз набору даних. Вимірювання, яке вони отримують, буде використано для оцінки всієї популяції дітей із карими очима, народжених наступного року.

Для другого прикладу розглянемо іншого дослідника, який хоче знати, чи пов’язано рано чи пізно спати з тим, як часто хворіє людина. Якщо припустити, що вибірку відбирають випадковим чином із популяції, розподіл частоти хвороби за розміром вибірки можна вважати нормальним. Однак експеримент, що вимірює стійкість людського організму до штаму бактерій, не може вважати нормальним розподілом.

Це відбувається тому, що випадково вибрані вибіркові дані можуть бути стійкими до деформації. З іншого боку, якщо дослідник враховує такі фактори, як генетичний склад та етнічна приналежність, він може виявити, що розмір вибірки, обраний з використанням цих характеристик, може не бути стійким до деформації. Отже, не можна припустити нормального розподілу.

Цей метод корисний, коли дані не мають чіткої чисельної інтерпретації та найкраще використовувати їх із даними, які мають ранжирування. Наприклад, тест оцінювання особистості може мати рейтинг своїх метрик, встановлених як сильно не погоджуючись, не згоден, байдужий, згоден і сильно погоджуючись. У цьому випадку слід застосовувати непараметричні методи.

Спеціальні міркування

Непараметрична статистика отримала високу оцінку завдяки простоті їх використання. У міру зменшення потреби в параметрах дані стають більш застосовними для більшої різноманітності тестів. Цей тип статистики може використовуватися без середнього, розміру вибірки, стандартного відхилення або оцінки будь-яких інших пов'язаних параметрів, коли жодна з цих даних не доступна.

Оскільки непараметрична статистика робить менше припущень щодо вибіркових даних, її застосування є ширшим за обсягом, ніж параметрична статистика. У випадках, коли параметричне тестування є більш доцільним, непараметричні методи будуть менш ефективними. Це тому, що результати, отримані з непараметричної статистики, мають менший ступінь достовірності, ніж якби результати були отримані за допомогою параметричної статистики.

Ключові вивезення

  • Непараметрична статистика проста у використанні, але не забезпечує точної точності інших статистичних моделей.
  • Цей тип аналізу найкраще підходить під час розгляду порядку впорядкування, де навіть якщо числові дані змінюються, результати, ймовірно, залишаться незмінними.
Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.

Пов'язані умови

Розуміння розподілу T розподілу AT - тип функції ймовірності, який підходить для оцінки параметрів сукупності для невеликих розмірів вибірки або невідомих дисперсій. докладніше, як працює розподіл вибірки. Розподілення вибірки - це розподіл ймовірностей статистики, отриманий за допомогою великої кількості вибірок, взятих з конкретної сукупності. докладніше Як використовується тест Вілкоксона Тест Вілкоксона, який стосується або тесту Ранкової суми, або тестування підписаного рангу, є непараметричним тестом, який порівнює дві парні групи. більше непараметричний метод Непараметричний метод відноситься до типу статистики, яка не вимагає, щоб дані, що аналізуються, відповідали певним припущенням або параметрам. більше Визначення T-тесту Т-тест - це тип інфекційної статистики, який використовується для визначення, чи є значна різниця між засобами двох груп, яка може бути пов'язана за певними ознаками. більше Інтервал довіри Інтервал довіри вимірює ймовірність того, що параметр сукупності потрапить між двома встановленими значеннями. більше Партнерські посилання
Рекомендуємо
Залиште Свій Коментар