Гомоскедастичний
ВИЗНАЧЕННЯ гомоскедастичногоГомоскедастичний (також написано "гомоскедастичний") означає стан, коли дисперсія залишкової або помилкового терміна в регресійній моделі є постійною. Тобто, термін помилки не сильно змінюється, оскільки змінюється значення змінної предиктора. Гомоскедастичність - це одне припущення лінійного моделювання регресії. Якщо дисперсія помилок навколо регресійної лінії сильно різниться, модель регресії може бути погано визначеною. Відсутність гомоскедастичності може говорити про те, що модель регресії може потребувати включення додаткових змінних предиктора для пояснення ефективності залежної змінної.
Протилежністю гомоскедастичності є гетерокедастичність так само, як протилежність "гомогенній" є "гетерогенною". Гетероскедастичність відноситься до умови, коли дисперсія терміна помилки в рівнянні регресії не є постійною.
НАРУШЕННЯ ВНИЗ Гомоскедастичний
Проста модель регресії, або рівняння, складається з чотирьох доданків. Зліва - залежна змінна. Він являє собою явище, яке модель прагне «пояснити». Права сторона - константа, змінна предиктора та залишковий або помилковий термін. Термін помилки показує величину змінності залежної змінної, яка не пояснюється змінною предиктора.
Приклад гомоскедастичності
Наприклад, припустимо, ви хотіли пояснити результати тесту для студентів, використовуючи кількість часу, який кожен студент витратив на навчання. У цьому випадку тестові бали були б залежною змінною, а час, витрачений на вивчення, буде змінною прогнозника. Термін помилки показував би кількість дисперсії в тестових балах, яка не була пояснена кількістю вивченого часу. Якщо ця дисперсія є рівномірною або гомоскедастичною, то це може припустити, що модель може бути адекватним поясненням для тестової ефективності - пояснення її з точки зору часу, витраченого на вивчення.
Але дисперсія може бути гетерокедастичною. Діаграма даних про термін помилки може показувати, що велика кількість часу дослідження дуже відповідала високим тестовим балам, але, що низькі бали часу тестування в навчальному періоді сильно відрізнялися і навіть включали деякі дуже високі бали. Таким чином, дисперсія балів не була б добре пояснена просто однією змінною предиктора - кількістю вивченого часу. У цьому випадку певний фактор, ймовірно, працює, і модель, можливо, потребує вдосконалення. Подальше розслідування може виявити, що деякі студенти бачили відповіді на тест достроково, і тому не потрібно було їх вивчати.
Для вдосконалення регресійної моделі дослідник повинен, таким чином, додати ще одну пояснювальну змінну із зазначенням того, чи бачив студент відповіді перед тестом. Тоді модель регресії мала б дві пояснювальні змінні - час вивчення та наявність у студента попередніх знань щодо відповідей. За допомогою цих двох змінних пояснюватиметься більшість дисперсійних балів тесту, і дисперсія терміна помилки може бути гомоскедастичною, що дозволяє припустити, що модель була чітко визначена.
Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.