Переобладнання

алгоритмічна торгівля : Переобладнання
Що таке Overfitting?

Поміщення - це помилка моделювання, яка виникає, коли функція занадто тісно підходить до обмеженого набору точок даних. Переоснащення моделі зазвичай набуває форми створення надмірно складної моделі для пояснення ідіосинкразії у досліджуваних даних.

Насправді дані, які часто вивчаються, мають певну ступінь помилки або випадкового шуму всередині неї. Таким чином, спроба зробити модель занадто тісною, щоб злегка неточні дані можуть заразити модель суттєвими помилками та зменшити її прогнозовану потужність.

[Важливо: Фінансові фахівці повинні завжди знати про небезпеку перевиконання моделі на основі обмежених даних.]

Розуміння перевиконання

Наприклад, поширеною проблемою є використання комп’ютерних алгоритмів для пошуку обширних баз даних історичних ринкових даних з метою пошуку шаблонів. З огляду на достатню кількість досліджень, часто можна розробити розроблені теореми, які, здається, з великою точністю прогнозують такі речі, як прибуток на фондовому ринку.

Однак, якщо застосовуватись до даних, що не належать до вибірки, такі теореми, ймовірно, можуть виявитися лише надмірною придатністю моделі до того, що насправді було лише випадковим явищем. У всіх випадках важливо протестувати модель на даних, які знаходяться за межами вибірки, яка використовується для її розробки.

Ключові вивезення

  • Поміщення - це помилка моделювання, яка виникає, коли функція занадто тісно підходить до обмеженого набору точок даних.
  • Фінансові професіонали завжди повинні знати про небезпеку перевиконання моделі на основі обмежених даних.
Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.

Пов'язані умови

Чому значення статистичної значущості Статистична значущість стосується результату, який, швидше за все, не відбудеться випадковим чином, а швидше за все, пов'язаний з конкретною причиною. докладніше, як працює згладжування даних. Згладження даних здійснюється за допомогою алгоритму для видалення шуму з набору даних. Це дозволяє виділити важливі зразки. Згладжування даних може бути використане для прогнозування тенденцій, таких як ціни на цінні папери. більше Зразок Зразок - це менша, керована версія більшої групи. Зразки використовуються при статистичному тестуванні, коли чисельність популяції занадто велика. більше Гетероскдастичність У статистиці гетерокедастичність буває тоді, коли стандартні відхилення змінної, що відстежуються протягом певного часу, є непостійними. докладніше Читання стратифікованої випадкової вибірки Стратифікований випадковий вибірковий вибір - це метод вибірки, який включає поділ сукупності на менші групи, відомі як страти. докладніше Як працюють прості випадкові вибірки Простий випадковий вибірки - це підмножина статистичної сукупності, в якій кожен член підмножини має рівну ймовірність бути обраним. Простий випадковий зразок мається на увазі як неупереджене представлення групи. більше Посилання партнерів
Рекомендуємо
Залиште Свій Коментар