Головна » алгоритмічна торгівля » Стратифікована випадкова вибірка

Стратифікована випадкова вибірка

алгоритмічна торгівля : Стратифікована випадкова вибірка
Що таке стратифікована випадкова вибірка?

Стратифікована випадкова вибірка - це метод вибірки, який включає поділ популяції на менші підгрупи, відомі як страти. У стратифікованому випадковому відборі чи стратифікації верстви утворюються на основі спільних ознак або характеристик членів, таких як дохід або рівень освіти.

Стратифіковану випадкову вибірку називають також пропорційною випадковою вибіркою або випадковою вибірковою вибіркою.

[Важливо: Стратифікована вибірка використовується для висвітлення відмінностей між групами в сукупності, на відміну від простого випадкового відбору вибірки, який розглядає всіх членів популяції як рівних, з однаковою ймовірністю вибірки.]

1:40

Стратифікована випадкова вибірка

Як працює стратифікована випадкова вибірка

Завершуючи аналіз або дослідження групи сутностей з подібними характеристиками, дослідник може виявити, що чисельність популяції занадто велика, для того, щоб завершити дослідження. Щоб заощадити час і гроші, аналітик може скористатися більш здійсненним підходом, вибравши невелику групу з населення. Невелика група називається вибірковою величиною, яка є підгрупою населення, яка використовується для представлення всієї сукупності. Вибірка може бути відібрана з сукупності кількома способами, одним з яких є стратифікований метод випадкового відбору.

Стратифікована випадкова вибірка включає поділ усієї сукупності на однорідні групи, що називаються стратами (множина для прошарку). Потім вибираються випадкові зразки з кожного прошарку. Наприклад, розглянемо академічного дослідника, який хотів би дізнатися кількість студентів МВА в 2007 році, які отримали пропозицію про роботу протягом трьох місяців після закінчення навчання.

Незабаром він виявить, що за рік було майже 200 000 випускників МВА. Він може вирішити просто взяти просту випадкову вибірку з 50000 випускників і провести опитування. Ще краще, він міг би розділити населення на верстви і взяти випадкову вибірку з верств. Для цього він створив групи населення на основі статі, вікового діапазону, раси, країни громадянства та кар'єри. Випадкова вибірка з кожного прошарку береться в кількості, пропорційній розміру шару, порівняно з популяцією. Ці підмножини пластів потім об'єднують, щоб утворити випадкову вибірку.

Ключові вивезення

  • Стратифікована випадкова вибірка дозволяє дослідникам отримати вибіркову сукупність, яка найкраще представляє всю досліджувану популяцію.
  • Стратифікована випадкова вибірка включає поділ усієї сукупності на однорідні групи, що називаються стратами.
  • Стратифікована випадкова вибірка відрізняється від простої випадкової вибірки, яка передбачає випадковий відбір даних з усієї сукупності, тому кожна можлива вибірка з однаковою ймовірністю має відбутися.

Приклад стратифікованої випадкової вибірки

Припустимо, дослідницька команда хоче визначити середній бал студентів коледжу в США. У дослідницької команди складно зібрати дані з усіх 21 мільйонів студентів коледжів; він приймає рішення взяти випадкову вибірку населення, використовуючи 4000 студентів.

Тепер припустимо, що команда розглядає різні атрибути учасників вибірки і цікавиться, чи є якісь відмінності в середніх навчальних закладах та спеціальностях студентів. Припустимо, з’ясується, що 560 студентів - англійські, 1135 - спеціалісти з інформатики, 800 - спеціальності з інформатики, 1090 - технічні, а 415 - математичні. Команда хоче використовувати пропорційну стратифіковану випадкову вибірку, де проба вибірки пропорційна випадковій вибірці в сукупності.

Припустимо, що команда досліджує демографіку студентів коледжів у США та виявляє відсоток того, що студенти здобувають 12% спеціальності з англійської мови, 28% - з наукових наук, 24% - з інформатики, 21% - з інженерії та 15% - з магістратури з математики. Таким чином, у процесі стратифікованої випадкової вибірки створюється п'ять верств.

Потім команді потрібно підтвердити, що прошарок населення пропорційний прошарку у вибірці; однак вони вважають, що пропорції не рівні. Потім команді необхідно повторно відібрати 4000 студентів з числа населення та випадковим чином вибрати 480 англійських, 1120 наук, 960 інформатики, 840 інженерних та 600 студентів з математики.

З цим він має пропорційну стратифіковану випадкову вибірку студентів коледжу, що забезпечує кращу представленість спеціальностей студентів коледжів у США. Потім дослідники можуть виділити конкретний прошарок, спостерігати за різними дослідженнями студентів коледжів у США та спостерігати за різними середніми балами .

Прості випадкові проти стратифіковані випадкові вибірки

Прості випадкові вибірки та стратифіковані випадкові вибірки є інструментами статистичного вимірювання. Простий випадковий зразок використовується для представлення всієї сукупності даних. Стратифікована випадкова вибірка ділить сукупність на менші групи або прошарки на основі спільних характеристик.

Проста випадкова вибірка часто використовується, коли є дуже мало інформації про сукупність даних, коли у сукупності даних є занадто багато відмінностей для поділу на різні підмножини або коли серед сукупності даних існує лише одна чітка характеристика.

Наприклад, цукеркова компанія може захотіти вивчити звички покупців своїх клієнтів, щоб визначити майбутнє своєї товарної лінійки. Якщо є 10 000 клієнтів, він може використовувати вибирати 100 таких клієнтів як випадкову вибірку. Потім він може застосувати те, що знайде, від цих 100 клієнтів до решти його бази. На відміну від стратифікації, він буде вибирати 100 членів виключно навмання, не враховуючи їх індивідуальних особливостей.

Пропорційна та непропорційна стратифікація

Стратифікована випадкова вибірка забезпечує те, що кожна підгрупа даної популяції адекватно представлена ​​у всій вибірковій сукупності дослідницького дослідження. Стратифікація може бути пропорційною або непропорційною. У пропорційному стратифікованому методі розмір вибірки кожного прошарку пропорційний розміру популяції шару.

Наприклад, якщо дослідник захотів вибірку з 50 000 випускників, використовуючи віковий діапазон, пропорційний стратифікований випадковий зразок буде отриманий за такою формулою: (розмір вибірки / розмір населення) х розмір шару. У таблиці нижче передбачається чисельність населення в 180 000 випускників MBA на рік.

Вікова група


24-28


29-33


34-37


Всього


Кількість людей у ​​прошарку


90 000


60 000


30 000


180 000


Розмір зразка шару


25 000


16 667


8, 333


50 000


Розмір вибірки прошарків для випускників MBA у віковому діапазоні від 24 до 28 років обчислюється як (50 000/180 000) x 90 000 = 25 000. Цей же метод використовується для інших вікових груп. Тепер, коли розмір вибірки шарів відомий, дослідник може виконати просту випадкову вибірку в кожному прошарку, щоб вибрати його учасників опитування. Іншими словами, 25 000 випускників вікової групи 24-28 років будуть вибрані випадковим чином з усієї сукупності, 16 667 випускників вікового діапазону 29-33 років будуть обрані з числа населення випадковим чином тощо.

У непропорційно стратифікованій вибірці розмір кожного прошарку не пропорційний його розміру в популяції. Дослідник може прийняти вибірку 1/2 випускників у віковій групі 34-37 та 1/3 випускників у віковій групі 29-33 років.

Важливо зазначити, що одна людина не може вписатись у кілька верств. Кожна організація повинна вміщуватися лише в одному прошарку. Перекриття підгруп означає, що деякі люди матимуть більш високі шанси бути відібраними для опитування, що повністю заперечує концепцію стратифікованого вибірки як виду ймовірності вибірки.

[Важливо: менеджери портфелів можуть використовувати стратифіковану випадкову вибірку для створення портфоліо шляхом тиражування індексу, такого як індекс облігацій.]

Переваги стратифікованої випадкової вибірки

Основна перевага стратифікованої випадкової вибірки полягає в тому, що вона фіксує ключові характеристики популяції у вибірці. Подібно до середньозваженого, цей метод відбору проб дає характеристики у вибірці, пропорційні загальній сукупності. Стратифікована випадкова вибірка добре працює для груп з різними ознаками, але в іншому випадку є неефективною, якщо підгрупи не можуть бути сформовані.

Стратифікація дає меншу помилку в оцінці та більшу точність, ніж простий метод випадкового відбору. Чим більше різниці між пластами, тим більше коефіцієнт посилення в точності.

Недоліки стратифікованої випадкової вибірки

На жаль, цей метод дослідження не може бути використаний у кожному дослідженні. Недоліком методу є те, що для правильного його використання необхідно виконати кілька умов. Дослідники повинні ідентифікувати кожного члена популяції, що вивчається, і класифікувати кожного з них на одну, і лише одну, підгрупу. Як результат, стратифікована випадкова вибірка є невигідною, коли дослідники не можуть впевнено класифікувати кожного члена популяції на підгрупу. Крім того, пошук вичерпного та остаточного списку цілого населення може бути складним.

Перекриття може бути проблемою, якщо є теми, які потрапляють у кілька підгруп. Коли проводиться просте випадкове відбір проб, більше шансів вибрати тих, хто знаходиться в декількох підгрупах. Результатом цього може стати неправильне представлення чи неточне відображення населення.

Наведені вище приклади полегшують: студенти, випускники, чоловіки та жінки є чітко визначеними групами. Однак в інших ситуаціях це може бути набагато складніше. Уявіть, що містять такі ознаки, як раса, етнічна приналежність чи релігія. Процес сортування стає складнішим, що робить стратифікований випадковий вибірковий вибір неефективним і менш ідеальним методом.

Порівняйте інвестиційні рахунки Ім’я постачальника Опис Розкриття рекламодавця × Пропозиції, що з’являються в цій таблиці, є партнерствами, від яких Investopedia отримує компенсацію.

Пов'язані умови

Зразок Зразок - це менша, керована версія більшої групи. Зразки використовуються при статистичному тестуванні, коли чисельність популяції занадто велика. докладніше Як працюють прості випадкові вибірки Проста випадкова вибірка - це підмножина статистичної сукупності, в якій кожен член підмножини має рівну ймовірність бути обраним. Простий випадковий зразок мається на увазі як неупереджене представлення групи. більше Представницький зразок часто використовується для екстраполяції більш широких настроїв Репрезентативна вибірка - це підмножина популяції, яка відображає характеристики всієї сукупності. детальніше Вхідні та вихідні системи систематичного відбору проб Систематичний відбір зразків - це метод імовірнісного відбору проб, при якому відбирається випадкова вибірка з більшої сукупності. більше Визначення вибірки Вибірка - це процес, що використовується в статистичному аналізі, в якому група спостережень витягується з більшої сукупності. більше Визначення T-тесту Т-тест - це тип інфекційної статистики, який використовується для визначення, чи є значна різниця між засобами двох груп, яка може бути пов'язана за певними ознаками. більше Партнерські посилання
Рекомендуємо
Залиште Свій Коментар