WikiSort.ru - Не сортированное

ПОИСК ПО САЙТУ | о проекте

В математической статистике, районированная выборка (другое название – стратифицированная выборка) – метод семплирования из генеральной совокупности, который позволяет улучшить точность статистических результатов при разбиении всего пространства событий на несколько областей-страт и независимой работе с этими стратами. Например, в каждой страте можно применять свою собственную выборку по значимости.


Пример

Предположим, что нам нужно оценить среднее число голосов, поданных за каждого кандидата на выборах. Предположим, что в стране 3 города: в городе А живёт 1 миллион заводских рабочих, в городе Б живёт 2 миллиона офисных работников, а в городе В живёт 3 миллиона пенсионеров. Мы можем выбрать получение случайной выборки размером в 60 голосов со всей популяции, но есть некоторая вероятность, что случайная выборка окажется плохо сбалансирована по этим городам и, следовательно, будет необъективна и малополезна («средняя температура по больнице»), вызывая значительную погрешность в оценке. Взамен этого, если мы выберем использовать простую случайную выборку в 10, 20 и 30 голосов из городов А, Б и В соответственно, мы можем получить меньшую погрешность в оценке при том же общем размере выборки.

Стратегии районированной выборки

Преимущества перед другими методами семплирования

Причины использовать районированную выборку вместо простой случайной выборки[1]:

  • Если измерения в пределах страт имеют небольшое среднеквадратическое отклонение, стратификация даёт меньшую погрешность в оценке.
  • Во многих случаях измерения становятся дешевле и/или более выполнимыми, когда население группируется в страту.
  • Часто желательно иметь оценки популяционных параметров для групп населения.

Если плотность населения сильно варьируется в пределах региона, районированная выборка будет гарантировать, что можно с одинаковой точностью сделать оценки в разных частях региона и что сравнение субрегионов можно выполнить с одинаковой статистической мощностью. Например, в Онтарио в исследовании, проводимом на территории всей провинции, можно использовать большую долю выборки из менее населённого севера, так как разница в численности населения между севером и югом настолько велика, что доля выборки из провинции в целом может привести к сбору лишь очень маленького количества данных с севера.

Также можно использовать рандомизированную стратификацию для увеличения репрезентативности населения в исследовании.

Недостатки


См. также

Примечания

  1. "6.1 How to Use Stratified Sampling | STAT 506". onlinecourses.science.psu.edu. Проверено 31.08.2016.

Литература

  • Särndal, Carl-Erik; et al. (2003). "Stratified Sampling". Model Assisted Survey Sampling. New York: Springer. pp. 100–109. ISBN 0-387-40620-4.

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .




Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2024
WikiSort.ru - проект по пересортировке и дополнению контента Википедии