Шкала (измерительная шкала) — это знаковая система, для которой задано отображение (операция измерения), ставящее в соответствие реальным объектам (событиям) тот или иной элемент (значение) шкалы. Формально шкалой называют кортеж, <X, φ, Y>, где X — множество реальных объектов (событий), φ — отображение, Y — множество элементов (значений) знаковой системы[1].
Различные типы измерительных шкал широко используются в теоретической и практической человеческой деятельности, в науке и технике — в том числе во многих гуманитарных научных областях, таких как экономика, психометрия, социология и др.[2][3]для символьного (формального) представления объектов (событий), их свойств (характеристик) и взаимосвязей.
Шкалы измерений классифицируются по типам измеряемых данных, которые определяют допустимые для данной шкалы отношения, в том числе те, что соответствуют математическим преобразованиям значений шкалы[1],[4]. Современная классификация шкал была предложена в 1946 году Стэнли Смитом Стивенсом.
Из рассмотренных шкал первые две являются неметрическими, а остальные — метрическими.
С вопросом о типе шкалы непосредственно связана проблема адекватности методов математической обработки результатов измерения. В общем случае адекватными являются те статистики, которые инвариантны относительно допустимых преобразований используемой шкалы измерений.
Типы шкал и их свойства согласно классификации Стэнли Смита Стивенса | |||||
---|---|---|---|---|---|
Номинальная
| Порядковая
| Интервальная
| шкала | ||
Логические/ математические операции |
× |
![]() |
![]() |
![]() |
![]() |
+ |
![]() |
![]() |
![]() |
![]() | |
< |
![]() |
![]() |
![]() |
![]() | |
= |
![]() |
![]() |
![]() |
![]() | |
Примеры: Дихотомические и недихотомические переменные |
Дихотомические: Пол (мужской vs. женский) Недихотомические: Национальность (американец/китаец/ и т.д) |
Дихотомические: Состояние здоровья (здоровый vs. больной), Красота (красивый vs.уродливый) Недихотомические: Мнение ('полностью согласен'/ 'скорее согласен'/ 'скорее несогласен'/ 'полностью несогласен') |
Дата (с 1457 до н. э. до 2013 н.э) Широта (от +90° до −90°) Температура (от 10 °C до 20 °C) |
Возраст (от 0 до 99 лет) | |
Мера центральной тенденции | |||||
Метрическая или нет |
Неметрическая (качественная) |
Неметрическая (качественная) |
Метрическая (количественная) |
Метрическая (количественная) |
Анализируя различные типы шкал Ф. Н. Ильясов приходит к выводу, что номинальная и интервальная шкала являются исследовательскими артефактами[6][прояснить].
Хотя типология Стивенса все ещё широко применима, она до сих пор является объектом критики теоретиков, в частности в случае с номинальной и порядковой шкалой.[7]
Основные моменты критики шкал Стивенсона:
Лорд критиковал аргументы Стивенса, показав, что выбор допустимых статистических тестов для некоторого набора данных не зависит от проблем репрезентации или единственности, а зависит от осмысленности.[8]
Бейкер, Хардик и Петринович, а также Боргатта и Борнштедт подчеркнули тот факт, что следование Стивенсовским ограничениям часто заставляет исследователей прибегать к ранговому упорядочению данных и тем самым отказываться от использования параметрических тестов. К сожалению, их аргументация носила скорее ad hoc характер и завершалась предложением использовать стандартные параметрические процедуры вместо того, чтобы связываться с проблемой робастности.[9][10]
Гуттман в более общем смысле доказывал, что статистическая интерпретация данных зависит от того, какой вопрос обращен к данным и какое доказательство мы готовы принять в ответ на этот вопрос. Он определил это доказательство в терминах функции потерь, выбранной для проверки качества модели.[11]
Джон Тьюки также критиковал стивенсовские ограничения как опасные для хорошего статистического анализа. Подобно Лорду и Гуттману, Тьюки отметил важность смысла данных при определении и шкалы, и подходящего способа анализа. Поскольку шкальные типы Стивенса абсолютны, в ситуации когда, например, данные нельзя считать полностью интервальными, их следует понизить в ранге до ординальных.
Даже сам Стивенс оговаривался, замечая: «Фактически большая часть шкал, широко и эффективно применяемых психологами, — это шкалы порядка. Обычные статистики, включая средние и стандартные отклонения, при строгом подходе не должны использоваться при работе с этим шкалами, однако такому неправомочному использованию может быть дано известное прагматическое оправдание: во многих случаях оно приводит к плодотворным результатам»
Дункан (1986) возразил против употребления слова «измерение» в описании номинальной шкалы, но Стивенс (1975) после дал собственное определения «измерения» которое звучит, как «приписывание признака по какому-либо правилу. Единственное правило, которое не может быть использовано для этих целей — случайность приписывания». Однако, так называемое «номинальное измерение» включает оценочное суждение исследователя, а возможные трансформации этого измерения бесконечны. Это одно из замечаний, сделанных Лордом в 1953 году в сатиристической статье On the Statistical Treatment of Football Numbers[12]
Использование «среднего» в качестве меры центральной тенденции для порядкового типа по-прежнему спорно среди тех, кто принимает типологию Стивенса. Несмотря на это, многие ученые, занимающиеся поведенческими исследованиями, используют среднее для порядковых данных. Обычно это оправдывают тем, что порядковый тип в поведенческих науках находится где-то между истинным порядковым и интервальным типами. Хотя разница интервалов между двумя порядковыми разрядами не является постоянной, она зачастую имеет тот же порядок.
К примеру, применение измерительных моделей в образовательном контексте показывает, что общие оценки имеют довольно линейную зависимость с измерениями в пределах диапазона оценки. Таким образом, некоторые утверждают, что пока разница интервалов между порядковыми разрядами не очень большая, статистические данные интервальных шкал (к примеру «средняя») может иметь значимый результат для порядковых шкал. Программное обеспечение для статистического анализа (например SPSS) требует от пользователя указание соответствующего класса измерений для каждой переменной. Это гарантирует, что непреднамеренные ошибки пользователя не приведут к бессмысленному анализу (пример: анализ корреляции с номинальной переменной).
Терстоун добился прогресса в разработке обоснования для получения интервального типа, основанного на законе сравнительного суждения. Общим применением закона является аналитический процесс иерархии. Геогр Раш (англ.) достиг дальнейшего прогресса, разработав вероятностную модель Rasch model (англ.), которая дает теоретическую основу и обоснование для получения интервальных измерений из подсчета наблюдений (например общее количество баллов по оценкам).
Несмотря на всю критику, в широком диапазоне ситуаций опыт показывает, что применение запрещенных статистик к данным приводит к научно значимым результатам, важным при принятии решений и ценным для дальнейших исследований.
Существуют иные типологии, отличные от Стивенса. К примеру: Mostller Mosteller и Tukey (1977), Nelder (1990) создали описание непрерывного отсчета, непрерывных отношений и категориальных моделях данных. См. также: Chrisman (1998), van den Berg (1991).
Mosteller and Tukey заметили, что 4 уровня недостаточно и предложили следующее деление:[13]
Например, проценты (вариант фракций в терминах Мостлера-Тьюки) не подходят к теории Стивенса, так как не существует полностью допустимых трансформаций.[7]
Николас Крисман предложил расширенный поиск уровней измерения для учета разных измерений, которые не обязательно соответствуют традиционным представлениям уровней измерения. Измерения, связанные с диапазоном и повторением (к примеру радиальные градусы по кругу, часы и тд), градуированные категории членства и другие типа измерений, не соответствуют оригинальной работе Стивена, приводящие к внедрению 6-ти новых уровней измерения к существующим 10-ти:
Расширенные уровни измерений редко используются вне академической географии.[14]
Теория типов шкал это своеобразная «интеллектуальная служанка» операционной теории измерения Стивенса, которая стала окончательной в психологии и поведенческих науках, несмотря на критику Мичелла за противоречивость с измерениями в естественных науках (Michell, 1999). На самом деле, операционная теория измерения была реакцией на выводы комитета, созданного British Association for the Advancement of Science (англ.) в 1932 для изучения возможности подлинных научных измерений в психологических и поведенческих науках. Этот комитет, который стал известен как «Комитет Фергюсона», опубликовал окончательный отчет (Ferguson, et al., 1940, p. 245), в котором шкала Стивенса сон (Stevens & Davis, 1938) была объектом критики.
![]() | …любо закон имеющий целью выразить количественное отношение между интенсивностью ощущения и интенсивностью стимула не только ложный, но и фактически не имеющий смысла до тех пор, пока смысл не обретет понятие сложения, примененное к ощущению. | ![]() |
Значит, если шкала сонов Стивенса действительно измеряет интенсивность ощущений аудитории, должно быть произведено доказательство того, что эти ощущения являются количественными атрибутами. Необходимым доказательством было присутствие «аддитивных структур» — концепт, разработанный немецким математиком Отто Холдером (Hölder, 1901). В условиях доминации физика и теоретика измерений Нормана Роберта Кампбелла (англ.) в обсуждении фергюсонского комитета, было постановлено, что измерения в социальных науках невозможны из-за отсутствия операции конкатенации. Впоследствии это решение было признано неверным после разработки теории совместных измерений Дебрю, а также независимо Люсом и Тьюки. Однако Стивенс хотел не введения дополнительных экспериментов для обнаружения аддитивных структур, а признания решения фергюсонского комитета полностью недействительным путем предложения новой теории измерений.
![]() | Перефразируя Н.Р. Кампбела (Final Report, p.340), можно сказать что измерение, в самом широком смысле, определяется как присваивание чисел объектам и события согласно некоторому правилу (Стивенс, 1946, p.677). | ![]() |
Огромное влияние на Стивенса оказали идеи другого гарвардского академика, лауреата нобелевской премии, физика Перси Бриджмена (1927), чью доктрину «Операционизм» Стивенс использовал для определения термина «измерение». К примеру, в определении Стивенса используется рулетка, которая определяет длину (объект измерения) как измеримую (следовательно количественную). Критики операционализма возражают, что он смешивает отношения между двумя объектами или событиями для свойств одного из объектов или событий (Hardcastle, 1995; Michell, 1999; Moyer, 1981a, b; Rogers, 1989).
Канадский исследователь измерительных теорий William Rozeboom (1966) был одним из первых критиков, резко высказавшихся против теории типов шкал Стивенса
Ещё одна проблема может заключаться в том, что одна и та же переменная может иметь разные типы шкал в зависимости от способа её измерения и целей анализа. Например, цвет волос обычно считается номинальной переменной, так как не имеет определённого порядка.[15] Тем не менее, расположить цвета в определённом порядке возможно несколькими способами, в том числе и по оттенкам, с помощью колориметрии.
Используя различные шкалы, можно производить различные психологические измерения[16]. Самые первые методы психологических измерений были разработаны в психофизике. Основной задачей психофизиков являлось то, каким образом определить, как соотносятся физические параметры стимуляции и соответствующие им субъективные оценки ощущений. Зная эту связь, можно понять, какое ощущение соответствует тому или иному признаку. Психофизическая функция устанавливает связь между числовым значением шкалы физического измерения стимула и числовым значением психологической или субъективной реакцией на этот стимул.
Для улучшения этой статьи желательно: |
Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".
Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.
Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .