.
  

© А. П. Пахомов

Проблема осмысленности психологических измерений

Рассматриваются основные положения репрезентативной теории измерений. Показано, что некоторые сделанные Стивенсом предписания, в первую очередь, относительно осмысленности психологических измерений, могут быть пересмотрены. Отмечается, что современная практика измерений в психологии опирается не только на репрезентативную теорию. Обсуждаются некоторые допущения классической и операциональной теорий измерения.

Ключевые слова: измерения в психологии, репрезентативная теория, осмысленность измерения, научные предположения.

Психологический журнал, №5, 2006

При ознакомлении широкого круга психологов с проблемами измерения без привлечения специфического материала математических выкладок (которые, несомненно, были бы интересны специалистам по математической психологии) внимание концентрируется на репрезентативной теории измерения. Примерно к середине прошлого века она оказалась наиболее проработанной, но начиная с 80-х годов ее развитие можно охарактеризовать лишь как экстенсивное. Оно шло через привлечение новых математических приемов без систематической эмпирической проверки предлагаемого материала; не уделялось большого внимания и практике психологических измерений.

Концепт осмысленности в репрезентативной теории измерений

Несмотря на существующие в данной теории измерения проблемы, она принимается в психологии почти повсеместно и безальтернативно, без критического отношения и анализа происхождения ее оснований, но с пиететом в отношении ее разработчиков.

Одним из наиболее важных, полезных и интересных ее концептов является концепт осмысленности измерения и научного предположения. Его возникновение было заложено в предписаниях, сделанных одним из основателей теории психологических измерений С. Стивенсом относительно использования допустимых преобразований шкал измерения и статистик [8, 16, 21, 33, 34]. Анализ литературы [1, 3-7] показывает, что эти предписания являются доминирующими в отечественной теории и практике психологических измерений.

Хотя концепт осмысленности измерения развивается с трансформацией идей Стивенса и разработкой проблем статистики и логики, его положения относительно шкалирования, по проблемам измерений в психологии и связанной с ними осмысленностью измерений требуют, на наш взгляд, критического анализа привычной практики использования психологического измерительного инструментария.

Проблема осмысленности измерений наиболее проработана в рамках так называемого «измерительного подхода» к соотношению статистики и измерения. Основой этих разработок были результаты исследований, проведенных Н. Кемпбеллом [12, 13] и опиравшихся на работы Гельмгольца и Холдера [17, 18], где был сформирован аксиоматический подход к измерению.

Основой для понимания сути измерительного подхода обычно считаются идеи, изложенные в работах, в которых вводятся основные определения по проблемам репрезентативного измерения [21,27]. Эти идеи базируются на некоторых принципиально важных положениях, которые касаются использования измерительных шкал и были изложены Стивенсом в работах [8, 33].

Выводы Стивенса опирались на следующие основных предположения. Первое из них состояло в том, что структуры измерений могут быть определены по их соответствию группам допустимых трансформаций. Если две структуры допускают одни и те же трансформации, тогда, по Стивенсу, их полезно характеризовать как сходные. Две структуры, допускающие преобразования, описываемые линейными функциями (функциями сходства), могут быть отнесены к категории «шкалы отношений». Аффинные преобразования (линейные плюс константа) определяют «интервальные шкалы», монотонные трансформации определяют «порядковые (ординальные) шкалы» и т.д. [26].

Второе касалось определения осмысленности научного высказывания. Охарактеризовав шкалы при помощи допустимого типа трансформации, Стивенс утверждал, что научные высказывания, в частности теоремы в статистике, сформулированные в терминах измеряемых величин, должны учитывать инвариантность значений при тех трансформациях, которые допустимы для данного типа шкалы. При отсутствии такой инвариантности следует говорить о несостоятельности осмысленности измерений, а также научных предположений и выводов.

Кроме того, по Стивенсу, осмысленным высказыванием является такое, в котором определенное им отношение отражает отношение в эмпирической структуре. Например, чтобы произведение двух чисел было осмысленным, должно существовать эмпирическое событие, которое соответствует этому произведению. Если такого события нет, произведение является бессмысленным по определению.

Хотя Стивенс не дал алгебраического определения для концепта осмысленности, он высказал это в виде, по его мнению, интуитивно ясного предположения. В дальнейшем оно стало известным как количественная осмысленность [25].

Полное понимание концепта осмысленности научного высказывания остается недоступным: до сих пор не ясно, каковы условия, при которых инвариантность при допустимых преобразованиях является адекватным критерием для осмысленности, и не известно, какие еще критерии кроме этого могут быть использованы.

Многие сторонники репрезентативной теории измерения принимают, что числа, используемые для репрезентации одного вида эмпирических отношений (например, отношения эквивалентности), не всегда могут обрабатываться тем же способом, что и числа, используемые для репрезентации другого их вида (например, порядка). Это обстоятельство в значительной мере связано с тем, что в работах Стивенса [8, 33] рассмотренные выше концепты допустимости трансформаций были применены для статистических обработок, и было показано, что для выполнения определенных манипуляций с данными требуется, чтобы они соотносились с определенными же измерительными операциями. Сложение величин (например, для того, чтобы вычислить среднее), которые появились при использовании шкалы порядка, или ординальной шкалы, как было указано Стивенсом, оказывается неприемлемым; предполагалось, что операция сложения может быть применена только к величинам интервальных шкал или шкал отношений.

В работах Стивенса утверждалось, что только инвариантные к допустимым трансформациям числовые операций дают результаты, которые имеют соответствующие величины в эмпирической структуре. Если осуществлять манипуляции, не являющиеся инвариантными к допустимым трансформациям, то это, по определению, будет приводить к различным результатам в разных числовых структурах, репрезентирующих одну и ту же эмпирическую структуру.

Отсюда следует, что данной шкале измерений должны соответствовать только те статистические индикаторы, которые основаны на инвариантной в отношении допустимых трансформаций алгебре.

Предположим, что подсчитано среднее арифметическое нескольких длин. Если среднее основано на инвариантной алгебре, то в этой алгебре можно трансформировать длины и вычислить новое среднее, которое будет эквивалентно трансформированному старому. Отсюда следует, что среднее группы длин, измеренных в сантиметрах, равно 2.54 средним тех же длин, но измеренных в дюймах. Кроме того, в эмпирической структуре существует единственная длина, которая соответствует среднему других длин.

Трансформация один в один (1-в-1) среднего номеров на футболках в общем случае не будет равна среднему тех же самых номеров после такой же трансформации каждого номера на футболке по отдельности. Таким образом, получаются два различных средних даже в том случае, когда игроки, обозначенные при помощи величин на футболках (а эти величины были использованы для подсчета среднего в двух рассматриваемых случаях), были одними и теми же. В этом случае для того, чтобы не рассматривать выбор между двумя эмпирически различными средними, Стивенс предписал, что вычисление среднего никогда не должно быть применено к номинальным данным (в данном случае к номерам на футболках).

Соображения Стивенса о группах трансформаций сыграли важную роль. Однако, считается, что их автор все же не предложил аргументов, почему должны получаться именно эти, а не другие группы трансформаций. Поэтому подход Стивенса был скорее дескриптивным, чем аналитическим. Предписания, сформулированные в работах Стивенса, способствовали не только развитию его идей, но и разработке соответствующих контраргументов. Начиная с 50-х гг. стало ясно, что существуют структуры измерения, которые не подходят к предложенной им схеме. Однако значительный прогресс в понимании этой проблемы наметился только к середине 80-х гг.

С самого начала среди сторонников измерительного подхода возникли дебаты о том, какие виды эмпирических фактов могут репрезентироваться измерением. Например, в работе Кемпбелла [12] есть категорические указания на то, что измерение должно быть числовой репрезентацией только фактов конкатенации (измерения длины и аналогичных по процедуре измерения величин) или, по крайней мере, каким-то образом основываться на этих фактах. В терминологии Стивенса это указание Кемпбелла означает ограничение измерения до шкалирования отношениями. Кроме этого, как указывал Стивенс, вводя такие ограничения, Кемпбелл не строго соблюдал главный принцип репрезентализма.

Еще в работе Б. Рассела 1903 г. [30] в концепцию измерения была включена числовая репрезентация ординальных структур. Стивенс оказался даже более либеральным, позволяя включать в измерение числовые репрезентации структур классификации. Эти противоречия были свидетельством роста числа проблем, появляющихся в результате того, что теория репрезентации освободила сама себя от положений классической теории измерения (о ней будет сказано ниже) и последовала внутренней логике своего центрального принципа, примененного к содержанию психологии. В соответствии с ним числовая репрезентация некоторой эмпирической структуры и является измерением.

Использование идей репрезентативной теории измерения порождает естественный вопрос: «Почему для того, чтобы репрезентировать эмпирические структуры, обязательно надо приписывать числа?». Кемпбелл и Рассел не сомневались по поводу ответа на него. В работе [12] сказано, что это делается только для того, чтобы мощное оружие математического анализа могло быть применено к сущностному предмету науки. Математический анализ является мощным оружием, т.к. в нем содержатся соответствующие аргументы и теоремы, которые могут быть применены к эмпирическим высказываниям с момента приписания сущностным явлениям числовых значений. Но выводы, сделанные при помощи числовых аргументов, должны полностью соответствовать самим эмпирическим данным, а не выводами, содержание которых зависит от приписанных чисел. В противном случае измерение являлось бы более чем числовой репрезентацией, а функция чисел — чем-то большим по сравнению с обеспечением процесса дедукции.

Использование чисел при измерении — просто удобство, и они не могут «внести» в выводы свое содержание; выводы же могут быть получены при помощи неметрических эмпирических данных (хотя долго и запутанно), поэтому они не должны быть несвободны от специфики шкалы высказываниями. Свободные же от нее предпосылки репрезентируются числовым образом через измерения. Измерения ведут к зависимым от специфики шкалы выводам, затем из этих выводов делаются свободные от нее выводы. Но тогда релевантной является проблема: действительно ли эти свободные от специфики шкалы выводы были сделаны из свободных от нее предпосылок. В этой связи проблема допустимых статистик или осмысленности может быть опущена.

Как было показано в работе [16], идущее от Стивенса достаточно нестрогое определение осмысленности является неточным; оно провоцирует появление неправильных интерпретаций даже при условии его осторожного применения. Не ясно даже, что подразумевал Стивенс под высказываниями, включающими в себя числовые шкалы. Эта неточность привела к различным альтернативным формулировкам осмысленности, они приведены, например, в работах [9, 23].

Можно предположить, что определенные описательные статистики, т.е. мода, медиана, арифметическое или геометрическое среднее, будут пригодными не всегда, а только в определенных ситуациях измерения. Эта идея первоначально была выдвинута Стивенсом и широко использовалась для применения статистики в гуманитарных науках. Опираясь на принцип, согласно которому высказывания, включающие в себя статистики, должны быть инвариантными (т.е. осмысленными в указанном выше понимании), Стивенс утверждал: медианы соответствуют описательными статистикам для шкал порядка и мощнее, а арифметические средние соответствуют интервальным шкалам и мощнее.

Базисные идеи Стивенса стали также применяться в дедуктивных и выведенных логически статистиках. Основной принцип состоял в том, что в случаях, когда рассматриваемые числа не формируют, по крайней мере, интервальную шкалу, будет неадекватным использовать параметрические статистики (г-тест, корреляцию Пирсона, дисперсионный анализ). Для порядковых шкал могут быть использованы непараметрические статистики (такие, как Mann Whitney U, Kruskal Wallis H или Kendall т).

Как было показано в работе [9], Стивенс, по крайней мере, неточен в изложенной выше концепции. Например, сообщение о медиане или о среднем по множеству измерений просто равносильно сообщению о фактах этого множества, потому запрещать сообщения таких фактов является в значительной степени произволом.

Есть и другой аргумент, ставящий под сомнение предположение Стивенса о том, что только осмысленные утверждения будут полезны для ученого. Рассмотрим сложную теорию с проверяемыми основаниями. Одни ее элементы могут быть проверены через наблюдение, другие — порождать ненаблюдаемые события или переменные, как это имеет место в некоторых важных психологических теориях. Ненаблюдаемые элементы не имеют аналогов в эмпирической структуре по определению; отсюда следует, что они являются бессмысленными в измерительным смысле, и это ставит под сомнение результаты многих работ в психологии. Однако можно утверждать, что указанные элементы обладают некоторой полезностью, например, в качестве инструмента порождения проблем исследования.

Таким образом, репрезентативная теория измерения в целом обладает определенной привлекательностью, но для психологии она не является универсальной. В частности, для случая тестов умственных способностей и кумулятивных рейтинговых шкал, с которыми связана значительная часть работ в психологии, имеющих квантитативный характер, не очень ясно, какие именно эмпирические отношения репрезентируются.

Сложности в понимании осмысленности измерений в значительной степени связаны с непроработанными идеями репрезентативной теории [25], однако репрезентализм не является единственным подходом к проблемам измерения.

Операциональная теория измерений

Операциональная теория измерения использовалась до появления работ Стивенса, и это во многом определило развитие репрезентализма.

Хорошо известное определение Стивенсом измерения как «приписывание чисел объектам или событиям в соответствии с правилами», принимается почти всеми. Репрезентативная теория требует, чтобы правила приписывания чисел ограничивались теми, согласно которым приписанные числа репрезентируют эмпирическую информацию, но данное Стивенсом само определение измерения не содержит этих ограничений. Кроме того, Стивенс активно способствовал расширению этой интерпретации и считал, что, обеспечивая постоянные правила приписывания, мы получаем некоторую форму измерения. Хотя это мнение не полностью соответствует духу репрезентализма, оно отражает стремление Стивенса объединить вместе два подхода к измерению: репрезентализм и операционализм.

Когда Стивенс впервые изложил свою теорию, второй из этих подходов был уже широко распространен в психологии, и его использование позволило теории Стивенса стать приемлемой для большинства психологов. Репрезентализм Стивенса с сомнительными высказываниями о допустимых статистиках вызвал сопротивление у многих, но его операционализм — в той форме, в которой он отражен в определении измерения — был принят психологами без критики.

Такое положение существует до сих пор. В работе [14] осмысленность использования метода рейтингового шкалирования утверждается логикой, в соответствии с которой он дает работоспособную технологию измерения, поскольку существуют повторные наблюдения, в которых приписанные таким способом числа демонстрируют соответствующий вид постоянства. Эта позиция является операционалистской по духу, и для большого числа психологов она подходит.

Как известно, операционализм уходит корнями в работу [11], и его смысл хорошо выражен в одном из ее девизов, согласно которому под любым концептом не подразумевается ничего иного, кроме множества операций: концепт является синонимом, соответствующим множеству операций. Поскольку процесс измерения всегда является некоторого рода операцией на объекте и поскольку она ведет к числовым результатам, постольку с операциональной точки зрения оказывается, что измерение является просто операцией, которая порождает числа. Такое его понимание измерения, очень похожее на данное Стивенсом определение измерения как приписывания чисел в соответствии с правилом, практически соответствует использованию операций некоторого рода. Интерпретацию доктрины измерения, аналогичную изложенной в работе [11], можно найти в работе [15], где измерение определяется как некоторая точно определенная операция, которая продуцирует числа.

Фундаментальное различие между репрезентативной и операциональной теориями лежат в их отношении к тому, каким образом числа включаются в измерение. В соответствии с первой числа репрезентируют эмпирическую реляционную систему, которая рассматривается как объективная структура, существующая вполне независимо от наших операций. Использовать числа удобно, но в принципе они необязательны. С позиций второй числа представляют собой нечто самодостаточное и независимое от представлений о шкалах; данные, на которых основывается измерение, являются неотъемлемо числовыми, а операции включают в себя продуцирование чисел. В пределе для убежденного операционалиста наука является просто изучением производимых операций, а не исследованием реальности, которая, вероятно, лежит за их границами.

Так, операционалист будет рассматривать оценки по тесту как измерения просто потому, что они являются осмысленно последовательными приписываниями чисел, которые являются результатом точно определенных операций. Для сторонника репрезентализма получаемой при этом информации отнюдь не достаточно. С его точки зрения, если оценки по тесту могут рассматриваться как результаты измерения, то числовые отношения между ними (т.е. одна оценка больше, чем другая и т.д.) должны репрезентировать качественные эмпирические отношения между успешностью выполнения теста, а исследование ориентировано на идентификацию таких отношений и описание их качеств.

Таким образом, при попытке осуществить в исследовании измерение сторонники рассматриваемых теорий будут иметь совершенно разные интересы. Операционалисты интересуются разработкой операций, которые продуцируют разумное последовательное приписывание чисел, сторонники репрезентализма — поиском отношений между числами и эмпирией.

Если взглянуть на измерение с точки зрения операционализма, то для статистических или других числовых процедур не может существовать ограничений, зависящих от типа шкалы. Например, ординальная шкала интеллекта не является таковой в абсолютном смысле, а исследователь не ограничен в том, насколько шкальные величины могут быть обработаны числовым образом. Основанные на измерениях числовые (или статистические) результаты выглядят как нечто окончательное, а не как этап на пути получения свободных от специфики шкалы выводов. Для поддерживающих эту точку зрения специалистов запреты Стивенса и критерий осмысленности были бы чем-то несуразным: они идут по пути открытия количественных отношений между исходами различных операций, и, следовательно, указанные ограничения выглядят для них как препятствия научному прогрессу.

В этой связи не удивительно, что многие психологи, по сути, сопротивляются сделанным Стивенсом предписаниям. Некоторые психологи испытывают симпатию к духу эмпиризма, которым веет от операционализма, но не принимают определение измерения, сделанного в рамках данной парадигмы. Они считают, что оценки по тесту, рейтинговые шкалы и другие исходы стандартных психометрических процедур отражают структуру лежащих в основе теоретических переменных, которые сами по себе прямо не измеряемы. Например, часто принимается, что оценки по когнитивным тестам отражают уровни латентных способностей. Такой подход к психологическому измерению в большей степени относится к классической теории измерения, чем к операциональной или репрезентативной.

В соответствии с точкой зрения сторонников операционализма цель количественной науки абсолютно проста: раскрытие количественных отношений между числами, создающимися операциями с последовательным приписыванием. В таком контексте концепт «тип шкалы» может найти свое применение, так как он не связан с видом репрезентируемых эмпирических отношений (как это имеет место в репрезентативной теории). Вместо этого он связан с тем, что представляет собой намерение использовать при измерении числовую информацию. Если осуществляется не более чем основанная на приписанных числах классификация, получается номинальная шкала; если используется не более чем ординальная информация, получается ординальная шкала; если используется информация о различиях, получается интервальная шкала; если используется информация об отношениях, получается шкала отношений. Идущие от Стивенса соображения об осмысленности измерения при этом могут не рассматриваться. В данной концепции приписываемые объектам числа не обременены своей историей, обращаться с ними можно довольно вольно, т.е. числа «не знают», откуда они пришли [22].

Классическая теория измерения

В соответствии с классической теорией измерения считается, что «современная» психология представляет собой количественную науку. Это предположение можно найти в работе Фехнера [1], где сказано, что в общем случае измерение количества состоит в установлении того, как часто единица количества того же сорта содержится в нем. В работе [36] отмечено: мы производим измерение в некоторой области естественных наук, когда сравниваем данную величину с некоторой конвенциальной единицей того же самого рода и определяем, сколько раз эта единица содержится в величине.

В настоящее время в психологии классическая теория измерений практически целиком вытеснена репрезентативной и операциональной теориями, однако некоторые следствия ее применения сохраняются до сих пор [20, 31]. В соответствии с этой теорией измерение является просто «оценкой количества» (т.е. оценкой «сколько») [31]. При измерении рассматривается, каким количеством данного атрибута обладает объект (т.е. сколько массы, интеллекта и т.д.). Оценка количества просто прикладывается к количественным переменным, и для того чтобы быть измеримым, атрибут должен соответствовать дефиниции количественной переменной [20]. При этом игнорируется тот момент, что такие атрибуты, как масса, могут быть измерены только потому, что они количественны, но такие как национальность измерены быть не могут. Различие между количественными и неколичественными атрибутами находятся в самой структуре атрибута.

Относительно структуры количественного атрибута достаточно сказать, что его величины состоят в ординальных и аддитивных отношениях друг с другом таким образом, что они формируют структуру, сходную с той, которая описана в работе [21] как экстенсивная. Но существует фундаментальное различие между концептами экстенсивной структуры и тем, что содержится в классической теории измерения. В работе [21] рассматриваются элементы измерения, которые обладают экстенсивной структурой, будучи объектами (например, прямые твердые бруски), в то время как в соответствии с классической теорией элементами измерения являются атрибуты объектов (т.е. длина таких брусков).

Из этих рассуждений видно, что хотя различия между теориями можно считать минимальными, они очень важны. Сам атрибут может рассматриваться как экстенсивный (или количественный), и при этом нет необходимости в обладающем им объекте. Тот факт, что атрибут является количественным, никак не зависит от существования множества объектов, обладающих отношениями физической аддитивности между ними.

Для классической теории измерения не является проблемой то, что такой атрибут, как, например, температура, в соответствии с представлениями современной физики, считается количественным — даже несмотря на то, что обладающие температурой объекты не формируют экстенсивную структуру. Репрезентативная же теория требует, чтобы отношения между данными объектами изначально конституировали соответствующий вид эмпирической реляционной системы — только после этого становится возможным измерение.

В соответствии с требованиями классической теории необходимо простое наличие доказательства в пользу гипотезы о том, что подлежащий измерению атрибут является количественным без ограничений, накладываемых на форму, в которой надо рассматривать это доказательство. В случае с длиной это требование может соответствовать открытию того, что определенные обладающие длиной объекты конституируют эмпирическую реляционную систему экстенсивного вида; с температурой такое соответствие может быть более опосредованным. Для классической теории измерения важно, что гипотеза о количественности рассматриваемого атрибута некоторым образом поддерживается при помощи очевидных доказательств в условиях отсутствия фальсифицирующих артефактов. Такая гипотеза не отличается от многих других, но ее нельзя положить в основание теории прежде, чем будут подсчитаны доказательства «за» и «против», и этот подсчет является проблемой мастерства исследователей.

Если взять некоторую величину атрибута как единицу измерения, то можно определить и аппроксимировать числовые отношения между единицей величины и подлежащей оценке величиной. Это важный момент, т.к. в соответствии с классической теорией при измерении не приписываются числа, а скорее открываются числовые отношения. Любые две величины одного и того же количественного атрибута будут находиться в отношении относительной величины (друг относительно друга), и это отношение будет количественным. Если взять, например, длину руки и длину большого пальца, можно сформулировать высказывание: «Длина руки в 18.5 раза больше длины большого пальца».

В более общем виде некоторая длина может быть в два, три четыре или в п раз больше (где п является некоторым положительным действительным числом) другой длины и, таким образом, она будет определена через п раз взятую единицу. В соответствии с классической теорией числовые отношения типа «одна длина является взятой п раз другой длиной» есть эмпирические отношения между длинами, а измерение есть открытие таких отношений. Этот аспект теории можно найти в работе [10], где показано, как отношения величин континуального количественного атрибута конституируют полностью упорядоченное поле и, соответственно, могут рассматриваться в качестве действительных чисел.

Очевидно, что классическая теория отличается и от репрезентативной, и от операциональной тем, что в процессе измерения при использовании первой числа не приписываются объектам, а скорее происходит открытие числовых отношений между величинами количественного атрибута. От операциональной она отличается еще и тем, что обеспечивает возможность измерения сущностных характеристик, а не ограничивается конструированием порождающих числа операций.

Классическая теория измерения влияла на развитие большинства количественных теорий в психологии вплоть до 1950 г. В факторно-аналитической теории способностей, предложенной Спирменом [32], в посвященной теории психофизики и измерению аттитюдов работе Терстоуна [35] и труде Халла [19] о теории научения делались предположения о существовании разных с точки зрения психологии видов атрибутов. Согласно любой из теорий, изложенных в этих работах, психологические переменные не могут измеряться непосредственно. Разработка соответствующих процедур измерения не вытекала ни из репрезентативной, ни из операциональной парадигмы; не было предпринято попыток точно определять эмпирические реляционные системы, а измерение не рассматривалось как просто разработка операций для порождения чисел. Вместо этого соприкасающиеся с теорией гипотетические психологические атрибуты (т.е. тестовые оценки, относительные частоты или скорость реакции и т.д.) были разработаны таким способом, чтобы связать их с наблюдаемыми количествами.

Законность созданных таким образом процедур измерения должна рассматриваться как зависящая от истинности лежащих в их основе психологических теорий; существование гипотетических количественных атрибутов является их неотъемлемой частью. Это становится возможным только с ростом приемлемости операциональной точки зрения, согласно которой те или иные измерительные процедуры рассматриваются как устанавливающие независимость психологического измерения от лежащих в их основе теорий. Так, многие согласились бы с тем, что измеряющие интеллект тесты вполне независимы от истинности теории Спирмена или Терстоуна.

В соответствии с классической теорией результаты измерения всегда являются натуральными числами, из этого следует, что к ним может быть применима любая форма валидного числового вывода. Т.е. для этой теории все измерения являются измерениями на одном и том же типе шкалы, а ограничения, накладываемые Стивенсом на использование статистических процедур и связанные с осмысленностью, не применимы.

Очевидно, что этой теории соответствуют те измерения, которые Стивенс и Суппес назвали измерениями на шкале отношений. Этот же вывод справедлив и для измерений на интервальных шкалах, поскольку различия на них конституируют шкалу отношений вследствие того, что подлежащее в классическом смысле измерению на интервальной шкале является различием. Это относится, например, к мерам температуры по шкале Цельсия — не к температуре как таковой, а к различиям в температуре, поскольку единица измерений в 1 °С является сотой частью различия между точками кипения и замерзания воды. Таким образом, шкалы в репрезентативной теории, аналогичные этой, подходят для классической.

Но то, что позволяет использование классической теории, не всегда подходит для репрезентативной теории; это касается, например, факторных оценок, получаемых при измерении способностей или величин шкалы Терстоуна, получаемых при измерении аттитюдов.

В контексте обсуждения положений классической теории измерения при строгой оценке номинальная и порядковая шкалы Стивенса с большей точностью могли бы быть отнесены к числовому кодированию, а не к измерению. В этих случаях числа используются для того, чтобы дать ярлыки нечисловым свойствам или отношениям. Данный вполне безобидный прием очевидным образом отличается от измерения, когда числа используются для отсылки к числовым отношениям — при числовом кодировании они для этого не предназначены. Последнее сходно с использованием цветовых терминов физиками для того, чтобы обозначить свойства кварка. Конечно, можно придумывать способы применения арифметических правил к числовым ярлыкам, но делать это не более продуктивно, чем думать о применении закона смешения цветов к свойствам кварков. Отметим, что хрестоматийный пример преобразований по Стивенсу номинальной шкалы 1-в-1 на футболках может соответствовать или не соответствовать изменению функций игроков.

В соответствии с классической теорией, некоторые из изучаемых в психологии переменных являются количественными, а измерение является открытием определенных видов числовых отношений между величинами переменных. Открытые таким образом числа (числовые отношения) являются натуральными и они будут настолько эмпирическими, насколько в научном исследовании найдены какие-либо эмпирические отношения. К ним законным образом может быть применен полный набор форм валидного числового доказательства. Кроме того, полученные так числовые выводы оказываются интерпретируемыми непосредственно как эмпирические высказывания вне зависимости от того, являются ли они несвободными или свободными от специфики шкалы. Отсюда следует, что в рамках классической теории постановка проблемы осмысленности измерения теряет смысл, в чем она значительно отличается от репрезентативной.

В психологии в равной мере сосуществуют три теории измерения, каждая из которых имеет свое значение для определения отношений между шкалами измерений и статистиками. Неудача в распознавании различий между ними осложняет разработку проблемы «допустимой статистики», что связано с осмысленностью измерений. Сторонники репрезентативной теории предполагают, что они знают, чем в действительности является измерение, и считают возможным предписывать некоторые аспекты использования статистики в психологии. Но репрезентативная теория не является единственной; для двух других, в соответствии с практикой их применения, такие предписания не являются обязательными.

В операциональной теории подразумевается, что между шкалами измерений и соответствующими процедурами измерений связи нет. Применение классической теории предполагает отрицание предложенных Стивенсом различий в обработке данных из-за типа шкалы и не запрещает использование любых статистических процедур на результатах измерений. Использование этих теорий не подразумевает постановки вопроса об осмысленности измерений, а если учесть, что данные вопросы еще не решены в полной мере и репрезентативной теорией, то приходится констатировать необходимость разработки новых подходов к проблеме осмысленности.

Список литературы

  1. Бардин К. В. Проблема порогов чувствительности и психофизические методы. М.: Наука, 1976.
  2. Верка К. Измерения. Понятия, теории, проблемы. М.: Прогресс, 1987.
  3. Измайлов Ч. А., Михалевская М. Б., Гусев А. Н. Измерения в психологии. М.: Смысл, 1998.
  4. Крылов В. Ю. Методологические и теоретические проблемы математической психологии. М., 2000.
  5. Логвиненко А. Д. Измерения в психологии: математические основы. М.: Изд-во Моск. ун-та, 1993.
  6. Рубцова Н. Е., Леньков С. Л. Статистические методы в психологии. М.: УМК «Психология», 2005.
  7. Сидоренко Е. В. Методы математической обработки в психологии. Социально-психологический центр. С. -Пб., 1996.
  8. Стивенс С. Математика, измерение и психофизика // Экспериментальная психология / Под ред. С. Стивенса. М.: Иностранная литература, 1960. Т. 1.
  9. Adams E.W., Fagot R.F., Robinson. R.E. A theory of appropriate statistics //Psychometrika. 30. 99 — 127, 1965.
  10. Bostock D. Logic and arithmetic. Oxford: Clarendon Press, 1979. V. 2.
  11. Bridgman P. The logic of modem physics. N.Y.: Mac-Millan, 1927.
  12. Campbell N.R. Physics: The elements. L.: Cambridge University Press, 1920.
  13. Campbell N.R. An account of the principles of measurement and calculation. L.: Longmans & Green, 1928.
  14. Cliff N. What is and isn't measurement // Statistical and methodological issues in psychology and social sciences research /Ed. G. Keren. Hillsdale. N.J., 1982. P. 3 — 38.
  15. Dingle H. A theory of measurement // British Journal for the Philosophy of Science, 1, 5 — 26. 1950.
  16. Falmagne J.C., Narens L. Scales and meaningfulness of quantitative laws // Synthese, 55, 287 — 325. 1983.
  17. Helmholtz H. Numbering and measuring from an episte-mological viewpoint // Helmholtz: Epistemological writings / Eds. P. Hertz, M. Schlick. Dordrecht, 1930 (1887). P. 72 — 114.
  18. Holder O. Die Axiome der Quntitat und Lehre vom Mass // Ber. Verh. Kgl. Sachsis. Ges. Wiss. Leipzig. Math. Phys. Classe. 1901. B. 53. Z. 1 — 64.
  19. Hull C.L. Principles of behavior. N.Y., 1943.
  20. Jones L.V. The nature of measurement // Educational measurement / Ed. R.L. Thorndike. Wash., 1971.
  21. Krantz D. M., Luce R.D., Suppes P., Tver sky A. Foundation of measurement N.Y.: Academic Press, 1971. V. 1.
  22. Lord F.M. On the statistical treatment of football numbers // American Psychologist. 1953. V. 8. P. 750 — 751.
  23. Luce R.D. Dimensionally invariant numerical laws correspond to meaningful qualitative relations // Philosophy of Science. 1978. V. 45. P. 1 — 16.
  24. Michell J. Measurement scales and statistics: A clash of paradigms. Psychological Bulletin. 1986. V. 100. P. 398-^07.
  25. Narens L. Abstract measurement theory. Cambridge: MIT Press, 1985.
  26. Narens L., Luce, R.D. Measurement: The theory of numerical assignments // Psychological Bulletin. 1986. V. 99. P. 166 — 180.
  27. Roberts F.S. Measurement theory. Reading: Addison-Wesley, 1979.
  28. Roberts F.S. On Luce's theory of meaningfulness // Philosophy of Science. 1980. V. 47. P. 424 — 433.
  29. Roediger H.L. Memory metaphors in cognitive psychology // Memory and Cognition. 1980. V. 8. P. 231 — 246.
  30. Russell B. The principles of mathematics. L.: Cambridge University Press, 1903.
  31. Senders V.L. A comment on Burke's additive scales and statistics // Psychological Review. 1953. V. 60. P. 423 — 424.
  32. Spearman C. The abilities of man. N.Y.: Macmillan, 1927.
  33. Stevens S.S. On the theory of scales of measurement // Science. 1946. V. 103. P. 677 — 680.
  34. Stevens S.S. Measurement, statistics, and the schemapir-ic view // Science. 1968. V. 161. P. 849 — 856.
  35. Thurstone L.L. Primary mental abilities. Chicago: University of Chicago Press, 1938.
  36. Titchener E.B. Experimental psychology. N.Y.: Macmillan, 1905. V. 1.

PROBLEM OF PSYCHOLOGICAL MEASUREMENTS MEANINGFULNESS

A. P. Pakhomoff

PhD, assistant professor of management of marketing chair, RUDN, Moscow

The basic concepts of the representative measurement theory are analyzed. It is supposed that some Steven's assumptions could be revised. It is noted that psychological measurements experience is based not only on the representative measurement theory.

Key words: psychological measurements, representative measurement theory, meaningfulness of measurement, scientific assumptions.

Канал в Telegram: @PsyfactorOrg
 
.
   

© Copyright by Psyfactor 2001-2017.
© Полное или частичное использование материалов сайта допускается при наличии активной ссылки на Psyfactor.org. Использование материалов в off-line изданиях возможно только с разрешения администрации.
Контакты | Реклама на сайте | Статистика | Вход для авторов