Контакты
Собственные публикации/Методические вопросы исследований

Чем психологический тест-опросник отличается от социологического опросника?

заметка индуцирована Александром Шмелевым, доктором психологических наук, профессором МГУ, научным руководитель Центра тестирования и развития Гуманитарные технологии 18 сентября 2018 года на фейсбуке


В социологии (и особенно в его маркетинговом «изводе») довольно широко используется психологическая терминология, а также нередко делаются попытки при социологических опросах измерять психологические характеристики. Мы сейчас не будем обсуждать корректность использования психологической терминологии в социологии, хотя это и очень хочется, но сейчас не об этом… В этой заметке мы попытаемся описать различие в понимании «измерения» между психологами и социологами и проблемы переноса психологических опросных шкал (измеряющие личностные черты) в социологические опросы.

Начать это обсуждение можно с замечания, что внешне чисто технически, а содержательно гораздо более глубокое различие состоит в том, что правильно сформированный социологический вопрос содержит альтернативу ответа «затрудняюсь ответить», а значительная часть психологических шкал не содержит возможности такого ответа в принципе. Во многом это различие порождено характером взаимодействия при опросе: в психологии испытуемый/клиент/пациент чаще всего ориентирован на сотрудничество, респондент в социологическом опросе нередко ищет ту или иную возможность сбежать… Но само по себе распределение ответов при наличии или отсутствии такой альтернативы различается, психологи это знают и специально «усиливают» отсутствием такой альтернативы чувствительность измерения, хотя на мой взгляд это путь к псевдодиагностике.

Кроме того, позволю напомнить, что и объект, и цели измерений в психологии и социологии различны! Психологическая шкала призвана диагностировать индивидуальные характеристики и быть чувствительна к индивидуальной динамике (в том числе в варианте стабильности), социологическое измерение должно быть чувствительно к дифференциации и динамике групп, а на индивидуальном уровне не анализируется вообще. Во многом эти основания приводят к многопунктовости вопросов в психологическом измерении (стандартный размер шкалы на одну характеристику около 20 пунктов) и 1-5 вопросам в социологическом опросе, а подозрительную на содержательность дисперсию (которая интерпретируется как дифференциация между группами) получают большим количество респондентов.

При этом «нормативность» измерения в психологии и социологии различна: в психологии под «стандартностью» чаще всего понимают нормальное распределение, в социологии что-то, имеющее нормальное распределение на репрезентативной выборке вызовет скорее подозрение. Во многом это связано и с тем, что психологические тесты разрабатываются на «квотных» (ограниченных по тем или иным параметрам) и малых (60-100 человек) с социологической позиции выборках, внутри которых параметр и может иметь распределение близкое к нормальному. Во многом эта «нормальность» является следствием «комфортного» квотирования выборки у психологов (студенты, обращающиеся за психологической помощью и т.д.), что приводит к перекосу по доходному и культурному уровню. Этот перекос приводит к тому, что значительная часть вопросов психологических шкал может вообще плохо пониматься на репрезентативной выборке респондентами с невысоким уровнем образования и/или низким доходом (это приводит к случайному или смещенному на первые альтернативы ответов выборы респондентами и во многом порождать псевдодифференциацию между группами).

Отдельную проблему представляет параметр «надежности», понимаемой как устойчивость результатов тестирования. С одной стороны, наличие такой характеристики теста вроде бы понятно, так как подразумевается, что измеряемая психологическая характеристика стабильна у психически здоровой личности хотя бы в пределах года при отсутствии эмоционально значимых событий в течении этого периода. В этом смысле психологи подходят более последовательно, но само постулирование устойчивости при отсутствии значимых событий между измерениями ставит довольно много вопросов относительно того, что же на самом деле измеряется. Социологи в этом смысле «надежность» чаще всего вообще не измеряют, так как, с одной стороны, они заимствуют шкалы у психологов и в этом доверяют им. С другой стороны они встречаются с большими проблемами при необходимости повторного тестирования больших групп людей (существующие многотысячные медийные и потребительские панели у маркетологов «защищены» от какой-либо иной, кроме целей исследования, нагрузки). Поэтому «надежность» у социологов это опять же сохранение дифференциации групп при повторном исследовании у случайно сформированной выборки. И хотя это может соблюдаться, но когда я имел возможность проверять устойчивость, например, факторизации используемых пунктов в различных проектах измерения «стиля жизни», «ценностей» или других психологически коннотированных темах, то уже на этом уровне никакой устойчивости не было. Чаще всего это следствие плохо проработанной концептуальной базы, вольно сформированного опросника и отсутствия контрольных исследований, но знание этих факторов самой проблемы измерения «психологии» не снимает.

Также стоит обратить внимание на понимание валидизации психологических шкал в самой психологии и в социологии. Большинство психологических шкал валидизируется через уже признанные шкалы и крайне редко через другие типы данных, в лучшем случае с помощью «контрастных групп», которые, допустим, понятны в клинической или педагогической практике, но не столь очевидны в социологии (напомню, что сами по себе «социальные группы» являются концептами, их реальность в каждом конкретном случае требует доказательства; например, доказательство наличия группы «пролетариат» и классификация относительно этого признака заняло почти два столетия и закончилось ничем). Я очень хорошо понимаю, что получение истинных L-данных требует безумных разнообразных затрат, но мне не удается вот так сразу припомнить публикации по разработке психологических тестов, в которых бы содержалась сколько-нибудь существенная информация, чем же реально различается жизнь людей с разной выраженностью той или иной психологической характеристики, пусть даже на уровне ответов вопросов о фактах поведения. При этом декларацию о выраженности того или иного переживания давайте не будем считать доказательством различий в жизни как повседневной деятельности и ее эффективности, так как само по себе содержание переживания мы зафиксировать не можем, но если мы считаем что различное содержание тревожности заслуживает отдельных наименований в качестве личностных характеристик, то тогда вправе рассчитывать на различия «на выходе из черного ящика» не только вербального плана. Причины такого игнорирования измерения поведения психологами понятны: даже опросное измерение различий повседневной жизни людей гораздо более трудоемкое занятие, чем 20-пунктовый психологический опросник (или даже батарея из нескольких шкал), и психологи, как правило, вообще не очень ориентируются о правильном и содержательном измерении этого (например, вопрос «часто ли вы смотрите телевизор» и альтернативы «часто, редко, вообще не смотрю» к измерению чего-либо отношение не имеет).

На сегодняшний день валидизация через признанные психологические шкалы, которые валидизировались через другие признанные шкалы, и т.д. вообще-то выглядит каким-то вырожденным путем ниоткуда в никуда. Позволю себе напомнить, что практические все «личностные характеристики» по своей сути, как и «социальные группы» являются конструктами, то есть идеями. Не ставя под сомнение саму по себе полезность этого приема, хотелось бы обратить внимание, что в предельном случае претендентами на измерение с помощью шкал по 20 пунктов в каждой становятся не только все слова, изначально существующие в языке для описания поведения и характеристик человека, но и все те, которые могут быть использованы в качестве метафоры (например, различие в поведении людей, которых окружающие называют «свиньями» или «поросятами»). Очевидно, что попытка валидизировать их через другие слова, без привязки к реальным событиям поведения, мы получим для русскоговорящих 15-факторную структуру, при некоторых усилиях выйдем на «большую пятерку», но без данных о реальном поведении дифференциация по любому количеству факторов будет не сильно информативна.

У социологов относительно валидизации внешне все выглядит чуть лучше, но являются ли различия в распределении ответов на тот или иной вопрос у мужчин и женщин или у разных возрастных или доходных групп различием собственно психологическим (определенным внутренними характеристиками человека) или же в той или иной мере ситуативными? Этот вопрос не любят ни психологи, ни социологи, спор о первичности или вторичности психологических характеристик относительно, например, социального статуса я сейчас инициировать не хотел бы, но замечу, что с возрастом дисперсия ответов по «психологическим» вопросам довольно сильно снижается. А с ростом дохода рост дисперсии по тому или иному «личностному» показателю растет куда сильнее, чем изменяется среднее значение по признаку. Это проблема не всех психологических «характеристик», есть вполне внешне валидизируемые характеристики, см. например, но их мало. В итоге социологи (чаще всего, их подгруппа «маркетологи») под каждую задачу пытаются подыскать специфические психологические характеристики, благо история психологии может предоставить классификации под любые самые странные идеи. И пусть эти идеи самой психологией уже могут считаться «детской болезнью», в социологической практике они в «припудренном и кастрированном» виде могут продолжать жизнь десятилетиями.

В итоге, начав с вопроса о различиях проведения опроса в психологии и социологии мы дошли до вопроса, а что же мы вообще измеряем, когда утверждаем, что измеряем «психологические различия»? В чем смысл их социологического измерения и какие из психологических характеристик вообще имеет смысл изучать как социологические (или маркетинговые) феномены, даже если доказано, что они имеют то или иное значение в ином (педагогическом, управленческом, коррекционном и т.д.) контексте?

Как говорится «на самом деле», подавляющее большинство позиций по общественным вопросам (изучаемых социологией) или потребительского поведения (анализируемого в маркетинге) никак не связано с собственно психологическими характеристиками. Сама по себе поддержка разрешения или запрета абортов не является следствием психологической характеристики «консерватизм», так как такой психологической характеристики не существует. Но существует «ригидность», характеризующая склонность к устойчивости тех или иных когнитивных установок, которая встречается у апологетов любой позиции в той или иной общественной дискуссии. Но не следует позиции по общественным вопросам обзывать психологическими характеристиками, а психологическим характеристикам придавать политические коннотации. Это вносит ненужную путаницу и так в непростые и те и другие вопросы.

Наверное, и ответ на заголовок лежит в том, что не существует «психологии толпы» не как поведения группы людей, находящихся в одном месте, а как общественного повседневного явления; что хотя мы все и разные, но разнообразие поведения в типичных ситуациях (например, при покупке чего-то конкретного) гораздо меньше, чем мы привыкли об этом думать, но наше поведение в одной товарной группе никак не связано с поведением в других товарных группах (и крайне редко определяется нашими психологическими особенностями) и т.д. и т.п. И использование слов «опрос» и «опросник» в психологии и социологии является аналогичными средствами, а не гомологичными. То есть одинаково они называются случайно, а внешнее сходство обманчиво…