© С.М. Морозов

2.2. Емпірична валідність

Морозов С. М. Засоби контролю діагностичних якостей психологічних тестів. — K., 1994.

Критерій емпіричної валідності об'єднує сукупність різноманітних характеристик валідності тесту, що визначаються за допомогою порівняльно-статистичного методу. Емпірична валідність охоплює критеріальну валідність та два її різновиди — поточну та прогностичну, а також конструктну валідність.

Як вже зазначалось, при визначенні валідності змісту аналіз якостей тесту здебільшого проводиться за допомогою якісних процедур, аналізу інформації дескриптивними методами при залученні експертів та інших джерел інформації з метою судження про ступінь збігу завдань тесту та змісту досліджуваної психологічної властивості. При визначенні емпіричної валідності завжди вдаються до засобів статистичного коригування та факторизації порівнюваних даних. Найчастіше здійснюється корелятивний аналіз міри зв'язку оцінок контрольованого тесту та показників, що відбивають якийсь зовнішній (незалежний від самого психологічного тесту) параметр досліджуваної психологічної якості. Така процедура найтиповіша для визначення критеріальної валідності тесту. При з'ясуванні дискримінативної та конвергентної конструктної валідності звичайно вдаються до порівняння показників контрольованого тесту з оцінками іншого психологічного тесту, валідність якого вже відома (див. розділ 2.2.3). Зрозуміло, що при вживанні статистичних засобів аналізу головними показниками, що розкривають сутність валідності, стають коефіцієнти кореляції, тобто кількісні коефіцієнти валідності (особливості інтерпретації коефіцієнтів валідності докладніше будуть розглянуті у розділі 2.3).

Чи не найпоширенішою процедурою визначення емпіричної валідності психологічного тесту є дослідження критеріальної валідності. Головною проблемою у порівнянні даних тесту з незалежним показником (критерієм) досліджуваної якості є раціональний підбір цього критерію; з цих причин розгляд критеріальної валідності доцільно розпочати питанням про самий незалежний критерій, зміст цього поняття, засоби його відбору.

2.2.1. Критерій валідізації

Критерієм валідізації може бути якась безпосередня та незалежна від тесту, що валідізується, міра, що прямо чи побічно відображає психічну властивість, особистісні якості, прояви поведінки, успішність діяльності тощо. Іншими словами, критерій валідізації — це показник якоїсь психічної властивості, що вимірюється тестом, але отриманий будь-яким іншим, відмінним від котрольованого тесту шляхом.

У практичній психологічній діагностиці як критерій валідізації найчастіше використовують такі види інформації:

  • об'єктивні соціально-демографічні та біографічні дані (фах, термін роботи за фахом, освіта, належність, до тих чи інших соціальних верств та угруповань, факти прийняття або звільнення з роботи, ув'язнення тощо);
  • показники успішності навчання, академічні оцінки, судження про досягнення у навчанні з боку педагогів та батьків, тестові результати, успішність оволодіння навчальним матеріалом;
  • виробничі показники в окремих видах професійної діяльності, характеристики ставлення до роботи, трудової дисципліни тощо;
  • виконання реальної критеріальної діяльності (малювання, моделювання, заняття музикою, складання оповідань тощо);
  • медичний діагноз, а також будь-які інші висновки фахівців та результати консультацій;
  • контрольні іспити щодо здобутих знань й навичок; дані інших методик та тестів, валідність яких вважається з'ясованою.

Різновиди критеріїв валідізації можуть бути загалом розподілені на об'єктивні (незалежні від суб'єктивних оцінок, міркувань людей), і суб'єктивні критерії. Останні, на жаль, найчастіше використовують у практиці критеріальної валідізації психодіагностичних методик. До таких критеріїв можна віднести академічні оцінки, характеристики вдачі та поведінки особистості, життєвих поглядів, стосунків з іншими людьми тощо, які виносяться експертами (педагогами, лікарями, керівниками виробництва, психологами та іншими фахівцями). Найчастіше експерт здійснює оцінювання якоїсь властивості за допомогою спеціально розробленої шкали. Об'єктивізація експертних критеріїв валідізації досягається за рахунок збільшення кількості експертів.

Відомі чотири найпоширеніші методи експертної валідізації.

1. Колективна оцінка.

Використовуючи цей метод, експерти разом оцінюють об'єкт за допомогою спеціальної шкали. Підбір градації оцінних шкал найчастіше здійснюється за принципом звичності оцінок для експерта. Так, для вчителів найзручнішим є оцінювання за п'ятибальною шкалою. Умовою методу колективної оцінки є розробка компромісного вирішення щодо досліджуваного об'єкта. У суспільному житті такий метод винайдення рішень є чи не найпоширенішим (збори, конференції тощо), але за такого способу оцінювання результати переважно залежать від особистостей та групової взаємодії експертів.

2. Середньозважена оцінка.

За такого підходу кожного піддослідного також оцінює група експертів, але жодному з них невідомі судження про якості об'єкта, які виносяться іншими експертами. Після закінчення оцінювання висновки експертів усереднюються.

3. Метод ранжирування.

За такого підходу група експертів разом або незалежно один від одного розміщують якості піддослідного у кілька груп' за принципом зростання чи зниження прояву тієї або іншої якості. Замість групування можуть складатися рангові списки. Згідно з першими методами оцінювання остаточні судження встановлюються шляхом компромісу, або середньозважено.

4. Парні порівняння

При визначенні рангового місця експерти нерідко зустрічаються зі складністю ідентифікації прояву досліджуваної ознаки та кваліфікації її прояву згідно з градаціями шкали. Такі труднощі особливо характерні для випадків оцінки малодиференційованих ознак (чи є ця людина доброю, розумною, щасливою тощо) або за низької кваліфікації та браку досвіду оцінювання іншої людини у самих експертів. За цих обставин суттєві переваги має метод парного порівняння. Завдання експертів складається з процедур парного порівняння об'єктів за альтернативними ознаками («рухливий-спокійний», «веселий-сумний»). Можливий інший варіант альтернативного розподілу. Тоді уся група піддослідних розподіляється на пари (так, як це робиться у соціометричній таблиці) і визначається, у кого з даної пари досліджувана якість виявляється сильніше. Показником рангового місця даного піддослідного є кількість виборів його у даних всіх експертів. Цей показник може враховувати кількість експертів та об'єктів, а також облічуватись у відсотках. Для такого підрахунку використовують формулу Д. Гілфорда, %:

формула Гілфорда

де В — кількість виборів; n — кількість об'єктів порівняння; N — кількість експертів.

Вибір критерію валідізації є дуже відповідальним етапом конструювання та валідізації тесту. Одним з найскладніших питань є визначення ступеня узагальненості критерію, що підбирається. Чим складнішою є досліджувана психологічна якість, тим ширшим та узагальненішим має бути критерій. Наприклад, при обґрунтуванні тесту загального інтелекту як критерій валідізації можна використати ефективність навчальної, виробничої або наукової діяльності суб'єкта в цілому; при валідізації методики виміру «екстраверсії — інтраверсії» — експертні оцінки таких характеристик особистості, як інтенсивність спілкування, соціальна відповідальність, емоційність та ін. Більш вузькі та часткові критерії вживаються у процедурах обґрунтування тестів, орієнтованих на вимірювання рівня конкретних професійних занять та вмінь — таких, як мануальна спритність, числова пам'ять тощо. Коло вибраних критеріїв щільно узгоджується зі сферою психологічних явищ, що охоплюються тестом, однорідністю (гомогенністю) завдань методик, конкретністю та однозначністю інтерпретації результатів. Чим узагальненішим буде критерій валідізації, тим різноріднішими (гетерогенними) можуть бути завдання тесту, тим багатозначнішою буде інтерпретація результатів тесту.

У реальній практичній діяльності успіх або невдача людини у будь-якій галузі визначається не якимось ізольованим фактором, а цілою низкою поєднаних факторів, які визначають її здібність або нездібність. Через це кожний критерій валідізації за своєю сутністю є багатокомпонентним. Так, під час валідізації тесту інтелекту не слід обмежуватися лише загальними показниками майбутньої діяльності людини. Потрібно також зважити на особливості нахилів, інтенсивність самонавчання, деякі особливості поведінки, склад характеру тощо.

З наведених видів інформації, що становлять критерії валідізації, академічні оцінки переважно вживаються при валідізації тестів інтелекту; виробничі показники у критеріальній діяльності — при валідізації тестів, що застосовуються для професійного відбору та професійної орієнтації; клінічні діагнози та консультації спеціалістів — при обґрунтуванні деяких спеціальних опитувальників, які найчастіше» вживаються у клінічній психодіагностиці; при валідізації опитувальників особистості найчастіше використовують експертні оцінки рис поведінки та емоційно-вольової сфери.

2.2.2. Критеріальна валідність

Під критеріальною валідністю розуміють комплекс характеристик емпіричної валідності, які розкривають міру узгодженості результатів досліджуваного тесту з незалежними критеріями, що відбивають стан вимірюваної психологічної властивості. Критеріальна валідність включає комплекс зв'язків оцінок тесту з поточним станом досліджуваного психологічного явища, а також зв'язок результатів тесту з більш-менш віддаленим станом. В останньому випадку тестові оцінки порівнюють з критеріями валідізації у майбутньому, що характеризують розвиток психологічної особливості через певний проміжок часу після тестування. Таким чином досліджують не тільки наявну діагностичну цінність тесту, а й здатність передбачати перспективи розвитку психологічного феномену. Отже, у межах критеріальної валідності можна виокремити так звану діагностичну (поточну) та прогностичну валідності. У разі характеристики поточної критеріальної валідності вивчення кореляції оцінок тесту з незалежними критеріями здійснюється паралельно з обстеженням. Показники кореляції вказують на ступінь репрезентації провідних факторів досліджуваного психологічного явища у тестових результатах. Прогностична критеріальна валідність може відображати як збіг прогнозу, зробленого на підставі даних тесту, з реальним станом досліджуваного явища через певний час, так і вказувати на інтервал часу, у якому прогноз тесту може вважатися валідним і науково обґрунтованим.

Специфічні якості поточної та прогностичної валідності ми розглядатимемо далі, а зараз буде доцільним, на наш погляд, спинитися на найтиповіших підходах до вивчення критеріальної валідності.

Найефективніші результати має критеріальна валідізація, що здійснюється за методом контрастних груп, який полягає у використанні складного гіпотетичного критерію, у якому відбивається комплексний вплив множини факторів. Наприклад, у випадку валідізації тесту інтелекту тестові оцінки дітей з відставанням у розумовому розвитку можуть збігатися з такими самими показниками нормальних школярів цього ж віку. Множина факторів, що зумовлює перехід дитини до спеціального навчального закладу для осіб з недостатнім психічним розвитком (комплексний гіпотетичний фактор), саме і є критерієм валідізації. Аналогічно критеріальна валідність опитувальника особистості для вимірювання «рівня невротизації» визначається на підставі порівняння результатів виміру у пацієнтів, що хворіють на неврози, та практично здорових. Тут гіпотетичним фактором виступає множина якостей, що зумовлює захворювання неврозами. Комплексність підходу до характеристики критеріальної валідності методом контрастних груп, підібраних на основі гіпотетичного фактору, наближає цю процедуру до визначення конструктної валідності (див. розділ 2.2.3).

З точки зору практичної валідізації тесту ефективнішим є зіставлення результатів тесту з частковими критеріальними мірами найсуттєвіших елементів досліджуваної діяльності або властивості. Так, тест визначення професійних здібностей конторського службовця може включати аналіз грамотності письма, арифметичних вмінь, комбінаторного мислення, навичок ділового спілкування, здібностей ведення ділової документації тощо. Валідність такого складного за характером завдань тесту може бути визначена за допомогою розглянутого раніше критерію гіпотетичної «успішності трудової діяльності». Більш точним та правильним при визначенні валідності буде порівняння результатів тесту з критеріальними мірами часткових здібностей. Інформація про поточну або прогностичну валідність, що визначається за допомогою часткового критерію, становить характеристику так званої синтетичної валідності. Процес синтетичної валідізації складається з детального аналізу тестованої діяльності з метою виявлення її суттєвих складових, визначення питомої ваги кожного з елементів у комплексному гіпотетичному критерії діяльності. Такий підхід дає змогу застосувати не лише кореляційний статистичний аналіз, а й більш складні та інформативні засоби факторного та регресивного аналізів.

Критеріальна валідізація тесту може здійснюватись на базі критерію, що відбиває стан досліджуваної якості у минулому (ретроспективна валідізація). За допомогою такого прийому показники тесту інтелекту можуть зіставлятися з критеріальними відомостями ще за часів дитинства (інформація від батьків про особливості психічного розвитку дитини, характеристики поведінки, академічні оцінки у початковій школі тощо). У цьому разі можна з певними припущеннями прийняти гіпотезу: якщо людина змалку розвивалася успішно,то і в наступні роки психічний розвиток її буде дещо випереджати середні показники. Зауважимо: завдяки певному суб'єктивізму ретроспективних оцінок такий засіб валідізації є допоміжним і вживається у випадках недостатності валідізації тесту за поточним або прогностичним критерієм.

Отже, суть критеріальної валідності поєднує дві групи відомостей про тест: характер та міру зв'язку показників методики з наявним станом досліджуваної якості і прогноз цього зв'язку на майбутнє. Існують певні особливості у розумінні та визначенні цих двох видів критеріальної валідності. Спинимося на них докладніше.

Поточна (діагностична, конкурентна) валідність. У широкому розумінні поточна валідність означає здатність тесту розрізняти піддослідних на тлі якоїсь діагностичної ознаки, що становить об'єкт дослідження у даній методиці (наприклад, згідно з рівнем загальних здібностей, навичок вербального інтелекту, рівнем досягнень, екстраверсії тощо). Завдяки цьому серед термінів, що є синонімами поточної валідності, є й визначення її як діагностичної.

У вужчому значенні поточна валідність — це встановлення співвідношення між показником тесту, що валідізується, та незалежним критерієм, що відбиває стан досліджуваного феномену відповідно до часу, коли проводилося тестування.

Своєрідним показником, що розкриває суть поточної валідності, є добірка відомостей про те, наскільки зручнішим та економічнішим є наявний тест у поріїчянні з інформацією про досліджувану якість, яка отримана від інших джерел (спостереження, аналіз об'єктивних даних, контрольні іспити, експертне оцінювання тощо). На цю властивість поточної валідності саме і вказує термін «конкурентна валідність». Конкуренція полягає у тому, що завдяки показникам діагностичної валідності вирішується питання: що може бути простішим і доцільнішим — провести обстеження членів бригади за допомогою тесту професійних досягнень чи проаналізувати традиційні показники — такі, як якість роботи, задоволеність, плинність кадрів тощо.

Критерій поточної валідності — один з провідних у характеристиці валідності будь-якої психодіагностичної методики, але найвищі вимоги до поточної валідності ставляться у клінічних тестах, орієнтованих на уточнення диференціального діагнозу, скрінінгових методик для попереднього відсіву виборок піддослідних, тестів досягнень, методик для виміру загальних та спеціальних здібностей. Провідним засобом визначення діагностичної валідності і досі лишається метод контрастних груп з подальшим статистичним аналізом ступеня збіжності результатів тест; з поточним незалежним критерієм.

Прогностична валідність. Прогностична валідність — комплекс інформації про методику, що розкриває ступінь точності та обґрунтованості судження про стан психічної властивості, котра діагностується, на основі результатів тесту через певний час після виміру. Прогностична валідність відображає інтервал часу, на який залишається дійсним судження про стан психологічної властивості, винесене на підставі аналізу показників тесту. Відомості про прогностичну валідність мають безпосереднє відношення до розкриття передбачуваної потенції методики, закономірностей екстраполяції результатів обстеження на майбутнє.

Як критерій валідізації при визначенні прогностичної валідності можуть вживатися показники поведінки та здібностей людини, зсунуті у часі відносно терміну тестування. При порівнянні прогностичної та поточної валідності слід брати до уваги те, що поряд із збіжністю принципів критеріальних зіставлень у першому та другому випадках аналіз прогностичних характеристик тесту є набагато складнішою проблемою. Точність прогнозу, що робиться на підставі тестових результатів, має обернену залежність до терміну прогнозування. Обґрунтування віддаленої екстраполяції даних тесту потребує врахування значно більшої кількості факторів, ніж при кваліфікації діагностичної сили тесту. До того ж під час терміну, що задається для валідізації, ці фактори можуть інтенсивно змінюватися, перебіг їх змін може підпасти під вікові особливості розвитку психічних явищ.

З надзвичайно великими труднощами пов'язане визначення прогностичної валідності для тестів, що орієнтовані на вимірювання комплексних властивостей та видів діяльності, складних психологічних конструктів — таких, як загальні здібності, інтегративні риси особистості, рівні досягнень у навчальній та професійній діяльності тощо. Розвиток цих психологічних властивостей, що великою мірою залежить від набутих знань та навичок, може докорінно змінюватись залежно від обставин життя та діяльності індивіду. Особливу проблему являє собою прогноз діяльності, що складається з елементів, які перебувають у складній динаміці у віковому розвитку. Так, при прогнозуванні досягнень в оволодінні читанням на перших етапах навчання провідним показником є швидкість читання. З поліпшенням навички читання головною характеристикою стає рівень розуміння тексту, розвиток якого стає домінуючим у навчанні. З цього моменту методика, що грунтується лише на темпових показниках, втрачає прогностичне значення, оскільки базується на вже пройдених щаблях розвитку діяльності.

У випадках діагностики ефективності навчання у молодших школярів у комплексі показників, на які може спиратися прогноз, неабияке місце посідає механічна пам'ять. У старших класах прогностичне значення цього показника помітно знижується, поступаючись організованій за змістом пам'яті, аналітичному засвоєнню знань. Наведені приклади вказують на необхідність поглибленого аналізу психологічних конструктів, що лежать в основі тестів, розуміння їх розвитку, чіткої уяви про значення показників, що вивчаються, для майбутньої критеріальної діяльності. Необхідність такого аналізу також наближує процедуру визначення прогностичної валідності до аналізу валідності конструктної.

При віддаленому критеріальному зіставленні існує ризик одержати неадекватну уяву про прогностичну валідність, якщо при повторній критеріалізації вживатиметься застарілий критерій. Так, об'єктивний показник професійної діяльності на час віддаленого зіставлення може виявитися надто простим. Наприклад, тест досягнень при аналізі його діагностичної валідності зіставлявся з успішністю виконання найпростішої виробничої операції, яку з тією чи іншою мірою успішності виконувала на початку освоєння професії уся група піддослідних з вибірки валідізації. Якщо під час віддаленої валідізації ми зіставлятимемо результати тестування при прийомі на навчання з показниками виконання роботи після певної професійної підготовки, то початкова операція, котра правила за критерій перед навчанням, тепер стане дуже простою, з нею добре справлятимуться майже усі піддослідні з вибірки валідізації. Зрозуміло, що більш правильним буде зіставлення з новим рівнем незалежного критерію. Це дасть надійнішу дисперсію успіхів піддослідних під впливом професійного навчання. Визначення нового, складнішого критерію може базуватися на дослідженні статистичного розподілу показників критерію під час віддаленої валідізації. Так, за аналізу діагностичної валідності ми можемо взяти за критерій завдання, з яким успішно справляється, наприклад, 50% осіб з вибірки. Після навчання ми знову маємо підібрати таке завдання, з яким успішно справляється така саме частка вибірки. Це завдання і буде критерієм для віддаленої прогностичної валідізації.

У ряді випадків поточна валідність може заміняти деякою мірою валідність прогностичну. Іноді буває невигідним надто затягувати валідізацію, вивчаючи віддалені критеріальні міри досліджуваної психологічної властивості на одній вибірці валідізації. Для прискорення процедури валідізації тест може бути наведений з групою, для якої вже є критеріальні дані. Наприклад, дані обстеження студентів можуть порівнюватись з їх академічною успішністю, дані тестування службовців — з їх успіхами на виробництві. У окремих випадках для швидкого отримання відомостей про прогностичну якість тесту можна вдатися до процедури ретроспективної валідізації.

Одним з найнадійніших засобів збору відомостей про прогностичні можливості тесту є метод «когорт». Розглянемо цей підхід на прикладі. Перед тестологом стоїть завдання — перевірити якою мірою результати тесту для вивчення деяких аспектів емоційних станів у хворих є прогностичними щодо імовірності виникнення у них психосоматичних захворювань, тобто чи дозволяє певний результат тесту міркувати про підвищений ризик виникнення такої хвороби. Для цього підбирається група осіб з певним запасом, враховуючи імовірний обсяг контрастних груп у майбутньому. З епідеміологічних даних, наприклад, стає відомим, що протягом трьох років з 1000 може захворіти 57 осіб. Це означає, що превентивною діагностикою мас бути охоплено близько 2000 піддослідних для того, щоб отримати чисельність групи захворівших приблизно зі 100 чол. Прогностичні можливості тесту у такому разі будуть підтверджуватись, виходячи з достеменності кількісної та якісної різниці у результатах тесту, що проводив під час набору «когорт» у тих, хто захворів, та здорових.

Визначення прогностичної валідності є обов'язковим на предмет правильного використання та інтерпретації тесту. Природно, найбільше значення критерій прогностичної валідності має для методик прямо чи опосередковано націлених на передбачення розвитку того чи іншого психологічного конструкту, виду діяльності. До таких передусім можна віднести тести загальних здібностей, профорієнтаційні методики, тести відбору тощо.

Важливість показників прогностичної валідності для аналізу тестових процедур, призначених для здійснення професійного відбору, підсилюється введенням спеціального терміну інкрементної валідності. Цей показник прогностичної валідності дає інформацію про те, наскільки більшою є імовірність правильного вибору на тлі результатів тесту у порівнянні з випадковим вибором або вибором, що здійснюється на підставі традиційних засобів (аналіз документів особистої справи, бесіди, контрольних іспитів тощо).

Розгляд питання про критеріальну валідність необхідно доповнити досить суттєвим аспектом критеріального зіставлення. Мається на увазі так звана контамінація критерію — комплекс явищ, пов'язаних з впливом відомостей про результати психодіагностичного обстеження піддослідного на суб'єктивне ставлення до нього з боку інших осіб. Так, якщо педагогу стає відомо, що учень недостатньо успішно виконав завдання тесту досягнень з окремого навчального предмета (що здебільшого свідчить про недостатнє опанування окремих розділів програми), це може вплинути на експертну оцінку навчальної діяльності цього учня взагалі. Вплив контамінації критерію буде тим більшим, чим більшим авторитетом і довірою користується ця методика у суб'єктів психодіагностичної інформації (див. далі розділ «Очевидна валідність»). Чималу роль у прояві контамінації критерію відіграє наявність певних очікувань та міркувань, що сформувались з тієї чи іншої причини у експертів щодо загальних здібностей, успішності навчальної та професійної діяльності тестованої особи.

Явище контамінації критерію може відігравати негативну роль у будь-яких сферах психодіагностичних досліджень. Наявність цього феномену підкреслює необхідність дотримання норм етики у психодіагностичних дослідженнях. При проведенні критеріального контролю, що базується на суб'єктивних оцінках якостей піддослідного з вибірки валідізації, необхідно дотримуватися обов'язкового правила: відомості про результати психологічного обстеження мають бути невідомими не тільки експертам, а й фахівцю-психологу, який збирає експертну інформацію.

2.2.3. Конструктна валідність

Один з провідних типів валідності, що відображає ступінь репрезентації в результатах тесту досліджуваного за допомогою певного теоретичного конструкту — це конструктна валідність. Під конструктом розуміється якийсь синтетичний фактор особистості, поведінки, здібностей тощо. Як психологічний конструкт можуть виступати: практичний або вербальний інтелект, емоційна несталість, інтроверсія, розуміння мови, нестійкість уваги тощо. Іншими словами, у процесі характеристики конструктної валідності визначається, яка галузь теоретичної структури психологічних феноменів вимірюється за допомогою тестів.

Оскільки прояви конструктів в поведінці та діяльності людини різноманітні і не обов'язково пов'язані з певною якістю, встановлення конструктної валідності є ширшою та не такою конкретно визначеною з боку засобів вирішення проблеми процедурою, як характеристика конструктної валідності та валідності змісту. Для пояснення зв'язку отриманих за допомогою тесту результатів з теоретичним конструктом, як правило, доводиться поступово нагромаджувати інформацію про природу тестових результатів. При цьому використовується найширший набір даних, які характеризують психологічну сутність, динаміку вимірюваної властивості, її збіжності та відмінності від інших психологічних феноменів.

Серед конкретних методів характеристики конструктної валідності передусім треба вказати на зіставлення досліджуваного на предмет конструктної валідності тесту з іншими методиками, конструктне навантаження яких відомо. Кореляція між новим та аналогічним за конструктом відомим тестом розглядається як показник того, що розроблюваний тест вимірює приблизно ту саму сферу поведінки, здібностей, психологічних якостей, що й еталонна методика. Така процедура валідізації нагадує визначення критеріальної валідності, якщо вважати, що еталонний тест виступає як незалежний критерій.

Безпосереднє відношення до визначення конструктної валідності має факторний аналіз, який дозволяє статистично виявити структуру зв'язків показників досліджуваного тесту з іншими або ще нез'ясованими факторами, з'ясувати загальні та специфічні для групи зіставлюваних тестів факторів та міру їх наявності у результатах (тобто встановити факторний склад та факторні навантаження результатів тесту). Виняткова важливість такої процедури дає підстави для виділення її в особливий різновид конструктної валідності — факторну валідність.

Важливим аспектом конструктної валідності є внутрішня узгодженість, що визначає, наскільки окремі пункти (завдання, питання), що складають матеріал тесту, підпорядковані основній спрямованості тесту як цілого, орієнтовані на діагностику одних і тих самих конструктів. Аналіз внутрішньої узгодженості здійснюється шляхом корелювання відповідей на кожне завдання з загальним результатом тесту. Зауважимо, що критерій внутрішньої узгодженості вказує лише на міру зв'язку усього контексту методики з якимось невідомим конструктом, не даючи інформації про те, яка саме природа цієї вимірюваної особливості.

У комплекс відомостей про конструктну валідність методики входять і дані, що традиційно належать до сфери критеріальної валідності та валідності змісту. Так, критерії, які вживаються при валідізації, містять суттєву інформацію для розкриття поведінки, якості здібності, що подані у тесті у вигляді конструкту. Зв'язок з практичними формами діяльності, імовірність прогнозу реальної поведінки також надзвичайно важливі для характеристики конструктної валідності. Однак конструктна валідність посідає якісно вищий щабель у кваліфікації тесту через те, що вона характеризує область вимірюваної поведінки у широких психологічних категоріях. Завдяки даним конструктної валідності ми маємо змогу з науково обґрунтованих позицій інтерпретувати результати тесту, їх дисперсію, а також встановити діагноз, вводячи вимірювану якість у систему психологічних категорій.

Нагальна необхідність поглибленого аналізу психологічного конструкту може бути проілюстрована на прикладі двох популярних опитувальників, а саме Шкали проявів тривоги Ж.Тейлора (MAS) та особистісного опитувальника Х.Айзенка (ЕРІ). Корелятивні дослідження вказують на те, що Шкала MAS додатньо корелює зі шкалою «нейротизму» опитувальника ЕРІ і від'ємно зі шкалою екстраверсії. З точки зору концепції Айзенка, ці дані можна трактувати як засвідчення низької валідності Шкали MAS: «тривожність» корелює не тільки з релевантним фактором нейротизму, а й з ірелевантним фактором інтроверсії. Таким чином, Шкала MAS є просто нечутливою до особливого різновиду «нейротизму» — тривожності екстравертів. З питань Шкали виключені висловлення, у яких могла б виявитись тривожність екстравертів. Зважаючи на теоретичний зміст, який приписується показникам MAS К.Спенсом та Ж.Тейлор, ця ситуація цілком закономірна і аж ніяк не є артефактом. За К.Спенсом, який намагався перенести на людську поведінку теорію навчання Халла, MAS вимірює загальний рівень драйва — неспеціалізованого потягу, який якраз і досягає максимуму при збіжності нейротизму (специфічна активація за Айзенком) та інтроверсії (неспецифічна активація). Отже, як бачимо, назва тесту далеко не завжди повністю відбиває теоретичний статус вимірюваного конструкту. У даному прикладі особливо підкреслюється роль психологічної теорії, яка лежить в основі методики у розкритті змісту показників, що діагностуються за її допомогою.

Одним з типових прийомів аналізу конструктної валідності тестів загальних здібностей є характеристика вікової диференціації результатів тесту, що відбиває динаміку змін розглядуваного за допомогою тесту критерію залежно від віку піддослідних. Аналіз конструктної валідності реалізується через визначення міри відповідності результатів тесту теоретично очікуваними та практично спостережуваним віковим змінам досліджуваного конструкту. Якщо у групі піддослідних з вибірки валідізації спостерігатиметься прогресивне збільшення показників, що за своїми параметрами наближаються до відомої швидкості розвитку властивості інтелекту, яка вимірюються даним тестом, то це є певною мірою підтвердженням того, що тест спрямований на дослідження означеної властивості інтелекту.

Визначення конструктної валідності за методом вікової диференціації набуло найбільшого значення при валідізації тестів, розроблених для виміру психологічних властивостей та функцій, які відрізняються відносно швидкою зміною під впливом індивідуального досвіду, а також помітною ієрархічністю ступенів розвитку (обізнаність, навички, інтелектуальні операції тощо). З огляду на це метод вікової диференціації стає чи не найголовнішими оцінним критерієм валідації тестів інтелекту, особливо призначених для дитячого віку. У таких методиках закономірне підвищення результатів виконання завдань тесту у кожній наступній віковій групі є основним психометричним принципом діагностики, базою для утворення психометричної шкали. Через характеристику ступеня точності визначення вікових етапів розвитку досліджуваних конструктів простежуються зв'язок методу вікової диференціації з методом визначення діагностичної валідності. Аналіз вікової диференціації має суттєве значення і для методик, що використовують у клінічній психодіагностиці з метою диференціальної діагностики вікових та патологічних змін, а також для обстеження осіб похилого віку.

У деяких випадках критерій вікової диференціації відбиває зв'язок з прогностичною валідністю методики. Наявність високих показників за критерієм вікової диференціації, які означають стабільну зміну досліджуваних властивостей при переході від однієї вікової групи до іншої, підвищує точність індивідуального прогнозу.

Слід, однак, брати до уваги, що за критеріальної валідізації, як правило, існує потреба у високому ступені кореляції між показниками тесту та критерієм валідізації, тоді як за аналізу конструктної валідності високий ступінь зв'язку результатів контрольованого та еталонного тестів зовсім не обов'язковий. Якщо ж новий та еталонний тести практично ідентичні за складом і конструктним навантаженням, а також якщо новий тест не є компактнішим та економнішим, це буде засвідчувати тільки дублювання методики, що виправдане лише з точки зору потреб складання паралельних форм або модифікування тесту. Зміст процедури конструктної валідізації полягає в установленні як збіжності, так і відмінності досліджуваного комплексу психологічних феноменів у порівнянні з еталонним тестом.

При аналізі конструктної валідності методики формулюється низка гіпотез щодо того, як буде корелювати розроблюваний тест з широким колом інших методик, які орієнтовані на вимірювання конструктів, що знаходяться у теоретично відомій або передбачуваній кореляції з властивостями, які вимірює контрольований тест. При цьому приймаються до уваги результати тестів не тільки таких, що мають відношення до даного конструкту, а й будь-яких інших. Так, якщо на результати тесту інтелекту абсолютно не впливають показники вимірювання емоційних станів, контрольований тест досліджує «чисті» властивості інтелекту, відносно вільні від впливу емоційно-вольових факторів. Порівняння еталонного та контрольованого тесту може здійснюватися за процедур конвергентної (перевірки ступеня прояву прямого чи зворотного зв'язку результатів тесту) та дискримінантної (встановлення відсутності зв'язку) валідізації. Завдяки прийому підтвердження або відхилення гіпотез про характер зв'язку контрольованого тесту з еталонним у психологічній діагностиці іноді конструктна валідність термінологічно позначається як «передбачена» валідність (assumed validity).

  Начало