Правила ранжирования. Ограничения критерия U

Пример

Ограничения критерия U

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 n 2 ≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 n 2 ≤60. Однако уже при n 1 n 2 >20 ранжирование становиться достаточно трудоемким.

На наш взгляд, в случае, если n 1 n 2 >20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбина­ции с критерием λ, позволяющим выявить критическую точку, в кото­рой накапливаются максимальные различия между двумя сопоставляе­мыми выборками (см. п. 5.4). .Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим.

Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального ин­теллекта. С помощью критерия Q Розенбаума мы в предыдущем па­раграфе смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот резуль­тат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 2.3.

Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?

Таблица 2.3

Индивидуальные значения невербального интеллекта в выборках студентов физического (щ=\4) и психологического (п2 = 12) факультетов

Студенты-физики Студенты-психологи
Код имени испытуемого Код имени испытуемого Показатель невербального интеллекта
1. И.А. 1. Н.Т. ИЗ
2. К.А. 2. О.В.
3. К.Е. 3. Е.В.
4. П.А. 4. Ф.О.
5. С.А. 5. И.Н.
6. Ст.А. 6. И.Ч.
7. Т.А. 7. И.В.
8. Ф.А. 8. К.О.
9. Ч.И. 9. P.P.
10. ЦА. 10. Р.И.
11. См.А. 11. O.K.
12. К.Ан. 12. Н.К.
13. Б.Л.
14. Ф.В.

Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.

1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.



Наибольшему значению начисляется ранг, соответствующий количе­ству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех слу­чаев, которые предусмотрены правилом 2.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.

Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получа­ет средний ранг:

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:

3. Общая сумма рангов должна совпадать с расчетной, которая опре­деляется по формуле:

где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельст­вовать об ошибке, допущенной при начислении рангов или их сум­мировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

При подсчете критерия U легче всего сразу приучить себя дейст­вовать по строгому алгоритму.

АЛГОРИТМ 4 Подсчет критерия U Манна-Уитни. 1. Перенести все данные испытуемых на индивидуальные карточки. 2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например синим. 3. Разложить все карточки в единый ряд по степени нарастания при­знака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой. 4. Проранжировать значения на карточках, приписывая меньшему зна­чению меньший ранг. Всего рангов получится столько, сколько у нас (n 1 +п 2). 5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд, синие - в другой. 6. Подсчитать сумму рангов отдельно на красных карточках (выборка 1) и на синих карточках (выборка 2). Проверить, совпадает ли об­щая сумма рангов с расчетной. 7. Определить большую из двух ранговых сумм. 8. Определить значение U по формуле: где n 1 - количество испытуемых в выборке 1; n 2 - количество испытуемых в выборке 2; Т х - большая из двух ранговых сумм; n х - количество испытуемых в группе с большей суммой рангов. 9. Определить критические значения U по Табл. II Приложения 1. Если U эмп.>U к p 005 , Н о принимается. Если U эмп U к p _ 005 , Н о от­вергается. Чем меньше значенияU, тем достоверность различий выше.

Теперь проделаем всю эту работу на материале данного примера. В результате работы по 1-6 шагам алгоритма построим таблицу.

Таблица 2.4

Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов

Ads by OffersWizardAd Options

Студенты-физики (n 1 =14) Студенты-психологи (n 2 =12)
Показатель невербального интеллекта Ранг Показатель невербального интеллекта Ранг
20,5
20,5
15,5 15.5
14"
11.5 11,5
11,5
11,5
6.5 6,5
4,5 4,5
Суммы
Средние 107,2 111,5

Общая сумма рангов: 165+186=351. Расчетная сумма:

Равенство реальной и расчетной сумм соблюдено.

Мы видим, что по уровню невербального интеллекта более "высоким" рядом оказывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186.

Теперь мы готовы сформулировать гипотезы:

H 0: Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.

Н 1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпи­рическую величину U:

Поскольку в нашем случае п\Фп2, подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей п х:

По Табл. II Приложения 1 определяем критические значения для n 1 =14, n 2 =12.

Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если U эмп U к p

Построим "ось значимости".

U эмп = 60

U эмп > U к p

Ответ: H 0 принимается. Группа студентов-психологов не превос­ходит группы студентов-физиков по уровню невербального интеллекта.

Обратим внимание на то, что для данного случая критерий Q Розенбаума неприменим, так как размах вариативности в группе физи­ков шире, чем в группе психологов: и самое высокое, и самое низкое значение невербального интеллекта приходится на группу физиков (см. Табл. 2.4).

Ранжирование данных, то есть присваивание рангов элементам упорядоченного списка, происходит по определённым правилам.

Сначала вы определяете направление ранжирования – от большего к меньшему или от меньшего к большему.

Выбор направления ранжирования осуществляется в соответствии с целью проводимого исследования. Если вы хотите проранжировать результаты решения творческих задач, то на первое место оптимальнее поставить лучший результат, на второе – лучший из оставшихся и т.д. Таким образом, будет осуществляться ранжировка по убыванию результатов (набранных баллов при решении творческих задач).

Если вы ранжируете результаты диагностики уровня внимания (например, полученные с помощью корректурной пробы), то лучшим результатом будет отсутствие ошибок (или их минимальное число, если в выборке нет безошибочного варианта). Выбрав самое меньшее число ошибок, вы присваиваете этому результату ранг 1, затем из оставшихся выбираете результат с минимальным количеством ошибок, присваиваете ему ранг 2 и т.д. Таким образом, получится ранжирование по возрастанию ошибок (хотя с точки зрения результатов – тоже по убыванию).

Выбрав направление ранжирования, вы приступаете к осуществлению его процедуры – каждому числовому значению присваиваете ранг, то есть место в упорядоченном перечне.

Например, вы хотите проранжировать по убыванию результаты теста интеллекта. В выборке 11 человек полученные баллы колеблются от 98 до 127 (таблица 1).

Ранжирование результатов диагностики интеллекта Таблица 1

Поскольку выбрано направление ранжирования от большего к меньшему (чтобы более высокие ранги были присвоены лучшим результатам), то нужно найти самое большое значение (лучший результат) и присвоить ему ранг 1. В нашем случае это 127. Напротив его мы указываем ранг 1. Затем выбираем максимальный результат из оставшихся – 120 – и присваиваем ему ранг 2. Следующее значение 119 получает ранг 3. Результату 118 приписываем ранг 4 и так далее. Полностью результаты ранжирования представлены в таблице 1.

Если встречаются совпадающие результаты, например, несколько человек получили одинаковые баллы (таблица 2), то процедура ранжирования осуществляется следующем образом: выбрав направление ранжирования (предположим, по возрастанию) определяете число, соответствующее 1 рангу.

Ранжирование результатов диагностики интеллекта Таблица 2

В соответствии с выбранным направлением (по возрастанию) выбираем наименьший результат (104) и присваиваем ему ранг 1. Затем выбираем наименьшее значение из оставшихся. Это 105, но этих значений два. Если бы одно из них было 105, а другое 106, то мы присвоили бы им ранги 2 и 3 соответственно. Но в случае одинаковых значений мы не можем присвоить им разные ранги. Поэтому поступаем следующим образом: те ранги, которые были бы присвоены, будь значения различными, назовем активными. В нашем случае это ранги 2 и 3. Активные ранги усредняются и одинаковые значения получают усреднённый ранг. Таким образом,

правило ранжирования одинаковых результатов: одинаковые значения получают совпадающие ранги, представляющие собой усреднённые «активные» ранги.

Усредненный ранг (2+3):2=2,5 присваивается двум значениям 105. Следующее значение 109, оно получает ранг 4. Особое внимание следует уделить на то, что после усреднённого ранга 2,5 можно ошибочно приписать следующему значению ранг 3. Но ранг 3 мы уже использовали при подсчёте усреднённого ранга. Поэтому ранжирование продолжается со следующего по порядку значения, в нашем случае это 4. Результат в 111 баллов получает ранг 5. Следующее значение 112, но в выборке 3 таких значения. Их активные ранги 6, 7 и 8. Усредненный ранг (6+7+8): 3=7. Таким образом, все значения 112 получают ранг 7, а продолжаем ранжирование с ранга 9 (следующего за наибольшим активным рангом). Этот ранг приписывается значению 118, значение 119 получает ранг 10, 121 – ранг 11, 127 – ранг 12, 128 – ранг 13, 129 – ранг 14, 130 – ранг 15 (таблица 2).

Чтобы проверить, не допущена ли ошибка, можно сложить приписанные нами ранги и сравнить с суммой порядковых номеров (совпадающей с суммой рангов без сходных значений). Сумма порядковых номеров равна 120:

Сумма проставленных нами рангов также равна 120:

Следовательно, ранжирование проведено верно.

А. Ранжирование качественных признаков

Пример 1.

Испытуемому предлагается задание, в котором семь личностных качеств необходимо упорядочить (проранжировать) в двух столбцах: в левом столбце в соответствии с особенностями его «Я реального», а в правом столбце в соответствии с особенностями его «Я идеального». Результаты ранжирования даны в таблице 2.

Таблица 2.

Я реальное

Качества личности

Я идеальное

ответственность

общительность

настойчивость

энергичность

жизнерадостность

терпеливость

решительность

Б. Ранжирование количественных признаков

Пример 2.

В результате диагностики невроза у пяти испытуемых по методике К.Хека и Х. Хесса были получены следующие баллы: 24, 25, 37, 13, 12. Этому ряду чисел можно проставить ранги двумя способами:

    большему числу в ряду ставится больший ранг, в этом случае получится: 3, 4, 5, 2, 1;

    большему числу в ряду ставится меньший ранг: в этом случае получится: 3, 2, 1, 4, 5.

4.2. Проверка правильности ранжирования

А. Формула для подсчета суммы рангов по столбцу (строчке)

Если ранжируется N чисел, то сумма рангов расчитывается по формуле (1.1):

1+2+3+...+N =N(N+ 1)/2 (1.1)

В случае примера 1 число ранжируемых признаков было равно N =7, поэтому сумма рангов, подсчитанная по формуле (1.1), должна равняться 7(7+1)/2=28.

Сложим величины рангов отдельно для левого и правого столбца таблицы:

7 + 1 + 3+ 2 + 5 + 4 + 6 = 28 - для левого столбца и

1 + 5+ 7+ 6 + 4 + 3 + 2 = 28 - для правого столбца.

Суммы рангов совпали.

Б. Формула для расчета суммы рангов в таблице

Ранжирование по столбцам.

Пример 3. Результаты тестирования двух групп испытуемых по 5 человек в каждой по методике дифференциальной диагностики депрессивных состояний В. А. Жмурова представлены в таблице 3.

Таблица 3.

Номер испытуемого

Задача: проранжировать обе группы испытуемых как одну, т. е. объединить выборки и проставить ранги объединенной выборке, сохраняя, однако различие между группами. Сделаем это в таблице 4, причем так, что максимальной величине будем ставить минимальный ранг.

Таблица 4.

Номер испытеумого

Поскольку у нас получены суммы ранга по столбцам, то общую сумму рангов можно получить, сложив эти суммы: 31+24= 55.

Чтобы применить формулу (1.1), нужно подсчитать общее количество испытуемых - это 5+5=10.

Тогда по формуле (1.1) получаем: 10(10+1)/2=55.

Ранжирование прведено правильно.

Если в таблице имеется большое число строк и столбцов, то можно использовать модификацию формулы (1.1)

Сумма рангов в таблице

= (kc+1)kc/2 , (1.2)

где k - число строк, с - число столбцов.

Вычислим сумму рангов по формуле (1.2.) для нашего примера. В таблице 2 имеется 5 строк и 2 столбца, сумма рангов = ((5·2+1)·5·2)/2=55

Ранжирование по строкам

Пример 4.

Таблица 5. Проведем ранжирование по строчкам.

Номер испытуемого

Суммы по столбцам

В этой таблице минимальному по величине числу ставится минимальный ранг. Сумма рангов по каждой строчке должна быть равна 6, поскольку у нас ранжируется три величины: 1+2+3= 6. В нашем случае так оно и есть. Теперь просуммируем ранги по каждому столбцу отдельно и сложим их.

Расчетная формула общей суммы рангов для ранжирования по строчкам для таблицы определяется по формуле:

Сумма рангов = nc(c+1)/2, (1.3.)

где n – количество испытуемых в столбце, с - количество столбцов (групп).

Проверим правильность ранжирования для нашего примера.

Реальная сумма рангов в таблице 8+10+12= 30

По формуле (1.3): 5·3·(3+1)/2=30.

Следовательно, ранжирование проведено правильно.

Случай одинаковых рангов

Ранжирование качественных признаков

А. Ранжирование качественных признаков

Модифицируем пример 1. и перепишем его в табл. 6. Предположим, что при оценке особенностей «Я реального» испытуемый считает, что такие качества, как «настойчи­вость» и «энергичность», должны иметь один и тот же ранг. При проведении ранжирования (столбец 1 табл. 6) этим качествам необходимо проставить мысленные ранги (М.Р.), как числа, обязательно идущие по порядку друг за другом, и от­метить эти ранги круглыми скобками - (). Однако посколь­ку эти качества, по мнению испытуемого, должны иметь одинаковые ранги, то во втором столбце табл. 6, относяще­муся к «Я реальному», следует поместить среднее арифмети­ческое рангов, проставленных в скобках, т.е. (2 + 3)/2 = 2,5. Таким образом, второй столбец табл. 6 и будет окончатель­ным итогом ранжирования особенностей «Я реального», данным испытуемым, а проставленные в этом столбце ран­ги будут носить название - реальные ранги (P.P.).

Аналогично при ранжировании «Я идеального» испыту­емый считает, что такие качества, как «общительность», «энергичность» и «жизнерадостность», должны иметь один и тот же ранг. Тогда при проведении ранжирования (см. столбец 5 табл. 6) этим качествам необходимо проставить мысленные ранги, как числа, обязательно идущие по поряд­ку друг за другом, и отметить эти ранги круглыми скобка­ми - (). Однако поскольку эти качества, по мнению испы­туемого, должны иметь одинаковые ранги - то в четвертом столбце табл. 6, относящемся к «Я идеальному», следует поместить среднее арифметическое рангов, проставленных в скобках, т.е. (4 + 5 + 6)/3 = 5. Таким образом, четвертый столбец таблицы 6 и будет окончательным итогом ранжи­рования особенностей «Я идеального», данным испытуе­мым, а проставленные в этом столбце ранги будут носить название - реальные ранги. Подчеркнем еще раз, что мыс­ленные (условные) ранги, как числа, должны располагаться друг за другом по порядку, несмотря на то что ранжируемые качества в таблице данных не находятся рядом друг с дру­гом.

Таблица 6.

Я реальное

Качества личности

Я идеальное

Ответственность

Общительность

Настойчивость

Энергичность

Жизнерадостность

Терпеливость

Решительность

Обозначения: М.Р. - мысленные, или условные, ранги; P.P. - ре­альные ранги.

Проверим правильность ранжирования во втором столб­це табл. 6, т.е. реальные ранги, относящиеся к «Я реаль­ному»:

1 + 2,5 + 2,5 + 5 + 4 + 6 = 28.

Проверим правильность ранжирования в четвертом столбце табл. 6, т.е. реальные ранги, относящиеся к «Я идеальному»:

1 + 2 + 3 + 5 + 5 + 5 + 7 = 28.

По формуле (1.1) сумма рангов также равняется 28. Сле­довательно, ранжирование проведено правильно.

Б. Ранжирование количественных характеристик (чисел)

Ранжирование чисел рассмотрим на примере.

Пример. Психолог получил у 11 испытуемых следующие значения показателя невербального интеллекта: 113,102,123,122, 117, 117, 102, 108, 114, 102, 104. Необходимо проранжировать эти показатели, и лучше всего это сделать в таблице 7.

Таблица 7

Номер испытуемых

Показатели интеллекта

Мысленные ранги (М.Р.)

Реальные ранги (P.P.)

В примере встретились две группы из равных чисел (102, 102 и 102; 117 и 117), поскольку числа в группах раз­личны, то и скобки, проставленные этим группам чисел, также различны.

Проверим правильность ранжирования по формуле (1.1). Под­ставив исходные значения в формулу, получим: 11·12/2 = 66. Суммируя реальные ранги, получим:

6 + 2 + 11 + 10 + 8,5 + 8,5 + 2 + 5 + 7 + 2 + 4 = 66.

Поскольку суммы совпали, следовательно, ранжирование про­ведено правильно.

Правила ранжирования чисел таковы.

1. Наименьшему (наибольшему) числовому значению приписывается ранг 1.

2. Наибольшему (наименьшему) числовому значению приписывается ранг, равный количеству ранжируемых ве­личин.

3. Одинаковым по величине числам должны проставлять­ся одинаковые ранги.

4. Если в ранжируемом ряду несколько чисел оказались равными, то им приписывается реальный ранг, равный средней арифметической величине тех рангов, которые эти числа получили бы, если бы стояли по порядку друг за дру­гом.

5. Если в ранжируемом ряду имеется две и больше групп равных между собой чисел, то для каждой такой группы применяется правило 4, и мысленные ранги каждой группы заключаются в разные скобки.

6. Общая сумма реальных рангов должна совпадать с расчетной, определяемой по формуле (1.1).

При необходимости ранжирования достаточно большого числа объектов следует объединять их по какому-либо при­знаку в достаточно однородные классы (группы), а затем уже ранжировать полученные классы (группы).

Наиболее часто к измерениям, полученным в ранговой шкале, применяются коэффициенты корреляции Спирмена и Кэндалла, и, кроме того, используются разнообразные критерии различий.

Использование порядковой шкалы позволяет присваивать ранги объектам по какому-либо признаку. Таким образом, метрические значения переводятся в ранговые. При этом фиксируются различия в степени выраженности свойств. В процессе ранжирования следует придерживаться 2 правил.

Правило порядка ранжирования. Надо решить, кто получает первый ранг: объект с самой большей степенью выраженности какого-либо качества или наоборот. Чаще всего это абсолютно безразлично и не отражается на конечном результате. Традиционно принято первый ранг приписывать объектам с большей степенью выраженности качества (большему значению – меньший ранг). Например, чемпиону присуждают первое место, а не наоборот. Хотя, и здесь если бы был принят обратный порядок, то результаты от этого не изменились бы. Так что порядок ранжирования каждый исследователь вправе определять сам. Например, Е. В. Сидоренко рекомендует меньшему значению приписывать меньший ранг. В некоторых случаях это удобнее, но непривычнее.

Например: имеется неупорядоченная выборка, данные которой необходимо проранжировать. {2, 7, 6, 8, 11, 15, 9}. После упорядочивания выборки ранжируем ее.

Метрические данные

Альтернативный вариант:

Метрические данные

Отдельно следует сказать следующее. Существует группа редко используемых непараметрических критериев (Т-критерий Вилкоксона, U-критерий Манна-Уитни,Q-критерий Розенбаума и др.), при работе с которыми всегда надо меньшему значению приписывать меньший ранг.

Правило связанных рангов. Объектам с одинаковой выраженностью свойств приписывается один и тот же ранг. Этот ранг представляет собой среднее значение тех рангов, которые они получили бы, если бы не были равны. Например, надо проранжировать выборку, содержащую ряд одинаковых метрических данных: {4, 5, 9, 2, 6, 5, 9, 7, 5, 12}. После упорядочивания выборки следует вычислить среднее арифметическое значение связанных рангов.

Метрические данные

Предварительное ранжирование

Окончательное ранжирование

Задания для самостоятельной работы.

    Проранжировать выборку по правилу «большему значению – меньший ранг»: {111, 104, 115, 107, 95, 104, 104}.

    Проранжировать выборку по правилу «меньшему значению – меньший ранг» {20, 25, 8, 7, 20, 14, 27}.

    Объединить две предыдущие выборки и провести ранжирование по правилу «большему значению – меньший ранг»

    Показатели каких признаков из Таблицы Iявляются номинативными, каких – метрическими?

    Перевести показатели осведомленности из Таблицы IПриложения в ранговую шкалу. Выделить уровни выраженности показателей посредством их перевода в номинативную шкалу.

      Таблица I Данные для обработки

учащиеся

профиль ВУЗа

осведомленность

скрытые фигуры

пропущенные

арифметика

понятливость

исключение

изображений

аналогии

числовые ряды

умозаключения

геометрическое сложение

заучивание слов

средний IQ

экстраверсия-

интроверсия

нейротизм

средняя отметка

Профиль ВУЗа: 0 - выбор учеником гуманитарного профиля;

1 - выбор учеником математического или естественно-научного профиля


Правила ранжирования

1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.

Наибольшему значению начисляется ранг, соответствующий количе­ству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех слу­чаев, которые предусмотрены правилом 2.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов , которые они получили бы, если бы не были равны.

Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получа­ет средний ранг:

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:

3. Общая сумма рангов должна совпадать с расчетной, которая опре­деляется по формуле:

где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельст­вовать об ошибке, допущенной при начислении рангов или их сум­мировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

При подсчете критерия U легче всего сразу приучить себя дейст­вовать по строгому алгоритму.

АЛГОРИТМ 4

Подсчет критерия U Манна-Уитни.

1. Перенести все данные испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например синим.

3. Разложить все карточки в единый ряд по степени нарастания при­знака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой.

4. Проранжировать значения на карточках, приписывая меньшему зна­чению меньший ранг. Всего рангов получится столько, сколько у нас (n 1 +п 2 ).

5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд , синие - в другой.

7. Определить большую из двух ранговых сумм.

8. Определить значение U по формуле:

где n 1 - количество испытуемых в выборке 1;

n 2 - количество испытуемых в выборке 2;

Т х - большая из двух ранговых сумм;

n х - количество испытуемых в группе с большей суммой рангов.

9. Определить критические значения U по Табл. II Приложения 1. Если U эмп.>U к p 005 , Н о принимается. Если U эмп U к p _ 005 , Н о от­вергается. Чем меньше значения U, тем достоверность различий выше.

Теперь проделаем всю эту работу на материале данного примера. В результате работы по 1-6 шагам алгоритма построим таблицу.

Таблица 2.4

Подсчет ранговых сумм по выборкам студентов физического и психа-логического факультетов



Студенты-физики (n 1 =14)

Студенты-психологи (n 2 =12)

Показатель невербального

интеллекта



Ранг

Показатель невербального

интеллекта



Ранг

127

26

123

25

122

24

117

23

116

22

115

20,5

115

20,5

114

19

113

18

112

17

111

15,5

111

15.5

108

14"

107

11.5

107

11,5

107

11,5

107

11,5

106

9

105

8

104

6.5

104

6,5

102

4,5

102

4,5

99

3

95

2

90

1

Суммы

1501

165

1338

186

Средние

107,2

111,5

Общая сумма рангов: 165+186=351. Расчетная сумма :

Мы видим, что по уровню невербального интеллекта более "высоким" рядом оказывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186.

Теперь мы готовы сформулировать гипотезы:

H 0 : Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.

Н 1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпи­рическую величину U:

Поскольку в нашем случае п\Фп2, подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей п х :

Такую проверку рекомендуется производить в некоторых руководствах (Рунион Р., 1982; Greene J., D"Olivera M., 1989). Для сопоставления с критическим значе­нием выбираем меньшую величину U: U эмп =60.

По Табл. II Приложения 1 определяем критические значения для n 1 =14, n 2 =12.

Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если U эмп U к p

Построим "ось значимости".

U эмп = 60

U эмп > U к p

Ответ: H 0 принимается. Группа студентов-психологов не превос­ходит группы студентов-физиков по уровню невербального интеллекта.

Обратим внимание на то, что для данного случая критерий Q Розенбаума неприменим, так как размах вариативности в группе физи­ков шире, чем в группе психологов: и самое высокое, и самое низкое значение невербального интеллекта приходится на группу физиков (см. Табл. 2.4).


2.4. Н - критерий Крускала-Уоллиса

Назначение критерия

Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.

Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих из­менений.

Описание критерия

Критерий Н иногда рассматривается как непараметрический ана­лог метода дисперсионного однофакторного анализа для несвязных вы­борок (Тюрин Ю. Н., 1978). Иногда его называют критерием "суммы рангов" (Носенко И.А., 1981).

Данный критерий является продолжением критерия U на боль­шее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выбор­ка. Затем все индивидуальные значения возвращаются в свои первона­чальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случай­ны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между вы­борками. Но если в одной из выборок будут преобладать низкие значе­ния рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия.

Гипотезы

H 0 : Между выборками 1, 2, 3 и т. д. существуют лишь случайные раз­личия по уровню исследуемого признака.

Н 1 : Между выборками 1, 2, 3 и т. д. существуют неслучайные разли­чия по уровню исследуемого признака.

Графическое представление критерия Н

Критерий Н оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная об­ласть наложения мала (Рис. 2.6 (а)), то различия достоверны; если она достигает определенной критической величины и превосходит ее (Рис. 2.6 (б)), то различия между выборками оказываются недостоверными.

Рис. 2.6. 2 возможных варианта соотношения рядов значений в трех выборках; штри­ховкой отмечены зоны наложения

Ограничения критерия Н

1. При сопоставлении 3-х выборок допускается, чтобы в одной из них п-Ъ, а двух других n=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (р≤ 0,05).

Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р5~0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по край­ней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.

2. Критические значения критерия Н и соответствующие им уровни значимости приведены в Табл. IV Приложения 1. Таблица преду­смотрена только для трех выборок и { n 1 , n 2 , n 3 } 5.

При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия χ 2 , поскольку критерий Крускала-Уоллиса асимптотически прибли­жается к распределению χ 2 (Носенко И.А., 1981; J. Greene, M. D"Olivera, 1982).

Количество степеней свободы при этом определяется по формуле: V=c-1 где с - количество сопоставляемых выборок.

3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказать­ся стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½·[c ·(c-1)]* 6 таких попарных сопоставлений используется, ес­тественно, критерий для двух выборок, например U или φ* .

АЛГОРИТМ 5 Подсчет критерия Н Крускала-Уоллиса

1. Перенести все показатели испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых группы 1 определенным цветом, например красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым и желтым цветом и т. д. (Можно использо­вать, естественно, и любые другие обозначения.)

3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой.

4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.

5. Вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения.

где N - общее количество испытуемых в объединенной выборке;

Т - суммы рангов по каждой группе.

8а. При количестве групп с=3, n 1 n 2 n 3 ≤5 определить критические значения и со­ответствующий им уровень значимости по Табл. IV Приложения 1.

Если Н эмп равен или превышает критическое значение H 0,05 , H 0 отвергается.

8б. При количестве групп с>3 или количестве испытуемых n 1 n 2 n 3 >5, определить критические значения χ 2 по Табл. IX Приложения 1.

Если Н эмп равен или превышает критическое значение χ 2 , H 0 отвергается.
Воспользуемся этим алгоритмом при решении задачи о неразре­шимых анаграммах. Результаты работы по 1-6 шагам алгоритма пред­ставлены в Табл. 2.6.

Таблица 2.6

Подсчет ранговых сумм по группам испытуемых, работавших над четырьмя неразрешимыми анаграммами



Группа 1: анаграмма

ФОЛИТОЫ (n 1 =4)



Группа 2: анаграмма

КАМУСТО (n 2 =8)



Группа 3: анаграмма

СНЕРАКО (n 3 =6)



Группа 4: анаграмма

ГРУТОСИЛ (n 4 =4)



Длительность

Ранг

Длительность

Ранг

Длительность

Ранг

Длительность

Ранг

60

1

128

2

145

3.5

145

3.5

194

5

210

6

236

7

283

8

385

9

469

10

482

11

720

12

731

13

848

14

905

15

1080

16

1200

17

1678

18

2081

19

2361

20

2416

21

3600

22

Суммы

38,5

82,5

68

64

Средние

9,6

10,3

11,3

16,0

Общая сумма рангов =38,5+82,5+68+64=253. Расчетная сумма рангов:

Равенство реальной и расчетной сумм соблюдено.

Поскольку таблицы критических значений критерия Н преду­смотрены только для количества групп с = 3, а в данном случае у нас 4 группы, придется сопоставлять полученное эмпирическое значение Н с критическими значениями у}. Для этого вначале определим количест­во степеней свободы V для c=4:

v=c- 1 = 4 - 1 = 3

Теперь определим критические значения по Табл. IX Приложе­ния 1 для v =3:

Ответ: Н 0 принимается: 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности по­пыток их решения.