Правила ранжирования. Ограничения критерия U

Пример

Ограничения критерия U

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 n 2 ≥3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 n 2 ≤60. Однако уже при n 1 n 2 >20 ранжирование становиться достаточно трудоемким.

На наш взгляд, в случае, если n 1 n 2 >20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбинации с критерием λ, позволяющим выявить критическую точку, в которой накапливаются максимальные различия между двумя сопоставляемыми выборками (см. п. 5.4). .Формулировка звучит сложно, но сам метод достаточно прост. Каждому исследователю лучше попробовать разные пути и выбрать тот, который кажется ему более подходящим.

Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q Розенбаума мы в предыдущем параграфе смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 2.3.

Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?

Таблица 2.3

Индивидуальные значения невербального интеллекта в выборках студентов физического (щ=\4) и психологического (п2 = 12) факультетов

	Студенты-физики		Студенты-психологи
Код имени испытуемого		Код имени испытуемого	Показатель невербального интеллекта
1.	И.А.		1.	Н.Т.	ИЗ
2.	К.А.		2.	О.В.
3.	К.Е.		3.	Е.В.
4.	П.А.		4.	Ф.О.
5.	С.А.		5.	И.Н.
6.	Ст.А.		6.	И.Ч.
7.	Т.А.		7.	И.В.
8.	Ф.А.		8.	К.О.
9.	Ч.И.		9.	P.P.
10.	ЦА.		10.	Р.И.
11.	См.А.		11.	O.K.
12.	К.Ан.		12.	Н.К.
13.	Б.Л.
14.	Ф.В.

Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.

1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.

Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.

Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг:

Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:

3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:

где N - общее количество ранжируемых наблюдений (значений). Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.

При подсчете критерия U легче всего сразу приучить себя действовать по строгому алгоритму.

АЛГОРИТМ 4 Подсчет критерия U Манна-Уитни. 1. Перенести все данные испытуемых на индивидуальные карточки. 2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например синим. 3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой. 4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Всего рангов получится столько, сколько у нас (n 1 +п 2). 5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд, синие - в другой. 6. Подсчитать сумму рангов отдельно на красных карточках (выборка 1) и на синих карточках (выборка 2). Проверить, совпадает ли общая сумма рангов с расчетной. 7. Определить большую из двух ранговых сумм. 8. Определить значение U по формуле:

где n 1 - количество испытуемых в выборке 1; n 2 - количество испытуемых в выборке 2; Т х - большая из двух ранговых сумм; n х - количество испытуемых в группе с большей суммой рангов. 9. Определить критические значения U по Табл. II Приложения 1. Если U эмп.>U к p 005 , Н о принимается. Если U эмп ≤ U к p _ 005 , Н о отвергается. Чем меньше значенияU, тем достоверность различий выше.

Теперь проделаем всю эту работу на материале данного примера. В результате работы по 1-6 шагам алгоритма построим таблицу.

Таблица 2.4

Подсчет ранговых сумм по выборкам студентов физического и психологического факультетов

Ads by OffersWizardAd Options

Студенты-физики (n 1 =14)	Студенты-психологи (n 2 =12)
Показатель невербального интеллекта	Ранг	Показатель невербального интеллекта	Ранг






	20,5
	20,5



	15,5		15.5
			14"
	11.5		11,5
	11,5
	11,5


	6.5		6,5
	4,5		4,5



Суммы
Средние	107,2		111,5

Общая сумма рангов: 165+186=351. Расчетная сумма:

Равенство реальной и расчетной сумм соблюдено.

Мы видим, что по уровню невербального интеллекта более "высоким" рядом оказывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186.

Теперь мы готовы сформулировать гипотезы:

H 0: Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.

Н 1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпирическую величину U:

Поскольку в нашем случае п\Фп2, подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей п х:

По Табл. II Приложения 1 определяем критические значения для n 1 =14, n 2 =12.

Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если U эмп ≤ U к p

Построим "ось значимости".

U эмп = 60

U эмп > U к p

Ответ: H 0 принимается. Группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.

Обратим внимание на то, что для данного случая критерий Q Розенбаума неприменим, так как размах вариативности в группе физиков шире, чем в группе психологов: и самое высокое, и самое низкое значение невербального интеллекта приходится на группу физиков (см. Табл. 2.4).

Ранжирование данных, то есть присваивание рангов элементам упорядоченного списка, происходит по определённым правилам.

Сначала вы определяете направление ранжирования – от большего к меньшему или от меньшего к большему.

Выбор направления ранжирования осуществляется в соответствии с целью проводимого исследования. Если вы хотите проранжировать результаты решения творческих задач, то на первое место оптимальнее поставить лучший результат, на второе – лучший из оставшихся и т.д. Таким образом, будет осуществляться ранжировка по убыванию результатов (набранных баллов при решении творческих задач).

Если вы ранжируете результаты диагностики уровня внимания (например, полученные с помощью корректурной пробы), то лучшим результатом будет отсутствие ошибок (или их минимальное число, если в выборке нет безошибочного варианта). Выбрав самое меньшее число ошибок, вы присваиваете этому результату ранг 1, затем из оставшихся выбираете результат с минимальным количеством ошибок, присваиваете ему ранг 2 и т.д. Таким образом, получится ранжирование по возрастанию ошибок (хотя с точки зрения результатов – тоже по убыванию).

Выбрав направление ранжирования, вы приступаете к осуществлению его процедуры – каждому числовому значению присваиваете ранг, то есть место в упорядоченном перечне.

Например, вы хотите проранжировать по убыванию результаты теста интеллекта. В выборке 11 человек полученные баллы колеблются от 98 до 127 (таблица 1).

Ранжирование результатов диагностики интеллекта Таблица 1

Поскольку выбрано направление ранжирования от большего к меньшему (чтобы более высокие ранги были присвоены лучшим результатам), то нужно найти самое большое значение (лучший результат) и присвоить ему ранг 1. В нашем случае это 127. Напротив его мы указываем ранг 1. Затем выбираем максимальный результат из оставшихся – 120 – и присваиваем ему ранг 2. Следующее значение 119 получает ранг 3. Результату 118 приписываем ранг 4 и так далее. Полностью результаты ранжирования представлены в таблице 1.

Если встречаются совпадающие результаты, например, несколько человек получили одинаковые баллы (таблица 2), то процедура ранжирования осуществляется следующем образом: выбрав направление ранжирования (предположим, по возрастанию) определяете число, соответствующее 1 рангу.

Ранжирование результатов диагностики интеллекта Таблица 2

В соответствии с выбранным направлением (по возрастанию) выбираем наименьший результат (104) и присваиваем ему ранг 1. Затем выбираем наименьшее значение из оставшихся. Это 105, но этих значений два. Если бы одно из них было 105, а другое 106, то мы присвоили бы им ранги 2 и 3 соответственно. Но в случае одинаковых значений мы не можем присвоить им разные ранги. Поэтому поступаем следующим образом: те ранги, которые были бы присвоены, будь значения различными, назовем активными. В нашем случае это ранги 2 и 3. Активные ранги усредняются и одинаковые значения получают усреднённый ранг. Таким образом,

правило ранжирования одинаковых результатов: одинаковые значения получают совпадающие ранги, представляющие собой усреднённые «активные» ранги.

Усредненный ранг (2+3):2=2,5 присваивается двум значениям 105. Следующее значение 109, оно получает ранг 4. Особое внимание следует уделить на то, что после усреднённого ранга 2,5 можно ошибочно приписать следующему значению ранг 3. Но ранг 3 мы уже использовали при подсчёте усреднённого ранга. Поэтому ранжирование продолжается со следующего по порядку значения, в нашем случае это 4. Результат в 111 баллов получает ранг 5. Следующее значение 112, но в выборке 3 таких значения. Их активные ранги 6, 7 и 8. Усредненный ранг (6+7+8): 3=7. Таким образом, все значения 112 получают ранг 7, а продолжаем ранжирование с ранга 9 (следующего за наибольшим активным рангом). Этот ранг приписывается значению 118, значение 119 получает ранг 10, 121 – ранг 11, 127 – ранг 12, 128 – ранг 13, 129 – ранг 14, 130 – ранг 15 (таблица 2).

Чтобы проверить, не допущена ли ошибка, можно сложить приписанные нами ранги и сравнить с суммой порядковых номеров (совпадающей с суммой рангов без сходных значений). Сумма порядковых номеров равна 120:

Сумма проставленных нами рангов также равна 120:

Следовательно, ранжирование проведено верно.

А. Ранжирование качественных признаков

Пример 1.

Испытуемому предлагается задание, в котором семь личностных качеств необходимо упорядочить (проранжировать) в двух столбцах: в левом столбце в соответствии с особенностями его «Я реального», а в правом столбце в соответствии с особенностями его «Я идеального». Результаты ранжирования даны в таблице 2.

Таблица 2.

Я реальное	Качества личности	Я идеальное
	ответственность
	общительность
	настойчивость
	энергичность
	жизнерадостность
	терпеливость
	решительность

Б. Ранжирование количественных признаков

Пример 2.

В результате диагностики невроза у пяти испытуемых по методике К.Хека и Х. Хесса были получены следующие баллы: 24, 25, 37, 13, 12. Этому ряду чисел можно проставить ранги двумя способами:

большему числу в ряду ставится больший ранг, в этом случае получится: 3, 4, 5, 2, 1;

большему числу в ряду ставится меньший ранг: в этом случае получится: 3, 2, 1, 4, 5.

4.2. Проверка правильности ранжирования

А. Формула для подсчета суммы рангов по столбцу (строчке)

Если ранжируется N чисел, то сумма рангов расчитывается по формуле (1.1):

1+2+3+...+N =N(N+ 1)/2 (1.1)

В случае примера 1 число ранжируемых признаков было равно N =7, поэтому сумма рангов, подсчитанная по формуле (1.1), должна равняться 7(7+1)/2=28.

Сложим величины рангов отдельно для левого и правого столбца таблицы:

7 + 1 + 3+ 2 + 5 + 4 + 6 = 28 - для левого столбца и

1 + 5+ 7+ 6 + 4 + 3 + 2 = 28 - для правого столбца.

Суммы рангов совпали.

Б. Формула для расчета суммы рангов в таблице

Ранжирование по столбцам.

Пример 3. Результаты тестирования двух групп испытуемых по 5 человек в каждой по методике дифференциальной диагностики депрессивных состояний В. А. Жмурова представлены в таблице 3.

Таблица 3.

Номер испытуемого

Задача: проранжировать обе группы испытуемых как одну, т. е. объединить выборки и проставить ранги объединенной выборке, сохраняя, однако различие между группами. Сделаем это в таблице 4, причем так, что максимальной величине будем ставить минимальный ранг.

Таблица 4.

Номер испытеумого

Поскольку у нас получены суммы ранга по столбцам, то общую сумму рангов можно получить, сложив эти суммы: 31+24= 55.

Чтобы применить формулу (1.1), нужно подсчитать общее количество испытуемых - это 5+5=10.

Тогда по формуле (1.1) получаем: 10(10+1)/2=55.

Ранжирование прведено правильно.

Если в таблице имеется большое число строк и столбцов, то можно использовать модификацию формулы (1.1)

Сумма рангов в таблице

= (kc+1)kc/2 , (1.2)

где k - число строк, с - число столбцов.

Вычислим сумму рангов по формуле (1.2.) для нашего примера. В таблице 2 имеется 5 строк и 2 столбца, сумма рангов = ((5·2+1)·5·2)/2=55

Ранжирование по строкам

Пример 4.

Таблица 5. Проведем ранжирование по строчкам.

Номер испытуемого





Суммы по столбцам

В этой таблице минимальному по величине числу ставится минимальный ранг. Сумма рангов по каждой строчке должна быть равна 6, поскольку у нас ранжируется три величины: 1+2+3= 6. В нашем случае так оно и есть. Теперь просуммируем ранги по каждому столбцу отдельно и сложим их.

Расчетная формула общей суммы рангов для ранжирования по строчкам для таблицы определяется по формуле:

Сумма рангов = nc(c+1)/2, (1.3.)

где n – количество испытуемых в столбце, с - количество столбцов (групп).

Проверим правильность ранжирования для нашего примера.

Реальная сумма рангов в таблице 8+10+12= 30

По формуле (1.3): 5·3·(3+1)/2=30.

Следовательно, ранжирование проведено правильно.

Случай одинаковых рангов

Ранжирование качественных признаков

А. Ранжирование качественных признаков

Модифицируем пример 1. и перепишем его в табл. 6. Предположим, что при оценке особенностей «Я реального» испытуемый считает, что такие качества, как «настойчивость» и «энергичность», должны иметь один и тот же ранг. При проведении ранжирования (столбец 1 табл. 6) этим качествам необходимо проставить мысленные ранги (М.Р.), как числа, обязательно идущие по порядку друг за другом, и отметить эти ранги круглыми скобками - (). Однако поскольку эти качества, по мнению испытуемого, должны иметь одинаковые ранги, то во втором столбце табл. 6, относящемуся к «Я реальному», следует поместить среднее арифметическое рангов, проставленных в скобках, т.е. (2 + 3)/2 = 2,5. Таким образом, второй столбец табл. 6 и будет окончательным итогом ранжирования особенностей «Я реального», данным испытуемым, а проставленные в этом столбце ранги будут носить название - реальные ранги (P.P.).

Аналогично при ранжировании «Я идеального» испытуемый считает, что такие качества, как «общительность», «энергичность» и «жизнерадостность», должны иметь один и тот же ранг. Тогда при проведении ранжирования (см. столбец 5 табл. 6) этим качествам необходимо проставить мысленные ранги, как числа, обязательно идущие по порядку друг за другом, и отметить эти ранги круглыми скобками - (). Однако поскольку эти качества, по мнению испытуемого, должны иметь одинаковые ранги - то в четвертом столбце табл. 6, относящемся к «Я идеальному», следует поместить среднее арифметическое рангов, проставленных в скобках, т.е. (4 + 5 + 6)/3 = 5. Таким образом, четвертый столбец таблицы 6 и будет окончательным итогом ранжирования особенностей «Я идеального», данным испытуемым, а проставленные в этом столбце ранги будут носить название - реальные ранги. Подчеркнем еще раз, что мысленные (условные) ранги, как числа, должны располагаться друг за другом по порядку, несмотря на то что ранжируемые качества в таблице данных не находятся рядом друг с другом.

Таблица 6.

Я реальное	Качества личности	Я идеальное

	Ответственность
	Общительность
	Настойчивость
	Энергичность
	Жизнерадостность
	Терпеливость
	Решительность

Обозначения: М.Р. - мысленные, или условные, ранги; P.P. - реальные ранги.

Проверим правильность ранжирования во втором столбце табл. 6, т.е. реальные ранги, относящиеся к «Я реальному»:

1 + 2,5 + 2,5 + 5 + 4 + 6 = 28.

Проверим правильность ранжирования в четвертом столбце табл. 6, т.е. реальные ранги, относящиеся к «Я идеальному»:

1 + 2 + 3 + 5 + 5 + 5 + 7 = 28.

По формуле (1.1) сумма рангов также равняется 28. Следовательно, ранжирование проведено правильно.

Б. Ранжирование количественных характеристик (чисел)

Ранжирование чисел рассмотрим на примере.

Пример. Психолог получил у 11 испытуемых следующие значения показателя невербального интеллекта: 113,102,123,122, 117, 117, 102, 108, 114, 102, 104. Необходимо проранжировать эти показатели, и лучше всего это сделать в таблице 7.

Таблица 7

Номер испытуемых	Показатели интеллекта	Мысленные ранги (М.Р.)	Реальные ранги (P.P.)

В примере встретились две группы из равных чисел (102, 102 и 102; 117 и 117), поскольку числа в группах различны, то и скобки, проставленные этим группам чисел, также различны.

Проверим правильность ранжирования по формуле (1.1). Подставив исходные значения в формулу, получим: 11·12/2 = 66. Суммируя реальные ранги, получим:

6 + 2 + 11 + 10 + 8,5 + 8,5 + 2 + 5 + 7 + 2 + 4 = 66.

Поскольку суммы совпали, следовательно, ранжирование проведено правильно.

Правила ранжирования чисел таковы.

1. Наименьшему (наибольшему) числовому значению приписывается ранг 1.

2. Наибольшему (наименьшему) числовому значению приписывается ранг, равный количеству ранжируемых величин.

3. Одинаковым по величине числам должны проставляться одинаковые ранги.

4. Если в ранжируемом ряду несколько чисел оказались равными, то им приписывается реальный ранг, равный средней арифметической величине тех рангов, которые эти числа получили бы, если бы стояли по порядку друг за другом.

5. Если в ранжируемом ряду имеется две и больше групп равных между собой чисел, то для каждой такой группы применяется правило 4, и мысленные ранги каждой группы заключаются в разные скобки.

6. Общая сумма реальных рангов должна совпадать с расчетной, определяемой по формуле (1.1).

При необходимости ранжирования достаточно большого числа объектов следует объединять их по какому-либо признаку в достаточно однородные классы (группы), а затем уже ранжировать полученные классы (группы).

Наиболее часто к измерениям, полученным в ранговой шкале, применяются коэффициенты корреляции Спирмена и Кэндалла, и, кроме того, используются разнообразные критерии различий.

Использование порядковой шкалы позволяет присваивать ранги объектам по какому-либо признаку. Таким образом, метрические значения переводятся в ранговые. При этом фиксируются различия в степени выраженности свойств. В процессе ранжирования следует придерживаться 2 правил.

Правило порядка ранжирования. Надо решить, кто получает первый ранг: объект с самой большей степенью выраженности какого-либо качества или наоборот. Чаще всего это абсолютно безразлично и не отражается на конечном результате. Традиционно принято первый ранг приписывать объектам с большей степенью выраженности качества (большему значению – меньший ранг). Например, чемпиону присуждают первое место, а не наоборот. Хотя, и здесь если бы был принят обратный порядок, то результаты от этого не изменились бы. Так что порядок ранжирования каждый исследователь вправе определять сам. Например, Е. В. Сидоренко рекомендует меньшему значению приписывать меньший ранг. В некоторых случаях это удобнее, но непривычнее.

Например: имеется неупорядоченная выборка, данные которой необходимо проранжировать. {2, 7, 6, 8, 11, 15, 9}. После упорядочивания выборки ранжируем ее.

Метрические данные	Альтернативный вариант:	Метрические данные

Отдельно следует сказать следующее. Существует группа редко используемых непараметрических критериев (Т-критерий Вилкоксона, U-критерий Манна-Уитни,Q-критерий Розенбаума и др.), при работе с которыми всегда надо меньшему значению приписывать меньший ранг.

Правило связанных рангов. Объектам с одинаковой выраженностью свойств приписывается один и тот же ранг. Этот ранг представляет собой среднее значение тех рангов, которые они получили бы, если бы не были равны. Например, надо проранжировать выборку, содержащую ряд одинаковых метрических данных: {4, 5, 9, 2, 6, 5, 9, 7, 5, 12}. После упорядочивания выборки следует вычислить среднее арифметическое значение связанных рангов.

Метрические данные	Предварительное ранжирование	Окончательное ранжирование

Задания для самостоятельной работы.

Проранжировать выборку по правилу «большему значению – меньший ранг»: {111, 104, 115, 107, 95, 104, 104}.

Проранжировать выборку по правилу «меньшему значению – меньший ранг» {20, 25, 8, 7, 20, 14, 27}.

Объединить две предыдущие выборки и провести ранжирование по правилу «большему значению – меньший ранг»

Показатели каких признаков из Таблицы Iявляются номинативными, каких – метрическими?

Перевести показатели осведомленности из Таблицы IПриложения в ранговую шкалу. Выделить уровни выраженности показателей посредством их перевода в номинативную шкалу.

Таблица I Данные для обработки

учащиеся

профиль ВУЗа

осведомленность

скрытые фигуры

пропущенные

арифметика

понятливость

исключение

изображений

аналогии

числовые ряды

умозаключения

геометрическое сложение

заучивание слов

средний IQ

экстраверсия-

интроверсия

нейротизм

средняя отметка

Профиль ВУЗа: 0 - выбор учеником гуманитарного профиля;

1 - выбор учеником математического или естественно-научного профиля

Правила ранжирования

1. Меньшему значению начисляется меньший ранг. Наименьшему значению начисляется ранг 1.

2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов , которые они получили бы, если бы не были равны.

3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:

При подсчете критерия U легче всего сразу приучить себя действовать по строгому алгоритму.

АЛГОРИТМ 4

Подсчет критерия U Манна-Уитни.

1. Перенести все данные испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых выборки 1 одним цветом, скажем красным, а все карточки из выборки 2 - другим, например синим.

3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой.

4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Всего рангов получится столько, сколько у нас (n 1 +п 2 ).

5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд , синие - в другой.

7. Определить большую из двух ранговых сумм.

8. Определить значение U по формуле:

где n 1 - количество испытуемых в выборке 1;

n 2 - количество испытуемых в выборке 2;

Т х - большая из двух ранговых сумм;

n х - количество испытуемых в группе с большей суммой рангов.

9. Определить критические значения U по Табл. II Приложения 1. Если U эмп.>U к p 005 , Н о принимается. Если U эмп ≤ U к p _ 005 , Н о отвергается. Чем меньше значения U, тем достоверность различий выше.

Таблица 2.4

Подсчет ранговых сумм по выборкам студентов физического и психа-логического факультетов

Студенты-физики (n 1 =14)			Студенты-психологи (n 2 =12)
Показатель невербального интеллекта		Ранг	Показатель невербального интеллекта	Ранг
Показатель невербального интеллекта		Ранг	Показатель невербального интеллекта
127		26
			123	25
			122	24
			117	23
116		22
115		20,5
115		20,5
			114	19
			113	18
			112	17
111		15,5	111	15.5
			108	14"
107		11.5	107	11,5
107		11,5
107		11,5
106		9
			105	8
104		6.5	104	6,5
102		4,5	102	4,5
99		3
95		2
90		1
Суммы	1501	165	1338	186
Средние	107,2		111,5

Общая сумма рангов: 165+186=351. Расчетная сумма :

Теперь мы готовы сформулировать гипотезы:

H 0 : Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.

Н 1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.

В соответствии со следующим шагом алгоритма определяем эмпирическую величину U:

Поскольку в нашем случае п\Фп2, подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей п х :

Такую проверку рекомендуется производить в некоторых руководствах (Рунион Р., 1982; Greene J., D"Olivera M., 1989). Для сопоставления с критическим значением выбираем меньшую величину U: U эмп =60.

По Табл. II Приложения 1 определяем критические значения для n 1 =14, n 2 =12.

Построим "ось значимости".

U эмп = 60

U эмп > U к p

2.4. Н - критерий Крускала-Уоллиса

Назначение критерия

Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.

Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.

Описание критерия

Критерий Н иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок (Тюрин Ю. Н., 1978). Иногда его называют критерием "суммы рангов" (Носенко И.А., 1981).

Данный критерий является продолжением критерия U на большее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия.

Гипотезы

H 0 : Между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака.

Н 1 : Между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.

Графическое представление критерия Н

Критерий Н оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная область наложения мала (Рис. 2.6 (а)), то различия достоверны; если она достигает определенной критической величины и превосходит ее (Рис. 2.6 (б)), то различия между выборками оказываются недостоверными.

Рис. 2.6. 2 возможных варианта соотношения рядов значений в трех выборках; штриховкой отмечены зоны наложения

Ограничения критерия Н

1. При сопоставлении 3-х выборок допускается, чтобы в одной из них п-Ъ, а двух других n=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (р≤ 0,05).

Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р5~0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.

2. Критические значения критерия Н и соответствующие им уровни значимости приведены в Табл. IV Приложения 1. Таблица предусмотрена только для трех выборок и { n 1 , n 2 , n 3 } ≤ 5.

При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия χ 2 , поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению χ 2 (Носенко И.А., 1981; J. Greene, M. D"Olivera, 1982).

Количество степеней свободы при этом определяется по формуле: V=c-1 где с - количество сопоставляемых выборок.

3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказаться стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½·[c ·(c-1)]* 6 таких попарных сопоставлений используется, естественно, критерий для двух выборок, например U или φ* .

АЛГОРИТМ 5 Подсчет критерия Н Крускала-Уоллиса

1. Перенести все показатели испытуемых на индивидуальные карточки.

2. Пометить карточки испытуемых группы 1 определенным цветом, например красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым и желтым цветом и т. д. (Можно использовать, естественно, и любые другие обозначения.)

3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой.

4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.

5. Вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения.

где N - общее количество испытуемых в объединенной выборке;

Т - суммы рангов по каждой группе.

8а. При количестве групп с=3, n 1 n 2 n 3 ≤5 определить критические значения и соответствующий им уровень значимости по Табл. IV Приложения 1.

Если Н эмп равен или превышает критическое значение H 0,05 , H 0 отвергается.

8б. При количестве групп с>3 или количестве испытуемых n 1 n 2 n 3 >5, определить критические значения χ 2 по Табл. IX Приложения 1.

Если Н эмп равен или превышает критическое значение χ 2 , H 0 отвергается.
Воспользуемся этим алгоритмом при решении задачи о неразрешимых анаграммах. Результаты работы по 1-6 шагам алгоритма представлены в Табл. 2.6.

Таблица 2.6

Подсчет ранговых сумм по группам испытуемых, работавших над четырьмя неразрешимыми анаграммами

Группа 1: анаграмма ФОЛИТОЫ (n 1 =4)		Группа 2: анаграмма КАМУСТО (n 2 =8)		Группа 3: анаграмма СНЕРАКО (n 3 =6)		Группа 4: анаграмма ГРУТОСИЛ (n 4 =4)
Длительность	Ранг	Длительность	Ранг	Длительность	Ранг	Длительность	Ранг
						60	1
				128	2
145	3.5	145	3.5
194	5
		210	6
		236	7
				283	8
		385	9
				469	10
				482	11
		720	12
731	13
		848	14
		905	15
		1080	16
1200	17
				1678	18
				2081	19
						2361	20
						2416	21
						3600	22
Суммы	38,5		82,5		68		64
Средние	9,6		10,3		11,3		16,0

Общая сумма рангов =38,5+82,5+68+64=253. Расчетная сумма рангов:

Равенство реальной и расчетной сумм соблюдено.

Поскольку таблицы критических значений критерия Н предусмотрены только для количества групп с = 3, а в данном случае у нас 4 группы, придется сопоставлять полученное эмпирическое значение Н с критическими значениями у}. Для этого вначале определим количество степеней свободы V для c=4:

v=c- 1 = 4 - 1 = 3

Теперь определим критические значения по Табл. IX Приложения 1 для v =3:

Ответ: Н 0 принимается: 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности попыток их решения.