Критерий вилкоксона в excel как сделать
Допустим мы сравниваем между собой уровень тревожности подростков до и после тренинга уверенности в себе.
Шаг 1. Запишем значения в таблицу.
Шаг 2. Рассчитаем разность значений. Для данного случае типичным сдвигом будет считаться сдвиг в отрицательную сторону (7 значений, красный цвет заливки), а нетипичным в положительную сторону (3 значения, зеленый цвет заливки)
Шаг 3. Найдем значения шага 2 по модулю
Шаг 4. Проранжируем значения по модулю.
Все четыре шага приведены в таблице.
№ | Уровень тревожности (до тренинга) | Уровень тревожности (после тренинга) | Шаг 2: Разность (после-до) |
Шаг 3: Значение разности по модулю |
Шаг 4: Ранг разности |
1 | 15 | 14 | -1 | 1 | 3 |
2 | 14 | 11 | -3 | 3 | 8 |
3 | 16 | 17 | 1 | 1 | 3 |
4 | 18 | 19 | 1 | 1 | 3 |
5 | 21 | 20 | -1 | 1 | 3 |
6 | 21 | 18 | -3 | 3 | 8 |
7 | 20 | 15 | -5 | 5 | 10 |
8 | 15 | 17 | 2 | 2 | 6 |
9 | 17 | 14 | -3 | 3 | 8 |
10 | 13 | 12 | -1 | 1 | 3 |
Шаг 5. Найдем T эмпирическое вычислив сумму рангов в НЕтипичном направлении (зеленый цвет заливки).
Шаг 6. Используя таблицу критических значений T-критерия Вилкоксона определяем T-критическое
6.1. Находим количество человек в выборке. n=10
6.2. Определяем T-критическое справа от значения количества человек в выборке. для p
Непараметрические критерии для связных выборок
Парный критерий Т — Вилкоксона
Для решения задач, в которых осуществляется сравнение двух рядов чисел психолог может использовать парный критерий Т — Вилкоксона. Этот критерий применяется для оценки различий экспериментальных данных, полученных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет выявить не только направленность изменений, но и их выраженность, т. е. он позволяет установить, насколько сдвиг показателей в каком-то одном направлении является более интенсивным, чем в другом.
Критерий Т основан на ранжировании абсолютных величин разности между двумя рядами выборочных значений в первом и втором эксперименте (например, до и после какого-либо воздействия). Ранжирование абсолютных величин означает, что знаки разностей не учитываются, однако в дальнейшем наряду с общей суммой рангов находится отдельно сумма рангов, как для положительных, так и для отрицательных сдвигов. Если интенсивность сдвига в одном направлении оказывается большей, то и соответствующая сумма рангов также оказывается больше. Этот сдвиг называется типичным, а противоположный, меньший по сумме рангов сдвиг — нетипичным. Эти два сдвига оказываются дополнительными друг другу. Критерий Т — Вилкоксона базируется на величине нетипичного сдвига, который называется
Пример: Психолог проводит с младшими школьниками коррекционную работу по формированию навыков внимания, используя для оценки результатов корректурную пробу. Задача состоит в том, чтобы определить, будет ли уменьшаться количество ошибок внимания у младших школьников после специальных коррекционных упражнений.
Для решения этой задачи психолог у 19 детей определяет количество ошибок при выполнении корректурной пробы до и после коррекционных упражнений. В табл. 6 приведены соответствующие экспериментальные данные и дополнительные столбцы, необходимые для работы по парному критерию Т — Вилкоксона.
Таблица 6
№ испытуемых п/п | До коррек
ционной работы |
После коррек
ционной работы |
Сдвиг (значение разности с учетом знака) | Абсолютные величины разностей | Ранги абсолютных величин разностей | Символ нетипичного двига |
1 | 24 | 22 | -2 | 2 | 10,5 | |
2 | 12 | 12 | 0 | 0 | 2 | |
3 | 42 | 41 | -1 | 1 | 6,5 | |
4 | 30 | 31 | +1 | 1 | 6,5 | * |
5 | 40 | 32 | -8 | 8 | 15 | |
6 | 55 | 44 | -11 | 11 | 16 | |
7 | 50 | 50 | 0 | 0 | 2 | |
8 | 52 | 32 | -20 | 20 | 18 | |
9 | 50 | 32 | -18 | 18 | 17 | |
10 | 22 | 21 | -1 | 1 | 6,5 | |
11 | 33 | 34 | +1 | 1 | 6,5 | * |
12 | 78 | 56 | -22 | 22 | 19 | |
13 | 79 | 78 | -1 | 1 | 6,5 | |
14 | 25 | 23 | -2 | 2 | 10,5 | |
15 | 28 | 22 | -6 | 6 | 13,5 | |
16 | 16 | 12 | -4 | 4 | 12 | |
17 | 17 | 16 | -1 | 1 | 6,5 | |
18 | 12 | 18 | +6 | 6 | 13,5 | * |
19 | 25 | 25 | 0 | 0 | 2 | |
Сумма | 190 | = 26,5 |
Обработка данных по критерию Т — Вилкоксона осуществляется следующим образом:
В четвертый столбец таблицы вносятся величины сдвигов с учетом знака. Их вычисляют путем вычитания из чисел третьего столбца соответствующих чисел второго столбца.
В пятом столбце в соответствие каждому значению сдвига ставят его абсолютную величину.
В шестом столбце ранжируют абсолютные величины сдвигов, представленных в пятом столбце.
По формуле: подсчитывают сумму рангов. В нашем примере она составляет:
12,5 + 6,5 + 6,5 + 15 + 16 + 2 + 18 + 17 + 6,5 + 6,5 + 19 + 6,5 + 10,5 + 13,5 + 12 + 6,5 + 13,5 +2 = 190
Проверяют правильность ранжирования на основе совпадения сумм рангов полученных двумя способами. В нашем случаи обе величины совпали, 190 = 190, следовательно, ранжирование проведено правильно.
Любым символом отмечают все имеющиеся в таблице нетипичные сдвиги. В нашем случае это три положительных сдвига.
Суммируют ранги нетипичных сдвигов. Это и будет искомая величина . В нашем случае эта сумма равна: = 6,5 + 13,5 + 6,5 = 26,5.
По табл. 15 приложения 6 определяют критические значения для n = 19.
Нужная нам строка табл. 15 из приложения 6 выделена ниже в табл. 7.
Таблица 7
Поскольку в нашем случаи основной, типичный сдвиг — отрицательный, то дополнительный, «нетипичный» сдвиг будет положительным и на уровне значимости в 5% сумма рангов таких сдвигов не должна превышать числа 53, а при уровне значимости в 1% не должна превышать числа 38. Представим сказанное выше следующим образом:
Строим «ось значимости»:
Анализ «оси значимости» показывает, что полученная величина Тпопадает в зону значимости. Следовательно, можно утверждать, что зафиксированные в эксперименте изменения не случайны и значимы на 1% уровне. Таким образом, психолог может говорить о том, что применение коррекционных упражнений способствует повышению точности выполнения корректурной пробы, следовательно, оказывает положительное влияние на развитие внимания школьников.
Для применения критерия Т — Вилкоксона необходимо соблюдать следующие условия:
Измерение может быть проведено во всех шкалах, кроме номинальной.
Выборка должна быть связной.
Число элементов в сравниваемых выборках должно быть равным.
Критерий Т — Вилкоксона может применяться при численности выборки от 5 до 50 (на большую величину не рассчитана таблица достоверности).
У нас можно заказать решение задач по математической статистике.
Заказать решение
А также Вы можете отправить свое задание на мою электронную почту reshim.su@gmail.com
Приведенный ниже текст получен путем автоматического извлечения из оригинального PDF-документа и предназначен для предварительного просмотра.
Изображения (картинки, формулы, графики) отсутствуют.
Для данных, измеренных в шкале отношений, для проверки гипотезы о совпадении характеристик двух групп целесообразно использование либо критерия24 Крамера-Уэлча, либо критерия Вилкоксона- Манна-Уитни. Критерий Крамера-Уэлча предназначен для проверки гипотезы о равенстве средних (строго говоря – математических ожиданий) двух выборок, критерий Вилкоксона-Манна-Уитни25 явля- ется более "тонким" (но и более трудоемким) – он позволяет проверять гипотезу о том, что две выборки "одинаковы" (в том числе, что совпадают их средние, дисперсии и все другие показатели26). Критерий Крамера-Уэлча. Эмпирическое значение данного критерия рассчитывается на основа- нии информации об объемах N и М выборок x и y, выборочных средних x и y и выборочных диспер- сиях Dx и Dy сравниваемых выборок (эти значения могут быть вычислены вручную по формулам (1)-(2) или с помощью инструмента "Описательная статистика" в компьютерной программе Microsoft Excel для Windows – см. выше) по следующей формуле: M ⋅N |x− y| (3) Tэмп = . M ⋅ Dx + N ⋅ D y Алгоритм определения достоверности совпадений и различий характеристик сравниваемых выбо- рок для экспериментальных данных, измеренных в шкале отношений, с помощью критерия Крамера- Уэлча заключается в следующем: 1. Вычислить для сравниваемых выборок Tэмп – эмпирическое значение критерия Крамера-Уэлча по формуле (3). 2. Сравнить это значение с критическим значением T0.05 = 1,96: если Tэмп ≤ 1,96, то сделать вывод: "характеристики сравниваемых выборок совпадают на уровне значимости 0,05"; если Tэмп > 1,96, то сделать вывод "достоверность различий характеристик сравниваемых выборок составляет27 95%". В качестве примера применим алгоритм для данных из таблицы 1. Для этого сравним сначала числа правильно решенных задач в контрольной и экспериментальной группе до начала эксперимента. Вычисляем28 по формуле (3) значение Tэмп = 0,04 ≤ 1,96. Следовательно, гипотеза о совпадении характеристик контрольной и экспериментальной групп до начала эксперимента принимается на уровне значимости 0,05. Теперь сравним характеристики контрольной и экспериментальной групп после окончания экспе- римента. Вычисляем по формуле (3) значение Tэмп = 2,42 > 1,96. Следовательно, достоверность разли- чий характеристик контрольной и экспериментальной групп после окончания эксперимента составляет 95%. Итак, начальные (до начала эксперимента) состояния экспериментальной и контрольной групп сов- падают, а конечные (после окончания эксперимента) – различаются. Следовательно, можно сделать вывод, что эффект изменений обусловлен именно применением экспериментальной методики обучения. Отметим, что мы не рассматриваем вопрос о том, "в какую сторону" экспериментальная группа от- личается от контрольной, то есть, улучшились или ухудшились (с содержательной точки зрения, не имеющей отношения к статистическим методам и являющейся прерогативой педагогики) исследуемые характеристики. Критерий Вилкоксона-Манна-Уитни29. Данный критерий оперирует не с абсолютными значе- ниями элементов двух выборок, а с результатами их парных сравнений. Например, существенно, что учащийся Петров решил больше задач, чем учащийся Иванов, а на сколько больше – не важно. Возьмем две выборки30: {xi}i = 1…N и {yj}j=1…M и для каждого элемента первой31 выборки xi, i = 1…N, определим число ai элементов второй выборки, которые превосходят его по своему значению (то есть 24 Критерий Крамера-Уэлча является более эффективным "заменителем" такого известного в физике и технике критерия как t-критерий (критерий Стьюдента). 25 Критерий Вилкоксона-Манна-Уитни плохо применим в условиях, когда число отличающихся друг от друга значений в выборках мало. 26 Две выборки могут иметь одинаковые средние (то есть, критерий Крамера-Уэлча установит совпадение средних), но различаться, например, разбросом. Те различия, которые не выявит критерий Крамера-Уэлча, могут быть выявлены кри- терием Вилкоксона-Манна-Уитни. 27 Корректнее говорить, что достоверность различий составляет не менее 95%, однако, так мы условились считать достаточной 95%-ую достоверность различий, то будем говорить, что достоверность различий составляет 95%. 28 Для сокращения ручных расчетов средние и дисперсии могут быть вычислены в рамках описательной статистики в компьютерной программе Microsoft Excel для Windows – см. выше таблицу 6. 29 Существуют два критерия – Вилкоксона и Манна-Уитни, однако, так как они однозначно связаны между собой, будем говорить об одном критерии Вилкоксона-Манна-Уитни. 11 число таких yj, что yj > xi), а также число bi элементов второй выборки, которые по своему значению равны ему (то есть число таких yj, что yj = xi). Сумма 1 N 1 N a1 + a2 + …+ aN + (b1 + b2 + …+ bN ) = ∑ ai + ∑ bi 2 i =1 2 i =1 по всем N членам первой выборки называется эмпирическим значением критерия Манна-Уитни и обо- значается U. Определим эмпирическое значение критерия Вилкоксона: N ⋅M | −U | (4) Wэмп = 2 . N ⋅ M ⋅ ( N + M + 1) 12 Алгоритм определения достоверности совпадений и различий для экспериментальных данных, из- меренных в шкале отношений, с помощью критерия Вилкоксона-Манна-Уитни заключается в следую- щем: 1. Вычислить для сравниваемых выборок Wэмп – эмпирическое значение критерия Вилкоксона по формуле (4). 2. Сравнить это значение с критическим значением W0.05 = 1,96: если Wэмп ≤ 1,96, то сделать вывод: "характеристики сравниваемых выборок совпадают с уровнем значимости 0,05"; если Wэмп > 1,96, то сделать вывод "достоверность различий характеристик сравниваемых выборок составляет 95%". В качестве примера применим алгоритм для данных из таблицы 1. Для этого сравним сначала числа правильно решенных задач в контрольной и экспериментальной группе до начала эксперимента. В таблице 8 приведены результаты экспериментальной группы (второй столбец), и контрольной группы (пятый столбец), а также для каждого члена экспериментальной груп- пы подсчитано число членов контрольной группы, решивших строго большее (чем он) число задач, плюс полусумма числа членов контрольной группы, решивших такое же (что и он) число задач (третий столбец). Например, в таблице 8 серым цветом в пятом столбце помечены члены контрольной группы, правильно решившие строго большее число задач, чем первый член (то есть i = 1) экспериментальной группы, который правильно решил 12 задач. Значит x1 = 12 и число таких yj, что yj > x1 равно 16. Следо- вательно, a1 = 16. Число таких yj, что yj = x1 равно 2. Следовательно, b1 = 2. Итак, a1 + b1 / 2 = 17, то есть число затененных ячеек равно 17. Записываем это число во вторую строку третьего столбца. Аналогич- но заполняются остальные строки третьего столбца. Таблица 8 Пример вычисления эмпирического значения критерия Манна-Уитни Номер члена Число задач, Число членов Номер члена Число задач, эксперименталь- правильно ре- контрольной контрольной правильно ре- ной группы шенных i-ым группы, пра- группы шенных j-ым членом экспери- вильно решив- членом кон- ментальной ших строго трольной группы группы до начала большее число до начала экспе- эксперимента задач, чем i-ый римента член эксперимен- тальной группы i xi ai + b i / 2 j yj 1 12 17 1 15 2 11 19,5 2 13 3 15 9 3 11 4 17 5 4 18 5 18 4 5 10 6 6 28,5 6 8 7 8 24,5 7 20 30 Ограничение на использование критерия Вилкоксона-Манна-Уитни следующее: каждая выборка должна содержать не менее трех элементов, если же в одной из выборок всего два элемента, то во второй их должно быть не менее пяти. 31 Какую выборку считать первой, а какую второй, не имеет значения, хотя при вычислениях удобнее первой считать ту выборку, в которой меньше членов. 12 Номер члена Число задач, Число членов Номер члена Число задач, эксперименталь- правильно ре- контрольной контрольной правильно ре- ной группы шенных i-ым группы, пра- группы шенных j-ым членом экспери- вильно решив- членом кон- ментальной ших строго трольной группы группы до начала большее число до начала экспе- эксперимента задач, чем i-ый римента член эксперимен- тальной группы i xi ai + b i / 2 j yj 8 10 21,5 8 7 9 16 6 9 8 10 12 17 10 12 11 15 9 11 15 12 14 12 12 16 13 19 2 13 13 14 13 14,5 14 14 15 19 2 15 14 16 12 17 16 19 17 11 19,5 17 7 18 16 6 18 8 19 12 17 19 11 20 8 24,5 20 12 21 13 14,5 21 15 22 7 27 22 16 23 15 9 23 13 24 8 24,5 24 5 25 9 22,5 25 11 – – 26 19 – – 27 18 – – 28 9 – – 29 6 – – 30 15 Сумма всех 25 чисел в третьем столбце таблицы 8 дает эмпирическое значение критерия Манна- Уитни U = 373. Вычисляем по формуле (4) значение Wэмп = 0,0338 ≤ 1,96. Следовательно, гипотеза о том, что сравниваемые выборки совпадают, принимается на уровне значимости 0,05. Теперь аналогичным образом (построив таблицу, аналогичную таблице 8, и вычислив эмпирическое значение критерия Вилкоксона) сравним числа правильно решенных задач в контрольной и экспери- ментальной группе после окончания эксперимента. Вычисляем по формуле (4) значение Wэмп = 2,1974 > 1,96. Следовательно, достоверность различий сравниваемых выборок составляет 95%. Итак, начальные (до начала эксперимента) состояния экспериментальной и контрольной групп сов- падают, а конечные (после окончания эксперимента) – различаются. Следовательно, можно сделать вывод, что эффект изменений обусловлен именно применением экспериментальной методики обучения. Методика определения достоверности совпадений и различий для экспериментальных дан- ных, измеренных в порядковой шкале. Рассмотрим случай, когда используется порядковая шкала с L различными баллами. Характеристикой группы будет число ее членов, набравших тот или иной балл. Для экспериментальной группы вектор баллов есть n = (n1, n2, …, nL), где nk – число членов эксперимен- тальной группы, получивших k-ый балл, k = 1, 2, …, L. Для контрольной группы вектор баллов есть m = (m1, m2, …, mL), где mk – число членов контрольной группы, получивших k-ый балл, k = 1, 2, …, L. Для рассматриваемого нами числового примера (L = 3 – "низкий", "средний" или "высокий" уровень знаний) данные приведены в таблице 4. Для данных, измеренных в порядковой шкале (см., например, таблицу 4), целесообразно использо- вание критерия однородности χ2 ("хи" – буква греческого алфавита, название критерия читается: "хи- 13 квадрат"), эмпирическое значение χ эмп которого вычисляется по следующей формуле32 (пример расче- 2 та приведен ниже): ni mi 2 L ( − ) (5) χ эмп = N ⋅ M ⋅ ∑ N M . 2 i =1 ni + mi Критические значения χ 02.05 критерия χ2 для уровня значимости 0,05 приведены в таблице 9 (стати- стические таблицы критических значений статистических критериев для различных уровней значимо- сти и различных – в том числе больших 10 – градаций шкалы отношений можно найти, практически, в любом учебнике по статистическим методам или в специальных статистических таблицах). Таблица 9 Критические значения критерия χ2 для уровня значимости α = 0.05 L–1 1 2 3 4 5 6 7 8 9 χ 0.05 2 3,84 5,99 7,82 9,49 11,07 12,59 14,07 15,52 16,92 Алгоритм определения достоверности совпадений и различий для экспериментальных данных, из- меренных в порядковой шкале, заключается в следующем: 1. Вычислить для сравниваемых выборок χ эмп – эмпирическое значение критерия χ2 по формуле 2 (5). 2. Сравнить это значение с критическим значением χ 02.05 , взятым из таблицы 9: если χ эмп ≤ χ 0.05 , 2 2 то сделать вывод: "характеристик сравниваемых выборок совпадают с уровнем значимости 0,05"; если χ эмп > χ 02.05 , то сделать вывод "достоверность различий характеристик сравниваемых 2 выборок составляет 95%". Применим алгоритм для данных из таблицы 4. Сначала вычисляем по формуле (5) эмпирические значения критерия χ2. Для примера приведем расчет. Параметры экспериментальной группы (N = 25) после окончания эксперимента: n1 = 2, n2 = 13, n3 = 10 (то есть 2 учащихся продемонстрировали "низ- кий" уровень знаний, 13 – "средний" и 10 – "высокий" – см. выше таблицу 4), контрольной группы (M = 30): m1 = 12, m2 = 10, m3 = 8. Подставляя в формулу (5), получаем: 2 12 2 13 10 2 10 8 χ эмп = 25 ⋅ 30 ⋅ = 7,36. 25 30 25 30 25 30 Аналогичным образом вычисляются все оставшиеся из 16 возможных результатов парных сравне- ний групп (экспериментальная и контрольная группы, до начала и после окончания эксперимента). Результаты вычислений приведены в таблице 10. Ячейки таблицы 10 содержат эмпирические значения критерия χ2 для сравниваемых групп, соответствующих строке и столбцу. Жирным шрифтом выделены результаты сравнения характеристик экспериментальной и контрольной группы до начала и после окончания эксперимента. Например, эмпирическое значение критерия χ2, получаемое при сравнении характеристик контрольной группы до начала эксперимента (вторая строка таблицы 10) и эксперимен- тальной группы до начала эксперимента (третий столбец таблицы 10), равно 0,03. В рассматриваемом примере L = 3 (выделены три уровня знаний – "низкий", "средний" и "высокий"). Следовательно, L – 1 = 2. Из таблицы 9 получаем для L – 1 = 2: χ 02.05 = 5,99. Тогда из табли- цы 10 видно, что все эмпирические значения критерия χ2, кроме результата χэмп = 7,36 сравнения экспе- риментальной и контрольной групп после окончания эксперимента, меньше критического значения. Следовательно "характеристики всех сравниваемых выборок, кроме экспериментальной и кон- трольной групп после окончания эксперимента, совпадают33 с уровнем значимости 0,05". Так как χэмп = 7,36 > 5,99 = χ 02.05 , то "достоверность различий характеристик экспериментальной и контрольной групп после окончания эксперимента составляет 95%". 32 Критерий хи-квадрат применим при условии, что для любого значения балла в любой из сравниваемых выборок не менее пяти ее членов получили данный балл, то есть: ni ≥ 5, mi ≥ 5, i = 1, 2, …, L. Кроме того, желательно, чтобы число градаций L было не менее трех. Если L = 2, то есть используется дихотомическая шкала ("да" – "нет", "решил" – "не решил" и т.д.), то можно применять критерий Фишера – см. ниже. 33 Интересно отметить, что характеристики экспериментальной группы до начала и после окончания эксперимента также совпадают с уровнем значимости 0,05. 14 Итак, начальные (до начала эксперимента) состояния экспериментальной и контрольной групп сов- падают, а конечные (после окончания эксперимента) – различаются. Следовательно, можно сделать вывод, что эффект изменений обусловлен именно применением экспериментальной методики обучения. Таблица 10 Эмпирические значения критерия χ для данных из таблицы 4 2 Контрольная Эксперимен- Контрольная Эксперимен- группа до тальная группа после тальная начала экспе- группа до окончания группа после римента начала экспе- эксперимента окончания римента эксперимента Контрольная группа до начала экспери- 0 0,03 1,16 4,60 мента Экспериментальная группа до начала 0,03 0 1,34 3,82 эксперимента Контрольная группа после окончания 1,16 1,34 0 7,36 эксперимента Экспериментальная группа после окон- 4,60 3,82 7,36 0 чания эксперимента Дихотомическая шкала. Отдельно рассмотрим случай, когда используется дихотомическая шкала – порядковая шкала с всего двумя различными упорядоченными баллами – "высокий"-"низкий", "спра- вился с заданием"-"не справился", "прошел тест"-"не прошел" и т.д. Характеристикой группы, помимо общего числа ее членов, будет число членов (или доля, процент от общего числа), набравших заданный, например – максимальный, балл (в общем случае – число членов, обладающих заданным признаком). Для экспериментальной группы, описываемой двумя числами (n1, n2), где n1 – число членов рас- сматриваемой группы, набравших низкий балл, n2 – набравших высокий балл, n1 + n2 = N, доля p ее членов, набравших максимальный балл, равна: p = n2 / N. Для контрольной группы, описываемой двумя числами (m1, m2), где m1 + m2 = M, доля q ее членов, набравших максимальный балл, равна: q = m2 / M. Рассмотрим пример: для каждого из столбцов таблицы 1, считая, что возможны два уровня знаний – "не усвоили материал" (число правильно решенных задач меньше либо равно 10) и "успешно усвоили материал" (число правильно решенных задач строго больше 10) определяем распределение членов экспериментальной и контрольной группы по двум уровням знаний и получаем таблицу 11 (для экспе- риментальной группы до начала эксперимента p = 0,72 (или 72%), после окончания эксперимента p = 0,92; для контрольной группы до начала эксперимента q = 0,70, после окончания эксперимента q = 0,60). Таблица 11 Результаты дихотомических измерений уровня знаний в контрольной и экспериментальной группах до и после эксперимента Контроль- Экспери- Контроль- Экспери- ная группа ментальная ная группа ментальная до начала группа до после окон- группа экспери- начала чания экс- после окон- мента экспери- перимента чания экс- мента перимента Доля, которую составляют учащиеся, не усвоившие 0,30 0,28 0,40 0,08 материал Доля, которую составляют учащиеся, усвоившие ма- 0,70 0,72 0,60 0,92 териал 15 Для данных, измеренных в дихотомической шкале целесообразно использование критерия Фише- ра , для которого эмпирическое значение ϕэмп вычисляется по следующей формуле (арксинус может 34 быть вычислен в Excel): M ⋅N (6) ϕэмп = |2 arcsin( p ) – 2 arcsin( q )| . M +N Критическое значение ϕ0.05 критерия Фишера для уровня значимости 0,05 равно 1,64. Алгоритм определения достоверности совпадений и различий для экспериментальных данных, из- меренных в дихотомической шкале, заключается в следующем: 1. Вычислить для сравниваемых выборок ϕэмп – эмпирическое значение критерия Фишера по фор- муле (6). 2. Сравнить это значение с критическим значением ϕ0.05 = 1,64: если ϕэмп ≤ 1,64, то сделать вывод: "характеристики сравниваемых выборок совпадают с уровнем значимости 0,05"; если ϕэмп > 1,64, то сделать вывод "достоверность различий характеристик сравниваемых выборок составляет 95%". Применим алгоритм для экспериментальных данных из таблицы 11. Сначала вычисляем по форму- ле (2) эмпирические значения критерия Фишера. Для примера приведем расчет. Параметры экспери- ментальной группы (N = 25) после окончания эксперимента: p = 0,92, контрольной группы (M = 30): q = 0,60 (см. таблицу 11). Подставляя в формулу (6), получаем: 25 ⋅ 30 ϕэмп = |2 arcsin( 0,92 ) – 2 arcsin( 0,6 )| = 2,94. 25 + 30 Аналогичным образом вычисляются все оставшиеся из 16 возможных результатов парных сравне- ний групп (экспериментальная и контрольная группы, до начала и после окончания эксперимента). Результаты вычислений приведены в таблице 12. Ячейки таблицы 12 содержат эмпирические значения критерия Фишера для сравниваемых групп, соответствующих строке и столбцу. Жирным шрифтом выделены результаты сравнения характеристик экспериментальной и контрольной группы до начала и после окончания эксперимента. Например, эмпирическое значение критерия Фишера, получаемое при сравнении характеристик контрольной группы до начала эксперимента (вторая строка таблицы 12) и экспериментальной группы до начала эксперимента (третий столбец таблицы 12), равно 0,16. Следовательно "состояния экспери- ментальной и контрольной групп до начала эксперимента совпадают с уровнем значимости 0,05". Теперь аналогичным образом сравним характеристики экспериментальной и контрольной групп по- сле окончания эксперимента. Так как ϕэмп = 2,94 > 1,64 = ϕкр, то "достоверность различий состояний экспериментальной и контрольной групп после окончания эксперимента составляет 95%". Таблица 12 Эмпирические значения критерия Фишера для данных из таблицы 11 Контроль- Экспери- Контроль- Экспери- ная группа ментальная ная группа ментальная до начала группа до после окон- группа после эксперимен- начала экс- чания экспе- окончания та перимента римента эксперимен- та Контрольная группа до 0 0,16 0,81 2,16 начала эксперимента Экспериментальная группа до начала экс- 0,16 0 0,94 1,92 перимента Контрольная группа после окончания экс- 0,81 0,94 0 2,94 перимента Экспериментальная группа после оконча- 2,16 1,92 2,94 0 ния эксперимента 34 В математической статистике существует несколько критериев Фишера. Мы используем один из них – так называемое угловое преобразование, поэтому далее под критерием Фишера будем понимать именно угловое преобразование Фишера. 16 Итак, начальные (до начала эксперимента) состояния экспериментальной и контрольной групп сов- падают, а конечные (после окончания эксперимента) – различаются. Следовательно, можно сделать вывод, что эффект изменений обусловлен именно применением экспериментальной методики обучения. Отметим, данный вывод (один и тот же) был получен при применении к соответствующим эксперимен- тальным данным всех четырех критериев – Крамера-Уэлча, Вилкоксона-Манна-Уитни, χ2 и Фишера35. Планирование педагогического эксперимента. Отметим, что, несмотря на то, что выше обсужда- лось применение статистических методов к уже полученным в результате проведения педагогического эксперимента данным, знание этих методов позволяет планировать эксперимент на стадии его подго- товки. Например, формулы (3)-(6), определяющие эмпирические значения критериев, совместно с фик- сированными критическими их значениями, позволяют заранее (до проведения эксперимента) оцени- вать необходимый объем выборки и другие важные параметры36. Кроме того, если до начала эксперимента выявлено статистически значимое различие характеристик экспериментальной и кон- трольной групп по интересующему исследователя критерию (например, по успеваемости), то проводить эксперимент не имеет смысла, так как никакие результаты сравнения характеристик этих групп после окончания эксперимента, не позволят выявить вклада сравниваемого с традиционным педагогического воздействия. Заключение. Итак, в настоящей работе мы попытались изложить на доступном уровне "рецепты" применения статистических методов при решении типовых задач анализа данных в педагогических исследованиях. В то же время, не следует забывать, что рассмотрены лишь несколько, хотя и наиболее распространенных, но все-таки достаточно простых ситуаций. Арсенал же современных статистических методов гораздо богаче. Быть может, освоение и применение этого арсенала подтолкнет исследователей в области педагогических наук как к расширению соответствующих предметных областей, так и к по- вышению уровня обоснованности научных результатов. Еще раз напомним, что рассмотренные выше инструменты анализа данных имеют программную реализацию в виде свободно распространяемой компьютерной программы "Статистика в педагоги- ке", которую можно загрузить с адреса (2.9 Мб). 35 Перечисленные четыре критерия обладают различной "мощностью" – возможны случаи, когда, например, применение критерия Крамера-Уэлча или критерия Вилкоксона-Манна-Уитни к данным, измеренным в шкале отношений, свидетельст- вует о наличии статистически значимых различий, а применение критерия χ2 к тем же эмпирическим результатам, пере- веденным в порядковую шкалу, свидетельствует о совпадении характеристик (см. также обсуждение потерь информации при переходе от шкалы отношений к порядковой шкале выше). Поэтому можно рекомендовать максимально использовать всю полученную в результате педагогического эксперимента информацию – если измерения проводились в шкале отноше- ний, то и обрабатывать данные следует в этой шкале. 36 Конечно, чем больше объемы выборок, тем в некотором смысле лучше, то есть тем проще будет обосновать различия, если они есть. Но, с другой стороны, привлечение к педагогическому эксперименту каждого нового участника требует от исследователя определенных усилий, поэтому целесообразно заранее примерно определить требуемый объем выборок. 17
Т-критерий Вилкоксона используется для оценки сдвига значений исследуемого показателя, измеренного на одной и той же выборке испытуемых.
Необходимость использования этого статистического критерия при написании курсовой, дипломной или магистерской работы по психологии возникает тогда, когда в работе присутствуют формирующий и контрольный эксперименты. В этом случае необходимо выяснить произошли ли статистически достоверные изменения психологического показателя в группе испытуемых в результате проведения с ними некоторых коррекционно-развивающих действий.
Рассмотрим пример использования Т-критерия Вилкоксона в рамках дипломной работы на тему «Развитие креативности старших дошкольников средствами сказкотерапии». На первом этапе данного исследования будет проведена диагностика креативности старших дошкольников и анализ этих результатов, что будет составлять содержание констатирующего эксперимента.
Формирующий эксперимент будет состоять в разработке и проведении программы сказкотерапии с группой старших дошкольников.
На этапе контрольного эксперимента возникает необходимость ответить на вопрос: «Изменилась ли креативность детей до и после проведения с ними программы сказкотерапии?» Для ответа на этот вопрос и нужно использовать Т-критерий Вилкоксона. Для этого нужно сделать следующее:
- Провести первичную диагностику креативности старших дошкольников в рамках констатирующего эксперимента.
- Провести вторичную диагностику креативности старших дошкольников в рамках контрольного эксперимента – после проведения с ними программы сказкотерапии.
- Выявить различия выраженности креативности старших дошкольников до и после сказкотерапии с помощью Т-критерия Вилкоксона.
Как рассчитать Т-критерий Вилкоксона
Возможность расчета Т-критерия Вилкоксона реализована в любой программе статистического анализа данных. Для этого необходимо иметь таблицу исходных данных с результатами тестирования группы испытуемых до и после некоторого воздействия.
Если упрощенно говорить об алгоритме вычисления этого статистического показателя, то можно отметить следующее. Логика вычисления Т-критерий Вилкоксона сводится к тому, что анализируются сдвиги показателей в сторону больших или меньших значений. Например, сравниваем уровень самооценки женщин до и после тренинга уверенности в себе:
- У каких-то испытуемых самооценка увеличилась — положительный сдвиг.
- У некоторых женщин, возможно, самооценка уменьшилась — отрицательный сдвиг.
- А кого-то из респондентов самооценка не изменилась – нулевой сдвиг.
Расчет Т-критерий Вилкоксона сводится к анализу интенсивности положительных и отрицательных сдвигов:
- Если преобладают положительные сдвиги, то можно говорить о статистически достоверных различиях самооценки до и после тренинга.
- Если преобладают отрицательные сдвиги, значит, в ходе тренинга самооценки снизилась.
- Если же положительные и отрицательные сдвиги уравновешивают друг друга, следовательно, самооценка в ходе тренинга не изменилась и различий «до» и «после» нет.
Надеюсь, эта статья поможет вам написать работу по психологии самостоятельно. Если понадобится помощь, обращайтесь (все виды работ по психологии; статистические расчеты). Заказать