123 11 35MB
Russian Pages 172 [174] Year 2014
-
О. А. Сю111жков
Непараметрическая статистика в
MS Excel и VBA
Москва, 2014
УДК
744.4:004.92
ББК
30.11 +32.973.26-018.2 С27
С27
Сдвижков О. А.
Непараметрическая статистика в MS Excel и VBA.
-
М.: ДМК Пресс,
2014. - 172 с.: ил.
ISBN 978-5-94074-917-2 В книгу вошли основные сведения по MS Excel и классическим ме
тодам непараметрической статистики, применяемым к независимым выборкам, парным наблюдениям и таблицам сопряженности, реали зующие эти методы программы VBA и технологии решения типовых
задач в MS Excel. Данные технологии представлены, как пошаговыми
решениями (без применения макросов), так и автоматическими, кота
задача решается одним макросом, возвращающим значение статисти ки, критерий принятия ос1ювной гипотезы и вывод о том, какую гипо тезу следует принять. Книга ориентирована на студентов вузов, изучающих статистиче ские методы, но будет полезна и более широкому кругу пользователей
MS Excel. УДК 744.4:004.92 ББК 30.11 +32.973.26-018.2 Все праuа защищены. Любая часть этой к1ш1·и не может быть uоспронз ведеиа в какой бы то ни было форме и какими бы то ни было средствами без ш1сьмен11оrо разрешения владельцев авторских прав. Материал, изложенный в данной кн11rе, мноrокрапю проверен. Но по скольку вероятность тех1шческих ошибок все равно существует, 11здательство не может гарантировать абсолютную точность и 11рав11лыюсть 11р1шою1мых сведений. В связи с этим издательство не несет ответстuешюсти за возможные 011111бк11, свяэа1111ые с использованием ю111п1.
ISBN 978-5-94074-917-2
© Сдвижков О. А., 2014 © Оформле11ие, издание, ДМК Пресс, 2014
Содержание Предисловие
"................."........................................... 5
Глава 1 . Теория вероятностей и математическая . . . . . . . . .
статистика в MS Excel """""""""""""""""""""""""""". 7
§ 1. §2. §3. §4. §5. §6. §7. §8.
Встроенные функции дискретных распределений"""""". 9 Макросы для дискретных распределений """"""""""". 18 Встроенные функции непрерывных распределений"""" 23 Инструмент Гистограмма "...................".................. 26 Инструмент Описательная статистика """."""""""""". 34 Встроенные средства корреляционного анализа . ""."." 38 Макрос Correlation 45 Тесты надстройки Анализ данных" """."."..""..".".."" 47 . . . . . . .
.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Глава 2. Непараметрические критерии . . .
для независимых выборок """."""""""""""."."""".".. 58
§ 1. Критерий Колмогорова-Смирнова " "".."."..".""."...".. 59 §2. Критерий Катценбайссера-Хакли """"".".""..""""""" 65 §3. Критерий Вилкоксона "" "...."......"..""..."......""""".".. 69 §4. Критерий Манна-Уитни """"""""""""""""""""""""" 76 §5. Критерий серий Вальда-Вольфовитца """"""""""""". 82 §6. Сериальный критерий Рамачандрана-Ранганатана """" 94 .
.
Глава 3. Непараметрические критерии для пар
. "...... "............................".................". 97 Критерий знаков """"."""".""""".""""."".".""""""" 98 Критерий Фишера"""""""""""""""""""""""""""". 104 Знаковый критерий Вилкоксона """"" """"""" """"". 107 Модификации критерия Вилкоксона """ "" "."""" """ 1 14 Критерий Спирмена "" """"""""""""""."""""""""" 123 Критерий Кендалла . . . . 128 Критерий Ван дер Вардена """.."..."....".".".".".""..". 132 Критерий Ширахате " ".."."..".. "".""""."" .... """"."." 136
наблюдений
§1 §2. §3. §4. §5. §6. §7. §8. .
. . . . .
. . . . . .
"
.
. . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
Глава 4. Непараметрические критерии
. . . .
. . . . .
.
.
.""....".""..".."."".""""". § 1. Четырехклеточный Х2 критерий "" " "." " " """"."""" §2. Общий случай х2 критерия ""."..."."."."......"."""".." §3. Точный критерий Фишера """.".."""""""."""""""""
для таблиц сопряженности
. . .
.
. . .
.
.
.
.
.
14 1 142 149 153
Содержание
4 §4. §5. §6. §7.
G-критерий Вулфа ........................................................ Критерий Макнимары ................................................... Биномиальные критерии .............................................. Критерий Ле Роя ...........................................................
Литература
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
156 159 163 167 170
Предисловие Непараметрические статистика - статистические критерии проверки гипотез, не связанных с законами распределений генеральных сово купностей и их параметрами. Непараметрическая статистика нахо дит широкое применение в исследованиях по психологии, биологии, экономике и многим другим областям. В макросах папки VBA_tests, которым, фактически, посвящена данная книга, статистические критерии запрограммированы так, как они изложены в большей части литературы по непараметрической статистике ([10], [12), [13) и др.), то есть, в основном, с помощью кри тических точек, соответствующих заданному уровню значимости а. В статистических пакетах STAТISТICA, SPSS, XLSTAT, как из вестно ([4], [8), [15)), подход другой ([22), стр. 37), опирающийся на значение p-level, который у не знакомых с ним пользователей вызы вает определенные трудности. Поэтому данные макросы, не требую щие специальной установки, одного из самых доступных, и популяр ных, пакетов обработки числовых данных, каким является MS Ехсе\, несомненно, будут полезны. Кроме того, папка VBA_tests содержит макросы таких уникальных критериев, каких нет в статистических пакетах: • Катценбайссера-Хакли; • Рамачандрана-Ранганатана; • Ширахате и др. Естественно, макросы неоднократно тестировались, результаты перепроверялись, в том числе, когда это было возможно, в статисти ческих пакетах. В книгу вошли основные сведения по MS Excel и классическим методам непараметрической статистики, применяемым к независи мым выборкам, парным наблюдениям и таблицам сопряженности, реализующие эти методы программы VBA и технологии решения типовых задач в MS Excel. Данные технологии представлены, как по лезными в учебных целях пошаговыми решениями (без применения макросов), так и автоматическими, когда задача решается одним ма кросом, возвращающим: • значение статистики; • критерий принятия основной гипотезы; • вывод о том, какую гипотезу следует принять. Таблицы критических точек статистик, не поддерживаемых в MS Ехсе\, введены как процедуры-функции.
Предисловие
6
Материал изложен просто и доступно, большое число задач и рисунков позволяет понять рассматриваемые технологии, вообще говоря, не включая компьютер. Условия задач, в основном, взяты из наиболее популярных сборников задач, учебных пособий и моногра фий. Включенные в книгу программы VBA должны подсказать поль зователям MS Ехсе\, как самостоятельно запрограммировать нужный критерий, а не охваченных информационными математическими тех нологиями статистических критериев - необозримое множество. Под стандартным применением макроса в книге, следуя [18], понимается: 1) вызов макроса (рабочей книги, содержащей макрос); 2) построчный ввод данных, начиная с ячейки А1; 3) выделение диапазона данных; 4) запуск макроса на исполнение (Сервис � Макрос � Макросы � И мя � Вып олнить).
Ссылка для скачивания макросов непараметрической статистики, содержащихся в папке VBA_tests: http://www.oasdv.narod.ru. Макросы, которых более 30, поддерживаются в MS Ехсе\ 2007 и 2010. Книга ориентирована на студентов вузов, изучающих статистиче ские методы, но будет полезна и более широкому кругу пользовате лей MS Ехсе\.
Теория вероятностей и математическая статистика в MS Excel § 1.
Встроенные функци и ди скретных распределени й """"""" . 9
§2. §3.
М акросы дл я дискретных распределени й """" "". 18 Встроенные функци и
непрерывных распределени й """" " " . 23 §4. §5.
Инструмент Гистогра м м а "" """" "" . 26 Инструмент
Описательная §6.
статистика """"" """"" 34 Встроен н ы е средства
коррел я ци онного анал иза"""""""""""". 38 §7. §8.
М акрос Correlation"""". 45
Тесты надстройки
Анал из дан н ы х""""""" 47
8
Теория вероятн остей и математическа я статистика в MS Excel
Теория вероятностей и математическая статистика поддерживаются в MS Excel встроенными функциями (таблица 1.1) и надстройкой (инструментами) Анализ данных (рис. 1.1, 1.2). Таблица 1 . 1 FРАСП
МАКС
СРЗНАЧ
FРАСПОБР
МАКСА
СРЗНАЧА
ZТЕСТ
МЕДИАНА
СРОТКЛ
БЕТАОБР
мин
СТАНДОТКЛОН
МИНА
СТАНДОТКЛОНА
БИНОМРАСП
МОДА
СТАНДОТ КЛО Н П
ВЕЙБУЛЛ
НАИБОЛЬШИЙ
СТАНДОТКЛОНПА
ВЕРОЯТНОСТЬ
НАИМЕНЬШИЙ
СТОШУХ
ГАМ МАОБР
НАКЛОН
СТЬЮДРАСП
ГАММАРАСП
НОРМАЛИЗАЦИЯ
СТЬЮДРАС ПОБР
ГАММАНЛОГ
НОРМОБР
СЧЕТ
ГИ ПЕРГЕОМЕТ
НОРМРАСП
СЧЕТЕСЛИ
дисп
НОРМСТОБР
СЧЕТЗ
ДИСПА
НОРМСТРАСП
СЧИТАТЬПУСТОТЫ
ДИС П Р
ОТРБИ НОМРАСП
ТЕНДЕНЦИЯ
ДИСПРА
ОТ РЕЗОК
ТТЕСТ
ДОВЕРИТ
ПЕРЕСТ
УРЕЗСРЕДНЕЕ
КВАДРОТКЛ
ПЕРСЕНТИЛЬ
Ф И ШЕР
КВАРТИЛЬ
П И РСОН
ФИ ШЕРОБР
КВ П И РСОН
ПРЕДСКАЗ
ФТЕСТ
КОВАР
П РОЦЕНТ РАНГ
ХИ20БР
КОРР ЕЛ
ПУАССОН
ХИ2РАСП
РАНГ
ХИ2ТЕСТ
ЛГРФПРИБЛ
РОСТ
ЧАСТОТА
ЛИ НЕЙН
скос
БЕТАРАСП
КРИТ Б ИНОМ
ЛОГНОРМОБР ЛОГНОРМ РАСП
СРГАРМ
ЭКСПРАСП ЭКСЦЕСС
СРГЕОМ
Меню встроенных функций (Мастер функций) открывается кноп кой /(х), по каждой из них в MS Excel можно получить подробную справку. Поэтому специально перечислять их назначения, как и зна чения параметров, нет необходимости, тем более 'ПО многие из них в дальнейшем будут применяться в конкретных задачах. Пакет Анализ данных, если его нет в меню Сервис, загружается командами Сервис � Надстройки, после чего надо поставить галоч ку в поле Анализ данных и подтвердить ОК. Щелчок по опции Анализ данных меню Сервис открывает список инструментов:
Встроенные функции дискретных распределений Аналнз данных
�нструменты анализа
,
·
. :
·
· ,
Двухфакторный дисперсионный анализ с повторения"и Деухфакторный дисперсионный анализ без поsторений Корреляция Ковариация Описательная статистика Экспоненциальное сглаживание
-.;�
1 5,5. 6. В диапазоне В 1 :В7 задаем арифметическую прогрессию, с первым членом 5,6, разностью (шагом) 1 ,7, предельным значением 1 5,8:
5
6 7
5,82 6,39 6 ,�4 6,97 7.06 7,16 7 .46
__
с
в
А
1 2 3 4
5,6 7 ,3 9 10,7 12.4 14,1 15 в
Рис. 1.36
1
-1
-�
7. С помощью встроенной функции СЧЕТЕСЛ И подсчитываем число вариант, принадлежащих промежутку (5,6; 7,3 ) , и запи сываем результат в ячейку С 1 :
Теория вероятностей и .v.атематическая статистика в М S Excel
28
!'""''�
� l�l"-< --7-,3-"-1---------iJ
,8_ 4_ :6 _ -- 92:� 6,3 , 8_ 5_ {� c-" Анализ данных => Описательная стати стика => ОК откроем диалоговое окно и заполним его, как на рис. 1 .49. Описательная статистика Вl[ОАНОЙ 01Нтереал:
'\,
$А$ ЦА$50
0 ГIО С!Р.> не поддерживает. Для них разработан макрос Summary, возвращающий значения основных числовых характери стик, величины ek и as вычисляются по формулам, приведенным в [6]. Задача 1 . 9 . По заданному распределению выборки � 12 14 16 18 20 22 n; 5 15 50 16 10 4 найти: 1 ) выборочную среднюю; 2) выборочную дисперсию; 3) исправленную выборочную дисперсию; 4) среднее квадратическое отклонение; 5) асимметрию; 6) эксцесс. Технология решения. Вызываем макрос Summary, вводим и вы деляем выборочные данные: •
Инструмент Описательная статистика
в
37
с
14 15
16 50
D
18 16
Е
20 10
Рис. 1 . 5 1
Запуск макроса на исполнение возвращает: Microsoft Excel 2.
1.
Хсред = 1 6,46 D а4, 868
�
З. Dиcn •4, 9 1 8 4 . s -2,206 6. Ek -0, 358
5. As •О,475 ок
Ответ: см. рис.
Рис. 1 . 52
1 .52.
Код макроса Summary
Sub Summa ry ( ) Dim n A s I nteger, х ( ) A s S i n g l e , m ( ) A s Intege r , h A s I n tege r , _ с As S i n g l e , d As S ingle , t As S i n g l e , s As S i n g l e , а As S i n g l e , е As Single n = Selection . Columns . Count ReDim x ( l То n ) : ReDim m ( l То n ) For i = 1 Т о n x ( i ) = C e l l s ( l , i ) . Value : m ( i ) = C e l l s ( 2 , i ) . Value Next с = О: h = О For i = 1 То n с = с + x (i) • m (i) h = h + m(i) Next с = с / h: d = О: а = О: е = О For i = 1 То n d = d + ( x ( i ) - с) ' 2 * m ( i ) а = а + (x (i) - с) ' 3 * m ( i ) е = е + (х ( i ) - с) ' 4 * m ( i ) Next d = d / h : t = h * d / ( h - 1 ) : s = Sqr ( d ) а = а / h / s ' 3: е = е / h / s ' 4 - 3 d = FormatNumЬe r ( d , 3 ) : t = Forma tNumЬe r ( t , 3 ) : s = FormatNumЬer ( s , 3 ) а = FormatNumЬe r ( a , 3 ) : е = Forma tNumЬe r ( e , 3 ) MsgBox ( " 1 . Хсред = " & с & Chr ( l 3 ) & " 2 . D = " & d & Chr ( l 3 ) & " 3 . Dисп = " & t & Chr ( 1 3 ) & " 4 . s =" & s & Chr ( l 3 ) & " 5 . As =" & а & Chr ( 1 3 ) & " 6 . Ek =" & е ) End Sub
Теория вероятностей и математи ческа я статисти ка в M S Excel
38
§ 6 . В строен н ы е сре дст ва корреля ционно го анали з а
1. По заданной совокупности точек (х;, у), i = 1 , 2, . .. , п, коэффициент корреляции - i')(. IJ ; - у) =_ ! ______ = -'п а ., . cr 11 "
/°
_L (x;
вычисляет встроенная функция КОРРЕЛ или П И РСОН. Для вы числения коэффициента ковариации µ=
_!_ :t (Х; - X)(.IJ; - У) 11 i I =
предназначена встроенная функция КОВАР. Например, пусть вход ные данные (х;, у), как на рис. 1 .53. в
А 1 2
4 5
з
6
1 _з
6L
_
49 , 1 55 ,З
81
52 ,5 63 7
15
72,8
_12i
с
60 ,4
Рис. 1 . 53
Тогда, открывая диалоговое окно КОРРЕЛ и заполняя поля, полу чаем значение коэффициента корреляции:
КОРРЕЛ
Во!еращl!ет к:о3ффициент корреляции между деумя множествами д�нных. Массив2 второй д11аnа3он 3наченнй. Эначен�1ям11 могут быть ч1кnаJ 11�1ена,
масснвы или ссылки с 1111енам11.
Сnомка по
!ТОЙ функuин
Значение: 0,888636954
Рис. 1 . 54
ОК
,J (
Отмена
Встроенные средства корреляционного анализа
39
Команда ОК вставляет значение коэффициента корреляции в ак тивную ячейку. Аналогично находится значение коэффициента кова риации. Значения коэффициентов выборочного У на Х уравнения прямо линейной регрессии Ух = kx + Ь находятся встроенными функциями НАКЛОН и ОТРЕЗОК, соответственно. Порядок ввода данных в их диалоговые окна является существенным, сначала вводятся значения У; • а затем Х; . Пример на рис. 1 .55.
НАКЛОН
1 lll• вестные_•начения_у B l : в6 � · • {'19, 1 : 55,З:52,5: 6З, :=="....,_.====-=----=:::� 111 • вестные_•начения_м ._ l : д6 � ...., "1 • { 1 : 3 :6 : 8 : 1 2: 1 5} А� _ _________,_ �
Воэеращоет наклон лмнин nннейной регресс11н,
Изв�стны�_:Jнач�ния_к множестео Не}аенснмых элементое донных -- имена, массивы или ссыnкн но яче�1ки, содержащие '+tсло.
Справка по этой функuни
ОК
Значен11е: 1 , 13392226 1
g1
Отмен•
Рис. 1 . 55
Поместим значения k , Ь в ячейки С 1 , О 1 , соответственно (рис. 1 .56), и построим выборочное уравнение прямолинейной регрессии. 1. В ячейку Е1 введем формулу =$С$ 1 * А1 + $ 0 $ 1 и копируем ее в ячейки Е2: Е6: Е1
с
в
о
49 ,1 1 ,433922 48 ,21 225 55 3 3 52 ,5 § 63 ,7 8 12 60 ,4 � 15 72 ,8 1
1 2
.]__ 4 5 ...___ 6
,&j =$С$1 *А1 +$0$1
.
А
,
__
--
-
Рис. 1 . 56
Е
49 ,646 1 7 52 ,51 402 56 ,81 578
59 ,68363
65 ,41 932 69 721 08.
2. Выделим диапазон А 1 :А6, а затем, нажимая и удерживая кла вишу Ctrl, диапазон Е 1 :Е6. 3. Запуская графический редактор Мастер диаграмм, приходим (Диаграмма � Точечная) к графику (рис. 1 .57).
Теория вероятностей и №атематическая статистика в tv.s Excel
40
ВЫБОРОЧНОЕ УРАВ НЕНИЕ ПРЯМОЛИНЕЙНОЙ РЕГРЕССИИ
ео �-����������������--.
7 0 -t------------,---=,,.....-----1 ___....60 t-����:r:::,..._--=::::� :::. �����--;
so +-.-�� 1-----���������-1
40 +------< 30 +------< 20 -t-------1 1 0 +------< о
0 -t-----.----,--1 5
10
15
20
Рис. 1 . 57
Столбец значений Е 1 :Е6, показанных на рис. 1 .56, можно полу чить и с помощью встроенной функции ТЕНДЕНЦИЯ. 1. Выделим, например, диапазон F 1 :F6. 2. Откроем диалоговое окно ТЕНДЕН ЦИЯ и заполним поля сле дующим образом:
ТЕНДЕНЦИЯ
И3вестные_эначения_у
В 1 :В6
Известные_значения_х А l : А б Ноеые_значения_х А l : А б Канет
l
� - {49, 1 : 55, 3 : 5 2, 5 : 63,
l'\'1! = {l : 3 : 6 : 8 : 1 2 : 1 5} "!!. ! - { l : 3 : 6 : 8 : 1 2 : 1 5} "·' = ИСТИНА
Возеращает значен"1я е соопsетств"111 с лttне�1ной аппроксимацией по методу н�11меньш11х кеадратое .
К онст
логическое )Начение: ко11станта Ь еыч11еляется обычным образом
при значении ИСТИНА или опутсте"1и значения 11 раена О при эначении ЛОЖЬ.
СпраЕiка по .этой функu11н
Эначение: 49,646 l 7 1 97
Рис. 1 . 58
�_,) 1
к ...._ .._ о_
Отмена
3. Тогда, нажимая F2 и Ctrl+Shift+Enter, получим те же значения, что и в столбце Е 1 : Е6 (рис. 1 .59). Если в поле новых значений х задать, действительно, диапазон новых значений, то в столбце F будут значения функции kx + Ь, вы-
Встроенные с редства корреля ционного анализа F1 >---
А
1 2 3 >--4 >--- -5
6 ,.___
...
41
fх]/ =ТЕ НДЕ Н ЦИЯ(В1 : 86;А 1 :.А6;А1 :АБ; 1 ) \
в
о
с
Е
49 , 1 1 ,433922 . 48 ,21 225 f- 49 ,6461 7 1 55 ,3 52 ,51 402 3 52 ,5 6 56 ,8 1 578 ,__. 59 ,68363 863 ,7 с---60 ,4 65 ,4 1 932 12 ,_ 15 69 ,721 08 72 ,8 - ··
-
·�
F
49 ,646 1 7 52 ,51 402 56 ,81 578 59 ,68363 65 ,41 932 69 721 08•
Рис. 1 . 59
численные для них. С помощью функции ТЕНДЕНЦИЯ можно вы числять и зНачения в одной точке, указывая ячейку, в которой она находится, в поле новых значений. Однако в этом случае лучше воспользоваться предназначенной для этого встроенной функцией П РЕД СКАЗ, имеющей более простое диалоговое окно. 2. Встроенная функция Л И Н Е Й Н возвращает одновременно оба коэффициента уравнения Ух = kx + Ь и, по запросу пользователя, до полнительную статистику. Пусть введены данные, как на рис. 1 .53. Выделим диапазон 5х2, например, D 1 :E5, откроем диалоговое окно Л И Н Е Й Н и заполним поля, как на рис. 1 .60.
ЛИНЕЙН
И•в"стны"_•нач"ния_у
� - {49, 1 :55, З : 52, 5 : 6З, �
! в 1 : 66 :=1
Изеестные_>н очения_х д"' 1 '"' : д= - • = { 1 : З : 6 : 8 : 1 2 : 1 5} 6 ==-=--=,_,_...,_..,..,�
Ста
п::: : :
�:::::
Во:sеращае т nарсУ-3 >-4
А
5 __о_
...
1 3 6
в
fi,]{=ЛИНЕИН(В1 : 86,А1 :А6; 1 ; 1 )} с Е D 1 49 , 1 1 ,43:шт 48,21225 55 ,3 0 ,3700 1 2 3 ,30604 52 ,5 -- о ,789676 4 ,401 435 3l 4 -- 1 5 ,0 1 824 290 9428 77 49051 60 ,4 72 ,8 l l
1H
12 15
·
F
�
Рис. 1 . 6 1
Наименования параметров приведены в таблице 1 . 5. Таблица 1 . 5 к
Ь - свободн ы й член
- угловой коэффициент
fl L - Стандартная ОШИбКа
cr, - стандартная ошибка
R' - коэффициент детерминации
fJ - стандартная ошибка по у
:t CfT,, - у)' - регрессионная сумма квад-
:t s ; , если s_,.2 > s92 , или н1 : s x2 < Sy.2 если н0 : s "2 < s92 • с татистика критерия: Р-
-
2 s_.. sч
2·
Теория вероятностей и М'!Тематическа я статистика в M S Excel
48
В список возвращаемых значений входят F - наблюдаемое (выбо рочное, эмпирическое) значение критерия и односторонняя критиче ская точка Fкr распределения Фишера. При F11 > 1 (F11 < 1 ) гипотеза Н0 принимается, если F11 < F" " (F11 > F. " ), в противном случае принимается альтернативная гипотеза. Аналогичным образом при а/2 проверяется Н0 при альтернативной гипотезе Н1 : s; * s � . Задача 1 . 1 О . Для сравнения точности двух станков-автоматов взяты две пробы (выборки), объемы которых n1 = 10 и п 2 = 8. В ре зул ьтате измерения контролируемого размера отобранных изделий получены следующие результаты: Таблица 1 . 6 х,
У,
1 ,08
1,10
1,1 2
1,14
1,15
1 ,25
1 ,36
1 , 38
1,1 1
1,12
1 , 18
1 ,22
1 ,33
1 ,35
1 , 36
1 ,38
1 ,40
1 ,42
Можно ли считать, что станки обладают одинаковой точностью = D(Y) ) , если принять уровень значимости а = О, 1 и в каче стве конкурирующей гипотезы Н1: D(X) * D(Y)? Технология решения. Вводим выборочные данные на рабочий лист: [ Hu: D(X)
·j�___L!Э
-� _
1
1 ,08 1 ,1 1
1 ,1 1 ,12
1
С 1 1 ,1 2 1 ,1 8
D J_.LLf_l__.O_ l_н_j__J_J_,i__J 1 ,1 4 1 ,1 5 1 ,25 1 ,36 1 ,38 1 ,4 1 ,42 1 ,22 1 ,33 1 ,35 1 ,36 1 ,38
Рис. 1 . 70
Открываем диалоговое окно Двухвы б орочный F-тест для дис персии и вводим данные, как показано на рис. 1 .7 1 . Входные данные Интервал переменной 1: Интервал переменной f.: О Метки [;льфа : �
Пара11етры вывода
0 В01ходной интервал : О Новый рабочий 11ист: О Новая рабочая !S.Н11Г а
ок
k [ Оп1ена [ �правка
$А$1 :$J$1 $А$2:$Н$2
$М$1
г
Рис. 1 . 7 1
"'!!:.
]
Тесты надстройки Анализ данных
49
Команда ОК возвращает: N
С р ед н е е Ди с п е р с и я Набл юд е н и я
df F
P(F а, в противном случае принима ется альтернативная гипотеза. Например, для задачи 1 . 10, как видно из диалогового окна, показанного на рис. 1 .73, получаем Р/2 > а = 0, 1 , то есть гипотеза Н0 принимается. ФТЕСТ
Массив l Al : J l
"\1 = { 1 , 08; 1 , 1 ; 1 , 1 2; 1 , 1 4 :=================��
Массив2 ._А_ 2_ 2 __________,_"k : н_ = ·' • { 1 , 1 1 ; 1 , 1 2; 1 , 1 8; 1 , 2 Во3вращает реэультат F-теста, одностороtНОЮ еероятность сходства двух совокупностеН.
Сnоовка гю 31011 фуt1кuни
Масснв2 еторой �сене или ди51аэон � числа, массиеы нлн ссылк�1 на ячеНки1 содержащне Ч11С М (пробе лы нrнорируются). Эначеже : О,599699 1 25
ОК
/1
Отмена
/
Рис. 1 . 73
2 . Парный двухвы б орочный t-тест для средних
- по парным на блюдениям (х;, у;), i 1, п, нормально распределенных совокупностей проверяет гипотезу Н 0 : Х У при альтернативной гипотезе Н 1 : Х "# У или Н1 : Х > У ( Н 1 : Х< У), если х > у (х 1 односторонняя критическая точка, t. 1>2 двусторонняя критическая точка. Если 1 t 1 < t. � то_: ипотеза Н0 принимается , в противном случае принимается Н1 : Х :t- У . Если 1 t 1 < tкpl' то гипотеза Н0 принимается, в противн.о!d с�учае принимается односторонняя альтернативная гипотеза Н1 (Х > У или х < У). Задача 1 11 На двух аналитических весах, в одном и том же по рядке, взвешены 1 0 проб химического вещества и получены следую щие результаты взвешиваний (в мг): -
-
•
•
Таблица 1 . 6 х,
зо
25
31
28
28
50
20
40
32
36
42
38
26
52
24
36
33
35
45
40
При уровне значимости 0,0 1 установить, значимо ли различаются результаты взвешиваний, в предположении, что они распределены нормально. Технология решения. Вводим выборочные данные на рабочий лист (рис. 1 .74).
, _A
� _
_
1
1
_
[ 13_ J _f_j__D_ _J E:__J_f_j Q___l_tj__ J _ _J
_ __
25 �
__
30 �
__
28 �
50 ы
__
20 �
40 �
i
J
_ __ _ _ _ _
32 �
36 %
42 �
38 �
J
Рис. 1 . 74
Открываем диалоговое окно Парный двухвыб орочный t-тест для средних и вводим данные (рис. 1 .75). По команде ОК получаем ре
зультаты (рис. 1 .76).
Входные данные
Интерsал перемеННОt1 !:
$А$ 1 : $]$ 1
Интервал переменной �:
$A$2 : $J$2
[иnотет ическая средняя ра}Ность:
О �е тки л� {l :
�ю
�"�етры tыеода 0 В!г!ХОдно11 интероол: О Новыii paбoчl"ii /!ИСТ:
О Новая �бочая 15.ннrа
Jo
L
'\,
1 ===--='$М : $"" =" ""' � -· О Then n = Next а = m: Ь = n ReDim x ( l То m) : ReDim nx ( l То m ) : ReDim y ( l То n ) : ReDim ny ( l То n ) For i = 1 Т о m х ( i ) = Cel l s ( 1 , i ) . Value nx ( i ) = 1 Next For i = 1 То n y ( i ) = C e l l s ( 2 , i ) . Value ny ( i ) = 1 Next Linel : For i = 1 То m - 1 I f x ( i ) = x ( i + 1 ) Then nx ( i) = nx ( i) + 1 I f i < m - 1 Then For k = i + 1 То m x (k) = x (k + 1 ) Next ReDim Prese rve x ( l То m - 1 ) : ReDim Prese rve nx ( l То m - 1 ) : m = m - 1 GoTo Linel Else ReDim Prese rve x ( l То m - 1 ) : ReDim Preserve nx ( l То m - 1 ) : m = m - 1 End I f End I f
64
Непараметрические критерии ДЛS1 независимых выборок
Next Line2 : For i = 1 То n - 1 I f y ( i ) = y ( i + 1 ) Then ny ( i ) = ny ( i ) + 1 I f i < n - 1 Then For k = i + 1 То n y ( k) = y ( k + 1 ) Next ReDim Preserve y ( l То n - 1 ) : ReDim Preserve ny ( l То n - 1 ) : n = n - 1 Gото Line2 Else ReDim Preserve y ( l То n - 1 ) : ReDim Preserve ny ( l То n - 1 ) : n = n - 1 End I f End I f Next sx = App l i cation . Wo rksheetFunct ion . Sum ( n x ) sy = App l i cation . Wo rksheetFunct ion . Sum ( n y ) u = Appl ication . WorksheetFunction . Mi n ( x , у ) v = Appl icat ion . Worksheet Function . Max ( x , у) For i = 1 То m nx ( i ) = nx ( i ) / sx Next For i = 1 То n ny ( i ) = ny ( i ) / s y Next For i = 2 То m nx ( i ) = nx ( i - 1 ) + n x ( i ) Next For i = 2 То n n y ( i ) = ny ( i - 1 ) + n y ( i ) Next ReDim Fx ( u То v ) : ReDim Fy ( u То v ) For k = u Т о v I f k < x ( l ) Then Fx ( k ) = О I f k < y ( l ) Then Fy ( k ) = О I f k >= x (m ) Then Fx ( k ) 1 I f k >= y ( n ) Then Fy ( k ) = 1 Next For i = 1 То m For k = x ( i ) То x ( i + 1 ) - 1 Fx ( k ) = nx ( i ) Next Next For i = То n - 1 For k = у ( i ) Т о y ( i + 1 ) - 1 Fy ( k ) = ny ( i ) Next Next d = о
Критерий Катценбайссера-Ха кли
65
For i = u То v t = Fx ( i ) - Fy ( i ) : t = Abs ( t ) : d = App l i ca t i o n . WorksheetFun c t i o n . Max ( d , t ) Next d = Forma tNumbe r ( d , 3) h = App l i c a t i o n . I nputBox ( " Введите номер уровня значимости критерия : " & Chr ( 1 3 ) & " 1 . 0 , 1 ; 2 . 0 , 0 5 ; 3 . 0 , 0 2 ; 4 . 0 , 0 1 " , Type : = l ) Select Case т Case Is 2 0 с = l amda ( h ) • S q r ( ( а + Ы / а / Ы End Select с = FormatNumber ( c , 3) I f d < с Then s t r = " Но . ·" Else str = " Hl . " End I f MsgBox ( " Значение статистики : D = " & d & " . Критерий принятия Но : D < " & с & " . Принять : " & s t r ) E n d Sub
§ 2 . Критерий Кат цен б айссера Х а кл и Критерий однородности Катценбайссера-Хакли ( Katzenbeisser Hackl test), применяемый при т = п, также связан с эмпирическими функциями распределений выборок Х; , У; · i 1, п. Статистикой Т в нем является число точек, в которых значения эмпирических функций распределений совпадают [ 1 2 ) . При уровне значимости а гипотеза Н0 об однородности принима ется, если а < Р( Т � Тв) = 1 - Р( Т > Тв), Тв - наблюдаемое значение критерия, 2' с ·-1 Р(Т > t) --1!!..:!.. . с ;" =
=
Задача 2 . 3 . При уровне значимости 0 , 1 проверить критерием Катценбайссера-Хакли нулевую гипотезу Н0 однородности призна ков Х, У, представленных выборками: Х; 22 22 26 27 27 29 33 34 35 36 У; 18 22 24 25 25 25 27 28 28 30 Альтернативная гипотеза Н0 : Х * У.
Непараметрические критерии № неза вис имых в ыборок
66
Технология решения. Так же, как при решении задачи 2. 1 , нахо дим эмпирические функции распределений выборок (рис. 2. 1 1 ). 22L 18
А
о
о
1
22 22
В
26
24 ,
27 25
27 25
25
02 о3
02 о6
оэ о6
о� о
С
02 о2
D
Е
F
н
G
27
28
33
29
о� о9
7
о� о9
к
J
L
м
35
36 30
о�
01
о�
о�
1
1
1
1
1 1.
Рис. 2. 1 1
Откуда следует Т8 = 2. Вероятность
Р ( Т > 2) 2 2 =
C�s
С 20
вычисляем по формуле: =2"2 * Ч И СЛКОМБ( 1 8;8)/Ч И СЛКОМ Б(20; 10) Она дает Р( Т > 2) = 0,947, то есть Р( Т :::;; 2 ) = 0,053. Так как а = О, 1 > 0,053 = Р( Т :;; 2), то нулевая гипотеза отклоняется. Ответ: принимается гипотеза Н1• Критерий реализован в макросе I_test_K_H, применяемом стан дартным образом при п ;::: 5. Например, для задачи 2.3 он возвращает результаты, полученные непосредственными вычислениями: �-���----- - - ---- �iE_r_osoftJxc i: I .,J.;,;; • , "
-.•.
-
-
..
" .-,
·-
••
,
.
-· •
·-
•
-
Значение статистики: 2. Критерий прннятия Но : alpfa < 0,0526 . Принять : ок
Рис. 2. 1 2
.
(8)
Hl.
Критерий l Fz(x), то есть Х < У, то критическая область левосторонняя: w.11 = w 1111 ж . кr = W( a, т, п ) . В случае W8 > w.r нулевая гипотеза принимается, в противном случае принимается альтернативная гипотеза F1 (x) > Fz(x).
Непараметрические критерии № неза в исимых выборок
70
При п > 25 проверка нулевой гипотезы F1 (x) = Fix) при альтер нативной гипотезе F1 (x) '* Fix) отличается в этом случае от предыду щего только тем, что rc1 " " " .•
[
]
- (т + пт + 1) - пх - 1 m · n(m + n + 1) "- z," , 2 12
где квадратные скобки обозначают целую часть, Ф( z ," )
1-а 2 Ф(z ) - функция Лапласа. При других альтернативных гипотезах 1 - 2а Ф(z ) 2-. "', = Задача 2.4. При уровне значимости 0,0 1 проверить критерием Вилкоксона гипотезу Н0 однородности признаков Х, У, заданных вы борками: Х; 3 5 6 10 13 17 У; 1 2 5 7 16 20 22 Принять в качестве конкурирующей гипотезы Н1 : F1 (x) '* F2 (x).
= -- ,
Технология решения.
1 . Вводим в одну строку, начиная с ячейки А 1 , сначала варианты первой выборки, затем второй. Ниже вводим номера выборок ( 1 или 2). 2. Выделяем данные первой строки ( А 1 : М 1 ) и проводим их сор тировку (с расширением) по возрастанию. 3. В ячейке А4 записываем формулу: = РАНГ( А 1 ;$А 1 :$М 1 ; 1 )+(СЧ Ё ТЕСЛИ($А1 :$М 1 ;А 1 ) - 1 )*0,5 4. Копируя ее в остальные ячейки диапазона А4: М4, получаем в нем ранги вариант:
1
"' А 1
т !-з 4
ч 1
в
2 2
-
2
С
1
ч 3
D
1 Е 1
��·
45
1
F
;t -t
45
Б
G
1 Н 1
7 101 2 1 1 г 7 8
Рис. 2. 1 3
1
13
1
1t 9
J
1
1 6:
2
10
1
к
17 1 11
L
м
1
�
20 2 2 131 12
1
5. В любой свободной ячейке с помощью функции СУММ ЕС Л И (рис. 2 . 1 4 ) находим сумму ран гов вариант первой выборки wи = 4 1 ,5:
Критерий Вилкоксона
СУММЕСПИ
71
[ ""!' Д""nа•он д 2 : М2 .11] - {2; 2; 1 ; 1 ; 2; 1 ; 2; 1 ; 1 ;< !=============� Крит � риИ " 1 " ['\1[ а " 1 "
ДИОП 5 проводит вычисления критерия Вил коксона автоматически и возвращает полученные результаты, и со общение о том, какая гипотеза принимается. Таблица критических точек введена как процедура-функция g(x, у, z). Для применения мак роса надо ввести выборочные данные в первые две строки рабочего листа Excel, начиная с ячейки А 1 , выделить диапазон с данными и запустить макрос на исполнение. Например, применим макрос I_test_W к задаче 2.4. Вызываем макрос и вводим выборочные данные:
Рис. 2. 1 5
Запуск макроса на исполнение открывает окно ввода номера аль тернативной гипотезы:
Непараметрические критерии № независимых в ыборок
72 В вод
---
--
(gJ
Введите номер альтернативной гипотезы : 1 . х < > У; 2. х > У; з. х < у
/1
ок
11
)[
1
Отмена
1
Рис. 2. 1 6
Команда О К открывает окно для ввода номера уровня значимости критерия:
Веедите номер уровня 3начимости критерия : 1 . 0, 0 1 ; 2. 0,02; З. О,05; '1. О, 1 .
ОК
J1
Отмена
1
J
Рис. 2. 1 7
Команда ОК возвращает результаты, полученные ранее непосред ственными вычислениями :
Значение статистики: '1 1 ,5 . Область принятия Но : (2'1, 60) . Прин�ть: Но .
ок
Рис. 2. 1 8
Задача 2 . 5 . Эффективность каждого из двух рационов (А и В) откорма животных характеризуется выборками объемов т = 1 0 и п = 1 2 (в первой строке приведен вес (в кг) животных, откармливае мых по рациону А, во второй строке - по рациону В): Х; 24 26 27 27 30 32 33 34 35 36 У; 21 21 22 23 25 25 25 25 27 27 29 31 Используя критерий Вилкоксона, при уровне значимости 0,05 проверить нулевую гипотезу об одинаковой эффективности рацио-
Критерий Вилкоксона
73
нов А и В, принимая в качестве конкурирую щей гипотез ы: рацио н А эффективнее рациона В (Н1 : F1 (x) < F2 (x), то есть Х > У). Технология решения. Вызываем макрос W_test и ввод им дан ные: в
26 21
с
27 22
D
27 23
Е
3) 25
F
G
32 25
н
33 25
L
К
34 25
29
31
Рис. 2. 1 9
Запуск макроса на исполнение открывает окно ввода номера ал ь тернативной гипотезы:
Вееднте номер альтернативной г1111оте3ы: 1 . х < > У; 2 . х > У; з. х < у 2
J[
ОК
Отмена
Рис. 2. 20
Команда ОК открывает окно ввода номера уровня значим ости критерия: Ввод
. . -- - - .. ;· �
Введите номер уровня 3нач�1мости критерия : 1 . 0, 005; 2. О,0 1 ; 3. О,025; 1. О,05. .
IГ
ОК
J [
Отмена
1
J
Рис. 2. 2 1
Команда ОК возвращает результаты: Значение статистики: W = 1 5 6 . Критерий nринятия Но: W < 1 4 1 . Принять: ок
Рис. 2. 22
Х
> У.
Непараметрические критерии № независ имых выборок
74
Ответ: корм А эффективнее.
Применение макроса I_test_W к данным задачи 2.2, входные дан ные показаны на рис. 2.23 частично, возвращает сообщение (рис. 2.24). с
в
А 12 11
14 13
о 15 16
F
Е 18 17
21 19
25 20
Рис. 2. 23
Значение статистики :
736,5. Область принятия Но: (583, 817)
,
Принять : Но.
ок
Код макроса
Рис. 2. 24
Sub I _t e s t _W ( ) Dim m As I n tege r , n As I n tege r , nl As I n tege r , n2 As I n tege r , s ( ) As S i ng l e , _ r ( ) As S i n g l e , tip As I n tege r , h As I n tege r , a l fa As S i ngle , z l As Intege r , z2 As I ntege r , t As S i n g l e , s t r As S t ring n = Selection . Column s . Count For i = l То n If Cel l s ( l , i) . Value > О Then m = i End I f Next ReDim s ( l Т о m + n ) : ReDim r ( l Т о m + n ) For i = 1 Т о m s ( i ) = Cel l s ( 1 , i ) . Value Next For i = m + 1 То m + n s ( i ) = Ce l l s ( 2 , i - m) . Va l ue Next For i = 1 То m + n Cel l s ( 4 , i ) . Va l ue = s ( i ) Next For i = 1 То m r ( i ) = App l i ca t ion . WorksheetFu n c t i on . Ra n k ( s ( i ) , Range (Cel l s ( 4 , 1 ) , Cel l s ( 4 , m + n ) ) , 1 ) r ( i ) = r ( i ) + (Appl i c a t i on . WorksheetFunction . Count i f ( Range ( C e l l s ( 4 , 1 ) , Cel l s ( 4 , m + n ) ) , s ( i ) ) - 1 ) • 0 . 5 Next w = о
Критерий Вилкоксона
75
For i То m w = w + r (i) Next tip = App l i c a t ion . I nput8ox ( " 8вeдитe номер альтернативной гипотезы : " & Chr ( 1 3 ) & " 1 . Х У ; 2 . Х > У ; 3 . Х < У " , Type : = l ) Select Case n Case I s У." End I f Msg8ox ( " Значение статистики : W " & w & " Критерий принятия Но : W < " & w2 & " . Принять : " & s t r ) Case Is = 3 I f wl < w Then str У." " Х Else 1 1 Х < У . 11 str End I f Msg8ox ( " Значение статистики : W " & w & " Критерий принятия Но : W > " & wl & " Принять : " & s t r ) E n d Select Case E l s e a l fa = App l i c a t ion . I nput8ox ( " 8вeдитe уровень значимости : " , Type : = l ) t = Appl i c a t i on . Workshee tFunction . NormS inv ( l - a l fa / 2 ) [alO] = t: [ЫО] = m: [clOJ = n Range ( " D l O " ) . Formu l a = "= RoundDown ( ( ( 8 1 0 + C l O + 1 ) • 8 1 0 - 1 ) / 2 - A l O • Sqrt ( 8 1 0 • C l O • ( 8 1 0 + C l O + 1 ) 1 1 2 ) , 0 ) " wl = Range ( " D l O " ) . Va lue
_
_
Непараметрические критерии мя независимых в ыборок
76 GoTo L i n e l E:nd S e l e c t
Range ( C e l l s ( 4 , 1 ) , Ce l l s ( 4 , m + n ) ) . C l e a rCon t e n t s R a n g e ( Ce l l s (1 0 , 1 ) , Ce l l s ( 1 0 , 4 ) ) . C l ea rC o n t e n t s E:nd S u b
§4 . Критерий М ан н а - У итн и
1 2]
Статистика критерия однородности Манна-Уитни ( Mann-Whitney U test) [ - число пар (х;, у;), в которых варианты первой выборки меньше вариант второй:
При перестановке местами выборок статистика И, обозначим ее
Ир переходит в статистику
""
И2 = L., L., cij, cij = ,
1
1 1,
0. x � yi" yj' Х;
>
Эти статистики, чтобы не исключались из рассмотрения пары (х;, у;), в которых Х; = У; · записывают в виде: И , = LL cu, j
j
c ij
11 ,
Тогда выполняется: О, и, + и2
= т . п.
+ 1)
У ;
1
Справедливы формулы: {!1
_ -
111
. п + т(т
2
_ 1,\ р
и .,-
=
11,
И 2 = LL c ij , си = 0, 5 ,
= 0, 5, Х; = j ,
т
·
/1
)
п(п + 1) + --'--�
О,
Х;
Х;
Х;
= yУ;· j
>
У) и уровня значимости а = 0,05 для краткости не приво дятся, возвращает: .�Jcrosoft
�-- - -
�-
Excel
�
-
.
.
,
-
Значенне ст�тистики: U- 1 9 . Критерий принятия
., Но:
-
-
,t�
..,.
'. ·
�
(Е)
U > 34. Принять: Х > У .
ок
Код ма кро са
Рис. 2. 33
Sub I_tes t_M_W ( ) Dim n As I n tege r , m As I ntege r , h As Integer, u As S i ngle , v As S i n g l e , a l f a As S i n g l e , s i gma As S i n g l e , s As S i n g l e , s t r As S t r ing, tip As I n teger Dim х ( ) As S i n g l e , у ( ) As S i n g l e m = О: n = О For i = 1 То Selection . Co l umn s . Count If Cel l s ( l , i ) . Value < > Empty Then m = m + 1 End I f I f Cel l s ( 2 , i ) . Value < > Empty Then n = n + 1 End I f Next ReDim х ( 1 Т о m ) : Re Dim у ( 1 Т о n ) For i = 1 Т о m x ( i ) = Cel l s ( l , i ) . Value Next For i = 1 То n у ( i ) = Cel l s ( 2 , i ) . Value Next
Критерий манна-Уитни s = о For i То m = 1 То n For I f x ( i ) < y ( j ) Then s = s + 1 Else If х (i) у ( j ) Then s = s + 0.5 End I f End I f Next Next tip = Appl ication . I nputBox ( " Bвeдитe номер альтернативной гипотезы : " & Chr ( l З J & " 1 . Х < > У ; 2 . Х > У ; 3 . Х < У " , Туре : = 1 ) I f m < = 2 0 And n < = 2 0 Then If tip = 1 Then h = App l i cation . I nputBox ( " Bвeдитe номер уровня значимости критерия : " & Chr ( 1 3 ) & " 1 . 0 , 0 2 ; 2 . 0 , 0 5 ; З . 0 , 1 0 ; 4 . О , 2 0 •• , Туре : : ! ) Else h = App l i cation . I nputBox ( " Bвeдитe номер уровня значимости критерия : " & Chr ( 1 3 ) & " 1 . 0 , 0 1 ; 2 . 0 , 0 2 5 ; З . 0 , 0 5 ; 4 . 0 , 1 0 " , Type : = l ) End I f u = Q (m, n , h ) v = m • n - u Else a l fa = Appl i c a t i o n . I nputBox ( " Bвeдитe уровень значимости критерия : " , Type : = l ) s i gma = m • n s igma = s i gma • (m + n + 1 ) / 1 2 s igma = Sqr ( s igma ) I f tip = 1 Then u = App l i ca t i o n . WorksheetFunc t i o n . Norminv ( a l fa / 2, m • n / 2, s i gma ) v = Appl ication . WorksheetFunction . Norminv ( l - a l fa / 2 , m • n / 2 , s i gma ) Else u = Appl ication . Workshee tFunction . Norminv ( a l f a , m • n / 2 , s i gma ) v = App l i cation . WorksheetFunc t i on . Norminv ( l - a l f a , m • n / 2 , s i gma ) End I f End I f Select Case t i p Case I s = 1 I f u < s And s < v Then str " Но . " Else " Hl . " str End I f MsgBox ( " Значение статистики : " & s & " Область принятия Но : ( " & u & " ; " & v & " ) . Принять : " & s t r ) Case I s = 2 I f s < u Then " Х > У." str Else str " Но . ••
81
_
Непараметрические критерии А/1Я неза в исимых в ыборок
82 End I f
MsgBox ! " Значение статистики : U=" & s & " Прин я т ь : " & s t r ) Case I s = З I f v < s Then str = " Х < У . "
& "
.
Else
" s t r = 1 1 Но .
End I f
MsgBox ( " З начение статистики : U=" & s & "
При н я т ь : " & s t r ) E n d Select
& "
.
Критерий принятия Но : U > " & u
Критерий принятия Н о : U < " & v
End Sub
§ 5 . Критерий серий В ал ьда - В ол ьфовитца
1. Для применения критерия серий Вальда-Вольфовитца (Wald Wolt"owitz twosample test) заданные выборки стр. объ единяются в одну выборку объема п, которая сортируется в по рядке возрастания. Серией в ней называется последовательность значений одной выборки, ограниченная значениями другой. Стати стикой критерия является количество серий И. При � min( , п ), max(m, п ) � 20 принимается гипотеза Н0 : F1 (x) = = Fi x), если 1 < И < п 2 , в противном случае, принимается гипотеза Н1 : F1 (x) -:;: Fix). Критические значения п1 и п 2 по объемам выборок и уровню значимости а находятся из таблицы таблица 6.7). При max(m, п ) > 20 от статистики U переходят к статистике
т+
2
z
=
nm
2m · n +i)I - ! lu - (_ т+п 2 2т ·n(2m ·n-m-n) (m+n)2(m + n-1)
-;:
([16], 82-84)
([2],
:::===
имеющей приближенно, если гипотеза Н0 верна, стандартное нор малыюе распределение. Гипотеза Н0 : F1 (x) = Fix) принимается, если 1 Z 1 < и 1 " ' где и 1 " - квантиль стандартного нормального распределе- 'i -2
ния уровня 1 - - . В противном случае принимается гинотеза Н1 : F1 (x) -:;: -:;: Fi x). Задача 2 . 6 . Применяя критерий серий проверить при а = 0,05 гипотезу Н0 : F1 (x) = Fix) од1 юрод11uстн выборок: а
2
Критерий серий Вальда-Вольфовитца
83
yj :
8,6 8,7 9,0 9,5 9,8 9,2 9,4 9,6 9,9 1 0, 1 Альтернативная гипотеза Н1 : F1 (x) * F2 (x).
Х; :
10,2 1 0,5
1 0,5
1 1 ,0
Технология решения .
1 . Вводим выборочные данные на рабочий лист: ,__ 1 ..._.-'8,6 А
В
с
о
Е
F
G
8.7 9 9,5 9,8 10,2 9 2 9 4 9 6 9 9 10 10 5 10 5
2
н
Рис. 2. 34
2. В стро�е 4 объединяем выборки, в строке 5 указываем номера выборок, в которые входят варианты строки 4:
ш _ 8 ,6 ш 1
9 ,8 1
8 ,7_ 1
1 0 .2 1 1
92 2
94 2
9 6Г9 9 1 2 2
1 01 1 6 51 1 0 5r--1il 2 2 2 2
Рис. 2. 35
3. Выделяем диапазон A4:N4 (объединенную выборку) и прово дим сортировку по возрастанию, что дает: 4 5
86 1
87 1
9 1
92 2
94 2
95 1
96 2
98 1
Рис. 2. 36
2j_
99
lL__!j_ 2 -1L
10
10 2
10 5
10 5
11 2j
4. В ячейку А6 вводим значение 1 , в ячейке В6 записываем фор мулу, которая возвращает номер серии, в которую входит эле мент, находящийся в ячейке В5: = ЕСЛИ(А5= В5;А6; А6+ 1 ). Копируя ее в ячейки диапазона C6:N6, получаем номер серии для каждого элемента строки 5:
�·�т �пr 9 .;r 9 ·il 9 .�1 9 .�1 9 .�r 9 .F1 �T 1 0 .f+ 1 0 .; r_J o .;: 1 �1 l 1! 1 1 2 2 4 5 6 6 8 8 в.
з
7
в
Рис. 2. 3 7
Откуда следует И = 8. 5. По таблице критических точек находим n 1 = n 1 (0,05;6;8) = 3, п 2 = ni0,05;6;8) = 1 2. Так как п 1 < И < п 2 , то нулевая гипотеза принимается.
Непараметрические критерии w..я независимых в ыборок
84
Ответ: гипотеза однородности принимается.
Макрос I_test_W_W проводит вычисления автоматически и воз вращает полученные результаты и вывод о том, какая гипотеза при нимается. Для применения макроса надо ввести выборочные данные в первые две строки рабочего листа Ехсе\, начиная с ячейки А 1 , вы делить диапазон с данными, запустить макрос на исполнение и сле довать указаниям. Например, запуск макроса I_test_W_W на исполнение, когда входные данные, как на рис. 2.34, открывает окно ввода номера уров ня значимости:
Введ11те номер уровня знач11•юст11 кр11тер11я: 1.
О, 1;
1
2 . 0,05; З . 0, 02; 4, 0 , 0 1
J
ок .___�__,
[
Отмена
Рис. 2. 38
Команда ОК возвращает результаты, совпадающие с полученны ми ранее:
Зн�чен'1е
ст�т11ст11к11 : 8 . Обл�сть
пр11нят11я Но: (З; 1 2) . Принят ь : Но.
ок
Рис. 2. 39
По команде ОК появляется окно: ; -·" '\.:',.,
�,,.......,. . _ ._,.. _ ...-.-" - '-�
В ы во.а.
•
:/)
\
-
-·- �-- -
.
•
В
Остав11ть выч1клен11я?
Да
Нет
Рис. 2.40
Критерий серий Вальда-Вольфовитца
85
Команда Да оставляет вычисления на рабочем листе, команда Нет их удаляет. Задача 2.7 . Проверить при уровне значимости а = 0, 1 5 гипотезу Н0 : F1 (x) = Fix) однородности выборок: Х; : 3 1 26 33 1 1 1 3 5 18 1 2 1 6 1 7 23 20 2 1 9 yj : 1 2 7 4 8 3 6 1 0 25 22 24 1 5 1 9 14 36 34 32 27 29 30 35 28 Альтернативная гипотеза Н1 : F1 (x) *- F2 (x). Технолоrия решения. Вызывается макрос I_test_W_W, вводятся, и выделяются выборочные данные: В
26
7
С
33 4
0 11
8
Е
F
13
5
3
6
G 18
10
Н 1
25
1
J
2
16 24
22
К L М N 1 7 23 20 21 15
19
14
36
О
Р
Q
R
S
Т
U
34
32
27
29
30
35
28
9
Рис. 2. 4 1
Запуск макроса I_test_W_W на исполнение открывает окно ввода уровня значимости: В вод
'.
1 0, 1 5
.... �
'
"
�
'
, ,.., ." , ....�..
'
. .'t
'
1 . ...
(RJ
Введите уровень значимости критерия :
ОК
J1
1 Отмена
Рис. 2. 42
Команда ОК возвращает:
Значение статистики : Z= 1 ,044, Критерий принятия Но: IZI < 1 , 4 4 , Принять: ок
Рис. 2. 43
Ответ: гипотеза однородности принимается.
Но,
86
Код макроса
Непараметрические критерии д11Я независимых выборок
Sub I _test _W_W ( ) Dim т As I ntege r , n As I ntege r , h As I n tege r , n l As Intege r , n2 As I n tege r , _ z As S i n g l e , u As I ntege r , t As S i n g l e , a l fa As S i n g l e For i = 1 То Selection . Column s . Count If Cel l s ( l , i) . Va l ue < > Empty Then т = i End I f I f Cel l s ( 2 , i ) . Va l ue < > Empty Then n = i End I f Next For i = 1 Т о т C e l l s ( 4 , i ) . Va l ue = Ce l l s ( l , i ) . Va l u e Next For i = 1 То n Cel l s ( 4 , т + i ) . Va l u e = C e l l s ( 2 , i ) . Va l ue Next For i = 1 То т + n If i < т + 1 Then C e l l s ( 5 , i ) . Value = Else Ce l l s ( 5 , i ) . Va lue = 2 End I f Next Range ( Ce l l s ( 4 , 1 ) , C e l l s ( 5 , т + n ) ) . Se l e c t Selection . So r t Keyl : =Range ( "A4 " ) , Orde r l : =xlAscending, Orientation : =xlLeftToRight [аб] = 1 For i = 2 То т + n If Ce l l s ( 5 , i - 1) . Value = Ce l l s ( S , i) . Va l u e Then C e l l s ( б , i) . Value = C e l l s ( б , i - 1) . Value Else Cel l s ( б , i ) . Va l u e = Cel l s ( б , i - 1 ) . Va l ue + 1 End I f Next [ а 8 ] = C e l l s ( б , т + n ) . Value : u = [ а 8 ] Select Case App l i c a t ion . WorksheetFunct i o n . Max (m, n ) Case I s d Then Ce l l s ( 4 , i) . Value : 1 Else I f Cel l s ( 1 , i ) . V a l u e < d Then Cel l s ( 4 , i) . Value : -1 Else C e l l s ( 4 , i ) . Va l ue : О End I f End If Next Line l : For i : 1 То n I f Cel l s ( 4 , i ) . Value : О Then Cel l s ( 4 , i) . De l e t e S h i f t : :xlToLeft n : n - 1 GoTo L i n e l End I f Next [а5] : 1 For i : 2 То n If C e l l s ( 4 , i - 1) . Value : Ce l l s ( 4 , i) . Value Then Ce l l s ( 5 , i ) . Value : C e l l s ( 5 , i - 1 ) . Value Else Ce l l s ( 5 , i ) . Va l u e : C e l l s ( 5 , i - 1 ) . Value + 1 End I f Next u : Ce l l s ( 5 , n ) . Va lue т : Appl i c a t i on . WorksheetFunction . Count i f ( Range (Cel l s ( 4 , 1 ) , Cel l s ( 4 , n ) ) , - 1 ) n : App l ication . WorksheetFunction . Counti f ( Range (Cel l s ( 4 , 1 ) , Ce l l s ( 4 , n ) ) , 1 ) [a8J : u Select Case n Case I s О" '\, •
{2; 1 ; · 1 ; 1 ; 2; 0; 3 ; ·5; 1
" >О'
Подсчитывает количество неnустых ячеек е д11аnа:юне, удоелетеоряющих 3аданному усnовню.
Критерий услоене в форме числа, вы�ження или текста, которы11 определяет, какие ячейки �до подсчитывать.
Сnоаек§ по ;пой функu11и
ОК
Эначение: 7
J[
Отмена
Рис. 3.2
Аналоrично, в ячейке BS подсчитываем число минусов получен ных разностей. В ячейке С5 формулой =А5+ В5 записываем число ненулевых разностей. В ячейку 05 функцией М И Н вставляем наи меньшее из значений ячеек А5 и BS:
Непараметрические критерии № пар наблюдений
1 00
мин
Чнсnо l AS:BS
'\, = {7;2} ?-------====....-=-��
Чи с л о2 .______________."" �-= ' -
Во3еращает м11нн11альное 3начение 113 сnнска аргументое. Логические 3начения и текст 11гнор�1руются.
Числ о ! :
Сrю�ка по 3 Той функции
число l ; число2j ." от 1 до за чисел1 пустых ячеек1 логических 3начен.1й среди которых 11щется мин11Мальное 3наченне,
_,,J 1
_ ок ,__
Значение: 2
О тмена
Рис. 3. 3
Теперь вызываем функцию БИНОМРАСП и вводим данные: 6ИНОМРАСП
Число _успехов DS
-.._, = 2
Число _испы тани й cs
Вероятность _успеха
Интегральная
'\,
'\,
1 12
'\,
1
= 9
= ИСТИНА
Во:3вращает от дельное значен11е бинониальноrо распределения,
_.J 1
Значенне : О,0898�375
Спраек§ по пой функции
_ ок '--'-
Отмена
Рис. 3. 4
Так как 0,0898 >
а -
2
0,1
=-=
2
0,05, то принимается нулевая гипотеза.
Ответ: нет.
Макрос I I_test_S проводит вычисления по критерию знаков авто матически и возвращает сообщение о том, какая гипотеза (основная или альтернативная) принимается. Например, задача 3. 1 решается макросом II_test_S следующим об разом. Вызываем макрос I I_test_S, вводим и выделяем данные таб лицы 3. 1 : А
70 72
в
85 86
с
63 62
о
54 55
Е
65 67
Рис. 3. 5
F
80 80
G
75 78
н
95 90
52 53
Критерий знаков
1 01
Запуск макроса на исполнение Сервис � Макросы � II_test_S � Выполнить открывает окно ввода уровня значимости критерия:
Введите уровень эночимостн кр111 е рня:
1 0, 1 J\
ОК
Отмено
Рис. 3. 6
Команда ОК открывает окно ввода номера альтернативной гипо тезы: В вод
,
·'
.
.
.
.
Введите номер 11ль тернотивной rиnотеэы: 1 . р < >О,5; 2 . р О,5, где p=P(xi 0,05 . Принять: р=О, 5 .
к
Рис. 3 . 8
Задача З . 2 . В таблице 3.2 представлены данные о числе аварий в некотором регионе за 201 1 и 20 1 2 годы. Можно ли на уровне значимо сти 5% утверждать, что аварийность в 20 1 2 году снизилось?
Непараметрические критерии № пар наблюдений
1 02 Таблнцв З. 2 20 1 1
20 1 0 r. Январь
1 25
Февраль
1 50
80
Март
80
85
Аnрель
50
Май Июнь
85
г.
20 1 1
20 1 0 r. 80
42
Август
75
43
Сентябрь
80
50
40
Октябрь
65
56
40
39
Ноябрь
50
78
43
40
Декабрь
95
83
Июль
г.
Технология решения. Вводим табличные данные: А 1 25 85
В 1 50 80
С
80 85
О
50 40
Е
F
40 39
G
43 40
Н
80 42
75 43
1
80 50
J
65 36
к
50 78
L
95 83 .
Рис. 3. 9
Запуск макроса на исполнение открывает окно ввода уровня зна чимости критерия: Ввод ..
" .._
. . .
,.·
Введите уровень значимости критерия :
l o, 05
ОК
� " •.
J 1
LEJ 1
Отмена
Рис. 3. 1 0
Команда О К открывает окно ввода номера альтернативной гипо тезы:
Введ1пе номер альтернап1вной г....,о те3ы: 1 . р < >О,5; 2 . р О,5, где р=Р(Х 0,05. Принsпь: р О Then r = r + 1 Else I f Cel l s ( 2 , i ) . Va l ue - Ce l l s ( l , i ) . Value < О Then s = s + 1 End I f End I f Next n = r + s g = Appl ication . WorksheetFunct ion . Mi n ( r , s ) a l fa = App l ication . I nputBox ( " Bвeдитe уровень значимости критерия : " , Type : = l ) tip = App l i ca t i on . I nputBox ( " Bвeдитe номер альтернативной гипотезы : " & Chr ( l 3 ) & " 1 . р О , 5 ; 2 . р< О , 5 ; З . р>О , 5 , " & Chr ( l 3 ) & " где p=P ( x i О , 5 . "
1 / 2, 1 )
Else
Str =
11
р= О , 5 . "
End I f End S e l e c t w = rormatNumЬe r ( w , 3 ) MsgBox ( " Выполняетс я : r = " & w & "
Критерий принятия Н о : r >
" & a l fa
& " . При н я т ь : " & S t r ) E n d Sub
§ 2 . Кр итерий Фишера В данном критерии ( [9), стр. 340) в качестве статистики можно при нять: h
F=
n-h+t' s
r+t' r
s
+t'
сел и
CCJI И CCJI 11
н 1< 1 >'
Н1( 2 »
н 1( :\ )
'
max(r, s). Гипотеза Н0 при альтернативной гипотезе н: 1 > на уровне значимости а. принимается, если Fu < F - -11 ( /г1 , /г2 ), /г1 = 2(п - h + 1) , k2 = 2h, h
=
1
2
иначе принимается н: 1 >. Гипотеза Н0 при альтернативной гипотезе н: 2 ) принимается, если Fll < FI u( kl ' k2 ), kl = 2 (r + 1 ), k 2 = 2s , иначе принимается н: 2 >. Ги потеза Н11 при альтернативной гипотезе н::�) принимается, если F11 < F1 "( kl ' k 2 ), k 1 = 2(s + 1 ), k 2 = 2 r, ина•1е принимается н::�>. Зна•1ение F1 _a( k P k 2 ) в MS Ехсе\ возвращает функция FРАСПОБР (а. , k l ' k2 ) . Для задачи 3. 1 , так как r = 7, s = 2: F = -- = 2 . 333. л
7
2+1
Критерий Фишера
1 05
Применяя функцию FРАСПОБР, с учетом k, = 2(2+ 1 ) = 6, k2 =
= 2 7 = 1 4 , находим F0.9 5(6, 14): ·
�.1 - o,os 1'\,1 - 6
FРАСПОбР
Вероятность 0, 1 /2 Сте:nе:ни_свободы l 6 Стеn"ни_свободыz 1 1 4
Сnраок�
по
зтой функции
�.1 - 11 ОК
Эноченме : 2,817725996
J1
Отмена
Рис. 3. 1 3
Так как F8 < F0J15(6, 14), то принимается гипотеза Н0• В задаче альтернативной будет гипотеза н� 2 > . а так как r = 2, s = 1 0, то
3.2 F11 = _!О_ :::: 3 333 . ' 2+1
Применяя функцию FРАСПОБР, получаем F0.95(6, 20) = 2,6. Так как F8 < Pii.н5(6, 20), то принимается гипотеза Н?). Критерий Фишера реализован в макросе I I_test_F, применяемом стандартным образом. В частности, применение к данным задачи возвращает:
3.1
,.....-�,....- ��-·-,.,....,.---
значение статf1ст11к11: F
'.
r._ •- -•�--
Mic.r41sof!,Excel ," ,..
• ': =
�
,· ,
.....
.,
• •
;_:
-
- -
,.· . ,
- - �ч1• ,.,.,-т
, i�--1�.,:,i,-(БJ "
2, ззз , Критерий принятия Но: F < 2,848 . Принять : р ок
-
=
0,5 .
)
Рис. 3. 1 4
Применение к данным задачи 3.2 дает:
Значение статистики :
F -
З,333 . Критерий принятия Но: F < 2,599. Принять : р < 0,5. ок
Рис. 3. 1 5
1 06
Код макроса
Непараметрические критерии № пар наблюдений
Sub I I _ t e s t _F ( ) Dim n As I ntege r , r As I ntege r , s As I n tege r , h As I n tege r , w As S i n g l e , F As S i n g l e , a l fa As S i n g l e , t i p As I n tege r , S t r As S t r i n g F o r i = 1 То Select ion . Column s . Count If Cel l s ( 2 , i ) . Value - Cel l s ( 1 , i ) . Value > О Then r = r + 1 Else I f Cel l s ( 2 , i ) . Va l u e - Ce l l s ( l , i ) . Va l u e < О Then s : s + 1 End I f End I f Next n = r + s h = Appl i c a t i on . WorksheetFunction . Max ( r , s ) a l fa = App l ication . I nputBox ( " Bвeдитe уровень значимости критерия : " , Type : = l ) t i p = Appl ication . I nputBox ( " Bв eдитe номер альтернативной гипотезы : " & Chr ( l 3 ) & " 1 . рО , 5 ; 2 . р< О , 5 ; 3 . р > О , 5 , " & Chr ( 1 3 ) & " где p=P ( x i < y i ) . " , Type : = l ) S e l e c t Case tip Case I s = 1 F = h / (n - h + 1 ) w = App l i c a t ion . WorksheetFu n c t i on . Finv ( a l fa / 2 , 2 • ( n - h + 1 ) , 2 • h ) I f F < w Then Str = "р = 0 , 5 . " Else S t r = "р < > 0 , 5 . " End I f Case I s = 2 F = s ! (r + 1) w = Appl i c a t i on . Wor ksheetFunction . Finv ( a l f a , 2 • ( r + 1 ) , 2 • s ) I f F > = w Then Str = "р < О , 5 . " Else S t r = "р = 0 , 5 . " End I f Case I s = 3 F = r / (s + 1) w = Appl i c a t i o n . WorksheetFunction . Finv ( a l fa , 2 • ( s + 1 ) , 2 • r ) I f F >= w Then Str = "р > 0 , 5 . " Else S t r = "р = 0 , 5 . " End I f End Select F = FormatNumЬe r ( F , 3 ) : w = FormatNumЬe r ( w , 3) MsgBox ( " Значение статистики : F = " & F & " . Критерий принятия Но : F < " & w & " . Принять : " & S t r ) E n d Sub
Знаковый критерий Вилкоксона
1 07
§ 3 . З н аковы й критери й В и лкоксона
Знаковый критерий Вилкоксона ( [ 10), стр. 288) учитывает н е только знаки У; - Х; , но и величины разностей. Статистика критерия записы вается в виде:
{шi1"1, (1-, s)
.•
Т=
CCJi l l
S, CCJl l l
если
Щ 2 >,
що,
н(З) 1 ,
где r - сумма рангов (порядковых номеров) положительных разно стей У; - Х; , s - отрицательных разностей, при ранжировании 1 У; - Х; 1 в возрастающем порядке, равным значениям приписывается средний ранг. Выполняется: п ( п + 1) . 1· + s = 2 Критические значения статистики Т приведены в таблице 3.3 ( [ 1 4 ) , таблица 2 1 ). Таблнца З. 3 Критические точки критерия Вилкоксона для пар наблюдений Уровень значимости л 0, 1 0 0,05 0,01 0,025 2 6 о з 2 5 о 7 з 8
1
3
5
8
9
3
5
8
10
10
5
8
10
14
11
7
10
13
17
12
9
1З
17
21
13
12
17
21
26
14
15
21
25
31 36
15
19
25
30
16
23
29
35
42
17
27
34
41
48
18
32
40
47
55
19
37
46
53
62
20
43
52
60
69
21
49
58
67
77
22
55
65
75
86
23
62
73
83
94
24
69
81
91
1 04
25
76
89
1 00
1 13
Непараметрические критерии дю. пар наблюдений
1 08
Нулевая гипотеза Hu при альтернативной гипотезе н: 1 > на уровне значимости а принимается, если табличное значение Т""
( �, )
п < Т.тr...,.
иначе принимается н: 1 >. Нулевая гипотеза Н0 при альтернативной гипотезе н:2> или нр> на уровне значимости а принимается, если табличное значение Тк1, ( а , п) < T11,r"• иначе принимается альтернативная гипотеза. При п > 25 имеет место оценка: - п(п + 1 ) + z ( а ) п(п + 1)(2п + 1 ) ' Ткр ( а, п ) -
24 4 z(a) квантиль стандартного нормального распределения уровня а. Правила проверки гипотез такие же, как в случае 5 < п $; 25. Задача 3 . 3 . Ниже приведено время (в секундах) решения кон трольных задач одиннадцатью учащимися до и после специальных упражнений по устному счету. Можно ли считать, что эти упражнения улучшили способности учащихся в решении задач? Принять а = 0,0 1 . До: 8 7 6 1 9 5 9 0 9 7 74 8 3 72 8 1 75 83 После: 50 45 79 90 88 65 52 75 81 61 52 -
Технология решения.
1 . Вводим выборочные данные, пропуская значения Х; = у;:
1 2
А
87 50
В
н
61 45
81 84
-т
75 61
Рис. 3. 1 6
2. В ячейке АЗ записываем формулу =А2-А1 и копируем се в остальные ячейки диапазона АЗ:JЗ. 3. В ячейку А4 вводим формулу =АВS(АЗ) и копируем в осталь ные ячейки диапазона A4:J4. 4. В ячейку А5 вводим, и копируем в ячейки 85: ]5, формулу =РАНГ(А4;$А4:$J4; 1 )+ (СЧ i:: ТЕСЛИ($А4:$J4;А4)- 1 )* 0,5, что дает ранги элементов четвертой строки: 3 -
4 5
-371 37 101
-1 6 1 61 65
-16 16 65
-9+ 9
35
-�-+9
35
Рис. 3. 1 7
-3 311+
85
з1
31 15
;f-
15
-1 4 14 5
-3 31�1 8 5!
Знаковый критерий Вилкоксона
1 09
5. Выделяем любую свободную ячейку, например, А7, кнопкой /(х) открываем каталог встроенных функций, где выбираем функцию СУММ ЕСЛИ. Ее диалоговое окно заполняем, как на рисунке 3. 1 8, и подтверждаем ОК, что вставляет в А7 значение r = 3. СУММЕСnи
Ди"nа•он
�д=З=:J=З -========��;:::;-'
Критерий _" >О"
Д иаnа3он_суммирован11я AS : JS
f
� = ">О" 2\.1
�
{·37; - 1 6; - 1 6;-9;-9;-:
•
{ 1 0;6,5;6, 5;3,5;3,5.
Сумм•"4>ует ячейкt1, � !ннь�е ука�жым условием.
Диаnа 3 он_суммирования фактическне ячеiiк:и для суммировання. Если диаnа3он
Спогвко по этой функщm
суммирое�ння не ук��н, будут исnоль3ое�ться ячейки, 3адаваемь1е параметром 'диапазон'. ОК
Эначеже : з
J1
Отмена
Рис. 3. 1 8
6. Аналогично находится значение s = 52, но можно и по формуле s = 1 0 · 1 1 _ 3 = 52 . 2 7. Так как проверяется гипотеза Н0 против гипотезы н?> вре мя счета уменьшилось, то Т, ,.6л = r = 3. По таблице 3.3 находим т. ,,(0,0 1 ; 10) = 5. Так как выполняется т.Р(О,0 1 ; 10) = 5 > 3 = Т, ",r>Л• 2 то принимается гипотеза н� >. Ответ: да. Критерий реализован в макросе I I_test_W, таблица 2.3 задана как процедура-функция G(x,y). Для применения макроса надо вве сти табличные данные, пропуская пары Х; = У;· если такие имеют ся, в первые две строки, начиная с ячейки А 1 1 , выделить диапазон с данными и запустить макрос на исполнение, далее следовать ука заниям. По желанию пользователя расчетная таблица остается на рабочем листе. Например, применяя макрос к последней задаче, входные данные на рис. 3. 1 6, получаем окно ввода номера выбранной альтернативной гипотезы: -
Непараметрические критерии мя пар наблюдений
1 10
(g)
Ввод Введите номер аnьтернатнвно�1
1.
р < >О,5; 2 . р О , 5,
rнnотезы:
1
p=P(xi 5 . Принять: р < 0 , 5 .
I_
ок
Рис. 3. 2 1
Команда О К открывает диалоговое окно: -...-...-
�"___"_ т -.,,..,. - --"-
-
.. P.���C:!�1�".��:i�:, ·���"tl���1.>-..�··
-.�
?,}
·-
'
Оставить
Да
.....
расче т ную таблицу? Нет
Рис. 3.22
Знаков ый критерий Вилкоксона
111
По команде Да расчетная таблица остается на рабочем листе, по команде Нет остаются только исходные данные. Задача 3 . 4 . По данным таблицы 3.4 при уровне значимости а = 0,05 проверить нулевую гипотезу Н0 : р = 0,5, конкурирующая ги потеза р > 0,5. Таблнца З.4 Х;
85 6 З 55 52 59 8 1 48 65 55 85 38 44 37 43 78 33 29 30 29 7 1 54 2 1 25 53 69 98 6 1 60
Технолоrия решения. Вызываем макрос I I_test_W. Начиная с ячейки А 1 , вводим табличные данные, диапазон A 1 :Z2 выделяем (рис. 3.23, 3.24). о
Е
н
1
J
к
L
52
59
81
65
55
85
38
53
60
82
67
57
83
40
44
37
G
F'
46
40
м 43
45
Рис. 3.23
N
78 80
о
33
30
р
29 32
Q
29 25
R
s
т
u
71 75
54 50
21 28
25 26
v
53 59
w
х
у
69
98
61
67
99
63
Рис. 3. 24
Запуская макрос на исполнение, получаем окно ввода номера альтернативной гипотезы: В �од
(8J
,
Введите номер альтернативной гиnоте3ы: 1 . р < >О,5; 2 . р < О , 5; З , р >О, 5, где p-P(xi
. '· . ·" ......�.c••
1 1 0, 735. ПринRты р
•
"
>
0,5.
Рис. 3 .2 7
По команде ОК появляется диалоговое окно, показанное на рис. 3.22. Команда Да оставляет расчетную таблицу на рабочем листе (рис. 3.28, 3.29): А
в
с
D
85 63 55 52 86 67 52 53 .3 1 1 4 3 1 3,5 21 ,5 17 ,5 3,5
1±
N
О
�
Р
Q
Рис. 3. 28 R
S
Т
U
85 83 -2 -2, 1 1 1 11 V
W
к
J
Ответ: принимается гипотеза р > 0,5.
м
�1
Х
78 33 29 29 71 54 21 25 53 69 98 00 � � � � � � � � ы � 2l .3 3.1- -4i 4k.4I 7L1l 6 -2 , 2 3 1 31 4 4 4 ' 7 1 6I 21 1 1 1 17 ,5Т 17,5 21 ,5 21 ,5 21 ,5.Q5 3,5 2� , _ ].5 Рис. 3. 29
L
38 44 37 43 40 46 40 45 21 2t 3 21 1 2 3 1 1t 1 1% . 1 у
61 63 21 2 1 1_.
z
60 ю. 10 10 26
Знаковый критерий Вилкоксона
Код макроса
1 13
Sub I I _ test_W ( ) Dim n дs I n tege r , r дs S i ng l e , s дs S i n g l e , с дs S i ngle , t дs S i ngle, _ a l f a дs S i ngle , t i p дs I n tege r , h дs Intege r , z дs S i n g l e , s t r дs S t r i ng n : Select ion . Co l umn s . Count For i : 1 То n C e l l s ( 3 , i) . Value : C e l l s ( 2 , i) . Value - C e l l s ( l , i) . Va l u e I f Cel l s ( 3 , i ) . Va l ue > О Then Ce l l s ( 4 , i ) . Value : Cel l s ( 3 , i) . Va l ue Else Ce l l s ( 4 , i ) . Va l u e : -Ce l l s ( 3 , i ) . Value End If Next For i : 1 То n s : дpp l i cation . WorksheetFunction . Rank ( C e l l s ( 4 , i ) , Range ( Ce l l s ( 4 , 1 ) , Ce l l s ( 4 , n ) ) , 1 ) r : дpp l i cation . WorksheetFunction . Count l f ( Range ( C e l l s ( 4 , 1 ) , C e l l s ( 4 , n ) ) , Cel l s ( 4 , i ) . Va l u e ) Cel l s ( 5 , i ) . Va l ue : s + ( r - 1 ) * 0 . 5 Next s : дpp l i c a t i o n . Workshee tFunction . Suml f ( Range ( C e l l s ( 3 , 1 ) , C e l l s ( 3 , n ) ) , " 0 " , Range ( Ce l l s ( 5 , 1 ) , C e l l s ( 5 , n ) ) ) с : дpp l i cation . WorksheetFunction . Mi n ( r , s ) tip : дppl icat ion . I nputBox ( " Bвeдитe номер альтернативной гипотезы : " & Chr ( 1 3 ) & " 1 . рО , 5 ; 2 . р< О , 5 ; 3 . р>О , 5 , " & Chr ( l 3 ) & " где p:P ( x i < yi ) . " , Type : :l ) I f n < : 2 5 Then If tip : 1 Then h : дpp l i cation . I nputBox ( �'Bвeдитe номер уровня значимости : " & Chr ( 1 3 ) & " 1 . 0 , 0 5 ; 2 . 0 , 1 " , Type : : l ) Else h : дppl ication . I nputBox ( " Bвeдитe номер уровня значимости : " & Chr ( 1 3 ) & " 1 . 0 , 0 1 ; 2 . 0 , 0 2 5 ; 3 . 0 , 0 5 ; 4 . 0 , 1 " , Type : : l ) End I f Else a l f a : дpp l i ca t ion . I nputBox ( " Bвeдитe уровень значимости критерия : " , _ Type : : l ) End I f Select Case n Case Is " &
При н я т ь : " & s t r )
& "
End If
I f t i p = 2 Then
If t < r Then str
р
Else
=
0, 5. "
1 1 р < 0 , 5 . 11
str End I f
MsgBox ( " Значение статистики : Т = " & r & "
&
Критерий принятия Но : Т > " &
Прин я т ь : " & s t r )
"
End If I f t i p = 3 Then If t < s Then str = " р Else End I f
=
0, 5. "
" str = " р > 0 , 5 .
MsgBox ( " Значение статистики : Т
=
" & s &
"
Критерий принятия Но : Т > " & t
Приня т ь : " & s t r )
& "
End I f Case E l s e I f t i p = l Then z = Appl i c a t i o n . WorksheetFunc t i o n . No rmS i n v ( a l f a / 2 ) Else z = App l i c a t i o n . Wo r k s h e e t Fu n c t i o n . NormS i n v ( a l f a ) End If z = FormatNumЬe r ( z , 4 ) t = n '
(n + 1 ) : t
=
t '
(2 ' n + 1 ) : t
t / 24 : t
t = n ' (n + l) / 4 + t
z • Sqr ( t )
GoTo L i n e l End S e l e c t Re s u l t = МsgВох ( " Оставить расчетную таблицу ? " , 4 + 3 2 , " Расчеты" ) I f Re s u l t = 6 Then Exit Sub End I f Range (Ce l l s ( З , 1 ) , Ce l l s ( S , n ) ) . C l e a rCon t e n t s End S u b
§4 . М од и ф и ка ци и кр и тер и я В и л коксон а
1 . При п > 25 одна из модификаций критерия Вилкоксона ( [ 1 0 ) , стр. 289) состоит в том, что в качестве статистики принимают
Модификация критерия Вилкоксона
115
п(п + 1) - Т
z = --;:::==4===
п(п + 1)(2п + 1) 24 В частности, для данных задачи 3.4 ее значение 26(26 + 1) - 1 00 4 z // = ---;:= ::: ======= 1 ,92. 26(26 + 1)(52 + 1) 24 Нулевая гипотеза Н0 при альтернативной гипотезе Н� 1 > на уровне значимости а принимается, если Zп < и -а • иначе принимается н: 1 >. ==
и
2
,�
-
1-
2
квантиль стандартного нормального распределения уровня
а
1 - -. 2 Нулевая гипотеза Н0 при альтернативной гипотезе Н?> или н�з> на уровне значимости а принимается, если Z8 < и 1 _а , иначе принимается альтернативная гипотеза. Такой подход реализован в макросе I I_test_Z, применяемом стан дартным образом. Рассмотрим применение его к задаче 3.4. Запуск макроса на исполнение, когда входные данные, как на рис. 3.23, 3.24, открывает окно ввода номера альтернативной гипотезы (рис. 3.25), затем окно ввода ур овня значимости критерия (рис. 3.26), и возвра щает: Mjcrosoft Excel ,
·. .
.,
,
.
-.
.
, .�:.1 .i;t'f
l8J
Знdчение ст�т11ст11к11: Z= 2,083. Кр11тер1111 прннЯТ'1Я Но: Z < 1 , 645. Принять: р > 0,5. ок
Код макроса
Рис. 3. 30
Sub I I_tes t_Z ( ) Dim n As I n tege r , r As S i n g l e , s As S i n g l e , с As S i ng l e , u As S i n g l e , z As S i n g l e , a l fa As S i n g l e , s t r As S t r i n g , t i p As I n teger n = Selection . Columns . Count For i = 1 То n
116
Непараметрические критерии A/'JI пар наблюдений
Cel l s ( З , i) . Va l ue : Ce l l s ( 2 , i) . Va l u e - Cel l s ( l , i) . Va l u e I f Cel l s ( З , i ) . Va l ue > О Then Ce l l s ( 4 , i) . Value : Cel l s ( З , i) . Value Else Ce l l s ( 4 , i) . Va l ue : -Ce l l s ( З , i) . Va l u e End I f Next For i : 1 Т о n s : Appl i c a t i o n . WorksheetFu n c t i on . Rank ( C e l l s ( 4 , i ) , Range ( C e l l s ( 4 , 1 ) , Ce l l s ( 4 , n) ) , 1) r : App l i ca t i o n . WorksheetFun c t i o n . Coun t i f ( Range ( C e l l s ( 4 , 1 ) , Ce l l s ( 4 , n ) ) , Ce l l s ( 4 , i ) . Va lue ) Cel l s ( 5 , i ) . Va l ue : s + ( r - 1 ) * 0 . 5 Next s : App l i ca t i o n . WorksheetFunc t i on . Sum l f ( Range ( Ce l l s ( 3 , 1 ) , Ce l l s ( 3 , n ) ) , " < О " , Range (Ce l l s ( 5 , 1 ) , Ce l l s ( 5 , n ) ) ) r : Appl i c a t i o n . WorksheetFunct ion . Sumi f ( Range (Ce l l s ( З , 1 ) , C e l l s ( З , n ) ) , " > 0 " , Range ( Ce l l s ( 5 , 1 ) , C e l l s ( 5 , n ) ) ) с : Appl i c a t ion . Wo r ksheetFunct i on . Mi n ( r , s ) tip : Appl ication . I nputBox ( " Bвeдитe номер альтернативной гипотезы : " & Chr ( l 3 ) & " 1 . р О , 5 ; 2 . р< О , 5 ; З . р > О , 5 , " & Chr ( l 3 ) & " где p:P ( x i < y i ) . " , Type : : l ) a l fa : App l ication . I nputBox ( " Bвeдитe уровень значимости критерия : " , Type : : l ) I f t i p : 1 Then u : Appl ication . Wo rksheetFu nc t i o n . NormS inv ( l - a l f a / 2 ) Else u : Appl ication . WorksheetFunc t i on . No rmS inv ( l - a l f a ) End I f z : n * (n + 1 ) / 4 : z z - с : d : n * (n + 1 ) : d : d * (2 * n + 1 ) d ; d / 24 : d ; d л (1 / 2) : z ; z / d I f t i p : 1 Then If z < u Then str : " р : 0 , 5 . " Else s t r : " р 0 , 5 . " End I f End I f I f t i p : 2 Then I f с : r And z >: u Then str " р < 0, 5 . " Else str " р : 0, 5 . " End I f End I f I f t i p : З Then If с : s And z >: u Then str : " р > 0 , 5 . " Else str ; n р ; 0 , 5 . "
N\одификация критерия Вилкоксона
117
End I f End I f
z = FormatNumЬe r ( z , 3 ) : u = formatNumЬe r ( u , 3 )
MsgBox ( " Значение статистики : Z = " & z & " . Критерий nринятия Но : Z < " & u & " . Приня т ь : " & s t r ) Re s u l t = МsgВох ( " Оставить расчетную таблицу ? " , 4 + 3 2 , " Расчеты" ) I f Re s u l t = б Then Exit Sub
End I f Range ( Ce l l s ( 3 , 1 ) , Ce l l s ( 5 , n ) ) . C l e a r C o n t e n t s
2 . При п > 25 более точная оценка т. 1,(а., п ) предыдущего парагра фа, учитывающая связки (совпадающие ранги), имеет вид: End S u b
т." ( а, п) =
п(п + 1) 4
+ z( а)
п ( п + 1) ( 2 п + 1 )
24
-у, у =
�
1)( + 1), 4 8 �i=I". /; (t; - t; 1
у несущественная , но может оказаться и полезной. Задача 3 . 5 . Найти решение задачи 3.4, применяя формулу T.r( а , п)
k число связок, t; длина связки. В большинстве случаев поправка -
-
с поправкой на связки.
Технология решения. Продолжаем вычисления, показанные на рис. 3.28, 3.29. Копируем диапазон A5:Z5 и специальной вставкой (значения) вставляем его значения в диапазон A7:Z7, затем прово дим сортировку по возрастанию. В ячейку А8 вводим 1, в ячейке В8 записываем формулу: = ЕСЛИ(А7= В7; А8;А8+ 1 ) . Копирование ее в ячейки C8:Z8 дает в ячейке Z8 число связок:
7 з.5 1 з.5Т з,5[ з.5Т- з.5Т з.5П1Т 1 1 Т 1 1 Т 1 Г 1 1 1 1 1 1 1Т 1 1 1 1 11 1 1 1 1 1 2 2 2 2 2 2 2 2 2
8
Рис. 3. 3 1
17 5' 17 5Т17 5Т17.5121 5Т 21 51 21 51 21 5Г 24Г 251 2в1 3 3 3 3 4 4 4 4 5 6 7. Рис. 3. 32
Связки 5, 6, 7, содержащие по одному элементу, можно не учиты вать. Поэтому вводим в диапазон А 1 O: D 1 О значения: 3,5; 1 1 ; 17 ,5; 2 1 , 5. Записывая в ячейке А 1 1 формулу =СЧ ЁТЕСЛИ(А7:Z7;А10) и копи руя ее в ячейки B 1 1 :D 1 1 , получаем длины связок 1, 2, 3, 4. Ввод в ячей ку А 1 2 формулы =А 1 1 * (А1 1 - 1 )*(А1 1 + 1 ) и копирование ее в осталь-
Непараметрические критерии А/1Я пар наблюдений
118
ные ячейки диапазона A 1 2: D 1 2 , а затем суммирование в ячейке Е 1 2 значений этого диапазон и деление на 48, дает значение поправки у:
1] 3]
f
1 1 17,5 1 � .5�. 6 9 4 '° 4Т-2 J о . 220 60 60! 21 .9! Рис. 3. 33
Остается в свободной ячейке провести вычисления r. r (0,05, 26) по формуле: =26*27/4+ КОРЕНЬ(26* (26+ 1 )*(2*26+ 1 )/24-2 1 ,9) * НОРМСТОБР(О,05) Она дает r. r (0,05, 26) :::. 1 1 1 , 195 > 1 00 = Т,,.6л . Ответ: нулевая гипотеза отклоняется. Поправка на связки учтена в макросе I I test Р, применяемом стандартно. Для задачи 3.5 он возвращает:
1
2
Код макроса
А
8
С
D
Е
F
G
8,6 8.7 9 9,5 9,8 10,2 9 2 9 4 9 6 9 9 10 10 5 10 5 Рис. 2. 34
Sub I I _ t e s t _ P ( ) Dim n A s I n tege r , k As I n tege r , r A s S i n g l e , s A s S i n g l e , с A s S i n g l e , g As S i n g l e , a l fa As S i n g l e , t As S i ngle , t i p As I ntege r , s t r A s S t r ing n = S e l e c t i on . Column s . Count For i = 1 То n Cel l s ( З , i) . Va l ue = C e l l s ( 2 , i) . Va l u e - Cel l s ( l , i) . Value I f Cel l s ( З , i ) . Value > О Then Ce l l s ( 4 , i) . Value = Ce l l s ( З , i) . Va l ue Else Ce l l s ( 4 , i ) . Va l ue = -Ce l l s ( З , i ) . Va l ue End I f Next For i = 1 Т о n s = Appl ication . WorksheetFunction . Rank (Cel l s ( 4 , i ) , Range ( C e l l s ( 4 , 1 ) , Cel l s ( 4 , n ) ) , 1 ) r = Appl ication . WorksheetFunction . Count i f ( Range ( C e l l s ( 4 , 1 ) , Cel l s ( 4 , n ) ) , Cel l s ( 4 , i ) . Va l u e ) Cel l s ( S , i ) . Va l ue = s + ( r - 1 ) • 0 . 5 Next s = Appl i c a t i on . WorksheetFunc t i on . Sumi f ( Range (Cel l s ( З , 1 ) , Cel l s ( З , n ) ) ,
модификация критерия Вилкоксона
1 19
" < 0 " , Range ( Ce l l s ( 5 , 1 ) , C e l l s ( 5 , n ) ) ) r = Appl i c a t i o n . WorksheetFunction . Suml f ( Range (Cel l s ( 3 , 1 ) , C e l l s ( 3 , n ) ) , " > 0 " , Range ( C e l l s ( 5 , 1 ) , C e l l s ( 5 , n ) ) ) с = Appl ication . Worksheet Function . Mi n ( r , s ) For i = 1 Т о n Cel l s ( 7 , i ) . Va l ue = Cel l s ( 5 , i ) . Value Next Range (Ce l l s ( 7 , 1 ) , Ce l l s ( 7 , n ) ) . So r t Keyl : =Range ( "A7 " ) , Order l : =xlAscending , Orientation : =x l Le ftToRight [а8] = 1 Range ( " д1 0 " ) . Value = Range («А7») . Va lue k = 1 For i = 2 То n If Ce l l s ( 7 , i) . Value = Cel l s ( 7 , i - 1) . Va l ue Then C e l l s ( 8 , i) . Value = Cel l s ( 8 , i - 1) . Value Else Cells ( 8 , i ) . Value = Ce l l s ( 8 , i - 1 ) . Value + 1 k = k + 1 C e l l s ( 1 0 , k ) . Va lue = Cel l s ( 7 , i ) . Value End I f Next For i = 1 То k C e l l s ( l l , i ) . Value = Appl ication . Worksheet Function . Count l f ( Range ( Ce l l s ( 7 , 1 ) , Cells ( 7 , n ) ) , Cells ( l O , i ) ) Next For i = 1 То k Cel l s ( 1 2 , i ) . Value = Cel l s ( l l , i ) . Value ' 3 - Ce l l s ( l l , i ) . Value Next Range ( " д1 3 " ) . Va lue = App l i ca t i o n . WorksheetFunc t i o n . Sum ( Range (Cells ( 1 2 , 1 ) , Ce l l s ( 1 2 , k ) ) ) / 4 8 tip = Appl ication . I nputBox ( " Введите ноыер альтернативной гипотезы : " & Chr ( 1 3 ) & " 1 . рО , 5 ; 2 . р< О , 5 ; 3 . р>О , 5 , " & Chr ( 1 3 ) & " где p=P ( x i < y i ) . " , Type : = l ) a l fa = App l i c a t ion . I nputBox ( " Bвeдитe уровень значимости критерия : " , Type : = l ) Range ( " B 1 3 " ) . Value = n I f t i p = 1 Then Range ( " C 1 3 " ) . Value = App l i c a t i o n . WorksheetFunction . NormS inv ( a l fa / 2 ) Else Range ( " C 1 3 " ) . Value = App l i c a t i on . WorksheetFunction . No rmS i nv ( a l f a ) End If Range ( " D 1 3 " ) . Fo rmu l a " =$8$ 1 3 * ( $8$ 1 3 + 1 ) / 4 " Range ( " Е 1 3 " ) . Formu l a "=$8$ 1 3 * ( $ 8 $ 1 3 + 1 ) * ( 2 * $8$ 1 3 + 1 ) / 2 4 - $А$ 1 3 " Range ( " F 1 3 " ) . Formu l a " =$С$ 1 3 * S q r t ( $Е $ 1 3 ) " t = App l i ca t i o n . WorksheetFunction . Sum ( Range ( " Dl 3 " ) , Range ( " F l 3 " ) ) Range ( " G l 3 " ) . Value = t I f tip = 1 Then If t < с Then str = " р = 0 , 5 . " Else
Непараметрические критерии А/1Я пар наблюдений
1 20 str = 11 р < > O , S . 11 End I f
End If I f t i p = 2 Then I f с = r And t > = с Then str = " р < 0 , 5 . " Else str = " р = 0, 5 . " End I f End I f I f t i p = З Then I f с = s And t > = с Then str = " р > 0 , 5 . " Else s t r = 1 1 р = O , S . 11 End I f End I f с = FormatNumbe r ( c , 3 ) : t = FormatNumЬer ( t , 3 ) MsgBox ( " Значение статистики : Т = " & с & " . Критерий принятия Но : Т > " & t & " . Приня ть : " & s t r ) Range (Ce l l s ( З , 1 ) , Ce l l s ( 8 , n ) ) . C l e a rC o n t e n t s Range ( Ce l l s ( 1 0 , 1 ) , Ce l l s ( 1 3 , k ) ) . C l ea rC o n t e n t s End S u b
3. При п > 25 еще более точный метод ( [2 1 ] , стр. 47), чем учиты вающий связки, предложен Иманом Р. (Iman R.). Статистика:
J=
[ v� Гп=t].
z 1+ 2
Критические точки вычисляются п о формуле: }и
= t"(n - 1) + za '
2 ta(n 1 ) - квантиль уровня а распределения Стьюдента с п 1 сте пенями свободы, za - квантиль уровня а стандартного нормального распределения. Нулевая гипотеза Hu при альтернативной гипотезе н: 1 > на уровне значимости а принимается, если } 8 < } " , иначе принимается н: 1 >. 12 Нулевая гипотеза Н0 при альтернативной гипотезе н: 2 > или н::�> на уровне значимости а принимается, если}8 О Then Ce l l s ( 4 , i) . Value = Cel l s ( З , i) . Value Else Cel l s ( 4 , i) . Value = -Ce l l s ( З , i) . Value End I f
Next ror i 1 То n s = Appl i c a t i o n . Worksheetrunct i on . Rank (Cel l s ( 4 , i ) , Range ( C e l l s ( 4 , 1 ) , Ce l l s ( 4 , n ) ) , 1 ) r = Appl i c a t i o n . Worksheetrunc tion . Count l f ( Range ( Ce l l s ( 4 , 1 ) , Ce l l s ( 4 , n ) ) , Cel l s ( 4 , i ) . Va l u e ) Cel l s ( 5 , i ) . Va l ue = s + ( r - 1 ) * 0 . 5 Next s = Appl i c a t i o n . Wo r ksheetrunction . Suml f ( Range (Cel l s ( З , 1 ) , C e l l s ( З , n ) ) , " < 0 " , Range ( C e l l s ( 5 , 1 ) , Ce l l s ( 5 , n ) ) ) r = Appl i c a t i o n . Worksheetrunct i o n . Suml f ( Range (Ce l l s ( З , 1 ) , C e l l s ( З , n ) ) , " >0 " , Ra nge ( C e l l s ( 5 , 1 ) , Cel l s ( 5 , n ) ) ) с = Appl i c a t i o n . Worksheetrunct i o n . Mi n ( r , s ) t i p = Appl i c a t i on . I nputBox ( " Bв eдитe номер аль тернативной гипотезы : " & Chr ( l З ) & " 1 . рО , 5 ; 2 . р< О , 5 ; З . р > О , 5 , " & Chr ( l 3 ) & " где p=P ( x i < y i ) . " , Type : = l ) a l fa = App l i c a t i o n . I nputBox ( " Bвeдитe уровен ь значимости критерия : " , Туре : = ! ) I f t i p = 1 Then t = Appl ication . Worksheetrunction . T inv ( a l f a , n - 1 ) z a = Appl i c a t i o n . Worksheetrunction . No rmS inv ( l - a l fa / 2 ) Else t = App l i ca t i o n . Wor ksheetrunc t i o n . T l nv ( a l fa * 2 , n - 1 ) z a = App l i c a t i o n . Worksheetrunction . No rmS i nv ( l - a l f a ) End If t = (t + za) / 2 Ь = n * ( n + 1 ) / 4 : Ь = Ь - с : d = n * (n + 1 ) : d = d • (2 * n + 1 ) d = d / 2 4 : d = d ' ( 1 / 2 ) : z = Ь / d : g = ( 1 + Sqr ( ( n - 1 ) / ( n - z • 2 ) ) ) * z / 2 I f t i p = 1 Then If g < t Then str = " р = 0 , 5 . " Else str = " р 0 , 5 . " End I f End I f I f t i p = 2 Then
Критерий Спирмена
1 23
I f с = r And g > = t Then str = 11 р < 0 , 5 . 11 Else
End I f
End I f
s t r = '' р = 0 , 5 . ''
I f t i p = 3 Then I f с = s And g > = t Then str = " р > 0 , 5 . " Else
End I f
End I f
s t r = '' р = 0 , 5 . "
t = Forma tNumЬe r ( t , 3 ) : g = Forma tNumЬe r ( g , 3 ) MsgBox ( " Значение статистики : J = " & g & "
& ".
.
Критерий прин ятия Но : J < " & t
Прин ять : " & s t r )
Range ( Ce l l s ( 3 , 1 ) , Ce l l s ( 5 , n ) ) . C l e a rCon t e n t s
E n d Sub
§ 5 . Критерий С п и рмена
По двумерной выборке (х;, у), i = 1, п , выборочный коэффициент Рв ранговой корреляции Спирмена признаков Х и У находится по фор муле: Рв
"
=
6 · � )r; - r;0 ) 2
""i""'=1'---- 1 - -" 3
r; (r/) - ранги вариант х; (у), \ Р в \ � 1 . Критерий Спирмена п о коэффициенту Р в и заданному уровню значимости а проверяет гипотезу Н0 : р1. = О, альтернативная гипотеза HI : Рг '* О. Гипотеза Но принимается, если 1 Рв 1 < т.р• где Ткр
=
n
-п
f "P ( a., n - 2 ) ·
2
,
t.r(a., п - 2 ) - критическая точка распределения Стьюдента для дву
сторонней критической области. В противном случае принимается гипотеза Н1 • В случае принятия Н0 ранговая корреляционная зависи мость между признаками признается незначимой, в противном слу чае - значимой. Задача 3 . 6 . Знания 1 0 студентов проверены по двум тестам: А и В. Оценки по стобалльной системе оказались следующими (в первой строке по тесту А, во второй - по тесту В):
Непараметрические критерии для пар наблюдений
1 24
95 90 86 84 75 70 62 60 57 50 92 93 83 80 55 60 45 72 62 70 Найти Рн и проверить при а. = 0,0 1 нулевую гипотезу Н0 : Рг = О, альтернативная гипотеза Н1 : р1• * О. Технология решения. Вводим выборочные данные: А
95
92
В 90 93
С 86 83
D 84
Е 75 55
80
F
70
60
Н
G
62
45
60 72
57
62
J
50
70.
Рис. 3. 38
В ячейке А4 записываем формулу ранга варианты ячейки А 1 , на пример, при ранжировании по убыванию: = РАН Г(А 1 ;$А 1 :$] 1 )+(СЧ Ё ТЕСЛИ($А1 :$J 1 ;А 1 )-1 ) *0,5 Копируя формулу в остальные ячейки диапазона А4:]5 получаем ранги всех вариант:
Ff] 11
21 1
31
41 4
61
51
71
вl
9'
1 01
61
1--=--1-------�--�--�--�--�--�--� ----- ·
2
3
в
9
10
5
7
Рис. 3. 39
В ячейке А7 записываем формулу: =(А4-А5У2 2 Копируя ее в остальные ячейки А7:]7 находим значения ( r; - r;) : Рис. 3.40
Кнопкой :I: в ячейку К7 вставляем сумму этих значений. В ячейке L7 вычисляем р 11 , применяя формулу: = 1 -6* К7/( 1 0"3- 1 О) Она дает р 11 = 0,636:
r 7-1
1j
от
О+-
161=. 4l
g!
Рис. 3. 4 1
+ 9
4
1 61:
60! 0,636!
Критерий Спирмена
1 25
Переходим к проверке гипотезы Н11• Выделяем свободную ячейку, например, А9 и, пользуясь кнопкой /(х), вызываем диалоговое окно функции СТЬЮДРАСПОБР, где вводим следующие данные, под тверждая их командой ОК:
СТЬЮДРАСПОБР
'\,
Вероятность О, 0 1 Степени_свободы
-
:=====�������::::: 8 '\, -
0, 0 1 8
- 3 , 35538733 1 Во3еращает обратное распределение Стьюдента.
Ст�п�ни_свободы Справка no зтой функu1-1Н
положительное цеnое число степеней сеободы� ха�ктерю:ующее D«1'1Jедепенне ,
ОК
Значеже : 3, ЗS5387331
J[
Отмена
j
Рис. 3. 42
В ячейке 89 записываем формулу: =А9 * КОРЕНЬ(( 1 - LУ2)/( 10-2)) Она возвращает т.,, = 0,9 1 5. Так как 1 Рв 1 = 0,636 < 0,9 1 5 = т." . то нулевая гипотеза Pr = О принимается. Ответ: Рн = 0,636, ранговая зависимость незначимая. Макрос I I_test_Sp находит выборочный ранговый коэффициент и проверяет гипотезу Н0 автоматически. Для применения макроса надо ввести выборочные данные в первые две строки листа MS Excel, на чиная с ячейки А 1 , выделить диапазон с данными и запустить макрос на исполнение. Например, если данные, как на рис. 3.38, то запуск макроса на исполнение возвращает полученное ранее значение вы борочного коэффициента Спирмена:
?
Коэффициент Сnирмена r Да
=
0, 6364 .
Нет
Рис. 3.43
Пров е р и т ь значимость?
Непараметрические критерии № пар наблюдений
1 26
По команде Да появляется окно ввода уровня значимости крите рия (рис. 3.44). - 7 "'\�;�:�.r;i,.��t ! :.. Bвo A lt ,L ;•: ! ...."-, •
, .",
�· " "
� "''
�
•.'.
; ."... ::..�· �
Введите уровень значимости:
1
10,01 ок
(
1[
1
Отмена
Рис. 3.44
Команда ОК возвращает: �----
.
M!�rosoft Excel
'
-
•,,.t\·; , "
- � .
- -
, ....._ . ,
•
..
�'
-
--
•
-
-�
•
·
--
.•
--,.
;. t&,
l8J
Значение r=О, 6364 . Критерин незначнr=8$4; 1 ;0) и копи руем ее в остальные ячейки диапазона В5:К14.
Непараметрические критерии № пар наблюдений
1 38
6. В ячейку LS вводим формулу =CYMM(BS:KS) и копируем ее в остальные ячейки диапазона LS:L 1 4 . 7. В ячейку М 1 5 вводим формулу =СУМ М П РОИЗВ(LS:L9; L 1 0:L 14), возвращающую значение критерия:
�I-1
1,� 11 12 13 14 15
2 4 7 1 5 6 з 5
7 1
2 1 1 1 о 1 1 1 1 1 о
4 о 1 1 о 1 1 о 1 1 о
7 о о 1 о о о о о 1 о
5 о о 1 о 1 1 о 1 1 о
6 о о 1 о о 1 о о 1 о
з о 1 1 о 1 1 1 1 1 о
7 о о 1 о о о о о 1 о
5 о о 1 о 1 1 о 1 1 о
з 5 10 2 7 8 4 7 10 2
СШ!
Рис. 3. 65
8. По таблице 3.5 находим критические значения 51 = 1 14 и 52 = 1 8 1 . Так как 51 < 1 48 < 52, то ранговая корреляционная зависимость признается незначимой Ответ: корреляционная зависимость незначимая. Критерий Ширахатэ реализован в макросе I I_test_Sh, применяемом стандартно, таблица 3.5 введена, как процедура-функция. Например, если введены данные, как на рис. 3.64, то, запуская макрос на исполнение, пользователь получает окно для ввода номера уровня значимости критерия: ".... ��
Ввод
"
\,( �;> �··4 "'· .,
·�
Введите но"ер уровнR значи'1Dст и : 1 .
12
1
ок
Рис. 3. 66
lRJ
О, 1 0;
1(
2. 0,05
Отмена
1
1
Критерий Ш ирахате
1 39
Команда ОК возвращает пол уч енные ранее рез ультаты :
MJcr�soft Exc�I
Значение статист111= Ce l l s ( 4 , j + 1) . Va lue Then Cel l s ( 4 + i, j + 1) . Va l ue = 1 Else + 1 ) . Va l u e = О Cel l s ( 4 + i , End I f Next Next For i = 1 Т о 2 • n Ce l l s ( 4 + i , 2 • n + 2 ) . Value = App l ication . WorksheetFunction . Sum ( Range ( C e l l s ( 4 + i , 2 ) , Cel l s ( 4 + i , 2 • n + 1 ) ) ) Next s = о For i 1 То n s = s + C e l l s ( 4 + i , 2 • n + 2 ) . Va lue • Ce l l s ( 4 + n + i , 2 • n + 2 ) . Value Next Cel l s ( 2 • n + 5, 2 • n + 3) . Value = s h = Appl i c a t i o n . I nputBox ( ''Bвeдитe номер уровня значимости : 1 . 0 , 1 0 ; 2 . 0 , 0 5 '' , Type : = l ) I f h = 1 Then If G ( n , 1) < s And s < G ( n , 2) Then
1 40
Непараметрические критерии № пар наблюдений
MsgBox ( " Значение статистики : S= " & s & " . Область незначимости : & G ( n , 1 ) & " , " & G ( n , 2 ) & " ) . Принять : незначимая . " ) Else MsgBox ( " Значение статистики : S= " & s & " . Область незначимости : & G ( n , 1 ) & " , " & G ( n , 2 ) & " ) . Принять : значима я . " ) End I f Else I f G ( n , 3 ) < s A n d s < G ( n , 4 ) Then MsgBox ( " Значение статистики : S= " & s & " Область незначимости : & G ( n , 3 ) & " , " & G ( n , 4 ) & " ) . Принять : незначимая . " ) Else MsgBox ( " Значение статистики : S= " & s & " . Область незначимости : & G ( n , 3 ) & " , " & G ( n , 4 ) & " ) . Принять : значима я . " ) End I f End I f Re s u l t = МsgВох ( " Оставить расчетную таблицу ? " , 4 + 3 2 , " Расчеты " ) I f Re s u l t = б Then Exit Sub End I f Range (Cel l s ( 4 , 1 ) , Cel l s ( 2 * n + 5 , 2 * n + 3 ) ) . C learContents End Sub
("
("
("
("
Н е п араметрические критерии дл я та бл и ц с о пряженн о сти §1 .
Ч еты рехклето ч н ы й 2 Х, крите р и й . . . . . . . . . . . . . . . . . 1 42
§3.
Точ н ы й крите р и й
§2. Общий случай
2 Х, крите р и я . . . . . . . . . . . . . . . . . . 1 49 Фишера
. . . . . . . . . . . .
. . . . . . . . . . 1 53
§4.
G - крите р и й Вул фа . . . . . . . 1 56
§5.
Крите р и й
§6.
Б и н о м и ал ь н ы е
Макнимары крите р и и §7.
. . . . . . . .
. . . . . . . . . 1 59
. . . . . . . . . . . . . . . . . . . .
Крите р и й Ле Роя
. .
1 63
. . . . . . . 1 67
Непараметрические критерии д/1Я табли ц сопряженности
1 42
§ 1 Ч е т ы р ехкле т оч н ы й х2 крит е рий .
Пусть имеются два признака Х и У, принимающие бинарные значеия, например, из множества { 1 , О}, и две выборки значений этих признаков Х; , i = 1, nr и .t/j , j = 1, n l/ , п + пУ = п. В этом случае составленная по частотам выборочных данных таблица 4. 1 называется таблицей сопряженности 2х2. 11
.•.
Таблнца 4. 1 ь
с
у
п.•
d
11 ,
k
:!:
о
1
а
х
п,
п"
п
Так как из соотношений n1 n , n1 nч · '
а = -·
следует: -
а
.
п
с = -· п ·
=с
то гипотеза независимости совокупностей (Х, У) и ( 1 , О) равносильна гипотезе однородности: Н11 : Р(Х = 1 I X) = P( Y = 1 1 У) , в краткой записи Н0 : р 1 = р 2 . Альтернативная гипотеза Н1 : р 1 * р 2 • Следуя [ 10) будем рассматривать и другие альтернативные гипотезы а с с а н.1 : р 1 > р 2 или н·· 1 : р 1 < р 2 , коrда - > - или - < - , соответственно. п ... n 11 п .11 п... Четырехклеточный Х2 критерий для проверки гипотезы Н0 при од ной из альтернативных гипотез Н" применяется, когда min(a, Ь , с, d) > > 3, п > 20. Статистика критерия: х- = .,
где
_
ао -
f1 o
( а - а0 )
:l
+
(/J - b1i ) ho
::!
+
( r - с0 ) �
Со
1
+
(d - d0 ) do
( а + с ) п.,. l _ (/н с/) п ,. ,. _ (а + с) п,1 ' Jo ' (о п п п
2
'
_ (b + cl)n!I
_1 ' r �о -
п
'
Четырехклеточный Х2 критерий
1 43
записывается также в виде: 2 n · (ad - bc ) 2 = х (а + /J)(c + d )(a + с)(Ь + d )
�������
С поправкой Й етса (Yates F.): 2 (1 а - llн 1 - 0,5) 2 (1 Ь - Ь11 1 - 0 , 5) 2 (1 с - С0 1 - 0,5)2 (1 d - d11 1 - 0,5) 2 + + + х = , � � � � откуда следует 2
х =
п{lad-lJтой функuии
логическое значеннеJ определяющее в11д функщ·..-1: �1нтегральная функция расnределення (ИСТИНА) или весовая функция распределения (ЛОЖЬ).
Значение : О, 01 6496309
Рис. 4 . 2 7
.___о_к_....J., 1
Отмена
Критерий N\акнима ры
161
Полученное значение 0,0 1 6 < а, принимаем гипотезу н;·.
Ответ: да.
Критерий реализован в макросе Test_M, применяемом стандарт ным образом. Например, запуск макроса на исполнение, когда вве дены табличные данные задачи 4.7, открывает окно выбора альтерна тивной гипотезы:
номер альтернатиеной 1 . P(X• l , V•O) < >P(x-o, v- 1 ); 2. P(X= l , V=O)>P(X=O,V= l ); З . P(X= l , У=О) 7,8 1 = Х2 (0,05; 3), то гипотеза однородности отклоняется.
Критерий Ле Роя
1 69
Ответ : гипотеза однородности отклоняется.
Критерий реализован в макросе Test_L_R, запускаемом на ис полнение, когда в диапазоны А1 :В2 и C 1 :D2 введены данные таблиц. Например, для данных задачи 4.8 он возвращает полученные ранее результаты:
Значение статист11к11:
R
=
1 1 , 24. Критерий принятия Н о :
R