Предыдущая | Главная | Глава 7 | Следующая
7.2. Проверка статистической
гипотезы. Сравнение двух генеральных средних
Статистическая гипотеза –
понятие более емкое, чем просто оценка значения неизвестного параметра. Пусть с
помощью статистического эксперимента мы хотим проверить простую гипотезу о том,
что неизвестное среднее равно некоторому
значению . Эта гипотеза будет основой. Альтернативной ей является
также простая гипотеза или сложная гипотеза, что или что . Например, известно, что в среднем за смену на станке
производится 110 деталей. Станок сломался и его отремонтировали. Получив на отремонтированном станке показатели за n смен, мы хотим проверить гипотезы: производительность
станка не изменилась, когда альтернативной гипотезой является то, что она
изменилась, или что производительность станка увеличилась, или что
производительность станка уменьшилась.
При решении таких задач
применяется аппарат построения для соответствующей статистики области , вероятность попадания в которую достаточно близка к
1. При попадании статистики, построенной по выборке, в эту область принимается
основная гипотеза (в нашем примере, что производительность станка не изменилась,
если значение статистики попало в область, противоположную ,
принимается альтернативная гипотеза (производительность станка изменилась ). В
задачах о проверке гипотез принято область, противоположную ,
называть критической, а число - уровнем значимости. Уровень значимости обычно берут равным
0,05, иногда 0,01. При мы, проверяя на деле
истинную гипотезу о том, что , будем ее отбрасывать с вероятностью 0,05 , т.е. в
среднем 5 из 100 истинных гипотез. Эту
ошибку , когда отбрасывается основная гипотеза, хотя она истинна,
называют ошибкой первого рода, в отличие от ошибки второго рода, которую
совершают, приняв основную гипотезу, когда она ложна. В простых случаях
областями оказываются уже знакомые нам доверительные
интервалы. При проверке гипотезы мы строим с доверительной вероятностью , при
альтернативной гипотезе двухсторонний, а
при гипотезах и односторонние с нижней
границей X
доверительные интервалы. Если этот интервал накрывает гипотеза H
принимается, если не накрывает – отвергается. Приведем некоторые примеры.
Пример 7.1. В задаче про ремонт станка проверяем гипотезу об изменении
производительности станка, если за 31 смену получены данные о производительности,
для которых , .
Уровень значимости и .
Значения , участвующие в построении доверительного интервала,
отыскиваются в таблице, или в верхней строке:
Вывод – гипотеза о том,
что производительность станка не изменилась,
не проходит на уровне значимости 5%, так как старая производительность, равная
110, в 95-процентный доверительный интервал для новой средней
производительности не попал. Более того, она не попала бы в доверительный
интервал, даже если бы мы задались 98-процентным уровнем доверия, для которого .
Т.е. наша выборка показала, что гипотеза о том, что производительность станка
не изменилась, не подходит даже на уровне значимости 2%. Только при уровне
доверия интервал становится таким
большим , что
мы уже не можем быть на 99% уверены, что изменения выборки не случайны. Увидев,
что новые показатели хуже старых, берем в качестве альтернативной гипотезу о
том, что новое среднее меньше старого (такая альтернатива естественна, если ),
т.е. что производительность станка уменьшалась. Это предложение подтверждается
даже на уровне значимости 0,01. Действительно, строим односторонний
доверительный интервал для уровня доверия 0,99. Значения , участвующие
в построении одностороннего доверительного интервала, отыскиваются в таблице
7.1, или в нижней строке:
Так
как
= 110 не входит в
построенный
односторонний
интервал,
можно
принять гипотезу о том, что
производительность
уменьшилась,
на
уровне
значимости 1%.
Подчеркнем,
что
вывод
о
приемлемости
основной
гипотезы,
ее непротиворечивости
имеющимся
данным
не
означает
того,
что
доказана
ее истинность.
Принимая
ее,
в
некотором
проценте
случаев
мы
ошибемся.
Перечислим
критерии, по
которым,
не
привлекая
понятия доверительного интервала,
проверяется
статистическая
гипотеза
о
том,
что
среднее
значение
генеральной совокупности на
уровне
значимости
a
(они выведены из формул
для
двустороннего
и
одностороннего
доверительного
интервала
для уровня
доверия
).
Вычисляем
по
выборке
значение
статистики
.
1. Критическая область
для
односторонней
проверки
гипотезы,
что среднее
значение
генеральной
совокупности
по сравнению
с альтернативой
на уровне
значимости
определяется
неравенством
(отыскивается по таблице критических значений распределения
Стьюдента,
a в
верхней
строке).
2. Критическая область
для
односторонней
проверки
гипотезы,
что среднее
значение
генеральной
совокупности
по сравнению с альтернативой
на
уровне
значимости
определяется
неравенством
(
отыскивается
по
таблице критических значений распределения
Стьюдента,
a
в
нижней
строке).
1. Критическая
область
для
односторонней
проверки
гипотезы,
что среднее
значение
генеральной
совокупности
по
сравнению
с альтернативой
на
уровне
значимости
определяется
неравенством
(
отыскивается
по
таблице критических значений распределения
Стьюдента,
в
нижней
строке).
Если
вычисленное
значение
статистики
Т попадает
в
критическую
область,
то
основная
гипотеза
отвергается.
Вероятность
попадания
в
эту
область
равна
принятому уровню значимости . В этом случае
принимается
альтернативная
гипотеза.
В
нашем
примере
про
станок
, a .
Так
что
основная
гипотеза не проходит, а
проходит
альтернативная
гипотеза
<110 при уровне значимости 0,01.
Теперь
рассмотрим
две
независимые
выборки
и извлеченные из нормальных
генеральных
совокупностей
с
одинаковыми
дисперсиями ,
причем
объемы
выборок
соответственно
n и
m, a средние
, и
дисперсия
2 неизвестны. Требуется проверить
гипотезу
о том,
что
. Альтернативной является
гипотеза .
Как
известно,
выборочные
средние
– нормально
(или
приблизительно
нормально) распределенные величины, следовательно,
их
разность
– нормальная
величина
со
средним
и дисперсией, которая
вычисляется
по формуле:
.
Если
бы
дисперсия
была
известна,
мы
могли
бы
для
проверки
гипотезы
воспользоваться свойствами и
таблицами
нормального
распределения,
как мы
это
делали
при
построении
доверительного
интервала
для
среднего
при
известной дисперсии. В силу того
что
2 неизвестна, заменим
в
наших
рассуждениях неизвестную дисперсию на
ее
эмпирический
аналог.
Итак,
для
проверки
гипотезы
построим
статистику:
,
где
Теперь
к
статистике
t применим те
же
рассуждения,
которые
мы применяли
к
статистике
Т.
Если
гипотеза
верна,
статистика
t имеет распределение
Стьюдента с
степенями
свободы
и
в
качестве
области
можно
взять
интервал,
симметричный
относительно
0, в
который
величина,
распределенная
по
Стьюденту,
попадает
с
вероятностью
b,
т.е.
. Таким образом, если
нам
заданы
две
выборки
и
уровень
значимости
a,
мы
вычисляем
значение
статистики
t и ищем по
a,
n и
m в таблице 7.1 (в
ней
содержатся критические значения распределения
Стьюдента)
значение
t . Если выполняется
,
мы принимаем
гипотезу
о
том
что
и отвергаем гипотезу
, если это
неравенство
не
выполняется
- произошло
событие
из
дополнительной области, вероятность которой
. Вероятность попасть в
область
равна
.
Если
оказалось,
что,
можно
проверять
гипотезу
о
том,
что
, когда альтернативной
гипотезой
является
. В этом случае
область,
попадание
в
которую
дает
основание
принять
основную
гипотезу,
строится односторонняя.
А
именно,
в
таблице
7.1 в
нижней
строке
отыскивается
, где b – заданный уровень
доверия,
в
строке
с
нужным
числом
степеней
свободы находим
границу
интервала
t. Далее, если
выполняется
,
то первая
гипотеза
неверна
и
принимается,
что
.
Можно
проверять
гипотезу
о
том,
что , когда альтернативной гипотезой
является. В этом случае
область,
попадание
в
которую
дает
основание принять первую гипотезу,
также
строится
"односторонняя".
А именно,
гипотеза
о
том,
что
не
принимается,
а
принимается
гипотеза тогда,
когда
.
С
помощью
нижней
строки
таблицы распределения Стьюдента
мы решали
уравнения:
и
,
где - уровень значимости.
Итак,
перечислим
критерии,
по
которым
проверяется
статистическая
гипотеза о том, что средние
значения
двух
генеральных
совокупностей,
имеющих
одинаковые
дисперсии,
совпадают
() на уровне значимости
. Они выведены из
формул
для
двустороннего
и
одностороннего
доверительного
интервала для уровня доверия
.
Вычисляем
по
выборке
значение
статистики
t:
,
где
1.
Критическая область для
односторонней
проверки
гипотезы,
что средние
значения
двух
генеральных
совокупностей
совпадают
() по сравнению с альтернативой
на уровне
значимости
определяется
неравенством
(отыскивается по таблице
7.1 критических
значений
распределения Стьюдента, a в верхней строке).
2.
Критическая область для
односторонней
проверки
гипотезы,
что средние
значения
двух
генеральных
совокупностей
совпадают
() по сравнению с альтернативой на
уровне
значимости
определяется
неравенством
(отыскивается по таблице
7.1 критических
значений
распределения Стьюдента, a в верхней строке).
3.
Критическая область для
односторонней
проверки
гипотезы,
что средние
значения
двух
генеральных
совокупностей
совпадают
() по сравнению с альтернативой на
уровне
значимости
определяется
неравенством
(отыскивается по таблице
7.1 критических
значений
распределения Стьюдента, a в верхней строке).
Если
вычисленное
значение
статистики
t попадает
в
критическую
область,
то
основная
гипотеза
отвергается.
Вероятность
попадания
в
эту
область
равна
принятому уровню значимости . В этом случае
принимается
альтернативная
гипотеза.
Список основных определений
Гистограмма |
графическое изображение эмпирической
плотности, строится для группированных выборок. |
Кумулята |
график накопленных частот, сглаженное
графическое изображение эмпирической функции распределения. |
Мода |
Для дискретного вариационного ряда –
значение , эмпирическая вероятность которого максимальна; для
сгруппированного ряда входит в интервал, у которого эмпирическая вероятность максимальна,
находится графически по гистограмм или с помощью линейной интерполяции. |
Медиана |
такая точка, что половина принимаемых
значений распределения лежит слева от нее, а половина справа (середина
распределения). В случае группированного вариационного ряда эмпирически
медиана делит площадь гистограммы пополам. |
Сходимость случайной
величины по вероятности к некоторому значению |
означает, что при увеличении числа
испытаний могут встретится значения случайной величины, довольно сильно
отличающиеся от предельного значения, но процент таких испытаний будет с
ростом n уменьшаться
(вероятность отклонения от предела с
ростом n стремится к 0) |
Статистика |
любая функция , зависящая от выборки; является случайной величиной. |
Несмещённая оценка параметра |
такая оценка, математическое ожидание
которой по всевозможным выборкам данного объёма равняется истинному значению
определяемого параметра. |
Состоятельная оценка
параметра |
такая оценка, которая при увеличении
объёма выборки сходится, по вероятности к истинному значению параметра. |
Точечная оценка параметра |
оценка параметра в виде числа – точки на
координатной оси. |
Таблица 7.1. Значение распределение
Стьюдента
Принятые обозначения: - уровень значимости (
ошибка ), - уровень доверия.
В таблице заданы - решения
уравнений (
значения в верхней строке ).
Если нужно решать уравнение, ищется в нижней
строке.
Число степеней свободы |
Уровень значимости ( двухсторонняя
критическая область). Заданы |
|||
n |
0,10/0,90 |
0,05/0,95 |
0,02/0,98 |
0,01/0,99 |
1 |
6,31 |
12,7 |
31,82 |
63,7 |
2 |
2,92 |
4,30 |
6,97 |
9,92 |
3 |
2,35 |
3,18 |
4,54 |
5,84 |
4 |
2,13 |
2,78 |
3,75 |
4,6 |
5 |
2,01 |
2,57 |
3,37 |
4,03 |
6 |
1,94 |
2,45 |
3,14 |
3,71 |
7 |
1,89 |
2,36 |
3,00 |
3,5 |
8 |
1,86 |
2,31 |
2,9 |
3,36 |
9 |
1,83 |
2,26 |
2,82 |
3,25 |
10 |
1,81 |
2,23 |
2,76 |
3,17 |
11 |
1,80 |
2,22 |
2,72 |
3,11 |
12 |
1,78 |
2,18 |
2,68 |
3,05 |
13 |
1,77 |
2,16 |
2,65 |
3,01 |
14 |
1,76 |
2,14 |
2,62 |
2,98 |
15 |
1,75 |
2,13 |
2,60 |
2,95 |
16 |
1,75 |
2,12 |
2,58 |
2,92 |
17 |
1,74 |
2,11 |
2,57 |
2,90 |
18 |
1,73 |
2,10 |
2,55 |
2,88 |
19 |
1,73 |
2,09 |
2,54 |
2,86 |
20 |
1,73 |
2,09 |
2,53 |
2,85 |
30 |
1,70 |
2,04 |
2,46 |
2,75 |
40 |
1,68 |
2,02 |
2,42 |
2,70 |
60 |
1,67 |
2,00 |
2,39 |
2,66 |
120 |
1,66 |
1,98 |
2,36 |
2,62 |
|
1,64 |
1,96 |
2,33 |
2,58 |
|
0,05/0,95 |
0,025/0,975 |
0,01/0,99 |
0,005/0,995 |
|
Уровень значимости ( односторонняя критическая область ) |
Предыдущая | Главная | Глава 7 | Следующая