Проверка гипотезы равенства средних двух выборок (t - критерий). Проверка гипотезы о равенстве средних двух и более совокупностей

Проверка статистических гипотез: гипотеза о равенстве средних для двух выборки

Работа носит вспомогательный характер, должна служить фрагментом других лабораторных работ.

Ни одно грамотное социологическое исследование не может обойтись без выдвижения гипотез. По большому счету можно вообще сказать, что главная его цель - это опровержение или подтверждение какого-либо предположения исследователя о социальной реальности на основе собранных им эмпирических данных. Мы выдвигаем гипотезу, собираем данные и делаем на основе статистического материала вывод. Но именно эта цепочка гипотеза-данные-вывод и содержит в себе массу вопросов, с которыми сталкивается практически любой начинающий исследователь. Основной из таких вопросов заключается в следующем: как перевести выдвинутую нами гипотезу на математический язык для того, чтобы ее потом можно было соотнести со статистическим массивом и, обработав с помощью методов математической статистики, опровергнуть или подтвердить? Здесь мы постараемся ответить на этот вопрос на примере проверки гипотез о равенстве средних.

Проверка статистических гипотез о равенстве средних

Под статистической гипотезой понимаются различного рода предположения относительно характера или параметров распределения случайной переменной, которые можно проверить, опираясь на результаты в случайной выборке.

Следует иметь в виду, что проверка статистической гипотезы имеет вероятностный характер. Также как мы никогда не можем на 100% быть уверены в том, что какой-либо выборочный параметр совпадает с параметром генеральной совокупности, мы никогда не можем абсолютно точно сказать, верна или ложна выдвинутая нами гипотеза.

Для того чтобы проверить статистическую гипотезу необходимо следующее:

1. Преобразовать содержательную гипотезу в статистическую: сформулировать нулевую и альтернативную статистические гипотезы.

2. Определить зависимые или независимые у нас выборки.

3. Определить объем выборок.

4. Выбрать критерий.

5. Выбрать уровень значимости, контролирующий допустимую вероятность ошибки первого рода, и определить область допустимых значений.

7. Отвергнуть или принять нулевую гипотезу.

Теперь рассмотрим каждый из шести пунктов более подробно.

Формулировка гипотезы

В статистических задачах часто бывает нужно сравнить средние двух разных выборок . Например, нас может интересовать разница средних зарплат мужчин и женщин, средних возрастов неких групп <А> и <В> и т.д. Или же, сформировав две независимые экспериментальные группы, мы можем сравнивать их средние с целью проверить, насколько различается, скажем, воздействие двух разных лекарств на кровяное давление или насколько размер группы влияет на отметки студентов. Иногда бывает так, что мы разбиваем совокупность на две группы попарно, то есть, имеем дело с близнецами, супружескими парами или одним и тем же человеком до и после какого-либо эксперимента и т.д. Чтобы стало более ясно, рассмотрим характерные примеры, где применяются различные критерии о равенстве средних.

Пример №1. Фирма разработала два разных препарата, понижающих давление (назовем их препараты Х и Y ) и хочет узнать различается или нет воздействие данных лекарств на больных, страдающих гипертонией. Из 50 человек с соответствующим заболеванием случайно выбираются 20 и случайно эти 20делятся на две группы по 10 человек. Первая группа в течение недели пользуется препаратом Х , вторая - препаратом Y . Затем у всех больных измеряется давление. Выдвигаемая содержательная гипотеза: препараты Х и Y по-разному влияют на кровяное давление больных .

Пример №2. Исследователь хочет узнать, как влияет продолжительность лекции на успеваемость студентов. Допустим, он избрал следующий путь: из 200 студентов случайно выбрал 50 человек и в течение месяца наблюдал за их успеваемостью. Далее он увеличил продолжительность лекций на 10 минут и в течение следующего месяца смотрел на успеваемость все тех же50 студентов. Потом он сравнил результаты каждого студента до и после увеличения продолжительности лекции. Выдвигаемая содержательная гипотеза: продолжительность лекции влияет на успеваемость студента .

Пример №3. Из 200 студентов случайно были выбраны 80 человек, и эти 80 человек разделили на две группы по 40. Одной группе задавали вопрос без установки: <Сколько вы готовы заплатить за натуральный йогурт?>, а второй группе задавали вопрос с установкой: <Сколько вы готовы заплатить за натуральный йогурт, если известно, что люди, потребляющие йогуртовые культуры, страдают на 10-15% меньше от заболеваний желудка?> Исследователь предполагал, что положительная информация о продукте, содержащаяся во втором вопросе, повлияет на респондента, и люди, отвечающие на вопрос с установкой, будут готовы заплатить за йогурт больше, нежели те, которым был предложен вопрос без установки. Выдвигаемая содержательная гипотеза: постановка вопроса влияет на ответ респондента .

Перед нами три примера, каждый из которых демонстрирует формулировку содержательной гипотезы. Теперь преобразуем наши содержательные гипотезы в статистические, но для начала немного скажем о статистических гипотезах в целом.

Наиболее частый подход к формулировке статистических гипотез - это выдвижение двух двусторонних гипотез :

Как видно из формулы, нулевая гипотеза говорит о том, что какой-либо параметр выборки или, скажем, разница между параметрами двух выборок равна некоему числу а . Альтернативная гипотеза утверждает обратное: интересующий нас параметр не равен а . Таким образом, данные две гипотезы содержат в себе все возможные варианты исходов.

Также возможна формулировка односторонних гипотез :

Иногда такие гипотезы оказываются более осмысленными. Обычно они имеют место в том случае, когда вероятность того, что наш параметр может оказаться больше (или меньше) а равна нулю, то есть такое невозможно.

Теперь сформулируем нулевую и альтернативную статистические гипотезы для наших трех примеров.

Таблица №1.

Пример №1

Пример №2

Пример №3

Препараты Х и Y по-разному влияют на кровяное давление больных

Продолжительность лекции влияет на успеваемость студентов

Постановка вопроса влияет на ответ респондента

Задача исследователя

4.Найти среднее арифметическое разностей для всех студентов, обозначаемое

Нулевая гипотеза

Смысл нулевой гипотезы

исредние генеральных совокупностей, из которых взяты выборки со среднимии. Нулевая гипотеза говорит о том, что влияние обоих лекарств на давление в среднем незначительно, и если даже выборочные средние не равны, то это объясняется лишь погрешностью выборки или иными не зависящими от нас причинами

Среднее разностей для студентов в генеральной совокупности. Нулевая гипотеза говорит о том, что на самом деле нет разницы между средним баллом студента до и после увеличения продолжительности лекции, и если даже выборочное среднее разностей отлично от нуля, то это объясняется лишь погрешностью выборки или иными не зависящими от нас причинами

Посколькусовпадает св примере №1, то объяснения можно найти в первой колонке (см. пример 1)

Альтернативная гипотеза

Вывод относительно содержательной гипотезы

Если мы принимаем нулевую гипотезу - препараты оказывают одинаковое влияние (разницы между средними нет), то мы отвергаем содержательную гипотезу, в противном случае - мы принимаем содержательную гипотезу

Если мы принимаем нулевую гипотезу - продолжительность лекции не влияет на успеваемость, то мы отвергаем содержательную гипотезу и наоборот

Если мы принимаем нулевую гипотезу - вопрос не влияет на выбор респондента, то мы отвергаем содержательную гипотезу и наоборот.

Проверка однородности двух выборок производится с помощью критерия Стьюдента (или t – критерия). Рассмотрим постановку задачи проверки однородности двух выборок. Пусть произведено две выборки объемом и . Необходимо проверить нулевую гипотезу о том, что генеральные средние двух выборок равны. То есть, и . n 1

Прежде чем рассматривать методику решения задачи рассмотрим некоторые теоретические положения, используемые для решения задачи. Известный математик У.С. Госсет (ряд своих работ публиковал под псевдонимом Стьюдент) доказал, что статистика t (6.4) подчиняется определенному закону распределения, который в последствии был назван законом распределения Стьюдента (второе название закона – ”t – распределение”).

Среднее значение случайной величины X ;

Математическое ожидание случайной величины X ;

Среднеквадратичного отклонения среднего выборки объема n .

Оценка среднеквадратичного отклонения среднего рассчитывается по формуле (6.5):

Среднеквадратичного отклонения случайной величины X .

Распределение Стьюдента имеет один параметр – количество степеней свободы .

Теперь вернемся к исходной постановке задачи с двумя выборками и рассмотрим случайную величину равную разности средних двух выборок (6.6):

(6.6)

При условии выполнения гипотезы о равенстве генеральных средних справедливо (6.7):

(6.7)

Перепишем соотношение (6.4) применительно нашему случаю:

Оценка среднеквадратичного отклонения может быть выражена через оценку среднеквадратичного отклонения объединенной совокупности (6.9):

(6.9)

Оценка дисперсии объединенной совокупности может быть выражена через оценки дисперсии, рассчитанные по двум выборкам и :

(6.10)

С учетом формулы (6.10) соотношение (6.9) можно переписать в виде (6.11). Соотношение (6.9) является основной расчетной формулой задачи сравнения средних:

При подстановке значения в формулу (6.8) будем иметь выборочное значение t -критерия . По таблицам распределения Стьюдента при количестве степеней свободы и заданном уровне значимости можно определить . Теперь, если , то гипотеза о равенстве двух средних отвергается.

Рассмотрим пример выполнения расчетов для проверки гипотезы равенства двух средних в EXCEL. Сформируем таблицу данных (рис. 6.22). Данные сгенерируем с помощью программы генерации случайных чисел пакета ”Анализ данных”:

X1 выборка из нормального распределения с параметрами объемом ;

X2 выборка из нормального распределения с параметрами объемом ;

X3 выборка из нормального распределения с параметрами объемом ;

X4 выборка из нормального распределения с параметрами объемом .


Проверим гипотезу равенства двух средних (X1-X2), (X1-X3), (X1-X4). В начале рассчитаем параметры выборок признаков X1-X4 (рис. 6.23). Затем рассчитаем значение t - критерия. Расчеты выполнит с помощью формул (6.6) – (6.9) в EXCEL. Результаты расчетов сведем в таблицу (рис. 6.24).

Рис. 6.22. Таблица данных

Рис. 6.23. Параметры выборок признаков X1-X4

Рис. 6.24. Сводная таблица расчета значений t – критерия для пар признаков (X1-X2), (X1-X3), (X1-X4)

По результатам, приведенным в таблице на рис. 6.24 можно сделать заключение, что для пары признаков (X1-X2) гипотеза равенства средних двух признаков отвергается, а для пар признаков (X1-X3), (X1-X4) гипотезу можно считать справедливой.

Такие же результаты можно получить с помощью программы “Двухвыборочный t -тест с одинаковыми дисперсиями” пакета Анализ данных. Интерфейс программы приведен на рис. 6.25.

Рис. 6.25. Параметры программы “Двухвыборочный t - тест с одинаковыми дисперсиями”

Результаты расчетов проверки гипотез равенства двух средних пар признаков (X1-X2), (X1-X3), (X1-X4), полученные с помощью программы приведены на рис. 6.26-6.28.

Рис. 6.26. Расчет значения t – критерия для пары признаков (X1-X2)

Рис. 6.27. Расчет значения t – критерия для пары признаков (X1-X3)

Рис. 6.28. Расчет значения t – критерия для пары признаков (X1-X4)

Двухвыборочный t -тест с одинаковыми дисперсиями иначе называется t -тестом с независимыми выборками. Большое распространение так же получил t -тестом с зависимыми выборками. Ситуация, когда необходимо применять этот критерий возникает тогда, когда одна и та же случайная величина подвергается измерению дважды. Количество наблюдений в обоих случаях одинаково. Введем обозначения для двух последовательных измерений некоторого свойства одних и тех же объектови , , а разность двух последовательных измерений обозначим :

В этом случае формула для выборочного значения критерия приобретает вид:

, (6.13)

(6.15)

В этом случае количество степеней свободы . Проверку гипотезы можно выполнить с помощью программы “Парный двухвыборочный t -тест” пакета анализа данных (рис. 6.29).

Рис. 6.29. Параметры программы “Парный двухвыборочный t -тест”

6.5. Дисперсионный анализ –классификация по одному признаку (F - критерий)

В дисперсионном анализе проверяется гипотеза, которая является обобщением гипотезы равенства двух средних на случай, когда проверяется гипотеза равенства одновременно нескольких средних. В дисперсионном анализе исследуется степень влияния одного или нескольких факторных признаков на результативный признак. Идея дисперсионного анализа принадлежит Р. Фишеру. Он использовал его для обработки результатов агрономических опытов. Дисперсионный анализ применяется для установления существенности влияния качественных факторов на исследуемую величину. Английское сокращенное название дисперсионного анализа – ANOVA (analysis variation).

Общая форма представления данных с классификацией по одному признаку представлена в таблице 6.1.

Таблица 6.1. Форма представления данных с классификацией по одному признаку

Среди важнейших обобщающих характеристик, относительно которых чаще всего выдвигаются гипотезы, является средняя величина. С целью проверки гипотезы о равенстве средних в генеральной совокупности необходимо сформулировать нулевую гипотезу. При этом, как правило, исходят из того, что обе выборки взяты из нормально распределенной генеральной совокупности с математическим ожиданием, равным X и с дисперсией, равной с0 . Если это предположение верно, то х1 - х2 ~ х . Фактически же выборочные средние Х1 И Х2 не будут равны из-за случайности выборки. Поэтому нужно выяснить существенность различий между х1 х2 - находится ли их разница в пределах возможной случайной вариации или же она выходит за эти пределы. Тогда задача проверки гипотезы сводится к проверке существенности различия

Каждая выборочная средняя имеет свою ошибку /и:

Определив дисперсии и среднюю ошибку выборочных средних, можно вычислить фактическое значение И-критерия и сравнить его с критическим (табличным) значением при соответствующем уровне значимости и числе степеней свободы вариации (для выборок с численностью п > 30 используется и-критерий нормального распределения, а для выборок с численностью п < 30 - и-критерий Стьюдента).

Фактическое значение и-критерия определяется по формуле

Если выборочное значение критерия попадает в критическую область (їфакі> О, нулевая гипотеза о равенстве средних отклоняется; если же выборочное значение критерия попадает в область допустимых значений (Іфакг< їа), нулевая гипотеза принимается.

Нулевая гипотеза о равенстве средних в двух генеральных совокупностях может быть также проверена путем сравнения фактической средней разницы [єФа,.т = ~~2 ) с предельной случайной ошибкой при заданном уровне значимости (еа). Если фактическая разница между выборочными средними находится в пределах случайной ошибки (єфакт < еа), нулевая гипотеза принимается. Если же фактическая разница между средними выходит за пределы случайной ошибки (еф^т > еа), нулевая гипотеза отклоняется.

При решении конкретных задач по проверке статистических гипотез относительно средних необходимо учитывать следующие моменты: 1) схему формирования выборок (выборки независимые и зависимые); 2) равенство или неравенство объемов выборок; 3) равенство или неравенство дисперсий генеральных совокупностях.

Алгоритм проверки гипотезы относительно двух средних несколько меняется, если дисперсии по выборкам (512 и 522) существенно отличаются. В этом случае при определении числа степеней свободы вводится поправка:

Когда же при неравных дисперсиях по выборкам, неровными есть и их численности (п1 и п2), табличное значение г-критерия Стьюдента следует рассчитать по формуле

где и1 и и2 - табличные значения Г-критерия Стьюдента, которые берутся в соответствии с п1 - 1 и п2 - 1 степенями свободы.

Рассмотрим пример проверки статистической гипотезы о равенстве двух средних независимых выборок равной численности (п1=п2) и равными дисперсиями (СГ;2 =).

Да, есть данные по живой массы телят при рождении двух группах коров черно-пестрой породы (коровы одного возраста). Первая группа коров имела нормальную продолжительность лактации (305 дней), а вторая группа доилась в течение 320 дней. В каждую группу вошло по 5 коров. Данные наблюдения приведены в табл. 7.2.

Таблица 7.2. Живая масса телят при рождении по группам коров с разной продолжительностью лактации

Сопоставление живых масс телят по двух группах коров показывает, что более высокая живая масса телят наблюдается у коров И группы, которые имели нормальную продолжительность лактации. Однако, в связи с тем, что численность выборок небольшая (п = 5), не исключена возможность, что разногласия между живыми массами полученные в результате действия случайных причин.

Необходимо статистически оценить разницу между средними по двум группам коров.

По результатам проверки гипотезы сделать вывод о том, что разница между средними лежит в пределах случайных колебаний, или же эта разница настолько значительная, что не согласуется с нулевой гипотезой о случайном характере различий между средними.

Если будет доказано второе положение и отклонено первых, можно утверждать, что продолжительность лактации влияет на живую массу телят.

Условие задачи предполагает, что обе выборки взяты из нормально распределенной генеральной совокупности. Формирование групп случайное (независимое), поэтому должна оцениваться разница между средними.

Определим среднюю живую массу телят по двух группах коров:

Фактическая разница между средними составляет:

Существенность этой разницы должна быть оценена. Для этого необходимо проверить гипотезу о равенстве двух средних.

Рассмотрим подробно все этапы схемы проверки гипотезы. 1. Сформулируем нулевую Но и На альтернативную гипотезы:

2. Примем уровень значимости а = 0,05, гарантируя принятие гипотезы или отказа от нее с вероятностью ошибки только в 5 случаях из 100.

3. Наиболее мощным критерием для проверки такого рода гипотезы Н0 есть и-критерий Стьюдента.

4. Сформулируем правило принятия решения по результатам

проверки Н0. Поскольку по альтернативной гипотезой х1 может быть или меньше или больше х2 , то критическая область должна быть установлена с двух

сторон: и - ~иа и и - иа, или короче: иа.

Такая форма задания критерия называется двусторонней критической областью. Критическая область при а = 0,05 будет содержаться в пределах - все значения выше, чем верхняя 2,5% и ниже, чем 2,5% точки распределения и-критерия Стьюдента.

С учетом сказанного выводы по проверке Н0 можно сформулировать так: гипотеза Н0 отклонятся, если фактическое значение Г-критерия окажется

больше табличное значение, то есть если іфакт > иа. В противном случае Ка должна быть принята.

5. Чтобы проверить Н0 нужно определить фактическое значение Г-критерия Стьюдента и сравнить его с табличным значением.

Для определения фактического значения Г-критерия Стьюдента выполним следующие вычисления.

6. Вычислим по каждой выборке скорректированные на потерю степеней свободы вариации дисперсии. Для этого предварительно возведем в квадрат значения хц и х2і:

7. Рассчитаем квадраты средних ошибок по каждой выборке и обобщенную среднюю ошибку разности средних:

8. Рассчитаем фактическое значение Г-критерия Стьюдента:

9. Определим табличное значение критерия Г-Стьюдента, исходя из уровня значимости а = 0,05 и числа степеней свободы для двух выборок:

По таблице "Критические точки распределения Стьюдента" (доп. 3) найдем и при а = 0,05 и к = 8: і005 = 2,31.

10. Сравним фактическое и табличное значение-критерия Стьюдента:

Поскольку іфаккг < и^05 (выборочное значение критерия находится в области допустимых значений), нулевая гипотеза о равенстве средних генеральных совокупностях принимается.

Итак, влияние продолжительности лактации на живую массу телят при рождении оказывается недоведенним.

Однако следует обратить внимание на такой существенный момент: живая масса телят при рождении во всех наблюдениях опыта выше в первой группе коров, которые имеют нормальную продолжительность лактации. Поэтому вместо альтернативной гипотезы На х1 ф х2 может быть взята другая. Поскольку нет оснований считать, что при нормальной продолжительности лактации живая масса телят будет ниже, то очевидно, что более целесообразной формой альтернативной гипотезы есть: На: х1 > х2.

Тогда критическая область, что составляет 0,05 всей площади под кривой распределения, будет расположена только с одной (правой) стороны, так как отрицательные значения живых масс считаются несовместимыми с условиями задачи. В связи с этим табличное значение-критерия следует определять при удвоенном значении уровня значимости (т.е. при 2а; иа = 2 o 0,05 = 0,10). Критерий проверки гипотезы формулируется так: нулевая гипотеза отклоняется, если > і2а.

Такая форма задачи критической области называется односторонней. Односторонний критерий более чувствителен к ошибкам второго рода, но его применение допустимо лишь в случае, если доказана правомерность данной альтернативной гипотезы.

Установим по таблицам (прил. 3) табличное значение-критерия при а = 0,10 и к = 8, і0Д0 = 1,86.

Итак, при использовании одностороннего критерия нулевая гипотеза отклоняется, Т.е. критерий окажется в критической области (іфакг > і0д0; 2,14 > 1,86). Таким образом, живая масса телят при рождении в группе коров с нормальной продолжительностью лактации существенно выше. Этот вывод точный, чем полученный на основе двустороннего критерия, так как здесь использована дополнительная информация для обоснования правильности применения одностороннего критерия.

Такой же вывод получим и путем сравнения возможной предельной ошибки двух выборок еа с фактической разницей средних.

Вычислим возможную предельную ошибку разности средних по двум выборкам: є0до = Г010 o /А_2 = 1,86 o 1,87 = 3,48 кг и сравним ее с фактической разницей средних:

Сопоставляя предельную возможную ошибку с фактической разницей средних, можно сделать аналогичный вывод о том, что выдвинутая гипотеза о равенстве средних не согласуется с полученными результатами.

Проверку гипотезы для случая зависимых выборок с равными чисельностями и равными дисперсиями рассмотрим на таком примере.

Да, есть данные выборочного наблюдения по продуктивности коров-матерей и коров-дочерей (табл. 7.3).

Таблица 7.3. Продуктивность коров-матерей и коров-дочерей

Необходимо проверить статистическую гипотезу относительно средней разницы между парами взаимосвязанных наблюдений в генеральной совокупности.

Так как наблюдения двух выборок попарно взаимосвязаны (зависимые выборки), то необходимо сравнивать не разницу между средними, а среднее значение разностей между парами наблюдений (и). Рассмотрим все этапы процедуры проверки гипотезы. 1. Сформулируем нулевую и альтернативную гипотезы:

При такой альтернативе необходимо применить двусторонний критерий.

2. Уровень значимости примем равным а = 0,05.

3. Самым мощным критерием проверки Н0 есть и-критерий Стьюдента.

4. Вычислим среднюю разность

5. Рассчитаем скорректированную дисперсию средней разницы:

6. Определим среднюю ошибку средней разницы:

7. Вычислим фактическое значение-критерия Стьюдента:

8. Установим число степеней свободы, исходя из численности пар взаимосвязанных разниц:

9. Найдем табличное значение Г-критерия Стьюдента при к = 4 и а = 0,05; V. = 2,78 (прил. 3).

10. Сравним фактическое и табличное значение критерия:

Фактическое значение критерия выше табличное. Следовательно, величина средней разницы между надоями двух выборок существенная и нулевая гипотеза отклоняется.

Такие же выводы получим, сравнивая возможную предельную ошибку с фактической средней разницей:

Предельная ошибка показывает, что в результате случайного варьирования средняя разница может достигать 2,4 ц. Фактическая средняя разница выше:

Итак, по результатам исследования можно с высокой степенью вероятности утверждать, что различия в значениях средних удоев коров-матерей и коров-дочерей вероятны.

8.1. Понятие зависимых и независимых выборок.

Выбор критерия для проверки гипотезы

в первую очередь определяется тем, являются ли рассматриваемые выборки зависимыми или независимыми. Введем соответствующие определения.

Опр. Выборки называются независимыми , если процедура отбора единиц в первую выборку никак не связана с процедурой отбора единиц во вторую выборку.

Примером двух независимых выборок могут служить обсуждавшиеся выше выборки мужчин и женщин, работающих на одном предприятии (в одной отрасли и т.д.).

Заметим, что независимость двух выборок отнюдь не означает отсутствие требования определенного рода сходства этих выборок (их однородности). Так, изучая уровень дохода мужчин и женщин, мы вряд ли допустим такую ситуацию, когда мужчины отбираются из среды московских бизнесменов, а женщины – из аборигенов Австралии. Женщины тоже должны быть москвичками и, более того – «бизнесвуменшами». Но здесь мы говорим не о зависимости выборок, а о требовании однородности изучаемой совокупности объектов, которое должно удовлетворяться и при сборе, и при анализе социологических данных.

Опр. Выборки называются зависимыми, или парными, если каждая единица одной выборки «привязывается» к определенной единице второй выборки.

Последнее определение, вероятно, станет более ясным, если мы приведем пример зависимых выборок.

Предположим, что мы хотим выяснить, является ли социальный статус отца в среднем ниже социального статуса сына (полагаем, что мы можем измерить эту сложную и неоднозначно понимаемую социальную характеристику человека). Представляется очевидным, что в такой ситуации целессобразно отбрать пары респондентов (отец, сын) и считать, что каждый элемент первой выборки (один из отцов) «привязан» к определенному элементу второй выборки (своему сыну). Эти две выборки и будут называться зависимыми.

8.2. Проверка гипотезы для независимых выборок

Для независимых выборок выбор критерия зависит от того, знаем ли мы генеральные дисперсии s 1 2 и s 2 2 рассматриваемого признака для изучаемых выборок. Будем считать эту проблему решенной, полагая, что выборочные дисперсии совпадают с генеральными. В таком случае в качестве критерия выступает величина:

Прежде, чем переходить к обсуждению той ситуации, когда генеральные дисперсии (или хотя бы одна из них) нам неизвестны, заметим следующее.

Логика использования критерия (8.1) похожа на ту, которая была описана нами при рассмотрении критерия “Хи-квадрат” (7.2). Имеется лишь одно принципиальное отличие. Говоря о смысле критерия (7.2), мы рассматривали бесконечное количество выборок объема n, «черпающихся» из нашей генеральной совокупности. Здесь же, анализируя смысл критерия (8.1), мы переходим к рассмотрению бесконечного количества пар выборок объемом n 1 и n 2 . Для каждой пары и рассчитывается статистика вида (8.1). Совокупности получаемых значений таких статистик, в соответствии с нашими обозначениями, отвечает нормальное распределение (как мы условились, буква z используется для обозначения такого критерия, которому отвечает именно нормальное распределение).

Итак, если генеральные дисперсии нам неизвестны, то мы вынуждены вместо них пользоваться их выборочными оценками s 1 2 и s 2 2 . Однако при этом нормальное распределение должно замениться на распределение Стьюдента – z должно замениться на t (как это имело место в аналогичной ситуации при построения доверительного интервала для математического ожидания). Однако при достаточно больших объемах выборок (n 1 , n 2 ³ 30) , как мы уже знаем, распределение Стьюдента практически совпадает с нормальным. Другими словами, при больших выборках мы можем продолжать пользоваться критерием:

Сложнее обстоит дело с такой ситуацией, когда и дисперсии неизвестны, и объем хотя бы одной выборки мал. Тогда вступает в силу еще один фактор. Вид критерия зависит от того, можем ли мы считать неизвестные нам дисперсии рассматриваемого признака в двух анализируемых выборках равными. Для выяснения этого надо проверить гипотезу:

H 0: s 1 2 = s 2 2 . (8.3)

Для проверки этой гипотезы используется критерий

О специфике использования этого критерия пойдет речь ниже, а сейчас продолжим обсуждать алгоритм выбора критерия, использующего для проверки гипотез о равенстве математических ожиданий.

Если гипотеза (8.3) отвергается, то интересующий нас критерий приобретает вид:

(8.5)

(т.е. отличается от критерия (8.2), использовавшегося при больших выборках, тем, что соответствующая статистика имеет не нормальное распределение, а распределение Стьюдента). Если гипотез (8.3) принимается, то вид используемого критерия меняется:

(8.6)

Подведем итог того, как выбирается критерий для проверки гипотезы о равенстве генеральных математических ожиданий на основе анализа двух независимых выборок.

известны

неизвестны

размер выборок большой

H 0: s 1 = s 2 отвергается

Принимается

8.3. Проверка гипотезы для зависимых выборок

Перейдем к рассмотрению зависимых выборок. Пусть последовательности чисел

X 1 , X 2 , … , X n ;

Y 1 , Y 2 , … , Y n –

это значения рассматриваемой случайной для элементов двух зависимых выборок. Введем обозначение:

D i = X i - Y i , i = 1, ... , n.

Для зависимых выборок критерий, позволяющий проверять гипотезу

выглядит следующим образом:

Заметим, что только что приведенное выражение для s D есть не что иное, как новое выражение для известной формулы, выражающей среднее квадратическое отклонение. В данном случае речь идет о среднем квадратическом отклонении величин D i . Подобная формула часто используется на практике как более простой (по сравнению с «лобовым» подсчетом суммы квадратов отклонений значений рассматриваемой величины от соответствующего среднего арифметического) способ расчета дисперсии.

Если сравнить приведенные формулы с теми, которые мы использовали при обсуждении принципов построения доверительного интервала, нетрудно заметить, что проверка гипотезы о равенстве средних для случая зависимых выборок по существу является проверкой равенства нулю математического ожидания величин D i . Величина

есть среднее квадратическое отклонение для D i . Поэтому значение только что описанного критерия t n -1 по существу равно величине D i , выраженной в долях среднего квадратического отклонения. Как мы говорили выше (при обсуждении способов построения доверительных интервалов), по такому показателю можно судить о вероятности рассматриваемого значения D i . Отличие состоит в том, что выше шла речь о простом среднем арифметическом, распределенном нормально, а здесь – о средних разностей, такие средние имеют распределение Стьюдента. Но рассуждения о взаимосвязи вероятности отклонения выборочного среднего арифметического от нуля (при математическом ожидании, равном нулю) с тем, сколько единиц s это отклонение составляет, остаются в силе.

Пусть требуется проверить нулевую гипотезу о нормальном законе распределения случайной величины. Уровень значимости принять =0,001 .

Обычно точные параметры гипотетического нормального закона нам неизвестны, поэтому нулевую гипотезу (Н0) словесно можно сформулировать следующим образом: F(х) является функцией нормального распределения с параметрами М(X) =а = и D(X) = .

Для проверки этой нулевой гипотезы найдем точечные оценки математического ожидания и среднего квадратического отклонения нормально распределенной случайной величины:

При проверке гипотезы о нормальном распределении генеральной совокупности сравниваются эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормальности распределения) частоты. Для этого используются статистика 2 - Пирсона с =k-r-1 степенями свободы (k - число групп, r - число оцениваемых параметров, в настоящем примере оценивались математическое ожидание и среднее квадратическое отклонение, следовательно, r = 2). Если 2расч. 2кр., то нулевая гипотеза отвергается и считается, что предположение о нормальности распределения не согласуется с опытными данными. В противном случае (2расч. < 2кр.) нулевая гипотеза принимается.

Вычисляются теоретические вероятности рi, попадания СВ ХN в частичные интервалы }