Параметрические критерии при проверке гипотез о средних и дисперсиях

Автор работы: Пользователь скрыл имя, 12 Апреля 2014 в 16:58, курсовая работа

Краткое описание

Параметрические критерии считаются несколько более мощными, чем не-параметрические, при условии, что признак измеренная с интервальной шкале и нормально распределенная Однако с интервальной шкале могут возникнуть определенные проблемы и, если данные, представлены не в стандартизированных оценках К тому же проверка распределения ("на нормальность)" требует достаточно сложных расчетов, результат которых заранее неизвестен .Чаще распределения признаков отличаются от нормального, тогда приходится обращаться к непараметрическим критериям.

Содержание

ВВЕДЕНИЕ…………………………………………………………………..........5
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1.1 Проверка гипотезы о равенстве средних и равных дисперсий ………….... 8
1.2.Проверка гипотезы о равенстве средних неизвестных равных
дисперсий ...…………………………………………………………………….11
1.3. Основные законы распределения …..…………………………………..…13
2. ПРАКТИЧЕСКАЯ ЧАСТЬ
2.1. Использование средств ms excel для проверки гипотезы о равенстве средних равных дисперсий …………………………………………………….19
2.2. Использование средств ms excel для проверки гипотезы о равенстве средних неизвестных равных дисперсий……...……………………….………22
2.3. Построение выборочной функции распределения……………….………26
ЗАКЛЮЧЕНИЕ………………………………………………..……….……….30
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………

Вложенные файлы: 1 файл

КУРСОВАЯ ПО вероятн.doc

— 2.27 Мб (Скачать файл)

нарис.3.  
 
 
 
Рис.3.Плотность распределения Стьюдента 
 
Распределением Фишера, или F-распределением с m и n степенями свободы называется распределение случайной величины

                                                                                          (24) 
где  ,   – случайные величины, подчиненные   распределениям со степенями свободы m и n, соответственно. 
 
Плотность F-распределения:

                                           (25) 
где

 
– бета-функция. 
 
Графики (25) изображены на рис. 4 
 
 
Рис. 4. Плотность F-распределения

 

 

 

 

 

 

 

  1. ПРАКТИЧЕСКАЯ ЧАСТЬ
    1. ИСПОЛЬЗОВАНИЕ СРЕДСТВ MS EXCEL ДЛЯ ПРОВЕРКИ ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНИХ РАВНЫХ ДИСПЕРСИЙ

 
Пусть из генеральных совокупностей с известными стандартными отклонениями   извлечены выборки объемом  . 
 

Рис.5

Пусть стандартные отклонения помещены в ячейки A1 и B1, а варианты заполняют строки со второй по сто первую (ячейки A2:A101 и B2:B101,соответственно). 
Найдем выборочные средние. В ячейку C1 введем формулу

 
=СУММ(A2:A101)/100 (26)

 
и переместим маркер автозаполнения до ячейки D1.

 

Рис.6.  
Вычислим значение связанной с разностью средних статистики, подчиненной стандартному нормальному распределению. В ячейку G3 введем 
=(C1-D1)/(A1^2/100+B1^2/100)^0,5                                                            (27) 
Вероятность критического события можно найти, воспользовавшись функцией рабочего листа НОРМСТРАСП, возвращающей функцию распределения стандартного нормального закона. В ячейку G4 введем 
 
=2-2*НОРМСТРАСП(ABS(G3))                                                                (28) 
 
 
Рис.7

 
         Окончательный результат: 
 
 
Рис.8

В данном примере вероятность критического события 
 

 
поэтому на уровне значимости 0,05 гипотеза о равенстве средних должна быть отвергнута.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    1. ИСПОЛЬЗОВАНИЕ СРЕДСТВ MS EXCEL ДЛЯ ПРОВЕРКИ ГИПОТЕЗЫ О РАВЕНСТВЕ СРЕДНИХ НЕИЗВЕСТНЫХ РАВНЫХ ДИСПЕРСИЙ

 
Пусть из генеральных совокупностей выборки объемом  . Пусть варианты заполняют строки с первой по сотую (ячейки A1:A100 и B1:B100, соответственно). 
 
Для нахождения выборочных средних и выборочных дисперсий удобнее воспользоваться пакетом анализа. Из меню Сервис следует выбрать Анализ данных, далее – Описательная статистика. В качестве входного интервала следует указать два первых столбца (ячейки $A$1:$B$100). Результаты анализа можно поместить начиная с ячейки C1; установить флажок

Описательная статистика. 
 

Рис.9.

 
Найдем смешанную оценку

 
(29) 
дисперсии разности выборочных средних. В ячейку G16 введем 
 
=1/(D15+F15-2)*(1/D15+1/F15)*((D15-1)*D8+(F15-1)*F8) (30) 
 
 
 
Рис.10.

Для вычисления статистиуи

 
                                                                                                 (31)

В ячейку G17 введем

 

 =(D3-F3)/G16^0,5                                                                                     (32)

 
 
 
 
Рис.11.

 
Вычислим вероятность критического события. В ячейку G18 введем 
 
=СТЬЮДРАСП(ABS(G17);D15+F15-2;2) (33)

 
 
 
Рис.12.

 

Окончательный результат:

 

Рис.13.

Вероятность критического события

 

 
и на уровне значимости 0,05 гипотеза о равенстве средних должна быть отвергнута. 

 

 

 

 

 

 

 

 

 

 

    1. ПОСТРОЕНИЕ ВЫБОРОЧНОЙ ФУНКЦИИ РАСПРЕДЕЛЕНИЯ

Для построения выборочных функций распределения в Excel используют инструмент Гистограмма из Пакета анализа или функция ЧАСТОТА. При этом весь диапазон изменения случайной величины разбивают на интервалы равной ширины, называемые карманами. Число карманов обычно 5-15. Вычисляется число попаданий значений случайной величины в каждый карман. По ним вычисляютсястатистические (относительные) частоты - отношение числа попаданий в карман m к общему числу испытаний n (m/n), по которым и строится гистограмма выборочной функции распределения статистических вероятностей.

В качестве примера построим выборочное распределение по данным о ежедневных продажах некоторого товара – на рис. 14 показана выборка за 2 месяца. Здесь же заведен диапазон карманов – граничных значений. Данные будут группироваться в интервалы 0-170, 171-175, 176-180 и т.д.: при подсчете в карман включаются значения на правой (нижней) границе и не включаются значения на левой (верхней) границе.

                                        Рис.14

 

Построим выборочное распределение дневных продаж инструментом Гистограмма: вызов через меню СервисАнализ данных….

                             Рис. 15

На рис. 15. показано заполнение параметров инструмента. Входной интервал $А$3:$Е$14 - это диапазон исследуемых данных.Интервал карманов $G$2:$G$14 - это границы, в которые группируются входные данные. Выходной интервал $I$1 – это ячейка, начиная с которой будет выведен результат. Установите также флажок Вывод графика - гистограммы. Флажок Интегральный процентустанавливают, если надо вычислить проценты частот с накоплением и вывести график интегральных процентов. Результат работы инструмента показан на рис. 16.

                                                                      Рис. 16

 

Теперь построим выборочное распределение дневных продаж, воспользовавшись функцией ЧАСТОТА. Результат показан на рис. 17. Здесь функцией ЧАСТОТА подсчитывается лишь колонка Частота; колонки I и J следует вычислить вручную и построить график.

                Рис. 17

Проделаем следующие действия:

  1. Выделим диапазон H2:H24 и вызовите функцию ЧАСТОТА из группы Статистические и заполните параметры – рис. 18. После нажатия ОК встаньте на строку формул и нажмите Ctrl+Shift+Enter. Карманы будут заполнены частотами появления значений.
  2. В ячейку H25 введите формулу вычисления общего числа испытаний n: =СУММ(H3:H24).
  3. В ячейку I2 введите формулу вычисления статистической частоты =I2/H$15 и размножьте ее на весь диапазон I3:I14.
  4. В ячейку J2 запишите значение из I2, в ячейку J3 – формулу =J2+I3, которую следует размножить на весь диапазон J4:J14.
  5. Выделите диапазон I2:J14 для построения графика и вызовите мастер диаграмм: выберите нестандартный тип График | гистограмма 2. Построенный график (рис. 19) должен быть идентичен предыдущему (рис. 16).

              Рис. 18

                    Рис. 19

 

 

 

 

 

ЗАКЛЮЧЕНИЕ

В ходе данной курсовой работы исследуются основные возможности пакета анализа для обработки данных, проверка связи между переменными статических исследований

По сравнению со специализированными и универсальными программными статистическими комплексами пакеты анализа отличает доступность; в частности, пакеты анализа входят в состав табличного процессора MS Excel, а также табличных процессоров свободно распространяемых пакетов OpenOffice

 

 

 

 

 

 

 

 

 

 

 

 

 

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

1. Лапач С.Н., Чубенко А.В., Бабич П.Н. Статистические методы  в медико-биологических исследованиях с использованием EXCEL. –  Киев: Изд-во Морион, 2005.

2. Макарова И.Н., Трофимец Н.Я. Статистика в EXCEL.-М.: Финансы и статистика, 2002.

3. Лакин А.В. Биометрия. Учебник для вузов. — М.: Высшая   школа, 1991

4.  Гмуpман В.Е. Теория вероятностей и математическая статистика: учебное пособие. – М.: Высшая школа, 2007.

 

 


Информация о работе Параметрические критерии при проверке гипотез о средних и дисперсиях