Задачи по статистике

Автор работы: Пользователь скрыл имя, 16 Января 2011 в 03:09, задача

Краткое описание

Решение 4 задач.

Вложенные файлы: 1 файл

ДЗ Мое Лазарева.doc

— 1.60 Мб (Скачать файл)

Задание 1. Оценивание характеристик генеральной совокупности по выборке. Методы группировки. Построение таблицы частот и гистограмм.  

     По  выборке из своего варианта (объем  выборки = 20) выполнить следующие расчеты и задания:

  1. Построить статистический и вариационный ряды.
  2. Вычислить оценки математического ожидания, моды и медианы, не смещенную и смещенную оценки дисперсии, размах выборки.
  3. Построить таблицу частот и накопленных частот для сгруппированной выборки (число интервалов равно 4).
  4. Построить гистограмму частот и относительных частот.
 
 

Дана выборка  объема 20: 

3 7 9 5 7 9 9 5 2 6 7 4 3 9 8 8 8 6 5 6
 

     Запустите программу STATISTICA. Создайте новый файл для ввода данных, выполняя следующие  операции Файл-Новый-Крупноформатная  таблица. Задайте: число переменных - 1, число регистров – 20.

Установите  Размещение: В новую книгу.

 

     В поле Varl  введите выборку из задания. Далее сохраните файл (Файл - Сохранить).

     Для построения вариационного ряда выполните  следующие операции Данные-Сортировка.

     

     После построения вариационного ряда в Переключателе модулей выберите Basic Statistics/Tables (Основная статистика/таблицы). В стартовой панели модуля выберите подменю Descriptive Statistics.

     Отметьте  необходимые характеристики, введите  имя анализируемой переменной Varl в левом верхнем углу и нажмите Summary (ОК). 
 
 

       
 
 
 

     Полученные  результаты представлены в виде таблицы.

       

     Для проведения группировки выборки, в  стартовой панели модуля Basic Statistics/Tables (Основная статистика/таблицы) выберем процедуру Frequency tables.

       
 

     В этом диалоговом окне можно задать количество интервалов командой No. of exact intervals (установив количество интервалов равное четырем, для данного примера).

     

     Результаты  группировки данных приведены на рис.

     Для построения гистограммы воспользуемся этим же окном, в котором присутствует кнопка , отвечающая за построение. 
 

     Итоговый  вид гистограммы представлен  на рис.

     Кривая  Exp Normal — график плотности нормального распределения с математическим ожиданием = 6,3; и средним квадратическим отклонением s= 2,178846 

     Построим  график накопленных относительных  частот (огиву) для переменной Varl.

     Для этого в появившейся таблице  частот выбрать столбец Cumulative Percent и щелкнуть правой кнопкой мыши по его имени, в меню выбрать Graphs of Block Data... → Line Plot-Entire Colums.

      График накопленных относительных частот представлен на рис. 

       
 

Замечание. Если некоторые ячейки столбца-переменной не заполнены, то они учитываются как отсутствующие значения (missing). Например, если в файле l.sta 22v * 30с, содержащем 30 строк, в качестве переменной Varl ввести подряд с первой строчки 20 чисел, то наблюдения 21—30 являются пропущенными значениями.

При вычислении таблицы частот, пропущенные значения учитываются при подсчете относительных частот (Percent), накопленных относительных частот (Cumul. Percent): эти значения будут вычисляться делением не на 20 (по числу введенных чисел), а на 30, т. е. на 4 число строк в переменной Varl.

     Задание 2. Доверительные интервалы. Проверка гипотез о параметрах и о виде распределения. 

     По  выборке из своего варианта, используя  результаты расчетов в задании 1, выполнить  следующие расчеты и задания:

1. Вычислить  доверительные интервалы для  среднего и дисперсии нормально  распределенной генеральной совокупности при доверительной вероятности равной 1 - α = 0,95, 1 - α = 0,90.

2. На  уровне значимости α = 0,01 проверить  гипотезы:

а) : m = m0, где , где — оценка среднего, a s — оценка среднего квадратического отклонения;

б)

  1. На уровне значимости α = 0,05 проверить гипотезу о нормальном распределении генеральной совокупности по критерию χ2.
 
 

     Доверительные интервалы для среднего нормально распределенной генеральной совокупности для заданной доверительной вероятности вычисляются в модуле Анализ – Основные статистики и таблицы – Описательная статистика. 

     При доверительной вероятности равной 1 - α = 0,95

     

     При доверительной вероятности равной 1 - α = 0,90

       
 
 
 

     Доверительные интервалы для дисперсии посчитаем  в пакете MathCAD: 
 
 
 
 

     

     

       

     Для вычисления статистики хи-квадрат запустим модуль (Distribution Fitting) Подгонка распределений. Выберем Нормальное распределение:

       
 
 
 
 
 
 
 
 
 
 
 

     Зададим параметры:

 
 

      Статистика  Хи-квадрат: 

 

     Чтобы получить уровень значимости нажали в появившемся меню в строке Distribution установили Chi-Square и построили график: 

     

     На  полученном графике представлены результаты группировки, значение статистики χ2 с одной степенью свободы (d.f. = 1, так как 3-1-1 = 1) и вычисленный уровень значимости р =[Р[χ2 (1) < 0,256] = 0,25719. Так как вычисленный уровень значимости р больше заданного уровня значимости α = 0,05, то гипотеза принимается.

     Заметим, что для проверки гипотезы о виде распределения по критерию χ2 необходимо иметь выборку значительно большего объема, чем 20. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

     Проверим  гипотезы из задания 2 с помощью пакета MathCAD:

       
 

Задание 3. Доверительные интервалы для разности средних и отношения дисперсий.

Проверка  гипотез о равенстве средних  и дисперсий двух нормально распределенных генеральных совокупностей. 

По выборкам из своего и следующего по номеру вариантов  выполнить следующие расчеты  и задания:

  1. Вычислить доверительный интервал для отношения дисперсий при доверительной вероятности равной 0,95.
  2. Проверить гипотезу о равенстве дисперсий двух генеральных совокупностей.
  3. Если в п. 2 гипотеза о равенстве дисперсий принимается, то вычислить доверительный интервал для разности средних и проверить гипотезу о равенстве средних на уровне значимости α = 0,05.
  4. Если в п. 2 гипотеза о равенстве дисперсий отклоняется, то проверить гипотезу о равенстве средних по критерию Уэлча.
 

Доверительные интервалы для двух выборок:

 
 
 
 
 
 
 
 
 
 
 
 

Для проверки гипотез используем статистику Стьюдента: 

 
 
 
 
 

 
 
 
 
 
 
 
 
 
 
 
 
 
 

Результат:

 

     значение  t-статистики где .

     Число степеней свободы t-статистики: df= 20 + 20 - 2 = 38. 

     Приводится  вычисленный уровень значимости

p=P(|T(n1+n2-2)|>|t|)=P(|T(38)|>2.852)=0,000861, где T(38) — случайная величина, имеющая распределение Стьюдента с 38 степенями свободы.

     Этот  результат показывает, что на уровне значимости α= 0,05 гипотеза о равенстве средних отклоняется (гипотеза принимается на уровне значимости α = 0,000861). 

     Приведенная выше t-статистика может быть использована только в случае, если дисперсии обеих генеральных совокупностей равны. Гипотезу , можно проверить используя статистику (в числитель ставится большая оценка дисперсии): гипотеза принимается, если 

                   

где — квантиль распределения Фишера порядка 1 - α/2 с n2 - 1 и n1 - 1 степенями свободы. 
 
 

     Для рассматриваемого примера значение статистики = 1.12, а квантиль 1.551 (это значение вычислила с помощью Основные таблицы и статистики – Вероятностный калькулятор). Так как <, гипотеза о равенстве дисперсий принимается на уровне значимости α = 0,05, и применение t-статистики правомерно.

     

     Проверку  гипотезы о средних двух нормально  распределенных генеральных совокупностей можно провести, используя и другую опцию пакета STATISTICA: Basic Stat./Tables. 

     Задание 4.

     Для изучения зависимости между объемом  работ и накладными расходами произведите группировку по объему работ, образовав четыре группы предприятий с равными интервалами.

   По  каждой группе и совокупности предприятий определите.   

  1. число предприятий; 
  2. объем работ — всего и в среднем на одно предприятие;
  3. объем накладных расходов — всего и в среднем на одно предприятие;
  4. долю накладных расходов в объеме произведенных работ.

   Результаты  представьте в таблице. Существует ли зависимость между номером группы и долей накладных расходов?

№ п/п Объем работ, млн  руб. Накладные расходы, млн руб.
А 1 2
1 9,0 2,7
2 10,3 3,0
3 7,0 2,5
4 5,2 2,2
5 6,4 2,5
6 9,5 2,7
7 14,0 4,0
8 13,0 4,0
9 5,0 2,0
10 7,4 2,6
11 9,3 2,6
12 8,0 3,2
13 10,2 2,3
14 10,0 3,0
15 12,0 2,6
16 15,0 3,0
17 16,0 5,0
18 17,0 4,3
19 21,0 5,0
20 19,0 4,8
21 12,5 4,0
22 8,0 2,0
23 11,0 3,0
24 6,5 2,0
25 13,0 5,0

Информация о работе Задачи по статистике