Статистический анализ данных уровня безработицы за 1994 – 2011гг. в России

Автор работы: Пользователь скрыл имя, 13 Октября 2013 в 09:07, курсовая работа

Краткое описание

Безработица — социально-экономическое явление, предполагающее отсутствие работы у людей, составляющих экономически активное население. Курсовая работа демонстрирует обработку реальных статистических данных уровня безработицы в России, взятых с сайта http://sophist.hse.ru/ (Единый архив экономических и социологических данных).

Содержание

Введение…………………………………………………………………………………………………..3
1.Постановка задачи……………………………………………………………………………………...4
2.Предварительная обработка данных…………………………………………………………………..5
2.1.Ранжирование выборки………………………………………………………………………………6
2.2.Построение интервального ряда…………………………………………………………………….7
2.3.Гистограмма частот и эмпирическая функция распределения…………………………………….8
2.4.Описательные статистики……………………………………………………………………………9
3.Статистический анализ………………………………………………………………………………...11
3.1.Выдвижение гипотезы……………………………………………………………………………….11
3.2.Точечное оценивание параметров…………………………………………………………………..12
3.3.Интервальное оценивание параметров……………………………………………………………..14
3.4.Проверка гипотезы…………………………………………………………………………………...15
Заключение……………………………………………………………………………………………….17
Список литературы………………………………………………………………………………………18

Вложенные файлы: 1 файл

Курсовая моя.docx

— 232.54 Кб (Скачать файл)

 

 

 

 

 

  1. Статистический анализ
    1. Выдвижение гипотезы

Гипотезы о распределениях заключаются в том, что выдвигается  предположение о том, что распределение  в генеральной совокупности подчиняется  какому-то определенному закону. Проверка гипотезы состоит в том, чтобы  на основании сравнения фактических (эмпирических) частот с предполагаемыми (теоретическими) частотами сделать  вывод о соответствии фактического распределения гипотетическому  распределению.

Рис.3

Гистограмма частот с наложенным графиком нормального распределения.

Так как гистограмма частот подходит под график плотности нормального  распределения, мат.ожидание, медиана  и мода приблизительно равны, эксцесс  и асимметрия равны нулю, то выдвинем гипотезу о нормальном распределении.

Плотность нормального распределения  записывается в виде:

Гипотеза Ho будет выглядеть следующим образом:

                                                                   

Произведем оценивание параметров μ и σ2 методом моментов и методом максимального правдоподобия.

    1. Точечное оценивание параметров

Проведем точечное оценивание параметров двумя способами: методом  моментов и методом максимального  правдоподобия.

Метод моментов:

Метод моментов заключается в приравнивании  определённого количества выборочных моментов к соответствующим теоретическим  моментам исследуемой случайной  величины, причём последние, очевидно, являются функциями от неизвестных  параметров .

Начальный и центральный  момент k-ого порядка.

Начальным моментом 1-го порядка  случайной величины x называется математическое ожидание .

Центральным моментом 2-го порядка  случайной величины x называется величина , определяемая формулой .


Выборочные моменты имеют вид:                                 

Приравнивая теоретические моменты к выборочным,


            

 получаем:

Нормальное распределение  имеет 2 параметра: μ или ( )  — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ² — дисперсия.. Т.к. согласно формуле плотности нормального распределения:

Параметр μ равен начальному моменту 1-го порядка (μ = μ 1[x]), а параметр σ2 равен центральному моменту 2-го порядка (σ2 = μ2[x]), то их можно найти, оценив соответствующие характеристики выборки. Таким образом, параметр μ будет равен характеристике g3, а параметр σ2 будет равен характеристике g6. Отсюда следует, что μ *=8,61, а σ2*=3,62.

Метод максимального  правдоподобия:

Основу метода составляет функция правдоподобия, выражающая плотность вероятности (вероятность) совместного появления результатов  выборки x1,x2,…,xn:

В качестве «наиболее правдоподобного» значения параметра берут значение, максимизирующее вероятность получить при n опытах данную выборку Х=(Х1,…,Хn).

Оценкой максимального правдоподобия  неизвестного параметра q называют значение q, при котором достигает максимума (как функция от q при фиксированных Х1,…,Хn):

Согласно методу максимального  правдоподобия в качестве оценки неизвестного параметра θ принимается  такое значение , которое максимизирует функцию L.

Нахождение оценки упрощается, если максимизировать не саму функцию L, а ln(L), поскольку максимум обеих функций достигается при одном и том же значении θ. Поэтому для отыскания оценок параметров надо решить систему уравнений правдоподобия, получаемых приравниванием частных производных нулю по параметрам, а затем отобрать то решение, которое обращает функцию ln(L) в максимум.

Плотность вероятности нормально  распределенной случайной величины

Тогда функция правдоподобия  имеет вид:

.

Логарифмируя, получим:

Для нахождения параметров μ и σ2 необходимо продифференцировать уравнение по μ и σ2 и приравнять нулю частные производные, т.е. решить систему уравнений правдоподобия:

отсюда оценки максимального  правдоподобия равны:

 

Отсюда следует, μ *=8,61, а σ2*=3,62

 

    1. Интервальное оценивание параметров

Построим доверительные  интервалы для параметров распределения. Доверительным называют интервал, который  покрывает неизвестный параметр с заданной надёжностью.

Доверительные интервалы примут вид:

 и  .

Сначала найдем доверительный  интервал для параметра μ, он будет  равен

, где  .

С помощью  функции СТЬЮДРАСПОБР пакета Microsoft Excel определим δγ с уровнем надежности γ = 0,95 и n – 1 степенями свободы. Получим значение, равное: δγ = 1,971059073.

 Теперь определим доверительный  интервал для параметра μ данного  распределения: 

,

.

Т.е. интервал [8,35; 8,86] покрывает истинное значение математического ожидания с уровнем значимости 0,05.

Теперь определим доверительный  интервал для параметра σ2, он будет равен , для нашего случая, при g=0,95, определим δ1γ  и d2g с помощью функции ХИ2ОБР пакета Microsoft Excel: δ1γ = 213,0383688, а d2g = 215,6342853. Тогда доверительный интервал для s2 будет:

,

.

Т.е. интервал [3.609; 3.653] покрывает истинное значение дисперсии с уровнем значимости 0,05.

    1. Проверка гипотезы

Для проверки статистических гипотез  о законе распределения  используются специальные  критерии согласия.

Критерий  Колмогорова

Практическое использование  критерия согласия Колмогорова осуществляется следующим образом.

Пусть – гипотетическая (непрерывная и полностью определенная) функция распределения. По результатам наблюдений строится эмпирическая функция распределения и находится величина

.

Затем задается уровень значимости и по таблицам распределения находится такое , что . Тогда, если найденная величина такова, что , то расхождение между и признается обусловленным случайностью наблюденных значений и гипотеза считается согласующейся с экспериментом (с определенным коэффициентом доверия). В противном случае гипотеза отвергается (с соответствующими сомнениями).

 

 

5,4÷ 6,4

6,4÷

7,4

7,4÷

8,4

8,4÷

9,4

9,4÷

10,4

10,4÷

11,4

11,4÷

12,4

12,4÷

14,6

ni

23

41

54

36

24

16

15

7

(ui-1 +ui)/2

5,9

6,9

7,9

8,9

9,9

10,9

11,9

13,5

 

-2,71

-1,71

-0,71

0,29

1,29

2,29

3,26

4,89

(((ui-1 +ui)/2)-g3

7,34

2,92

0,5

0,08

1,66

5,24

10,62

23,91

 

 

-1.7÷

-1.2

 

-1.2÷

-0.6

 

-0.6÷

-0.1

 

-0.1

÷0,4

 

0,4÷

0,9

 

0,9÷

1,5

 

1,5÷

2.0

 

1,9÷

3.0

G

0.106

0.29

0.54

0.71

0.82

0.89

0.96

1

F

0,123

0,26435

0,4562

0,6591

0,8264

0,9278

0,9766

0,9939

|G-F|

0.017

0.025

0.083

0.05

0.006

0.04

0.02

0.006


 

       

Dn

     

g3=8,61

g6=3,62

G=niнак/n

F=0.5+0.5*((ui+1-g3)/√g6) (функция Лапласа)

Критическое значение критерия Колмогорова  равно λ0,05=1,36

Так как λ<λ0.05 , то гипотеза H0 о нормальном законе распределения принимается с уровнем значимости 0,05.

 

 

 

 

 

 

 

 

 

 

 

 

Заключение

В ходе работы были достигнуты поставленные цели, т.е. решены основные задачи математической статистики: проверка гипотезы о типе распределения, точечные и интервальные оценки параметров распределения.

Выдвинутая на основании  графика гипотеза о нормальном распределении  была подтверждена с соответствующим  уровнем значимости. Для проверки гипотезы был использован критерий Колмогорова.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список литературы

  1. Хамитов Г.П., Т.И. Ведерникова: ВЕРОЯТНОСТИ. – Иркутск: БГУЭП, 2003. – 189 с.;
  2. Хамитов Г.П., Т.И. Ведерникова: Статистический анализ данных: Методические указания по выполнению комплексной курсовой работы. –Иркутск: БГУЭП, 2003.-10с.;
  3. Прикладная статистика и основы эконометрики. Учебник для вузов. / Айвазян С.А., Мхитарян В.С. – М.: ЮНИТИ, 1998. – 1022 с.
  4. Н.Ш.Кремер: Теория вероятностей и математическая статистика. Учебник для вузов. М.:ЮНИТИ-ДАНА, 2001. – 543с.
  5. Интернет-ресурсы: http://ru.wikipedia.org

                                              http://sophist.hse.ru/

 

 

 

 

 


Информация о работе Статистический анализ данных уровня безработицы за 1994 – 2011гг. в России