Статистический анализ данных уровня безработицы за 1994 – 2011гг. в России

Автор работы: Пользователь скрыл имя, 13 Октября 2013 в 09:07, курсовая работа

Краткое описание

Безработица — социально-экономическое явление, предполагающее отсутствие работы у людей, составляющих экономически активное население. Курсовая работа демонстрирует обработку реальных статистических данных уровня безработицы в России, взятых с сайта http://sophist.hse.ru/ (Единый архив экономических и социологических данных).

Содержание

Введение…………………………………………………………………………………………………..3
1.Постановка задачи……………………………………………………………………………………...4
2.Предварительная обработка данных…………………………………………………………………..5
2.1.Ранжирование выборки………………………………………………………………………………6
2.2.Построение интервального ряда…………………………………………………………………….7
2.3.Гистограмма частот и эмпирическая функция распределения…………………………………….8
2.4.Описательные статистики……………………………………………………………………………9
3.Статистический анализ………………………………………………………………………………...11
3.1.Выдвижение гипотезы……………………………………………………………………………….11
3.2.Точечное оценивание параметров…………………………………………………………………..12
3.3.Интервальное оценивание параметров……………………………………………………………..14
3.4.Проверка гипотезы…………………………………………………………………………………...15
Заключение……………………………………………………………………………………………….17
Список литературы………………………………………………………………………………………18

Вложенные файлы: 1 файл

Курсовая моя.docx

— 232.54 Кб (Скачать файл)

Байкальский государственный  университет экономики и права

 

Кафедра информатики и  кибернетики

 

 

 

КУРСОВАЯ РАБОТА

по теме:

«Статистический анализ данных уровня безработицы за 1994 – 2011гг. в России»

 

 

 

 

Работу выполнил: студент группы ИС-09-2

Михайлова А.М.

Руководитель: к. т. н.,  доцент          

Ведерникова Т.И.

 

 

 

 

 

Иркутск

2012г.

Содержание

Введение…………………………………………………………………………………………………..3

1.Постановка задачи……………………………………………………………………………………...4

2.Предварительная обработка данных…………………………………………………………………..5

2.1.Ранжирование выборки………………………………………………………………………………6

2.2.Построение интервального ряда…………………………………………………………………….7

2.3.Гистограмма частот и эмпирическая  функция распределения…………………………………….8

2.4.Описательные статистики……………………………………………………………………………9

3.Статистический анализ………………………………………………………………………………...11

3.1.Выдвижение гипотезы……………………………………………………………………………….11

3.2.Точечное оценивание параметров…………………………………………………………………..12

3.3.Интервальное оценивание параметров……………………………………………………………..14

3.4.Проверка гипотезы…………………………………………………………………………………...15

Заключение……………………………………………………………………………………………….17

Список литературы………………………………………………………………………………………18

 

 

 

 

 

 

 

 

 

 

 

Введение

Безработица — социально-экономическое явление, предполагающее отсутствие работы у людей, составляющих экономически активное население.

Согласно  определению Международной организации труда, человек в возрасте 10-72 лет (в России, по методологии Росстата, — 15-72 лет) признаётся безработным, если на критическую неделю обследования населения по проблемам занятости он одновременно:

  • Не имел работы
  • Искал работу
  • Был готов приступить к работе

Уровень безработицы — количественный показатель, позволяющий сравнить безработицу для разной численности населения (для разных стран или для разных периодов одной и той же страны). Уровень безработицы рассчитывается как отношение числа безработных к общему числу занятых в хозяйстве или к численности интересующей группы населения (безработица среди женщин, молодёжи, сельского населения и т. п.).

На протяжении уже многих лет значительный интерес представляет изучение тенденций изменения такого показателя, как уровень безработицы.

Курсовая работа демонстрирует  обработку реальных статистических данных уровня безработицы в России, взятых с сайта http://sophist.hse.ru/ (Единый архив экономических и социологических данных).

В данной работе рассмотрена  одна из важнейших задач математической статистики – обоснованный выбор  среди множества теоретико-вероятностных  моделей той, которая наилучшим  образом соответствует имеющимся  статистическим данным.

Большинство вычислений проведены с использованием программы MS Excel 2007 и STATISTICA 6.

 

 

 

 

 

 

 

 

 

 

  1. Постановка задачи

Курсовая работа посвящена исследованию числовой выборки методами статистического  анализа. В качестве исходных данных принимаются данные об уровне безработицы за 1994 – 2011 годы. Для достижения поставленной цели необходимо решить следующие задачи:

    • Ранжировать исходные данные;
    • Разбить выборку на интервалы (формула Стерджеса);
    • Сформировать таблицу частот согласно полученным интервалам;
    • Построить гистограмму частот;
    • Найти оценки числовых характеристик выборки;
    • Выдвинуть гипотезу о законе распределения;
    • Произвести точечные оценки параметров теоретического распределения методом моментов и методом максимального правдоподобия;
    • Произвести интервальную оценку параметров распределения;
    • Проверить выдвинутую гипотезу.

 

  1. Предварительная обработка данных

Исходные данные: уровень безработицы, %

 

1

2

3

4

5

6

7

8

9

10

11

12

1994

6,4

6,8

7,1

7,4

7,4

7,4

7,5

7,7

7,7

7,7

7,8

7,8

1995

7,9

8,1

8

8,2

8,3

8,4

8,5

8,8

8,9

9,2

9,1

9

1996

9,1

9,3

9,2

9,5

9,6

9,6

9,7

9,7

9,8

9,8

9,9

10

1997

10,1

10,3

10,5

10,7

10,9

10,9

10,9

10,9

11

11,1

11,2

11,2

1998

11,4

11,6

11,7

11,7

11,5

11,3

11,3

11,6

11,9

12,3

12,8

13,2

1999

12,2

14,6

14,1

13,4

12,7

12,3

12,1

12

12,1

12,4

12,6

12,4

2000

12,2

12,1

11,4

10,8

10,2

10,1

10

9,8

9,8

9,8

9,8

9,9

2001

10,0

10,2

9,6

9,1

8,6

8,6

8,6

8,6

8,7

8,8

8,9

8,7

2002

8,6

8,4

8,3

8,3

8,2

7,5

7,3

7,1

7,6

8,1

8,5

8,8

2003

9,3

9,6

9,2

8,8

8,5

8,4

8,3

8,2

8,2

8,2

8,2

8,6

2004

9,1

9,5

8,9

8,2

7,6

7,5

7,4

7,3

7,7

8,0

8,4

8,3

2005

8,3

8,3

8,0

7,6

7,3

7,3

7,2

7,1

7,2

7,3

7,5

7,7

2006

7,7

7,9

7,8

7,6

7,5

7,2

6,9

6,5

6,6

6,7

6,7

6,9

2007

7,1

7,2

6,8

6,4

5,9

5,8

5,7

5,6

5,6

5,6

5,7

6,1

2008

6,6

7,1

6,5

6,0

5,4

5,6

5,7

5,8

6,2

6,6

7,0

7,8

2009

8,7

9,4

9,2

8,8

8,5

8,3

8,1

7,9

7,6

7,7

8,2

8,2

2010

9,2

8,6

8,6

8,2

7,3

6,8

7,0

6,9

6,6

6,8

6,7

7,2

2011

7,8

7,6

7,1

7,2

6,4

6,1

6,5

6,1

6,0

6,4

6,3

6,1


 

Выборка содержит 216 значений. Необходимо провести предварительную обработку данных, которая включает в себя ранжирование выборки по возрастанию, расчет описательных статистик, разбиение выборки на интервалы, построение эмпирической функции распределения и гистограммы частот.

 

 

 

 

 

 

 

 

 

 

 

 

    1.  Ранжирование выборки

Произведем сортировку данных по возрастанию: 

%

%

%

%

%

1

5,4

46

7,1

91

8

136

8,8

181

10,8

2

5,6

47

7,1

92

8

137

8,8

182

10,9

3

5,6

48

7,1

93

8

138

8,8

183

10,9

4

5,6

49

7,2

94

8,1

139

8,9

184

10,9

5

5,6

50

7,2

95

8,1

140

8,9

185

10,9

6

5,7

51

7,2

96

8,1

141

8,9

186

11

7

5,7

52

7,2

97

8,2

142

9

187

11,1

8

5,7

53

7,2

98

8,2

143

9,1

188

11,2

9

5,8

54

7,2

99

8,2

144

9,1

189

11,2

10

5,8

55

7,3

100

8,2

145

9,1

190

11,3

11

5,9

56

7,3

101

8,2

146

9,1

191

11,3

12

6

57

7,3

102

8,2

147

9,2

192

11,4

13

6

58

7,3

103

8,2

148

9,2

193

11,4

14

6,1

59

7,3

104

8,2

149

9,2

194

11,4

15

6,1

60

7,3

105

8,2

150

9,2

195

11,6

16

6,1

61

7,4

106

8,2

151

9,2

196

11,6

17

6,1

62

7,4

107

8,3

152

9,3

197

11,7

18

6,2

63

7,4

108

8,3

153

9,3

198

11,7

19

6,3

64

7,4

109

8,3

154

9,4

199

11,9

20

6,4

65

7,5

110

8,3

155

9,5

200

12

21

6,4

66

7,5

111

8,3

156

9,5

201

12,1

22

6,4

67

7,5

112

8,3

157

9,6

202

12,1

23

6,4

68

7,5

113

8,3

158

9,6

203

12,1

24

6,5

69

7,5

114

8,3

159

9,6

204

12,2

25

6,5

70

7,6

115

8,4

160

9,6

205

12,2

26

6,5

71

7,6

116

8,4

161

9,7

206

12,3

27

6,6

72

7,6

117

8,4

162

9,7

207

12,3

28

6,6

73

7,6

118

8,4

163

9,8

208

12,4

29

6,6

74

7,6

119

8,5

164

9,8

209

12,4

30

6,6

75

7,6

120

8,5

165

9,8

210

12,6

31

6,7

76

7,7

121

8,5

166

9,8

211

12,7

32

6,7

77

7,7

122

8,5

167

9,8

212

12,8

33

6,7

78

7,7

123

8,6

168

9,8

213

13,2

34

6,8

79

7,7

124

8,6

169

9,9

214

13,4

35

6,8

80

7,7

125

8,6

170

9,9

215

14,1

36

6,8

81

7,7

126

8,6

171

10

216

14,6

37

6,8

82

7,7

127

8,6

172

10

38

6,9

83

7,8

128

8,6

173

10

39

6,9

84

7,8

129

8,6

174

10,1

40

6,9

85

7,8

130

8,6

175

10,1

41

7

86

7,8

131

8,7

176

10,2

42

7

87

7,8

132

8,7

177

10,2

43

7,1

88

7,9

133

8,7

178

10,3

44

7,1

89

7,9

134

8,8

179

10,5

45

7,1

90

7,9

135

8,8

180

10,7


 

    1. Построение интервального ряда

 

Определим длину интервала  по формуле Стерджесса:

где — максимальное и минимальное значение признака, N – объём выборки, - длина интервала группировки.

Для определения количества интервалов воспользуемся формулой:

Минимум = 5,4

Максимум = 14,6

Длина интервала = 1

Количество интервалов = 8

Далее построим вариационный ряд:

Границы интервала

Частота

Накопленная частота

5,4-6,4

23

23

6,4-7,4

41

64

7,4-8,4

54

118

8,4-9,4

36

154

9,4-10,4

24

178

10,4-11,4

16

194

11,4-12,4

15

209

12,4-14,6

7

216


   

 

 

 

 

 

 

 

 

    1. Гистограмма частот и эмпирическая функция распределения

Гистограмма строится по таблице  частот и представляет собой графическое  отображение интервального вариационного  ряда.

Рис.1

По графику  можно предположить, что величина подчиняется  нормальному закону распределения.

Другой характеристикой  распределения является эмпирическая функция распределения. Эмпирической функцией распределения, построенной  по выборке X = {X1…Xn} объёма n, называется случайная функция , при каждом равная

То есть, при любом y значение F(y), равное истинной вероятности случайной величине X1 быть меньше y, оценивается долей элементов выборки, меньших y.

Можно построить эмпирическую функцию распределения по вариационному  ряду:

Функция распределения выборки  показывает относительную частоту  значений выборки, не превышающих заданное число.

 

Рис.2

 

    1. Описательные статистики

К основным характеристикам  случайной величины (описательные статистики) относятся: среднее значение, оценка дисперсии, моды, медианы, коэффициентов вариации, ассиметрии и эксцесса.

Математическим ожиданием  случайной величины X называется число  вида:

                                                                   

Дисперсия случайной величины характеризует меру разброса случайной величины около ее математического ожидания.

                                                

      Стандартное отклонение вычисляется по формуле:

                                                 

Медианой случайной величины X c распределением называется такое значение аргумента m, для которого выполняются неравенства:

        

Медиана характеризует серединное значение в выборке.

Модой  распределения  непрерывной случайной величины с плотностью pX(x) называют то значение аргумента, при котором плотность достигает максимума:

        

Мода характеризует наиболее часто встречающееся значение распределения.

Коэффициент асимметрии показывает отклонение распределения от симметричного и вычисляется по формуле:

, где n -  число наблюдений,

Коэффициент эксцесса измеряет «пикообразность» распределения. Если эксцесс значимо отличен от 0, то функция плотности либо имеет  более закругленный, либо более острый пик, чем пик плотности нормального  распределения. Функция плотности  нормального распределения имеет  эксцесс равный 0. Оценка эксцесса (выборочный эксцесс) вычисляется по формуле:

, где n – число наблюдений,

Описательная статистика:

Статистика                      Значение

   

Среднее

8,612037037

Стандартная ошибка

0,129493207

Медиана

8,3

Мода

8,2

Стандартное отклонение

1,903153691

Дисперсия выборки

3,621993971

Эксцесс

0,027663565

Асимметричность

0,70812249

Интервал

9,2

Минимум

5,4

Максимум

14,6

Сумма

1860,2

Счет

216

Информация о работе Статистический анализ данных уровня безработицы за 1994 – 2011гг. в России