Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор работы: Пользователь скрыл имя, 07 Декабря 2012 в 17:34, лабораторная работа

Краткое описание

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции - как изучаемые признаки единиц.
Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек В4:С35.
В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупности.

Содержание

Постановка задачи……………………………………………….3
Анализ выборочной совокупности. ……………………………5
Анализ генеральной совокупности…………...………………..13
Приложения……………………………………………………...16

Вложенные файлы: 1 файл

Отчет по статистике.doc

— 350.00 Кб (Скачать файл)


 ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ

ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ  ИНСТИТУТ

КАФЕДРА СТАТИСТИКИ

 

 

 

ОТЧЕТ

о результатах  выполнения

компьютерной  лабораторной работы

«Автоматизированный априорный анализ

статистической  совокупности в среде MS Excel»

вариант № 2

 

 

Выполнила: ст. Ⅲ курса

Факультет Финансово-кредитный

Специальность Финансы  и кредит

Группа 1день

№ зачетной книжки

Проверила:

 

 

 

 

 

Уфа-2012

 

ОГЛАВЛЕНИЕ

 

Постановка задачи……………………………………………….3

Анализ выборочной совокупности. ……………………………5

Анализ генеральной  совокупности…………...………………..13

Приложения……………………………………………………...16

 

Постановка задачи

 

При проведении статистического  наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год (таб. 1).

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции - как изучаемые признаки единиц.

Для проведения автоматизированного  статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек  В4:С35.

В процессе исследования совокупности необходимо решить ряд  статистических задач для выборочной и генеральной совокупности.

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 1

Исходные данные

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

206,00

206,00

2

244,00

226,00

3

252,00

252,00

4

266,00

280,00

5

170,00

140,00

6

280,00

240,00

7

288,00

324,00

8

214,00

220,00

9

264,00

258,00

10

306,00

322,00

11

336,00

340,00

12

110,00

300,00

13

254,00

268,00

14

280,00

292,00

15

322,00

354,00

16

370,00

380,00

17

274,00

256,00

18

304,00

304,00

19

240,00

190,00

20

308,00

260,00

21

344,00

350,00

22

234,00

198,00

23

184,00

186,00

24

314,00

298,00

25

280,00

260,00

26

260,00

246,00

27

200,00

160,00

28

272,00

250,00

29

316,00

274,00

30

300,00

260,00

31

370,00

100,00

32

218,00

232,00


 

 

 

 

 

 

Анализ выборочной совокупности

Задание 1

Указать количество аномальных единиц наблюдения с ссылкой на табл. 2.

Решение

  1. Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

В настоящей лабораторной работе в качестве исходных данных представлены выборочные значения двух признаков Среднегодовая стоимость основных производственных фондов и Выпуск продукции. Для выявления аномальных значений этих признаков можно построить график для каждого из признаков в отдельности, однако анализ упростится, если использовать диаграмму рассеяния – точечный график.

Каждый «выброс» из основной массы  точек означает аномальность единицы наблюдения. Такие единицы подлежат удалению из первичных данных.

Построение диаграммы  рассеяния в среде Excel осуществляется с помощью инструмента построения графиков Мастер диаграмм.

Рисунок 1. Аномальные значения признаков на диаграмме рассеяния

 

Таблица 2

АНОМАЛЬНЫЕ ЕДИНИЦЫ  НАБЛЮДЕНИЯ

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

12

110,00

300,00

31

370,00

100,00


 

Среди исходных данных были выявлены два предприятия с резко выделяющимися характеристиками и исключены из проводимого статистического исследования вследствие нетипичности (аномальности) этих предприятий для изучаемой совокупности.

 

Задание 2

Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую ( ), моду (Мо), медиану (Ме), размах вариации (R), дисперсию , средние отклонения – линейное (d) и квадратическое ( ), коэффициент вариации ( ), структурный коэффициент асимметрии К.Пирсона ( ).

Решение

Обобщающие статистические показатели исчисляются на основе анализа вариационных рядов распределения. Однако пакет Excel позволяет рассчитать многие из этих показателей непосредственно по первичным данным наблюдения, используя инструмент Описательная статистика надстройки Пакет анализа, а также статистические функции инструмента Мастер функций.

Выполнение задания 2 заключается в автоматизированном решении двух статистических задач:

1. Расчет описательных  показателей выборочной и генеральной  совокупностей по несгруппированным выборочным данным с использованием инструментов Описательная статистика и Мастер функций.

2. Оценка средней и  предельной ошибок выборки для  средней величины признака, а также границ, в которых эта средняя будет находиться в генеральной совокупности при заданных уровнях надежности.

Таблица 3

Описательные статистики выборочной совокупности

По столбцу "Среднегодовая стоимость  основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 
       

Среднее

270

Среднее

260,8666667

Стандартная ошибка

8,832021156

Стандартная ошибка

10,53584286

Медиана

273

Медиана

259

Мода

280

Мода

260

Стандартное отклонение

48,37497216

Стандартное отклонение

57,70718794

Дисперсия выборки

2340,137931

Дисперсия выборки

3330,11954

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

200

Интервал

240

Минимум

170

Минимум

140

Максимум

370

Максимум

380

Сумма

8100

Сумма

7826

Счет

30

Счет

30

Уровень надежности(95.4%)

18,41309526

Уровень надежности(95.4%)

21,96524156

Стандартное отклонение

47,56188951

Стандартное отклонение

56,73725016

Дисперсия

2262,133333

Дисперсия

3219,115556

Среднее линейное отклонение

38,26666667

Среднее линейное отклонение

43,70666667

Коэффициент вариации, %

17,61551463

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,015275091


 

Задание 3

На основе рассчитанных показателей в предположении, что  распределения единиц по обоим признакам близки к нормальному, оценить:

а) степень колеблемости значений признаков в совокупности;

б) степень однородности совокупности по изучаемым признакам;

в) устойчивость индивидуальных значений признаков;

г) количество попаданий  индивидуальных значений признаков  в диапазоны ( ), ( ), ( ).

 

Решение

а) Степень колеблемости значений первого признака составляет 17,61551463 (≈17,62).

Степень колеблемости значений второго  признака составляет 21,74952089 (≈21,75).

б) Совокупности первого и второго признака являются количественно однородными т.к. коэффициент вариации не превышает 33%.

в) Сопоставление средних отклонений – квадратического σ и линейного позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.

В условиях симметричного и нормального, а также близких к ним распределений между показателями σ и имеют место равенства

σ ≈ 1,25

,
≈ 0,8σ,

поэтому отношение показателей  и σ может служить индикатором устойчивости данных: если

то значения признака неустойчивы, в них имеются «аномальные» выбросы. Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц при выполнении задания 1, некоторые аномалии в первичных данных продолжают сохраняться. В этом случае их следует выявить (например, путем поиска значений, выходящих за границы ( ) и рассматривать в качестве возможных «кандидатов» на исключение из выборки.

Итак, для первого признака σ ≈ 1,25 ,

47,56 ≈ 1,25*38,27      →      47,56 ≈ 47,83.

≈ 0,8σ,

38,27 ≈ 0,8*47,56        →       38,27 ≈ 38,05.

38,27/47,56 > 0,8         →       0.8 = 0.8.

Распределение первого  признака симметрично и нормально.

Для второго σ ≈ 1,25 ,

56,74 ≈ 1,25*43,71           →     56,74 ≈ 54,63,

   ≈ 0,8σ,

43,71 ≈ 0,8*56,74              →   43,71 ≈ 45,39,

    

  43,71/56,74 > 0,8             →   0,77 < 0.8.

Распределение второго  признака симметрично и нормально.

Таблица 4

 

Выборочные  показатели вариации и асимметрии

 

По столбцу "Среднегодовая  стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Стандартное отклонение

47,56188951

Стандартное отклонение

56,73725016

Дисперсия

2262,133333

Дисперсия

3219,115556

Среднее линейное отклонение

38,26666667

Среднее линейное отклонение

43,70666667

Коэффициент вариации, %

17,61551463

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,015275091


г)

Таблица 5

РАСПРЕДЕЛЕНИЕ ЗНАЧЕНИЙ ПРИЗНАКА ПО ДИАПАЗОНАМ РАССЕЯНИЯ ПРИЗНАКА ОТНОСИТЕЛЬНО

 

Границы диапазонов

Количество значений

,

находящихся в диапазоне

 

Первый

признак

Второй 

признак

Первый

признак

Второй 

признак

222,44≤ ≤317,56

204,13≤ ≤317,61

20

19

174,88≤ ≤365,12

147,39≤ ≤374,35

28

28

127,32≤ ≤412,68

90,65≤ ≤431,09

30

30


 

 

 

 

 

 

Задание 4

Дать сравнительную  характеристику распределения единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков;

б) количественной однородности единиц;

в) надежности (типичности) средних значений признаков;

г) симметричности распределений  в центральной части ряда.

Решение

Описательные статистики выборочной совокупности

Таблица 6

По столбцу "Среднегодовая стоимость  основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 
       

Среднее

270

Среднее

260,8666667

Стандартная ошибка

8,832021156

Стандартная ошибка

10,53584286

Медиана

273

Медиана

259

Мода

280

Мода

260

Стандартное отклонение

48,37497216

Стандартное отклонение

57,70718794

Дисперсия выборки

2340,137931

Дисперсия выборки

3330,11954

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

200

Интервал

240

Минимум

170

Минимум

140

Максимум

370

Максимум

380

Сумма

8100

Сумма

7826

Счет

30

Счет

30

Уровень надежности(95.4%)

18,41309526

Уровень надежности(95.4%)

21,96524156

Стандартное отклонение

47,56188951

Стандартное отклонение

56,73725016

Дисперсия

2262,133333

Дисперсия

3219,115556

Среднее линейное отклонение

38,26666667

Среднее линейное отклонение

43,70666667

Коэффициент вариации, %

17,61551463

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,015275091

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel