Закономерности распределения статистических величин и показатели

Автор работы: Пользователь скрыл имя, 17 Октября 2012 в 20:37, курсовая работа

Краткое описание

Цель работы: раскрыть теоретические основы закономерностей распределения статистических величин, рассмотреть ряды распределения статистических величин и показатели, характеризующие вариационный ряд.

Вложенные файлы: 1 файл

Курсовая по статистике - Таня.doc

— 420.50 Кб (Скачать файл)

Коэффициент децильной  дифференциации необходимо отличать от коэффициента фондовой дифференциации (коэффициента фонда), который представляет собой соотношение средних значений признака в последней и первой децильных группах. Поскольку наполненность децильных групп одинакова (они содержат по 10% единиц совокупности), коэффициент фондовой дифференциации можно определить через соотношение суммарного значения признака в последней и первой децильных группах. Например, для характеристики дифференциации доходов в обществе рассчитывают коэффициент фондов, измеряющий соотношение средних доходов 10% наиболее и 10% наименее обеспеченного населения. На практике его определяют как отношение суммарных доходов соответствующих групп населения.

 

3. 2 Показатели размера и интенсивности вариации.

Основным этапом в  изучении вариационных рядов является расчет показателей размера и интенсивности вариации.

Для характеристики размера вариации в статистике применяются абсолютные показатели вариации:

—  размах вариации;

—  среднее линейное отклонение;

—  среднее квадратическое отклонение;

—  дисперсия.

Размах вариации (амплитуда колебаний) представляет собой разность между максимальным и минимальным значениями признака в совокупности:

Для группировок с открытыми первым и последним интервалами, когда не известны реальные минимальное и максимальное значения признака в совокупности, расчет размаха вариации некорректен.

Размах вариации зависит  от величины только крайних значений признака. Более точно характеризуют вариацию признака показатели, основанные на учете колеблемости всех значений признака, — среднее линейное отклонение ( ) и среднее квадратическое отклонение ( ). Среднее квадратическое отклонение называют также стандартным отклонением.

Среднее линейное и среднее  квадратическое отклонения рассчитываются по формулам:

— для несгруппированных  данных:

 

где xi, — значение признака у i-й единицы совокупности; — средняя величина признака в совокупности; п - число единиц совокупности;

— для сгруппированных  данных:

Xi - значение признака в i-й группе (дня интервальных вариационных рядов - середина i-го интервала); - средняя величина признака в совокупности; — частота (частость) i-й группы; k — число групп.

Среднее линейное и среднее  квадратическое отклонения показывают, на сколько в среднем величина изучаемого признака у отдельных единиц совокупности отличается от среднего значения признака в совокупности.

Среднее квадратическое отклонение по величине всегда больше среднего линейного отклонения. Соотношение зависит от наличия в совокупности резких отклонений и может служить индикатором «засоренности» совокупности нетипичными, выделяющимися из основной массы единицами. Для нормального распределения это соотношение равно  1,25.

Приближенную оценку среднего квадратического отклонения можно получить в соответствии с правилом «трех сигм» по следующей формуле:

так как в нормальном распределении в размахе вариации «укладывается» .

Если распределение  заведомо асимметричное, то

Эти формулы обычно используют для оценки среднего квадратического отклонения на стадии проектирования выборочного обследования.

Квадрат среднего квадратического  отклонения называется дисперсией Для несгруппированных данных дисперсия рассчитывается по формуле:

Для сгруппированных  данных:

Рассчитать дисперсию  можно также по преобразованной  формуле:

Где    — средний квадрат значений признака в совокупности

- квадрат среднего значения признака в совокупности.

Размах вариации, среднее  линейное отклонение и среднее квадратическое отклонение являются величинами именованными, то есть имеют ту же единицу измерения, что и изучаемый признак. Дисперсия единиц измерения не имеет.

Определим среднее линейное, среднее квадратическое отклонение и дисперсию для распределения работников по величине начисленной заработной платы. Все промежуточные вычисления приведены в таблице

 

Таблица – Расчёт показателей  вариации

Начисленная заработная плата за месяц, тыс. руб.

Число работников в % к  итогу (fi )

Середина интервала (xi)

 

 

 

До 1,0

14,4

0,6

1,9

27,36

51,984

1,0-1,8

24,3

1,4

1,1

26,73

29,403

1,8-2,6

19,8

2,2

0,3

5,94

1,782

2,6-3,4

18,0

3,0

0,5

9,0

4,500

3,4-4,2

9,7

3,8

1,3

12,61

16,393

4,2-5,0

5,7

4,6

2,1

11,97

25,137

5,0-5,8

3,7

5,4

2,9

10,73

31,117

5,8 и более

4,4

6,2

3,7

16,28

60,236

Итого

100

-

-

120,62

220,552


 

Среднее линейное отклонение, дисперсия и среднее квадратическое отклонение соответственно составят:

 тыс. руб.;

Среднее линейное и среднее  квадратическое отклонения показывают, на сколько в среднем величина начисленной заработной платы у отдельных работников жилищно-коммунального хозяйства и производственных видов бытового обслуживания отличалась от средней заработной платы по этим отраслям. По формуле среднего линейного отклонения это отличие составляло ±1206 руб., по формуле среднего квадратического отклонения — ±1485 руб.

Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака:

—  относительный размах вариации (коэффициент осцилляции);

—  относительное линейное отклонение;

—  относительное квадратическое отклонение и др.

Наиболее часто на практике применяют коэффициент  вариации ( ), который представляет собой относительное квадратическое отклонение:

.

По величине коэффициента вариации можно судить об интенсивности отклонений значений признака от средней величины, а следовательно, и об однородности изучаемой совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней и выше неоднородность совокупности. Средняя, рассчитанная для неоднородной совокупности, не является ее типической характеристикой.

Существует шкала определения  степени однородности совокупности в зависимости от значений коэффициента вариации:

Коэффициент вариации

До 30

30-60

60 и более

Степень однородности совокупности

Высокая

Средняя

Низкая

Отметим, что данная шкала  оценки однородности совокупности весьма условна. Вопрос о степени интенсивности вариации должен решаться для каждого изучаемого признака индивидуально, исходя из сравнения наблюдаемой вариации с некоторой ее обычной интенсивностью, принимаемой за норму.

Для нашего примера коэффициент  вариации составил:

что свидетельствует  о высокой колеблемости признака, то есть неоднородности совокупности работников по размеру начисленной заработной платы.

Применяя любой вид  статистических показателей, полезно  знать, каковы предельно возможные  значения данного показателя для  изучаемой системы и каково отношение  фактически наблюдаемых значений к  максимально возможным. Очевидно, что минимально возможное значение показателей вариации достигается при строго равномерном распределении объемного признака между всеми единицами совокупности, а максимально возможное — при таком распределении объемного признака, при котором весь его объем сосредоточен в одной единице совокупности. Максимально возможное значение показателей вариации можно рассчитать по формулам:

—  среднее линейное отклонение:

—  среднее квадратическое отклонение:

;

—  коэффициент вариации:

Из формул видно, что  максимально возможные значения показателей вариации зависят от численности изучаемой совокупности n.

 

3. 3 Моменты  распределения

Моментом распределения называется средняя арифметическая тех или иных степеней отклонений индивидуальных значений признака от определенной исходной величины.

Моменты распределения  в вариационном ряду рассчитываются по формуле:

где А — величина, от которой определяются отклонения; a — степень отклонения (порядок момента); fi — частота (частость) i-го интервала; k— число групп.

В зависимости от величины А различают три вида моментов:

1. При А= 0 получают начальные моменты Ма:

Начальный момент первого  порядка представляет собой среднюю арифметическую.

2. При А = х получают центральные моменты µa:

В соответствии с нулевым  свойством средней арифметической центральный момент первого порядка  всегда равен нулю.

Центральный момент второго  порядка представляет собой дисперсию.

3. При А, не равном среднему значению признака и отличному от нуля, получают условные моменты mа:

Наиболее часто используются моменты первого, второго, третьего и четвертого порядков.

 

3. 4 Оценка вариационного ряда на асимметрию и эксцесс

Асимметрия и эксцесс  являются характеристиками формы распределения.

Ряды распределения  могут иметь один и тот же центр  группирования (показатели центра распределения) и одинаковые пределы варьирования признака (показатели вариации), однако при этом отличаться характером распределения единиц совокупности вокруг центра. Как уже отмечалось, если большая часть совокупности расположена левее центра, имеет место левосторонняя асимметрия, если правее — правосторонняя.

Для оценки асимметричности применяют моментный и структурные коэффициенты асимметрии.

Моментный коэффициент  асимметрии (стандартизованный момент третьего порядка) определяется по формуле:

где µ3— центральный момент третьего порядка:

На направление асимметрии указывает знак коэффициента: если As < О, то это левосторонняя асимметрия (ее называют также отрицательной асимметрией), при правосторонней (положительной) асимметрии As > 0.

 Степень существенности асимметрии можно оценить с помощью средней квадратической ошибки коэффициента асимметрии, которая зависит от объема изучаемой совокупности и рассчитывается по формуле:

где п - число единиц совокупности.

Если   отношение   ,   асимметрия   считается   существенной,   если ,  то  асимметрия  признается  несущественной,  вызванной влиянием случайности.

Основной недостаток моментного коэффициента асимметрии заключается  в том, что его величина зависит от крайних значений признаков в совокупности и от наличия в совокупности резко выделяющихся (нетипичных) единиц. В последнем случае моментный коэффициент малопригоден, поскольку его большая (абсолютная) величина будет объясняться доминирующим вкладом в величину центрального момента третьего порядка нетипичных значений, а не асимметричностью распределения основной части единиц. В таких случаях рекомендуют либо исключить из анализа резко выделяющиеся единицы, либо использовать структурные показатели асимметрии.

Структурные показатели (коэффициенты) асимметрии характеризуют асимметричность только в центральной части распределения, т. е. основной массы единиц, и в отличие от моментного коэффициента не зависят от крайних значений признака.

Наиболее часто применяют структурный коэффициент асимметрии, предложенный английским статистиком К. Пирсоном:

Учитывая, что в умеренно асимметричном распределении расстояния между показателями        центра        распределения        характеризуются        равенством , формула К. Пирсона может быть записана следующим образом:

Используют и другие формулы для расчета коэффициента асимметрии. Так, например, шведский математик  Линдберг предложил оценивать асимметрию по формуле

AsП = П-50,

где П — процент  единиц совокупности, у которых значение изучаемого признака превосходит среднее значение признака по совокупности.

Информация о работе Закономерности распределения статистических величин и показатели