Статическое изучение взаимосвязей

Автор работы: Пользователь скрыл имя, 23 Апреля 2014 в 08:52, реферат

Краткое описание

Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания, так или иначе, определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики.

Содержание

1. Понятие корреляционной связи и предпосылки ее использования.
2. Статистические методы выявления наличия корреляционной связи между двумя признаками. Корреляционная и групповая таблицы, «поле корреляции».
3. Измерение степени тесноты корреляционной связи в случая парной зависимости.
4. Уравнение регрессии. Множественная корреляция.

Вложенные файлы: 1 файл

статистикатема8.docx

— 74.28 Кб (Скачать файл)

 

 

 

Параллельное сопоставление позволяет установить, что увеличение средней занятости рабочего места влечет за собой уменьшение среднего времени межоперационных перерывов, хотя в отдельных случаях наличие отмеченной зависимости может и не усматриваться.

Однако наличие большого числа различных значений результативных признаков, соответствующих одному и тому же значению признака - фактора затрудняет восприятие таких рядов, поэтому для установления факта наличия связи пользуются корреляционными или групповыми таблицами.

В корреляционной таблице факторный признак Х располагается в строках, а результат Y в колонках таблицы. Числа расположенные на пересечении строк и столбцов показывают частоту повторений данного сочетания значений Х и Y.

Построим корреляционную таблицу 2, в которой Х - средняя занятость рабочего места (факторный признак); Y - среднее время межоперационных перерывов (результативный признак).

 

 Среднее время

межоперац.

перерывов.

Средняя Группа

Занятость поY

по Х

0,32 -0,55

0,55 - 0,78

0,78 - 1,01

1,01 - 1,24

1,24 - 1,47

   

Середина интервала

0,435

0,665

0,895

1,125

1,355

0,22

0,24

0,26

0,30

0,32

 

5

 

2

 

2

2

1

1

3

5

3

4

5

1, 202

1,079

0,895

0,780

0,435

 

5

4

4

4

3

20

 

 

 

 

 

 - среднее значение результатов признака;

 

  - частота повторений данного  варианта значений факторного  признака во всей совокупности;

 

  - частота повторений значений  результатов признака во всей  совокупности.

Для результатов признака необходимо определить величину интервала по формуле Стреджесса

 

 

 

 ,

 

 .

 

 

Среднее время межоперационных перерывов для партии деталей имеющих среднюю занятость рабочего места 0,223

 

 

 

  и т.д.

 

 

Корреляционная таблица уже при общем знакомстве дает возможность выдвинуть предложение о наличии или отсутствии связи, а также выявить ее направление.

Если частота в корреляционной таблице расположена по диагонали из левого верхнего угла в правый нижний угол (т.е. большим значениям Х соответствует большее значение Y) можно предположить о наличии прямой корреляционной зависимости, если наоборот то обратной. Т.о. уменьшение средних значений результативного признака с увеличением значения факторного признака еще раз свидетельствует о обратной корреляционной зависимости среднего времени межоперационных перерывов партии деталей от средней занятости рабочего места. Другим приемом обнаружения связи является построение групповой таблицы 3. Все наблюдения разбиваем на группы в зависимости от величины признака - фактора и по каждой группе вычисляем среднее значение результативного признака.

 

 

Группы партий деталей по уровню средней занятости

Сумма значений результативного признака в группе

Число партий деталей в группе

Среднее значение результативного признака в группе

0,22

3,76

3

1,253

0,24

5,08

5

1,016

0,26

2,63

3

0,877

0,30

3,09

4

0,773

0,32

2,02

5

0,404

Итого

16,58

20

0,829


 

 

 

Сравнив средние значения результирующего признака по группам можно также сделать вывод, что рост средней занятости рабочего места влечет за собой снижение величины межоперационных перерывов, т.е. можно сказать имеет место обратная корреляционная связь.

Если бы связи между факторными и результативными признакам не было, то все групповые средние были бы приблизительно одинаковы по величине. Оценка существенности расхождения групповых средних лежит в основе использования метода дисперсионного анализа для выявления наличия и оценки связи.

Для предварительного выявления связи и раскрытия ее характера применяют графический метод. Используя данные таблицы 1 построить точечный график, который называют поле корреляции.

Нанеся данные таблицы 3 и соединяя последовательно отрезками прямых соответствующих им точек, получим эмпирическую линию связи.

Если эмпирическая линия приближается к прямой, - предполагают наличие прямолинейной корреляционной связи, если к какой либо кривой, то это может быть связано с наличием криволинейной корреляционной связи.

 

Измерение степени тесноты корреляционной связи в случае парной зависимости

 
Показатели степени тесноты связи дают возможность охарактеризовать зависимость вариации результативного признака от вариации признака-фактора. В известной мере они дополняют и развивают уже отмеченные приемы обнаружения связи.

Зная показатели тесноты корреляционной связи, мы можем решать следующие группы вопросов:

 

  1. ответить на вопрос о необходимости изучения данной связи между признаками и целесообразности ее практического применения;

  1. сопоставляя показатели тесноты связи для различных ситуаций, можно судить о степени различий в ее проявлении для конкретных условий;

  1. и, наконец, сопоставляя показатели тесноты связи результативного признака с различными факторами, можно выявить те факторы, которые в данных конкретных условиях являются решающими и главным образом воздействуют на формирование величины результативного признака.

 
К простейшим показателям степени тесноты связи относят коэффициент корреляции знаков, который был предложен немецким ученым Г.Фехнером (1801-1887). Этот показатель основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязанных пар признаков. 
Коэффициент Фехнера может принимать различные значения в пределах от -1 до +1, Если знаки всех отклонений совпадут, то показатель будет равен 1, что свидетельствует о возможном наличии прямой связи. Если же знаки всех отклонений будут разными, тогда коэффициент Фехнера будет равен -1, что дает основание предположить наличие обратной связи.  
Величина коэффициента Фехнера не зависит от величины отклонений факторного и результативного признака от соответствующей средней величины. Поэтому нельзя говорить о степени тесноты корреляционной связи, а тем более об оценке ее существенности на основании только коэффициента Фехнера. При малом объеме исходной информации коэффициент Фехнера практически решает ту же задачу, которая ставится при построении групповых и корреляционных таблиц, т.е. отвечает на вопрос о наличии и направлении корреляционной связи между признаками. В том случае, если построена корреляционная или же групповая таблица, дополнительный расчет коэффициента Фехнера не имеет практической ценности. 
Более совершенным показателем степени тесноты связи является линейный коэффициент корреляции. При расчете этого показателя учитываются не только знаки отклонений индивидуальных значений признака от средней, но и сама величина таких отклонений. Однако непосредственно сопоставлять между собой полученные абсолютные величины нельзя, так как сами признаки могут быть выражены в разных единицах (как это имеет место в представленном примере), а при наличии одних и тех же единиц измерения средние могут быть различны по величине. В этой связи сравнению могут подлежать отклонения, выраженные в относительных величинах, т.е. в долях среднего квадратического отклонения (их называют нормированными отклонениями). Для того чтобы на основе сопоставления рассчитанных нормированных отклонений получить обобщающую характеристику степени тесноты связи между признаками для всей совокупности, рассчитывают среднее произведение нормированных отклонений. Полученная таким образом средняя и будет являться линейным коэффициентом корреляции. Расчет коэффициента Фехнера представлен в таблице.

 

 

Порядковый номер фирмы

Затраты на рекламу, усл. ден. ед.X.

Количество туристов, воспользовавшихся услугами фирмы, человекУ

Знаки отклонений индивидуальных значений признака от средней

Совпадение (а) или несовпадение (в)знаков

для X

для у

1

2

3

4

5

6

1

8

800

   

а

2

8

850

 

-

а

3

8

720

 

-

а

4

9

850

   

а

5

9

800

-

-

а

6

9

880

   

а

7

9

950

-

 

а

8

9

820

-

 

а

9

10

900

+

 

Ь

10

10

1000

+

+

а

11

10

920

+

 

b

12

10

1060

+

+

а

13

10

950

+

 

b

14

11

900

+

 

Ь

15

11

1200

+

+

а

15

11

1150

+

+

а

17

11

1000

+

+

а

18

12

1200

+

+

а

19

12

1100

+

+

а

20

12

1000

+

+

а


 

 
 
Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи - прямой зависимости соответствует знак плюс, а обратный зависимости - знак минус. 
Если с увеличением значений факторного признака х, результативный признак у имеет тенденцию к увеличению, то величина коэффициента корреляции будет находиться между О и 1. Если же с увеличением значений х результативный признак у имеет тенденцию к снижению, коэффициент корреляции может принимать значения в интервале от 0 до —1. 
Квадрат коэффициента корреляции носит название коэффициента детерминации. В тех случаях, когда исходная информация представлена в виде корреляционной таблицы, нужно учитывать частоты повторений как индивидуальных значений факторного и результативного признаков, так и число повторений данного сочетания значений фактора и результата. Здесь еще раз следует напомнить, что сама по себе величина коэффициента корреляции не является доказательством наличия причинно-следственной связи между исследуемыми признаками, а является оценкой степени взаимной согласованности в изменениях признаков. Установлению причинно-следственной зависимости предшествует анализ качественной природы явлений. Но есть и еще одно обстоятельство, объясняющее формулировку выводов о возможном наличии связи по величине коэффициента корреляции. 
Связано это с тем, что оценка степени тесноты связи с помощью коэффициента корреляции производится, как правило, на основе более или менее ограниченной информации об изучаемом явлении. Возникает вопрос, насколько правомерно наше заключение по выборочным данным в отношении действительного наличия корреляционной связи в той генеральной совокупности, из которой была произведена выборка? 
Принципиально возможны случаи, когда отклонение от нуля полученной величины выборочного коэффициента корреляции оказывается целиком обусловленным неизбежными случайными колебаниями тех выборочных данных, на основании которых он вычислен. Особенно осторожно следует подходить к истолкованию полученных коэффициентов корреляции при незначительных объемах выборочной совокупности. 
В этой связи и возникает необходимость оценки существенности линейного коэффициента корреляции, дающая возможность распространить выводы по результатам выборки на генеральную совокупность. В зависимости от объема выборочной совокупности предлагаются различные методы оценки существенности линейного коэффициента корреляции. В отношении приводимых ниже критериев существенности можно сделать общее замечание, касающееся свойств исходной совокупности. Этим свойством является нормальное распределение значений признака в генеральной совокупности. 
1. При большом объеме выборки, отобранной из исходной нормально распределенной совокупности, можно считать распределение линейного коэффициента корреляции приближенно нормальным со средней, равной с и дисперсией а. Полученную величину t сравнивают с табличным значением f-критерия (число степеней свободы равно n-2). Если рассчитанная величина t превосходит табличное значение критерия t, то практически невероятно, что найденное значение обусловлено только случайными совпадениями х и у в выборке из генеральной совокупности, для которой действительное значение коэффициента корреляции равно нулю. Если же вычисленная величина f  меньше, чем в таблице, то полагают, что коэффициент корреляции в генеральной совокупности в действительности равен нулю и соответственно, эмпирический коэффициент корреляции существенно не отличается от нуля. 
2. Проверку гипотезы об отсутствии связи можно сделать и без вычислений, пользуясь таблицей, составленной Р. Фишером. В этой таблице показывается величина коэффициента корреляции, которая может считаться существенной при данном количестве наблюдений. При пользовании этой таблицей величину коэффициента корреляции следует искать для числа степеней свободы, равного n-2. Краткая выдержка из таблицы значений коэффициентов корреляции при различных уровнях критерия значимости приведена в табл. 

Информация о работе Статическое изучение взаимосвязей