Автор работы: Пользователь скрыл имя, 02 Сентября 2012 в 23:32, реферат
Анализ статистической, или корреляционной, связи предполагает выявление формы связи, а также оценку тесноты связи. Первая задача решается методами регрессионного анализа, вторая — методами корреляционного анализа. Регрессионный анализ сводится к описанию статистической связи с помощью подходящей функциональной зависимости. Корреляционный анализ позволяет оценивать тесноту связи посредством специальных показателей, причем выбор их зависит от вида функциональной зависимости, пригодной для адекватного описания рассматриваемой статистической взаимосвязи.
Введение…………………………………………………………………………...3
1. Основные понятия корреляционного и регрессионного анализа………..….4
2. Корреляционно-регрессионный метод анализа………………...………….....7
3. Непараметрические показатели связи……………………………………….13
Заключение…………………………………………………………………….…20Список использованной литературы…………………………………………...22
Пример.
На
основе выборочных данных о деятельности
6 предприятий одной из отраслей
промышленности оценить тесноту
связи между трудоемкостью
Расчетная таблица для определения коэффициента корреляции
№ п/п | Объем произведенной продукции, млн. руб., Y | Затраты на 100 изделий, чел.-час, X | yx | y2 | x2 |
1
2 3 4 5 6 |
221
1070 1001 606 779 789 |
96
77 77 89 82 81 |
21216
82390 77077 53934 63878 63909 |
48841
1144900 1002000 367236 606841 622520 |
9216
5929 5929 7921 6724 6561 |
Сумма | 4466 | 502 | 362404 | 3792338 | 42280 |
Средняя | 744,33 | 83,67 | 60400,67 | 632056,33 | 7046,67 |
Используя формулу получаем:
По формуле значение коэффициента корреляции составило:
Таким образом, результат по всем формулам одинаков и свидетельствует о сильной обратной зависимости между изучаемыми признаками.
В
случае наличия линейной и нелинейной
зависимости между двумя
Эмпирическая (т.е. выборочная) оценка этой характеристики вычисляется по следующим формулам:
Здесь черта сверху означает операцию среднего арифметического:
, а величина
называется ковариацией и обозначается как cov (x,y).
Величину выборочного коэффициента корреляции следует считать достаточной для статистического обоснованного вывода о наличии корреляционной связи между исследуемыми переменными, если будет выполнено условие:
, где - табличное значение квантили распределения Стьюдента с (n - 2)- мя степенями свободы и уровнем значимости, равным a/2.
В альтернативном случае неравенства принимается гипотеза об отсутствии корреляционной связи.
Доверительный интервал для теоретического (т.е. истинного) коэффициента корреляции r заключен в пределах: th z1 < r< th z2 ,
Где ,
- квантиль нормального распределения с уровнем значимости a/2, причем величина находится при заданном по таблицам z-преобразования Фишера (или прямым вычислением).
Пример.
По данным n = 39 предприятий получен коэффициент корреляции =-0,654, характеризующий тесноту связи между себестоимостью продукции (y) и производительностью труда (x). Найти доверительную оценку для r, задавшись 95% - й доверительной вероятностью (или 5% - м уровнем значимости).
Из таблиц z-преобразования Фишера (или прямым вычислением) для =-0,654 находим z = - 0,7823.
Тогда получим
,
.
Далее, по таблицам z-преобразования Фишера, но уже по значениям: функции и находим аргументы и :
=- 0,756, = - 0,420 .
Таким
образом, можно утверждать, что с
доверительной вероятностью P = 95% истинное
значение коэффициента корреляции r между
себестоимостью продукции (y) и производительностью
труда x будет лежать в интервале от –
0,756 до – 0, 420.
Непараметрические
показатели связи
В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы.
Наибольшее распространение имеют ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений статистического ряда. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений. В этом случае номер каждой отдельной единицы будет ее рангом.
В качестве грубой количественной оценки корреляции используются коэффициенты корреляции рангов Спирмена и Кендалла, меняющиеся от –1 до +1, и чем ближе они по модулю к 1, тем теснее зависимость.
Ранг – это порядковый номер единицы совокупности в ранжированном ряду. Ранжировать оба признака необходимо в одном и том же направлении: либо от меньших значений к большим, либо наоборот.
Идея использования ранговых коэффициентов состоит в следующем: если проранжировать совокупность по двум признакам, то полное совпадение рангов означает максимально тесную прямую связь, а полная противоположность рангов - максимально тесную обратную связь.
Ранговый коэффициент Спирмена рассчитывается согласно формуле:
,
где - сумма квадратов разностей рангов,
- разность рангов каждой пары значений x и y,
n - общее число вариант, имеющих оба признака (число наблюдений).
Ранговый коэффициент корреляции Кендалла использует несколько другую методику вычислений и определяется согласно формуле:
Здесь – сумма положительных и отрицательных баллов (фактическая сумма рангов), где P – общая сумма числа рангов для каждого значения более высокого порядка (эти баллы учитываются со знаком «плюс»); Q - общая сумма числа рангов следующих для каждого значения , меньших по значению (эти баллы учитываются со знаком «минус»).
Рассмотрим методику вычислений обоих ранговых коэффициентов на примере измерения тесноты связи между объёмом выпуска продукции (y, млн руб.) и стоимостью основных производственных фондов (x, млн руб.) по данным 10 предприятий.
Расчет необходимых показателей (графы 3 – 8) на основе исходных данных (графы 1 и 2) дается в следующей таблице:
X | Y | Подсчет баллов | |||||
+ | - | ||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
1,5
1,8 2,0 2,2 2,3 2,6 3,0 3,1 3,5 3,8 |
3,9
4,4 3,8 3,5 4,8 4,3 7,0 6,5 6,1 8,2 |
1
2 3 4 5 6 7 8 9 10 |
3
5 2 1 6 4 9 8 7 10 |
-2
-3 1 3 -1 2 -2 0 2 0 |
4
9 1 9 1 4 4 0 4 0 |
7
5 6 6 4 4 1 1 1 - |
2
3 1 0 1 0 2 1 0 - |
SD2=36 | P = 35 | Q = -10 |
Коэффициент корреляции рангов Спирмена получается равным
.
Для расчета коэффициента корреляции рангов Кендэлла находим общую сумму баллов (эти баллы даны в графах 7 и 8): S = P + Q = 35 + (-10) = 25. Тогда ранговый коэффициент Кендалла равен
.
Следует заметить, что коэффициент Кендалла всегда меньше, чем коэффициента Спирмена, так как .
Также к непараметрическим методам исследования можно отнести коэффициент ассоциации Кас и коэффициент контингенции Ккон, которые используются, если, например, необходимо исследовать тесноту зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков.
Для определения этих коэффициентов создается расчетная таблица (таблица «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде:
Признаки | А (да) | А (нет) | Итого |
В (да) | a | b | a + b |
В (нет) | с | d | c + d |
Итого | a + c | b + d | n |
Здесь а, b, c, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков ; n - общая сумма частот.
Коэффициент ассоциации можно расcчитать по формуле
Коэффициент контингенции рассчитывается по формуле
Нужно иметь в виду, что для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации.
Если
необходимо оценить тесноту связи
между альтернативными
Для исследования такого рода связи первичную статистическую информацию располагают в форме таблицы:
Признаки | A | B | C | Итого |
D | m11 | m12 | m13 | ∑m1j |
E | m21 | m22 | m23 | ∑m2j |
F | m31 | m32 | m33 | ∑m3j |
Итого | ∑mj1 | ∑mj2 | ∑mj3 | П |
Здесь mij - частоты взаимного сочетания двух атрибутивных признаков; П - число пар наблюдений.
Коэффициент взаимной сопряженности Пирсона определяется по формуле
где φ2 - показатель средней квадратической сопряженности:
Коэффициент взаимной сопряженности изменяется от 0 до 1.
Наконец, следует упомянуть коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле
где na - количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; nb - соответственно количество несовпадений.
Коэффициент Фехнера может изменяться в пределах -1,0 Кф +1,0.
Пример.
По данным о прибыли и объеме кредитных вложений 10 коммерческих банков одного из регионов определить с помощью коэффициента Спирмена зависимость между этими признаками.
Расчет коэффициента Спирмена
№ банка | Кредитные вложения, млн. руб., X | Прибыль, млн.руб., Y | Ранги | Разность рангов di = Rx - Ry | di2 | |
Rx | Ry | |||||
1 | 2 | 3 | 8 | 9 | 10 | 11 |
1
2 3 4 5 6 7 8 9 10 |
2887
1710 3010 2472 2535 1897 2783 1862 1800 2003 |
557
605 628 488 418 397 501 589 269 437 |
9
1 10 6 7 4 8 3 2 5 |
7
9 10 5 3 2 6 8 1 4 |
2
-8 0 1 4 2 2 -5 1 1 |
4
64 0 1 16 4 4 25 1 1 |
Итого | - | - | - | - | - | 120 |
Информация о работе Основные понятия корреляционного и регрессионного анализа