Ценные бумаги

Автор работы: Пользователь скрыл имя, 27 Марта 2014 в 10:23, курсовая работа

Краткое описание

Множественная регрессия - это уравнение связи с несколькими независимыми переменными:
y = f (x1,x2,…xm) + ɛ,
где у - зависимая переменная (результативный признак); х1, х2,…хm -
независимые переменные (признаки-факторы).

Вложенные файлы: 1 файл

теория.docx

— 54.23 Кб (Скачать файл)

Теоретическая справка

Множественная регрессия - это уравнение связи с несколькими независимыми переменными:

y = f (x1,x2,…xm) + ɛ,

где у - зависимая переменная (результативный признак); х1, х2,…хm -

независимые переменные (признаки-факторы).

Для    построения    уравнения    множественной    регрессии    чаще используются следующие функции:

  • линейная – у = a +b х1 + b2  х2 +... + bm хm + ɛ;

  • степенная – у = aх1b1 * х2b2*...* хmbm *ɛ;

  • экспонента – у = ea+b1x1+b2x2+…+bmxm+ɛ;

  • гипербола - у = 

Можно использовать и другие функции, приводимые к линейному виду.

Для оценки параметров уравнения множественной регрессий применяют метод наименьших квадратов (МНК). Для линейных уравнений

у = a +b х1 + b2  х2 +... + bm хm + ɛ;     (3.1)

строится следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:

 (3.2)

Σyx1 = aΣx1 + b1Σx12 + b2Σx1x2 + …+ bmΣxmx1,

…………………………………………….

Σyxm = aΣxm + b1Σx1xm + b2Σx2xm +  bmΣxm2.

Для двухфакторной модели данная система будет иметь вид:   

na + b1Σx1 + b2Σx2 + … + bmΣxm = Σy,  (3.3)

aΣx1 + b1Σx12 + b2Σx1x2 + …+ bmΣxmx1 = Σyx1,

aΣx2 + b1Σx1x2 + b2Σx22 = Σyx2.

Так же можно воспользоваться готовыми формулами, которые являются следствием из этой системы:

b1 = ;                (3.4)

b2 = ;

a = ȳ - b1ẋ1 – b2ẋ2.

В линейной множественной регрессии параметры при x называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне.

Метод наименьших квадратов применим и к уравнению множественной регрессии в стандартизированном масштабе:

ty = β1tx1 + β2tx2 + ... + βmtxm + ɛ,                                                                          (3.5)

 

где    ty, tx1, ..., txm     –    стандартизированные    переменные:

ty = ,  txi = , для которых среднее значение равно нулю:   ṫy =ṫxi =0, а

среднее квадратическое отклонение равно единице: σty =σtxi =1; βi  –

стандартизированные коэффициенты регрессии.

В силу того, что все переменные заданы как центрированные и нормированные, стандартизованные коэффициенты регрессии βi можно

сравнивать между собой. Сравнивая их друг с другом, можно ранжировать факторы по силе их воздействия на результат. В этом основное достоинство стандартизованных коэффициентов регрессии в отличие от коэффициентов «чистой» регрессии, которые несравнимы между собой.

Применяя МНК к уравнению множественной регрессии в стандартизированном масштабе, получим систему нормальных уравнений вида

ryx1 = β1 + β2rx1x2 + β3rx1x3 + … + βmrx1xm,

ryx2 = β1rx1x2 + β2 + β3rx1x3 + … + βmrx1xm,                  (3.6)

…………………………………………

ryxm = β1rx1xm + β2rx2xm + β3rx3xm + … + βm.

где ryxi и rxixj - коэффициенты парной и межфакторной корреляции.

Коэффициенты       «чистой»       регрессии        bi        связаны       со стандартизованными коэффициентами регрессии βi следующим образом:

βi = bi            (3.7)

Поэтому можно переходить от уравнения регрессии в стандартизованном масштабе (3.5) к уравнению регрессии в натуральном масштабе переменных     (3.1),    при     этом     параметр     a     определяется     как

a = ȳ-b1ẋ1 -b2ẋ2 -...-bmẋm.

Рассмотренный смысл стандартизованных коэффициентов регрессии позволяет их использовать при отсеве факторов – из модели исключаются факторы с наименьшим значением βi .

Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле

Ӭyxj = bj*,                                                                                 (3.8)

которые показывают на сколько процентов в среднем изменится результат, при изменении соответствующего фактора на 1%. Средние показатели эластичности можно сравнивать друг с другом и соответственно ранжировать факторы по силе их воздействия на результат.

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:

Ryx1x2…xm = .             (3.9)

Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:

Ryx1x2…xm ≥ ryxi (i = 1, m).

При линейной зависимости коэффициент множественной корреляции можно определить через матрицы парных коэффициентов корреляции:

Ryx1x2…xm = ,         (3.10)

где

∆r =

…………………………………

ryxm      rxmx1 rxmx2  … 1

  • определитель матрицы парных коэффициентов корреляции;
  • ∆r11 =

……………………

                                        rxmx1 rxmx2   … 1

– определитель матрицы межфакторной корреляции.

Так же при линейной зависимости признаков формула коэффициента множественной корреляции может быть также представлена следующим выражением:

Ryx1x2…xm = ,        (3.11)

где   βi  -  стандартизованные коэффициенты регрессии;   ryxi  - парные

коэффициенты корреляции результата с каждым фактором.

Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции R2yx1x2…xm.

Для того чтобы не допустить преувеличения тесноты связи, применяется скорректированный индекс множественной детерминации, который содержит поправку на число степеней свободы и рассчитывается по формуле

Ř2 = 1 – (1 – R2) * ,      (3.12)

где n- число наблюдений, m- число факторов. При небольшом числе наблюдений нескорректированная величина коэффициента множественной детерминации R2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.

Частные коэффициенты (или индексы) корреляции, измеряющие влияние на у фактора xi, при элиминировании (исключении влияния) других факторов, можно определить по формуле

 

ryx1*x1x2…xi-1xi+1…xm = ,       (3.13)

или по рекуррентной формуле:

Рассчитанные по рекуррентной формуле частные коэффициенты корреляции изменяются в пределах от -1 до +1, а по формулам через множественные коэффициенты детерминации - от 0 до 1. Сравнение их друг с другом позволяет ранжировать факторы по тесноте их связи с результатом. Частные коэффициенты корреляции дают меру тесноты связи каждого фактора с результатом в чистом виде.

При двух факторах формулы (3.12) и (3.13) примут вид:                 (3.14)

ryx1*x1x2…xi-1xi+1…xm =

Значимость     уравнения     множественной    регрессии     в     целом оценивается с помощью F -критерия Фишера:

F = * .               (3.15)

Частный    F -критерий    оценивает    статистическую  значимость

присутствия каждого из факторов в уравнении. В общем виде для фактора х частный F -критерий определится как

Fxi = *                                                   (3.16)

Фактическое    значение    частного     F -критерия    сравнивается    с табличным при уровне значимости α и числе степеней свободы: k1=1 и k2=n-m-l. Если фактическое значение Fxi превышает Fтабл(α, k1 к2), то дополнительное включение фактора хi в модель статистически оправданно

и коэффициент чистой регрессии bi при факторе xi статистически значим.

Если же фактическое значение Fxi меньше табличного, то дополнительное включение в модель фактора   xi   не увеличивает существенно долю объясненной вариации признака y, следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.

Оценка значимости коэффициентов чистой регрессии проводится по t-критерию Стьюдента. В этом случае, как и в парной регрессии, для каждого фактора используется формула

tbi=                                                                                    (3.17)

Для уравнения множественной регрессии (3.1) средняя квадратическая ошибка коэффициента регрессии может быть определена по формуле:

mbi = , (3.18)

где R2xix1…xm - коэффициент детерминации для зависимости фактора xi со всеми  другими  факторами  уравнения  множественной  регрессии.   Для двухфакторной модели (m= 2) имеем:

mb1 = ;            (3.19)

mb2 = .            (3.20)

Существует связь между  t -критерием Стьюдента и частным   F- 
критерием Фишера:

|tbi| = .

Уравнения множественной регрессии могут включать в качестве независимых переменных качественные признаки (например, профессия, пол, образование, климатические условия, отдельные регионы и т.д.). Чтобы ввести такие переменные в регрессионную модель, их необходимо упорядочить и присвоить им те или иные значения, т.е. качественные переменные преобразовать в количественные.

Такого     вида     сконструированные     переменные     принято     в

эконометрике называть фиктивными переменными. Например, включать в

модель фактор «пол» в виде фиктивной переменной можно в следующем

виде:

1 - мужской пол, 
z =      (3.22)

0 - женский пол.

Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменной при переходе от одной категории (женский пол) к другой (мужской пол) при неизменных значениях остальных параметров. 
Приложение 1

Значения критерия Фишера (F-критерия) для уровня значимости

= 0.05

f1 - число степеней свободы большей дисперсии, f2 - число степеней свободы меньшей дисперсии

 

f1

f2

1

2

3

4

5

6

7

8

9

10

15

1

161.45

199.50

215.71

224.58

230.16

233.99

236.77

238.88

240.54

241.88

245.95

2

18.51

19.00

19.16

19.25

19.30

19.33

19.35

19.37

19.38

19.40

19.43

3

10.13

9.55

9.28

9.12

9.01

8.94

8.89

8.85

8.81

8.79

8.70

4

7.71

6.94

6.59

6.39

6.26

6.16

6.09

6.04

6.00

5.96

5.86

5

6.61

5.79

5.41

5.19

5.05

4.95

4.88

4.82

4.77

4.74

4.62

6

5.99

5.14

4.76

4.53

4.39

4.28

4.21

4.15

4.10

4.06

3.94

7

5.59

4.74

4.35

4.12

3.97

3.87

3.79

3.73

3.68

3.64

3.51

8

5.32

4.46

4.07

3.84

3.69

3.58

3.50

3.44

3.39

3.35

3.22

9

5.12

4.26

3.86

3.63

3.48

3.37

3.29

3.23

3.18

3.14

3.01

10

4.96

4.10

3.71

3.48

3.33

3.22

3.14

3.07

3.02

2.98

2.85

11

4.84

3.98

3.59

3.36

3.20

3.09

3.01

2.95

2.90

2.85

2.72

12

4.75

3.89

3.49

3.26

3.11

3.00

2.91

2.85

2.80

2.75

2.62

13

4.67

3.81

3.41

3.18

3.03

2.92

2.83

2.77

2.71

2.67

2.53

14

4.60

3.74

3.34

3.11

2.96

2.85

2.76

2.70

2.65

2.60

2.46

15

4.54

3.68

3.29

3.06

2.90

2.79

2.71

2.64

2.59

2.54

2.40

16

4.49

3.63

3.24

3.01

2.85

2.74

2.66

2.59

2.54

2.49

2.35

17

4.45

3.59

3.20

2.96

2.81

2.70

2.61

2.55

2.49

2.45

2.31

18

4.41

3.55

3.16

2.93

2.77

2.66

2.58

2.51

2.46

2.41

2.27

19

4.38

3.52

3.13

2.90

2.74

2.63

2.54

2.48

2.42

2.38

2.23

20

4.35

3.49

3.10

2.87

2.71

2.60

2.51

2.45

2.39

2.35

2.20

Информация о работе Ценные бумаги