Регрессионные модели

Автор работы: Пользователь скрыл имя, 16 Сентября 2014 в 10:56, контрольная работа

Краткое описание

Термину регрессионная модель, используемому в регрессионном анализе, можно сопоставить синонимы: «теория», «гипотеза». Эти термины пришли из статистики, в частности из раздела «проверка статистических гипотез». Регрессионная модель есть прежде всего гипотеза, которая должна быть подвергнута статистической проверке, после чего она принимается или отвергается.
Регрессионная модель — это параметрическое семейство функций, задающее отображение
где — пространтсво параметров, — пространство свободных переменных, — пространство зависимых переменных.

Вложенные файлы: 1 файл

модели.docx

— 51.61 Кб (Скачать файл)

Более простой способ выявления и устранения избыточности факторов состоит в оценке мультиколлинеарности (чем больше мультиколлинеарность, тем больше избыточность) и в последующем использовании метода исключения переменных.

Метод исключения переменных заключается в том, что высококоррелированные объясняющие переменные (факторы) устраняются из регрессии последовательно в несколько этапов, после чего она заново оценивается:

  1. Отбор переменных, подлежащих исключению, производится с помощью коэффициентов парной корреляции. Опыт показывает, что если │rij│≥ 0.7, то одну из переменных можно исключить (rij - коэффициент парной корреляции между факторами xi и xj).
  2. Отбор переменных продолжают, анализируя тесноту взаимосвязи факторов x с зависимой переменной y. Для анализа тесноты взаимосвязи x и y используют значения коэффициента парной корреляции между фактором и функцией (rxi y). Факторы xi, для которых rxi y≈ 0, то есть мало связанные с y, подлежат исключению.
  3. На следующем этапе отбор факторов проводят, анализируя коэффициенты βфакторов. Коэффициент β показывает, на сколько "сигм" (СКО) изменяется функция с изменением соответствующего аргумента на одну "сигму" при фиксированном значении остальных аргументов βk =ak∙(σx k/σy),

где: βk - коэффициент β k-го фактора;

σx k - СКО k-го фактора;

σy - СКО функции;

ak - коэффициент регрессии при k-ом факторе.

Из двух факторов может быть исключен тот, который имеет меньшее значение β.

  1. Дальнейший отбор факторов проводится путем проверки коэффициентов регрессии ak на статистическую значимость (например, с помощью t-критерия Стьюдента). Расчет критерия Стьюдента tk (для k-го фактора) выполняется по формуле:

tk=ak /Sa k, (3.2)

где: ak - коэффициент регрессии при k-ом факторе;

Sa k - стандартное отклонение оценки параметра ak.

Значение tk, рассчитанное по (3.2), сравнивают с табличным значением критерия tf,α, найденным по таблице квантилей t-распределения (для этого предварительно задаются величиной уровня значимости α и определяют число степеней свободы f =n-m-1, где: n - число наблюдений в исходном статистическом ряде; m - количество факторов в модели).

Если tk<t f,α, то k-ый фактор не оказывает существенного влияния на y, в связи с чем, он может быть исключен из модели.

Проверка адекватности регрессионной модели. Целью этого этапа является проверка качества окончательного варианта регрессионной модели. Данный этап включает:

  • оценку значимости коэффициента детерминации D;
  • вычисление средней ошибки аппроксимации Е.

Оценка значимости коэффициента детерминации необходима для ответа на вопрос: оказывают ли выбранные факторы достаточное влияние на y? Для оценки значимости используется F-статистика Фишера:

F= [D∙(n -m- 1)] / [m∙(1 -D)], (3.3)

где: D -коэффициент множественной детерминации,

D =R2 (здесь R коэффициент множественной корреляции);

n - число наблюдений в исходном статистическом ряде;

m - количество факторов в модели.

Значение F, рассчитанное по (3.3), сравнивают с табличным значением Ff1,f2,α, найденным по таблице квантилей F-распределения Фишера (для этого предварительно задаются величиной уровня значимости α и определяют число степеней свободы f1=m; f2=n-m- 1,

где: n - число наблюдений в исходном статистическом ряде;

m - количество факторов в модели).

Если F>Ff1,f2,α , то включенные в регрессию факторы достаточно полно объясняют зависимую переменную y, что позволяет говорить о значимости самой регрессии (модели).

Вычисление средней ошибки аппроксимации позволяет проверить качество подбора теоретического уравнения. Средняя ошибка аппроксимации регрессии определяется по формуле:

 

n

E= {{∑[(y i-y i т) /y i т]} /n} ∙100 %,

i = 1

где: n - число наблюдений в исходном статистическом ряде;

yi - значения зависимой переменной, полученные в i-ом наблюдении (в i-ой точке исходного статистического ряда);

yi т - значения зависимой переменной, рассчитанные с помощью регрессии для i-ой точки.

Смысловая интерпретация полученной модели. Целью этого этапа является осмысление функциональных возможностей полученной регрессионной модели. На тестовых примерах проверяется корректность исходных гипотез (сформулированных на первом этапе), составляется предварительный план решения (на основе полученной модели) ряда конкретных исследовательских задач, например, - задач прогнозирования.

 


Информация о работе Регрессионные модели