Регрессионные модели
Контрольная работа, 16 Сентября 2014, автор: пользователь скрыл имя
Краткое описание
Термину регрессионная модель, используемому в регрессионном анализе, можно сопоставить синонимы: «теория», «гипотеза». Эти термины пришли из статистики, в частности из раздела «проверка статистических гипотез». Регрессионная модель есть прежде всего гипотеза, которая должна быть подвергнута статистической проверке, после чего она принимается или отвергается.
Регрессионная модель — это параметрическое семейство функций, задающее отображение
где — пространтсво параметров, — пространство свободных переменных, — пространство зависимых переменных.
Вложенные файлы: 1 файл
модели.docx
— 51.61 Кб (Скачать файл)Более простой способ выявления и устранения избыточности факторов состоит в оценке мультиколлинеарности (чем больше мультиколлинеарность, тем больше избыточность) и в последующем использовании метода исключения переменных.
Метод исключения переменных заключается в том, что высококоррелированные объясняющие переменные (факторы) устраняются из регрессии последовательно в несколько этапов, после чего она заново оценивается:
- Отбор переменных, подлежащих исключению, производится с помощью коэффициентов парной корреляции. Опыт показывает, что если │rij│≥ 0.7, то одну из переменных можно исключить (rij - коэффициент парной корреляции между факторами xi и xj).
- Отбор переменных продолжают, анализируя тесноту взаимосвязи факторов x с зависимой переменной y. Для анализа тесноты взаимосвязи x и y используют значения коэффициента парной корреляции между фактором и функцией (rxi y). Факторы xi, для которых rxi y≈ 0, то есть мало связанные с y, подлежат исключению.
- На следующем этапе отбор факторов проводят, анализируя коэффициенты βфакторов. Коэффициент β показывает, на сколько "сигм" (СКО) изменяется функция с изменением соответствующего аргумента на одну "сигму" при фиксированном значении остальных аргументов βk =ak∙(σx k/σy),
где: βk - коэффициент β k-го фактора;
σx k - СКО k-го фактора;
σy - СКО функции;
ak - коэффициент регрессии при k-ом факторе.
Из двух факторов может быть исключен тот, который имеет меньшее значение β.
- Дальнейший отбор факторов проводится путем проверки коэффициентов регрессии ak на статистическую значимость (например, с помощью t-критерия Стьюдента). Расчет критерия Стьюдента tk (для k-го фактора) выполняется по формуле:
tk=ak /Sa k, (3.2)
где: ak - коэффициент регрессии при k-ом факторе;
Sa k - стандартное отклонение оценки параметра ak.
Значение tk, рассчитанное по (3.2), сравнивают с табличным значением критерия tf,α, найденным по таблице квантилей t-распределения (для этого предварительно задаются величиной уровня значимости α и определяют число степеней свободы f =n-m-1, где: n - число наблюдений в исходном статистическом ряде; m - количество факторов в модели).
Если tk<t f,α, то k-ый фактор не оказывает существенного влияния на y, в связи с чем, он может быть исключен из модели.
Проверка адекватности регрессионной модели. Целью этого этапа является проверка качества окончательного варианта регрессионной модели. Данный этап включает:
- оценку значимости коэффициента детерминации D;
- вычисление средней ошибки аппроксимации Е.
Оценка значимости коэффициента детерминации необходима для ответа на вопрос: оказывают ли выбранные факторы достаточное влияние на y? Для оценки значимости используется F-статистика Фишера:
F= [D∙(n -m- 1)] / [m∙(1 -D)], (3.3)
где: D -коэффициент множественной детерминации,
D =R2 (здесь R коэффициент множественной корреляции);
n - число наблюдений в исходном статистическом ряде;
m - количество факторов в модели.
Значение F, рассчитанное по (3.3), сравнивают с табличным значением Ff1,f2,α, найденным по таблице квантилей F-распределения Фишера (для этого предварительно задаются величиной уровня значимости α и определяют число степеней свободы f1=m; f2=n-m- 1,
где: n - число наблюдений в исходном статистическом ряде;
m - количество факторов в модели).
Если F>Ff1,f2,α , то включенные в регрессию факторы достаточно полно объясняют зависимую переменную y, что позволяет говорить о значимости самой регрессии (модели).
Вычисление средней ошибки аппроксимации позволяет проверить качество подбора теоретического уравнения. Средняя ошибка аппроксимации регрессии определяется по формуле:
n
E= {{∑[(y i-y i т) /y i т]} /n} ∙100 %,
i = 1
где: n - число наблюдений в исходном статистическом ряде;
yi - значения зависимой переменной, полученные в i-ом наблюдении (в i-ой точке исходного статистического ряда);
yi т - значения зависимой переменной, рассчитанные с помощью регрессии для i-ой точки.
Смысловая интерпретация
полученной модели. Целью этого этапа является осмысление функциональных возм