Уравнение парной линейной регрессии ,
Лекция, 29 Октября 2013, автор: пользователь скрыл имя
Краткое описание
Оценка качества уравнения парной линейной регрессии
Регрессионная модель представляет сумму уравнения регрессии и остатков. Проверяется качество обоих слагаемых.
Оценка качества уравнения линейной регрессии состоит из следующих этапов.
1. Оценка математической точности уравнения. Для этого рассчитывается средняя относительная ошибка аппроксимации
Вложенные файлы: 1 файл
Критерии Фишера и Стьюдента.doc
— 88.00 Кб (Скачать файл)Уравнение парной линейной регрессии
Оценка качества уравнения парной линейной регрессии
Регрессионная модель представляет сумму уравнения регрессии и остатков. Проверяется качество обоих слагаемых.
Оценка качества уравнения линейной регрессии состоит из следующих этапов.
1. Оценка математической точности уравнения. Для этого рассчитывается средняя относительная ошибка аппроксимации
,
где - фактические значения переменной y , - теоретические значения y , найденные по уравнению регрессии. Для принятия решения о точности уравнения можно воспользоваться таблицей
Значение |
Точность уравнения |
менее 10 |
высокая |
10 - 20 |
хорошая |
20 - 50 |
удовлетворительная |
более 50 |
неудовлетворительная |
В случае, когда уравнение имеет неудовлетворительную точность, необходимо увеличить объем наблюдений (объем выборки) n, либо взять другое уравнение регрессии (нелинейное).
2. Проверка статистической значимости уравнения регрессии в целом с помощью F-критерия Фишера.
Выдвигается гипотеза Н0: уравнение регрессии статистически незначимо, при конкурирующей гипотезе Н1: уравнение регрессии статистически значимо. Находится расчетное значение (статистика) критерия
или ,
где , , - соответственно фактическое (наблюдаемое), теоретическое и среднее значение ; n - объем выборки, m - число параметров уравнения регрессии при независимых переменных (в случае парной линейной регрессии m = 1), R2 - коэффициент детерминации ( R2 = (r)2 ) .
Табличное (критическое) значение Fтабл , находится по таблице критических значений распределения Фишера-Снедекора (F-распределения) по уровню значимости α и двум числам степеней свободы df1 = m и df2 = n - m - 1 .
Если Fрасч > Fтабл , то гипотеза Н0 отвергается с вероятность ошибки α , т.е. уравнение регрессии признается в целом статистически значимым (адекватно описывающим исходные данные).
В противном случае (Fрасч < Fтабл) уравнение считается незначимым.
3. Проверка статистической значимости оценок параметров b0, b1 с помощью t-критерия Стъюдента.
Критерий Стьдента проверяется
только для линейного уравнения!
Выдвигается гипотеза Н0: параметр bj = 0 (j = 0, 1) (статистически незначим, случайно отличается от 0), при конкурирующей гипотезе Н1: параметр bj ≠ 0 (статистически значим, неслучайно отличается от 0). Находится расчетное значение критерия
,
где средние квадратические ошибки параметров:
,
.
Теоретическое значение критерия tтабл находится по таблице критических значений распределения Стъюдента по уровню значимости α и числу степеней свободы df = n - m - 1 .
Если tbj > tтабл , то гипотеза Н0 отвергается с вероятность ошибки α , т.е. оценка коэффициента регрессии bj признается статистически значимой, т.е. не является результатом действия внешних случайных факторов.
В противном случае (tbj < tтабл) - bj статистически незначим.
4. Построение интервальных оценок (доверительных интервалов) параметров регрессии в виде
которые с надежностью (вероятностью) γ = 1 - α покрывают истинные параметры βj. Здесь tтабл - значение, найденное по таблице критических точек распределения Стъюдента по уровню значимости α/2 и числу степеней свободы df = n - m - 1.
Если границы некоторого доверительного интервала имеют разные знаки, соответствующий параметр уравнения регрессии статистически незначим.