Статистический анализ продаж готовой продукции ООО ПФ «Челнинский арматурный завод»
Курсовая работа, 25 Мая 2012, автор: пользователь скрыл имя
Краткое описание
Основной целью курсовой работы является статистический анализ продаж готовой продукции ООО ПФ «Челнинский арматурный завод», выявление на основе корреляционно-регрессионного анализа экономических показателей, влияющих на изменение объема продаж, и прогнозирование объема продаж на основе трендового анализа.
Вложенные файлы: 1 файл
Курсовая.docx
— 514.43 Кб (Скачать файл)Если , то между случайными величинами Y и х существует только корреляционная связь: .
Коэффициент корреляции находится по формуле:
(1), где
, , ,
Для вычисления r по значениям выборочных данных xi и yi, , формулу (1) преобразуем к виду (2):
1.3.2 Основные виды уравнений парной регрессии и методы определения их параметров2
Выбор формулы связи (вида уравнения) называется спецификацией уравнения регрессии.
Перечислим основные виды уравнений парной регрессии:
- Линейная зависимость ;
- Гиперболическая зависимость ;
- Степенная зависимость ;
- Логарифмическая зависимость ;
- Полиномиальная зависимость ;
- Тригонометрическая зависимость ; где m – число гармоник; a0, ak, bk – неизвестные коэффициенты линии регрессии.
Определение параметров уравнения регрессии называется параметризацией.
Для
определения неизвестных
Алгоритм применения МНК
- Строится целевая функция
- Находится система уравнений для определения неизвестных параметров
Согласно МНК для нахождения параметров полинома p-ой степени необходимо решить систему так называемых нормальных уравнений:
Решение
этой системы относительно
и дает искомые значения параметров.
Линейная зависимость
Для
определения неизвестных
.
Пусть d, da ,db – определители, соответствующие системе уравнений (3), а именно:
.
Тогда неизвестные коэффициенты уравнения регрессии будут равны:
.
Другое решение системы (3). Из первого уравнения следует: , а из второго – имеем:
Таким образом , .
Подставив значения а и b в формулу , получим:
.
Гиперболическая зависимость
При гиперболической
зависимости
параметры a и b находят, как
и в случае линейной зависимости, но для
уравнения регрессии
, где
.
Степенная зависимость
Для определения параметров a и b степенной зависимости необходимо преобразовать зависимость в линейную, для этого прологарифмировать обе части:
Пусть , a* = lna, x* = lnx, тогда .
Применив к
Определители d, da*, db относятся к системе уравнений
, где
Значение а находим в результате
потенцирования a =
ea*, значение b из соотношения
b = db / d.
Логарифмическая зависимость
Для определения параметров a и b при заданной зависимости уравнение регрессии представим в виде ,где x*=lnx..
Параболическая зависимость
Алгоритм применения МНК для параболической зависимости второго порядка заключается в следующем:
1. Строится целевая функция:
2. Находится система нормальных уравнений
Система преобразуется к виду:
Решение системы нормальных уравнений относительно неизвестных параметров a, b, c можно найти, как и при линейной зависимости, с помощью определителей:
, где
Тригонометрическая зависимость
Уравнение регрессии этого вида является приближением функции Y(х), которое тем точнее, чем больше значение m (m - число гармоник, количество составляющих исследуемого процесса). Поэтому при различных значениях m получаются различные виды тригонометрической зависимости.
Значения неизвестных
Для этого строится целевая функция:
Далее находят .
Получается система нормальных уравнений. Эта система обладает свойством ортогональности.
В результате решения системы получим:
Если
увеличивается число
При нелинейной зависимости определение тесноты связи между двумя случайными величинами х и Y производится с помощью корреляционного отношения
, где .
Корреляционное отношение h всегда положительно 0£ h £ 1.
Чем теснее связь между Y и х, тем меньше величина , , тем больше h.
Точность аппроксимации определяется как средняя относительная ошибка аппроксимации .
Величина d определяется в процентах. Чаще применяется при оценке нелинейной зависимости.
1.3.3 Оценка значимости коэффициента корреляции3
Поскольку коэффициент корреляции r определяется по данным случайной выборки, то он может отличаться от коэффициента корреляции r, который соответствует генеральной совокупности.
В случае, когда объем выборки N ³ 20, то предполагают, что коэффициент корреляции является случайной величиной, распределенной по нормальному закону.
Пусть sr – среднеквадратичное отклонение выборочного коэффициента корреляции r. Тогда при N ³ 20 доверительный интервал для r будет равен (r - xpsr, r + xpsr), где хр – параметр нормального распределения вероятностей:
.
Значение хр определяется по таблице функции распределения Ф(х) в зависимости от вероятности Р. Для оперативного определения значения хр при Р ³ 0,9, можно использовать таблицу 1.
Таблица 1.
| (х) | 0,9 | 0,95 | 0,99 |
| хр | 1,653 | 1,96 | 2,576 |
Значение среднеквадратичного отклонения sr можно определить по формуле .
Подставим в доверительный интервал вместо неизвестной величины r его оценку по выборке r и sr . Тогда
. Для проверки значимости выборочного коэффициента корреляции r чаще используется так называемая нулевая гипотеза: H0: r = 0, H1: r ¹ 0.
Суть нулевой гипотезы состоит в том, что в случае, когда для случайных величин х и Y на основании выборок и получено½r½>0, т.е. между ними имеется корреляционная связь, предполагается, что в генеральной совокупности этой связи нет (H0: r = 0).
При r = 0, получим:
.
При проверке нулевой гипотезы достаточно использовать только левый (нижний) предел доверительного интервала . Так как r = 0, то .
Данное условие означает, что нулевая гипотеза с вероятностью Ф(хр) подтверждается.
Если , то нулевая гипотеза с вероятностью Ф(хр) отвергается, а, следовательно, связь между х и Y имеет место.
В
тех случаях, когда размер выборки
N<20, для проверки нулевой гипотезы (r
= 0) используется t – критерий Стьюдента.
Алгоритм использования t – критерия Стьюдента (N<20)
Определяется расчетное значение tрасч. по формуле: .
По
таблице критических точек
Если ½tрасч½ £ tтеор., то нулевая гипотеза Н0 принимается (r = 0), если ½tрасч½ > tтеор., то Н0 – отвергается (r ¹ 0), следовательно, случайные величины х и Y коррелированы, то есть между ними существует линейная связь.
1.3.4 Автокорреляция остатков. Критерий Дарбина – Уотсона4
Статистическая
значимость коэффициентов регрессии
не гарантирует высокое качество
уравнения регрессии. При анализе
уравнения регрессии на начальном
этапе часто проверяют
При этом проверяют их некоррелированность, причем не любых, а только соседних величин ei , .