Статистический анализ продаж готовой продукции ООО ПФ «Челнинский арматурный завод»

Автор работы: Пользователь скрыл имя, 25 Мая 2012 в 21:13, курсовая работа

Краткое описание

Основной целью курсовой работы является статистический анализ продаж готовой продукции ООО ПФ «Челнинский арматурный завод», выявление на основе корреляционно-регрессионного анализа экономических показателей, влияющих на изменение объема продаж, и прогнозирование объема продаж на основе трендового анализа.

Вложенные файлы: 1 файл

Курсовая.docx

— 514.43 Кб (Скачать файл)

    Если  , то между случайными величинами Y и х существует только корреляционная связь:  .

    Коэффициент корреляции находится по формуле:

     (1), где

    

     , , ,    

    

     Для вычисления r по значениям выборочных данных xi и yi, , формулу (1) преобразуем к виду (2):

                

1.3.2 Основные виды  уравнений парной  регрессии и методы  определения их  параметров2

    Выбор формулы связи (вида уравнения) называется спецификацией уравнения регрессии.

    Перечислим  основные виды уравнений парной регрессии:

  • Линейная зависимость ;
  • Гиперболическая зависимость ;
  • Степенная зависимость ;
  • Логарифмическая зависимость ;
  • Полиномиальная зависимость ;
  • Тригонометрическая зависимость ; где m – число гармоник; a0, ak, bk – неизвестные коэффициенты линии регрессии.

    Определение параметров уравнения регрессии  называется параметризацией

    Для определения неизвестных параметров уравнения регрессии обычно применяют  метод наименьших квадратов (МНК). Рассмотрим функцию вида .

    Алгоритм  применения МНК

  1. Строится целевая функция
  2. Находится система уравнений для определения неизвестных параметров

    Согласно  МНК для нахождения параметров полинома p-ой степени необходимо решить систему так называемых нормальных уравнений:

    

    Решение этой системы относительно и дает искомые значения параметров. 

    Линейная  зависимость

    Для определения неизвестных параметров    линейной зависимости методом наименьших квадратов необходимо решить следующую  систему нормальных уравнений:

     .

    Пусть d, da ,db – определители, соответствующие системе уравнений (3), а именно:

     .

    Тогда неизвестные коэффициенты уравнения  регрессии  будут равны:

     .

    Другое решение системы (3). Из первого уравнения следует:  , а из второго – имеем:

      Таким образом  , .

    Подставив значения  а и b в формулу , получим:

     . 

    Гиперболическая зависимость

          При гиперболической  зависимости  параметры a и b находят, как и в случае линейной зависимости, но для уравнения регрессии     , где . 

    Степенная зависимость

    Для определения параметров a и b степенной зависимости необходимо преобразовать зависимость в линейную, для этого прологарифмировать обе части:

                            

          Пусть     ,      a* = lna,     x* = lnx, тогда        .

          Применив к зависимости  МНК, находим  .

          Определители d, da*, db относятся к системе уравнений

     , где  

      Значение а находим в результате потенцирования a = ea*, значение b из соотношения b = db / d. 

    Логарифмическая  зависимость

          Для определения  параметров a и b при заданной зависимости уравнение  регрессии представим в виде ,где x*=lnx..

      

    Параболическая  зависимость

          Алгоритм применения МНК для параболической зависимости  второго порядка  заключается в следующем:

    1. Строится целевая функция:

    

    2. Находится система нормальных уравнений

    

    Система преобразуется к виду:

    

    Решение системы нормальных уравнений относительно неизвестных параметров a, b, c можно найти, как и при линейной зависимости, с помощью определителей:

     , где

      

    Тригонометрическая  зависимость

    Уравнение регрессии этого вида является приближением функции Y(х), которое тем точнее, чем больше значение  m (m - число гармоник, количество составляющих исследуемого процесса). Поэтому при различных значениях m получаются различные виды тригонометрической зависимости.

     Значения неизвестных параметров a0, ak, bk ( ) находят с помощью метода наименьших квадратов.

    Для этого строится целевая функция:  

      Далее находят  .

    Получается  система нормальных уравнений. Эта  система обладает свойством ортогональности.

    В результате решения системы получим:

    

    Если  увеличивается число коэффициентов  в уравнении регрессии при  параболической и тригонометрической зависимости, то увеличится точность аппроксимации, но уменьшится значимость в результате увеличения дисперсии  , где n – количество неизвестных параметров в уравнении регрессии.

    При нелинейной зависимости определение  тесноты связи между двумя  случайными величинами х и Y  производится с помощью корреляционного отношения

     , где .

    Корреляционное  отношение h всегда положительно       0£ h £ 1.

    Чем теснее связь между Y и х, тем меньше величина , тем больше h.

    Точность  аппроксимации определяется как средняя относительная ошибка аппроксимации .

    Величина d определяется в процентах. Чаще применяется при оценке нелинейной зависимости.

1.3.3 Оценка значимости  коэффициента корреляции3

    Поскольку коэффициент корреляции r определяется по данным случайной выборки, то он может отличаться от коэффициента корреляции r, который соответствует генеральной совокупности.

    В случае, когда объем выборки N ³ 20, то предполагают, что коэффициент корреляции является случайной величиной, распределенной по нормальному закону.

    Пусть sr – среднеквадратичное отклонение выборочного коэффициента корреляции r.   Тогда при N ³ 20 доверительный интервал для r  будет равен (r - xpsr, r + xpsr), где хр – параметр нормального распределения вероятностей:

     .

    Значение  хр определяется по таблице функции  распределения Ф(х) в зависимости  от вероятности Р. Для оперативного определения значения хр  при  Р ³ 0,9, можно использовать таблицу 1.

    Таблица 1.

     
    (х)     0,9     0,95     0,99
    хр     1,653     1,96     2,576

    Значение  среднеквадратичного отклонения sr можно определить по формуле .

    Подставим  в доверительный интервал вместо неизвестной величины r его оценку по выборке r и sr . Тогда

     . Для проверки значимости выборочного коэффициента корреляции r чаще используется так называемая нулевая гипотеза: H0: r = 0,      H1: r ¹ 0.

    Суть  нулевой гипотезы состоит в том, что в случае, когда для случайных  величин х и Y на основании выборок и получено½r½>0, т.е. между ними имеется корреляционная связь, предполагается, что в генеральной совокупности этой связи нет (H0: r = 0).

    При r = 0, получим:

     .

    При проверке нулевой гипотезы достаточно использовать только левый (нижний) предел доверительного интервала  . Так как r = 0, то .

    Данное  условие означает, что нулевая  гипотеза с вероятностью Ф(хр) подтверждается.

    Если  , то нулевая гипотеза с вероятностью Ф(хр) отвергается, а, следовательно, связь между х и Y имеет место.

    В тех случаях, когда размер выборки        N<20, для проверки нулевой гипотезы (r = 0) используется t – критерий Стьюдента. 

    Алгоритм  использования t – критерия Стьюдента (N<20)

    Определяется  расчетное значение tрасч. по формуле: .

    По  таблице критических точек распределения  Стьюдента по значению числа степеней свободы k = N - 2 и уровню значимости a (уровень значимости - это вероятность совершить ошибку первого рода, т.е. отвергнуть правильную нулевую гипотезу) определяется теоретическое значение tтеор. (критическая точка).

    Если ½tрасч½ £ tтеор., то нулевая гипотеза Н0 принимается (r = 0),  если ½tрасч½ > tтеор., то            Н0 – отвергается         (r ¹ 0), следовательно,  случайные величины  х и Y  коррелированы,  то  есть   между   ними   существует линейная связь.

1.3.4 Автокорреляция остатков.  Критерий Дарбина – Уотсона4

    Статистическая  значимость коэффициентов регрессии  не гарантирует высокое качество уравнения регрессии.  При анализе  уравнения регрессии на начальном  этапе часто проверяют выполнимость одной предпосылки, которую можно  сформулировать как статистическая независимость отклонений (остатков ) между собой.

    При этом проверяют их некоррелированность, причем не любых, а только соседних величин    ei , .

Информация о работе Статистический анализ продаж готовой продукции ООО ПФ «Челнинский арматурный завод»