Теория корреляции

Автор работы: Пользователь скрыл имя, 21 Мая 2013 в 19:45, реферат

Краткое описание

Теория вероятности есть математическая наука, изучающая закономерности в случайных явлениях.
Что же понимается под случайными явлениями?
При научном исследовании физических и технических задач, часто приходится встречаться с явлениями особого типа, которые принято называть случайными.
Случайное явление - это такое явление, которое при неоднократном воспроизведении одного и того же опыта протекает несколько по-иному.

Вложенные файлы: 1 файл

реферат.docx

— 46.37 Кб (Скачать файл)

т.е. начальный момент s-го порядка  случайной величины Х есть не что  иное, как математическое ожидание s-ой степени этой случайной величины.

Перед тем как дать определение  центрального момента введем понятие "центрированной случайной величины".

Пусть имеется случайная величина Х с математическим ожиданием mx.

Центрированной случайной  величиной, соответствующей величине Х, называется отклонение случайной величины Х от её математического ожидания

Нетрудно видеть, что математическое ожидание центрированной случайной величины равно нулю.

Центрирование случайной величины равносильно переносу начала координат  в точку, абсцисса которой равна математическому ожиданию.

Центральным моментом порядка s случайной величины Х называется математическое ожидание s-ой степени соответствующей центрированной случайной величины:

.

Для прерывной случайной величины s-й центральный момент выражается суммой

,

а для непрерывной - интегралом

.

Важнейшее значение имеет второй центральный  момент, который называют дисперсией и обозначают D[X]. Для дисперсии имеем

.

Дисперсия случайной величины есть характеристика рассеивания, разбросанности значений случайной величины около её математического ожидания.

Само слово "дисперсия" означает "рассеивание".

Механической интерпретацией дисперсии  является не что иное, как момент инерции заданного распределения масс относительно центра тяжести.

На практике часто применяется  также величина

, называемая средним квадратичным отклонением (иначе - "стандартом") случайной величины Х.

Теперь перейдем к рассмотрению характеристик систем случайных  величин.

Начальным моментом порядка k,s системы (Х, Y) называется математическое ожидание произведения Xk и Ys, xk,s=M[XkYs].

Центральным моментом порядка k,s системы (Х, Y) называется математическое ожидание произведения k-ой и s-ой степени соответствующих центрированных величин:

,

где , .

Для прерывных случайных величин

,

где рij - вероятность того , что система (Х, Y) примем значения (xi, yj), а сумма рассматривается по всем возможным значениям случайных величин  X,Y.

Для непрерывных случайных величин

,

где f(x,y) - плотность распределения  системы.

Помимо чисел k и s, характеризующих  порядок момента по отношению  к отдельным величинам, рассматривается ещё суммарный порядок момента k+s, равный сумме показателей степеней при Х и Y. Соответственно суммарному порядку моменты классифицируют на первый, второй и т.д. На практике обычно применяются только первые и вторые моменты.

Первые начальные моменты представляют собой математические ожидания величин Х и Y, входящих в систему σ1,0=mx            σ0,1=my. 

Совокупность математических ожиданий mx  , my представляет собой характеристику положения системы. Геометрически это координаты средней точки на плоскости, вокруг которой происходит рассеивание точки (Х, Y).

Важную роль на практике играют также вторые центральные моменты систем.

Два из них представляют собой дисперсии  величин Х и Y

,

характеризующие рассеивание случайной  точки в направлении осей Ox  и Oy.

Особую роль играет второй смещенный  центральный момент:

, называемый корреляционным моментом (иначе - "моментом связи")случайных величин Х и Y.

Корреляционный момент есть характеристика системы случайных величин, описывающая, помимо рассеивания величин Х и Y, еще и связь между ними. Для того, чтобы убедиться в этом отметим, что корреляционный момент независимых случайных величин равен нулю.

Заметим, что корреляционный момент характеризует не только зависимость  величин, но и их рассеивание. Поэтому для характеристики связи между величинами (Х;Y) в чистом виде переходят от момента Kxy к характеристике

, (3)

где σx, σy - средние квадратичные отклонения величин Х и Y. Эта характеристика называется коэффициентом корреляции величин Х и Y.

Из формулы (3) видно, что для независимых  случайных величин коэффициент корреляции равен нулю, так как для таких величин kxy=0.

Случайные величины, для которых rxy=0, называют некоррелированными (несвязанными).

Отметим однако, что из некоррелированности  случайных величин не следует  их независимость.

Коэффициент корреляции характеризует  не всякую зависимость, а только так называемую линейную зависимость. Линейная вероятностная зависимость случайных величин заключается в том, что при возрастании одной случайной величины другая имеет тенденцию возрастать (или же убывать) по линейному закону. Т.о., коэффициент корреляции характеризует степень тесноты линейной зависимости между случайными величинами.

Например  меры связи ответов испытуемых по заданию № 7 (Х7) с суммой баллов тех  же испытуемых по всему тесту, строится вспомогательная таблица 2.3, в которой  использованы соответствующие данные таблицы 2.2.

Табл. 2.3. Пример расчета коэффициента корреляции

 

X7 Yi X7 Yi X2 Yi2

1 9 9 1 81

1 8 8 1 64

1 7 7 1 49

0 6 0 0 36

0 6 0 0 36

1 5 5 1 25

1 5 5 1 25

0 5 0 0 25

0 4 0 0 16

0 4 0 0 16

0 3 0 0 9

0 2 0 0 4

0 1 0 0 1

В первой колонке приводятся значения баллов, полученных испытуемыми в седьмом  задании. Сумма этих баллов равна 5, или ∑ Х7 = 5.

Во второй колонке представлены тестовые баллы (Yi);    ∑ Yi = 65.

В третьей  колонке даются произведения баллов каждого испытуемого по седьмому заданию (Х7) и по сумме баллов (Y);     ∑ Х7Y = 34.

В четвертой  и пятой колонках - квадраты значений Х7 и Y; Соответственно, ∑ Х72 = 5 и ∑ Y2 = 387.

Для расчета  коэффициента корреляции используются четыре формулы:

1. Вначале  находится сумма квадратов отклонений  баллов испытуемых от среднего  арифметического балла в интересующем  задании (SS по заданию Х7).

2. Затем  находится сумма квадратов отклонений  тестовых баллов испытуемых от  среднего арифметического балла  по всему тесту (SSy). Подставляя  известные данные, получаем

3. Находится  так называемая скорректированная,  на средние значения, сумма попарных  произведений Х и Y, по формуле:

В этой формуле  ∑ XY представляет собой сумму произведений баллов каждого испытуемого по седьмому заданию и по Y, тестовому баллу  испытуемых.

Вторая  часть формулы представляет собой  коррекцию на средние значения произведений Хi на Yi.

4. Рассчитывается  классический коэффициент корреляции:

Подставляя  в эту формулу результаты проведенных  расчетов, получаем:

Чем выше значения r, тем больше вероятность  превращения задания в тестовой форме в тестовое задание, то есть быть включенным в тест. Особенно заметно  эта вероятность повышается при  г > 0,4.

Если  взять значение r2 * 100%, то получим  значение так называемого коэффициента детерминации, выраженного в удобной  для интерпретации процентной мере связи задания с суммой баллов.

Для взятого  примера коэффициент детерминации у седьмого задания равен

0,6522 * 100% = 42,5 %,

что можно  интерпретировать так: 42,5% вариации суммы  тестовых баллов испытуемых по всем заданиям связано с вариацией баллов по одному только седьмому заданию, что  указывает на очень высокий потенциальный  вклад седьмого задания в общую  дисперсию теста.

Нулевая корреляция свидетельствует об отсутствии у задания системных свойств, присущих тесту. Такие задания, равно  как и задания с отрицательными значениями rxy устраняются из тестовых материалов, как не выдержавшие эмпирической проверки.

Иногда  приходится рассматривать особые случаи возможности включения заданий  в тест, хорошо коррелирующих с  другими заданиями, но слабо или  вообще не коррелирующих с суммой баллов (или внешним критерием). 

Список литературы

1.      Гублер Е.В., Генкин  А.А. Применение непараметрических  критериев

статистики в медико-биологических  исследованиях. - Л.: Медицина, 1973.

2.      Вентцель Е.С., Овчаров  Л.А. Теория вероятностей и  её инженерные

приложения. - М.: Наука, 1988.

3.      Применение вычислительной  техники и математической теории

эксперимента в научных исследованиях (учебное пособие).// Под ред. М-Б.А.

Бабаева. -  Баку, "Елм". - 1999. - 85 стр.

    

 


Информация о работе Теория корреляции