Вернутся на главную

Тема 9. КОРРЕЛЯЦИОННЫЙ Способ АНАЛИЗА СВЯЗЕЙ. МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ


Тема 9. КОРРЕЛЯЦИОННЫЙ Способ АНАЛИЗА СВЯЗЕЙ. МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ на нашем сайте

Статьи
Статьи для студентов
Статьи для учеников
Научные статьи
Образовательные статьи Статьи для учителей
Домашние задания
Домашние задания для школьников
Домашние задания с решениями Задания с решениями
Задания для студентов
Методички
Методические пособия
Методички для студентов
Методички для преподавателей
Новые учебные работы
Учебные работы
Доклады
Студенческие доклады
Научные доклады
Школьные доклады
Рефераты
Рефератывные работы
Школьные рефераты
Доклады учителей
Учебные документы
Разные образовательные материалы Разные научные материалы
Разные познавательные материалы
Шпаргалки
Шпаргалки для студентов
Шпаргалки для учеников
Другое

В парной корреляции исходят из постулата, что результативный признак зависит от одного факторного признака.

В действительности связь в экономических явлениях чаще является многофакторной. Уравнения, выражающие зависимость результативного признака от многих факторов, называются многофакторными (множественными) корреляционными уравнениями.

Линейное уравнение множественной регрессии в общем виде представляется формулой

,

где – значение результативного признака, соответствующее заданным факторным признакам .

, – параметры уравнения.

Параметр экономической интерпретации не имеет. Параметр называется коэффициентом условно-чистой регрессии.

Термин «коэффициент условно-чистой регрессии» означает, что каждая из величин измеряет среднее по совокупности отклонение результативного признака от его средней величины при отклонении данного фактора от своей средней величины на единицу его измерения и при условии, что все прочие факторы, входящие в уравнение регрессии, закреплены на средних значениях, не изменяются, не варьируют.

Таким образом, в отличие от коэффициента парной регрессии коэффициент условно-чистой регрессии измеряет влияние фактора, абстрагируясь от связи вариации этого фактора с вариацией остальных факторов. Если было бы возможным включить в уравнение регрессии все факторы, влияющие на вариацию результативного признака, то величины можно было бы считать мерами чистого влияния факторов. Но так как реально невозможно включить все факторы в уравнение, то коэффициенты не свободны от примеси влияния факторов, не входящих в уравнение.

Параметры уравнения , найдем методом наименьших квадратов (МНК). Для этого необходимо минимизировать сумму квадратов отклонений результативного признака от теоретического значения результативного признака , т.е. найти параметры , , при которых функция достигает минимума.

Запишем необходимые условия экстремума:

,

,

,

или

,

,

,

.

Раскроем скобки и получим стандартную форму нормальных уравнений. Параметры уравнения , найдем из решения системы этих нормальных уравнений:

Уравнение множественной регрессии в нелинейной форме не применяют в связи с тем, что их решение в математическом плане становится сверхсложной задачей.

При построении уравнения множественной регрессии принципиальное значение приобретает отбор факторов, которые будут участвовать в данной модели.

Выбранная функция должна отразить основные закономерности, но в то же время иметь по возможности простой вид.

Отбор факторов для модели может быть выполнен в следующей последовательности.

На первой стадии производится априорный анализ явления, и устанавливаются все возможные факторы.

На второй стадии осуществляется сравнительная оценка и отсев части факторов с помощью парных коэффициентов корреляции.

Если абсолютная величина парного коэффициента корреляции =0,8 и более, то факторы и считаются коллинеарными (дублирующими друг друга) и один из них отбрасывается.

На третьей стадии выполняется многошаговый процесс вычислений с последовательным отсевом наименее значимого фактора , у которого парный коэффициент корреляции оказался наименьшим.

Для каждой модели, включающей в себя число факторов, последовательно уменьшенное на один из них, рассчитывается совокупный коэффициент корреляции или корреляционное отношение, которые равны между собой. Модель с наибольшим совокупным коэффициентом корреляции (или корреляционным отношением) считается наиболее оптимальной.

Рассмотрим множественное уравнение регрессии с двумя признаками-факторами:

.

Параметры уравнения найдем из решения системы нормальных уравнений:

Решение данной системы имеет вид:

Совокупный коэффициент корреляции вычисляется по формуле:

,

где – это линейный коэффициент корреляции, который исчислен по указанным парам показателей и , и , и . Так, например,

,

где – среднее значение произведения признаков и ;

– средние значения признаков и ;

– средние квадратические отклонения признаков и ;

Корреляционное отношение вычисляется по формуле:

,

где – индивидуальные значения результативного признака,

– теоретические значения результативного признака, которые находятся по уравнению множественной регрессии,

– среднее значение результативного признака.

При этом совокупный коэффициент корреляции равен корреляционному отношению.

Для оценки степени соответствия модели фактическим данным служит коэффициент детерминации

.

Коэффициент детерминации показывает, какую часть фактической вариации переменной y составляет вариация регрессии.

Значимость модели множественной регрессии проверяется с помощью F-критерия Фишера. Проверяется нулевая гипотеза при конкурирующей гипотезе .

1. Наблюдаемое значение критерия находится по формуле:

,

где m – количество объясняющих переменных модели.

2. Критическую точку F-критерия Фишера определяем по соответствующей таблице

,

где - уровень значимости, обычно или (, где - доверительная вероятность);

m и n-m-1 – числа степеней свободы, а n – количество наблюдений;

3. Сравниваем наблюдаемое значение критерия и критическую точку:

Если , то принимаем нулевую гипотезу об отсутствии линейной регрессии между показателями и y.

Если , то отклоняем нулевую гипотезу о равенстве нулю коэффициента детерминации. Т.е. принимаем конкурирующую гипотезу о наличии линейной регрессии между показателями и y.

Значимость коэффициента регрессии () проверяется с помощью t-критерия Стьюдента. Проверяется нулевая гипотеза () (о незначимости коэффициента регрессии) при конкурирующей гипотезе ().

1. Наблюдаемое значение критерия находится по формуле:

(),

где () - среднеквадратическая (стандартная) ошибка параметра регрессии (), находится по формуле

(),

где - среднеквадратическая (стандартная) ошибка регрессии, рассчитывается по формуле:

2. Критическую точку t-критерия Стьюдента определяем по соответствующей таблице

,

где - уровень значимости, обычно или (, где - доверительная вероятность);

– число степеней свободы, а n – количество наблюдений;

3. Сравниваем наблюдаемое значение критерия и критическую точку:

Если , то принимаем нулевую гипотезу о незначимости коэффициента регрессии, т.е. коэффициент регрессии почти не отличается от нуля или равен нулю.

Если , то отклоняем нулевую гипотезу о незначимости коэффициента регрессии, т.е. коэффициент регрессии не равен нулю.

Значимость параметра a проверяется с помощью t-критерия Стьюдента. Проверяется нулевая гипотеза при конкурирующей гипотезе .

1. Наблюдаемое значение критерия находится по формуле:

,

где - среднеквадратическая (стандартная) ошибка параметра регрессии a.

;

2. Критическую точку t-критерия Стьюдента определяем по соответствующей таблице

;

3. Сравниваем наблюдаемое значение критерия и критическую точку:

Если , то принимаем нулевую гипотезу о незначимости параметра a, т.е. параметра a почти не отличается от нуля или равен нулю.

Если , то отклоняем нулевую гипотезу о незначимости параметра a, т.е. параметра a не равен нулю.

Доверительные интервалы параметров регрессии при уровне значимости определяются по формулам:

где , , - среднеквадратические ошибки параметров регрессии a, и , соответственно,

- табличное значение критерия Стьюдента при заданном уровне значимости и числе степеней свободы .

Точечный прогноз находится по построенной модели множественной линейной регрессии.

Пример.Имеются данные об объеме сбережений домохозяйства, располагаемого им дохода и процентной ставки за 11 лет (см. табл. 9.1).

Таблица 9.1

Год Располагаемый доход домохозяйства, тыс. руб. Процентная ставка, % Объем сбережений домохозяйства, тыс. руб.

Необходимо:

1) построить модель множественной линейной регрессии зависимости объема сбережений домохозяйства от располагаемого им дохода и процентной ставки;

2) оценить тесноту связи между указанными признаками с помощью совокупного коэффициента корреляции;

3) определить значимость построенной модели с помощью коэффициента детерминации;

4) при уровне значимости проверить значимость

а) модели множественной линейной регрессии,

б) параметров регрессии

и сделать соответствующие выводы;

5) построить 95%-ные доверительные интервалы для найденных параметров регрессии.

6) спрогнозировать средний объем сбережений в 1991 году, если предполагаемый доход составит 170 тыс. руб., а процентная ставка будет равна 5,5%.





Название статьи Тема 9. КОРРЕЛЯЦИОННЫЙ МЕТОД АНАЛИЗА СВЯЗЕЙ. МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ