reforef.ru 1
МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ



Методическое пособие представляет собой сборник практических работ по решению задач множественной регрессии по дисциплине «Эконометрика». Методическое пособие может быть использовано как для практических занятий, так и для самостоятельных занятий студентов.

Оглавление
Практическое занятие 1……………………………………4

Практическое занятие 2……………………………………6

Практическое занятие 3……………………………………10

Практическое занятие 4……………………………………14

Практическое занятие 5……………………………………20

Практическое занятие 1

Бюджетное обследование пяти случайно выбранных семей дало следу­ющие результаты (в тыс. руб.) (таблица 1):

Таблица 1

Семья

Накопления, S

Доход, Y

Имущество, W

1

3.0

40

60

2

6.0

55

36

3

5.0

45

36

4

3.5

30


15

5

1.5

30

90



а) Оцените регрессию S на Y и W.

б) Спрогнозируйте накопления семьи, имеющей доход 40 тыс. руб. и имущество стоимостью 25 тыс. руб.

в) Предположим, что доход семьи возрос на 10 тыс. руб., в то время как стоимость имущества не изменилась. Оцените, как возрастут ее накопления.

г) Оцените, как возрастут накопления семьи, если ее доход вырос на 5 тыс. руб., а стоимость имущества увеличилась на 15 тыс. руб.

д) Найдите сумму квадратов остатков и постройте оценку дисперсии регрессии.
Решение

Запишем регрессию


в матричной форме , где



Имеем


В дальнейших вычислениях нам понадобятся следующие матрицы:

,




а) Согласно формуле (3.4)

б)



в)



г)



д) Имеем:



Практическое занятие 2.
Рассмотрим регрессию



из предыдущей задачи 3.5.

а) Постройте 95%-доверительное множество для

1) ?2 и ?3;

2) ?2;

3) ?3

4) ?1 и ?2

б) Проверьте с 5%-уровнем значимости следующие гипотезы:

1) ?2 = 0 и ?3 = 0;

2) ?2 = 0 (стоимость имущества несущественна);

3) ?3 = 0 (величина дохода несущественна);

4) ?2 = 1 (таким мог быть ответ вашего коллеги на вопрос о зависимости накопления от дохода);

5) ?2 = 1.57 (такое значение коэффициента f2 могло быть с вы­сокой степенью надежности установлено для другой страны, и вас интересует вопрос, верно ли это для вашей страны);

в) Пусть некоторая семья имеет доход Y = 30 тыс. руб. и имущество стоимостью W = 52.5 тыс. руб.

1) Чему равна прогнозная величина ее накоплений?

2) В каком смысле эта семья может рассматриваться как сред­няя между семьями 4 и 5 (задача 3.5)? Почему прогноз­ная величина ее накоплений не есть среднее между 3.5 и 1.5 тыс.руб.?

3) Постройте 95%-доверительный интервал для прогнозной ве­личины накоплений этой семьи.

Решение

а) Здесь и в дальнейшем будем применять результаты, полученные при решении предыдущей задачи.

1) Воспользуемся F-статистикой при



и вычислениями (3.41). Имеем


Таким образом, имеем:

Из таблиц находим: , т.е. 95%-доверительная область для описывается неравенством
1600,7(0,123 – ?2)2 + 2347,7(0,123 – ?2)(0,029 + ?3) +

+ 11678,9(0,029 + ?3)2 < 19,0

или

84,25(?2 – 0,123)2 – 123,57(?2 – 0,123)(?3 + 0,029) +

+ 614,58(?3 + 0,029)2 < 1.
2), 3) Получаем, что (для t = 2, 3) интервал

является 95%-доверительным интервалом для коэффициента ?i, где tc = 4.303 –двусторонняя 95%-квантиль распределения Стьюдента с nk = 5 -3 –2 степенями свободы. Имеем



Таким образом, получаем 95%-доверительные интервалы

для : (0.044; 0.202); для : (-0.059;-0.00016).


4) Аналогично 1), но в этом случае



При этом вычисления (3.41) переписываются в виде



Таким образом, 95%- доверительное множество для имеет вид



или



б) Воспользуемся результатами пункта а).

1) Легко заметить, что точка не удовлетворяет соотно­шению (*):



Следовательно, гипотезу Н0: отвергаем.

2) Отвергаем, так как (-0.059; -0.00016).

3) Отвергаем, так как (0.044; 0.202).

4) Отвергаем, так как (0.044; 0.202).

5) Отвергаем, так как (0.044; 0.202).


Практическое занятие 3..
После финансового кризиса спрос на чебуреки упал, и менеджер был вынужден тратить часть средств на рекламу. Для изу­чения зависимости объема продаж от цены и расходов на рекламу ме­неджер использует следующую модель:



В табл. 3.1 приведены данные наблюдений за 20 недель (t –номер неде­ли, qt - количество проданных чебуреков, pt - цена одного чебурека (руб.), at –затраты на рекламу (100 руб.)).
Таблица 2


t

qt

pt

at

1

2

3

4

5

6

265

615

399

845

571

726

6.62

5.15

6.95

5.09

6.8

6.11

5.74

1.74

4.69

2.21

3.09

2.78


Используя данные табл. 3.1, ответьте на следующие вопросы:

а) Отклик количества проданных чебуреков на изменение цены из­меряется коэффициентом . Аналогично, .

Какие знаки вы ожидаете получить?


б) Найдите оценки коэффициентов регрессии и их стандартные ошибки. Соответствуют ли знаки оценок вашим ожиданиям?

в) Пусть себестоимость производства одного чебурека равна 2 руб. Тогда чистый доход за неделю задается формулой

г) Найдите оптимальную цену при расходах на рекламу, равных 280 руб.

д) Найдите оптимальный уровень расходов на рекламу при цене че­бурека, равной 6 руб.

е) Найдите 95%-доверительные интервалы для . Проверьте значимость влияния цены, а также расходов на рекламу на коли­чество проданных чебуреков.
Решение

а) Естественно предполагать, что рост цены на чебуреки приводит к уменьшению спроса на них, т. е. ожидаемая оценка коэффициента отрицательная. Увеличение расходов на рекламу должно приводить к росту спроса на них, при этом разумно считать, что при большом уровне расходов каждый последующий рубль, вложенный в рекламу, должен давать меньшую отдачу, чем тот же рубль при более низком уровне расходов на рекламу. Иными словами, разумно предполагать, что для расходов на рекламу действует «эффект насыщения». Таким образом, ожидаемый знак оценки , оценки .

б). Определим параметр а2 :
а2 =
Запишем исходные данные в виде матриц.

Оценочные коэффициенты

,

вычисленные в среде MathCAD параметры, имеют следующие значения:





В конечном итоге

С помощью непосредственных вычислений получаем:


Приравнивая эту производную нулю и учитывая, что , получаем следующее значение цены, при которой максимизируется средний доход при фиксированных расходах на рекламу a:


Подставляя вместо коэффициентов ? их оценки и полагая a = 280 руб., получаем оценку оптимальной цены:



д) Аналогично предыдущему получаем


Приравнивая эту производную нулю и учитывая, что< 0, полу­чаем следующее значение расходов на рекламу, при которых максими­зируется средний доход при фиксированной цене чебурека р = 6 руб.:

Подставляя вместо коэффициентов их оценки и полагая р = 6 руб., получаем оценку оптимальных расходов на рекламу:


е) Из результатов оценивания уравнения для количества продан­ных чебуреков (см. п. б)) следует, что все коэффициенты значимы на 5%-уровне, поскольку для каждой оценки соответствующее Р-значение (Probability) меньше 0.05.

Число степеней свободы модели есть , таким образом, доверительные интервалы для коэффициентов суть , i = 1,2,3,4, где, как обычно, – оценки стандарт­ных ошибок, a . Используя результаты п.б), получаем:



Практическое занятие 4.
В кейнсианской теории спрос на деньги зависит от доходов и процент­ных ставок. Рассмотрим следующую модель:

(*)

где - агрегат денежной массы Ml (млрд. долл.), - валовой на­циональный продукт (ВНП) (млрд. долл.), - процентные ставки по 6-месячным государственным облигациям США. В табл. 3.2 представлены данные по этим переменным за пе­риод 1961-1983 гг. (через каждые 5 лет) по экономике США.

Таблица 3


Год

yt

mt

it

1961

1967

1973

1977

1983

524,6

799,6

1326,4

1918,3

3309,5

146,5

185,1

265,8

335,5

521,1

2,605

4,630

7,178

5,510

8,750


а) Найдите оценки коэффициентов регрессии (*). Интерпретируйте знаки коэффициентов.

б) Рассчитайте прогноз спроса на деньги при значениях:

(1) y = 100, i = 10 (2) y =2500, i = 5

в) Рассчитайте эластичность спроса на деньги т по доходам у т по процентным ставкам в двух точках (1) и (2) из б). Сравните результаты.

г) Рассмотрим модель

(**)

Повторите б) и в) и сравните результаты, полученные по разным моделям. Сравните модели (*) и (**). Какая из них вам представ­ляется более предпочтительной?
Решение
а) Запишем данные задачи в виде матриц.



Оценка параметров модели (*), вычисленные в среде MathCAD, дают следующие результаты





Коэффициенты соответственно равны


Все коэффициенты значимы на 5%-уровне. Знаки оценок согласу­ются с экономической теорией и здравым смыслом. Неравенство ?2 > 0 означает, что увеличение ВНП при фиксированных процентных ставках приводит в среднем к возрастанию денежной массы Ml. В то же время неравенство ?3 > 0 означает, что при увеличении процентных ставок по государственным ценным бумагам спрос на них возрастает, и это приводит к «связыванию» наличности и уменьшению денежной массы Ml. Свободный член показывает денежную массу Ml при i = y = 0. Однако такие значения ВНП и процентных ставок лежат вдалеке от наших данных. Поэтому величина свободного члена не имеет хорошей интерпретации и не так важна. Эластичность денежной массы по ВНП положительна и выше в точке (2); эластичность денежной массы по процентным ставкам отрицательна и выше по абсолютной величине в точке (1).

б) В соответствии с моделью (*) . Используя результаты п. а), получаем:

в) По определению


Поэтому

г) В соответствии с моделью (**) .


Для нахождения соответствующих параметров введем новые переменные и произведем вычисления в среде MathCAD:




В итоге получим:

Из (**) следует, что эластичности спроса на деньги по у и i постоянны и равны соответствующим коэффициентам


Таким образом, сравнивая модели (*) и (**) с точки зрения качества соответствующих регрессий, видим, что во второй значения t-статистик выше, чем в пер­вой, однако существенной разницы в значимости коэффициентов нет: в обеих регрессиях все коэффициенты статистически значимы на 5%-уровне. Коэффициенты детерминации в обеих моделях близки к 1, од­нако по этому показателю их сравнивать нельзя, так как у них разные зависимые переменные. Кроме того, для регрессий одних макроэконо­мических временных рядов на другие вообще характерны высокие зна­чения коэффициентов R2 из-за наличия общего временного тренда. С точки зрения экономической теории модель (**) выглядит более пред­почтительной, поскольку в широком диапазоне значений агрегат денеж­ной массы Ml проявляет постоянную эластичность по ВНП и процент­ной ставке, что говорит в пользу логарифмической модели (**).
Практическое занятие 5.
В табл. 3.3 представлены реальный доход на душу населения у (тыс. долл.), процент рабочей силы, занятой в сельском хозяйстве, х1 и средний уровень образования населения в возрасте после 25 лет х2 (число лет, проведенных в учебных заведениях) для 15 развитых стран в 1983 г.

Страна


y

x1

x2

1

2

3

4

5

7

9

14

10

12

8

7

4

6

8

9

11

16

12

13


а) Проведите множественную регрессию у на константу, х1 и х2 и проинтерпретируйте полученные результаты.

б) Определите

в)Постройте 95%-доверительные интервалы для коэффициентов и вычислите коэффициент детерминации R2 и скорректи­рованный коэффициент детерминации

г) Проверьте на 5%-уровне значимость коэффициентов
Решение
а) Оценивание множественной регрессии переменной у на константу и переменные х1, х2, вычисленные в среде MathCAD, дает сле­дующий результат.



В итоге получаем


б) С помощью непосредственных вычислений получаем:



Отсюда



(ср. с результатами п. а)).

в) В регрессионных моделях константа, как правило, играет вспо­могательную роль. Ее вводят в регрессии для гибкости модели, вели­чина ее оценки обычно не имеет реального экономического смысла. На­пример, если рассматривается логарифмическая модель, то величина константы зависит от основания логарифма, в то время как оценки ко­эффициентов при других независимых переменных не изменяются при изменении основания логарифмов.

г) Имеем



где . Таким образом,





Коэффициент детерминации равен:



Скорректированный коэффициент детерминации равен:



д) На 5% уровне проверим гипотезы



Обе гипотезы не отвергаются, так как ?1 = 0 и ?2 = 0 входят в интервалы для ?1 и ?2 соответственно.