Как найти y с крышечкой эконометрика
Перейти к содержимому

Как найти y с крышечкой эконометрика

  • автор:

Введение

Эконометрика — это наука, лежащая на стыке между статистикой и математикой, она разрабатывает экономические модели для цели параметрической идентификации, прогнозирования (анализа временных рядов).

Классификация эконометрических моделей и методов.

Эконометрические модели (ЭМ)

Эконометрические модели параметрической идентификации

Эконометрические модели для цели прогнозирования

Система эконометрических моделей

(установление параметров (есть ли тренд) (комплексная модели) оценка)

y — зависимая переменная (отклик), прибыль, например. x — независимая переменная (регрессор), какова численность персонала, например. На основании наблюдений оцениваются a и b (определение параметров моделей или регрессионные коэффициенты).

На основании наблюдений оценивается a и b (определение параметров моделей или регрессионные коэффициенты).

Параметрическая идентификация занимается оценкой эконометрических моделей, в которых имеется один или несколько x и один y. Для целей установления влияния одних параметров работы предприятия на другие.

Если x в первой степени и нет корней, ни степеней, нет 1/x, то модель линейная.

y=ax b — степенная функция;

y=ab x — показательная функция;

y=a1/x — парабола односторонняя.

Y -прибыль — линейная модель

Выбираем наиболее надежную модель. После построения по одним и тем же эксперт данным одной линейной и нескольких нелинейных моделей над каждой из полученных моделей производим две проверки.

1 — на надежность модели или статистическую значимость. Fкр — или критерий Фишера. Табличное F и расчетное F. Если Fp > Fтабл. — то модель статистически значима.

2 — Отобрав из моделей все значимые модели, среди них находим самую точную, у которой минимальная средняя ошибка аппроксимации.

Эконометрические модели для прогнозов исследуют поведение одного параметра работы предприятия во времени.

I. Основная часть Параметрическая идентификация парной линейной эконометрической модели

По семи областям региона известны значения двух признаков за 2007г.

Расходы на покупку продовольственных товаров в общих расходах,%, у

Валентин Юльевич Арьков
Введение в эконометрику. Учебное пособие

Эконометрика – это построение математических моделей экономических систем по фактическим данным с помощью статистических методов. Это значит, что требуется проводить анализ больших объемов реальных данных. На сегодняшний день такую деятельность часто называют «Наука о данных».

Основные идеи и методы эконометрики изучают в рамках предмета «Математическая статистика». Конечно, при построении моделей здесь нужно учитывать специфику именно экономических процессов.

С другой стороны, математическими моделями также занимается предмет «Математическая экономика». В рамках этой дисциплины рассматривают математические модели – в том числе и как иллюстрацию экономической теории. Иногда эконометрику рассматривают как раздел экономики или математической экономики.

Эконометрика во многом опирается на основной раздел статистики под названием РЕГРЕССИЯ. Это построение линии (и уравнения этой линии) В СРЕДНЕМ по точкам. В эконометрике рассматривается построение парной и множественной, линейной и нелинейной регрессии (без привязки ко времени), а также регрессионных моделей временных рядов. Кроме того, эконометрические модели могут иметь несколько входов и несколько выходов – это системы эконометрических уравнений.

В настоящее время многие пакеты прикладных программ позволяют проводить эконометрические исследования. Для практического знакомства с технологиями эконометрики мы будем использовать электронные таблицы MS Excel. Можно также обратиться к любым другим табличным редакторам, в том числе, к бесплатным.

1. Парная линейная регрессия

1.1. Оформление отчёта

Отчёт о работе оформляется в виде рабочей книги Excel. Саму работу мы тоже выполняем в этой же рабочей книги. Каждое отдельное задание оформляем на новом рабочем листе. Подробности оформления отчёта описаны в работе [1].

Отчёт начинаем, как обычно, с титульного листа. Это первый лист рабочей книги. На титульном листе нужно указать название министерства, ВУЗа, кафедры. Далее идёт тип и название документа. Конечно, нужно указать номер студенческой группы, а также фамилию и инициалы студента. В нижней части титульного листа располагают название города и год.

На втором листе размещают оглавление работы. В нашем случае это название разделов и ссылка на соответствующий лист рабочей книги.

На третьей странице отчёта укажите номер зачетки. Это будут настройки генератора случайных чисел для имитационного моделирования.

Задание. Создайте новый документ Excel и сохраните, выбрав уникальное информативное имя файла.

1.2. Общий план работы

В первой работе мы будем знакомиться с парной линейной регрессией. Напомним, что регрессия – это построение зависимости в среднем по большому количеству точек (исходных данных). Слово «парная» означает, что у нас всего «пара» переменных – «икс» и «игрек». Слово «линейная» указывает, что мы будем строить линейное уравнение, то есть уравнение прямой линии. В линейном уравнении «икс» участвует в первой степени

В качестве исходных данных мы будем использовать результаты имитационного моделирования. Это позволит работать с такими данными, которые заведомо содержат интересующие нас закономерности.

Мы сгенерируем два столбца, в которых будет находиться одна независимая переменная «икс» и одна зависимая переменная «игрек». В этих данных будет заложена линейная взаимосвязь на фоне случайных отклонений – случайный разброс точек вокруг прямой линии.

«Икс» называют независимой переменной – independent variable. Предполагается, что «икс» может меняться как угодно и что он ни от чего в нашей модели не зависит. Другими словами, «икс» – это вход модели.

Изменение «икса» объясняет поведение «игрека». Поэтому «икс» ещё называют «объясняющей» переменной.

«Игрек» выступает в роли зависимой переменной – dependent variable. Он зависит от «икса». Хотя бы частично.

Для моделирования мы используем генератор случайных чисел из надстройки «Анализ данных». Попутно заметим, что полученные случайные числа будут записаны как числовые значения. Они не будут меняться со временем. В других ситуациях нам как раз будет нужно, чтобы случайные числа менялись – тогда мы будем вызывать функцию RAND.

Далее мы рассмотрим методику построения линейной модели, которая описывает наши данные в среднем. Это означает, что на графике линия должна проходить в среднем – по местам сгущения точек.

Кроме уравнения такой линии, нам понадобится определить возможную неопределённость (погрешность) полученных коэффициентов.

Окончательное уравнение должно содержать как коэффициенты, так и их погрешность. Случайную ошибку обычно описывают с помощью «сигмы». Это стандартное отклонение, или среднеее квадратическое отклонение (СКО). Для каждого коэффициента указываем его сигму – под коэффициентом в скобках, см. рис.

Рис. Коэффициенты и их сигмы

Для оценки коэффициентов и их «сигм» в данной работе используем три способа:

– надстройку «Анализ данных»;

– функцию ЛИНЕЙН – LINEST;

Затем нам нужно будет провести интерпретацию полученного уравнения. Мы сформулируем смысл уравнения регрессии в виде высказывания, понятного обычному пользователю.

1.3. Надстройка

Чтобы включить надстройку «Анализ данных», вызовите File – Options.

В диалоговом окне Excel Options выбираем: Add-ins – Manage – Excel Add-ins – Go, см. рис.

Ставим галочку рядом пунктом AnalysisToolpak – Пакет анализа, см. рис.

Рис. Меню «Надстройки»

Рис. Включение надстройки «Анализ данных»

Если надстройка активирована, можно будет найти кнопку Data Analysis в разделе меню Data – Analysis, см. рис.

https://amdy.su/wp-admin/options-general.php?page=ad-inserter.php#tab-8

Рис. Надстройка в разделе «Анализ»

1.4. Исходные данные

Сгенерируем исходные данные. Наши переменные будут расположены по столбцам.

В данной работе мы сформируем по 100 значений в каждом столбце. Это не слишком много и не слишком мало. С одной стороны, графики будут достаточно наглядными. С другой стороны, рисунки не будут слишком основательно заполнены точками.

Первый столбец – переменная u. Сгенерируйте столбец случайных чисел с равномерным распределением от 170 до 200. Начальное состояние генератора – четыре последние цифры номера зачетки, см. рис.

Рис. Настройки генератора

Далее нам нужно сгенерировать два столбца случайных чисел e1 и e2 со стандартным нормальным распределением. У такого распределения среднее значение MEAN равно нулю, а стандартное отклонение STANDARD DEVIATION равно единице. Сразу задаём генерирование двух столбцов – число переменных равно двум. Начальное состояние генератора – четыре последних цифры номера зачетки плюс 5.

Разные настройки генератора позволят создать независимые случайные числа в разных колонках.

В следующем столбце y введём формулу, как показано на рисунке.

Рис. Формулы по столбцам

В следующем столбце сформируем x. Добавим к значениям u из первого столбца случайный разброс e1.

Наконец, округлим два последних столбца x и y до целых значений с помощью функции ROUND. Эти два столбца X и Y будут имитировать результаты измерений. Когда мы что-то измеряем, всегда появляются случайные погрешности измерений, пускай даже небольшие и незаметные. К тому же, такие параметры тела, как рост и вес, немного меняются даже в течение суток.

Наши «иксы» – это значения роста человека в сантиметрах. «Игреки» – это значения веса в килограммах. Мы закладываем в нашу выборку зависимость веса от роста. Затем добавляем в данные случайный разброс.

Рис. Линейная модель

Рис. Зашумлённые наблюдения

Рис. Постановка задачи

Рис. Имитационное моделирование

На схеме показано, как добавляются случайные погрешности измерений к значениям иксов и игреков. Таким образом, при анализе реальных данных наши числа всегда содержат случайный шум. Это зашумлённые данные.

Результаты эконометрического анализа – это ОЦЕНКИ коэффициентов уравнения. Мы говорим «оценки», чтобы подчеркнуть, что полученные значения коэффициентов отличаются от истинных, правильных, точных значений. К тому же, они изменяются, если взять другой набор таких же данных – другую выборку.

Кроме коэффициентов уравнения, нас будут интересовать ПРОНОЗ значений завипсимой переменной – игрека. Задавая значения икса, мы пронозируем возможное значение игрека. Оно тоже будет меняться; это будет случайная погрешность. Так что пронозы тоже являются оценками.

Оценки коэффициентов и пронозы зависимой переменной обозначены символом, который называют «крышка», или «крышечка». Обозначение читается так: «икс с крышкой», «игрек с крышкой», см. рис.

Рис. Условные обозначения

Мы подробно обсуждаем такие «очевидные» вещи, о которых почему-то не пишут в учебниках. Это вроде как «все знают». Хотя выясняется, что это знают только преподаватели, а вот студенты должны об этом узнать каким-то волшебным образом, ведь «это же настолько элементарно».

Один преподаватель так и сказал: «Ну я же это вам уже рассказывал». Студенты возразили: «Нет, вы нам это не рассказывали». Преподаватель просто возмутился: «Ну не вам, значит другим. Я это уже сколько раз рассказывал. Каждый год кому-нибудь обязательно рассказываю. Одним объясняю, а другие не понимают!»

Вот поэтому приходится составлять учебное пособие – для изучения учебника. Учебное пособие (по определению) должно помогать в учёбе. Слово «пособить» означает «помочь». Но пособие не может заменить учебник. Так что студентам не помешает открыть пару учебников по нашему предмету, а потом вернуться к нашему пособию и продолжить изучение материала.

Символ «крышка» – это пример того, что называется УСЛОВНЫЕ ОБОЗНАЧЕНИЯ. Это означает, что авторы о чём-то «условились», то есть «договорились». Это соглашение, доворённость о том, что и как будет в тексте и в формулах обозначено. Следите за условными обозначениями в формулах.

Чтобы всё окончательно запутать, в книгах по эконометрике и в программных продуктах используют разные условные обозначения. А ещё эти обозначения не всегда подробно объясняют и расшифровывают. Так что следите за смыслом.

Реферат: Классификация эконометрических моделей и методов

Эконометрика — этонаука, лежащая на стыке между статистикой и математикой, она разрабатываетэкономические модели для цели параметрической идентификации, прогнозирования (анализа временныхрядов).

Классификацияэконометрических моделей и методов.

Эконометрические модели (ЭМ)

Эконометрические модели параметрической идентификации Эконометрические модели для цели прогнозирования Система эконометрических моделей

(установление параметров (естьли тренд) (комплексная модели) оценка)

y — зависимая переменная (отклик), прибыль, например. x — независимая переменная (регрессор),какова численность персонала, например. На основании наблюдений оцениваются a и b (определение параметров моделейили регрессионные коэффициенты).

№ п/п y x 1 11 1 2 13 2 3 14 3 4 12 4 5 17 5 6 16,7 6 7 17,8 7

На основании наблюденийоценивается a и b (определениепараметров моделей или регрессионные коэффициенты).

Параметрическая идентификациязанимается оценкой эконометрических моделей, в которых имеется один илинесколько x и один y. Для целейустановления влияния одних параметров работы предприятия на другие.

Если x впервой степени и нет корней, ни степеней, нет 1/x, томодель линейная.

y=axb — степенная функция;

y=a1/x — парабола односторонняя.

/> Y-прибыль — линейная модель

Выбираем наиболее надежнуюмодель. После построения по одним и тем же эксперт данным одной линейной инескольких нелинейных моделей над каждой из полученных моделей производим двепроверки.

1 — на надежность модели илистатистическую значимость. Fкр — иликритерий Фишера. Табличное F и расчетное F. Если Fp<sub/>> Fтабл. — томодель статистически значима.

2 — Отобрав из моделей всезначимые модели, среди них находим самую точную, у которой минимальная средняяошибка аппроксимации.

Эконометрические модели дляпрогнозов исследуют поведение одного параметра работы предприятия во времени.


I. Основная частьПараметрическая идентификация парной линейнойэконометрической модели

По семи областям регионаизвестны значения двух признаков за 2007г.

Расходы на покупку продовольственных товаров в общих расходах,%, у

среднедневная заработная плата одного работающего, руб., х

1 68,8 45,1 2 61,2 59 3 59,9 57,2 4 56,7 61,8 5 55 58,8 6 54,3 47,2 7 49,3 55,2 №п/п Y x ух

(y-ŷ) /y 1 68,80 45,10 3102,88 2034,01 61,33 11,8286862 55,87562 0,108648 2 61, 20 59,00 3610,80 3481,00 56,46 2,0326612 22,46760 0,077451 3 59,90 57, 20 3426,28 3271,84 57,09 0,6331612 7,89610 0,046912 4 56,70 61,80 3504,06 3819,24 55,48 5,7874612 1,48840 0,021517 5 55,00 58,80 3234,00 3457,44 56,53 1,8379612 2,34090 0,027820 6 54,30 47, 20 2562,96 2227,84 60,59 7,3131612 39,56410 0,115840 7 49,30 55, 20 2721,36 3047,04 57,79 0,0091612 72,08010 0,172210 Итого 405, 20 384,30 22162,34 21338,41 405,27 29,4422535 201,7128 0,570398 Средн. з 57,89 54,90 3166,05 3048,34 57,90 4, 2060362 28,81612 0,081485

Исходные данные x и y могут быть двух типов:

а) рассматриваем однопредприятие, то наблюдения берутся через равностоящие промежутки времени (1 вквартал);

б) если каждое наблюдение — этоотдельное предприятие, то данные берутся на одну и ту же дату, например, на 01.01.07

у — расходы на продовольственныетовары в процентах; траты, например, на еду.

х — среднедневная заработнаяплата, в руб.

у = а + bх — линейная парная регрессионная ЭМ.

=-0.35 a=y — b x =76,88

b = (3166,049-57,88571*54,9)/ (3048,344-54,9) = — 0,35

а = 57,88571 — ( — 0,35) *54,9 =77,10071

ŷ (игрек с крышечкой) =76,88-0,35х -это модельное значение y, котороеполучается путем подстановки в y = a+ b x,конкретное значение a и bкоэффициенты, а также x из конкретной строчки.

n — количество наблюдений;

m — количество регрессоров (x1)

Допустим, 0,7. Fкритне может быть меньше единицы, поэтому, если мы получим значение < 1, то

— обратное значение. =1,4

1. Таблица значений F-критерия Фишера для уровня значимости α = 0.05

1 2 3 4 5 6 8 12 24 ∞ 1 161,45 199,50 215,72 224,57 230,17 233,97 238,89 243,91 249,04 254,32 2 18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45 19,50 3 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53 4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77 5,63 5 6,61 5,79 5,41 5, 19 5,05 4,95 4,82 4,68 4,53 4,36 6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12 2,93 9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,90 2,71 10 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,74 2,54 11 4,84 3,98 3,59 3,36 3, 20

2,95 2,79 2,61 2,40

Когда m=1,выбираем 1 столбец.

k2=n-m=7-1=6 — т.е.6-я строка — беремтабличное значение Фишера

Fтабл=5.99,у ср. = итого: 7

Влияние х на у — умеренное иотрицательное

ŷ модельноезначение.

F расч. = 28,648: 1 = 0,92 200,50: 5

А = 1/7 * 398,15 * 100% = 8,1%< 10% —

Модель достаточно точная.

F расч. = 1/0,92 =1,6

F расч. = 1,6 < F табл. = 5,99

Должно быть Fрасч.> Fтабл

Нарушается данная модель,поэтому данное уравнение статистически не значимо.

Так как расчетное значениеменьше табличного — незначимая модель.

1 Σ (y — ŷ) *100% N y

A=1/7*0,563494* 100% = 8,04991% 8,0%

Считаем, что модель точная, еслисредняя ошибка аппроксимации менее 10%.

Параметрическая идентификация парной нелинейной регрессии

Модель у = а * хb — степенная функция

Чтобы применить известнуюформулу, необходимо логарифмировать нелинейную модель.

log у = log a + b log x

Y=C+b*X -линейная модель.

С = 1,7605 — ( — 0,298) * 1,7370= 2,278

Возврат к исходной модели

У I (y-ŷ) /yI 1 68,80 45,10 1,8376 1,6542 3,039758 2,736378 60,9614643 0,113932 2 61, 20 59,00 1,7868 1,7709 3,164244 3,136087 56,2711901 0,080536 3 59,90 57, 20 1,7774 1,7574 3,123603 3,088455 56,7931534 0,051867 4 56,70 61,80 1,7536 1,7910 3,140698 3, 207681 55,4990353 0,021181 5 55,00 58,80 1,7404 1,7694 3,079464 3,130776 56,3281590 0,024148 6 54,30 47, 20 1,7348 1,6739 2,903882 2,801941 60,1402577 0,107555 7 49,30 55, 20 1,6928 1,7419 2,948688 3,034216 57,3987130 0,164274 Итого 405, 20 384,30 12,3234 12,1587 21,40034 21,13553 403,391973 0,563493 Средняя 57,88571 54,90 1,760486 1,736957 3,057191 3,019362 57,62742 0,080499

Входим в EXCELчерез «Пуск»-программы. Заносим данные в таблицу. В «Сервис»- «Анализ данных» — «Регрессия» — ОК

Если в меню «Сервис» отсутствуетстрока «Анализ данных», то ее необходимо установить через «Сервис»- «Настройки» — «Пакет анализа данных»

Прогнозирование спроса на продукцию предприятия. Использованиев MS Excelфункции «Тенденция»

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *