Эконометрика:
9.
Автокорреляция уровней и взаимосвязь временных рядов
9.1.
Лаговые переменные и автокорреляция уровней

Эконометрические модели, характеризующие протекание процесса во времени или состояние одного объекта в последовательные моменты времени (или периоды времени), представляют модели временных рядов. Временным рядом называется последовательность значений признака, принимаемых в течение нескольких последовательных моментов времени или периодов. Эти значения называются уровнями ряда. Между уровнями временного ряда, или ряда динамики, может иметься зависимость. В этом случае значения каждого последующего уровня ряда зависят от предыдущих. Подобную корреляционную зависимость между последовательными уровнями ряда динамики называют автокорреляцией уровней ряда.

Количественное измерение корреляции осуществляется посредством использования линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени:

. (9.1)

Если сдвиг во времени составляет всего один шаг, то соответствующий коэффициент корреляции называется коэффициентом автокорреляции уровней ряда первого порядка. При этом лаг равен 1. Измеряется же зависимость между соседними уровнями ряда. В общем случае число шагов (или циклов), на которые осуществляется сдвиг, характеризующий влияние запаздывания, также называется лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается.

Динамика уровней ряда может иметь основную тенденцию (тренд). Это весьма характерно для экономических показателей. Тренд является результатом совместного длительного действия множества, как правило, разнонаправленных факторов на динамику исследуемого показателя. Довольно часто динамика уровней ряда подвержена циклическим колебаниям, которые зачастую носят сезонный характер. Иногда не удается выявить тренд и циклическую компоненту. Правда нередко в этих случаях каждый следующий уровень ряда образуется как сумма среднего уровня ряда и некоторой случайной компоненты.

В очень многих случаях уровень временного ряда представляется в виде суммы тренда, циклической и случайной компонент или в виде произведения этих компонент. В первом случае это аддитивная модель временного ряда, во втором — мультипликативная модель. Исследование временного ряда заключается в выявлении и придании количественного выражения каждой из этих компонент, после чего удается использовать соответствующие выражения для прогнозирования будущих значений ряда. Можно также решать задачу построения модели взаимосвязи двух или нескольких временных рядов.

Скоро появится ребенок? Выход есть! Получи диплом в Московском Университете им. С.Ю. Витте дистанционно
9.2.
Автокорреляционная функция

Для выявления трендовой, циклической компонент можно использовать коэффициент автокорреляции уровней ряда и автокорреляционную функцию. Автокорреляционная функция — это последовательность коэффициентов автокорреляции уровней первого, второго и последующих порядков. Соответственно график зависимости значений автокорреляционной функции от величины лага (порядка коэффициента автокорреляции) — коррелограмма. Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная.

Прежде чем пояснить это, отметим: коэффициент автокорреляции характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Если ряд имеет сильную нелинейную тенденцию, коэффициент автокорреляции может приближаться к нулю. Знак его не может служить указанием на наличие возрастающей или убывающей тенденции в уровнях ряда.

Теперь об анализе структуры временного ряда с помощью автокорреляционной функции и коррелограммы. Довольно ясно, что, если наиболее высоким оказался коэффициент автокорреляции первого порядка, то исследуемый ряд содержит основную тенденцию, или тренд, и, скорее всего, только ее. Если ситуация иная, когда наиболее высоким оказался коэффициент корреляции некоторого отличного от единицы порядка, то ряд содержит циклические компоненты (циклические колебания) с периодом моментов времени. Наконец, если ни один из коэффициентов корреляции не является значимым, то достаточно правдоподобны следующие две гипотезы. Либо ряд не содержит ни тренда, ни циклических компонентов, так что его структура носит флуктуационный (резко случайный) характер. Либо имеется сильная нелинейная тенденция, обнаружение которой требует дополнительных специальных исследований.

Автокорреляция связана с нарушением третьего условия Гаусса — Маркова, что значение случайного члена (случайного компонента, или остатка) в любом наблюдении определяется независимо от его значений во всех других наблюдениях. Для экономических моделей характерна постоянная направленность воздействия не включенных в уравнение регрессии переменных, являющихся наиболее частой причиной положительной автокорреляции. Случайный член в регрессионной зависимости подвергается воздействию переменных, влияющих на зависимую переменную, которые не включены в уравнение регрессии. Если значение случайного компонента в любом наблюдении должно быть независимым от его значения в предыдущем наблюдении, то и значение любой переменной, «скрытой» в случайном компоненте, должно быть некоррелированным с ее значением в предыдущем наблюдении.

Попытки вычисления коэффициентов корреляции различных порядков и тем самым формирования автокорреляционной функции являются, так сказать, непосредственным выявлением корреляционной зависимости, которое иногда приводит к вполне удовлетворительным результатам. Имеются специальные процедуры оценивания неизвестного параметра σ в выражении линейной зависимости, представляющем рекуррентное соотношение, связывающее значения случайных компонентов в текущем и предыдущем наблюдениях (коэффициент авторегрессии).

Тем не менее, необходимо иметь также и особые тесты на наличие или отсутствие корреляции по времени. В большинстве этих тестов используется такая идея: если имеется корреляция у случайных компонентов, то она присутствует также и в остатках, получаемых после применения к модели (уравнениям) обычного МНК. Не станем здесь вдаваться в подробности реализации этой идеи. Они не очень сложны, но связаны с громоздкими алгебраическими преобразованиями. Важнее иметь в виду следующее. Как правило, все или почти все они связаны с проверкой двух статистических гипотез. Нулевая гипотеза — отсутствие корреляции σ = 0. Альтернативная гипотеза либо просто состоит в том, что несправедлива гипотеза нулевая, т.е. σ ≠ 0, либо так называемая односторонняя, более точная σ > 0. Несмотря на вид второй (альтернативной) гипотезы, соответствующее распределение (используемое в критерии) зависит не только от числа наблюдений и количества регрессоров (объясняющих переменных), но и от всей матрицы коэффициентов при неизвестных в уравнениях системы.

Понятно, что невозможно составить таблицу критических значений для всех матриц, так что приходится использовать обходные способы применения таких тестов. В тесте Дарбина — Уотсона используются для этого верхняя и нижняя (две) границы, которые уже зависят только от количества наблюдений, регрессоров и уровня значимости, таким образом, их уже можно «затабулировать» (составить для них таблицы). Правда, применение их (границ) далеко не всегда просто! Все ясно, когда соответствующая статистика (эмпирическое, или рассчитанное распределение) Дарбина — Уотсона меньше нижней границы, то отвергается нулевая гипотеза и принимается альтернативная гипотеза. Если же тест больше верхней границы, то принимается первая (нулевая) гипотеза. Но если тест попадает между этими границами, ситуация становится неопределенной: непонятно как выбрать одну из двух гипотез. К сожалению, ширина этой неопределенной зоны вполне может быть довольно пространной. Естественно, что поэтому пытались и небезуспешно построить тесты, сужающие такую зону неопределенности.

Вернемся теперь к проблеме выявления основной зависимости. Для этого существуют различные методы. Это могут быть качественные методы и качественный анализ исследуемых временных рядов, в т.ч. построение и визуальный анализ графика зависимости уровней ряда от времени. Это могут быть методы сопоставления двух параллельных рядов и методы укрупнения интервалов. Поскольку они носят достаточно качественный характер, суть их понятна из названия и к тому же они приводятся в курсах статистики, не будем останавливаться на них подробно.

9.3.
Метод скользящего окна

Несколько более гибок и опирается на количественные (аналитические) инструменты анализа метод скользящей средней, или скользящего окна. В нем последовательно рассчитывается вместо одного полного среднего для всех наблюдений ряд так называемых частных средних для трех, пяти наблюдений или более, номера которых постоянно сдвигаются вправо (в сторону увеличения). Таким образом, получается последовательность частных средних, которая отсеивает несущественные флуктуации и способна легче обнаружить тренд, чем данные исходного ряда.

Очевидно также, что при описанном выше использовании коэффициентов автокорреляции уровней ряда для выявления тренда используется сравнение коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Ясно, что при наличии линейного тренда соседние уровни ряда тесно коррелируют. Для нелинейного тренда дело обстоит сложнее, но нередко может быть упрощено сведением к линейному случаю соответствующим преобразованием переменных.

9.4.
Метод аналитического выравнивания

Основным способом моделирования и изучения таким образом основной тенденции временного ряда (ряда динамики) является аналитическое выравнивание временного ряда. При этом строится аналитическая функция, характеризующая зависимость уровней ряда динамики от времени. Эта функция называется также трендом. Сам такой способ выявления основной тенденции называется аналитическим выравниванием. Ранее были описаны различные способы определения типа тренда. В целом построение модели тренда включает следующие основные этапы:

В качестве основной тенденции выдвигается гипотеза о некоторой аналитической функции, выражающей данную зависимость. Но ведь требуется еще определить коэффициенты (параметры) данной зависимости. Для определения (оценивания) параметров тренда используется обычный МНК. Критерием отбора наилучшей формы тренда является наибольшее значение скорректированного коэффициента детерминации.

Для устранения тренда применяют метод отклонений от тренда, в ходе которого вычисляются значения тренда для каждого ряда динамики модели и отклонения от тренда. Для последующего анализа уже применяют не исходные данные, а отклонения от тренда.

Другой способ устранения тренда — это метод последовательных разностей. Если тренд линейный, то исходные данные заменяются первыми разностями, которые в этом случае равны просто коэффициенту регрессии b, сложенному с разностью соответствующих случайных компонент. Если тренд параболический, то исходные данные заменяются вторыми разностями. В случае экспоненциального и степенного тренда метод последовательных разностей применяется к логарифмам исходных данных. Не следует упускать из виду и уже обсуждавшуюся выше автокорреляцию в остатках. Для выявления автокорреляции остатков используется критерий Дарбина — Уотсона.


9.5.
Модели с распределенным лагом

Рассматриваются также и эконометрические модели, содержащие не только текущие, но и лаговые (учитывающие запаздывание) значения факторных переменных. Эти модели так и называются моделями с распределенным лагом. Если максимальная величина лага конечна, то для такой модели зависимость имеет довольно простой вид. Это просто сумма свободного члена и произведений коэффициентов (регрессии) на факторные переменные (в текущий момент, в предшествующий момент, в предпредшествующий момент и т.д.). Естественно, имеется еще и случайный член. Последовательные суммы соответствующих коэффициентов при значениях факторов в различные моменты времени называются промежуточными мультипликаторами. Для максимального лага воздействие фактора на результативное переменное описывается полной суммой соответствующих коэффициентов, которая и называется долгосрочным мультипликатором. После деления этих коэффициентов на долгосрочный мультипликатор получаются относительные коэффициенты модели с распределенным лагом. По формуле средней арифметической взвешенной получают величину среднего лага модели множественной регрессии. Эта величина представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент t. Имеется также медианный лаг — период, в течение которого с момента времени t будет реализована 1/2 общего воздействия фактора на результат.

Во многих практически интересных ситуациях выявление тренда (при всей важности этого) вовсе не является завершением исследования структуры ряда и требуется по крайней мере обнаружение и изучение еще циклической (сезонной) составляющей. Проще всего для решения подобных задач использовать метод скользящей средней, далее построить аддитивную или мультипликативную модель временного ряда. Если амплитуда сезонных колебаний (или циклических колебаний) приблизительно постоянна, то строят аддитивную модель временного ряда, в котором значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, то строят мультипликативную модель. В мультипликативной модели уровни ряда зависят от значений сезонной компоненты.

В остальном схема во многом аналогична приведенной выше с очевидными модификациями. Именно процесс построения модели включает следующие шаги:

Если полученные значения ошибок не содержат автокорреляции, то ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок для анализа взаимосвязи исходного ряда и других временных рядов.

Иногда строится модель регрессии с включением (явно) фактора времени и фиктивных переменных. При этом количество фиктивных переменных должно быть на единицу меньше числа моментов (периодов) времени внутри одного цикла колебаний. Каждая фиктивная переменная отражает сезонную (циклическую) компоненту ряда для какого-либо одного периода, поэтому она просто численно равна единице для данного периода и нулю для всех остальных периодов. Основным недостатком модели с фиктивными переменными является большое количество фиктивных переменных во многих случаях и тем самым снижение числа степеней свободы. В свою очередь, уменьшение числа степеней свободы снижает вероятность получения статистически значимых оценок параметров уравнения регрессии.

9.6.
Изменения тенденции временного ряда

Кроме сезонных и циклических колебаний весьма важную роль играют единовременные изменения характера тенденции временного ряда. Эти (относительно) быстрые однократные изменения тренда (его характера) вызываются структурными изменениями в экономике либо мощными глобальными (внешними) факторами. Прежде всего выясняется, значимо ли повлияли общие структурные изменения на характер тренда. При условии значимости такого влияния (структурных изменений) на характер тренда используется кусочно-линейная модель регрессии. Кусочно-линейная модель означает представление исходной совокупности данных ряда в виде двух частей. Одна часть данных моделируется просто линейной моделью с одним коэффициентом регрессии (углом наклона прямой) и представляет данные до момента (периода) структурных изменений. Вторая часть данных — это тоже линейная модель, но уже с иным коэффициентом регрессии (углом наклона).

После построения двух таких моделей (подмоделей) линейной регрессии получают уравнения двух соответствующих прямых. Если структурные изменения незначительно повлияли на характер тенденции ряда, то вместо построения точной кусочно-линейной модели вполне можно использовать единую аппроксимирующую модель, т.е. одну общую линейную зависимость (одну прямую), тоже вполне приемлемо представляющую данные в целом. Незначительное ухудшение в отдельных данных при этом непринципиально.

Если строится кусочно-линейная модель, то снижается остаточная сумма квадратов по сравнению с единым для всей совокупности уравнением тренда. В то же время разделение исходной совокупности на две части ведет к потере числа наблюдений и тем самым к снижению числа степеней свободы в каждом уравнении кусочно-линейной модели. Единое уравнение для всей совокупности данных позволяет сохранить число наблюдений исходной совокупности. Остаточная сумма квадратов по этому уравнению в то же время выше, чем такая же сумма для кусочно-линейной модели. Выбор конкретной — кусочно-линейной или просто линейной — модели, т.е. единого уравнения тренда, зависит от соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единого уравнения регрессии к кусочно-линейной модели.

Для оценки этого соотношения был предложен статистический тест Грегори — Чоу. В этом тесте рассчитываются параметры уравнений трендов, вводится гипотеза о структурной стабильности тенденции исследуемого ряда динамики. Ясно, что остаточную сумму квадратов кусочно-линейной модели можно найти как сумму соответствующих сумм квадратов для обеих линейных компонент модели. Сумма числа степеней свободы этих компонент дает число степеней свободы всей модели в целом. Тогда сокращение остаточной дисперсии при переходе от единого уравнения тренда к кусочно-линейной модели — это просто остаточная сумма квадратов, из которой вычтены соответствующие суммы для обеих компонент кусочно-линейной модели. Столь же просто определяется и соответствующее число степеней свободы.

После этого рассчитывается фактическое значение F-критерия по дисперсиям на одну степень свободы. Это значение сравнивают с табличным, полученным по таблицам распределения Фишера для требуемого уровня значимости и соответствующего числа степеней свободы. Как всегда, если расчетное (фактическое) значение больше табличного (критического), то гипотеза о структурной стабильности (незначимости структурных изменений) отклоняется. Влияние же структурных изменений на динамику изучаемого показателя признается значимым. Таким образом, следует моделировать тенденцию ряда динамики с помощью кусочно-линейной модели. Если же расчетное значение меньше критического, то нельзя отклонять нуль-гипотезу без риска сделать неверный вывод. В этом случае следует использовать единое для всей совокупности уравнение регрессии как наиболее достоверное и минимизирующее вероятность ошибки.

Вопросы для самопроверки

  • Что называется рядом динамики?

  • Объясните, что такое уровни ряда.

  • Дайте определение автокорреляции.

  • Как определяется коэффициент автокорреляции первого порядка?

  • Что такое лаг?

  • В результате чего возникает тренд?

  • Какова природа циклической компоненты?

  • Охарактеризуйте коэффициент авторегрессии.

  • Каким образом анализируется структура временного ряда?

  • В чем заключается центральная идея тестов на наличие корреляционной зависимости у членов временного ряда?

  • Опишите проблему зоны неопределенности в таких тестах.

  • В чем суть метода скользящей средней?

  • Воздействию каких переменных подвергается случайный член в уравнениях регрессии?

  • Зачем выполняется аналитическое выравнивание?

  • Перечислите основные этапы построения аналитической модели тренда.

  • Какой метод используется для оценивания коэффициентов тренда?

  • Объясните, что означают отклонения от тренда.

  • Как отбирается наилучшая форма тренда?

  • Укажите и объясните методы устранения тренда.

  • Объясните понятие модели с распределенным лагом, среднего лага.

  • Какова цель применения теста Грегори — Чоу?

  • Опишите недостатки кусочно-линейной модели.

  • Укажите недостатки модели с фиктивными переменными.

  • Как учитываются единовременные изменения характера тренда?

  • Какие трудности в выявлении взаимозависимостей двух временных рядов помогает преодолеть предварительное устранение в них тренда и циклической компоненты?

  • Каковы способы такого устранения этих компонент?

  • Укажите достоинства уравнений в последовательных разностях.

  • Опишите причины появления автокорреляции в остатках.

  • Перечислите методы определения автокорреляции остатков.

  • Разъясните суть метода (теста) Дарбина — Уотсона определения автокорреляции остатков.

  • Что является исходным положением, с которого начинается развертывание алгоритма, реализующего тест Дарбина — Уотсона?

  • Сколько зон неопределенности в тесте Дарбина — Уотсона?

  • Как поступают при попадании в такие зоны неопределенности?



Менеджер ДО [E-Mail: info@e-college.ru]  E-Mail:  info@e-college.ru