229 91 2MB
Russian Pages 56
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Оренбургский государственный университет» Кафедра математических методов и моделей в экономике
Л. М. Туктамышева, Е. Н. Седова
ПРОВЕРКА ГИПОТЕЗЫ О ХАРАКТЕРЕ ТРЕНДА: ТЕСТИРОВАНИЕ НА TS/DS РЯДЫ
Рекомендовано к изданию Редакционно-издательским советом федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Оренбургский государственный университет» в качестве методических указаний для студентов, обучающихся по программам высшего профессионального образования по направлениям подготовки 01.03.04 (231300.62) Прикладная математика, 38.03.05 (080500.62) Бизнес-информатика, 38.03.01 (080100.62) Экономика
Оренбург 2014
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 330.4 (076) ББК 65 в 631 я 7 T81 Рецензент – кандидат экономических наук, доцент C.В. Дьяконова
Т 81
Туктамышева, Л. М. Проверка гипотезы о характере тренда: тестирование на TS/DS ряды: методические указания / Л. М. Туктамышева, Е. Н. Седова; Оренбургский гос. ун-т. – Оренбург: ОГУ, 2014. – 56 с.
Методические указания содержат рекомендации к лабораторному практикуму и самостоятельной работе по дисциплинам «Эконометрика», «Эконометрическое моделирование», «Методы моделирования и прогнозирования», «Методы социально-экономического прогнозирования», «Макроэкономическое планирование и прогнозирование» и другим дисциплинам, требующим навыков моделирования и прогнозирования на основе данных временного характера. Методические указания к лабораторному практикуму, курсовой работе, дипломному проектированию и самостоятельной работе для студентов, обучающихся по программам высшего профессионального образования по направлениям подготовки 01.03.04 (231300.62) Прикладная математика, 38.03.05 (080500.62) Бизнес-информатика, 38.03.01 (080100.62) Экономика.
УДК 330.4 (076) ББК 65 в 631 я 7
Туктамышева Л. М., 2014 Седова Е. Н., 2014 ОГУ, 2014
2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Содержание Введение ............................................................................................................................... 4 1 Описание лабораторной работы ..................................................................................... 5 2 Постановка задачи............................................................................................................ 5 3 Порядок выполнения работы .......................................................................................... 6 3.1 Теоретические положения............................................................................................ 6 3.2 Описание выполнения работы в пакете GRETL ...................................................... 19 3.3 Описание выполнения работы в пакете Stata ........................................................... 38 4 Содержание письменного отчета.................................................................................. 46 5 Вопросы к защите........................................................................................................... 47 Список использованных источников .............................................................................. 49 Приложение А Исходные данные.................................................................................... 50 Приложение Б Список источников статистических данных ........................................ 52 Приложение В Описание исключения детерминированной сезонной компоненты в Stata ..................................................................................................................................... 53 Приложение Г Описание установки ado-файла для выполнения KPSS-теста............ 54
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Введение
На основе моделирования временных рядов решаются многие социальноэкономические задачи, начиная от прогнозов макроэкономических показателей, финансовых инструментов и заканчивая прогнозами показателей деятельности отдельных
экономических
предварительное
единиц.
тестирование
Обязательным
компонентного
при
этом
и
характера
состава
является тренда
исходного ряда для выбора метода прогнозирования. В имеющейся отечественной специализированной учебно-методической литературе практически нет работ, подробно освещающих вопросы тестирования характера тренда на основе процедуры Доладо-Дженкинса-Сосвилла-Риверо и критерия Квятковского-Филипса-Шмидта-Шинна. Как правило, ограничиваются описанием реализации расширенного критерия Дики-Фуллера, при этом не указываются некоторые особенности его применения. В предлагаемых методических указаниях описывается процедура проверки гипотезы
о
характере
тренда
на
базе
свободно
распространяемого
профессионального кросс-платформенного пакета GRETL и специализированного пакета Stata. Цель методических указаний заключается в формировании навыков выявления характера тренда нестационарных временных рядов.
4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1 Описание лабораторной работы
Цель работы заключается в выработке навыков проверки гипотезы о принадлежности временных рядов к TS/DS рядам. Лабораторная работа включает в себя следующие этапы: - постановку задачи; - ознакомление с порядком выполнения работы; - выполнение расчетов индивидуальных задач на компьютере и анализ результатов; - подготовку письменного отчета с выводами по работе; - защиту лабораторной работы. Лабораторная работа рассчитана на 2 часа. Большую часть данных методических указаний составляют технические подробности работы в пакете GRETL, Stata, которые при подготовке отчета должны быть опущены.
2 Постановка задачи
По данным Приложения А для исследуемого временного ряда: 1) на основе визуального анализа, а также анализа значений выборочной автокорреляционной
и
частной
автокорреляционной
функций
определить
компонентный состав ряда динамики изучаемого показателя; 2) проверить гипотезу о DS-ряде на основе простого и расширенного критерия Дики-Фуллера. Уточнить состав регрессоров, включаемых в тестовую модель,
на
основе
процедуры
Доладо-Дженкинса-Сосвилла-Ривера.
Учесть
возможность существования нескольких единичных корней на основе подхода Дики-Пентула.
5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3) проверить гипотезу о TS-ряде на основе критерия КвятковскогоФиллипса-Шмидта-Шинна (KPSS-тест).
3 Порядок выполнения работы 3.1 Теоретические положения
Ряды являются
динамики
большинства
нестационарными.
социально-экономических
Использование
ряда
методов
показателей предполагает
стационарность исследуемого временного ряда (проведение спектрального анализа, построение моделей типа АРСС). Речь идет о нестационарности вследствие непостоянства математического ожидания или дисперсии, соответственно выделяют 2 типа нестационарных процессов (иногда говорят о 2 характерах трендов): TSP или TS-ряды (time stationary process) и DSP или DS-ряды (difference stationary process) [1]. Следует отметить, что в класс TS-рядов включаются также стационарные ряды, не имеющие детерминированного тренда. Пусть наблюдается апостериорный стационарный временной ряд y1,Т у1 ,..., уТ (ему соответствует 1,Т 1 ,..., Т - априорный временной ряд). Далее в зависимости от целей термин «временной ряд» будет использоваться и по отношению к собственно случайной последовательности 1 ,..., Т и к ее реализации у1 ,..., у Т . Определение: Временной ряд у1,T называется стационарным относительно детерминированного тренда ( t ) , если ряд у1,T ( t ) стационарный. Временной ряд у1,T называется стационарным относительно стохастического тренда (интегрированным порядка d, d=1,2,..) если ряд d уt d 1 уt d 1 уt 1 является стационарным. Для таких рядов у1,T справедливо, что: 1)
у1,T не является TS-рядом;
6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2)
ряд d уt , полученный в результате d-кратного дифференцирования ряда
у1,T , - стационарный;
3)
ряд d 1 у t , полученный в результате (d-1)-кратного дифференцирования
ряда у1,T , не является TS-рядом. Принципиальное различие между этими двумя классами рядов заключается в том, что в случае TS ряда вычитание соответствующего детерминированного тренда приводит к стационарному ряду, а в случае DS - оставляет ряд нестационарным изза наличия у него тренда стохастического. Для нестационарного TS-ряда корректное исключение тренда заключается в оценивании соответствующего детерминированного тренда (регрессии на время) и его вычитании из исходного ряда, а для нестационарного DS-ряда – в переходе к последовательным разностям. Незнание типа ряда и произвольный выбор способа исключения тренда приводит
к
весьма
нежелательным
последствиям,
так
вычитание
оценки
детерминированного тренда (регрессии на время) из DS – ряда меняет спектр ряда, приводя к появлению ложной периодичности, а взятие разностей от TS-ряда приводит к «передифференцированному» ряду, который хотя и стационарен, но обладает необратимой частью скользящего среднего [2]. Продемонстрируем это на примере. Пусть временной ряд содержит детерминированный тренд вида:
y t a 0 a1t t ,
(1)
где t - «белый шум», M ( t ) 0; M ( t t
_____ 2 при 0 ) ,t 1,T 0 при 0
(2)
Найдем первую разность, для этого запишем модель (1) для предшествующего момента времени 7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
y t 1 a 0 a1 ( t 1 ) t 1 ,
(3)
тогда y t y t y t 1 = a 0 a1t t а 0 а1 ( t 1 ) t 1 = a1 t t 1 .
(4)
Получили ряд, в котором детерминированная составляющая равна константе a1 .
Найдем вторую разность
[ 2 ] y t y t y t 1 = a1 t t 1 a1 t 1 t 2 t 2 t 1 t 2 .
(5)
Получили ряд соответствующий процессу скользящего среднего, однако параметры модели по модулю больше 1, то есть нарушено требование обратимости. Зачастую за детерминированный тренд принимают случайное блуждание. Различают случайное блуждание с дрейфом и без дрейфа. Процесс случайного блуждания без дрейфа:
t t 1 t ,
(6)
который является нестационарным, так как содержит стохастический тренд (DSряд). Математическое ожидание и дисперсия процесса случайного блуждания:
t
M ( t ) M ( t 1 t ) M ( t 2 t t 1 ) ... M ( 1 i ) 1 ,
(7)
i 1
t
D( t ) D( 1 i ) t 2 . i 1
8
(8)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
То есть процесс нестационарен вследствие тренда дисперсии (дисперсия возрастает с течением времени). Процесс случайного блуждания с дрейфом
t t 1 t ,
(9)
где - величина дрейфа (сноса).
t
t
M ( t ) M ( t 1 t ) M ( 2 t 2 t t 1 ) ... M ( 1 i ) t 1 i 1
t
(10)
i 1
t
D( t ) D( 1 i ) t 2 . i 1
(11)
i 1
Процесс нестационарный, содержит тренд среднего и тренд дисперсии. Данные процессы легко принять за ряды с детерминированным трендом, так при оценивании регрессии на время будут получены следующие результаты, которые могут привести к «ложным» выводам, представленным в таблице 1.
Таблица 1 – Последствия оценки регрессии на время по ряду случайного блуждания Характеристика
Случайное блуждание без дрейфа
Случайное блуждание с дрейфом
1
2
3
Оценка выборочного коэффициента детерминации Остаточная дисперсия Остатки
R€ 2 0 ,44 независимо от длины R€ 2 1 при T временного ряда Занижена, вследствие чего завышенные наблюденные значения tстатистики при проверке значимости параметров модели
€t t 1 1 10 автокоррелированы, при этом T
Таким образом, видно, что процессы случайного блуждания легко идентифицировать как ряды с детерминированным трендом, речь идет о так называемом «ложном» тренде.
9
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Знание
характера
нестационарности
важно
и
при
исследовании
многофакторных регрессионных моделей по временным рядам. При построении регрессии по переменным, измеренным во времени при определенных условиях может возникнуть эффект ложной (мнимой, кажущейся) регрессии. Ложность заключается в том, что, несмотря на значимость модели регрессии и высокое значение выборочного коэффициента детерминации, между рассматриваемыми переменными на самом деле связи нет [3]. Поясним это. Пример 1. Рассмотрим построение регрессии на основе данных временного характера, при этом ряды нестационарны. Возьмем два независимых случайных блуждания: t t 1 t t 1,...T , t t 1 t
(12)
Если t , t независимы, то между 1,T и 1,T нет ничего общего. Предположим, что мы не знаем механизмов, порождающих 1,T и 1,T , и оцениваем регрессию:
yt x t t .
(13)
Если проверять значимость этой зависимости на основе t-статистики для коэффициента , то будет получен ложный вывод о наличии значимой связи. Было показано, что чем больше Т, тем больше шансов прийти к этому ложному заключению (так как при T t-статистика расходится). Например, нам представляется, что связана динамика денежной массы и инфляция, но мы не учли, что оба процесса – DSP, и сделанный вывод неправомочен. Пример 2. Возьмем два процесса с детерминированным трендом:
t a 1 1t t t a 2 2 t t 10
(14)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценка уравнения регрессии (13) покажет, что процессы зависят между собой, в то время как на самом деле они оба зависят от третьей переменной – времени. При построении моделей связей между временными рядами в долгосрочной перспективе (модели коинтеграции, модели коррекции ошибок, векторные авторегрессии) необходимо учитывать факт наличия или отсутствия у них стохастического (недетерминированного тренда). Например, если выявляется группа DS-рядов, то между ними возможна так называемая коинтеграционная связь (а между TS и DS-рядом коинтеграционной связи быть не может!). При наличии такой связи можно
построить комбинации краткосрочной и долгосрочной
динамических регрессионных моделей в форме модели коррекции ошибок. Траектория TS-ряда находится то ниже, то выше линии детерминированного тренда, а траектория DS-ряда может весьма долго пребывать по одну сторону от него,
удаляясь
от
него
на
значительные
расстояния.
Поэтому
наличие
стохастического тренда требует проведения определенной экономической политики для
возвращения
макроэкономической
переменной
к
ее
долговременной
перспективе, тогда как при отсутствии стохастического тренда серьезных усилий для этого не требуется [1]. Очевидна необходимость некоторых процедур (тестов) для определения принадлежности наблюдаемого ряда к классу TS или DS. Таких процедур много, и они могут приводить к противоположным выводам. Поэтому рекомендуется применять несколько разных критериев [2]. Наиболее распространенными критериями для определения типа ряда являются критерии типа Дики-Фуллера, в которых проверяемой (нулевой) гипотезой является гипотеза о том, что исследуемый ряд 1,T относится к классу DS. Разберем идею построения данного теста. Рассмотрим модель вида
y t y t 1 t .
11
(15)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Если
, то мы имеем модель случайного блуждания без дрейфа
y t y t 1 t , которое, как известно, относится к DS-рядам.
Если
, то имеем стационарный процесс (авторегрессию 1-го порядка),
который по определению относится к TS-рядам. Таким образом, проверка принадлежности ряда к DS сводится к проверке гипотезы:
H0 : 1, y t y t 1 t – случайное блуждание без дрейфа, нестационарный ряд типа I(1), DS
H1 : 1, y t y t 1 t – стационарный ряд с нулевым математическим ожиданием, TS (ситуация
– взрывной нестационарный процесс не
рассматривается) Поскольку более «привычно» проверять гипотезу
, то преобразуем
модель, вычтя из обеих частей y t 1 :
y t y t 1 y t 1 y t 1 t
(16)
y t ( 1) y t 1 t y t 1 t .
(17)
Тогда проверка гипотезы о том, что том, что
эквивалентна проверке гипотезы о
.
H0 : 0, y t t – случайное блуждание без дрейфа, нестационарный ряд типа I(1), DS
H1 : 0, y t y t 1 t – стационарный ряд с нулевым математическим ожиданием, TS Обычно для проверки такой гипотезы используется t-статистика. Однако при выполнении нулевой гипотезы временной ряд является случайным блужданием, дисперсия которого с ростом t стремится к бесконечности (как было показано выше) и статистика t=
€ S€€
(18) 12
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
имеет распределение, отличное от распределения Стьюдента – оно было названо распределением
Дики-Фуллера
по
именам
исследователей,
впервые
затабулировавших его критические точки. Критические значения – всегда отрицательные (хотя в литературе их иногда приводят со знаком плюс). Таким образом, рассмотрено построение критерия для проверки нулевой гипотезы о том, что исследуемый ряд принадлежит классу DS, а именно случайное блуждание без дрейфа. К DS рядам относится также случайное блуждание с дрейфом и ряды, имеющие наряду со стохастическим детерминированный тренд, поэтому проверка наличия единичного корня при использовании критерия ДикиФуллера проводится в рамках одной из 3-х ситуаций. Во всех случаях проверяется гипотеза 0 или Но : 1 против Н1 : 1 . В рассмотренном
критерии
Дики-Фуллера
предполагается,
что
исследуемый
временной ряд генерируется моделью авторегрессии 1-го порядка. Обобщение критирия Дики-Фуллера для учета авторегрессии p-порядка составляет суть расширенного критерия Дики-Фуллера (ADF-тест). Таблица 2 – Оцениваемые модели в критериях Дики-Фуллера Модель
А а) блуждание
Оцениваемая модель в простом критерии Дики-Фуллера (DFтест) 1 случайное y t y t 1 t
Оцениваемая модель в расширенном критерии ДикиФуллера (ADF-тест) 2 p 1
y t y t 1 i y t i t i 1
б) случайное y t y t 1 t блуждание с дрейфом
p 1
y t y t 1 i y t i t i 1
в) случайное y t t y t 1 t блуждание с дрейфом и детерминированным трендом
13
p 1
y t t y t 1 i y t i t i 1
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ADF-тест может использоваться и в том случае, если исследуемый временной ряд генерируется моделью СС или АРСС, поскольку данные модели могут быть сведены к модели АР (возможно, с большим числом лагов). Критические значения расширенного критерия Дики-Фуллера совпадают с критическими значениями обычного критерия Дики-Фуллера, роль дополнительной авторегрессионной компоненты сводится к тому, чтобы исключить автокорреляцию остатков, при которых тест не работает. Помимо автокорреляции остатков, критерий Дики-Фуллера имеет некоторые особенности или ограничения по использованию. Рассмотрим их: - при добавлении в модель излишних регрессоров (в том числе и константы) мощность критерия снижается. Составляющие включают в модель на основе визуального анализа или на основе пошаговой процедуры Доладо, Дженкинса и Сосвилла-Риверо (рассмотрен ниже); - критерий чувствителен к выбору числа лагов. Распределение t-отношения для
является распределением Дики-Фуллера, если число лагов согласовано с
длиной реализации ряда. При этом возможны следующие подходы к выбору числа лагов: 1)
Вначале длину лагов берут достаточно большим, а затем понижать
ее на основе последовательного исключения незначимых лаговых переменных и сравнением по критерию Шварца моделей с различным числом лагов. 2)
Берут
такую
длину
лага,
при
которой
остатки
будут
некоррелированными (проверяют на основе критерия множителей Лагранжа) и гомоскедастичными. 3)
Длину лага берут на основе эвристического критерия, например,
число лагов равно
1 [T 3 ]
или
1 [T 4 ]
1
T 4 или [4( ) ] 100
для квартальных данных,
1
T 4 [12( ) ] для месячных. 100 Получается, к примеру, что для ряда длиной до 81 точки – берем 2 лага, от 81 до 256 – 3 лага. 14
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
- если дисперсия остатков непостоянна, то ADF-тест неприменим, следует использовать, например, непараметрический критерий Филипса-Перрона [5]; - при наличии структурных скачков, критерий Дики-Фуллера будет «склонен» к принятию нулевой гипотезы, так как ADF-тест может трактовать скачки как нестационарность. Следует использовать, например, критерий Перрона [4,9]; - критерии Дики-Фуллера основаны на предположении, что если единичный корень и имеется, то он единственный. Поэтому если есть предположение, что единичных корней больше 1 (то есть ряд интегрированный порядка больше, чем 1), то для определения количества корней следует использовать процедуру Дики и Пентула. Существует 2 подхода: от частного к общему и от общего к частному. При первом подходе проверяется гипотеза об одном единичном корне для исходного ряда. Если нулевая гипотеза принимается, то переходят к первым разностям и проверяют гипотезу единичного корня, и, если нулевая гипотеза отвергается, то делаем вывод о том, что исследуемый ряд содержит один единичный корень. Если нулевая гипотеза единичного корня для ряда разностей принимается, то получаем, что исследуемый ряд содержит минимум два единичных корня, то есть является интегрированным второго порядка. Переходят к проверке на единичный корень ряда вторых разностей и т.д. Делают вывод о том, что ряд содержит k единичных корней, если ряд разностей k+1 порядка стационарный. Процедура
Дики-Пентула
реализует
подход
от
общего
к
частному.
Выдвигается предположение о максимально возможном количестве единичных корней, например, k [1]. H0: максимум k единичных корней H1: меньше, чем k единичных корней Для проверки гипотезы в соответствии с процедурой Доладо-ДженкинсаСосвилла
-Риверо
используется
расширенный
критерий
Дики-Фуллера
применительно к (k-1) разности исследуемого ряда. Если нулевая гипотеза отвергается, то количество предполагаемых единичных корней уменьшается на 1 и используются (k-2) разности ряда: 15
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
H0: максимум (k-1) единичных корней H1: меньше, чем (k-1) единичных корней и т.д.; - мощность критерия Дики-Фуллера зависит, в первую очередь, от фактической протяженности ряда во времени, а не от частоты, с которой производятся наблюдения. То есть, имея значения ряда за 10-летний период, не получаем выигрыша в мощности, анализируя месячные данные, а не квартальные или годовые; - при анализе данных, подвергшихся сезонному сглаживанию, исследуемый ряд чаще классифицируется как DS, чем при анализе исходных данных. Поэтому предпочтительнее устранение сезонности с помощью фиктивных переменных и применение критерия Дики-Фуллера к ряду остатков от оцененной регрессии. Было показано, что асимптотическое распределение t не изменяется при исключении из ряда детерминированных сезонных компонент. Для случая стохастической сезонной компоненты существуют специальные тесты. При добавлении излишних регрессоров мощность критерия снижается. Поэтому
используют
процедуру
Доладо-Дженкинса-Сосвилла-Ривера
для
определения состава регрессоров [1]. Шаг 1. Оценивается модель с константой и линейным трендом (модель «в» из таблицы 1).
H0 : 0 H1 : 0 Если нулевая гипотеза отвергается, то ряд класса TS. Если нулевая гипотеза не отвергается, то прежде чем относить ряд к классу DS, нужно удостовериться, что мы правильно включили тренд. Оценивается модель «в», но без регрессора yt-1. Проверяется значимость коэффициента при тренде. Если он значим, то тренд был включен правильно, ряд DS. Иначе его зря включили при оценке модели, и тогда нужно было оценивать модель «б» из таблицы 2. Шаг 2. Оценивается модель «б». 16
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
H0 : 0 H1 : 0 Если нулевая гипотеза отвергается, то ряд класса TS (стационарный ряд с ненулевой средней). Если нулевая гипотеза не отвергается, то прежде чем относить ряд к классу DS, нужно удостовериться, что мы правильно включили в модель константу. Оценивается модель «б», но без регрессора yt-1. Проверяется значимость константы с помощью t-статистики Стьюдента. Если константа значима, то она была включена правильно, это случайное блуждание с дрейфом. Если константа не значима, то оценивается модель «а» из таблицы 2. Шаг 3. Оценивается модель «а».
H0 : 0 H1 : 0 Если нулевая гипотеза отвергается, то ряд класса TS (процесс AR с нулевым математическим ожиданием). Иначе это процесс DS - случайное блуждание без дрейфа. Зачастую критерии единичного корня дают противоречивые результаты, что вынуждает применять критерии, в которых проверяется гипотеза о TS-ряде. К ним относится тест Квятковского –Филлипса-Шмидта-Шинна (KPSS-тест). Рассматривается временной ряд, содержащий детерминированный тренд t , стохастический тренд t и белый шум t
t t t t ,
(19)
В частном случае этот временной ряд можно представить как
y t t x t e t
x t x t 1 u t ,
xt - процесс случайного блуждания; 17
(20)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
u t остатки с нулевым математическим ожиданием и дисперсией 2u относительно которой и проверяется нулевая гипотеза [6]:
H 0 : 2u 0 ( x t const ) ряд типа TS H1 : 2u 0 ( x t const ) ряд типа DS. Запишем первое уравнение модели (20) для момента t-1 и вычтем его из исходного, получим:
y t y t 1 t x t t ( t 1) x t 1 t 1
y t u t t w t , где wt -остатки уравнения (22). Если u t , t
(21) (22)
нормально-распределенные и взаимно
некоррелированные, то wt - автокоррелирован первого порядка и может быть представлен моделью скользящего среднего первого порядка СС(1) [7,8]:
w t v t v t 1 .
(23)
Тогда тестируемая модель принимает вид:
y t y t 1 w t , w t v t v t 1 ,
(24)
1.
При 1 полученная модель фактически соответствует модели ARIMA, то есть имеем нестационарный ряд, а при 0 - стационарный ряд. Строится статистика
T
t
( e i ) 2 LM
t 1 i 1 2 2
T S (k )
18
,
(25)
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
T t 1
T
T
j1
t s 1
w j, k e t e t 1
et S 2 (k )
k
2
T
,
(26)
где еt - остатки оценки модели (24); w( j , k ) веса, зависящие от выбора спектрального окна, авторы теста предлагают
брать окно Бартлетта, то есть
w ( j, k ) 1
j , k 1
(27)
что обеспечивает неотрицательность S 2 ( k ) . Например, для квартальных данных k берут равным 8 [7]. Критические значения статистики смоделированы на основе метода МонтеКарло (их значения можно найти в [7-8]). Далее продемонстрируем процедуру определения характера тренда в пакете GRETL.
3.2 Описание выполнения работы в пакете GRETL
Запуск GRETL и подготовка данных
Эконометрический пакет GRETL позволяет, как создавать рабочие файлы сразу в своем формате и вводить данные непосредственно с клавиатуры, так и осуществлять импорт данных из большинства распространенных офисных и специализированных статических пакетов – Eviews, Stata, SPSS, SAS. Покажем, как импортировать данные из Excel. Создадим новую книгу Excel и на ее первом листе введем (или скопируем) данные, причем в первой строке сразу укажем название анализируемого временного ряда. Переименуем лист с данными из Лист1 в list1 (для этого нужно щелкнуть 19
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
левой клавишей мыши на ярлычке листа и ввести новое имя), сохраним файл под именем kniga1.xls, используя пункт меню Файл – Сохранить как (рисунок 2).
Рисунок 2 – Исходные данные в Excel
Памятка по импорту данных в GRETL из Excel 1.
2. 3.
Имена переменных, листы рабочих книг и сами книги называйте ЛАТИНСКИМИ буквами. Старайтесь не использовать символы национальных алфавитов. Импортируемые данные должны находиться на первом из листов рабочей книги (если их несколько). На листе с импортируемыми данными не должно находиться никаких других посторонних объектов (графиков, рисунков и т.д.).
Запустим GRETL. После запуска на экране откроется основное окно программы. Выберем пункт главного меню Файл – Открыть – Импорт – Excel (рисунок 3).
20
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 3 – Стартовое окно пакета GRETL
В появившемся окне укажем путь к файлу с данными, осуществляя навигацию с помощью списка слева (рисунок 4).
Рисунок 4 – Указание пути к файлу с данными После нажатия на кнопку
появится окно, в котором нужно указать
номер первого столбца и первой строки массива с данными. В блоке Лист для
21
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
импорта указывается, какого листа открываемой книги будут считываться данные – как и требовалось, с листа list1 (рисунок 5).
Рисунок 5 – Задание номера первого столбца и строки диапазона с данными
Поскольку все параметры диапазона данных заданы верно, нажмем кнопку . На экране появится окно с запросом о возможности задания структуры данных в виде временного ряда или панельных данных (рисунок 6). В нашем случае мы имеем временной ряд, поэтому нажмем кнопку
.
Рисунок 6 – Вид окна запроса изменения структуры данных
На экране появится форма с запросом о структуре данных, в которой поставим переключатель на «Временные ряды» (рисунок 7).
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 7 – Вид окна запроса структуры данных
После нажатия кнопки
на экране появится форма с запросом
частоты временного ряда (рисунок 8, а), где установим переключатель на «Ежемесячные». После нажатия кнопки
на экране появится форма с
запросом даты, к которой относится первый уровень исследуемого временного ряда, год и месяц разделяются двоеточием (рисунок 8, б).
(а)
(б)
Рисунок 8 – Вид окна запроса частоты временного ряда (а) и установки даты для первого уровня временного ряда (б)
23
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
После последнего вопроса о правильности всех сделанных установок (рисунок 9), нажмем кнопку
- появится главное окно GRETL с импортированными
данными (рисунок 10).
Рисунок 9 – Вид окна запроса подтверждения дат и структуры данных
Рисунок 10 – Вид окна GRETL после импорта данных
Для просмотра значений временного ряда нужно выделить соответствующую переменную и сделать или двойной щелчок левой клавишей мыши, или щелчок правой клавишей мыши с выбором пункта контекстного меню Показать значения. 24
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сохраним импортированные данные в формате GRETL. Для этого выберем Файл – Сохранить как – Файл gretl (рисунок 11).
Рисунок 11 – Выбор пункта меню для сохранения данных в формате gretl
В появившемся окне следует указать переменные, которые нужно сохранить. Для этого они выделяются в списке Доступные переменные и переносятся в список Выбранные переменные с помощью кнопки с зеленой стрелкой одновременного переноса всех переменных нажимается кнопка
..Для . Если
решение о необходимости сохранения переменной изменилось, то соответствующая переменная удаляется из списка Выбранные переменные с помощью кнопки с красной стрелкой
. Вид окна представлен на рисунке 12.
Рисунок 12 – Выбор переменных для сохранения 25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
После нажатия
на экране появится окно, в котором задается имя и
расположение будущего файла (рисунок 13).
Рисунок 13– Задание имени и расположения сохраняемого файла Нажмем на кнопку
.
Определение компонентного состава временного ряда
Первым этапом при определении компонентного состава временного ряда является построение его
графика. Для этого сначала в основном окне GRETL
выделяется нужная переменная, затем можно воспользоваться пунктом главного меню Вид – График – График временного ряда или щелкнуть правой клавише мыши по выделенной переменной и использовать пункт График временного ряда контекстного меню (рисунок 14).
Рисунок 14 – Выбор пункта контекстного меню для построения графика временного ряда 26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для правки появившегося графика нужно щелкнуть на нем клавишей мыши и выбрать пункт Правка контекстного меню (рисунок 15). На вкладке Общие можно изменить шрифт, на вкладках Ось Х и Ось Y – настроить шкалу и подписи соответствующих осей (однако при выборе названий стоит помнить о возможных проблемах с отображением символов национальных алфавитов). Для удобства дальнейшего обращения к графику сохраним его – щелчок мышью в любом месте графика и выбор пункта контекстного пункта Сохранить в текущей сессии. Для вставки графика в документ (отчет) удобно использовать пункт контекстного меню Копировать в буфер обмена – Черно-белый (или Цвет).
Рисунок 15 - Выбор пункта контекстного меню для правки графика временного ряда
Визуальный анализ графика позволяет предположить отсутствие сезонности и наличие возрастающего тренда. Данное предположение можно проверить как с помощью специальных критериев, так и на основе анализа выборочной 27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
автокорреляционной функции ряда – она позволяет в частности, определить, насколько рассматриваемый ряд близок к стационарному. Автокорреляции стационарного ряда затухают с ростом лага. Анализ автокорреляционной (АКФ, или ACF) и частной автокорреляционной функций (ЧАКФ, или PACF) также позволяет сделать выводы о компонентном составе временного ряда. Для построения АКФ и ЧАКФ выделим в главном окне программы анализируемую переменную, вызовем правым щелчком мыши контекстное меню и выберем пункт Коррелограмма (рисунок 16) или воспользуемся пунктами главного меню Переменная Коррелограмма.
Рисунок 16 - Выбор пункта контекстного меню для построения выборочных АКФ и ЧАККФ временного ряда
В появившемся окне зададим количество лагов (рисунок 17) и нажмем .
Рисунок 17 – Вид окна выбора количества лагов для построения АКФ и ЧАКФ 28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
На экране появится таблица с численными значениями коэффициентов автокорреляции (рисунок 18). В столбцах ACF и PACF приведены численные значения выборочных автокорреляционной и частной автокорреляционной функций соответствующего порядка (лага). В столбцах Q-стат. и [p-значение] приведены значения Q-cтатистики Льюнга-Бокса и достигаемый уровень значимости p для гипотезы об отсутствии автокорреляции соответствующего порядка.
Рисунок 18 – Вид окна с численными значениями выборочных АКФ и ЧАКФ
На рисунке 20 представлены графики выборочных автокорреляционной и частной автокорреляционной функций с соответствующими доверительными интервалами (пунктирные линии), которые равны двум стандартным отклонениям и вычисляются как 1,96 T . Если k-ое значение выборочной автокорреляционной (либо частной автокорреляционной) функции находится внутри данного интервала, то можно говорить о том, что коэффициент автокорреляции k-ого порядка приблизительно на уровне значимости 0,05 незначимо отличается от нуля. Как видно из рисунков 18 и 19, исследуемый ряд нестационарен, т.к. автокорреляционная функция не имеет тенденции к затуханию. О наличии 29
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
трендовой компоненты говорит тот факт, что значимым оказался частный коэффициент автокорреляции только первого порядка. Таким образом, мы имеем дело с нестационарным временным рядом.
Рисунок 19 – Вид окна с графиками выборочных АКФ и ЧАКФ
Рассмотрим процедуру проверки гипотезы о единичном корне на основе критерия Дики-Фуллера. Следует отметить, что ряд не содержит сезонности, следовательно нет необходимости проводить его корректировку. Для этого выберем пункт главного меню Модель – Переменная – Расширенный критерий ДикиФуллера (ADF-тест) (рисунок 20).
30
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 20 – Вид окна расширенного теста Дики-Фуллера В появившемся окне есть возможность настройки порядка лагов для ADFтеста. В данном случае по эвристическому критерию число лагов для 65 1 4
наблюдений равно 2 (целая часть от 65 ). Другие возможные подходы к выбору числа лагов описаны выше.
Рисунок 21 – Результаты применения расширенного теста Дики-Фуллера 31
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Для всех трех вариантов моделей (из таблицы) гипотеза единичного корня не отвергается, так как вероятности принятия нулевой гипотезы выше 0,05. Проверим не включили ли в модель лишние регрессоры (константа и тренд) на основе процедуры ДДСР. По рисунку 21 видно, что гипотеза о единичном корне на основе модели с константой и трендом не отвергнута. Оценим модель «в» из таблицы 2 без регрессора у t 1 .
Для этого перейдем к опции Модель-Метод наименьших
квадратов
Рисунок 22 – Окно выбора параметров модели «в» без регрессора уt 1 Нажав кнопку Ок, получим результаты, представленные на рисунке 23.
32
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 23 – Результаты оценивания модели «в» без регрессора у t 1 По рисунку 23 видно, что параметр при тренде значим на уровне значимости 0,1.Значит, тренд включен в модель правильно. Процедура ДДСР заканчивается, делается вывод о наличии в ряду единичного корня. Исследуемый ряд является интегрируемым порядка 1. Проверим на автокорреляцию и гетероскедастичность ряд остатков модели «в». Для этого заново оценим модель «в», используя вкладку Метод наименьших квадратов пункта меню Модель. На рисунке 24 представлено окно с выбором параметров модели.
Рисунок 24- Окно выбора параметров модели «в» 33
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Нажав на кнопку Ok, получим окно с результатами оценивания.
Рисунок 25 – Окно с результатами оценивания модели «в» Проверим гипотезу об отсутствии гетероскедастичности на основе теста Бреуша-Пагана. Для этого перейдем во вкладку Тесты и выберем пункт Гетероскедастичность – Breusch-Pagan (Бреуш-Паган) и нажав кнопку Ok, получим окно с результатами проверки.
Рисунок 26 – Окно с результатами проверки теста об отсутствии гетероскедастичности остатков модели «в» 34
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
По рисунку 26 видно, что нулевая гипотеза принимается, так как вероятность принятия нулевой гипотезы 0,34, что больше 0,05. Проверим остатки модели на автокорреляцию на основе АКФ и ЧАКФ. Для этого в окне результатов, представленном на рисунке 25, выберем вкладку Графики – Коррелограмма. Результаты оценивания АКФ и ЧАКФ остатков модели представлены на рисунке 27.
Рисунок 27 – Оценки АКФ и ЧАКФ остатков модели «в» По коррелограммам видно, что остатки не автокоррелированы, кроме того они гомоскедастичны, поэтому нет необходимости применять критерий ФилипсаПеррона. Проверим также ряд первых разностей на наличие единичного корня на основе расширенного критерия Дики-Фуллера, в данном случае выберем автоматическое определение порядка лагов.
35
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 28 – Вид окна расширенного теста Дики-Фуллера Нажав кнопку Ok, получим результат, представленный на рисунке 29.
Рисунок 29 – Результаты применения расширенного теста Дики-Фуллера к ряду разностей 36
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Согласно полученным результатам, нулевая гипотеза во всех случаях (модели «а»-«в») отвергается в пользу TS –ряда, то есть ряд первых разностей – стационарный, что подтверждает наш вывод об интегрированности 1 порядка. Проверим характер тренда на основе KPSS-теста, который проверяет гипотезу о TS-ряде. Для этого выберем пункт главного меню Модель – Переменная - KPSS-тест (рисунок 30).
Рисунок 30 – Вид окна KPSS-теста
В появившемся окне нет возможности настройки порядка лагов. По эвристическому критерию число лагов возьмем равным 2.
Рисунок 31 – Результаты применения KPSS- теста 37
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В нашем случае критическое значение для уровня значимости 0,05 составляет 0,146. Значение статистики KPSS-критерия составляет для модели с 2 лагами 0,169, что превышает критическое значение, следовательно, нулевая гипотеза об отсутствии единичного корня отвергается, тип исследуемого ряда DS.
3.3 Описание выполнения работы в пакете Stata
Проведем тестирование ряда индекса Доу-Джонса на наличие единичных корней в пакете Stata. Для работы нам понадобится переменная t, принимающая значения 1,2, 3 и т.д. Такую переменную можно сгенерировать непосредственно в Stata или создать заранее, например, в Excel. Скопируем данные вместе с названиями переменных в первой строке в буфер обмена, запустим пакет Stata, вызовем редактор данных Data Editor с помощью пунктов главного меню Data – Data Editor – Data Editor (Edit) или с помощью кнопки на панели инструментов. Поставим курсов в левую верхнюю ячейку, сделаем щелчок правой клавишей мыши и в контекстном меню выберем пункт Paste Special. Далее в появившемся окне укажем символ табуляции (Tab) в качестве разделителя данных (Delimiter) и поставим галочку у опции Treat first row as variable name – Первая строка содержит названия переменных. Далее необходимо указать, что данные имеют временную структуру. Для этого можно воспользоваться пунктами главного меню Statistics – Time Series – Setup and utilities – Declare dataset to be time-series data и в появившемся окне в списке Time variable выбрать вспомогательную переменную t, а в блоке Time unit and display format for the time variable выбрать Generic (рисунок 32). Нажать Ок. Аналогом описанных действий с использованием оконного интерфейса является команда tsset t, generic.
38
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 32 – Задание параметров временной структуры данных
Для построения графика исследуемого временного ряда используем команду twoway (tsline y). Анализируемый временной ряд не имеет сезонности (рисунок 33), поэтому вопрос об элиминировании сезонной компоненты не ставится (см.
220
240
y 260
280
300
приложение В).
0
20
40 t
Рисунок 33 – График исследуемого временного ряда 39
60
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Предположим, что максимальное количество единичных корней исследуемого ряда равно k=2, то есть выдвигаем нулевую гипотезу H0 о том, что имеется максимум 2 единичных корня против альтернативной гипотезы H1 о том, что единичных корней менее 2. Тогда согласно процедуре Дика-Пантула необходимо провести исследования наличия единичного корня у ряда первых разностей, то есть
yt yt yt 1 . Для создания ряда первых разностей используем команду gen d1y = y[_n]-y[_n-1]:
. gen d1y = y[_n]-y[_n-1]
,
где gen – команда создания новой переменной, d1y – имя новой создаваемой переменной, y – имя переменной, содержащей анализируемый временной ряд, y[_n] – текущий уровень временного ряда, то есть для момента времени t, y[_n-1] – предыдущий уровень временного ряда, то есть для момента времени t-1. Далее осуществим проверку наличия в ряду первых разностей единичного корня на основе одного из критериев, например, критерия Дики-Фуллера или его расширенной версии (ADF-тест). Выберем пункт меню Statistics – Time Series – Tests – Augmented Dickey–Fuller test for unit root. В соответствии с процедурой Доладо-Дженкинса и Сосвилла-Риверо (ДДСР) на первом шаге оцениваем модель с включением константы и тренда, поэтому поставим галочки на опции Include trend term in regression – Включить тренд в модель (рисунок 34). Константа включается в модель по умолчанию. Результаты реализации теста представлены на рисунке 35. Отметим, что вместо работы через оконный интерфейс можно использовать команду dfuller (рисунок 34).
40
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок 34 – Вид окна с настройками расширенного критерия Дики-Фуллера
. dfuller d1y, trend regress Dickey-Fuller test for unit root
Z(t)
Number of obs
Test Statistic
1% Critical Value
-6.291
-4.121
=
63
Interpolated Dickey-Fuller 5% Critical 10% Critical Value Value -3.487
-3.172
MacKinnon approximate p-value for Z(t) = 0.0000
D.d1y
Coef. d1y L1. _trend _cons
-.7950051 .0266143 -.0070169
Std. Err.
.126363 .0134755 .471159
t
-6.29 1.98 -0.01
P>|t|
0.000 0.053 0.988
[95% Conf. Interval]
-1.047769 -.0003408 -.9494751
-.5422415 .0535694 .9354414
Рисунок 35– Результаты применения к ряду первых разностей ADF-теста (шаг 1 процедуры ДДСР)
Согласно полученным результатам, значение статистики ADF-теста составило -6,291, критическое значение статистики, соответствующее уровню значимости 5%, равно -3,487. Таким образом, значение статистики попадает в критическую область (в случае ADF-теста строится левосторонняя критическая область), следовательно, 41
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
нулевая гипотеза о наличии в ряду первых разностей единичного корня отвергается, и делается вывод о том, что в ряду первых разностей единичного корня нет. Проверку гипотезы можно выполнить также на основе сравнения достигаемого уровня значимости p-value с установленным уровнем значимости. В нашем случае p-value = 0,000, уровень значимости равен 0,05, и поскольку p-value меньше уровня значимости,
то
нулевая
гипотеза
отвергается.
Следовательно,
отвергается
выдвинутая выше согласно процедуре Дики—Пантула нулевая гипотеза о наличии двух единичных корней, и делается вывод о том, что количество единичных корней равно 1 или меньше. Приступаем к проверке ряда на наличие единичных корней. На первом шаге процедуры Доладо-Дженкинса и Сосвилла-Риверо оцениваем модель с включением константы и тренда (рисунок 36). . dfuller y, trend regress Dickey-Fuller test for unit root
Z(t)
Number of obs
Test Statistic
1% Critical Value
-0.785
-4.119
=
64
Interpolated Dickey-Fuller 5% Critical 10% Critical Value Value -3.486
-3.172
MacKinnon approximate p-value for Z(t) = 0.9669
D.y
Coef. y L1. _trend _cons
-.0340332 .06617 7.170812
Std. Err.
.0433552 .0434024 9.218502
t
-0.78 1.52 0.78
P>|t|
0.436 0.133 0.440
[95% Conf. Interval]
-.1207274 -.0206185 -11.26272
.052661 .1529585 25.60435
Рисунок 36 – Результаты применения к ряду ADF-теста без лагов (шаг 1 процедуры ДДСР)
Представленные на рисунке 35 результаты говорят о том, что значение статистики ADF-теста составило -6,291, критическое значение статистики, соответствующее уровню значимости 5%, равно -3,487, то есть нулевая гипотеза о наличии единичного корня не отвергается (соответствующее p-value = 0,967 > 0,05). 42
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Поскольку в модель не было включено лаговых значений, то фактически нами использовался
критерий
Дики-Фуллера.
При
необходимости
включить
в
оцениваемую модель лаговые значения нужно указать порядок лагов в поле с названием (рисунок 34). Так, результаты оценки модели с включением лаговых переменных до лага 3 включительно приведены на рисунке 37. Нулевая гипотеза о наличии единичного корня также не отвергается. . dfuller y, trend regress lags(3) Augmented Dickey-Fuller test for unit root
Test Statistic
1% Critical Value
-1.186
-4.126
Z(t)
Number of obs
=
61
Interpolated Dickey-Fuller 5% Critical 10% Critical Value Value -3.489
-3.173
MacKinnon approximate p-value for Z(t) = 0.9132
D.y
Coef. y L1. LD. L2D. L3D. _trend _cons
-.0621236 .2533272 -.0527877 .2078762 .0768553 13.30313
Std. Err.
.0523614 .13372 .1385978 .1372528 .0508575 11.05317
t
-1.19 1.89 -0.38 1.51 1.51 1.20
P>|t|
0.241 0.063 0.705 0.136 0.136 0.234
[95% Conf. Interval]
-.1670582 -.0146537 -.3305439 -.0671846 -.0250653 -8.847919
.042811 .5213081 .2249686 .4829369 .1787759 35.45418
Рисунок 37 – Результаты применения к ряду ADF-теста, порядок лагов равен 3 (шаг 1 процедуры ДДСР)
Прежде чем относить ряд к классу DS, нужно удостовериться, что мы правильно включили с модель тренд: оценим модель без регрессора
, то есть
p 1
модель вида yt t i yt i t , и проверим значимость коэффициента i 1
. Для этого используем команду reg d1y t, где reg – имя команды для оценки линейной модели регрессии обычным методом наименьших квадратов, d1y – имя зависимой переменной в оцениваемой модели, t – имя факторной переменной в модели (рисунок 38). 43
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
. reg d1y t Source
SS
df
MS
Model Residual
24.6095421 213.776107
1 62
24.6095421 3.44800172
Total
238.385649
63
3.78389919
d1y
Coef.
t _cons
.033568 -.089684
Std. Err. .0125649 .4806775
t 2.67 -0.19
Number of obs F( 1, 62) Prob > F R-squared Adj R-squared Root MSE
P>|t| 0.010 0.853
= = = = = =
64 7.14 0.0096 0.1032 0.0888 1.8569
[95% Conf. Interval] .0084512 -1.050545
.0586848 .8711766
Рисунок 38 – Результаты оценки регрессии для проверки необходимости включения
При необходимости оценить эту вспомогательную модель с лагами нужно предварительно создать новые переменные, содержащие лаговые значения, с помощью команды gen lagS = y[_n-S], где gen – команда создания новой переменной, lagS – имя новой создаваемой переменной, S – порядок лага, y _ имя переменной, для которой формируются лаговые значения. Например, для оценки вспомогательной модели с порядком лагов 3 нужны следующие команды: gen lag1 = d1y[_n-1] gen lag2 = d1y[_n-2] gen lag3 = d1y[_n-3] reg d1y t lag1 lag2 lag3 Как видно из рисунка, коэффициент при тренде значим, значит, тренд был включен в модель верно. Процедура ДДСР заканчивается, делается вывод о наличии в ряду единичного корня. Исследуемый ряд является интегрируемым порядка 1. В силу не очень высокой мощности всех существующих критериев единичного корня в эконометрической практике принято выполнять проверку с использованием нескольких критериев, причем желательно, чтобы нулевая гипотеза в другом критерии была не о наличии единичного корня, а об его отсутствии. Этому условию удовлетворяет критерий Квятковского-Филипса-Шмидта-Шина (KPSSтест). Для его запуска используем команду kpss y, где kpss – имя команды, y – имя проверяемого ряда (см. приложение Г). 44
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В результате выполнения команды на экран выводится формулировка нулевой гипотезы (H0: y is trend stationary), критические значения для уровней значимости 0,1 (10%), 0,05 (5%), 0,025 (2,5%) и 0,01 (1%), а также значения статистики критерия для случаев оценки модели с различным количеством лагом (рисунок 39). При необходимости можно запустить реализацию данного теста с автоматическим выбором числа лагом, для этого используется опция auto и команда принимает вид kpss y, auto. Так, в нашем случае критическое значение для уровня значимости 0,05 составляет 0,146. Значение статистики KPSS-критерия составляет для модели без лагов, с одним и двумя лагами 0,452, 0,241 и 0,170, что превышает критическое значение 0,146, следовательно, нулевая гипотеза об отсутствии единичного корня отвергается, тип исследуемого ряда DS. Для моделей с большим числом лагом значением статистики KPSS-критерия меньше критического значения 0,146, следовательно, нулевая гипотеза об отсутствии единичного корня не отвергается и тип исследуемого ряда TS. C учетом всей полученной информации представляется остановиться на результатах для лагов менее 2, и признать тип ряда DS. . kpss y KPSS test for y Maxlag = 10 chosen by Schwert criterion Autocovariances weighted by Bartlett kernel Critical values for H0: y is trend stationary 10%: 0.119 Lag order 0 1 2 3 4 5 6 7 8 9 10
5% : 0.146
2.5%: 0.176
1% : 0.216
Test statistic .452 .241 .17 .135 .115 .102 .0934 .0877 .084 .0818 .0808
Рисунок 39 – Результаты применения к ряду KPSS-теста 45
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таким образом, критерий Дики-Фуллера при нулевой гипотезе о том, что исследуемый рад имеет тип DS, не отвергнул нулевую гипотезу, а KPSS-критерий при нулевой гипотезе о том, что исследуемый ряд имеет тип TS, отвергнул ее. Такая комбинация результатов нескольких критериев единичных корней однозначно говорит в пользу вывода о том, что тип исследуемого ряда DS, порядок интегрированной 1, в ряду имеется стохастический тренд. Таким образом, установлено, что ряд динамики исследуемого показателя является интегрированным первого порядка, что было установлено на основе расширенного критерия Дики-Фуллера и KPSS-теста. Для проверки правильности числа регрессоров использована процедура Доладо-Дженкинса-Сосвилла-Ривера. Проверена также гипотеза, что ряд не содержит двух и более единичных корней. Остатки тестируемой модели не автокоррелированы и гомоскедастичны, значит, оправданно применение критерия Дики-Фуллера вместо критерия ФилипсаПеррона. Ряд не содержит структурного скачка, то есть, нет необходимости использовать дополнительно критерий Перрона.
4 Содержание письменного отчета Отчет должен быть выполнен на листах формата А4 с титульным листом, оформленным соответствующим образом и содержать следующее: 1) постановку задачи с вариантом выборок; 2)
краткое изложение теории по тестированию на характер тренда;
3) результаты компьютерной обработки данных; 4) анализ полученных результатов; 5) выводы по полученным результатам. Отчет
должен
содержать
описание и
результаты
основных
этапов
исследования, при этом обязательно четко обосновывать необходимость проведения каждого этапа. Технические аспекты и подробности реализации этапов в
46
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
конкретном статистическом пакете должны быть опущены. Рекомендуемая схема описания каждого этапа: 1) постановка задачи этапа; 2) указание на используемый статистический критерий; 3) полученные результаты решения задачи; 4) окончательные выводы по этапу.
5 Вопросы к защите 1. Дайте определение TS-ряда. 2. Дайте определение DS-ряда. 3. К какому типу относится ряд, интегрированный порядка 0? 4. Перечислите и поясните последствия осуществления над TS-рядом операции перехода к разностям первого порядка. 5. операции
Перечислите и поясните последствия осуществления над DS-рядом детрендирования
(оценивания
и
вычитания
из
исходного
ряда
детерминированного тренда). 6. Определите тип процесса: а) t t 1 t ; б) t t 1 t ; в) t 0,7 t 1 t ; г) t t t (через t обозначен процесс «белого шума»). 7. Перечислите ограничения а) критерия Дики-Фуллера; б) расширенного критерия Дики-Фуллера. 8. О каком единичном корне идет речь в а) критерии Дики-Фуллера? б) расширенном критерии Дики-Фуллера. 9. Сформулируйте нулевую и альтернативную гипотезы а) критерия ДикиФуллера; б) расширенного критерия Дики-Фуллера; в) критерия KPSS. 47
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
10. Как проверить наличие у исследуемого временного ряда более чем одного единичного корня? 11. Как определить тип ряда при наличии а) сезонных колебаний? б) структурного скачка? 12. Перечислите и кратко охарактеризуйте известные Вам подходы к определению числа лагов в расширенном критерии Дики-Фуллера. 13. Какой способ удаления тренда является корректным для а) TS-ряда? б) DS-ряда? 14. Верно ли, что распределение статистики Дики-Фуллера зависит от состава регрессоров оцениваемой модели? 15. Верно ли, что распределения статистик обычного и расширенного критериев Дики-Фуллера совпадают? 16. Для определения типа ряда использовалось 2 критерия: критерий ДикиФуллера (DF-test) и критерий KPSS. В таблице ниже указаны полученные значения достигаемого уровня значимости. Какой вывод на уровне значимости 0,05 нужно сделать в каждой из четырех перечисленных ситуаций: № ситуации 1 2 3 4
DF-test 0,012 0,344 0,126 0,035
KPSS 0,568 0,017 0,299 0,042
17. В каких случаях а) следует использовать расширенный критерий Дики-Фуллера? б) можно ограничиться обычным критерием Дики-Фуллера? 18. С какой целью в модели расширенного критерия Дики-Фуллера включаются дополнительные лаговые значения зависимой переменной? Как определить необходимое количество лагов? 19. В эконометрической практике для проверки ряда на наличие единичного корня принято использовать не один, а несколько критериев. Чем это вызвано? 20. Опишите процедуру Доладо-Дженкинса и Сосвилла-Риверо. 48
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Список использованных источников 1 Канторович, Г. Г. Анализ временных рядов / Г. Г. Канторович // Экономический журнал Высшей школы экономики, 2003. – Т.7. – N1. – С.79-103. 2 Туктамышева, Л. М. К вопросу о методах идентификации характера тренда / Л. М. Туктамышева // Интеграция науки и практики в профессиональном развитии педагога. / Материалы всероссийской научно-практической конференции. – Оренбург: ИПК ГОУ ОГУ, 2010. – С. 963 – 967. ISBN 978-5-7410-1047-1 3 Носко, В. П. Эконометрика. Кн. 1. Ч. 1, 2: учебник / В. П. Носко. – М.: Издательский дом «Дело» РАНХиГС, 2011. – 672 с. 4 Perron, P. The Great Crash, the Oil Price Shock, and The Unit Root Hypothesis / P. Perron // Econometrica, 1989. – №57. – P.1361-1401. 5 Phillips, P. C. B. Testing for a Unit Root in Time Series Regression / P. C. B. Phillips, P. Perron // Biometrika, 1988. – №75. – P. 335-346. 6 Syczewska, E. 2010. Empirical power of the Kwiatkowski-Phillips-Schmidt-Shin test / E. Syczewska // Department of Applied Econometrics, Warsaw School of Economics, 2010. – 45 p. 7 Kwiatkowski, D. Testing the Null Hypothesis of Stationarity against the Alternative of a Unit Root / D. Kwiatkowski [ect.] //, Journal of Econometrics, 1992. - № 54. - P. 159178. 8 Математическое моделирование: исследование социальных, экономических и экологических процессов (региональный аспект) : учебное пособие / [О. И. Бантикова и др.]; под ред. А. Г. Реннера ; М-во образования и науки Рос. Федерации, Федер. гос. бюджет. образоват. учреждение высш. проф. образования "Оренбург. гос. ун-т". - Оренбург : Университет, 2014. - 367 с. 9 Туктамышева Л.М. О подходах к математическому моделированию рядов динамики со структурным скачком / Л. М. Туктамышева // Формирование основных направлений развития современной статистики и эконометрики. / Материалы I-ой Международной научной конференции. - научный редактор В.Н. Афанасьев.- 2013. С. 273-280. 49
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложение А (обязательное) Исходные данные Таблица А.1 – Выборочные данные по курсам ценных бумаг Период времени I 1997 II 1997 III 1997 IV 1997 I 1998 II 1998 III 1998 IV 1998 I 1999 II 1999 III 1999 IV 1999 I 2000 II 2000 III 2000 IV 2000 I 2001 II 2001 III 2001 IV 2001 I 2002 II 2002 III 2002 IV 2002 I 2003 II 2003 III 2003 IV 2003 I 2004 II 2004 III 2004 IV 2004 I 2005 II 2005 III 2005 IV 2005 I 2006 II 2006 III 2006 IV 2006
y1 37,26 73,11 38,93 70,39 10,99 66,99 64,81 107,93 45,85 99,16 87,87 88,45 63,85 105,66 105,62 129,29 132,7 137,93 137,84 158,59 154,43 174,3 183,7 162,16 191,31 226,16 262,08 291,44 272,92 302,23 323,66 382,3 377,94 409,12 418,23 475,85 452,06 528,85 561,82 582,46
y2 17,92 32,58 51,36 113,09 137,24 151,01 157,07 236,49 223,48 282,3 284,93 328,65 406,55 367,87 370,08 430,08 395,57 428,27 490,12 502,39 528,37 592,22 594,53 599,75 625,82 681,13 731,02 694,18 745,36 790,22 772,85 869,02 871,44 878,85 898,02 932,06 938,44 944,7 1013,3 1052,46
y3 48,73 84,55 45,76 60,38 35,7 87,01 85,94 143,51 33,28 133,64 112,82 72,74 103,65 124,23 124,49 170,27 161,13 181,21 150,95 197,75 176,88 199,82 244,2 189,02 208,4 211,19 258,91 321,57 293,26 333,6 283,81 375,38 363,82 404,27 434,47 482,71 479,89 542,7 589,11 607,87
y4 17,69 30,95 33,72 32,16 93,02 86,57 101,94 118,75 106,07 124,24 125,72 126,31 134,17 157,67 173,4 158,34 230,67 235,01 213,47 285,03 199,19 268,18 287,37 292,67 307,94 310,86 347,52 355,1 357,05 348,87 389,7 383,26 402,61 432,87 432,19 426,01 468,04 470,03 483,11 495,3
Показатель y5 y6 73,2 239,11 93,77 232,83 99,17 210,83 64,4 262,04 123,83 227,14 64,98 245,74 150,11 233,99 110,68 237,94 113,11 233,33 110,92 234,13 72,66 215,21 95,85 212,45 119,01 211,86 114,24 266,59 120,64 249,84 86,98 295,14 135,56 249,39 132,91 292,3 121,16 262,41 112,34 311,71 119,13 272,09 126,83 256,52 102,94 286,45 112,14 292,77 138,96 290,8 103,24 306,45 160,03 303,12 138,28 355,63 98,78 354,3 149 380,25 124,27 362,29 148,74 382,19 142,25 368,14 170,11 375,11 157,76 403,62 133,88 446,38 154,38 407,3 141,17 431,81 158 502,04 178,5 487,48 50
y7 22,06 34,16 32,29 29,99 2,23 0,14 1,09 20,97 6,43 13,29 10,61 1,2 14,68 4,43 4,29 28,64 15,39 23,44 5,84 30,6 46,37 24,95 0,86 28,89 28,4 31,72 31,21 23,02 12,64 13,69 4,33 13,62 46,5 10,23 5,08 4,35 13,92 13,03 78,1 11,39
y8 238,81 231,55 211,07 263,32 228,34 247,47 231,81 237,71 234,43 233,04 214,52 210,76 210,01 265,61 249,07 293,02 248,82 291,90 262,54 311,34 271,76 256,15 287,79 292,68 290,61 305,94 301,15 354,76 356,68 380,90 363,95 383,80 368,68 376,01 401,70 446,30 406,78 431,13 501,66 486,72
y9 21,46 31,60 32,78 32,54 4,63 3,61 3,28 20,50 8,62 11,12 9,23 2,18 10,99 2,47 2,74 24,40 14,25 22,63 6,11 29,87 45,72 24,21 3,55 28,72 28,03 30,69 27,27 21,29 17,39 15,00 7,65 16,84 47,58 12,03 1,24 4,18 12,87 11,68 77,34 9,87
y10 73,50 95,05 98,93 63,12 122,63 63,25 152,29 110,91 112,01 112,01 73,35 97,54 120,86 115,22 121,41 89,10 136,13 133,31 121,03 112,71 119,46 127,20 101,60 112,23 139,15 103,75 162,00 139,15 96,40 148,35 122,61 147,13 141,71 169,21 159,68 133,96 154,90 141,85 158,38 179,26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таблица А.2 – Выборочные данные по курсам ценных бумаг Период времени сен.03 окт.03 ноя.03 дек.03 янв.04 фев.04 мар.04 апр.04 май.04 июн.04 июл.04 авг.04 сен.04 окт.04 ноя.04 дек.04 янв.05 фев.05 мар.05 апр.05 май.05 июн.05 июл.05 авг.05 сен.05 окт.05 ноя.05 дек.05 янв.06 фев.06 мар.06 апр.06 май.06 июн.06 июл.06 авг.06 сен.06 окт.06 ноя.06 дек.06
y11 37,26 73,11 73,11 38,93 70,39 10,99 66,99 64,81 107,93 45,85 99,16 87,87 88,45 63,85 105,66 105,62 129,29 129,29 132,7 137,93 137,84 158,59 154,43 174,3 174,3 183,7 162,16 191,31 226,16 262,08 291,44 291,44 272,92 302,23 323,66 382,3 377,94 377,94 409,12 418,23
y12 17,92 32,58 32,58 51,36 113,09 137,24 151,01 157,07 236,49 223,48 282,3 284,93 328,65 406,55 367,87 370,08 430,08 430,08 395,57 428,27 490,12 502,39 528,37 592,22 592,22 594,53 599,75 625,82 681,13 731,02 694,18 694,18 745,36 790,22 772,85 869,02 871,44 871,44 878,85 898,02
y13 48,73 84,55 84,55 45,76 60,38 35,7 87,01 85,94 143,51 33,28 133,64 112,82 72,74 103,65 124,23 124,49 170,27 170,27 161,13 181,21 150,95 197,75 176,88 199,82 199,82 244,2 189,02 208,4 211,19 258,91 321,57 321,57 293,26 333,6 283,81 375,38 363,82 363,82 404,27 434,47
y14 17,69 30,95 30,95 33,72 32,16 93,02 86,57 101,94 118,75 106,07 124,24 125,72 126,31 134,17 157,67 173,4 158,34 158,34 230,67 235,01 213,47 285,03 199,19 268,18 268,18 287,37 292,67 307,94 310,86 347,52 355,1 355,1 357,05 348,87 389,7 383,26 402,61 402,61 432,87 432,19
Показатель y15 y16 73,2 239,11 93,77 232,83 93,77 232,83 99,17 210,83 64,4 262,04 123,83 227,14 64,98 245,74 150,11 233,99 110,68 237,94 113,11 233,33 110,92 234,13 72,66 215,21 95,85 212,45 119,01 211,86 114,24 266,59 120,64 249,84 86,98 295,14 86,98 295,14 135,56 249,39 132,91 292,3 121,16 262,41 112,34 311,71 119,13 272,09 126,83 256,52 126,83 256,52 102,94 286,45 112,14 292,77 138,96 290,8 103,24 306,45 160,03 303,12 138,28 355,63 138,28 355,63 98,78 354,3 149 380,25 124,27 362,29 148,74 382,19 142,25 368,14 142,25 368,14 170,11 375,11 157,76 403,62 51
y17 22,06 34,16 34,16 32,29 29,99 2,23 0,14 1,09 20,97 6,43 13,29 10,61 1,2 14,68 4,43 4,29 28,64 28,64 15,39 23,44 5,84 30,6 46,37 24,95 24,95 0,86 28,89 28,4 31,72 31,21 23,02 23,02 12,64 13,69 4,33 13,62 46,5 46,5 10,23 5,08
y18 238,81 231,55 231,55 211,07 263,32 228,34 247,47 231,81 237,71 234,43 233,04 214,52 210,76 210,01 265,61 249,07 295,14 293,02 248,82 291,90 262,54 311,34 271,76 256,15 256,52 287,79 292,68 290,61 305,94 301,15 354,76 355,63 356,68 380,90 363,95 383,80 368,68 368,14 376,01 401,70
y19 21,46 31,60 31,60 32,78 32,54 4,63 3,61 3,28 20,50 8,62 11,12 9,23 2,18 10,99 2,47 2,74 28,64 24,40 14,25 22,63 6,11 29,87 45,72 24,21 24,95 3,55 28,72 28,03 30,69 27,27 21,29 23,02 17,39 15,00 7,65 16,84 47,58 46,50 12,03 1,24
y20 73,50 95,05 95,05 98,93 63,12 122,63 63,25 152,29 110,91 112,01 112,01 73,35 97,54 120,86 115,22 121,41 86,98 89,10 136,13 133,31 121,03 112,71 119,46 127,20 126,83 101,60 112,23 139,15 103,75 162,00 139,15 138,28 96,40 148,35 122,61 147,13 141,71 142,25 169,21 159,68
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложение Б (справочное)
Список источников статистических данных При выполнении лабораторной работы студентам рекомендуется использовать статистические данные, соответствующие их учебным и научным интересам. Ниже представлен краткий список ресурсов, предоставляющих открытый доступ к данным. 1.
Федеральная служба государственной статистики РФ предоставляет
статистическую информацию на уровне РФ, федеральных округов и субъектов РФ. Режим доступа: http://www.gks.ru 2.
Инвестиционная компаний «ФИНАМ» предоставляет информацию о
котировках акций, ценах на финансовые инструменты, сырьевые ресурсы и т. д. Режим доступа: www.finam.ru 3.
Единый архив экономических и социальных данных Высшей
Школы Экономики. Режим доступа: http://sophist.hse.ru 4.
Евростат
предоставляет
информацию
по
широкому
спектру
показателей, характеризующих население, экономику и финансы, социальные условия большинства европейских стран Режим доступа: http://epp.eurostat.ec.europa.eu/portal/page/portal/statistics/themes 5.
Перечень открытых источников статистических данных на сайте,
поддерживаемым университетом Бристоля Режим доступа: http://www.economicsnetwork.ac.uk/links/data_free 6.
Анатольев С., Цыплаков А. (2009) «Где найти данные в сети?»,
Квантиль, №6, с.59-71. // С. Анатольев, А. Цыплаков. – Квантиль. – 2009. – №6 – с. 59-71. Эссе, содержащее кратко аннотированные списки веб-сайтов, на которых прикладной экономист может найти данные для исследований. Режим доступа: http://quantile.ru/06/06-AT.pdf 52
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложение В (обязательное)
Описание исключения детерминированной сезонной компоненты в Stata
Если
во
временном
ряду
имеются
сезонные
колебания,
то
перед
использованием критериев типа Дики-Фуллера необходимо устранить сезонность с помощью фиктивных переменных и далее работать с рядом остатков от соответствующей регрессии. Пусть переменная t принимает значения 1,2,3…T. Значения исследуемого временного ряда содержатся в переменной y. Имя m ранее не использовалось. Тогда в случае месячных данных используем следующие команды, в результате применения которых в переменной с именем yws будут сохранены значения исследуемого временного ряда, очищенные от сезонности:
gen m=month(dofm(t)) reg y b12.m predict yws, residuals
Для квартальных данных следует применять следующие команды:
gen q=month(dofq(t)) reg y b4.q predict yws, residuals
Следует иметь в виду, что описанная процедура исключает из данных константу – это нужно учитывать при выборе оцениваемой модели при дальнейшем применении критериев единичного корня.
53
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложение Г (обязательное)
Описание установки ado-файла для выполнения KPSS-теста В базовой версии Stata критерий KPSS не реализован. Однако можно попытаться найти дополнительные процедуры. Для этого выберем пункт меню Help – Search. В появившемся окне выберем вариант Search all, в поле введем kpss (рисунок Г.1).
Рисунок Г.1 – Ввод названия критерия для поиска
Нажмем ОК. В появившемся окне будут перечислены найденные ресурсы (рисунок Г.2).
Рисунок Г.2– Вид окна результатов поиска 54
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Нажмем на первую гиперссылку sts15_2, появится окно с описанием пакета. Нажмем на гиперссылку для установки (рисунок Г.3).
Рисунок Г.3 – Вид окна со ссылкой на установку дополнительного ado-файла
Появится окно с сообщением о том, что установка завершена и указанием пути установки (рисунок Г.4).
55
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рисунок Г.4 – Вид информационного окна после установки дополнительного ado-файла
56