Acessibilidade / Reportar erro

Estimação do parâmetro "d " em modelos arfima

Resumos

Os modelos ARFIMA caracterizam-se por sua longa dependência e por possuírem o parâmetro d do modelo ARIMA (grau de diferenciação) assumindo valores fracionários. Quando no caso d <FONT FACE=Symbol>Î</FONT> (-0,5; 0,5), há estacionariedade. A longa dependência aparece quando d é positivo. Este trabalho visa testar e comparar duas metodologias para o processo de estimação de d, baseadas na função Periodograma e na função Periodograma Suavizado. Através de séries sintéticas geradas para este fim, foram realizadas simulações em quatro diferentes estruturas ARFIMA, a saber : (0,d,0), (1,d,0), (0,d,1), (1,d,1) para três possíveis valores de d, (0,0; 0,10; 0,25 e 0,40).

ARFIMA; Longa Dependência; d Fracionário; Periodograma


ARFIMA models are characterized by both their long-range dependence and fractional values for the ARIMA model differencing parameter. Stationarity is achieved for d <FONT FACE=Symbol>Î</FONT> (-0.5, 0.5) and the long memory appears whether d is positive. This work tests and compares two methodologies for the differencing parameter estimation based on, respectively, Periodogram and Smoothed Periodogram functions. Through synthetic series generated to this purpose, simulations were ran to four different ARFIMA structures: (0,d,0), (1,d,0), (0,d,1), (1,d,1) and three values of d (0,0; 0,10; 0,25 and 0,40).

ARFIMA; Long Memory; Fractional d; Periodogram


ESTIMAÇÃO DO PARÂMETRO "d " EM MODELOS ARFIMA

Elma Suema Trevisan

Universidade Federal de Santa Maria

Departamento de Estatística - CCNE

Camobi - 97105 900 - Santa Maria, RS.

trevisan@ele.puc-rio.br

Reinaldo Castro Souza

Leonardo Rocha Souza

PUC - RJ

Resumo

Os modelos ARFIMA caracterizam-se por sua longa dependência e por possuírem o parâmetro d do modelo ARIMA (grau de diferenciação) assumindo valores fracionários. Quando no caso d Î (-0,5; 0,5), há estacionariedade. A longa dependência aparece quando d é positivo. Este trabalho visa testar e comparar duas metodologias para o processo de estimação de d, baseadas na função Periodograma e na função Periodograma Suavizado.

Através de séries sintéticas geradas para este fim, foram realizadas simulações em quatro diferentes estruturas ARFIMA, a saber : (0,d,0), (1,d,0), (0,d,1), (1,d,1) para três possíveis valores de d, (0,0; 0,10; 0,25 e 0,40).

Palavras-chave : ARFIMA, Longa Dependência, d Fracionário, Periodograma.

Abstract

ARFIMA models are characterized by both their long-range dependence and fractional values for the ARIMA model differencing parameter. Stationarity is achieved for d Î (-0.5, 0.5) and the long memory appears whether d is positive. This work tests and compares two methodologies for the differencing parameter estimation based on, respectively, Periodogram and Smoothed Periodogram functions.

Through synthetic series generated to this purpose, simulations were ran to four different ARFIMA structures: (0,d,0), (1,d,0), (0,d,1), (1,d,1) and three values of d (0,0; 0,10; 0,25 and 0,40).

Keywords: ARFIMA, Long Memory, Fractional d, Periodogram.

1. INTRODUÇÃO

Os modelos ARIMA (p,d,q), introduzidos por Box & Jenkins (1970), incluem o parâmetro d, um inteiro que estabelece o nível de diferenciações necessárias para tornar uma série temporal estacionária de 2ª ordem. Estes modelos são adequados para a modelagem do comportamento de séries temporais a curto prazo. A partir dos anos 80, Granger & Joyeux e ainda Hosking (1981) propõem uma generalização desta modelagem em relação ao parâmetro d , podendo este assumir não só valores inteiros, mas também representar graus de diferenciação fracionários.

Modelos com esta propriedade permitem estudar séries caracterizadas por longas dependências temporais. Estes modelos intitulam-se ARFIMA (p,d,q), onde F significa "fractional".

O processo Xt é um ARFIMA (p,d,q) se este é a solução da equação de diferenças:

onde :

f(B) e q(B) representam os polinômios f (Z) = 1 – f1Z...–f e q(Z) = 1–q1...–q no operador retardo B : BJ Xt = Xt-j .

O termo (1 - B)d é definido pela expansão binomial (1 - B)d =

(-1)k Bk.

{at} é um processo ruído branco onde E(at) = 0, > 0.

Se os polinômios f(z) e q(z) têm suas raízes fora do círculo unitário, e não possuem raízes comuns, o processo (1-B)dXt é estacionário (de 2ª ordem) e invertível.

Quando d = 0, Xt é um modelo autorregressivo médias móveis, ARMA (p,q).

Quando d ¹ 0 e é não-inteiro, a função de autocorrelação r(k) tem um decaimento hiperbólico, r(k) ~ e ½k½2d-1 com ½k½® ¥. As autocorrelações originadas de um modelo ARMA (p,q) têm um decaimento exponencial rk ~ ak, 0<a<1 (Box & Jenkins, 1976). Tem-se então, no caso do ARFIMA, um processo de "longa dependência", "longa persistência" ou "long memory", se 0 < d < 0,5. No caso de -0,5 < d < 0, o processo é de dependência intermediária ou "intermediate memory". Neste caso, a função de autocorrelação exibirá dependências negativas entre observações mais distantes.

No domínio da freqüência, a característica fracionária de "d" é detectada pelo comportamento da função espectral que tende ao infinito, quando a freqüência se aproxima de zero.

O objetivo do presente trabalho é testar e comparar duas metodologias utilizadas no processo de estimação de "d": o método da regressão utilizando a função periodograma, e o método de regressão utilizando a função periodograma suavizado.

Para tanto, foi realizado um estudo baseado na simulação das seguintes estruturas de séries temporais:

1. ARFIMA (1,d,0), modelo autorregressivo fracionário, com coeficientes f = -0,9; f = -0,5; f = 0,3; f = 0,8, e o grau de diferenciação "d" assumindo quatro valores distintos, d =0,0; d = 0,10, d = 0,25 e d = 0,40.

2. ARFIMA (0,d,1), modelo médias móveis fracionário, com coeficientes q = -0,9 ; q =-0,5; q = 0,3 ; q = 0,8 , e com d assumindo quatro valores, d = 0,0; d = 0,10 ; d = 0,25 ; d = 0,40.

3. ARFIMA (0,d,0), modelo ruído branco fracionário, onde d assume também os valores d = 0,0; d = 0,10 ; d = 0,25 ; d = 0,40.

4. ARFIMA (1,d,1), modelo autorregressivo médias móveis fracionário, com o vetor de coeficientes [f q ] adotando os valores [-0,9 0,3]; [-0,5 0,8]; [0,3 -0,9]; e [0,8 -0,5] , e o grau de diferenciação d assumindo também quatro valores, a saber, d = 0,0; d = 0,10; d = 0,25 e d = 0,40.

Foram geradas, para cada modelo, 1000 replicações de séries de tamanho 200, 500 e 1000. O método usado para a geração das mesmas é o algoritmo de Durbin-Levinson, baseado na distribuição de Xt condicional às observações Xt-1, Xt-2, ..., X1. Para isso, neste algoritmo, é utilizada a função de autocorrelação parcial, que é calculada recursivamente a partir da função de autocovariância. Neste trabalho, utiliza-se a abordagem de Hosking, que aproveita a fórmula simples da autocorrelação parcial do modelo ARFIMA (0,d,0), para reduzir o tempo computacional usualmente gasto no cálculo recursivo da mesma (detalhes em Hosking, 1982, 1984). De fato, a função de autocorrelação parcial do modelo ARFIMA (0,d,0) para o lag k é dada por kk = d/(k-d).

Os diferentes tamanhos de série usados têm o objetivo de permitir a observação empírica do comportamento assintótico dos estimadores.

2. MÉTODOS DE ESTIMAÇÃO DO PARÂMETRO d

2.1. Análise espectral de um processo estacionário

Seja {Xt} um processo estacionário com as autocovariâncias gk, absolutamente convergentes, isto é, S½rk½< ¥

A função espectral de {Xt} é dada por:

(3) é deduzido de (2), usando-se as seguintes propriedades :

gi = g-i

sen(-wk) = -sen(wk)

cos(-wk) = cos(wk)

2.2. Função espectral do modelo ARMA

Se {Xt} é um processo ARMA (p,q) da forma Fp(B)(Xt – m) = qq(B)et , com média zero e variância I*(w), sua função espectral é dada por:

onde :

Fp e Qq são polinômios do processo ARMA (p,q) , e

é a variância do ruído branco at

2.3. Espectro de um ARFIMA (p,d,q)

Se o processo Zt é modelado por um ARFIMA (p,d,q), tem-se f(B).(1 - B)dZt = q(B)at. Considerando-se o modelo particionado em : (1 - B)dXt = Ut e f(B)Ut = q(B)at, pode-se calcular a densidade espectral de Zt por:

Levando-se em consideração os resultados acima, tem-se :

Logaritmando e rearranjando-se os termos da equação acima, chega-se à seguinte expressão final para fz(w):

2.4. A função periodograma

Seja o conjunto de observações X1, X2, ..., Xn de um processo {Xt}, a função periodograma I(w), definida para todo w Î [–p,p] é definida por:

onde : R(k) é a função de autocovariância amostral do processo.

onde : I*(w) é um estimador assintoticamente não viciado de f(w)

2.5. Função periodograma suavizado

Um estimador alternativo do espectro f(w) é a função periodograma suavizado, que é um estimador consistente da função espectral (Priestley, 1981).

A função fs(w) é definida por:

onde l(k) é a "função de suavização" ou "janela espectral" do periodograma.

Diferentes formas da função l(k) são sugeridas na literatura de séries temporais. No caso, foi escolhida a Janela de Parzen, devido ao fato de esta possuir a propriedade de produzir somente estimativas positivas da densidade espectral (ver Reisen, 1995, para detalhes).

3. ESTIMAÇÃO DE "d"

Seja {Xt} um processo ARFIMA (p,d,q) com d Î (-0,5; 0,5), representado por (1 - B)dXt = Ut, onde f(B)Ut = q(B)at, e {at} é um processo ruído branco.

A função espectral de {Xt} é dada por:

onde fu(w) é a função espectral de Ut.

Logaritmando-se a expressão (11), obtém-se :

Da equação (13), obtém-se as duas equações de regressão que serão usadas no processo de estimação de d,, usando o periodograma e o periodograma suavizado.

3.1. Estimação usando a função periodograma

Substituindo-se, na equação (13), w por wj = e adicionando-se ln(I(wj)), tem-se:

equação esta que pode ser colocada sob a forma de uma equação de regressão simples:

onde : Yj = ln I (wj);
xj = ln(2sen(wj /2))2;
ej = ln(I(wj) / f (wj)+c;
b = –d;
a = ln fu (0) – c
c = E(–ln(I(wj) / f (wj))

A equação de regressão fornecerá como estimador de d o coeficiente angular b multiplicado por -1, isto é:

3.2. Estimação usando a função periodograma suavizado

Será usada, como estimador alternativo da função densidade espectral f (w), a função periodograma suavizado :

onde l(k) é uma janela (lag window).

Usando-se as propriedades assintóticas de fs(W) e restringindo-se o domínio de j,1 £ j £ g(n) , pode-se escrever a equação de regressão na forma:

Esta equação pode ser colocada sob a forma de uma equação de regressão simples:

onde :

xj = ln(2sen(wj /2))2;

ej = ln(fs(wj) / f (wj)+c;

b = –d;

a = ln fu (0) – c

c = E(–ln(I(wj) / f (wj))

A equação de regressão fornecerá também, como estimador de "d", o coeficiente angular b multiplicado por -1, isto é:

4. Resultados obtidos através da simulação

Os resultados obtidos das estimações simuladas, com os diversos modelos ARIMA(p,d,q), variando os valores de d, d = 0,0; d = 0,10; d = 0,25; d = 0,40, são mostrados nas tabelas a seguir. Estes resultados referem-se ao viés e ao desvio-padrão dos estimadores, e permitem estabelecer-se comparações entre os métodos de regressão utilizando a função periodograma, e o método de regressão usando a função periodograma suavizado. Notar que os resultados relativos ao ARFIMA (0,d,0) estão nas tabelas referentes ao ARFIMA (1,d,0), com  = 0.

5. Conclusões

Das análises dos desempenhos dos estimadores, ao se usar o periodograma e o periodograma suavizado, conclui-se que:

No modelo Ruído Branco (tabelas 1,2 e 3), para todos os tamanhos de amostra, observa-se que a função periodograma suavizado ocasiona menores vícios e desvios padrões. O aumento amostral provoca uma diminuição do vício e também uma diminuição do valor do desvio padrão.

A análise dos modelos ARFIMA (1,d,0), observada nas tabelas 1, 2 e 3, também evidencia menores vícios de estimação e menores desvios padrões, para todos os valores do parâmetro f , nas estimações via periodograma suavizado. Observa-se também que os vícios dos estimadores aumentam consideravelmente com o crescimento do coeficiente f , quando este é positivo. Quando o mesmo é negativo, a estimação não é afetada.

Os modelos ARFIMA (0,d,1), cujas estatísticas encontram-se descritas nas tabelas 4, 5 e 6, evidenciam também que as estimações obtidas pelo periodograma suavizado forneceram menores vícios e menores desvios padrões.

Ao se considerar os componentes autorregressivos e médias móveis simultaneamente, através do modelo ARFIMA (1,d,1), cujas estatísticas encontram-se descritas nas tabelas 7, 8 e 9, percebe-se novamente que as estatísticas obtidas pela estimação via periodograma suavizado são menores. No caso de N = 1000, o menor vício encontrado foi na estimação de d = 0,25, para f = - 0,9 e q = 0,3. Para o modelo ARFIMA (1,d,1), não foi observada subestimação do parâmetro d para os coeficientes f = 0,8 e q = - 0,5.

Em todos os casos, o vícios e os desvios padrões dos estimadores decresceram com o aumento amostral. Observou-se também que os parâmetros positivos ocasionam maiores vícios.

Em todos os modelos simulados, há uma tendência geral dos desvios padrões das estimações, via função periodograma suavizado, serem em média duas vezes menor do que as obtidas nas estimações com função periodograma.

Observa-se, em geral, através da grande ocorrência de vieses negativos, uma tendência de subestimação do parâmetro d, principalmente para valores baixos (d = 0,00 e d = 0,10).

Na totalidade dos casos de estimação, os coeficientes dos modelos ARFIMA têm o mesmo comportamento próximo à região de não-estacionariedade, isto é, observa-se também um aumento gradual do viés (bias), à medida que aumenta o valor dos coeficientes.

6. Referências Bibliográficas

  • Beran, Jan (1994). Statistics for long-memory process. Chapman & Hall. New York.
  • Crato, N. & Ray, B. K.(1996). Model selection and forecasting for long-range dependent processes. Journal of Forecasting, Vol. 15, 107 125.
  • Granger, C. W. J. e Joyeux, R. (1980). An introduction to long-memory time series models and fractional differencing. Journal of Time Series Analysis, 1, 15-29.
  • Hosking, J. (1982). Some models of persistence in time series analysis: theory and practice 1 North Holland Publishing Company, 641-653.
  • Hosking, J. (1984). Modelling persistence in hydrological time series using fractional differencing. Water Resources Research, Vol. 20, No. 12, 1898-1908.
  • Pęgo, A.F.S.(1990). Modelagem de Persistęncia a longo prazo em séries temporais. Instituto de Matemática Pura e Aplicada. Rio. Dissertaçăo de Mestrado.
  • Priestley. M.B.(1981). Spectral Analysis in Time Series. Vol. 1 e 2. Academic Press.
  • Reisen, V. A.(1994). Estimation of the fractional difference parameter in the ARIMA(p,d,q) model using the smoothed periodogram. Journal of the Time Series Analysis Vol 15, nş 3, May 1994, 335-350.
  • Reisen, V. A. (1995).ARFIMA O modelo ARIMA para o d fracionário. 6Ş Escola de Séries Temporais. Vitória, ES.
  • Trevisan, E. S., Souza, L. R., Souza, R. C. (1996). Uma simulaçăo na estimaçăo do parâmetro "d" em modelos Arfima (p,d,q). Anais. 7ş Congresso da APDIO IO 96. Universidade de Aveiro, PO.

Datas de Publicação

  • Publicação nesta coleção
    27 Maio 2003
  • Data do Fascículo
    Jun 2000
Sociedade Brasileira de Pesquisa Operacional Rua Mayrink Veiga, 32 - sala 601 - Centro, 20090-050 Rio de Janeiro RJ - Brasil, Tel.: +55 21 2263-0499, Fax: +55 21 2263-0501 - Rio de Janeiro - RJ - Brazil
E-mail: sobrapo@sobrapo.org.br