Acessibilidade / Reportar erro

Aplicação da Distribuição Nakagami na Análise de Dados de Precipitação

The Nakagami Distribution Applied in Precipitation Data Analysis

Resumo

Este trabalho teve como objetivo avaliar o desempenho da distribuição Nakagami na análise de séries de precipitação mensal, ao longo de vários anos, visando à seleção de uma distribuição útil para o planejamento e gestão de atividades dependentes dos índices de precipitação na Região Sul do Brasil. Para tanto, compara-se a mesma com cinco distribuições alternativas: Weibull, Gama, Log-Normal, Log-Logística e Inversa-Gaussiana. Foram utilizadas séries históricas de 33 estações meteorológicas observadas entre janeiro de 1970 a dezembro de 2014, totalizando 396 séries (33 estações × 12 meses). Para a escolha da distribuição, que forneceu o melhor ajuste, foram utilizados os valores dos critérios de informação de Akaike, de Kolmogorov-Smirnov, de Anderson-Darling e de Cramér-von Mises. Segundo estes critérios se encontrou que as distribuições Nakagami e Weibull foram selecionadas o maior número de vezes (Nakagami: 146 vezes e Weibull: 100 vezes). Embora a distribuição Nakagami não seja muito utilizada, na descrição de dados de precipitação, recomenda-se sua utilização na descrição do comportamento da pluviosidade mensal como alternativa para distribuições tradicionalmente utilizadas.

Palavras-chave:
ajuste de distribuições; variações climáticas; dados de precipitação; distribuição Nakagami; verossimilhança

Abstract

This research had as its objective evaluating if Nakagami distribution achieves in precipitation data analysis, by considering monthly data series over several years, in an attempt to select a useful distribution that helps in the management and administration of those activities that depends on Southern Brazil precipitation index. For this purpose Nakagami distribution was compared with five alternatives: Weibull, Gamma, Log-Normal, Log-Logistic e Inverse-Gaussian. In the analysis, data series belonging to 33 weather stations between January 1970 and December 2014 were used, amounting 396 data series (33 weather × stations 12 months). In order to choose the best distribution were used the Akaike Information, the Kolmogorov-Smirnov, then Anderson-Darling and the Cramér-von Mises criterions. According to these criterions, it can be found that Nakagami and Weibull distributions were selected the greatest number of times (Nakagami: 146 times and Weibull: 100 times). Even though Nakagami distribution is not too used in rain precipitation data description, we recommend its application in the description of monthly precipitation behavior as an alternative of distributions that have been traditionally applied.

Keywords:
climate variation; distributions adjustment; maximum likelihood; Nakagami distribution; precipitation data

1.

Introdução

A Região Sul do Brasil tem grande parte de sua economia baseada na produção agropecuária, o que gera preocupações em torno das variações climáticas ao longo do ano. A intensidade e a frequência com que os fenômenos climáticos ocorrem influenciam diretamente a susten­tabilidade ambiental e econômica dos setores do agronegócio (Beyruth, 2008BEYRUTH, Z. água, agricultura e as alterações climáticas globais. Rev. Tec. & Agrop., 318 n. 6, p. 74-89, 2008.).

Para realização de estudos com variáveis climáticas, a World Meteorological Organization (WMO) recomenda séries históricas com o mínimo de trinta anos. De maneira geral, dentre os elementos climáticos, é possível observar que a precipitação é o elemento que possui menor precisão das estimativas tomando como base trinta anos de observação (Cargnelutti Filho et al., 2009CARGNELUTTI-FILHO, A.; MATZENAUER, R.; MALUF, J.R.T.; RADIN, B. Variabilidade temporal e espacial da precisão das estimativas de elementos meteorológicos no Rio Grande do Sul. Cienc. Rural., v. 39, n. 4, p. 962-970, 2009.). Um estudo recente observou que trinta anos são suficientes para prever a precipitação na maioria dos meses do ano, com exceção de junho, julho e agosto, uma vez que para esses meses podem ser necessários até sessenta e três anos (Torres et al., 2016TORRES, F.E.; CARGNELUTTI FILHO, A.; TEODORO, P.E.; CORRêA, C.C.G.; RIBEIRO, L.P.; CUNHA, E.R. Dimensionamento amostral para a estimação da média de precipitação pluvial mensal em locais do Estado do Mato Grosso do Sul. Cienc. Rural, v. 46, n. 1, p. 60-69, 2016.).

A caracterização da distribuição da precipitação cons­titui um importante instrumento de apoio para estudos e desenvolvimento de cultivares. Para descrever dados de precipitação e compreender esse fenômeno climatológico, ao longo do tempo, um grande número de distribuições de probabilidades vem sendo utilizado. O estudo da distribuição de variáveis climáticas determina padrões de ocorrência, permitindo uma previsão razoável do comportamento climático de uma região (Dourado Neto et al., 2005DOURADO NETO D.; ASSIS, J.P. de; TIMM, L.C.; MANFRON, P.A.; SPAROVEK, G.; FARAWAY, J.; MARSAGLIA, G.; MARSAGLIA, J.; BADDELEY, A. Goftest: Classical Goodness-of-Fit Tests for Univariate Distributions. R package version 1.0-2. 2014. Disponível em: URL http://CRAN.R-project.org/package=goftest. Acesso em: 30 de abr. 2015.
http://CRAN.R-project.org/package=goftes...
).

As distribuições de probabilidade como a Weibull, a Gama, a Log-Normal, a Log-Logística e a Inversa-Gaussiana, geralmente especificadas por dois parâmetros, são tradicionalmente usadas na modelagem de dados de natu­reza climática (Coe e Stern, 1982COE, R.; STERN, R.D. Fitting models to daily rainfall data. J. Appl. Meteorol., v. 21, n. 7, p. 337 1024-1031, 1982.). Ramos e Moala (2014)RAMOS, P.L.; MOALA, F.A. A aplicação da distribuição exponen­cial geométrica estendida para modelagem de dados plu­viométricos. Rev. bras. meteorol., v. 29, n. 4, p. 613-620, 2014. comparam as distribuições Gama, Weibull e Log-Normal com a distribuição Exponencial Geométrica Estendida mostrando que essa distribuição, menos usual para dados climatológicos, pode ser aplicada com sucesso em dados de precipitação. Uma família de distribuições também muito utilizada, só que em geral na modelagem de extremos, é a distribuição Valor Extremo Generalizada (Kotz e Nadarajah, 2000KOTZ, S.; NADARAJAH, S. Extreme value distributions. London: Imperial College Press. 2000).

Por outro lado, o mesmo não ocorre com a distribuição Nakagami, cujas aplicações se concentram, principalmente, na área de engenharia de comunicações. Essa distribuição foi proposta pela primeira vez por Nakagami, em 1960NAKAGAMI, M., The m-distribution - A general formula of intensity distribution of rapid fading. In: HOFFMAN, W. C. (Ed.), Statistical Methods in Radio Wave Propagation. Pergamon, 1960. p. 3-36., para descrever a propagação de ondas e, atualmente, é muito utilizada para modelar ambientes micro celulares e celulares, nos quais há desvanecimento rápido (Antônio, 2003ANTôNIO, J.R. área de cobertura em ambiente de propagação modelado com a distribuição k-u. 2003. 88 p. Dissertação (Mestrado em Engenharia Elétrica) - Instituto Nacional de Telecomunicações (INATEL), Santa Rita do Sapucaí. 2003. Disponível em: http://www.wisstek.org/ie708/Jamil.pdf. Acesso em: 10 jan. de 2016
http://www.wisstek.org/ie708/Jamil.pdf...
). Se comparada com outras distribuições, a distribuição Nakagami é bastante simples e flexível em termos do comportamento de sua função densidade de probabilidade. No entanto, para va­riáveis climatológicas, esta distribuição parece ser pouco usual, principalmente, para dados de precipitaçãoque não constam na literatura em nenhuma aplicação.

Baseado nessas informações, este trabalho teve como objetivo avaliar o desempenho da distribuição Nakagami na análise de séries de precipitação mensal ao longo dos anos. Para tanto, o presente estudo comparou o uso da distribuição Nakagami como alternativa para cinco distribuições convencionais: Weibull, Gama, Log-Normal, Log-Logística e Inversa-Gaussiana.

2.

Material e Métodos

2.1.

Os dados

Foram utilizadas 396 séries históricas da precipitação mensal de 33 estações meteorológicas localizadas na Região Sul do Brasil: Paraná (8 estações, 96 séries), Santa Catarina (7 estações, 84 séries) e Rio Grande do Sul (18 estações, 216 séries). As séries foram obtidas no Portal do Instituto Nacional de Meteorologia (INMET), no qual são disponibilizadas séries históricas de 265 estações meteorológicas convencionais do Brasil. Na Tabela 1 apresenta-se o código WMO, a latitude e a longitude das estações utilizadas.

De cada estação foram geradas doze séries para cada ano, uma para cada mês, com período de observação compreendido ente janeiro de 1970 a dezembro de 2014, totalizando 44 anos. Possivelmente, por algum problema operacional nas estações, as séries utilizadas não possuem o mesmo número de observações e variam de 22 a 44, com mediana de 39 observações.

Tabela 1
Número das estações meteorológicas e suas respectivas coordenadas geográficas situadas na região sul do Brasil.

Antes de conduzir o ajuste e a discriminação das distribuições foram avaliadas a validade das suposições de homogeneidade (as observações são identicamente distribuídas) e aleatoriedade (as observações são independentes), respectivamente, pela aplicação dos testes de Von-Neumann (Kangand e Yusof, 2012KANG, H.M.; YUSOF, F. Homogeneity tests on daily rainfall series in peninsular malaysia. Int. J. Contemp. Math. Sci., v. 7, n. 1, p. 9-22, 2012.; Buishand, 1982BUISHAND, T.A. Some methods for testing the homogeneity of rainfall records. J. Hydrol., v. 58, n. 1-2, p. 11-27, 1982.) e Wald-Wolfowitz (Gibbons e Chakraborti, 20011GIBBONS, J.D.; CHAKRABORTI, S. Nonparametric statistical inference, 5th Edition. Statistics: Textbooks and Monographs. Boca Raton: CRC Press. 2011.).

O método da máxima verossimilhança foi o método adotado para a obtenção das estimativas dos parâmetros, enquanto que a qualidade do ajuste da distribuição selecionada, segundo os critérios descritos abaixo, foi avaliada a partir da aplicação dos testes: Kolmogorov-Smirnov, Anderson-Darling e Cramér-von Mises. Na avaliação da qualidade do ajuste, por esses critérios, pelo menos um deles não rejeitou o ajuste da distribuição selecionada em nível de significância de 5%.

Utiliza-se a função mledist da biblioteca fitdistrplus (Delignette-Muller e Dutang, 2015DELIGNETTE-MULLER, M.L.; DUTANG, C. Fitdistrplus: An R package for fitting distri-butions. J. Stat. Software, v. 64, n. 4, p. 1-34. 2015), do ambiente R, para encontrar as estimativas de máxima verossimilhança e os valores das estatísticas usadas na discriminação das seis distribuições. Os valores-p associados aos testes Kolmogorov-Smirnov, Anderson-Darling e Cramér-von Mises foram calculados pelas funções ks.test, ad.test e cvm.test, disponíveis na biblioteca goftest (Faraway et al., 2014DOURADO NETO D.; ASSIS, J.P. de; TIMM, L.C.; MANFRON, P.A.; SPAROVEK, G.; FARAWAY, J.; MARSAGLIA, G.; MARSAGLIA, J.; BADDELEY, A. Goftest: Classical Goodness-of-Fit Tests for Univariate Distributions. R package version 1.0-2. 2014. Disponível em: URL http://CRAN.R-project.org/package=goftest. Acesso em: 30 de abr. 2015.
http://CRAN.R-project.org/package=goftes...
). A biblioteca randtests (Caeiro e Mateus, 2014CAEIRO, F.; MATEUS, A. Randtests: Testingrandomness in R. R package version 1.0. 2014. Disponível em: URL http://CRAN.R-project.org/package=randtests. Acesso em: 30 de abr. 2015.
http://CRAN.R-project.org/package=randte...
) foi utilizada na aplicação dos testes de homogeneidade e de aleatoriedade.

2.2

As distribuições

Para análise da pluviosidade total mensal são consideradas, além da distribuição Nakagami, as distribuições Weibull, Gama, Log-Normal, Log-Logística e Inversa-Gaussiana. A seguir são descritas todas elas, enfatizando a distribuição Nakagami, objeto de estudo do presente artigo.

2.2.1

A Distribuição de Nakagami

Uma variável aleatória não negativa X com distribuição Nakagami tem, respectivamente, função de densidade e de distribuição escritas nas formas:

(1) f ( x | α , θ ) = 2 γ ( α ) ( α θ ) α x 2 α 1 exp [ α θ x 2 ]

e

(2) F ( x | α , θ ) = γ ( α θ x 2 , α , 1 )

em que θ > 0 é o parâmetro de escala, α 0.5 é o parâmetro de forma, γ. é a função gama e γ.,a,b é a função de distribuição acumulada de uma variável aleatória com distribuição Gama, com parâmetro de forma a e escala b. Para α=1 tem-se a distribuição seminormal e para α=0.5 a distribuição Rayleigh. A partir do método de transformação de variáveis aleatórias é possível mostrar que se, XNakagamiθ,α então Y=X2 tem distribuição Gama com parâmetro de escala θα e parâmetro de forma α .

O momento de ordem k da distribuição Nakagami é dado por:

(3) E ( X k ) = γ ( α + 0.5 k ) γ ( α ) ( θ α ) k .

Em particular, para k=1,2 tem-se:

(4) E ( X ) = γ ( α + 0.5 ) γ ( α ) θ α

e

(5) E ( X 2 ) = θ .

Consequentemente:

(6) V ( X ) = θ [ 1 1 α ( γ ( α + 0.5 ) γ ( α ) ) 2 ] .

Dado um conjunto de observações independentes, x=x1,,xn e supondo que estas são realizações de uma variável aleatória X com distribuição Nakagami θ,α, tem-se que as estimativas de θ e α podem ser encontradas a partir do método da máxima verossimilhança.

De (1) tem-se a função de verossimilhança:

(7) L ( α , θ | x ) = [ 2 γ [ α ] ( α θ ) α ] n π i = 1 n x i 2 α 1 exp [ α θ i = 1 n x i 2 ]

cujo logaritmo pode ser escrito na forma:

(8) l ( α , θ | x ) = n log [ 2 γ [ α ] ( α θ ) α ] + ( 2 α 1 ) i = 1 n log ( x i ) α θ i = 1 n x i 2 .

As estimativas de máxima verossimilhança de θ e α são obtidas pela maximização da função de verossimilhança ou log-verossimilhança. Explicitamente, (8) é maximizada resolvendo, simultaneamente em α e, θ o sistema formado pelas equações αlα,θ|x=0 e θlα,θ|x=0 em que:

(9) α l ( α , θ | x ) = n [ 1 + log ( α θ ) ψ ( α ) ] + 2 i = 1 n log ( x i ) + 1 θ i = 1 n x i 2 ,
(10) θ l ( α , θ | x ) = n a θ + a θ 2 i = 1 n x i 2

e que ψα=ddαlogγα é a função digama.

A partir da Eq. (10) se tem que, θ^=1ni=1nxi2 enquanto que α^ é obtido numericamente a partir da equação:

(11) n [ log ( α ) n log ( θ ^ ) ψ ( α ) ] + 2 i = 1 n l o g ( x i ) = 0.

As estimativas intervalares para θ e α podem ser obtidas a partir da normalidade assintótica dos estimadores de má­xima verossimilhança e pela propriedade de invariância, funções de θ e α, diga-se, gα,θ são estimadas por gα^,θ^ . Por exemplo, a média, EX é estimada por E^X=γα^+0.5γα^θ^α^ enquanto que a estimativa de VarE^X é calculada a partir da aplicação do método delta (Casella e Berger, 1990CASELLA, G.; BERGER, R.L. Statistical inference. Série: Statistics/Probability Serie, Ed. Wadsworth \& Brooks/Cole Advanced Books \& Software, Pacific Grove, CA. 1990).

Em se tratando de dados de precipitação total (diária, decendial, mensal, etc.), a precipitação total mais provável ou máxima no período, representada aqui por, Xmax obtida da equação, ddXmaxfXmax|α^,θ^=0 e estimada por X^max=θ^(2α^12α^) .

2.2.2.

As demais distribuições

A título de avaliar a eficiência da distribuição Nakagami, na descrição de dados de precipitação, a mesma foi comparada com cinco distribuições comuns na análise de dados de precipitação, sendo essas: Weibull, Gama, Log-Normal, Log-Logística e Inversa-Gaussiana, resumidamente caracterizadas a seguir pela função de densidade, média e moda, representada por Xmax .

Distribuição Weibull:

(12) f ( x | α , θ ) = α θ α x α 1 exp [ ( x θ ) α ] ,

E(X)=θγ(α+1α) e , para α >1, Xmax=θ(α1α).

Distribuição Gama:

(13) f ( x | α , θ ) = 1 θ α γ ( α ) x ( α 1 ) exp ( x θ ) ,

E(X)=αθ e para α>1, Xmax=θ(α1)

Distribuição Inversa-Gaussiana:

(14) f ( x | α , μ ) = α 2 π x 3 exp [ α ( x μ ) 2 2 μ 2 x ] ,

E ( X ) = μ e X max = μ 1 + 9 μ 2 4 α 2 3 μ 2 2 α .

Distribuição Log-Logística:

(15) f ( x | α , θ ) = α θ α x α 1 [ 1 + ( x θ ) α ] 2 ,

E(X)=θπαsen(πα), e para α>1, Xmax=θ(α1α+1)1α

Distribuição Log-Normal:

(16) f ( x | μ , θ ) = 1 2 π θ x exp [ 1 2 ( log ( x ) μ θ ) 2 ] ,

E(X)=exp(μ+0.5θ2) e Xmax=exp(μθ2).

Vale lembrar que os parâmetros, θ>0, α>0 e μ>0 descrevem, respectivamente, a escala, a forma e a locação destas distribuições. Apenas na distribuição Log-Normal o parâmetro μ tem suporte nos números reais.

Uma caracterização completa destas distribuições apresentadas pode ser encontrada, por exemplo, em Johnson et al. (1994JOHNSON, N.L.; KOTZ, S.; BALAKRISHNAN, N. Continuous univariate distributions. v. 1, 2ed. New York: Wiley-Interscience Publication. 1994. e 1995JOHNSON, N. L.; KOTZ, S.; BALAKRISHNAN, N. Continuous univariate distributions. v. 2, 2ed. New York: Wiley-Interscience Publication. 1995.).

2.3.

Os critérios de discriminação

Depois de estimados os parâmetros das distribuições candidatas pelo método da máxima verossimilhança foram utilizados quatro critérios para a escolha da distribuição com melhor ajuste. A distribuição escolhida foi a que mais vezes se mostrou vencedora, segundo os valores das quatro estatísticas descritas no decorrer desta seção.

Dado um conjunto de observações, x=x1,,xn representando a precipitação total mensal, e as seis distribuições concorrentes, decidiu-se em favor de uma delas, a partir dos valores das estatísticas:

  • Critério de informação de Akaike: AIC=2l+2p;

  • Kolmogorov-Smirnov: KS=max1 i n(z^iin, inz^i) para i=1, ..., n ;

  • Anderson-Darling: AD=n1ni=1n(2i1)[log(z^i)+log(1z^n+1i)];

  • Cramér-von Mises:

    CvM=112n+i=1n(z^i2i12n)2.

Nestas expressões se tem que l é a verossimilhança localmente nas estimativas dos parâmetros, n é o tamanho da amostra, p o número de parâmetros, x(i) a i-ésima estatística de ordem da amostra e z^i=Fx(i) é a estimativa da função de distribuição. Para todos os critérios decide-se em favor da distribuição que apresenta o menor valor da estatística.

Além do critério de informação de Akaike (1974)AKAIKE, H. A new look at the statistical model identification. IEEE Trans. Automat. Contr., v. 19, n. 6, p. 716-723, 1974. encontra-se na literatura, dentre outros, o critério de informação de Akaike corrigido, AICc=2n+2npnp1, o critério de informação de Hannane-Quinn (1979)HANNAN, E.J.; QUINN, B.G. The determination of the order of an autoregression. Journal of the Royal Statistical Society. Series B. Methodological, v. 41, n. 2, p. 190-195, 1979., HQIC=2l+2ploglogn o critério de informação de Akaike consistente, CAIC=2l+plogn+1 e o critério de informação de Schwarz (1978)SCHWARZ, G. Estimating the dimension of a model. The Annals of Statistics, v. 6, n. 2, p. 461-464, 1978., BIC=2l+plogn.

Neste artigo, como as distribuições rivais são especificadas pelo mesmo número de parâmetros se pode, simplesmente, usar como critério de seleção o valor de - 2l. Sob esta circunstância, as estatísticas AIC, AICc, HQIC, CAIC, BIC e - 2l sempre irão selecionar a mesma distribuição.

Embora as estatísticas de Kolmogorov-Smirnov, Anderson-Darling e Cramér-von Mises sejam, geralmente, usadas para avaliar a plausibilidade de uma dada distribuição, elas também podem ser usadas na escolha de uma dentre duas ou mais distribuições concorrentes. Ao leitor interessado em detalhes destas estatísticas se recomenda, entre outros, D’Agostino e Stephens (1986)D’AGOSTINO, R.B.; STEPHENS, M.A. Goodness-of-fit techniques. Statistics: Textbooks and Monographs. v. 68. New York, Marcel Dekker, 1986. e Stephens (1974)STEPHENS, M.A. EDF statistics for goodness of fit and some com­parisons. J. Am. Stat. Assoc., v. 69, n. 347, p. 730-737, 1974..

3.

Resultados e Discussões

A primeira avaliação realizada nos dados ocorreu quanto à validação das suposições de homogeneidade e de aleatoriedade. Todas as 396 séries foram submetidas aos testes de Von-Neumann e Wald-Wolfowitz. Apresenta-se, na Tabela 2, a distribuição do nível mínimo de significância associado a ambos os testes. Em nível de significância de 5%, 23(26) séries não satisfizeram a suposição de homogeneidade(aleatoriedade). Esses números representam 5.8% e 6.6% das 396 séries. No geral, 37 séries, 9.3%, não satisfizeram a suposição de homogeneidade, de aleatoriedade ou ambas.

Tabela 2
Distribuição do nível mínimo de significância associado aos testes Von-Neumann e Wald-Wolfowitz.

Em adição aos testes Von-Neumann e Wald-Wolfowitz foram aplicados os testes de Bartels (Bartels, 1982BARTELS, R. The rank version of von Neumann’s ratio test for randomness. J. Am. Stat. Assoc., v. 77, n. 377, p. 40-46, 1982.) e Mann-Kendall (Mann, 1945MANN, H.B. Nonparametric tests against trend. Econometrica, v. 13, n. 3, p. 245-259, 1945.; Kendall e Gibbons, 1990KENDALL, M.; GIBBONS, J.D. Rank correlation methods, 5th Edition. A Charles Griffin Title. Edward Arnold, London. 1990.). As conclusões oriundas dos mesmos corroboram as conclusões obtidas com os testes de Von-Neumann e Wald-Wolfowitz; por esse motivo, seus resultados não são reportados. Uma detalhada revisão desses e vários outros testes é apresentada em Machiwal e Jha (2012MACHIWAL, D.; JHA, M.K. Hydrologic time series analysis: theory and practice. Springer, Dordrecht; Capital Publishing Company, New Delhi, 2012., Capítulo 4, página 51).

Nas Tabelas 3 e 4 são apresentados o número e a porcentagem de vezes que cada uma das seis distribuições foi selecionada, segundo os quatro critérios de discriminação. Na Tabela 3 foram consideradas todas as 396 séries, enquanto que na Tabela 4 constam somente as 359 séries que passaram, simultaneamente, nos testes de Von-Neumann e Wald-Wolfowitz (homogeneidade e aleato­riedade, respectivamente).

Com relação à qualidade do ajuste, avaliada pelos testes de Kolmogorov-Smirnov, Anderson-Darling e Cramér-von Mises se constata que o número de vezes que a distribuição obteve maior valor-p coincidiu com os valores observados nas Tabelas 3 e 4.

Tabela 3
Número de séries (porcentagem) em que as distribuições de probabilidade (Weibull, Gamma, LogN, Log-Log, IGauss, Nakagami) foram selecionadas (vencedoras) em cada critério de seleção: Akaike (AIC), Kolmogorov-Smirnov (KS), Anderson-Darling (AD) e Cramér-von Mises (CvM), dentre as 396 séries utilizadas. Números marcados em negrito indicam a distribuição vencedora em cada critério de seleção.
Tabela 4
Número de séries (porcentagem) em que as distribuições de probabilidade (Weibull, Gamma, LogN, Log-Log, IGauss, Nakagami) foram selecionadas (vencedoras) em cada critério de seleção: Akaike (AIC), Kolmogorov-Smirnov (KS), Anderson-Darling (AD) e Cramér-von Mises (CvM), somente das séries que passaram, simultaneamente, nos testes de von-Neumann (homogeneidade) e Wald-Wolfowitz (aleatoriedade). Números marcados em negrito indicam a distribuição vencedora em cada critério de seleção.

Na Tabela 5 apresentam-se os números de séries que não rejeitaram, para um nível de significância de 5%, a distribuição ajustada como sendo apropriada. é importante observar o que ocorreu com as distribuições Weibull e Nakagami. Estas distribuições não foram rejeitadas ne­nhuma vez, ou seja, pelo ajuste, foram vencedoras em todas as séries utilizadas, 396 vezes (33 estações × 12 meses). Segundo os critérios utilizados na discriminação se encontra que as distribuições Nakagami e Weibull foram as distribuições selecionadas o maior número de vezes. Das 396 séries, a distribuição Nakagami foi selecionada 146 vezes, seguida da Weibull selecionada 100 vezes. Observa-se também que a escolha está relacionada ao critério de discriminação utilizado. O mesmo fato foi observado por Ashkar e Zoglat (1997)ASHKAR, F.; ZOGLAT A.M. On the discrimination between statistical distributions for hydrological frequency analysis. In: CSCE ANNUAL CONFERENCE. Major Public Works: Key Technologies for the 21st Century, Quebec, 1997. p. 169-178. Em Ashkar e Aucoin (2012)ASHKAR, F.; AUCOIN, F. Choice between competitive pairs of frequency models for use in hydrology: a review and some new results. Hydrol. Sci. J. v. 57, n. 6, p. 1092-1106, 2012. é apontado que a razão das veros­si­mi­lhanças maximizadas e o critério baseado na estatística Anderson-Darling são os critérios mais poderosos. Segundo esses dois critérios se tem que a distribuição Nakagami leva vantagens sobre as demais distribuições (ver, Tabelas 3 e 4).

Tabela 5
Número de vezes em que as distribuições sob hipótese nula não foi rejeitada em três testes de critérios de seleção [Akaike (AIC), Kolmogorov-Smirnov (KS), Anderson-Darling (AD) e Cramér-von Mises (CvM)], dentre as 396 séries utilizadas. Números marcados em negrito indicam as distribuições que não tiveram a hipótese nula rejeitada nenhuma vez.

é importante ressaltar, neste ponto, que a distribuição Nakagami é amplamente utilizada em várias áreas do co­nhecimento, especialmente, na análise do desvanecimento de sinais de rádio e de ultrassom (Karagiannidis et al., 2005KARAGIANNIDIS, G.K.; SAGIAS, N.C.; MATHIOPOULOS P.T. The N×Nakagami Fading Channel Model. In: Wireless Communication Systems of 2nd International Symposium, 2005. Anais 2nd International Symposium; p. 185-189.; Antônio, 2003ANTôNIO, J.R. área de cobertura em ambiente de propagação modelado com a distribuição k-u. 2003. 88 p. Dissertação (Mestrado em Engenharia Elétrica) - Instituto Nacional de Telecomunicações (INATEL), Santa Rita do Sapucaí. 2003. Disponível em: http://www.wisstek.org/ie708/Jamil.pdf. Acesso em: 10 jan. de 2016
http://www.wisstek.org/ie708/Jamil.pdf...
; Guedes, 1994GUEDES, L.G.R. área de cobertura e sobreposição de células no ambiente Nakagami. 1994. 123p. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Engenharia Elétrica e de Computação UNICAMP, Campinas. 1994. Disponível em: http://repositorio.unicamp.br/jspui/bitstream/REPOSIP/259670/1/Guedes_LeonardoGuerradeRezende_M.pdf. Acesso em: 30 de abr. 2015
http://repositorio.unicamp.br/jspui/bits...
). Existe uma vasta literatura referente à aplicação na área de engenharia de comunicações. Por outro lado, quando se buscam aplicações envolvendo variáveis climatológicas, um número bastante reduzido de publicações é encontrado (Schwartz et al., 2013SCHWARTZ, J.; GODWIN, R.T.; GILES, D.E. Improved maximum-likelihood estimation of the shape parameter in the Nakagami distribution. J. Stat. Comput. Simul., v. 83, n. 3, p. 434-445, 2013. ; Singh e Sarkar, 2013SINGH, K.J.; SARKAR, S. Development of GIUH for the catchment contributing to Loktak lake, North East India. J. Indian Society Remote Sens., v. 41, n.2, p. 447-459, 2013.; Sarkar e Rai, 2011SARKAR, S.; RAI, R.K. Flood inundation modeling using Nakagami-m distribution based GIUH for a partially gauged catchment. Water Resour. Manag., v. 25, n. 14, p. 3805-3835, 2011.; Sarkar e Mathur, 2010SARKAR, S.; GOEL, N.K.; MATHUR, B. Performance investigation of Nakagami-m distributionto derive flood hydrograph by genetic algorithm optimization approach. J. Hydraul. Eng., v. 15, n. 8, p. 658-666, 2010.; Sarkar e Mathur, 2009SARKAR, S.; GOEL, N.K.; MATHUR, B. Adequacy of Nakagami-m distribution function to derive GIUH. J. Hydraul. Eng., v. 14, n. 10, p. 1070-1079, 2009.). No entanto, nenhum deles utilizou dados de precipitação.

é importante enfatizar que, independentemente da frequência com que cada uma das distribuições foi selecionada, todas elas são importantes e, sempre que possível, o maior número delas deve ser ajustada e escolhida, segundo os critérios discutidos aqui e na literatura.

4.

Conclusões

Embora a distribuição Nakagami não seja muito utilizada na descrição de dados de precipitação ou de outras variáveis climatológicas, os resultados deste trabalho evidenciam seu potencial na análise de séries de precipitação.

A distribuição Nakagami foi escolhida o maior número de vezes como vencedora, obtendo o melhor ajuste para as estações climatológicas da Região Sul do Brasil para série histórica de até 44 anos. Esta distribuição permite previsões de precipitação climática, que podem servir de suporte para tomada de decisões, planejamento e gestão no agronegócio de uma região. Recomenda-se sua utilização na descrição do comportamento da pluviosidade mensal como concorrente a algumas distribuições tradicionalmente utilizadas.

Agradecimentos

Agradecemos ao Instituto Nacional de Meteorologia (INMET) por disponibilizar no portal INMET os dados utilizados neste trabalho. O segundo autor agradece ao Instituto Cesumar de Ciência, Tecnologia e Inovação (ICETI) pela Bolsa de Produtividade em Pesquisa concedida.

Referências

  • AKAIKE, H. A new look at the statistical model identification. IEEE Trans. Automat. Contr., v. 19, n. 6, p. 716-723, 1974.
  • ANTôNIO, J.R. área de cobertura em ambiente de propagação modelado com a distribuição k-u. 2003. 88 p. Dissertação (Mestrado em Engenharia Elétrica) - Instituto Nacional de Telecomunicações (INATEL), Santa Rita do Sapucaí. 2003. Disponível em: http://www.wisstek.org/ie708/Jamil.pdf Acesso em: 10 jan. de 2016
    » http://www.wisstek.org/ie708/Jamil.pdf
  • ASHKAR, F.; AUCOIN, F. Choice between competitive pairs of frequency models for use in hydrology: a review and some new results. Hydrol. Sci. J. v. 57, n. 6, p. 1092-1106, 2012.
  • ASHKAR, F.; ZOGLAT A.M. On the discrimination between statistical distributions for hydrological frequency analysis. In: CSCE ANNUAL CONFERENCE. Major Public Works: Key Technologies for the 21st Century, Quebec, 1997. p. 169-178
  • BARTELS, R. The rank version of von Neumann’s ratio test for randomness. J. Am. Stat. Assoc., v. 77, n. 377, p. 40-46, 1982.
  • BEYRUTH, Z. água, agricultura e as alterações climáticas globais. Rev. Tec. & Agrop., 318 n. 6, p. 74-89, 2008.
  • BUISHAND, T.A. Some methods for testing the homogeneity of rainfall records. J. Hydrol., v. 58, n. 1-2, p. 11-27, 1982.
  • CAEIRO, F.; MATEUS, A. Randtests: Testingrandomness in R. R package version 1.0. 2014. Disponível em: URL http://CRAN.R-project.org/package=randtests Acesso em: 30 de abr. 2015.
    » http://CRAN.R-project.org/package=randtests
  • CARGNELUTTI-FILHO, A.; MATZENAUER, R.; MALUF, J.R.T.; RADIN, B. Variabilidade temporal e espacial da precisão das estimativas de elementos meteorológicos no Rio Grande do Sul. Cienc. Rural., v. 39, n. 4, p. 962-970, 2009.
  • CASELLA, G.; BERGER, R.L. Statistical inference Série: Statistics/Probability Serie, Ed. Wadsworth \& Brooks/Cole Advanced Books \& Software, Pacific Grove, CA. 1990
  • COE, R.; STERN, R.D. Fitting models to daily rainfall data. J. Appl. Meteorol., v. 21, n. 7, p. 337 1024-1031, 1982.
  • D’AGOSTINO, R.B.; STEPHENS, M.A. Goodness-of-fit techniques. Statistics: Textbooks and Monographs. v. 68. New York, Marcel Dekker, 1986.
  • DELIGNETTE-MULLER, M.L.; DUTANG, C. Fitdistrplus: An R package for fitting distri-butions. J. Stat. Software, v. 64, n. 4, p. 1-34. 2015
  • DOURADO NETO D.; ASSIS, J.P. de; TIMM, L.C.; MANFRON, P.A.; SPAROVEK, G.; FARAWAY, J.; MARSAGLIA, G.; MARSAGLIA, J.; BADDELEY, A. Goftest: Classical Goodness-of-Fit Tests for Univariate Distributions. R package version 1.0-2 2014. Disponível em: URL http://CRAN.R-project.org/package=goftest Acesso em: 30 de abr. 2015.
    » http://CRAN.R-project.org/package=goftest
  • GIBBONS, J.D.; CHAKRABORTI, S. Nonparametric statistical inference, 5th Edition. Statistics: Textbooks and Monographs. Boca Raton: CRC Press. 2011.
  • GUEDES, L.G.R. área de cobertura e sobreposição de células no ambiente Nakagami 1994. 123p. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Engenharia Elétrica e de Computação UNICAMP, Campinas. 1994. Disponível em: http://repositorio.unicamp.br/jspui/bitstream/REPOSIP/259670/1/Guedes_LeonardoGuerradeRezende_M.pdf Acesso em: 30 de abr. 2015
    » http://repositorio.unicamp.br/jspui/bitstream/REPOSIP/259670/1/Guedes_LeonardoGuerradeRezende_M.pdf
  • HANNAN, E.J.; QUINN, B.G. The determination of the order of an autoregression. Journal of the Royal Statistical Society. Series B. Methodological, v. 41, n. 2, p. 190-195, 1979.
  • JOHNSON, N.L.; KOTZ, S.; BALAKRISHNAN, N. Continuous univariate distributions v. 1, 2ed. New York: Wiley-Interscience Publication. 1994.
  • JOHNSON, N. L.; KOTZ, S.; BALAKRISHNAN, N. Continuous univariate distributions v. 2, 2ed. New York: Wiley-Interscience Publication. 1995.
  • KANG, H.M.; YUSOF, F. Homogeneity tests on daily rainfall series in peninsular malaysia. Int. J. Contemp. Math. Sci., v. 7, n. 1, p. 9-22, 2012.
  • KARAGIANNIDIS, G.K.; SAGIAS, N.C.; MATHIOPOULOS P.T. The N×Nakagami Fading Channel Model. In: Wireless Communication Systems of 2nd International Symposium, 2005. Anais 2nd International Symposium; p. 185-189.
  • KENDALL, M.; GIBBONS, J.D. Rank correlation methods, 5th Edition. A Charles Griffin Title. Edward Arnold, London. 1990.
  • KOLAR, R.; JIRIK, R.; JAN, J. Estimator comparison of the Nakagami-m parameter and its application in echocardiography. Radioengineering, v. 13, n. 1, p. 8-12. 2004.
  • KOTZ, S.; NADARAJAH, S. Extreme value distributions London: Imperial College Press. 2000
  • MACHIWAL, D.; JHA, M.K. Hydrologic time series analysis: theory and practice Springer, Dordrecht; Capital Publishing Company, New Delhi, 2012.
  • MANN, H.B. Nonparametric tests against trend. Econometrica, v. 13, n. 3, p. 245-259, 1945.
  • NAKAGAMI, M., The m-distribution - A general formula of intensity distribution of rapid fading. In: HOFFMAN, W. C. (Ed.), Statistical Methods in Radio Wave Propagation. Pergamon, 1960. p. 3-36.
  • R CORE TEAM, 2013. R: A Language and Environment for Statistical Computing. R Foun-dation for Statistical Computing, Vienna, Austria. 2013.
  • RAMOS, P.L.; MOALA, F.A. A aplicação da distribuição exponen­cial geométrica estendida para modelagem de dados plu­viométricos. Rev. bras. meteorol., v. 29, n. 4, p. 613-620, 2014.
  • SARKAR, S.; GOEL, N.K.; MATHUR, B. Adequacy of Nakagami-m distribution function to derive GIUH. J. Hydraul. Eng., v. 14, n. 10, p. 1070-1079, 2009.
  • SARKAR, S.; GOEL, N.K.; MATHUR, B. Performance investigation of Nakagami-m distributionto derive flood hydrograph by genetic algorithm optimization approach. J. Hydraul. Eng., v. 15, n. 8, p. 658-666, 2010.
  • SARKAR, S.; RAI, R.K. Flood inundation modeling using Nakagami-m distribution based GIUH for a partially gauged catchment. Water Resour. Manag., v. 25, n. 14, p. 3805-3835, 2011.
  • SCHWARTZ, J.; GODWIN, R.T.; GILES, D.E. Improved maximum-likelihood estimation of the shape parameter in the Nakagami distribution. J. Stat. Comput. Simul., v. 83, n. 3, p. 434-445, 2013.
  • SCHWARZ, G. Estimating the dimension of a model. The Annals of Statistics, v. 6, n. 2, p. 461-464, 1978.
  • SINGH, K.J.; SARKAR, S. Development of GIUH for the catchment contributing to Loktak lake, North East India. J. Indian Society Remote Sens., v. 41, n.2, p. 447-459, 2013.
  • STEPHENS, M.A. EDF statistics for goodness of fit and some com­parisons. J. Am. Stat. Assoc., v. 69, n. 347, p. 730-737, 1974.
  • TORRES, F.E.; CARGNELUTTI FILHO, A.; TEODORO, P.E.; CORRêA, C.C.G.; RIBEIRO, L.P.; CUNHA, E.R. Dimensionamento amostral para a estimação da média de precipitação pluvial mensal em locais do Estado do Mato Grosso do Sul. Cienc. Rural, v. 46, n. 1, p. 60-69, 2016.

Endereços de Internet

Datas de Publicação

  • Publicação nesta coleção
    30 Maio 2019
  • Data do Fascículo
    Jan-Mar 2019

Histórico

  • Recebido
    08 Mar 2016
  • Aceito
    07 Abr 2018
Sociedade Brasileira de Meteorologia Rua. Do México - Centro - Rio de Janeiro - RJ - Brasil, +55(83)981340757 - São Paulo - SP - Brazil
E-mail: sbmet@sbmet.org.br