Acessibilidade / Reportar erro

Uma nova classe de distribuições generalizadas

Resumos

Neste trabalho, é introduzida uma família de distribuições denominada hipergeométrica confluente G que inclui os importantes modelos: beta normal, beta Weibull, beta Gumbel, beta Pareto, entre outros. Novas distribuições são apresentadas como membros dessa família, por exemplo, a distribuição hipergeométrica confluente normal e a distribuição hipergeométrica confluente Weibull. A estimação dos parâmetros dessa nova classe de distribuições generalizadas é estudada utilizando o Método da Máxima Verossimilhança e sua potencialidade é demonstrada na modelagem de um conjunto de dados reais de trinta e cinco crianças com deficiência do hormônio de crescimento.

Distribuição beta generalizada; distribuição hipergeométrica confluente; Método da Máxima Verossimilhança


In this paper we introduced a family of distributions called confluent hypergeometric G that includes the important models beta normal, beta Weibull, beta Gumbel, beta Pareto among others. New distributions are presented as members of this family, for example, confluent hypergeometric normal distribution and confluent hypergeometric Weibull distribution. The estimation of the parameters of this new class of generalized distributions is studied using the maximum likelihood method and its potential is demonstrated in the modeling of a real data set of thirty-five children with growth hormone deficiency.

Generalized beta distribution; confluent hypergeometric distribution; method of maximum likelihood


Uma nova classe de distribuições generalizadas

J.A. RodriguesI; L.M. ChavesI,1 1 jailsonderaujo@yahoo.com.br, lucas@dex.ufla.br 2 fredy@est.ufmg.br ; F. CastellaresII,2 1 jailsonderaujo@yahoo.com.br, lucas@dex.ufla.br 2 fredy@est.ufmg.br

IDepartamento de Ciências Exatas, DEX, UFLA - Universidade Federal de Lavras, 37200-000 Lavras, MG, Brasil

IIDepartamento de Estatística, ICEX, UFMG - Universidade Federal de Minas Gerais, 31270-901 Belo Horizonte, MG, Brasil

RESUMO

Neste trabalho, é introduzida uma família de distribuições denominada hipergeométrica confluente G que inclui os importantes modelos: beta normal, beta Weibull, beta Gumbel, beta Pareto, entre outros. Novas distribuições são apresentadas como membros dessa família, por exemplo, a distribuição hipergeométrica confluente normal e a distribuição hipergeométrica confluente Weibull. A estimação dos parâmetros dessa nova classe de distribuições generalizadas é estudada utilizando o Método da Máxima Verossimilhança e sua potencialidade é demonstrada na modelagem de um conjunto de dados reais de trinta e cinco crianças com deficiência do hormônio de crescimento.

Palavras-chave. Distribuição beta generalizada, distribuição hipergeométrica confluente, Método da Máxima Verossimilhança.

ABSTRACT

In this paper we introduced a family of distributions called confluent hypergeometric G that includes the important models beta normal, beta Weibull, beta Gumbel, beta Pareto among others. New distributions are presented as members of this family, for example, confluent hypergeometric normal distribution and confluent hypergeometric Weibull distribution. The estimation of the parameters of this new class of generalized distributions is studied using the maximum likelihood method and its potential is demonstrated in the modeling of a real data set of thirty-five children with growth hormone deficiency.

Keywords. Generalized beta distribution, confluent hypergeometric distribution, method of maximum likelihood.

1. Introdução

Nos últimos anos, têm-se buscado novas distribuições para modelagem do tempo de duração de componentes ou tempo de vida de indivíduos. Esse fato é justificado, em função das distribuições existentes, muitas vezes não se ajustarem de forma satisfatória ao conjunto de dados reais em estudo. Nesse contexto, generalizações das distribuições existentes têm sido propostas. Algumas dessas distribuições são: a beta Pareto apresentada por [1], a Weibul exponenciada estudada por [2, 9, 10, 13, 15], a beta normal estudada por [4], a beta Weibull inversa introduzida por [6], a beta Weibull proposta por [7], a beta Gumbel proposta por [11], a beta exponencial estudada por [12], a beta Burr XII inserida por [16], a beta Weibull modificada estudada por [19] e a Gumbel exponenciada tratada por [18].

O objetivo deste trabalho é introduzir uma nova classe de distribuições, denominada hipergeométrica confluente G, que generaliza a família de distribuições beta G. Algumas novas distribuições são apresentadas como membros dessa família. A estimação de parâmetros é discutida via Método de Máxima Verossimilhança. Alguns casos especiais são discutidos e uma aplicação a dados reais demonstra sua potencialidade.

O texto é organizado da seguinte forma: na Seção 2 a família hipergeométrica confluente G é definida e alguns submodelos são discutidos na Seção 3. A estimação dos parâmetros via método da máxima verossimilhança é discutida na Seção 4. Na Seção 5 é feita a aplicação da distribuição hipergeométrica confluente G na análise de dados reais de trinta e cinco crianças com deficiência do hormônio de crescimento.

Os cálculos envolvidos incluem o uso de algumas funções especiais como a função gama,

a função gama incompleta,

a função beta,

e a função hipergeométrica confluente,

sendo que (z)i = (z) (z + 1) ¼ (z + i - 1) denota o fatorial ascendente. As propriedades dessas funções especiais podem ser vistas em [14].

2. O Modelo

Considere a distribuição hipergeométrica confluente, ver [5], com função densidade de probabilidade (fdp),

em que 0 < x < 1, a > 0, b > 0, - ∞ < c < + ∞.

Combinando os trabalhos de [3], [4] e [17] pode-se construir uma nova classe de distribuições, denominada hipergeométrica confluente G. Se G(x) denota uma função de distribuição (fd) de uma variável aleatória em que xI, então, a fd hipergeométrica confluente G é dada por,

a fdp associada a essa distribuição é,

a função de sobrevivência é,

e a função taxa de falha é dada por,

Claramente quando a = b = 1 e c = 0 o modelo hipergeométrico confluente G reduz-se a distribuição original G(x).

Se 1 > | z | e se b é um número real positivo não inteiro, então

Utilizando a expansão em série (2.6), a fd hipergeométrica confluente G pode ser expressa em termos da função gama incompleta,

Se b > 0 é um número inteiro, o índice j varia de zero até b - 1.

3. Alguns Casos Especias

Nesta seção, são tratados alguns exemplos da distribuição hipergeométrica confluente G. Esses submodelos generalizam diversas distribuições importantes existentes na literatura; como é o caso da beta normal e da beta Weibull.

• Distribuição hipergeométrica confluente normal

Ao substituir G(x) e g(x) em (7) pelas respectivas fd e fdp da distribuição normal N(µ, σ2) obtemos, a fdp hipergeométriica confluente normal,

sendo que - ∞ < x < + ∞, a > 0, b > 0, s > 0, - ∞ < c < + ∞, - ∞ < m < + ∞, ϕ(·) é a fdp normal padrão e Φ(·) é a fd normal padrão. Uma variável aleatória X com fdp (3.1) será denotada por X ~ HCN (a, b, c, µ, σ2). Caso, c = 0 a distribuição HCN (a, b, 0, µ, σ2) corresponde ao modelo beta normal, proposto por [4] e a distribuição HCN (1, 1, 0, µ, σ2) coincide com o modelo normal.

• Distribuição hipergeométrica confluente log-normal

Quando G(x) e g(x) em (2.3) são substituídas pelas respectivas fd e fdp da distribuição log-normal LN (µ, σ2) obtém-se, a fdp hipergeométriica confluente log-normal,

sendo que x > 0, a > 0, b > 0, σ > 0, - ∞ < c < + ∞, - ∞ < µ < + ∞, ϕ(·) é a fdp normal padrão e Φ(·) é fd normal padrão. Caso, c = 0, tem-se o modelo beta log-normal, para a = b = 1 e c = 0, obtém-se a distribuição log-normal. Uma variável aleatória X com densidade (3.2) será indicada, X ~ HCLN (a, b, c, µ, σ2).

• Distribuição hipergeométrica confluente Weibull

A distribuição Weibull que inclui os submodelos exponencial e Rayleigh é uma das mais importantes da estatística. A fd e a fdp desse modelo são respectivamente,

e

em que x > 0, k > 0 e s > 0. Dessa forma, a densidade hipergeométriica confluente Weibull, denotada por HCW (a, b, c, k, s), pode ser expressa como,

Essa distribuição inclui, quando c = 0, o modelo beta Weibull descrita por [7]. Se k = 1 juntamente com c = 0, tem-se o modelo beta exponencial proposto por [12]. Caso, b = 1 e c = 0 origina-se o modelo bastante conhecido Weibull exponenciado. Se k = 2 e c = 0 origina-se a distribuição beta Rayleigh. Se a = b = 1 e c = 0, obtém-se o modelo Weibull. Se a = b = 1, c = 0 e em adicional k = 1 resulta no modelo exponencial.

• Distribuição hipergeométrica confluente gama Seja Y uma variável aleatória com fd, G(y) = γ(α, βy)/Γ(α) em que y > 0, α > 0 e β > 0. A fdp de uma variável aleatória X com distribuição hipergeométriica confluente gama, indicada por X ~ HCG (a, b, c, α, β), pode ser escrita como,

Se c = 0, a fdp (3.6) reduz-se a fdp do modelo beta gama.

• Distribuição hipergeométrica confluente Pareto

Se X é uma variável aleatória Pareto com fd, G(x) = 1 - (x/s)-k em que x > s, k > 0 e s > 0. A densidade de uma variável aleatória X com distribuição hipergeométriica confluente Pareto, indicada por X ~ HCP (a, b, c, k, s), pode ser expressa como,

A distribuição beta Pareto introduzida por [1] é um importante caso particular de (3.7) quando c = 0.

• Distribuição hipergeométrica confluente Gumbel

A fd e a fdp do modelo Gumbel são dadas, respectivamente, por:

e

com - ∞ < x < + ∞, - ∞ < µ < + ∞ e s > 0. O modelo hipergeométrico confluente Gumbel tem fdp dada por,

sendo que u = (x - µ)/σ. A distribuição beta Gumbel, ver [11], é um submodelo de (3.10) quando c = 0. Caso b = 1 juntamente com c = 0, tem-se a fdp Gumbel exponenciada estudada. Uma variável aleatória X com fdp (3.10) será denotada por X ~ HCGB (a, b, c, µ, σ).

• Distribuição hipergeométrica confluente Weibull inversa

A fd da distribuição Weibull inversa é definida como G(x) = exp em que x > 0, k > 0 e s > 0. Dessa forma, a fdp da distribuição hipergeométriica confluente Weibull inversa, indicada por X ~ HCWI (a, b, c, k, s), pode ser expressa como,

Se c = 0, a fdp (22) reduz-se ao modelo beta Weibull inversa. Caso b = 1 e c = 0, tem-se a distribuição Weibull inversa exponenciada.

Nas Figuras de 1 a 7 são exibidas algumas das formas possíveis das fdp para os casos especiais da distribuição hipergeométrica confluente G.







4. Estimação dos Parâmetros

Seja X1,..., Xn uma amostra aleatória da distribuição hipergeométrica confluente G com vetor paramétrico = (a, b, c, ). O vetor p-dimensional de parâmetros = (η1,..., ηp) é proveniente da distribuição geradora G(x;). A função de verossimilhança para o vetor paramétrico pode ser escrita como,

Enquanto a correspondente função log-verossimilhança pode ser expressa como:

as estimativas de máxima verossimilhança de a, b, c e ηj são as soluções do sistema de equações não-lineares:

em que ψ(·) denota a função digama ψ(t) = dlogΓ(t)/dt.

5. Aplicação

Nesta seção, foi realizada uma aplicação da família hipergeométrica confluente G, quando G tem distribuição Weibull.

A distribuição hipergeométrica confluente Weibull foi ajustada utilizando dados do Programa Hormonal de Crescimento da Secretaria da Saúde de Minas Gerais, esses dados são provenientes do tratamento de trinta e cinco crianças com diagnóstico de deficiência do hormônio de crescimento e consistem no tempo até que o medicamento com esse tipo de hormônio atinja o objetivo, Tabela 1. Mais detalhes sobre esse conjunto de dados podem ser encontrados em [8].

As estimativas de máxima verossimilhança para o modelo hipergeométrico confluente Weibull e seus submodelos beta Weibull, Weibull e exponencial são exibidas na Tabela 2.

Para selecionar a distribuição com melhor ajuste foi utilizado o critério de informação de Akaike, baseado na teoria de decisão o AIC (Akaike Information Criterion) é definido como a quantidade AIC = - 2L + 2p em que L representa a magnitude máxima da função suporte e p denota o número de parâmetros da distribuição. De acordo com esse critério, o melhor modelo é aquele que apresenta o menor valor do AIC. Na Tabela 2 pode-se observar que a distribuição hipergeométrica confluente Weibull apresentou um ajuste melhor, comparado aos outros modelos probabilísticos alternativos, pois seu AIC apresentou menor valor em relação as outras distribuições consideradas.

A qualidade de ajuste dos modelos também pode ser verificada pelos gráficos de probabilidades. Esses gráficos consistem em representar no plano cartesiano a probabilidade observada versus a probabilidade esperada. Para cada um dos modelos foi plotado F(x(i)) versus (i - 0,375)/(n + 0,25), i = 1,..., n em que F(·) denota a função de distribuição e x (i) representa os valores amostrais em ordem crescente. Na Figura 8 são exibidos os gráficos de probabilidade as distribuições ajustadas, também por esse critério, a distribuição hipergeométrica confluente Weibull apresentou melhor ajuste em relação as distribuições beta Weibull, Weibull e exponencial.


Comparando as fdp ajustadas com o histograma dos dados observados, Figura 9, novamente pode-se concluir que a distribuição hipergeométrica confluente Weibull oferece um ajuste melhor em relação as outras três distribuições.


6. Conclusões

Utilizando os trabalhos de [3], [4] e [17] foi intoduzida uma nova família de distribuições generalizadas. Para cada distribuição G pode-se definir uma nova distribuição, hipergeométrica confluente G, que a generaliza utilizando uma fórmula simples.

A estimação dos parâmetros dessa nova família pelo Método da Máxima Verossimilhança pode ser facilmente computada utilizando métodos numéricos. Uma aplicação da distribuição hipergeométrica confluente Weibull a dados reais demonstrou a flexibilidade e o potencial da família hipergeométrica confluente G na análise de dados de sobrevivência.

Recebido em 08 de Fevereiro de 2012; Aceito em 31 de Julho de 2012.

  • [1] A. Akinsete, F. Famoye, C. Lee, The beta-Pareto distribution, Statistics, 42, No. 6 (2008), 547-563.
  • [2] A. Choudhury, A simple derivation of moments of the exponentiated Weibull distribution, Metrika, 62, No. 1 (2005), 17-22.
  • [3] G.M. Cordeiro, M. Castro, A new family of generalized distributions, J. Stat. Comp. Simulation, 81, No. 7 (2011), 883-898.
  • [4] N. Eugene, C. Lee, F. Famoye, Beta-normal distribution and its application, Commun. Stat. - Theory and Methods, 31 (2002), 497-512.
  • [5] M.B. Gordy, Computationally convenient distributional assumptions for common-Value auctions, Comp. Econom., 12, No. 1 (1998), 61-78.
  • [6] M.S. Khan, The beta inverse Weibull distribution, Int. Trans. Math. Sciences and Comp., 3, No. 1 (2010), 113-119.
  • [7] C. Lee, F. Famoye, O. Olumolade, Beta-Weibull distribution, J. Mod. Appl. Stat. Meth., 6, No. 1 (2007), 173-186.
  • [8] A.L. Morais, "A class of generalized beta distributions, Pareto power series and Weibull power series", Dissertação para a obtenção do grau de Mestre em Estatística, Universidade Federal de Pernambuco, Recife, PE, 2009.
  • [9] G.S. Mudholkar, D.K. Srivastava, M. Friemer, M. Castro, The exponentiated Weibull family: A reanalysis of the bus-motor-failure data, Technometrics, 37 (1995), 436-445.
  • [10] S. Nadarajah, A.K. Gupta, On the moments of the exponentiated Weibull distribution., Commun. Stat. - Theory and Methods, 34, No. 2 (2005), 253-256.
  • [11] S. Nadarajah, S. Kotz, The beta Gumbel distribution, Math. Prob. Eng., 10 (2004), 323-332.
  • [12] S. Nadarajah, S. Kotz, The beta exponential distribution, Reliab. Eng. and Syst. Safety, 91 (2006), 689-697.
  • [13] M.M. Nassar, F.H. Eissa, On the exponentiated Weibull distribution, Commun. Stat. - Theory and Methods, 32, No. 7 (2003), 1317-1336.
  • [14] K. Oldham, J. Myland, J. Spanier, "An atlas of functions: with equator, the atlas function calculator", Springer Vergland, Canadá, 2009.
  • [15] M. Pal, M.M. Ali, J. Woo, Exponentiated Weibull distribution, Statistica, 66, No. 2 (2006), 139-147.
  • [16] P.F. Paranaíba, E.M.M. Ortega, G.M. Cordeiro, R.R. Pescim, The beta Burr XII distribution with application to lifetime data, Commun. Stat. - Theory and Methods, 55, No. 2 (2011), 1118-1136.
  • [17] M.A.R. de Pascoa, E.M.M. Ortega, G.M. Cordeiro, The Kumaraswamy generalized gamma distribution with application in survival analysis, Commun. Stat. - Theory and Methods, 8, No. 5 (2011), 411-433.
  • [18] K. Persson, J. Ryden, Exponentiated Gumbel distribution for estimation of return levels of significant wave height, J. Envir. Stat., 1, No. 3 (2010), 1-12.
  • [19] G.O. Silva, E.M.M. Ortega, G.M. Cordeiro, The beta modified Weibull distribution , Math. and Stat., 16, No. 3 (2010), 409-430.
  • 1 2
  • Datas de Publicação

    • Publicação nesta coleção
      15 Out 2012
    • Data do Fascículo
      2012

    Histórico

    • Recebido
      08 Fev 2012
    • Aceito
      31 Jul 2012
    Sociedade Brasileira de Matemática Aplicada e Computacional Rua Maestro João Seppe, nº. 900, 16º. andar - Sala 163 , 13561-120 São Carlos - SP, Tel. / Fax: (55 16) 3412-9752 - São Carlos - SP - Brazil
    E-mail: sbmac@sbmac.org.br