Acessibilidade / Reportar erro

Avaliação de métodos de estimação intervalar para funções lineares binomiais via bootstrap infinito

Evaluation of intervalar estimation methods for binomial linear functions through infinity bootstrap

Resumos

Objetivou-se, neste trabalho, avaliar intervalos de confiança de diferentes funções lineares compostas por proporções binomiais construídas com base no método de Wald e Wald ajustado utilizando a técnica de bootstrap infinito. Considerados diversos tamanhos amostrais (n is), parâmetros (p) e número de coeficientes das funções lineares. Concluiu-se, por meio das probabilidades de cobertura dos intervalos de confiança das populações binomiais, cujas proporções foram baixas (p=0,2) e considerando diferentes tamanhos de amostras, que a generalização bootstrap do método de Wald ajustado foi eficiente para funções lineares cujos coeficientes indicaram a comparação de uma proporção versus as demais.

Probabilidade de cobertura; intervalos de confiança; Wald


This work aimed to evaluate confidence intervals of different linear functions of binomial proportions base on Wald and Wald's adjusted method using the infinity bootstrap technique. Several sample sizes (n i), binomial parameters (p) and number of coefficients of the linear functions were considered. One concluded through the probabilities of binomial population confidence covered intervals that the bootstrap generalization of adjusted Wald's method was efficient for linear functions whose coefficients indicated a comparison of versus the others proportion (p=0.2) considering different sample sizes.

Covered probabilities; confidence intervals; Wald


COMUNICAÇÃO

Avaliação de métodos de estimação intervalar para funções lineares binomiais via bootstrap infinito

Evaluation of intervalar estimation methods for binomial linear functions through infinity bootstrap

Marcelo Angelo CirilloI; Daniel Furtado FerreiraII; Thelma SafádiIII

IDoutor em Estatística e Experimentação Agropecuária - Departamento de Ciências Exatas/DEX - Universidade Federal de Lavras/UFLA - Cx. P. 3037 - Lavras, MG - marcufla@gmail.com, marcelocirillo@hotmail - Bolsista FAPEMIG

IIPhD em Estatística e Experimentação Agropecuária, Professor Adjunto - Departamento de Ciências Exatas/DEX - Universidade Federal de Lavras/UFLA - Cx. P. 3037 - Lavras, MG - danielff@ufla.br

IIIPhD em Estatística, Professora Adjunta - Departamento de Ciências Exatas/DEX - Universidade Federal de Lavras/UFLA - Cx. P. 3037 - Lavras, MG - safadi@ufla.br

RESUMO

Objetivou-se, neste trabalho, avaliar intervalos de confiança de diferentes funções lineares compostas por proporções binomiais construídas com base no método de Wald e Wald ajustado utilizando a técnica de bootstrap infinito. Considerados diversos tamanhos amostrais (nis), parâmetros (p) e número de coeficientes das funções lineares. Concluiu-se, por meio das probabilidades de cobertura dos intervalos de confiança das populações binomiais, cujas proporções foram baixas (p=0,2) e considerando diferentes tamanhos de amostras, que a generalização bootstrap do método de Wald ajustado foi eficiente para funções lineares cujos coeficientes indicaram a comparação de uma proporção versus as demais.

Termos para indexação: Probabilidade de cobertura, intervalos de confiança, Wald.

ABSTRACT

This work aimed to evaluate confidence intervals of different linear functions of binomial proportions base on Wald and Wald's adjusted method using the infinity bootstrap technique. Several sample sizes (ni), binomial parameters (p) and number of coefficients of the linear functions were considered. One concluded through the probabilities of binomial population confidence covered intervals that the bootstrap generalization of adjusted Wald's method was efficient for linear functions whose coefficients indicated a comparison of versus the others proportion (p=0.2) considering different sample sizes.

Index terms: Covered probabilities, confidence intervals, Wald.

Os intervalos de confiança para diferença de duas proporções são usualmente estimados pelo método de Wald, cujo fundamento está na aproximação assintótica da distribuição normal. Contudo, para amostras pequenas, essas estimativas não são condizentes com o nível de confiança desejado. Como conseqüência desse problema, Agresti & Coull (1998) propuseram uma modificação no método, que consiste em acrescentar quatro pseudo-observações classificadas, empiricamente, como duas observações representando "sucessos" e duas representando "fracassos", para uma população binomial. Posteriormente, Agresti & Caffo (2000) realizaram essa modificação no intervalo de confiança para diferença de duas proporções. Com essas modificações, originou-se o teste de Wald ajustado, doravante representado nesse trabalho por Wald (ajust).

Price & Bonett (2004) apresentaram uma extensão desses métodos, considerando funções lineares de proporções binomiais. O termo função linear se dá por apenas assumir linearidade nos parâmetros p. Vale ressaltar que a praticidade dessas funções lineares dos parâmetros binomiais consiste em comparar tratamentos não estruturados, exemplificados pelas comparações múltiplas, ou estruturados, no sentido de grupos de tratamentos serem previamente determinados para análise. Tal estrutura poderá ser exemplificada pela comparação de um tratamento controle versus os demais. Portanto, nota-se que o uso de funções lineares, perfeitamente enquadra-se em aplicações da estatística experimental, diferindo apenas no fato de que as populações consideradas são binomiais e não normais.

Um exemplo prático da aplicação dessas funções pode ser encontrado em Cohen et al. (1991). O experimento realizado por esses autores consistiu em aplicar as funções lineares binomiais para avaliar o efeito de diferentes dietas alimentares, em relação à formação ou não de tumores. Cada dieta foi formada a partir dos fatores: fibra (ausência/presença) e gordura, classificadas nos níveis: alto e baixo, sendo essas submetidas, aleatoriamente, a 120 ratos. As respostas de cada tratamento foram determinadas por meio de contagens de ratos que desenvolveram ou não tumores, de forma a propiciar o cálculo das proporções de cada tratamento, em relação ao número total de ratos.

Com base nesses resultados, os autores construíram três funções lineares, de modo que os coeficientes utilizados para cada função permitiram estimar a significância dos efeitos principais e da interação.

Em se tratando do estudo dos métodos utilizados para estimar as funções lineares, Price & Bonett (2004) obtiveram as probabilidades de cobertura dos métodos Wald e Wald(ajust.) por meio de simulação Monte Carlo, utilizando diferentes configurações, como número de populações, diferentes proporções e funções lineares. Assim, os mesmos autores concluíram que o intervalo de confiança de Wald(ajust.) resultou em probabilidades de cobertura mais próximas ao nível de confiança desejado, em relação às probabilidades propiciadas pelo método de Wald original. Entretanto, convém salientar que, em algumas situações, Price & Bonett (2004) verificaram que os métodos em questão (Wald e Wald(ajust.)) revelaram resultados referentes à probabilidade de cobertura, inapropriados ao nível nominal de confiança fixado em 95%. Com base nessas evidências, julgou-se necessário avaliar o desempenho desses métodos na abordagem bootstrap, na expectativa de que resultados condizentes com o nível de confiança nominal fossem obtidos. Destaca-se, assim o objetivo deste trabalho de avaliar os métodos de Wald e Wald(ajust.) por meio das probabilidades de cobertura e amplitude intervalar, submetidos à abordagem bootstrap proposta por Conlon & Thomas (1990), destacando seu mérito nas situações em que os estimadores intervalares convencionais apresentaram deficiências. Para isso, configurações não contempladas por Price & Bonett (2004) foram avaliadas, sendo essas diferenciadas pela estrutura dos tratamentos e diferentes valores paramétricos representados pelas proporções p.

Com esse propósito, consideraram-se k=4, 6 e 8 populações binomiais (ni,pi), em que os tamanhos amostrais foram fixados em ni=10 e 60 (i=1,...,k) para funções lineares com coeficientes definidos pelos vetores c1=(1,1,-1,-1); c2=(1,1,1,-1,-1,-1) e c3=(1,1,1,1,-1,-1,-1,-1) e pi=0,2; 0,5 e 0,9. Tal situação se deu para amostras de tamanhos iguais para todas as populações. No caso de amostras diferentes, os tamanhos amostrais foram definidos pela relação ni=dj×10, sendo dj a j-ésima componente do vetor d=(1,2,...,k) e os coeficientes das funções lineares foram c1=(3,-1,-1,-1); c2=(5,-1,-1,-1,-1,-1) e c3=(7,-1,-1,-1,-1,-1,-1,-1). Com base nessas configurações, realizaram-se 2000 simulações Monte Carlo, nas quais foram geradas observações binomiais independentes, Yi, (i=1, 2,..., k). Para cada simulação, foram estimados os intervalos de confiança de Wald (1) e Wald(ajust.) (2), para funções de proporções binomiais representadas por :

em que, ; ; ; e o quantil superior 100(a/2)% da distribuição normal padrão, cujo valor é 1,96, para α=5%.

Em ambos os métodos, as probabilidades de cobertura foram obtidas pelas porcentagens de intervalos, que contiveram o valor do parâmetro Ψ e o comprimento médio pela média das amplitudes intervalares no final das 2000 simulações. O bootstrap infinito, definido por Conlon & Thomas (1990), consiste em um método de computação intensiva utilizado para estimar diferença entre duas proporções binomiais, utilizando-se a distribuição conjunta do modelo binomial para cada população.

Neste trabalho, utilizou-se o algoritmo definido por esses autores, porém expandindo a metodologia proposta para k populações binomiais, referenciadas por meio de um único valor paramétrico definido por . Dessa forma, a distribuição de probabilidade conjunta a ser utilizada no processo de reamostragem das observações (y1,y2,...,yk), uma vez que, os tamanhos amostrais ni (i=1,...,k) foram previamente fixados, foi dada por:

em que z =1 e 2.

de modo que se z=1, o estimador de e assumindo z=2 tem-se . Assim, utilizou-se essa expressão para gerar amostras bootstrap, de tal forma que, cada combinação amostral, obtida pela realização das B=2000 reamostragens foi representada por (y1*,y2* ,...,yk*). Cada valor gerado foi classificado como "sucesso", e utilizado para compor as estimativas . Isso posto, para um melhor entendimento da obtenção da probabilidade conjunta (4), definiu-se o conjunto de pontos Ω = {{0,...,n1}×{0,...,n2 }×...×{0,...,nk}}, no qual cada valor simulado estará contido.

Para cada estimativa de Ψb(z) em que, z = 1 ou 2, estimou-se a probabilidade D = Ψb(z), de acordo com a expressão

Posteriormente, após a realização das 2000 reamostragens com reposição, obteve-se a distribuição empírica da variável aleatória D. Em seguida, esses valores foram ordenados e os limites inferiores (q1) e superiores (q2) foram estimados conforme as expressões (5) e (6).

Seguindo a metodologia, mencionada anteriormente, procedeu-se à apresentação e à discussão dos resultados encontrados na Tabela 1. Observou-se que, para o valor da proporção (p=0,2), quando consideradas amostras menores (ni(s)=10), a probabilidade de cobertura foi superior a 95%, em todos os métodos avaliados.

Nessa primeira análise, uma atenção especial deve ser dada aos resultados relativos ao método de Wald(ajust.), justamente por serem concordantes com os resultados obtidos por Price & Bonett (2004). Contudo, vale ressaltar que a metodologia utilizada por esses autores assumiu diferentes valores para os coeficientes c, tendo o(s) parâmetro(s) p sido gerados por uma distribuição uniforme. Isso posto, respalda-se em afirmar que, independente dos coeficientes assumidos, o método de Wald(ajust.) apresentou probabilidade de cobertura próxima do nível de confiança nominal especificado. Além do mais, notou-se similaridade com o método de Wald-Laplace, cujas probabilidades de cobertura foram calculadas de forma exata por Greenland (2001).

Aumentando-se o valor dessa proporção para p = 0,5, ainda considerando-se ni=10 (i=1,...,k). As probabilidades de cobertura dos métodos de Wald e Wald(ajust.) foram reduzidas, apresentando valores levemente inferiores ao nível de confiança especificado (95%). Esse fato foi mais notável para proporções maiores, no caso p=0,9, em que apenas o método de Wald (ajust.) manteve probabilidades superiores ao nível de confiança nominal, corroborando os resultados obtidos por Price & Bonett (2004).

Em relação à eficiência da abordagem bootstrap dos métodos mencionados, observou-se que nenhum resultado agregou informação no sentido de corrigir os intervalos, de forma a proporcionar uma probabilidade de cobertura desejável em relação a um valor nominal do coeficiente de confiança. Diante dos resultados apresentados e discutidos, com base nos valores paramétricos avaliados, não se aconselha a generalização bootstrap desses métodos.

Analisando-se os resultados referentes às amostras ni(s)=60, observou-se que, de modo geral, todos os métodos, inclusive a generalização bootstrap, mostraram probabilidades superiores ou aproximadas ao nível de confiança especificado em 95%, desprezando-se o erro de Monte Carlo. Portanto, pode-se inferir que os problemas de aproximação assintótica, observados por Agresti & Caffo (2000), no caso de diferença de duas proporções binomiais, mantêm-se para k proporções.

Considerando amostras de mesmo tamanho e funções lineares simétricas (ψ=0) para quaisquer valores de p fixado (ex. p=0,9), os resultados são iguais às funções em que os parâmetros são definidos como 1-p (ex. p=0,1). Facilmente isso é verificado, em virtude da propriedade de simetria da distribuição binomial.

Os resultados encontrados na Tabela 2 referem-se às probabilidades de cobertura para amostras de tamanhos diferentes, conforme especificado pela relação ni=dj×10, sendo dj a j-ésima componente do vetor d = (1,2,...,k) e exemplificado para k = 4 populações, como n1 = 10; n2 = 20; n3 = 30 e n4 = 40.

Bonnet & Woodward (1987) destacaram que as funções lineares de proporções binomiais correspondem a casos mais complexos de comparações, pois um número maior de populações poderá ser exigido, podendo envolver não apenas os efeitos principais, mas também as interações. Em particular, para duas populações, a análise dessas funções coincide com a comparação de duas proporções binomiais, comumente realizada por meio de intervalos de confiança ou testes de hipóteses. Nesse caso, podem-se citar importantes resultados obtidos por Agresti & Caffo (2000), os quais, em síntese, afirmam que o intervalo de confiança de Wald, construído por meio dos estimadores de máxima verossimilhança apresentou deficiências em sua cobertura.

Posteriormente, Carari (2004) avaliou, por meio de simulação Monte Carlo, este método e concluiu que a probabilidade de cobertura apresentou probabilidades inferiores aos valores nominais do coeficiente de confiança, comprometendo sua aplicação prática para pequenas amostras. Assim sendo, verifica-se a inviabilidade da aplicação do método de Wald, seja na forma convencional ou na sua generalização bootstrap, inferida nesse trabalho para amostras provenientes de populações binomiais com o valor da proporção p=0,9, dado que, nessa situação, as probabilidades de cobertura foram bem inferiores ao nível de confiança especificado em 95%, A deficiência no método de Wald verificada nas funções lineares torna-se plausível de ser aceita. Entretanto, a principal vantagem da generalização bootstrap se deu para o método de Wald(ajust.), no qual, notoriamente, observou-se que, para populações com baixo valor (p = 0,2), esse método revelou probabilidades inferiores ao nível de confiança desejado. Porém, comparando-se os resultados desse método na abordagem bootstrap, verificou-se que essa deficiência foi corrigida, revelando em algumas funções lineares ganhos acima de 7 pontos porcentuais, como pode ser percebido nos resultados dos contrastes c4, c5 e c6 (Tabela 2). Porém, não se pode expandir essa vantagem para p=0,9, de modo que, nesse caso, a generalização desse método apresentou resultados bastante insatisfatórios, em relação ao nível de confiança desejado.

Outro fator relevante é que a eficiência do método Wald(ajust.), mencionada anteriormente, se deu em funções lineares que retratam o teste de uma proporção em relação às demais, de maneira semelhante ao caso de contraste, envolvendo um tratamento controle com os demais. Além do mais, tais deficiências apontadas por esse método ratificam os resultados obtidos por Price & Bonett (2004), considerando pequeno número de população e diferentes combinações dos tamanhos amostrais (n) fixados em 10, 20 e 30. No entanto, todos os resultados obtidos por esses autores e citados em toda discussão desse trabalho, limitam-se apenas à simulação Monte Carlo. Evidentemente, são resultados empíricos e avaliando algumas situações escolhidas ao acaso por esses autores, o que, de certa forma, restringe a obtenção de conclusões mais amplas.

O método Wald ajustado foi proposto por Agresti & Coull (1998) com a finalidade de melhorar a cobertura do intervalo de Wald, para duas populações binomiais. Considerando esse fato, os resultados encontrados na Tabela 2 evidenciam que a expansão desses métodos para um número maior de populações, representadas por meio das funções lineares, resultou em probabilidades questionáveis.

Esse questionamento é coerente, ao avaliar o método de Wald ajustado, em que as populações foram simuladas considerando-se o valor paramétrico em p=0,2. Nesse caso, suas probabilidades de cobertura foram inferiores às probabilidades do método de Wald, além de terem sido inferiores ao nível de confiança nominal. Contudo, enfatizando o estudo da abordagem bootstrap nos métodos em questão, pode-se observar que, os resultados propiciados pela generalização bootstrap do método de Wald ajustado, referidos na Tabela 2 por Wald(ajust.)(Boot), corrigiu essa deficiência, apresentando probabilidades próximas ao método de Wald original.

Diante desses resultados, para julgar a viabilidade de aplicar a generalização bootstrap no método de Wald ajustado, uma vez que tal generalização envolve um esforço computacional relativamente custoso, justifica-se realizar um estudo de precisão. Procedeu-se, assim, a uma análise que contemplasse medidas das amplitudes médias intervalares (Tabela 3), considerando apenas os resultados mais expressivos discutidos anteriormente.

De modo geral, os resultados encontrados (Tabela 3) revelaram que os métodos de Wald e Wald(ajust.)(Boot) mostraram praticamente a mesma precisão, com leves oscilações ocasionadas, supostamente devido ao erro Monte Carlo. Portanto, no que tange à precisão dos métodos, a generalização bootstrap não apresentou resultados que possam justificar seu uso.

Dadas as configurações entre os tamanhos amostrais e os valores paramétricos e a formalização dos contrastes avaliados nesse trabalho, concluiu-se que a generalização do método bootstrap infinito apresentou desempenho similar ao dos métodos convencionais. A exceção foi apenas para o método de Wald (ajust.), cujos resultados referentes à probabilidade de cobertura indicaram que a generalização bootstrap foi compensável, no sentido de justificar seu esforço computacional, nas situações (p=0,2), em que os coeficientes da função linear foram definidos de forma a comparar uma proporção versus as demais.

Recebido em 9 de março de 2006

Aprovado em 31 de março de 2008

  • AGRESTI, A.; CAFFO, B. Simple and effective confidence intervals for proportions and differences of proportions result from adding two failures. American Statistician, Alexandria, v. 54, n. 4, p. 280-288, 2000.
  • AGRESTI, A.; COULL, B. A. Aproximate is better than "exact" for interval estimation of binomial proportions. American Statistician, Alexandria, v. 52, p. 119-126, 1998.
  • BONETT, D. G.; WOODWARD, J. A. Application of the kronecker product and Wald test in log-linear models. Comput Statistic Quarterly, [S.l.], v. 3, p. 235-243, 1987.
  • CARARI, M. L. Intervalo de confiança para a diferença de duas proporções binomiais utilizando bootstrap infinito 2004. 66 f. Dissertação (Mestrado em Agronomia) - Universidade Federal de Lavras, Lavras, 2004.
  • COHEN, L. A.; KENDALL, M. E.; ZANG, E.; MESCHTER, C.; ROSE, D. P. Modulation of N-nitrosomethylurea-induced mammary tumor promotion by dietary fiber and fat. Journal Natural Cancer Institute, [S.l.], v. 83, p. 496-501, 1991.
  • CONLON, M.; THOMAS, R. G. A new confidence interval for the difference of two binomial proportions. Computational Statistics & Data Analysis, Amsterdam, v. 9, n. 2, p. 237-241, 1990.
  • GREENLAND, S. Simple and effective confidence intervals for proportions and differences of proportions result from adding two successes and two failures. American Statistician, Washington, v. 55, p. 172, 2001.
  • PRICE, M. R.; BONETT, D. G. An improved confidence interval for the difference of two binomial proportions. Computational Statistics & Data Analysis, Amsterdam, v. 45, p. 449-456, 2004.

Datas de Publicação

  • Publicação nesta coleção
    09 Mar 2010
  • Data do Fascículo
    2009

Histórico

  • Aceito
    31 Mar 2008
  • Recebido
    09 Mar 2006
Editora da Universidade Federal de Lavras Editora da UFLA, Caixa Postal 3037 - 37200-900 - Lavras - MG - Brasil, Telefone: 35 3829-1115 - Lavras - MG - Brazil
E-mail: revista.ca.editora@ufla.br