Acessibilidade / Reportar erro

Procedimento estatístico para validação de escalas diagramáticas na quantificação de doenças

Statistical procedure for validation of diagrammatic scales to disease quantification

Resumos

Na validação de escalas diagramáticas de doenças é comum utilizar a regressão linear simples para testar a identidade entre dados estimados e valores reais de severidade de doença. Nestes casos, após ajustar a regressão linear, as hipóteses H01: β0 = 0 e H02: β1 = 1 ão testadas, mas não de forma simultânea, ou seja, se β0 = 0 ao mesmo tempo em que β1 = 1, ou, se β1 = 1 ao mesmo tempo em que β0 = 0. O objetivo deste trabalho foi propor um novo procedimento estatístico para validação de escalas diagramáticas, denominado L&O. Este procedimento resulta da combinação do teste F, modificado por Graybill (1976), teste t para o erro médio e análises do coeficiente de correlação linear. Este procedimento foi aplicado para testar a identidade entre valores estimados e valores reais de severidade da doença causada por Quambalaria eucalypti em eucalipto. Os resultados mostraram que o procedimento estatístico foi eficiente, não subjetivo e permitiu também testar a identidade entre quaisquer dois vetores ou grupos de dados quantitativos.

Quantificação de doenças; Severidade; Acurácia e precisão


Validation of disease diagrammatic scale is commonly done by using simple linear regression to test the identity between estimates and observed values of disease severity . In this case, when adjusting a linear regression, only evaluation of the hypotheses H01:β0 = 0 and H02: β1 = 1, are made without testing these hypotheses simultaneously, if β0 = 0 at same time that β1 = 1, or, if β1 = 1 at the same time that β0= 0. The objective of this work was to propose a novel statistical procedure to validate disease diagrammatic scales. The proposed procedure, namely L&O, results from the combination of the F test modified from Graybill (1976), t test for the medium error and analysis of the linear correlation coefficient. This procedure was applied to test the identity between estimates with diagrammatic scale and observed values of severity disease caused by Quambalaria eucalypti in eucalypt. The results showed that the proposed statistical procedure is efficient and not subjective and it could also be used to test the identity between any two vectors or groups of quantitative data.

Disease quantification; Severity; Accuracy and Precision


Procedimento estatístico para validação de escalas diagramáticas na quantificação de doenças

Statistical procedure for validation of diagrammatic scales to disease quantification

Reginaldo Gonçalves MáfiaI; Maria Alves FerreiraII; Daniel Henrique Breda BinotiIII; Hélio Garcia LeiteIV

ICentro de Tecnologia. Fibria Celulose S.A. Aracruz, ES. E-mail:<rgoncalves@fibria.com.br>

IIDepartamento de Fitopatologia, Universidade Federal de Lavras. Lavras, MG. E-mail: <mariaferreira@dfp.ufla.br>

IIIPós graduação em Ciências Florestais, Universidade Federal de Viçosa, Viçosa, MG. E-mail: <danielbinoti@yahoo.com.br>

IVDepartamento de Engenharia Florestal, Universidade Federal de Viçosa, Viçosa, MG. E-mail: <hgleite@ufv.br>

RESUMO

Na validação de escalas diagramáticas de doenças é comum utilizar a regressão linear simples para testar a identidade entre dados estimados e valores reais de severidade de doença. Nestes casos, após ajustar a regressão linear, as hipóteses H01: β0 = 0 e H02: β1 = 1 ão testadas, mas não de forma simultânea, ou seja, se β0 = 0 ao mesmo tempo em que β1 = 1, ou, se β1 = 1 ao mesmo tempo em que β0 = 0. O objetivo deste trabalho foi propor um novo procedimento estatístico para validação de escalas diagramáticas, denominado L&O. Este procedimento resulta da combinação do teste F, modificado por Graybill (1976), teste t para o erro médio e análises do coeficiente de correlação linear. Este procedimento foi aplicado para testar a identidade entre valores estimados e valores reais de severidade da doença causada por Quambalaria eucalypti em eucalipto. Os resultados mostraram que o procedimento estatístico foi eficiente, não subjetivo e permitiu também testar a identidade entre quaisquer dois vetores ou grupos de dados quantitativos.

Palavras-chave adicionais: Quantificação de doenças, Severidade, Acurácia e precisão.

ABSTRACT

Validation of disease diagrammatic scale is commonly done by using simple linear regression to test the identity between estimates and observed values of disease severity . In this case, when adjusting a linear regression, only evaluation of the hypotheses H010 = 0 and H02: β1 = 1, are made without testing these hypotheses simultaneously, if β0 = 0 at same time that β1 = 1, or, if β1 = 1 at the same time that β0= 0. The objective of this work was to propose a novel statistical procedure to validate disease diagrammatic scales. The proposed procedure, namely L&O, results from the combination of the F test modified from Graybill (1976), t test for the medium error and analysis of the linear correlation coefficient. This procedure was applied to test the identity between estimates with diagrammatic scale and observed values of severity disease caused by Quambalaria eucalypti in eucalypt. The results showed that the proposed statistical procedure is efficient and not subjective and it could also be used to test the identity between any two vectors or groups of quantitative data.

Keywords: Disease quantification, Severity, Accuracy and Precision.

1. INTRODUÇÃO

A intensidade de doenças de plantas pode ser quantificada pela incidência, severidade ou prevalência. A severidade pode ser avaliada por meio de mensuração eletrônica, análise de vídeo, sensoriamento remoto, relação incidência/severidade ou, de modo mais comum, utilizando escalas diagramáticas de notas (MAFFIA et al., 1999; NUTTER, 1999).

A escala diagramática mais conhecida e utilizada em estudos fitopatológicos foi desenvolvida por Hosfall e Barrat (1945) e inclui 12 classes de severidade (AMORIM, 1995; BERGAMIN FILHO e AMORIM, 1996). A partir dessa escala, vários outros diagramas foram desenvolvidos, por exemplo, para a cultura do feijão (DÍAZ et al., 2001), inhame (MICHEREFF et al., 2000), citrus (SPÓSITO et al., 2004), tomate (BOFF et al., 1991), abacaxi (ROHRBACH e SCHIMITT, 1994), alface (O' BRIEN e VAN BRUGGEN, 1992), cereais (DUVEILLER, 1994), soja (MARTINS et al., 2004), eucalipto (ANDRADE et al., 2005), entre outras.

Antes de recomendar uma escala diagramática como método-padrão de quantificação de doença, é necessário realizar sua validação. Para isso, um grupo de avaliadores, com o auxílio da escala proposta, realiza estimativas de severidade considerando amostra com diferentes níveis de intensidade da doença. Essas informações, em uma segunda etapa, são empregadas para determinar a precisão e acurácia das estimativas. Para Nutter et al. (1991), a precisão é uma medida de repetibilidade nas avaliações de doença, podendo ser quantificada pelo coeficiente de determinação (r2). No entanto, a exatidão é medida de proximidade da estimativa com o valor real, a qual é determinada por regressão linear entre os valores estimados, com o uso da escala proposta, e os valores reais de severidade.

Considerando regressões lineares entre as estimativas obtidas com o uso da escala diagramática e os valores reais, estimativas exatas ocorrem quando as hipóteses H01: β0= 0 e H02: β1= 1 não são rejeitadas pelos testes t1 (β0) e t2 (β1), definidos por t1 = (β0-0)/Sβ0 e t2 = (β1-1)/Sβ1, respectivamente (DRAPPER e SMITH, 1981; KRANZ, 1988; MAFFIA et al., 1999; CAMPBELL e MADDEN, 1990; NUTTER et al., 1991; AMORIM, 1995). Todavia, essa estatística não testa, simultaneamente, se β0 = 0 ao mesmo tempo em que β1 = 1 ou se β1 = 1 ao mesmo tempo em que β0 = 0. De acordo com Leite e Oliveira (2002), o ideal é que essas hipóteses sejam testadas simultaneamente, ou seja, como segue abaixo:

Outra consideração sobre a validação de escalas diagramáticas consiste no emprego do valor do coeficiente de determinação (r2) como medida de precisão. Como se sabe, idealmente o valor dessa estatística não deve ser considerado de forma isolada. Na Figura 1 são demonstradas algumas situações que podem dificultar a interpretação correta do coeficiente de determinação. Em todos os casos, exceto no exemplo 1g, o r2 é alto, mas somente no caso 1a os valores estimados podem ser considerados equivalentes aos valores reais.


Para contornar essas dificuldades, este trabalho propõe na avaliação da acurácia empregar o teste F, modificado por Graybill (1976), no qual os valores de β0 e são testados simultaneamente, bem como utilizar o teste t para o erro médio. Como em alguns casos é possível obter baixo valor do erro médio, associado com baixo valor do coeficiente de determinação, conforme o exemplo de 1 g, propõe-se, também, empregar o coeficiente de correlação. Assim, na validação de uma escala diagramática, como de forma generalizada para comparar dois vetores ou grupos de dados quantitativos (teste de identidade de modelos), são empregados os testes F de Graybill e o teste t para o erro médio, bem como o coeficiente de correlação, conforme o procedimento estatístico denominado L&O, proposto por Leite e Oliveira (2002).

2. MATERIAL E MÉTODOS

2.1. Procedimento estatístico proposto

O procedimento proposto por Leite e Oliveira (2002) é empregado para comparar dois quaisquer vetores quantitativos, combinando a estatística F, na forma modificada por Graybill (1976), no teste de erro médio, e do coeficiente de correlação linear. Com base nessas estatísticas, é proposta uma regra de decisão para o teste de hipótese de identidade entre dois vetores quaisquer, ou seja, grupos de dados quantitativos.

Sendo Y1 e Yj dois vetores de dados quantitativos, nos quais j indica as estimativas obtidas com o uso de uma escala diagramática e 1 os valores reais observados de severidade da doença, normalmente distribuídos com média 0 e variância s2, representados por:

a relação entre Y1 e Yj pode ser matricialmente expressa por Yj = Y1β + , em que:

Sob a hipótese de normalidade:

na qual:

em que QMR é o quadrado médio dos resíduos da regressão Yj = β0 + β1Y1.

Consequentemente, com n 2 graus de liberdade (g.l.) e a um nível de significância a, a estatística F pode ser utilizada para testar a hipótese H0: β' = [0 1]. Se F(H0) > Fα (2, n-2 g.l.), a hipótese é rejeitada. Entretanto, se F(H0) < Fα (2, n-2 g.l.), a hipótese não é rejeitada, admitindo-se a identidade entre os dois conjuntos de dados, ou seja, Yj = Y1 em nível a de significância.

O valor do erro médio ( ) é dado pela expressão e = {∑[(YjiY1i)/Y1i]}/n . Considerando que os erros i = (YjiY1i)/Y1i seguem distribuição normal, a hipótese Ho: = 0 versus Ha: = 0 pode ser testada, utilizando-se a estatística t, dada por , em que , com n-1 graus de liberdade.

Se t

> tα(n-1), a hipótese H0 é rejeitada. Entretanto, se t < t (n-1), pode-se admitir que a diferença entre os dois métodos comparados seja casual, ou seja, a hipótese H0 é aceita.

O denominador da estatística F(H0) é 2QMR. Então, considera-se que, quanto maior a correlação entre os dois conjuntos de dados, menor o QMR. Consequentemente, o valor de F(H0) será maior e a chance de a hipótese H0 ser rejeitada também. Isso leva a crer que, quando os valores estimados com uso de uma escala diagramática forem muito similares aos valores reais, indicando alta precisão de Yj em relação a Y1, qualquer pequena diferença entre estimativas contidas naqueles vetores leva à rejeição de H0. A fim de evitar esse inconveniente, Guimarães (1994) propôs a combinação da estatística F(H0), da porcentagem de erro médio e do coeficiente de correlação, para comparar dados estimados por modelos de regressão com dados observados. O método proposto por esse autor demanda a fixação de limites aceitáveis para o coeficiente de correlação e para a percentagem média do erro. Além disso, é necessário quantificar o grau de associação entre os dados estimados e reais, o que também pode ser feito pelo coeficiente de correlação linear. Essa medição também é necessária porque somente o valor de β1 e a informação de que β1 1 não quantificam o quanto os dois vetores de dados estão associados.

Como previamente mencionado, é possível encontrar valor baixo de erro médio, ou seja, com β0 = 0, ao mesmo tempo em que β1 = 1, mas com baixo valor do coeficiente de correlação entre os dados estimados (Yj) e os valores reais (Y1) (Figura 1g).

Se as hipóteses H0: β' = [0 1] e H0 : e = 0 não forem rejeitadas, o caso está apresentado na Figura 1a. Entretanto, é possível que maior dispersão de Y1 em relação a Yj (Figura 1g) ainda ocorra. Dessa forma, H0: β' = [0 1] e H0: = 0 não seriam rejeitadas, juntamente com alta correlação entre Yj e Y1, o que permite seguramente concluir que os valores estimados não são estatisticamente diferentes dos valores reais. No entanto, a fim de evitar a subjetividade na definição do que seria alta correlação, o estimado é comparado com (1 | |), já que H0: = 0 não foi rejeitada. Um sumário do procedimento estatístico é apresentado na Tabela 1, mostrando as situações que podem ocorrem quando se aplica o procedimento estatístico proposto, com a indicação da decisão a ser tomada.

2.2. Estudo de caso

Os dados empregados para comparar o procedimento estatístico usual para validação de escala diagramática, com o método L&O proposto neste trabalho, foram obtidos de Andrade et al. (2005). Assim, pelo procedimento usual a acurácia dos dados estimados foi determinada pelo teste t dos parâmetros interseção e inclinação da reta, enquanto a precisão foi determinada pelo coeficiente de determinação. Consideraram-se com maior acurácia os avaliadores cujas estimativas resultaram em equações de regressão, em que os parâmetros 0 e β1 não diferiram estatisticamente de 0 e 1, respectivamente, e com maior precisão os avaliadores cujas estimativas permitiram o ajuste do modelo linear com maiores valores do coeficiente de determinação (r2). Os mesmos dados, para um grupo de 12 avaliadores, que estimaram a severidade de 50 imagens de folhas com diferentes níveis de severidade da doença, foram avaliados pelo procedimento L&O.

3. RESULTADOS E DISCUSSÃO

O procedimento estatístico L&O tem sido utilizado para testes de identidade de modelos em diferentes aplicações (DIAS et al., 2005; LEITE et al., 2006; LEITE e ANDRADE, 2003). Considerando o objetivo proposto neste trabalho, observou-se maior robustez do procedimento em função da comparação simultânea dos parâmetros do modelo linear, bem como do uso do coeficiente de correlação e do erro médio.

De acordo com os dados apresentados na Tabela 2, observa-se que para os avaliadores 10 e 12 houve rejeição da hipótese β0 = 0. Nesses casos, o teste da hipóteseβ1 = 1 diferiu na presença ou ausência do β0, em função dos motivos discutidos anteriormente. Para os avaliadores 3, 5 e 8, as hipóteses não foram aceitas simultaneamente para os dois parâmetros da regressão linear, dificultando a interpretação da acurácia. De acordo com o procedimento L&O, no qual as duas hipóteses foram testadas ao mesmo tempo, em todos esses casos os valores estimados diferiram dos valores reais. Nota-se que, para o avaliador 9, o teste t para o erro médio demonstrou que os valores estimados diferiram dos valores reais, de acordo com o procedimento L&O. Pelo procedimento convencional, esses conjuntos de dados foram considerados acurados e precisos. Observa-se, também, que o valor do coeficiente de determinação para todos os avaliadores foi elevado, não permitindo diferenciação. É importante mencionar que, havendo aceitação de H0(1): β0 =0 e rejeição de H0(2): β1 = 1, a regressão deve ser ajustada sem β0, ou seja, Ye= β1Yr +ε e, nesse caso, o coeficiente de determinação é a relação entre a soma de quadrados de parâmetros e a soma de quadrado total, portanto não pode ser comparado com aquele obtido para ajustar Y2 = β0 + β1Yr +ε.

Os avaliadores 1, 2 e 4, de acordo com o procedimento convencional e pelo proposto neste trabalho, apresentaram avaliações acuradas e precisas. O sucesso do uso de escalas diagramáticas depende da percepção visual e da experiência do avaliador (SPÓSITO et al., 2003), bem como da qualidade da escala utilizada. É importante mencionar também que é possível, dentro de certos limites, melhorar a capacidade do avaliador empregando softwares como o Distrain e o Disease.Pro. O uso desses softwares minimiza a subjetividade das avaliações (NUTTER e SCHULTZ, 1995). No entanto, sabe-se que determinados avaliadores, em função da percepção visual, não são indicados para realizar esse tipo de avaliação. Assim, recomenda-se selecionar indivíduos aptos à esse tipo de trabalho, os quais podem empregar o método proposto neste estudo.

A escala diagramática utilizada nesta pesquisa de caso foi previamente validada (ANDRADE et al., 2005), considerando-se o teste t independente para os parâmetros do modelo linear. Pelo procedimento proposto neste trabalho, a escala também foi validada, considerando-se a identidade de modelos lineares ajustados para dados reais e estimados de severidade com o uso da escala diagramática proposta. Pelo procedimento aqui proposto, pode-se observar que o ideal é testar os parâmetros do modelo linear de forma simultânea, ou seja, se β0 = 0 ao mesmo tempo em que β1 = 1 ou se β1 = 1 ao mesmo tempo em que β0 = 0. Adicionalmente, em função das diferenças entre avaliadores, é também importante padronizá-los, considerando a experiência em avaliação de intensidade de doenças, para aumentar a precisão e a acurácia das estimativas.

4. CONCLUSÕES

A escala diagramática empregada neste estudo de caso foi adequada para estimar a severidade da doença. Adicionalmente, observou-se variação na precisão e acurácia entre avaliadores, o que deve estar relacionado com diferenças na percepção visual dos indivíduos. Além disso, o procedimento estatístico proposto mostrou-se efetivo na validação de escalas diagramáticas de severidade de doenças, permitindo testar os parâmetros do modelo linear de forma simultânea, além de considerar a análise do coeficiente de correlação e do erro médio.

5. REFERÊNCIAS

Recebido em 04.07.2008 e aceito para publicação em 16.12.2011.

  • AMORIM, L. Avaliação de doenças. In: BERGAMIN FILHO, A., KIMATI, H., AMORIM, L. Manual de fitopatologia princípios e conceitos. São Paulo: Agronômica Ceres, 1995. p.647-671.
  • ANDRADE, G. C. G. et al. Escala diagramática para avaliação da severidade da mancha foliar do eucalipto causada por Quambalaria eucalypti Fitopatologia Brasileira, v.30, n.5, p.504-509. 2005.
  • BERGAMIN FILHO, A.; AMORIM, L. Doenças de plantas tropicais: epidemiologia e controle econômico. São Paulo, Agronômica Ceres, 1996. 299p.
  • BOFF, P.; ZAMBOLIM, L.; VALE, F. X. R. Escalas para avaliação de severidade de mancha de estenfílio (Stemphylium solani) e da pinta preta (Alternaria solani) em tomateiro. Fitopatologia Brasileira, v.16, p.280-283, 1991.
  • CAMPBELL, C. L.; MADDEN, L. V. Introduction to plant disease epidemiology New York: John Wiley & Sons, 1990. 532p.
  • DIAS, A. N. et al. Avaliação de métodos de ajuste de curvas de índices de local em povoamentos de eucalipto desbastados. Revista Árvore, v.29, p.741-747. 2005.
  • DÍAZ, C. G.; BASSANEZI, R. B.; BERGAMIN FILHO, A. Desenvolvimento e validação de uma escala diagramática para Xanthomonas axonopodis pv. phaseoli em feijoeiro. Summa Phytopathologica, v.27, p.35-39, 2001.
  • DRAPER, N. M.; SMITH, H. Applied regression analysis New York: Wiley, 1981. 709p.
  • DUVEILLER, E. A pictorial series of disease assessment keys for bacterial leaf streak of cereals. Plant Disease, v.78, p.137-141, 1994.
  • GRAYBILL, F. A. Theory and application of linear model Belmont: Duxbury, 1976. 704p.
  • GUIMARÃES, D. P. Desenvolvimento de um modelo de distribuição diamétrica de passo invariante para prognose e projeção da estrutura de povoamentos de eucalipto 1994. 160f. Tese (Doutorado em Ciência Florestal) - Universidade Federal de Viçosa, Viçosa, MG, 1994.
  • HORSFALL, J. G.; BARRAT, R. W. An improved grading system for measuring plant disease. Phytopathology, v.35, p.655, 1945.
  • KRANZ, J.; ROTEM, J. Experimental techniques in plant disease epidemiology. Heidelberg: Springer Verlag, 1988.
  • LEITE, H. G.; ANDRADE, V. C. L. Importância das variáveis altura dominante e altura total em equações hipsométricas e volumétricas. Revista Árvore, v.27, n.2, p.301-310, 2003.
  • LEITE, H. G. et al. Um modelo de distribuição diamétrica para povoamentos de Tectona grandis submetidos a desbaste. Revista Árvore, v.30, n.1, p.89-98, 2006.
  • LEITE, H. G.; OLIVEIRA, F. H. T. Statistical procedure to test the identity of analytical methods. Communications in Soil Science and Plant Analysis, v.33, p.1105-1118. 2002.
  • MAFFIA, L. A.; MIZUBUTI, E. S. G.; AMORIM, L. Quantificação da intensidade de doenças. Mini-curso. In: CONGRESSO BRASILEIRO DE FITOPATOLOGIA, 32., 1999, Curitiba. Anais... Curitiba: 1999.
  • MARTINS, M. C. et al. Escala diagramática para a quantificação do complexo de doenças foliares de final de ciclo em soja. Fitopatologia Brasileira, v.29, p.179-184. 2004.
  • MICHEREFF, S. J.; MAFFIA, L. A.; NORONHA, M. A. Escala diagramática para avaliação da severidade da queima das folhas do inhame. Fitopatologia Brasileira, v.25, p.612-619, 2000.
  • NUTTER Jr., F. W.; SCHULTZ, P. M. Improving the accuracy and precision of disease assessment: Selection of methods and use of computer-aided training programs. Canadian Journal of Plant Pathology, v.17, p.174-178, 1995.
  • NUTTER, Jr., F. W. Quantification of plant diseases. Mini-curso. In: CONGRESSO BRASILEIRO DE FITOPATOLOGIA, 32., 1999, Curitiba. Anais.. Curitiba: 1999.
  • NUTTER, Jr., F. W.; TENG, P. S.; SHOKES, F. M. Disease assessment terms and concepts. Plant Disease, v.75, p.1187-1188, 1991.
  • O'BRIEN, R. D.; van BRUGGEN, A. H. C. Accuracy, precision, and correlation to yield of disease severity scales for corky root of lettuce. Phytopathology, v.82, n.1, p.91-96, 1992.
  • ROHRBACH, K.G. & SCHMITT, D. P. Pineapple. In: PLOETZ, R. C. et al. (Eds). Compendium of tropical fruit diseases St. Paul: APS Press, 1994. p.45-55.
  • SPÓSITO, M. B. et al. Elaboração e validação de escala diagramática para avaliação da severidade da mancha preta em frutos cítricos. Fitopatologia Brasileira, v.28, p.S231, 2003. (Resumo).
  • SPÓSITO, M. B. et al. Elaboração e validação de escala diagramática para avaliação da severidade da mancha preta em frutos cítricos. Fitopatologia Brasileira, v.1, p.81-85, 2004.

Datas de Publicação

  • Publicação nesta coleção
    03 Maio 2011
  • Data do Fascículo
    Abr 2011

Histórico

  • Recebido
    04 Jul 2008
  • Aceito
    16 Dez 2011
Sociedade de Investigações Florestais Universidade Federal de Viçosa, CEP: 36570-900 - Viçosa - Minas Gerais - Brazil, Tel: (55 31) 3612-3959 - Viçosa - MG - Brazil
E-mail: rarvore@sif.org.br