Acessibilidade / Reportar erro

Ordenação de populações em amplas classes de nível de saúde, segundo um indicador abrangente definido por uma função discriminante linear

Ranking of populations in broad classes of health levels according to a comprehensive indicador defined by a linear discriminant function

Resumos

Utilizando a função discriminante linear, propõe-se um indicador de nível de saúde abrangente de vários indicadores usuais, a saber: o coeficiente de mortalidade geral (CMG), indicador quantificado de Guedes (IG), esperança de vida ao nascer (EV), coeficiente de natalidade (CN), coeficiente de mortalidade infantil (CMI) e coeficiente de mortalidade por doenças transmissíveis (CMDT). Para a padronização dos dois últimos, foi proposta e utilizada uma população padrão mediana; para sua formação, cada grupo etário concorre com a mediana das percentagens de participação desse grupo na composição da população de cada um dos 44 países estudados. A análise crítica das equações de funções discriminantes obtidas com a técnica passo a 2895 2060 1000 passo ascendente (stepwise), mostrou que o valor: Z = 2895/CMI + 2060/CN + 1000/CMDTp, pode ser utilizado como indicador abrangente, permitindo a ordenação de países em amplas classes de nível de saúde.

Indicador de nível de saúde; Função discriminante linear; População padrão mediana


There are, very often, considerable discrepancies when countries are ranked according to the values of each of the common health indicators. By the use of computed linear discriminant functions the authors developed a single indicator designed to convey the information gathered from the following health indicators: life expectancy at birth (LE), birth rate (BR), infant mortality rate (IMR), quantified indicator of Guedes (GI), general mortality rate (GMR) and mortality rate (MR) by infective and parasitic diseases (MRIPD), the last two age adjusted. For the construction of this adjustment a median standard population was suggested and used, each age group contributed with the average of the percentages of participation of the group in the composition of the population of each one of the 44 countries studied. These were those for which it was possible to get reliable data for the years around 1980. The contrasted groups in computing discriminant functions, each one consisting of 12 countries, were defined according to a criterion based on the rank of the sum of the normal reduced deviations calculated for the distributions of the values for each indicator. For the computation of discriminant function equations by the stepwise technique, reciprocal transformation was used for the four indicators expressed as ratios and for the other two their face values were used. Critical analysis of results as shown that the formula: Z = 2895/IMR + 2060/BR + 1000/MRIPD, can be used as a comprehensve indicator allowing the ranking of countries in broad classes of health levels, as follows: A - 737 or more; Denmark and Sweden; B - 637 |- 737: Australia, Netherland, England and Wales, Iceland, Luxembourg, Norway and Switzerland; C - 537 |- 637: Federal Republic of Germany, Canada, Scotland, Finland and Japan; D - 437 |- 537: Austria, Belgium, United States, France, Northern Ireland, Italy and New Zealand; E - 337 |- 437: Bulgaria, Spain, Greece, Hong Kong, Hungary, Ireland, Israel and Singapore; F - 237 |- 337: Barbados, Costa Rica, Yugoslavia, Poland, Portugal and Romania; G - 137 |- 237: Chile, Guyana, Mauritius, Panama, Trinidad and Tobago and Uruguay; H - < 137: Egygt, Guatemala and Mexico.

Health status indicators; Comprehensive health indicator; Linear discriminant function; Median standard population


ARTIGO ORIGINAL

Ordenação de populações em amplas classes de nível de saúde, segundo um indicador abrangente definido por uma função discriminante linear

Ranking of populations in broad classes of health levels according to a comprehensive indicador defined by a linear discriminant function

Neil Ferreira Novo; Yára Juliano; Elias Rodrigues de Paiva; Walter Leser

Do Departamento de Medicina Preventiva da Escola Paulista de Medicina — Rua Botucatu, 740 — 04023 — São Paulo, SP — Brasil.

RESUMO

Utilizando a função discriminante linear, propõe-se um indicador de nível de saúde abrangente de vários indicadores usuais, a saber: o coeficiente de mortalidade geral (CMG), indicador quantificado de Guedes (IG), esperança de vida ao nascer (EV), coeficiente de natalidade (CN), coeficiente de mortalidade infantil (CMI) e coeficiente de mortalidade por doenças transmissíveis (CMDT). Para a padronização dos dois últimos, foi proposta e utilizada uma população padrão mediana; para sua formação, cada grupo etário concorre com a mediana das percentagens de participação desse grupo na composição da população de cada um dos 44 países estudados. A análise crítica das equações de funções discriminantes obtidas com a técnica passo a 2895 2060 1000 passo ascendente (stepwise), mostrou que o valor: Z = 2895/CMI + 2060/CN + 1000/CMDTp, pode ser utilizado como indicador abrangente, permitindo a ordenação de países em amplas classes de nível de saúde.

Unitermos: Indicador de nível de saúde. Função discriminante linear. População padrão mediana.

ABSTRACT

There are, very often, considerable discrepancies when countries are ranked according to the values of each of the common health indicators. By the use of computed linear discriminant functions the authors developed a single indicator designed to convey the information gathered from the following health indicators: life expectancy at birth (LE), birth rate (BR), infant mortality rate (IMR), quantified indicator of Guedes (GI), general mortality rate (GMR) and mortality rate (MR) by infective and parasitic diseases (MRIPD), the last two age adjusted. For the construction of this adjustment a median standard population was suggested and used, each age group contributed with the average of the percentages of participation of the group in the composition of the population of each one of the 44 countries studied. These were those for which it was possible to get reliable data for the years around 1980. The contrasted groups in computing discriminant functions, each one consisting of 12 countries, were defined according to a criterion based on the rank of the sum of the normal reduced deviations calculated for the distributions of the values for each indicator. For the computation of discriminant function equations by the stepwise technique, reciprocal transformation was used for the four indicators expressed as ratios and for the other two their face values were used. Critical analysis of results as shown that the formula: Z = 2895/IMR + 2060/BR + 1000/MRIPD, can be used as a comprehensve indicator allowing the ranking of countries in broad classes of health levels, as follows: A - 737 or more; Denmark and Sweden; B - 637 |— 737: Australia, Netherland, England and Wales, Iceland, Luxembourg, Norway and Switzerland; C - 537 |— 637: Federal Republic of Germany, Canada, Scotland, Finland and Japan; D - 437 |— 537: Austria, Belgium, United States, France, Northern Ireland, Italy and New Zealand; E - 337 |— 437: Bulgaria, Spain, Greece, Hong Kong, Hungary, Ireland, Israel and Singapore; F - 237 |— 337: Barbados, Costa Rica, Yugoslavia, Poland, Portugal and Romania; G - 137 |— 237: Chile, Guyana, Mauritius, Panama, Trinidad and Tobago and Uruguay; H - < 137: Egygt, Guatemala and Mexico.

Uniterms: Health status indicators. Comprehensive health indicator. Linear discriminant function. Median standard population.

INTRODUÇÃO

Para avaliação do nível de saúde de uma população são utilizados vários indicadores, na sua quase totalidade representados por coeficientes baseados em dados de mortalidade (geral, por doenças transmissíveis, infantil e materna) ou em valores da mortalidade proporcional por idade (Razão de Mortalidade Proporcional de Swaroop e Uemura, Curva de Mortalidade Proporcional de Nelson Moraes e Indicador Quantificado de Guedes). Também calculadas a partir de dados de mortalidade, freqüentemente são referidas as esperanças de vida, ao nascer e na idade de um ano. Uma exceção é dada pelo coeficiente de natalidade, demonstradamente relacionada com as condições de saúde do grupo materno-infantil.

Verifica-se porém, com freqüência que, quando são comparadas várias populações utilizando cada um desses indicadores, observam-se discrepancias, por vezes marcantes, entre as posições relativas que um mesmo país ocupa nas diferentes ordenações. Assim, de uma comparação realizada em termos de um deles, resultarão conclusões que, na realidade, dependem da escolha feita.

Recorrendo ao emprego de técnica já utilizada por Swaroop e Uemura 10 (1957) procurou-se estudar as equações discriminantes envolvendo vários indicadores mais freqüentemente utilizados, visando a encontrar, entre elas, a que mais adequadamente forneça uma expressão abrangente do conjunto de indicadores estudados. Com os valores da estatística Z, calculados, segundo tal equação, torna-se possível a ordenação em amplas classes, quanto ao nível de saúde, de diferentes populações, ou de uma mesma população em sucessivas épocas.

MATERIAL E MÉTODOS

Indicadores utilizados

Os valores de CN e do CMI foram colhidos diretamente das fontes consultadas. Os valores da EV foram fornecidos nas fontes, separadamente para homens e para mulheres; o valor para a população foi obtido pelo cálculo da média ponderada dos valores para os sexos.

Para o cálculo do IG surgiu o problema da discrepância entre a distribuição etária dos óbitos, adotada no anuário da OMS 11, e os grupos etários propostos por Moraes 6 (1959) e seguidos por Guedes 4 (1972). Tornaram-se necessárias interpelações, nos grupos 15-24 e 45-54, tendo-se para tanto recorrido aos multiplicadores de Karup-King indicados para a divisão de grupos ao meio (Shryock e Siegel7, 1973).

No caso do CMG impunha-se a padronização, tendo em vista as previsíveis diferenças de composição das populações. A mesma situação ocorria, evidentemente, com relação ao CMDT, acrescentando-se, entretanto, a necessidade de ser considerada a principal das causas de erro envolvidas na determinação deste coeficiente, ou seja, a freqüência de óbitos classificados na rubrica "sintomas, sinais e afecções mal definidas". Referirnos-emos a eles, como é usual, por "óbitos por causas mal definidas",

PAÍSES ESTUDADOS

Para a inclusão de um país no conjunto a ser estudado, era necessário que se dispusesse de dados referentes à população e aos óbitos por causas, com distribuição por grupos etários, bem como de informações sobre o valor da natalidade e da esperança de vida ao nascer, em um dado ano.

Como fonte básica de tais dados foram utilizadas edições sucessivas de publicação da OMS (World Health Statistics Annual11, 1977-1982).

Estabeleceu-se, ainda, que somente seriam incluídos países cujos dados fossem apontados, na publicação referida, como confiáveis.

Em alguns poucos casos, dados faltantes puderam ser encontrados em edições sucessivas de publicação das Nações Unidas (Demographic Yearbook, 1978-1981).

Procurou-se utilizar dados recentes, remontando o mais antigo (México) a 1975.

Levando em conta os critérios acima descritos, chegou-se a uma amostra de 44 países, estes com os mais variados graus de desenvolvimento e de tamanho de população, com localização geográfica abrangendo cinco continentes. Não se trata, evidentemente, de amostra representativa da totalidade dos países, pois a inclusão de cada um dependeu da sua capacidade de fornecer, à OMS, dados por esta qualificados como confiáveis. Tal característica, a da representatividade, não era, entretanto, necessária para o objetivo do presente estudo. Infelizmente, não pôde ser incluído o Brasil, por não figurarem seus dados nas fontes utilizadas.

Foram incluídos no estudo os países relacionados em ordem alfabética na Tabela 1, na qual constam, também, para cada um dos grupos etários adotados nas publicações da OMS, os dados referentes a população e a participação percentual no total. Sendo os dados apresentados nas fontes com arredondamento ao milhar, as somas dos valores dos grupos etários podem não coincidir exatamente com a população total. O mesmo sucede, naturalmente, no caso das percentagens de participação, calculadas com arredondamento à segunda decimal. Apenas no caso do Japão foi encontrada, nas fontes, freqüência na cásela referente a "idade não especificada"; procedeu-se, então, à distribuição dessa freqüência (54.000) em partes proporcionais às freqüências dos grupos etários.

Correção da causa de erro decorrente de óbitos por causas mal definidas

Tentando atenuar os erros que resultam, no cálculo do CMDT, de diferenças marcantes, entre os países, nas freqüências relativas de óbitos por causas mal definidas, foi necessário trabalhar com a hipótese de que, entre eles, a proporção de óbitos por doenças transmissíveis seja a mesma que a existente entre os que têm causas identificadas nos atestados, ou seja, o total de óbitos menos os óbitos por causas mal definidas.

Com essa admissão e sendo:

0 = total de óbitos;

t = número de óbitos por doenças transmissíveis (segundo os atestados);

MD = número de óbitos por causas mal definidas,

temos:

= proporção de óbitos pordoenças transmissíveis entre os que têm causas identificadas;

= número de óbitos por doenças transmissíveis entre os óbitos por causas mal definidas;

T = t + = = total estimado, em função da admissão feita, de óbitos por doenças transmissíveis.

Esse total, calculado por grupo etário, foi utilizado na padronização do coeficiente.

Padronização de coeficientes. População mediana

Sendo a idade, entre os atributos eventualmente associados com a variável estudada, a mais importante e mais freqüentemente posta em foco, apenas ela foi considerada na padronização dos coeficientes.

Surgiu, então, como sempre ocorre em tal procedimento, o problema da escolha da população a ser adotada como padrão.

No presente trabalho, o problema da escolha do padrão foi consideravelmente dificultado, pois, como se vê na Tabela 1, há acentuadas diferenças entre as populações no referente à participação dos grupos etários na sua composição.

População padrão mediana

Tendo em mente a recomendação de Shryock e Siegel7 (1973), salientando que a "regra geral é selecionar a distribuição de idades que seja semelhante à distribuição das várias populações estudadas", pareceu válida a idéia de definir uma "População Padrão Mediana". Partindo das percentagens de participação dos grupos etários na composição da população de cada um dos países estudados, foi determinada a percentagem mediana para cada grupo etário. Essas medianas fornecem, então, a composição, em termos de percentagem de participação de cada grupo etário em uma população padrão. Visando a alcançar simplificação operacional, procedeu-se a ajustamento proporcional, para que a soma fosse igual a 100; finalmente, com arredondamento ao milhar, foram estabelecidas as freqüências de cada grupo em uma população igual a um milhão.

A escolha da mediana das percentagens de participação, em lugar da média aritmética, visou a afastar a influência que, no caso desta, seria exercida pela eventual ocorrência, em certos grupos etários, de percentagens de participação fortemente discrepantes das demais.

Na Tabela 1 são também apresentados os dados básicos para o cálculo da "População Padrão Mediana" e, na Tabela 2 os países que delimitam a mediana, bem como os valores ajustados, ao milhar, para os grupos etários dessa população.

Padronização dos coeficientes de mortalidade geral e de mortalidade por doenças transmissíveis

Uma vez obtida a "População Padrão Mediana", pôde-se calcular os coeficientes padronizados de mortalidade geral e de mortalidade por doenças transmissíveis, este com os valores corrigidos considerando os óbitos por causas mal definidas.

Foi adotado o método direto de padronização, por ser o que permite comparação dos valores obtidos para os diferentes países.

Esses coeficientes padronizados serão os utilizados em todos os cálculos e fórmulas, com as siglas CMDTp e CMGp.

Cálculo das funções discriminantes lineares

Para o cálculo das funções discriminantes, levando em conta que quatro dos seis indicadores são representados por taxas, resolveu-se, seguindo recomendação de Sokal e Rohlf 9 (1969), adotar a transformação recíproca dos valores de tais indicadores, ou seja, do CMI, do CN, do CMDTp e do CMGp, mantendo os valores numéricos da EV e do IG. Para evitar decimais antes do primeiro algarismo significativo, as recíprocas foram calculadas pela razão . Além disso, para simplificar a expressão das equações em que figurem esses valores transformados e não transformados, convencionou-se adotar os seguintes símbolos:

IG. Foi essa transformação que proporcionou os maiores valores para a distância quadrática generalizada de Mahalanobis.

Formação dos grupos de países a serem estudados

A técnica da função discriminante tem sido aplicada em vários campos da biologia, especialmente em sistemática. Para a classificação dos integrantes de cada um dos grupos é usualmente possível utilizar critérios objetivos, mas no presente estudo, fundamento desta natureza não existe para essa classificação.

Swaroop e Uemura 10 (1957) enfrentaram o mesmo problema, ou seja, o de constituir dois grupos de países que, do ponto de vista da saúde fossem, ou "desenvolvidos" ou "subdesenvolvidos". Em seus próprios termos: "escolhemos deliberadamente dois grupos de países que sabemos a priori diferirem um do outro quanto a seus níveis de saúde".

Pareceu-nos conveniente basear nossa escolha dos países de cada grupo em algum critério menos subjetivo. Era necessário definir tal critério, capaz de permitir uma ordenação dos países, em termos de nível de saúde, avaliado, por alguma forma, com base nos indicadores escolhidos. Visando a afastar defeitos identificáveis em outras soluções possíveis (soma de postos nas ordenações de cada indicador; média de "notas" atribuídas a cada país, para cada indicador, por exemplo), adotou-se como variável, o desvio reduzido de cada valor dxi, contado a partir da média da distribuição a que pertence, ou seja:

dxi = em que

Xi = o valor numérico de indicador não expresso em taxa (EV e IG)

ou

=

Xi = média aritmética de Xi

= desvio padrão estimado de Xi

Definiu-se, então, como critério, o valor da soma algébrica, para cada país, dos desvios reduzidos calculados para cada indicador. Tal valor poderia, eventualmente, ser considerado um indicador abrangente dos indicadores incluídos no seu cálculo. Entretanto, isso implicaria admissão de pesos iguais para todos esses indicadores, hipótese que parece pouco aceitável. Além disso, sua determinação ficaria extremamente penosa quando se tratasse de país não incluído na relação, exigindo cálculo de novas médias, desvios padrão e desvios reduzidos para o novo grupo. Em última análise, o objetivo do presente estudo foi, exatamente, o de procurar estabelecer pesos que traduzissem a participação de cada indicador na composição de uma estatística capaz de permitir, como o fizeram Swaroop e Uemura 10 (1957), a ordenação de países em amplas classes de nível de saúde,

Os valores das variáveis X1 a X6 e dos desvios reduzidos referentes a cada uma delas figuram na Tabela 3.

Tratava-se, em seguida, de definir o tamanho dos grupos de países a serem confrontados, no cálculo das funções discriminantes. Foi adotado o critério estabelecido por Kelley5 (1939) para a técnica de análise por itens, de testes educacionais, atribuindo a cada grupo 27% do total de provas, em um e outro extremo da distribuição de resultados. Assim, resultaram dois grupos de tamanho 12, integrados por países com valores correspondentes aos dois extremos da distribuição da soma de desvios reduzidos.

Foram designados por "mais desenvolvidos" os 12 países com maior soma de desvios reduzidos. São eles: Alemanha Federal, Austrália, Canadá, Dinamarca, Holanda, Inglaterra e Gales, Islândia, Japão, Luxemburgo, Noruega, Suécia e Suiça. No grupo a ser com ele confrontado, o dos "menos desenvolvidos", figuram os 12 com menores somas, a saber: Chile, Costa Rica, Egito, Guatemala, Guiana, Ilhas Maurícias, Iugoslávia, México, Panamá, Romênia, Trinidad e Togabo e Uruguai.

MÉTODOS ESTATÍSTICOS

Cálculo da junção discriminante

Como referem Snedecor e Cochran8 (1971), em discussão sucinta, mas esclarecedora, sobre função discriminante, esta foi desenvolvida independentemente por Fisher, Mahalanobis e Hotteling, na década de 30. Para o cálculo dessa função, seguiu-se o modelo apresentado por Goulden3 (1952).

Foi utilizada a técnica passo a passo (stepwise), ascendente, como descrita por Armitage1 (1971). Calculou-se, inicialmente, o poder de discriminação de cada um dos indicadores, isoladamente. Esse poder de discriminação foi medido pela diferença quadrática de Mahalanobis. Depois de eleito o indicador único com maior poder de discriminação, foram acrescentados um a um os indicadores restantes, passando assim a trabalhar com funções com dois indicadores. Após escolher o par de indicadores com maior poder de discriminação, foram acrescentados cada um dos restantes, novamente selecionando o conjunto mais discriminador. Usando o mesmo procedimento, chegou-se às funções discriminantes com números crescentes de indicadores, mesmo que o acréscimo não mais proporcionasse ganho significante na discriminação.

O efeito da adição de cada indicador foi medido pela diferença observada entre as Somas de Quadrados, entre grupos, com o novo indicador e sem o mesmo. Essa diferença, dividida pelo Quadrado Médio do Resíduo da Análise de Variância (com o novo indicador incluído), forneceu a significância do ganho observado com a adição do referido indicador.

Outros métodos estatísticos

Além desses métodos estatísticos, foi utilizado, para os valores de Z obtidos nas equações discriminantes, o teste de aderência à curva normal, de Kolmogorov-Smirnov (Sokal e Rohlf 9, 1969). A significancia das estatísticas G1 e G2, para as mesmas distribuições de Z foi determinada mediante teste "t" de "Student". Decidiu-se rejeitar a hipótese de nulidade quando a < 0,05.

RESULTADOS

Como já foi referido, a seleção das equações, envolvendo os seis indicadores utilizados no trabalho, baseou-se nos resultados do cálculo das funções discriminantes lineares. Essa seleção se fez pela aplicação da técnica passo a passo ascendente.

Inicialmente, o cálculo foi feito a partir dos valores numéricos dos indicadores. Tendo em vista que os maiores valores da diferença quadrática de Mahalanobis foram observados quando se trabalhou com as recíprocas dos valores numéricos dos indicadores representados por taxas, resolveu-se trabalhar com os valores de Xi relacionados na Tabela 3, ou seja, as recíprocas de CMI, CN, CMDTp e CMGp e os valores numéricos de EV e IG. Foram, assim, obtidos os valores apresentados na Tabela 4 que mostra dados complementares referentes a características das distribuições e às correlações entre elas. Observa-se, nessa tabela, que acréscimos significantes da soma de quadrados ocorrem até o quinto passo. Nesta tabela, na apresentação das equações discriminantes, selecionadas em cada passo, a partir do segundo, foi feita, também, a indicação da forma simplificada que assumem pela divisão de todos os coeficientes pelo correspondente a X4.

DISCUSSÃO

Como se observa na Tabela 4, para fins de discriminação entre os dois grupos, de "mais desenvolvidos" e "menos desenvolvidos", a equação correspondente ao quinto passo deveria ser selecionada, pois, até ele, acréscimos significantes na soma de quadrados são proporcionados de passo a passo.

Entretanto, como foi apontado, nosso objetivo era o de selecionar a equação que mais adequadamente propiciasse a ordenação dos países em classes, em termos de nível de saúde.

Foi necessário, então, comparar as distribuições dos valores de Z, calculados segundo as equações selecionadas a cada passo, estudando o seu relacionamento com algum critério que se possa considerar válido.

Para tanto, foi inicialmente elaborada a Tabela 5 em que se encontram os valores de Z calculados nos termos dessas seis equações para os 44 países.

Desde logo cabe assinalar que, como se vê pelos valores fornecidos pelo teste de Kolmogorov-Smirnov e pelas estatísticas G1 e G2, nenhuma das distribuições de valores de Z afasta-se significantemente da normalidade.

Assume especial importância a ocorrência, nas equações que incluem mais de três indicadores, de sinais de coeficientes que não se coadunam com a lógica do problema. De fato, nas equações 4, 5 e 6, o sinal negativo de X6 implica tanto maior redução do valor de Z quanto maior o valor do Indicador de Guedes; também na equação 6 o sinal negativo de X3 acarreta redução maior do valor de Z quando a Esperança de Vida aumenta.

Tal situação surge, com certa freqüência, em análises multivariadas, não só no caso de funções discriminantes como também em regressões múltiplas, como resultado das complexas inter-relações entre as variáveis. Certamente não há interferência na capacidade discriminante, como comprovam os valores de D2, ou seja, mesmo com sinais que divergem do esperado, reduz-se a probabilidade de erro de classificação, de cada indivíduo estudado, em um ou outro dos grupos.

Para o presente objetivo, porém, impunha-se o exame da possibilidade de alteração da posição de países nas classes da ordenação a ser definida, especialmente para aqueles que apresentam valores de EV ou de IG grandemente discrepantes dos demais. Como exemplo frisante, basta referir o caso da Guatemala. Como se pode ver na Tabela 3, sua situação é desfavorável, em relação a todos os demais países, quanto aos valores dos indicadores CMI, CN, CMDTp e IG; entretanto, como mostra a Tabela 5, seu valor de Z, calculado segundo a equação que inclui esses indicadores, supera os de cinco países. Ainda mais, com situação melhor do que a de cinco países, somente no que se refere ao CMGp, e apenas a de um desses países, no caso da EV, seu valor de Z é maior do que o de seis outros quando calculado pela equação 6.

Considerando todos esses aspectos, tornou-se necessário escolher um critério que permitisse selecionar, dentre as seis equações, a que apresente com ele maior relacionamento. Como foi referido, a soma dos desvios reduzidos, contados a partir das médias das variáveis X1 a X6, poderia constituir indicador razoavelmente expressivo, ainda que implique admissão de pesos iguais para todos os indicadores que abrange. O relacionamento da sua distribuição com as dos valores de Z, fornecido pelas seis equações, pode representar forma válida de se aferir o grau de adequação de cada uma delas ao fim visado. Com isso, pode-se avaliar até que ponto a presença de sinais discrepantes, em três dessas equações, afeta essa adequação.

Calculando as correlações entre os valores das somas de desvios reduzidos que figuram na Tabela 3 e cada uma das distribuições de valores de Z, referentes às seis equações discriminantes, arrolados na Tabela 5, foram encontrados para o coeficiente de correlação de Pearson (r) e para o coeficiente de determinação (r2), os seguintes valores:

Sendo o valor crítico de r, ao nível de 0,05, igual a 0,29, todos os valores encontrados são significantes, correspondendo o maior à equação que inclui recíprocas de três indicadores, com sinais de coeficientes que são os de se prever em termos do comportamento das variáveis.

Lembrando que, como foi salientado, a soma dos desvios reduzidos implica a admissão de pesos iguais para os seis indicadores que dela participam, poder-se-ia supor que o mesmo ocorresse no caso da equação discriminante para o qual foi encontrado o maior valor de r, ou seja, que os três indicadores participassem igualmente na discriminação entre os grupos.

A simples comparação dos valores dos coeficientes de cada uma das variáveis não permite avaliar essa participação, pois cada um deles deve ter valor tal que, de sua integração no conjunto resultem valores de Z, para cada um dos componentes dos dois grupos, A e B, que assegurem a maximização da razão:

Uma estimativa da participação de cada variável, na discriminação entre os grupos, pode ser feita em termos das quantidades com que contribuem para a diferença .

Com esse objetivo, foi elaborada inicialmente a Tabela 6, em que se encontram, destacados na Tabela 5, os valores de Z, calculados segundo a equação que inclui as variáveis X1, X2 e X4, correspondentes aos países "mais desenvolvidos" e "menos desenvolvidos", bem como, destacados da Tabela 3, os valores de X1, X3 e X4 para esses países.

Calculando as equações com os valores médios de X1, X2 e X4 para cada um dos grupos, tem-se:

Então, para a composição da diferença entre

A e B, X1 concorre com 49,3%, X2 com 16,4% e X4 com 34,3%, ou seja, diferem os pesos com que participam na discriminação os três indicadores. Considerando este fato e lembrando que a soma dos desvios reduzidos implica pesos iguais para todas as variáveis, torna-se compreensível não ter sido encontrada correlação perfeita entre os valores de Z e as somas de desvios reduzidos.

Ainda visando à comparação entre as seis equações, procedeu-se à ordenação em classes dos valores de Z, decorrentes de cada uma delas, para os 44 países estudados.

Não podendo ser rejeitada, como já foi referido, a hipótese de normalidade para todas essas distribuições de Z, pôde-se organizar classes a partir das respectivas médias, adotando-se, como inõz tervalo, , todos os valores com aproximação à unidade. Estes parâmetros estão arrolados na Tabela 5. As classes, seguindo a ordem decrescente dos valores de Z, são designadas, em maiúsculas, em ordem alfabética.

Na Tabela 7 figuram os resultados dessas ordenações em classes. Como se pode ver, a classe H deixa de existir, nas ordenações baseadas em equações incluindo quatro ou mais indicadores, como conseqüência das alterações introduzidas no valor de Z, capazes de influir na ordenação dos países quando os valores de IG ou de EV, ou de ambos, discrepam acentuadamente dos demais. Tais discrepancias ocorrem, justamente, na cauda inferior das distribuições desses dois indicadores como se pode observar na Tabela 3.

Assim, o sinal negativo nos coeficientes dessas duas variáveis provoca uma mudança de classe, para melhor, dos países que apresentam situação mais desfavorável em termos desses dois indicadores.

Lembrando que a equação com três recíprocas de indicadores foi a que proporcionou valores de Z com a maior correlação com a soma dos desvios reduzidos, ainda que sem diferenças significantes entre os valores dos coeficientes, as considerações acima aduzem mais um argumento em favor de sua escolha como a mais adequada para o objetivo visado neste estudo.

Não é ela, como mostra a Tabela 4, a que corresponde ao maior valor de D2 na técnica passo a passo, mas, como já foi referido, não só esse valor foi considerado, tendo-se atentado primordialmente na adequação para fins de ordenação. De qualquer forma, mesmo em termos de discriminação, o valor 7,29 alcançado por D, é plenamente satisfatório.

Para comparação da ordenação, baseada na equação escolhida, com as resultantes das demais equações, foi elaborada a Tabela 8. Como se pode verificar, a ordenação baseada na equação que inclui a recíproca de apenas um indicador, o CMI, discrepa substancialmente das demais, evidenciando, como já foi referido, a falta de paralelismo no comportamento dos indicadores estudados. Mesmo com as recíprocas de dois indicadores incluídos na equação, a ordenação ainda difere apreciavelmente das demais.

A partir da equação com três recíprocas, ou seja, a que foi considerada mais adequada, as diferenças observadas com as demais são em pequeno número e limitadas a variações de uma classe. Deve-se notar que as mudanças da classe H para a classe G traduzem a incapacidade das equações, com quatro ou mais variáveis, de produzirem valores classificáveis como H.

Lembrando que:

a equação:

pode ser reformulada, para fins operacionais, visando a tornar desnecessário o cálculo das recíprocas, assumindo, com grau suficiente de aproximação, a forma:

CONCLUSÃO

Considerando os elementos colhidos no estudo dos dados apresentados e a discussão dos resultados obtidos, sendo:

CMI = coeficiente de mortalidade infantil;

CN = coeficiente de natalidade; e

CMDTp = coeficiente de mortalidade por doenças transmissíveis padronizado pela população mediana definida; o valor Z, na equação da função discriminante linear,

pode ser utilizado como indicador abrangente que permite a ordenação de populações em amplas classes de nível de saúde.

Recebido para publicação em 22/02/1985

Aprovado para publicação em 21/05/1985

  • 1. ARMITAGE, P. Statistical methods in medical research. Oxford, Blackwell, 1971.
  • 2
    DEMOGRAPHIC YEARBOOK. (United Nations). New York, v. 30, 1978; v. 31, 1979; v. 32, 1980.
  • 3. GOULDEN, C.H. The discriminant function. In: Goulden, C.H. Methods of statistical analysis. 2nd ed. New York, Wiley, 1952. p. 378-93.
  • 4. GUEDES, J.S. Contribuição para o estudo da evolução do nível de saúde do Estado de São Paulo: análise das regiões administrativas (1950-1970). São Paulo, 1972. [Tese de Doutoramento -Faculdade de Saúde Pública da USP]
  • 5. KELLEY, T.L. The selection of upper and lower groups for the validation of test items. J. educ. PsychoL, 30:17-24, 1939.
  • 6. MORAES, N.L. Níveis de saúde de coletividades brasileiras. Rev. Serv. publ., Rio de Janeiro, 10:403-97, 1959.
  • 7. SHRYOCK, H.S. & SIEGEL, J.S. The methods and materials of demography. Washington, D.C., U.S. Department of Commerce, 1973, v. 2.
  • 8. SNEDECOR, G.W. & COCHRAN, W.G. Métodos estadísticos. 6.a ed. Mexico, Continental, 1971.
  • 9. SOKAL, R.R. & ROHLF, F.J. Biometry: the principles and practice of statistics in biological research. San Francisco, Freeman, 1969.
  • 10. SWAROOP, S. & UEMURA, K. Proportional mortality of 50 years and above: a suggested indicator of the component "health, including demographic conditions" in the measurement of levels of living. Bull. Wld Hlth Org., 17:439-81, 1957.
  • 11
    WORLD HEALTH STATISTICS ANNUAL. (World Health Organization). Geneva, 1977; 1978; 1979; 1980; 1981; 1982.

Datas de Publicação

  • Publicação nesta coleção
    21 Set 2005
  • Data do Fascículo
    Ago 1985

Histórico

  • Aceito
    21 Maio 1985
  • Recebido
    22 Fev 1985
Faculdade de Saúde Pública da Universidade de São Paulo Avenida Dr. Arnaldo, 715, 01246-904 São Paulo SP Brazil, Tel./Fax: +55 11 3061-7985 - São Paulo - SP - Brazil
E-mail: revsp@usp.br