Acessibilidade / Reportar erro

Separação de espectros simulados e de luminescência total através do método generalizado de anulação do posto (GRAM)

Curve resolution of simulated and total luminescence spectra by generalized rank annihilation method (GRAM)

Resumo

A multivariate curve resolution method, "GENERALIZED RANK ANNIHILATION METHOD (GRAM)", is discussed and tested with simulated and experimental data. The analysis of simulated data provides general guidelines concerning the condition for uniqueness of a solution for a given problem. The second-order emission-excitation spectra of human and animal dental calculus deposits were used as an experimental data to estimate the performance of the above method. Three porphyrinic spectral profiles, for both human and cat, were obtained by the use of GRAM.

chemometrics; Generalized Rank Annihilation Method; curve resolution


chemometrics; Generalized Rank Annihilation Method; curve resolution

ARTIGO

Separação de espectros simulados e de luminescência total através do método generalizado de anulação do posto (GRAM)

Marlon Martins dos Reis e Márcia M. C. Ferreira

Departamento de Físico-Química - Instituto de Química - UNICAMP - CP 6154 - 13083-970 - Campinas - SP

marlon@iqm.unicamp.br

marcia@iqm.unicamp.br

Recebido em 15/9/97; aceito em 1/6/98

Curve resolution of simulated and total luminescence spectra by generalized rank annihilation method (GRAM). A multivariate curve resolution method, "GENERALIZED RANK ANNIHILATION METHOD (GRAM)", is discussed and tested with simulated and experimental data. The analysis of simulated data provides general guidelines concerning the condition for uniqueness of a solution for a given problem. The second-order emission-excitation spectra of human and animal dental calculus deposits were used as an experimental data to estimate the performance of the above method. Three porphyrinic spectral profiles, for both human and cat, were obtained by the use of GRAM.

Keywords: chemometrics; Generalized Rank Annihilation Method; curve resolution.

1. INTRODUÇÃO

O desenvolvimento de instrumentos combinados1,2, como cromatografia líquida de alta eficiência ("CLAE") tendo como detector um espectrofotômetro UV-Visível com arranjo de díodos, espectros de emissão-excitação, etc., tem colocado o químico frente a uma grande quantidade de informações numéricas, que possuem expressivos valores quantitativos e qualitativos. Nestes exemplos citados, as respostas experimentais são classificadas como dados de ordem superior3 e para seu tratamento estatístico a quimiometria tem desenvolvido vários métodos como o GRAM4 do inglês "Generalized Rank Annihilation Method", PARAFAC5 do inglês "Parallel Factor Analysis" e TLD6 do inglês "Trilinear Decomposition". Estes métodos podem ser aplicados em calibração tensorial7 e na separação de sinais8, necessária quando ocorre sobreposição de espectros.

O principal objetivo deste trabalho é a divulgação da quimiometria, mostrando a possível utilização de ferramentas matemáticas, estatísticas e computacionais, aplicadas em conjunto, na solução de problemas experimentais. Para isto, foi escolhido o Método Generalizado de Anulação do Posto ou GRAM, que é a extensão desenvolvida por Wilson, Sanchez e Kowalski aos primeiros métodos de anulação do posto9. O GRAM se aplica ao caso geral onde não é necessário que as duas amostras analisadas tenham todas as substâncias em comum. Neste caso, a separação de sinais e calibração tensorial são conseguidas através da resolução de um problema generalizado de autovalores-autovetores4,10.

A primeira aplicação do GRAM é apresentada com dados simulados e a segunda tem como objeto de trabalho espectros de luminescência total coletados para amostras de cálculo dentário em felinos e humanos.

A simulação é importante para a apresentação do método, pois com ela a compreensão das técnicas algébricas é facilitada, também por ser possível apresentar a diferença entre a solução matemática para dados perfeitos, neste caso aqueles simulados, e dados experimentais.

2. O MÉTODO GENERALIZADO DE ANULAÇÃO DO POSTO

Para facilitar a compreensão das técnicas algébricas utilizadas no GRAM, foi simulado um conjunto de espectros, representando as respostas de um experimento hipotético. Neste experimento, as amostras M e N, constituídas por misturas das substâncias químicas A e B, são submetidas à cromatografia líquida, cujo detector é um espectrofotômetro. Desta forma, a cada tempo de eluição é coletado um espectro de intensidade de absorção. Os cromatogramas foram simulados contendo vinte tempos de eluição, de 0 a 20 minutos com 1 minuto de intervalo, e os espectros em cinqüenta comprimentos de onda, 400-449nm com intervalo de 1nm. Os espectros e cromatogramas foram normalizados pelo maior pico, isto é, os valores encontrados nos cromatogramas e espectros foram divididos pelos valores de seus respectivos máximos. A Figura 1 apresenta as curvas, cromatogramas e espectros, para as duas substâncias hipotéticas.


Admitindo que a Lei de Beer11 é seguida e considerando o caminho ótico igual a um centímetro, a relação entre absorbância em cada comprimento de onda e o respectivo tempo de eluição, será dada pela equação (1).

aki =cA tk bi ,(1)

onde: akié a absorbância no tempo de eluição k e no comprimento de onda i.

cA é a concentração da substância A,(mol l-1).

tk é a constante referente ao tempo de eluição k.

bié a absortividade molar no comprimento de onda i, (lmol-1cm-1).

Para k tempos de eluição e i comprimentos de onda tem-se a equação (2).

onde A é uma matriz (k X i) na qual as linhas correspondem a espectros de absorbância. Graficamente esta matriz representa uma superfície de resposta.

Para uma dada amostra S, constituída pela mistura das substâncias A e B, os espectros coletados correspondem à soma dos espectros de A e B, em suas respectivas concentrações. Em termos matriciais esta amostra é representada pela equação (3).

S = X C Yt , (3)

obs.: o símbolo "t" em Yt indica que a matriz está transposta.

Onde: S é uma matriz contendo os espectros e representa uma

superfície de resposta para a amostra S;

X é uma matriz na qual as colunas correspondem aos cromatogramas, normalizados para concentração unitária, das substâncias puras;

C é uma matriz diagonal contendo concentrações das substâncias puras;

Y é uma matriz onde as colunas correspondem às absortividades molares das substâncias puras;

A equação (3) pode ser estendida ao caso geral para este tipo de dados. Por exemplo, X poderia representar espectros de intensidade de excitação, Y espectros de intensidade de emissão e C as concentrações das espécies luminescentes.

Para a aplicação do GRAM são necessárias duas amostras, constituídas por misturas de substâncias químicas comuns, mas em concentrações diferentes. Desta forma, os cromatogramas e espectros simulados para as substâncias A e B foram colocados em suas formas matriciais e substituídos na equação (3) (ver equações (3.1) e (3.2)), para dar origem a duas matrizes de espectros simulados correspondentes às amostras hipotéticas M e N. As concentrações usadas para A e B são as seguintes:

-Para M: 2 unidades de concentração de A e 5 unidades de concentração de B;

-Para N: 7 unidades de concentração de A e 3 unidades de concentração de B.

onde: tAk e tBk são as constantes dos tempos de eluição para as substâncias A e B, respectivamente, ou seja, os valores correspondentes aos pontos das curvas simuladas para cromatogramas.

bAi e bBi são as absortividades molares para as substâncias A e B, respectivamente, ou seja, os valores correspondentes aos pontos das curvas simuladas para espectros.

A Figura 2 apresenta as superfícies das amostras M e N.


Em termos vetoriais os espectros correspondentes a estas amostras são combinações lineares8,12,13 dos espectros das substâncias puras A e B. Como as amostras M e N diferem entre si apenas nas concentrações das substâncias A e B, então suas matrizes correspondentes podem ser representadas pelo mesmo conjunto de autovetores12,13,14, mas com autovalores12,13,14 diferentes, equações (4) e (5).

MY = Y lM, (4)

NY = Y lN, (5)

onde: Y é a matriz de autovetores e l é a matriz de autovalores;

Como a matriz de autovalores é uma matriz diagonal e sua inversa é a matriz diagonal cujos elementos são os inversos dos autovalores, pode se escrever as equações (6) e (7).

MY lM-1 = Y, (6)

N Y lN-1 = Y, (7)

A igualdade dos autovetores nas equações (6) e (7) permite que se igualem os lados esquerdos destas equações resultando na equação (8) e, por conseguinte, a equação (9).

MY lM-1 = N Y lN-1, (8)

M Y = N Y lN-1lM, (9)

O produto dos autovalores, lN-1lM , resulta em uma matriz diagonal representada pela equação (10), onde, L é a matriz cujos elementos são dados pela relação entre os autovalores, que representam as concentrações das substância A e B, das matrizes correspondentes às amostras M e N.

L=lN-1 lM, (10)

A substituição da equação (10) na equação (9) dá origem à equação (11):

MY = N Y L, (11)

A equação (11) representa um problema de autovetores-autovalores generalizado10,14. Para sua solução, as matrizes devem ser quadradas e não pode existir correlações entre colunas e entre linhas, evitando assim que seus determinantes12,13 sejam iguais a zero. Para evitar correlações, as matrizes M e N devem ser projetadas em uma base ortogonal12,13, porque assim as linhas e colunas passam a ser representadas por vetores linearmente independentes12,13. Uma base ortogonal pode ser encontrada através de uma decomposição em valores singulares13,14.

Após a decomposição, a matriz original passa a ser representada pelo produto de três matrizes, duas ortonormais e uma diagonal. As ortonormais possuem seus vetores ortogonais entre si e com módulo unitário12,13. A matriz diagonal possui os valores singulares da matriz original.

Como a base do espaço vetorial12,13 deve ser a mesma para as duas matrizes correspondentes às amostras M e N , então é necessário usar informações destas duas para efetuar a decomposição em valores singulares. Para tal, são criadas as matrizes justapostas (M | N), M ao lado de N e M acima de N. As equações (12) e (13) apresentam as decomposições para as matrizes justapostas.

(M | N) = P Z1Vt , (12)

onde U, P, V e Q são as matrizes ortonormais e Z1e Z2 as matrizes diagonais com os valores singulares.

A Tabela 1 apresenta os cinco primeiros valores singulares para as decomposições das matrizes correspondentes aos espectros simulados. Destes valores singulares, apenas dois são diferentes de zero porque só existem duas substâncias diferentes nas amostras M e N, ou seja, apenas dois vetores linearmente independentes são necessários para formar uma base para estas matrizes.

Os quadrados dos valores singulares estão ligados à proporção da variação nos novos vetores15, ou seja, quanto cada novo vetor esta sendo importante na representação das matrizes originais. Desta forma, os valores singulares são dispostos na matriz diagonal de forma decrescente, isto é, daquele de maior importância para o de menor. Portanto, para M e N onde apenas dois vetores ortogonais são necessários para descrever as matrizes originais, só os dois primeiros valores singulares correspondentes aos vetores de maior importância serão diferentes de zero. O número de valores singulares diferentes de zero é igual ao posto da matriz.

A relação entre valor singular e variação dos dados também explica a grande importância do primeiro valor singular da Tabela 1. Tal importância é devida ao fato de o vetor, correspondente ao primeiro valor singular, ter a mesma direção que o vetor média dos espectros, onde esta presente a maior variação dos dados, resultando assim em uma alto valor singular.

Em se tratando de dados experimentais, com a presença de ruídos, o número de valores singulares diferentes de zero não será igual ao posto da matriz, pois um número maior de vetores ortogonais será necessário para descrever tais ruídos8,15. Por este motivo, é necessário escolher o número de vetores importantes para a representação da matriz original e eliminar aqueles usados para descrever os ruídos.

Para mostrar tal influência dos ruídos, um novo conjunto de dados foi gerado a partir dos espectros e cromatogramas já simulados. Mas agora, com a adição de interferentes e ruídos gerados aleatoriamente com média igual a zero e variância um. Na Figura 3 são mostrados os espectros e cromatogramas dos interferentes, as superfícies após a adição de ruídos e interferentes.


A Tabela 2 apresenta os valores singulares para esta última simulação, onde se pode verificar que a variação, a partir do terceiro valor singular, é menos "significativa", se comparada com aquela existente entre o primeiro e o segundo valores. Para facilitar a compreensão da significância dos valores singulares, vale lembrar o exemplo dos espectros simulados sem interferentes e ruídos, onde de 0,9192 no primeiro valor singular caiu para 0,0808 no segundo e depois para zero no terceiro valor singular, permanecendo constante nos valores seguintes, ou seja a variação igual a zero. Agora voltando ao caso da simulação com ruídos e interferentes, a variação entre o primeiro e o segundo valores singulares é de 0,8087 para 0,0707 e deste para 0,0117 o terceiro valor singular, de onde a variação passa a ser praticamente constante semelhante ao primeiro exemplo simulado. Ainda sobre os valores citados nestas comparações, eles correspondem às matrizes justapostas verticalmente e lateralmente para simulações com e sem ruídos e interferentes. Aquela queda na significância da variação entre valores singulares, é uma indicação de que apenas os dois primeiros vetores, correspondentes aos dois primeiros valores singulares, são importantes para descrever as matrizes justapostas.

Conhecido o número de vetores necessários para formar a base para as matrizes M e N, são feitas as projeções mostradas nas equações (14) e (15), onde: Mpq e Npq são as matrizes correspondentes a M e N na nova base.

obs.: O traço acima de P e Q indica que estão truncadas, isto é, só os vetores importantes estão sendo usados, tendo sido eliminados aqueles correspondentes aos ruídos experimentais.

Agora o problema de autovetores-autovalores generalizado, equação (16), pode ser resolvido, pelo algoritmo QZ10.

MpqY = NpqY L, (16)

A matriz de cromatogramas será dada pela equação (17) e a de espectros pela equação (18).

X = P (Mpq + Npq) Y, (17)

Y = Q (Y-1)t, (18)

A Figura 4 apresenta o resultado para o conjunto de dados simulado, sem ruído e interferentes. A proporção das concentrações L é 3,5 e 0,6 que correspondem a 7 unidades de concentração em N dividido por 2 unidades de concentração em M para a substância A e 3 unidades de concentração em N dividido por 5 unidades de concentração em M para a substância B.


No segundo conjunto de dados simulados, com interferentes e ruídos, o GRAM foi aplicado para posto das matrizes igual a dois e depois igual a três. Estes dois testes têm por objetivo mostrar que o terceiro vetor será usado para descrever ruídos e interferentes. Os resultados destes testes são mostrados na Figura 5 onde é verificada a distribuição aleatória no terceiro vetor.


3. RESULTADOS E DISCUSSÃO

O conjunto de dados experimentais é constituído por amostras de cálculo dentário, uma de felino e outra humana. Seus espectros foram coletados de amostras pesando em torno de 0,01g, dissolvidas em 5ml de ácido clorídrico a 27%, sem filtração, apenas com decantação16. O instrumento usado foi um espectrofluorímetro Perkin-Elmer LS50, com lâmpada de xenônio para a excitação e cubeta de 1cm. Este instrumento conta com um monocromador para excitação e outro para emissão16. A região espectral envolvida, no caso da emissão, inicia-se em 460nm indo até 750nm com intervalos de 0,5nm. Em relação à excitação, o comprimento de onda inicial foi fixado em 390nm variando até 450nm, sendo que o intervalo é de 2 nm. As Figuras 6 e 7 apresentam as superfícies resultantes para estas duas amostras.



Os espectros de emissão apresentam espalhamento Raman na região entre 460 a 580nm e também uma provável fluorescência residual. Já a amostra humana, também apresenta deslocamento em relação à linha de base (Fig. 8). Assim, a região a ser trabalhada foi limitada entre 584nm e 709nm (Fig. 8), pois abaixo de 580nm, ocorre o espalhamento Raman e a fluorescência residual, e acima de 709nm a intensidade de emissão é muito baixa, ou seja, da ordem do ruído experimental. Em se tratando da correção para a linha de base, uma curva foi ajustada ao espectro menos intenso da amostra humana, para que, ao ser subtraída dos espectros desta amostra, a intensidade em 584nm tivesse valor próximo ao valor em 709nm, semelhante ao que ocorre na amostra referente aos felinos. A Figura 9 mostra os espectros de emissão e excitação para a amostra humana antes e depois da correção da linha de base.



Os valores singulares destas amostras, apresentados na Tabela 3, mostram uma queda na variação entre eles a partir do quarto valor singular. Para os dados simulados, a queda na variação entre os valores singulares ocorreu quando os vetores, correspondentes a estes valores, passaram a descrever ruídos e interferentes. Sendo assim, uma analogia entre tais valores, simulados e experimentais, sugere que o posto para as matrizes referentes aos dados experimentais deva ser três. Este valor para o posto será confirmado após a aplicação do Método Generalizado de Anulação do Posto, ou seja, primeiro aplicado considerando o posto igual a três e depois igual a quatro, seguindo a metodologia adotada para os dados simulados.

Outro fato a ser verificado é se as mesmas substâncias estão presentes nas duas amostras. Para isto, os valores singulares das matrizes originais são comparados com aqueles obtidos para as matrizes justapostas. Desta maneira, se o número de vetores linearmente independentes para descrever as matrizes em separado for igual ao das justapostas é uma indicação de que as mesmas substâncias são as constituintes das duas amostras. A Tabela 4 apresenta os valores singulares obtidos para as amostras de cálculo dentário humano e felino quando justapostas.

Para confirmar o posto das matrizes o GRAM foi aplicado, primeiro considerando o posto com sendo igual a três e depois igual a quatro. Os resultados para o primeiro teste são espectros com significado químico, isto é, positivos e com picos distintos (Figura 10). No segundo teste, para posto igual a quatro, dois espectros de excitação possuem os seus máximos no mesmo comprimento de onda, ou seja, destes dois apenas um tem sentido químico, no caso da identificação pelo comprimento de onda do máximo da banda (Figura 10). Sendo assim, para a resolução empregada na excitação é possível identificar três espectros diferentes, o que indica existência de três espécies luminescentes. Pode se verificar ainda, a presença de três espécies semelhantes nas duas amostras, pois o posto para as matrizes justapostas é três e as distribuições dos valores singulares correspondentes às duas amostras são praticamente iguais (Tabelas 3 e 4).


Os espectros de excitação mostrados na Figura 9, são os responsáveis pela caracterização destas três espécies, por aparecerem na região da banda Soret característica de espécies porfirínicas17. Os comprimentos de onda correspondentes aos máximos nos espectros de excitação resolvidos pelo método são: 410nm, 418nm e 434nm; semelhantes àqueles encontrados para felinos e caninos16, 410nm, 417nm, 436nm.

4. CONCLUSÕES

A apresentação do Método Generalizado de Anulação do Posto em conjunto com os dados simulados é importante, principalmente, para a interpretação da decomposição em valores singulares. Isto por mostrar que, na ausência de ruídos e interferentes, o número de valores singulares diferentes de zero é igual ao número de substâncias presentes nas amostras, cujas matrizes foram decompostas. Outro fato que reafirma tal importância, é a comparação dos valores singulares resultantes da decomposição feita após a adição de interferentes e ruídos aos dados simulados com aqueles encontrados para os dados experimentais. Esta comparação mostra que a variação entre os valores singulares, usados para descrever os ruídos e interferentes, não é significativa frente àquela variação encontrada para os valores singulares importantes na descrição da matriz original, fato este que serve de parâmetro na escolha do posto das matrizes. Em se tratando desta escolha, também é importante o conhecimento químico, o que é verificado nos dados experimentais, onde a confirmação do posto está diretamente ligada ao fato de serem os espectros de excitação os responsáveis pela identificação das espécies luminescentes presentes nas amostras. Cabe ressaltar ainda que, a discussão teórica a respeito do método tem por objetivo mostrar a confiabilidade de seus resultados, comprovada através das aplicações tanto para dados simulados quanto para dados reais.

A grande vantagem que o GRAM apresenta é uma solução matemática, de rápida aplicação e com um baixo custo computacional, sendo que, a determinação destas substâncias por um tratamento químico, no que diz respeito a sua separação, poderia ser mais dispendiosa em tempo e custos operacionais, ou até mesmo inviável. Ainda sobre sua aplicação, o GRAM exige do químico a compreensão do problema a ser resolvido e o conhecimento de fundamentos básicos a seu respeito, não existindo assim, a necessidade de se especializar em álgebra para sua manipulação.

Além destas duas aplicações o GRAM pode ser empregado nos mais variados tipos de experimentos envolvidos em pesquisas, principalmente na química analítica, que enfrentem problemas de separação de curvas. Como por exemplo análises por injeção em fluxo utilizando fotodetectores com arranjo de díodos e outro experimentos que empreguem instrumentos combinados18.

Outro fato que favorece a utilização do GRAM é sua fácil implementação computacional, podendo ser feita através de programas especiais para álgebra linear como por exemplo OCTAVE ou MATLAB.

Os algoritmos utilizados foram escritos usando rotinas internas do pacote MATLAB para Windows.

AGRADECIMENTOS

À CAPES, CNPq, FAPESP.

  • 1. Jones, D. G.; Anal. chem. 1985, 57, 1207A.
  • 2. Hirschfeld, T.; Anal. chem. 1980, 52, 297A.
  • 3. Sanchez, E.; Kowalski, B. R.; J. Chemometrics 1988, 2, 247.
  • 4 .Wilson, B. E.; Sanchez, E.; Kowalski, B. R.; J. Chemometrics 1989, 3, 493.
  • 5. Geladi, P.; Chem. Intell. Lab. Sys 1989, 7, 11.
  • 6. Sanchez, E.; Kowalski, B. R.; J. Chemometrics 1990, 4, 29.
  • 7. Sanchez, E.; Kowalski, B. R.; J. Chemometrics 1988, 2, 265.
  • 8. Tauler, R.; Smilde, A.; Kowalski, B. R.; J. Chemometrics 1995, 9, 31.
  • 9. Lorber, A.; Anal. Chem. 1985, 57, 2395.
  • 10. Golub, G. H.; Van Loan, C. F.; Matrix Computations The Johns Hopkins University Press, 1989.
  • 11. Christian, G. D.; Analytical Chemistry , 5a ed. John Wiley & Sons,Inc, 1994
  • 12. Boldrini, J. L.; Costa, S. I. R.; Figueiredo, V. L.; Wetzler H. G.; Álgebra Linear, HARBRA Ltda. 3 ed, 1986.
  • 13. Noble, B.; Daniel, J. W.; Carvalho, J. P. Carvalho; Álgebra Linear Aplicada; Prentice-Hall do Brasil Ltda, 1986.
  • 14. Strang, G.; Linear Algebra and Its Application, Harcourt Brace Jovanovich, Publisher, 1976.
  • 15. Malinowski, E. D.; Factor Analysis in Chemistry; 2 ed., John Wiley & Sons, Inc, 1991.
  • 16. Ferreira, M. M. C.; Brandes, M. L.; Ferreira I. M. C.; Booksh, K. S.; Dolowy, W. C.; Gouterman, M.; Kowalski, B. R.; Appl. Spectrosc. 1995, 49, 1317.
  • 17. Falk, J. E.; Porphyrins and Metalloporphyrins, Elsevier, 1964.
  • 18. Raimundo, I. M; Pasquini, C.; Quím. Nova 1997, 20, 83.

Datas de Publicação

  • Publicação nesta coleção
    11 Set 2000
  • Data do Fascículo
    Fev 1999

Histórico

  • Aceito
    01 Jun 1998
  • Recebido
    15 Set 1997
Sociedade Brasileira de Química Secretaria Executiva, Av. Prof. Lineu Prestes, 748 - bloco 3 - Superior, 05508-000 São Paulo SP - Brazil, C.P. 26.037 - 05599-970, Tel.: +55 11 3032.2299, Fax: +55 11 3814.3602 - São Paulo - SP - Brazil
E-mail: quimicanova@sbq.org.br