A produção de artigos da área das ciências da saúde com o auxílio de <i>key lexical bundles</i>: um estudo direcionado por corpus

Bocorny, Ana Eliza Pereira; Rebechi, Rozane; Reppen, Randi; Delfino, Maria Claudia Nunes; Lameira, Vivian Meurer

doi:10.1590/1678-460X2021370101

RESUMO

O inglês é a língua franca da academia. Publicar nesse idioma aumenta a disseminação do conhecimento científico e as possibilidades de citação. Frente ao exposto, buscamos contribuir para o aumento do impacto da produção científica brasileira, propondo recursos pedagógicos baseados em padrões linguísticos obtidos com uma abordagem direcionada por corpus. Por meio de uma análise empírica de um corpus de artigos acadêmicos publicados em periódicos indexados, e utilizando os pressupostos da Linguística de Corpus, objetivamos levantar key lexical bundles na introdução de artigos em inglês da área da saúde, classificar esses bundles de acordo com sua função comunicativa e sugerir aplicações pedagógicas para os dados coletados que visem à redação de artigos acadêmicos. Os dados, levantados a partir da ferramenta de análise textual Sketch Engine mostram que (i) há concentração de key lexical bundles em certos movimentos e passos da seção estudada e (ii) é possível agrupar unidades com mesma função comunicativa identificadas em um mesmo passo de forma a construir uma estrutura lexical (lexical frame) que pode ser usada na construção de recursos pedagógicos.

Palavras-chave:
Linguística de Corpus; key lexical bundles; recursos pedagógicos direcionados por corpus; escrita acadêmica

ABSTRACT

English is the lingua franca in academic settings. Publishing in this language enhances the spread of scientific knowledge and citations. Hence, we intend to contribute to increase the impact of Brazilian scientific production by proposing pedagogical resources based on linguistic patterns obtained with a corpus-driven approach. Through an empirical analysis of a corpus of academic articles published in indexed journals, and using Corpus Linguistics principles, we aim to identify key lexical bundles from the introduction section of articles in the area of health sciences, classify these bundles according to their communicative function and suggest pedagogical applications for the collected data aimed at writing academic articles. The data, collected with a textual analysis tool (Sketch Engine), show that (i) key lexical bundles concentrate in certain movements and steps of the section under study; and (ii) units can be grouped according to the communicative functions identified in the same step and, hence, a lexical frame is built to be used in the construction of pedagogical resources.

Keywords:
corpus linguistics; key lexical bundles; corpus-driven teaching resources; academic writing

1. Introdução

O ensino superior mudou consideravelmente nas últimas décadas (cf. Mok, 2015MOK, Ka Ho. 2015. Higher education transformations for global competitiveness: Policy responses, social consequences and impact on the academic profession in Asia. Higher Education Policy, 28(1), 1-15. ; Blessinger & Anchan, 2015BLESSINGER, Patrick; ANCHAN, John (eds.). 2015. Democratizing higher education: International comparative perspectives. Nova Iorque: Routledge.; Altbach et al., 2019ALTBACH, Philip; REISBERG, Liz; RUMBLEY, Laura. 2019. Trends in global higher education: Tracking an academic revolution. Boston: BRILL.). Uma dessas mudanças está relacionada ao fato de um grande número de instituições de ensino superior em todo o mundo estar buscando internacionalizar suas atividades (cf. Baumvol, 2018BAUMVOL, Laura. 2018. Language practices for knowledge production and dissemination: the case of Brazil (Doctoral dissertation, Instituto de Letras, Universidade Federal do Rio Grande do Sul, Porto Alegre, Brasil).; Robson & Wihlborg, 2018). Sendo o inglês a língua franca da academia (cf. Jenkins, 2009JENKINS, Jennifer. 2009. English as a lingua franca: Interpretations and attitudes. World Englishes, 28(2), 200-207.; Tardy, 2004TARDY, Christine. 2004. The role of English in scientific communication: lingua franca or Tyrannosaurus rex? Journal of English for academic purposes , 3(3), 247-269.; Ammon, 2001AMMON, Ulrich (ed.). 2001. The dominance of English as a language of science: Effects on other languages and language communities (Vol. 84). Nova Iorque: Walter de Gruyter.), publicar nesse idioma facilita a disseminação do conhecimento científico produzido no país e aumenta as chances de o trabalho ser citado por outros autores, assim como também as oportunidades de colaboração científica internacional (cf. Meneghini & Packer, 2007, apud Baumvol, 2018). Apesar de haver movimentos em prol da aceitação de uma linguagem que visa ao sucesso da comunicação, independentemente do uso da gramática normativa (cf. Crystal, 2003CRYSTAL, David. 2003. English As a Global Language. Cambridge, UK: Cambridge University Press.), a utilização da linguagem considerada convencional pela comunidade discursiva da área ainda é determinante para o aceite de artigos submetidos a periódicos de circulação internacional.

Tendo em vista o contexto apresentado, os objetivos deste estudo são: (i) identificar key lexical bundles⁷ 7 Optamos por manter o termo key lexical bundle (KLB) em inglês por ainda não haver um equivalente consagrado em português. , ou sequências contínuas e recorrentes de palavras consideradas características de uma coleção de textos - neste caso da seção Introdução de artigos acadêmicos publicados em inglês em periódicos internacionais da área das ciências da saúde -, quando comparadas a um corpus de referência; (ii) classificar os key lexical bundles de acordo com sua função comunicativa nos movimentos retóricos da seção Introdução dos artigos; e (iii) sugerir como os dados coletados podem informar a construção de recursos pedagógicos de livre acesso direcionados por corpus (corpus-driven) para auxiliar pesquisadores brasileiros na redação de artigos acadêmicos em inglês nas áreas selecionadas. Acredita-se que a utilização dos referidos recursos pedagógicos possa levar ao aprimoramento dos artigos produzidos em inglês pelos pesquisadores brasileiros e a um consequente aumento do impacto desses textos.

O presente artigo está assim organizado: na seção 2 são apresentados os pressupostos teóricos relativos à Linguística de Corpus e aos estudos sobre gêneros do discurso que dizem respeito a este estudo. A seção 3 descreve os procedimentos metodológicos usados para a extração dos key lexical bundles. Na seção 4 os resultados obtidos são relatados e discutidos. Por fim, a seção 5 traz as conclusões e propostas de trabalhos futuros.

2. Revisão de literatura

O resultado prático que se pretende atingir com este estudo deriva do encontro e do entrelaçamento de pressupostos teóricos oriundos de duas áreas do conhecimento: (i) os princípios da Linguística de Corpus e (ii) os estudos sobre gêneros do discurso.

2.1. Linguística de Corpus

A Linguística de Corpus parte de uma perspectiva de descrição da linguagem autêntica, quer ocorra no âmbito geral ou especializado. A visão da língua como um sistema probabilístico é um dos fundamentos principais da Linguística de Corpus (cf. Berber Sardinha, 2004______. 2004. Lingüística de corpus. Barueri: Editora Manole Ltda.). Os traços linguísticos (lexicais, estruturais, pragmáticos e discursivos) não ocorrem todos com a mesma regularidade (cf. Berber Sardinha, 2004______. 2004. Lingüística de corpus. Barueri: Editora Manole Ltda.). Por esse motivo, a variação dos traços não é aleatória; pelo contrário, existe “um mapeamento regular entre a frequência maior ou menor de um traço e um contexto de ocorrência” (Berber Sardinha 2000BERBER SARDINHA, Tony. 2000. Lingüística de Corpus: histórico e problemática. DELTA, 16(2), 323-367. Disponível em: Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-44502000000200005&lng=en&nrm=iso . Acesso em: 27 nov. 2019.
http://www.scielo.br/scielo.php?script=s... , p. 351). Logo, defender que os traços não são aleatórios significa dizer que a linguagem é formulaica, i.e., padronizada. Como afirma Berber Sardinha (2000BERBER SARDINHA, Tony. 2000. Lingüística de Corpus: histórico e problemática. DELTA, 16(2), 323-367. Disponível em: Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-44502000000200005&lng=en&nrm=iso . Acesso em: 27 nov. 2019.
http://www.scielo.br/scielo.php?script=s... , p. 351), “A padronização se evidencia pela recorrência, isto é, uma colocação, coligação ou estrutura que se repete significativamente mostra sinais de ser, na verdade, um padrão lexical ou léxico-gramatical”.

**2.1.1. Pesquisa baseada em corpus versus pesquisa direcionada pelo corpus**

Biber (2012______. 2012. Corpus-based and corpus-driven analyses of language variation and use. In Heine, Bernd; Narrog, Heiko. (Eds.). The Oxford handbook of linguistic analysis. Oxford: Oxford University Press.) diferencia estudos baseados em corpus (corpus-based studies) de estudos direcionados por corpus (corpus-driven studies). O primeiro tem como principal objetivo de pesquisa “analisar os padrões sistemáticos de variação e uso das características linguísticas pré-definidas”⁸ 8 Todas as traduções neste artigo são de nossa autoria. (Biber, 2012______. 2012. Corpus-based and corpus-driven analyses of language variation and use. In Heine, Bernd; Narrog, Heiko. (Eds.). The Oxford handbook of linguistic analysis. Oxford: Oxford University Press., p. 162)⁹ 9 No original: “to analyze the systematic patterns of variation and use for those pre-defined linguistic features” (Biber, 2012, p. 162). , enquanto o segundo busca uma perspectiva de pesquisa em que “as próprias construções linguísticas emergem da análise do corpus”¹⁰ 10 No original: “the linguistic constructs themselves emerge from analysis of a corpus” (Biber, 2012, p. 162). (Biber, 2012______. 2012. Corpus-based and corpus-driven analyses of language variation and use. In Heine, Bernd; Narrog, Heiko. (Eds.). The Oxford handbook of linguistic analysis. Oxford: Oxford University Press., p. 162). Assim, a abordagem direcionada por corpus difere da pesquisa baseada em corpus na medida em que faz “o mínimo de afirmações a priori em relação às características linguísticas empregadas na análise de um corpus”¹¹ 11 No original: “minimal a priori assumptions regarding the linguistic features that should be employed for the corpus analysis” (Biber, 2012, p. 162). (Biber, 2012______. 2012. Corpus-based and corpus-driven analyses of language variation and use. In Heine, Bernd; Narrog, Heiko. (Eds.). The Oxford handbook of linguistic analysis. Oxford: Oxford University Press., p. 162). A perspectiva adotada neste estudo é corpus-driven, pois não partimos de categorias a priori, mas sim da identificação do objeto de estudo no corpus com base na sua frequência de ocorrência, para posteriores análise e classificação.

2.1.2. Linguagem formulaica

A identificação de padrões lexicais, entendidos aqui como combinações de palavras que apresentam certa estabilidade e frequência (cf. Hyland, 2012______. 2012. Disciplinary identities: Individuality and community in academic discourse. Munique: Ernst Klett Sprachen.), tem grande importância pedagógica no âmbito do ensino das linguagens especializadas. Para capacitar pesquisadores menos proficientes a produzir textos conforme os padrões considerados convencionais pelos especialistas das áreas nas quais se inserem, é preciso identificar os padrões recorrentes utilizados em diferentes disciplinas.

Textos especializados comunicam informações específicas por meio de elementos linguísticos (termos, unidades terminológicas, unidades fraseológicas, lexical bundles) e não linguísticos (gráficos, tabelas, imagens). Segundo o princípio da idiomaticidade de Sinclair (1991SINCLAIR, John. 1991. Corpus, concordance, collocation. Oxford: Oxford University Press .), a comunicação acontece, em grande parte, por meio de unidades formulaicas e não com a seleção aleatória de palavras individuais. As relações que essas sequências formulaicas estabelecem entre si e com outros elementos do texto se constituem como fios que se entrelaçam em uma trama de sentido, resultando em uma linguagem que pode ser considerada mais fluente e idiomática (cf. Hyland, 2012______. 2012. Disciplinary identities: Individuality and community in academic discourse. Munique: Ernst Klett Sprachen.; Paquot & Granger, 2012PAQUOT, Magali; GRANGER, Sylviane. 2012. Formulaic language in learner corpora. Annual Review of Applied Linguistics, 32, 130-149.).

Sequências formulaicas têm sido amplamente estudadas no âmbito do discurso acadêmico por meio da Linguística de Corpus (cf. Biber & Conrad, 1999BIBER, Douglas; CONRAD, Susan. 1999. Lexical bundles in conversation and academic prose. Language and Computers, 26, 181-190.; Biber et al., 2004BIBER, Douglas; CONRAD, Susan; CORTES, Viviana. 2004. If you look at…: Lexical bundles in university teaching and textbooks. Applied linguistics, 25(3), 371-405.; Biber & Barbieri, 2007BIBER, Douglas; BARBIERI, Federica. 2007. Lexical bundles in university spoken and written registers. English for specific purposes, 26(3), 263-286.; Biber, 2009BIBER, Douglas. 2009. A corpus-driven approach to formulaic language in English. International journal of corpus linguistics, 14(3), 275-311.; Staples et al., 2013STAPLES, Shelley; EGBERT, Jesse; BIBER, Douglas. 2013. Formulaic sequences and EAP writing development: Lexical bundles in the TOEFL iBT writing section. Journal of English for academic purposes , 12(3), 214-225.; Gray & Biber, 2013GRAY, Bethany; BIBER, Douglas. 2013. Lexical frames in academic prose and conversation. International journal of corpus linguistics , 18(1), 109-136.). As sequências formulaicas recorrentes e contínuas de três ou mais palavras (por exemplo, / the aim of this paper is) mais frequentes em dado registro são chamadas de lexical bundles (Biber et al., 1999BIBER, Douglas; JOHANSSON, Stig; LEECH, Geoffrey; CONRAD, Susan & FINEGAN, Edward. 1999. Longman grammar of spoken and written English. Harlow: Pearson.; Biber et al., 2004BIBER, Douglas; CONRAD, Susan; CORTES, Viviana. 2004. If you look at…: Lexical bundles in university teaching and textbooks. Applied linguistics, 25(3), 371-405.), enquanto as sequências formulaicas recorrentes descontínuas, isto é, com slots variáveis (por exemplo, / don’t * to, it is * to), são denominadas formulaic frames (Biber, 2009BIBER, Douglas. 2009. A corpus-driven approach to formulaic language in English. International journal of corpus linguistics, 14(3), 275-311.) ou lexical frames (Gray & Biber, 2013GRAY, Bethany; BIBER, Douglas. 2013. Lexical frames in academic prose and conversation. International journal of corpus linguistics , 18(1), 109-136.).

Sobre os lexical bundles, Biber e Barbieri (2007BIBER, Douglas; BARBIERI, Federica. 2007. Lexical bundles in university spoken and written registers. English for specific purposes, 26(3), 263-286.) destacam três características que os diferenciam de outras expressões formulaicas: (i) são extremamente comuns, (ii) não são expressões idiomáticas, já que podem ser compreendidos a partir do significado das palavras que os compõem, e (iii) geralmente não representam uma unidade estrutural completa. Gray (2016GRAY, Bethany. 2016. Lexical bundles. Triangulating methodological approaches in corpus linguistic research. London: Routledge, pp. 33-56.) destaca a importância de tais unidades como componentes básicos da construção do discurso. A autora também ressalta a importância dos lexical bundles como auxílio aos usuários da língua na realização de funções discursivas específicas.

2.1.3. Key lexical bundles

Para a Linguística de Corpus, a palavra-chave (keyword) é “uma palavra estatisticamente significativa que caracteriza um documento, texto ou corpus” (Rayson, 2012RAYSON, Paul. 2012. Corpus analysis of key words. In: Carol A. Chapelle (ed.). The Encyclopedia of Applied Linguistics . Hoboken: Blackwell Publishing, pp. 320-326., p. 1). Em outros termos, trata-se de um elemento que ocorre estatisticamente com mais frequência em um corpus de estudo (isto é, aquele que se pretende investigar de forma mais detalhada) do que em um corpus de referência (ou seja, aquele usado como termo de comparação).

Para os propósitos desta pesquisa, o termo key lexical bundle (doravante, KLB) será utilizado para designar o nosso objeto de estudo. Como os lexical bundles, os KLBs são sequências contínuas e recorrentes de três ou mais palavras bastante frequentes, que usualmente não representam estruturas completas. O que diferencia os KLBs dos lexical bundles é o fato de os primeiros serem unidades identificadas como típicas de uma coleção de textos de um domínio, gênero e/ou seção específicos, quando comparados a um corpus de referência, o que leva essas unidades a desempenharem funções discursivas específicas na construção do discurso especializado de determinada disciplina ou área de especialidade.

2.2. Os gêneros do discurso e a análise de movimentos retóricos

Em sua primeira proposta de análise dos movimentos retóricos nas introduções de artigos acadêmicos, Swales (1981SWALES, John. 1981. Aspects of article introductions. Birmingham: University of Aston.) apresenta o modelo CARS (Create a Research Space), segundo o qual a organização retórica é composta de movimentos (moves), que expressam funções comunicativas. No caso das introduções de artigos de pesquisa há três movimentos obrigatórios: (i) estabelecendo o território; (ii) estabelecendo um nicho; e (iii) ocupando o nicho. Tais movimentos retóricos, por sua vez, são divididos em unidades menores, chamadas passos (steps), que podem ser obrigatórios ou opcionais. O modelo é revisado pelo autor em trabalhos posteriores (Swales, 1990______. 1990. Genre analysis: English in academic and research settings. Cambridge: Cambridge University Press.; 2004). Dentre as contribuições de Swales (1981, 1990, 2004) aos estudos de gênero, a mais relevante para esta pesquisa é, justamente, a sua investigação sobre a macroestrutura da introdução do gênero artigo acadêmico por meio da análise dos padrões organizacionais e retóricos.

Os estudos de Swales (1981SWALES, John. 1981. Aspects of article introductions. Birmingham: University of Aston., 1990, 2004) influenciaram várias pesquisas sobre gêneros acadêmicos em diversas disciplinas (Nwogu, 1997NWOGU, Kevin N. 1997. The medical research paper: Structure and functions. English for specific purposes , 16(2), 119-138., na medicina; Kanoksilapatham, 2005KANOKSILAPATHAM, Budsaba. 2005. Rhetorical structure of biochemistry research articles. English for specific purposes , 24(3), 269-292., na bioquímica; Cortes, 2013______. 2013. The purpose of this study is to: Connecting lexical bundles and moves in research article introductions. Journal of English for academic purposes, 12(1), 33-43., em contexto multidisciplinar), tendo sido o seu modelo adaptado de acordo com os propósitos de cada um dos trabalhos. Nwogu (1997) apresentou um estudo sobre a organização retórica de trinta artigos de pesquisa em inglês da área da medicina. A análise detalhada de uma amostra de quinze artigos do corpus inicialmente compilado revelou onze movimentos retóricos típicos dos artigos da disciplina estudada. Kanoksilapatham (2005), por sua vez, realizou a análise de movimentos retóricos de 60 artigos da área da bioquímica, propondo um modelo de organização para os artigos dessa disciplina.

Swales (2004______. 2004. Research genres: Explorations and applications. Cambridge: Cambridge University Press.) ressalta que os movimentos retóricos são unidades discursivas, e não unidades formais, que desempenham uma função comunicativa que os membros da comunidade discursiva pretendem expressar. Para tanto, são usados elementos linguísticos adequados à expressão do propósito comunicativo e reconhecíveis pelos membros dessa comunidade. O estudo de Cortes (2013______. 2013. The purpose of this study is to: Connecting lexical bundles and moves in research article introductions. Journal of English for academic purposes, 12(1), 33-43.) sobre movimentos retóricos de gêneros acadêmicos e linguagem formulaica concentra-se na relação entre lexical bundles e movimentos retóricos em algumas seções de artigos acadêmicos de diversas disciplinas. Cortes (2013) inova, portanto, propondo uma abordagem baseada em corpus na qual relaciona movimentos retóricos e lexical bundles como elementos que, combinados, constroem o discurso. Ela identifica lexical bundles em introduções de artigos de pesquisa como uma etapa inicial para a análise dessas expressões nas diferentes seções dos referidos artigos. Assim, a partir de um corpus de estudo de um milhão de palavras de introduções de artigos de treze disciplinas diferentes, Cortes (2013) propõe a classificação gramatical e funcional dos lexical bundles e a posterior realização da análise de movimentos retóricos.

No presente trabalho, a partir dos resultados de Cortes (2013______. 2013. The purpose of this study is to: Connecting lexical bundles and moves in research article introductions. Journal of English for academic purposes, 12(1), 33-43.), relacionamos elementos formulaicos e recorrentes do discurso aos movimentos retóricos da seção Introdução de artigos acadêmicos. Diferentemente de Cortes (2013), contudo, temos como objeto de estudo os key lexical bundles, identificados em um corpus de aproximadamente um milhão de palavras provenientes de textos de apenas uma área do conhecimento. Assim, propomos um estudo direcionado por corpus (corpus-driven) que identifica e faz uma classificação funcional de key lexical bundles, relacionando tais estruturas recorrentes a movimentos retóricos em apenas uma área do conhecimento, buscando identificar o que é típico da seção, gênero e domínio escolhidos, e não o que é generalizável. Nossos dados são extraídos de um corpus de estudo de aproximadamente um milhão de palavras de textos da seção Introdução de artigos acadêmicos no âmbito das ciências da saúde, e são comparados a um corpus de referência composto por artigos de outras áreas do conhecimento.

Em função da proximidade das áreas, optamos por usar a adaptação do modelo de Swales (1990______. 1990. Genre analysis: English in academic and research settings. Cambridge: Cambridge University Press.) feita por Kanoksilapatham (2005KANOKSILAPATHAM, Budsaba. 2005. Rhetorical structure of biochemistry research articles. English for specific purposes , 24(3), 269-292.), construída para artigos da área da bioquímica, como referência para a classificação dos key lexical bundles identificados em nosso corpus de estudo, composto de artigos das áreas da saúde. Partindo do modelo de Swales (1990), Kanoksilapatham (2005) identifica a frequência de ocorrência dos movimentos retóricos nos artigos da área da bioquímica a partir de um ponto de corte de 60%, ou seja, “para ser reconhecido como um movimento retórico convencional, o movimento deve ocorrer em 60% das seções apropriadas do corpus.”¹² 12 No original: “to be recognized as a conventional move, a move must occur in 60% of the appropriate sections in the corpus” (Kanoksilapatham, 2005, p. 272). (Kanoksilapatham 2005, p. 272). O Quadro 1 mostra a frequência de ocorrência dos movimentos retóricos identificados por Kanoksilapatham (2005) na seção Introdução dos artigos da área da bioquímica. Como pode ser observado, os movimentos retóricos 1 e 3 estavam presentes em 100% dos artigos analisados. O movimento retórico 2 se mostrou menos frequente, ocorrendo em 66% dos artigos.

Movimento retórico (doravante MR)	Frequência de ocorrência (%)
Passo (doravante P)	Frequência de ocorrência (%)
MR1: Apresentando a relevância do campo	100%
P1: Defendendo a centralidade do tópico
MR1: Apresentando a relevância do campo
P2: Fazendo generalizações
MR1: Apresentando a relevância do campo
P3: Revisando pesquisas prévias
MR2: Preparando para a presente pesquisa	66%
P1: Indicando lacunas
MR2: Preparando para a presente pesquisa
P2: Levantando questões
MR3: Introduzindo o presente estudo	100%
P1: Estabelecendo objetivo(s)
MR3: Introduzindo o presente estudo
P2: Descrevendo procedimentos
MR3: Introduzindo o presente estudo
P3: Apresentando resultados

Registro*	Acadêmico
Gênero	Artigos
Meio de publicação	Periódicos revisados por pares e de acesso aberto da plataforma PLoS ONE
Língua de publicação	Inglês
Ano (ou período) de publicação	de 2003 a 2019
Domínio	Ciências da saúde
Seção do artigo	Introdução

KLB (5 palavras)	Corpus de estudo		Corpus de referência		IC*
KLB (5 palavras)	Frequência absoluta	Frequência Normalizada	Frequência absoluta	Frequência Normalizada	IC*
by the world health organization	25	19.9	18	2.9	5.4
the present study aimed to	20	15.0	17	2.7	4.6
it has been reported that	28	22.3	30	4.8	4.0
study was to evaluate the	23	18.3	24	3.8	4.0
purpose of this study was	34	27.0	43	6.8	3.6
study was to investigate the	26	20.7	32	5.1	3.6
this study was to investigate	23	18.3	29	4.6	3.4
the aim of this study	99	78.7	161	25.6	3.0
the purpose of this study	41	32.6	66	10.5	2.9
aim of this study was	85	67.6	145	23.1	2.8

KLBs de 4 palavras			KLBs de 5 palavras		KLBs de 6 palavras
Frequência mínima: 40		IC	Frequência mínima: 20	IC	Frequência mínima: 10	IC
1	for the treatment of	10.1	by the world health organization	5.4	this study was to compare the	4.2
2	is the most common	5.0	the present study aimed to	4.6	the purpose of this study was	3.8
3	the world health organization	4.0	it has been reported that	4.0	of this study was to compare	3.7
4	has been associated with	3.6	study was to evaluate the	4.0	purpose of this study was to	3.5
5	to be associated with	3.1	purpose of this study was	3.6	this study was to evaluate the	3.5

Movimento retórico (doravante MR)	KLB (4 palavras)	KLB (5 palavras)	KLB (6 palavras)
Passo (doravante P)	KLB (4 palavras)	KLB (5 palavras)	KLB (6 palavras)
MR1: Apresentando a relevância do campo	is the most common is one of the	one of the most common is one of the most	is one of the most common is one of the most important
P1: Defendendo a centralidade do tópico	is the most common is one of the	one of the most common is one of the most	is one of the most common is one of the most important
MR1: Apresentando a relevância do campo	to the development of has been shown to	has been shown to be it has been shown that
P2: Fazendo generalizações	to the development of has been shown to	has been shown to be it has been shown that
MR1: Apresentando a relevância do campo	been shown to be have been shown to	it has been reported that it has been shown that
P3: Revisando pesquisas prévias	been shown to be have been shown to	it has been reported that it has been shown that
MR2: Preparando para a presente pesquisa	the best of our best of our knowledge	there is a lack of to the best of our	to the best of our knowledge
P1: Indicando lacunas	the best of our best of our knowledge	there is a lack of to the best of our	to the best of our knowledge
MR2: Preparando para a presente pesquisa
P2: Levantando questões
MR3: Introduzindo o presente estudo	aim of this study of this study was	the present study aimed to study was to evaluate the	this study was to compare the the purpose of this study was
P1: Estabelecendo objetivo(s)	aim of this study of this study was	the present study aimed to study was to evaluate the
MR3: Introduzindo o presente estudo	in the present study
P2: Descrevendo procedimentos	in the present study
MR3: Introduzindo o presente estudo	in the present study
P3: Apresentando resultados	in the present study

Movimento retórico (doravante, MR)	Passo (doravante, P)	KLBs com maior IC	KLBs com a mesma função comunicativa
MR1: Apresentando a relevância do campo	P1: Defendendo a centralidade do tópico	4p - is the most common	3
		5p - is one of the most	5
		6p - is one of the most important	2
	P2: Fazendo generalizações	4p - to the development of	6
		5p - has been shown to be	4
		6p - -	0
	P3: Revisando pesquisas prévias	4p - have been shown to	5
		5p - it has been reported that	4
		6p - -	0
MR2: Preparando para a presente pesquisa	P1: Indicando lacunas	4p - the best of our	6
		5p - there is a lack of	5
		6p - to the best of our knowledge	1
	P2: Levantando questões	4p - -	0
		5p - -	0
		6p - -	0
MR3: Introduzindo o presente estudo	P1: Estabelecendo objetivos	4p - aim of this study	13
		5p - the present study aimed to	18
		6p - this study was to compare the	30
	P2: Descrevendo procedimentos	4p - in the present study	1
		5p - -	0
		6p - -	0
	P3: Apresentando resultados	4p - in the present study	1
		5p - -	0
		6p - -	0

Pergunta-guia	Padrão						Exemplo de resposta à pergunta-guia
What was the aim of this study?	Thus,	the	( - )	AIM OF THIS STUDY	was to	compare	...the effect and mechanism of hyperandrogenemia and flutamide (a non-steroidal anti-androgen) on the embryo implantation and pregnancy during mid-pregnancy.
	Hence,		primary		is to	investigate
	Therefore,		primary		is to	determine
Exemplo de possível texto resultante
Thus, the primary AIM OF THIS STUDY was to investigate the effect and mechanism of hyperandrogenemia and flutamide (a non-steroidal anti-androgen) on the embryo implantation and pregnancy during mid-pregnancy.

	purpose	of	this	*study*	was	to
the	purpose	of	this	*study*	was
			this	*study*	was	to	compare
		of	this	*study*	was	to	compare
			this	*study*	was	to	evaluate
the	aim	of	our	*study*	was
		of	this	*study*	was	to	investigate
			this	*study*	was	to	investigate	the
	aim	of	our	*study*	was	to
the	aim	of	this	*study*	was
		of	this	*study*	was	to	evaluate
	objective	of	the present	*study*	was
the	objective	of	this	*study*	was
the	aim	of	this	*study*	is
the	aim	of	the present	*study*
the	objective	of	the present	*study*
		of	this	*study*	was	to	assess
			this	*study*	was	to	determine	the
	objective	of	this	*study*	was	to
		of	this	*study*	was	to	examine
		of	this	*study*	was	to	determine
		of	the present	*study*	was	to
	aim	of	this	*study*	is	to
the	objective	of	this	*study*	is
	objective	of	this	*study*	is	to
	aim	of	the present	*study*	was
	aim	of	this	*study*	was	to

Movimento Retórico (doravante, MR)	KLB (4 palavras)	KLB (5 palavras)	KLB (6 palavras)
Passo (doravante, P)	KLB (4 palavras)	KLB (5 palavras)	KLB (6 palavras)
MR1: Apresentando a relevância do campo	is the most common is one of the one of the most	one of the most common is one of the most plays an important role in one of the most important an important role in the	is one of the most common is one of the most important
P1: Defendendo a centralidade do tópico	is the most common is one of the one of the most		is one of the most common is one of the most important
MR1: Apresentando a relevância do campo	to the development of has been shown to have been shown to it has been shown are more likely to on the other hand	has been shown to be it has been shown that have been shown to be it has been suggested that
P2: Fazendo generalizações
MR1: Apresentando a relevância do campo	been shown to be have been shown to it has been shown studies have shown that in addition to the	it has been reported that it has been shown that have been shown to be it has been suggested that
P3: Revisando pesquisas prévias
MR2: Preparando para a presente pesquisa	the best of our best of our knowledge to the best of in the absence of it is necessary to little is known about	there is a lack of to the best of our little is known about the the best of our knowledge a better understanding of the	to the best of our knowledge
P1: Indicando lacunas			to the best of our knowledge
MR2: Preparando para a presente pesquisa
P2: Levantando questões
MR3: Introduzindo o presente estudo	aim of this study of this study was purpose of this study the aim of this this study was to the purpose of this the aim of the the objective of this objective of this study the present study was this study is to of this study is of the present study	the present study aimed to study was to evaluate the purpose of this study was study was to investigate the this study was to investigate the aim of this study the purpose of this study aim of this study was of our study was to of this study was to objective of this study was the objective of this study of the present study was aim of this study is the aim of the present aim of the present study the present study was to of this study is to	this study was to compare the the purpose of this study was of this study was to compare purpose of this study was to this study was to evaluate the the aim of our study was of this study was to investigate this study was to investigate the aim of our study was to the aim of this study was of this study was to evaluate aim of the present study was aim of this study was to objective of the present study was the objective of this study was the aim of this study is the aim of the present study the objective of the present study of this study was to assess this study was to determine the objective of this study was to of this study was to examine of this study was to determine of the present study was to aim of this study is to the objective of this study is objective of this study is to goal of this study was to objectives of this study were to the objectives of this study were
P1: Estabelecendo objetivo(s)
MR3: Introduzindo o presente estudo	in the present study
P2: Descrevendo procedimentos	in the present study
MR3: Introduzindo o presente estudo	in the present study
P3: Apresentando resultados	in the present study

KLB (4 palavras)	Corpus de estudo		Corpus de referência		IC
KLB (4 palavras)	Frequência absoluta	Frequência Normalizada	Frequência absoluta	Frequência Normalizada	IC
for the treatment of	58	46.1	23	3.7	10.1
is the most common	53	42.1	48	7.6	5.0
the world health organization	96	76.3	115	18.3	4.0
has been associated with	46	36.6	59	9.4	3.6
to be associated with	51	40.5	78	12.4	3.1
aim of this study	114	90.6	199	31.7	2.8
of this study was	176	139.9	323	51.4	2.7
purpose of this study	43	34.2	76	12.1	2.7
the aim of this	131	104.1	241	38.4	2.7
this study was to	166	132.0	313	49.8	2.6
the purpose of this	51	40.5	108	17.2	2.3
the aim of the	49	38.9	105	16.7	2.3
the objective of this	60	47.7	131	20.9	2.2
objective of this study	60	47.7	137	21.8	2.1
to the development of	42	33.4	102	16.2	2.0
the present study was	45	35.8	112	17.8	2.0
has been shown to	106	84.3	281	44.7	1.9
in the united states	118	93.8	336	53.5	1.7
is one of the	204	162.2	646	102.8	1.6
been shown to be	61	48.5	201	32.0	1.5
this study is to	47	37.4	156	24.8	1.5
the best of our	45	35.8	151	24.0	1.5
best of our knowledge	45	35.8	151	24.0	1.5
in the present study	82	65.2	279	44.4	1.5
of this study is	50	39.7	170	27.1	1.5
to the best of	46	36.6	157	25.0	1.4
of the present study	52	41.3	184	29.3	1.4
in the absence of	55	43.7	202	32.2	1.3
have been shown to	74	58.8	277	44.1	1.3
it has been shown	41	32.6	160	25.5	1.3
studies have shown that	70	55.6	275	43.8	1.3
it is necessary to	45	35.8	184	29.3	1.2
little is known about	46	36.6	200	31.8	1.1
one of the most	178	141.5	777	123.7	1.1
in addition to the	43	34.2	189	30.1	1.1
it is important to	74	58.8	345	54.9	1.1
are more likely to	47	37.4	223	35.5	1.1
on the other hand	128	101.7	614	97.7	1.0

Brasil

Brasil

A produção de artigos da área das ciências da saúde com o auxílio de key lexical bundles: um estudo direcionado por corpus

RESUMO

ABSTRACT

1. Introdução

2. Revisão de literatura

2.1. Linguística de Corpus

2.1.1. Pesquisa baseada em corpus versus pesquisa direcionada pelo corpus

2.1.2. Linguagem formulaica

2.1.3. Key lexical bundles

2.2. Os gêneros do discurso e a análise de movimentos retóricos

3. Corpus e procedimentos metodológicos

3.1. Constituição do corpus de estudo e do corpus de referência

3.2. Ferramenta e critérios para compilação dos corpora

3.3. Critérios para extração e classificação dos KLBs

4. Resultados e discussão

4.1. Classificação e distribuição dos KLBs conforme sua função comunicativa nos movimentos retóricos e passos da seção Introdução

4.2. A construção de recursos pedagógicos a partir dos dados coletados

4.2.1. Padrão a partir do KLB com maior chavicidade

4.2.2. O agrupamento de todos os KLBs de um passo, com mesma função comunicativa, em um único lexical frame

5. Conclusão

Referências

ANEXOS

Datas de Publicação

Histórico

**2.1.1. Pesquisa baseada em corpus versus pesquisa direcionada pelo corpus**

**4.2.1. Padrão a partir do KLB com maior chavicidade**