A SEGMENTAÇÃO LINGUÍSTICA DAS LEGENDAS PARA SURDOS E ENSURDECIDOS (LSE) DE TELENOVELAS: UMA PESQUISA BASEADA EM CORPUS1

Araújo, Vera Lúcia Santiago; Assis, Ítalo Alves Pinto de; Arraes, Daniel de Albuquerque e

doi:10.1590/010318138649264276381

RESUMO

Este trabalho tem o objetivo de descrever a segmentação na legendagem, ou seja, a distribuição das falas em duas ou mais legendas. Os dados colhidos em projetos anteriores realizados pelo grupo Legendagem e Audiodescrição (LEAD) da UECE sugerem que uma segmentação adequada pode garantir uma boa recepção por parte de surdos. Isso está acontecendo até mesmo na recepção a legendas muito rápidas. Com o suporte teórico-metodológico dos Estudos da Tradução, mais especificamente da Tradução Audiovisual (TAV) e da Linguística de Corpus, a metodologia envolveu uma dimensão descritiva pautada por análises quanti-qualitativas. eForam analisadas quatro novelas exibidas por emissoras brasileiras que disponibilizam legendas do tipo pop-on, usadas para transmitir programas pré-gravados. A legenda pop-on é aquela cujas frases ou sentenças surgem como um todo e não palavra por palavra, como acontece com a legenda rotativa. Os resultados mostraram que, para as novelas, os maiores problemas de segmentação encontrados estão na quebra entre os constituintes do sintagma verbal.

Palavras-chave:
legendagem para Surdos e Ensurdecidos (LSE); Segmentação Linguística; Linguística de Corpus

ABSTRACT

This paper aims at describing the parameter of segmentation in subtitling, that is, the distribution of the lines in two or more subtitles. The data collected in previous projects carried out by the UECE’s Subtitling and Audiodescription (LEAD) group suggests that adequate segmentation could guarantee good reception by the deaf. This is happening even in reception to very fast subtitles. With the theoretical-methodological support of Translation Studies, more specifically of Audiovisual Translation (AVT) and Corpus Linguistics, the methodology involved a descriptive dimension based on quantitative-qualitative analysis. Four soap operas exhibited by Brazilian TV Channels that provide pop-on subtitles, the type used to broadcast prerecorded programs were analyzed. The pop-on subtitle is the one whose phrases or sentences appear as a whole and not word for word as with the roll-up subtitle. The results showed that, for soap operas, the main problems of segmentation found are in the break between the constituents of the verbal phrase.

Keywords:
subtitling for the deaf and hard-of-hearing (SDH); linguistic segmentation; Corpus Linguistics

INTRODUÇÃO

Desde meados do século XX, os meios midiáticos de imagem em movimento, como cinema e televisão, têm se desenvolvido constantemente e mantido um lugar preponderante nas produções culturais humanas, tanto globais, quanto locais. Especificamente sobre o cinema, a transição dos filmes mudos para sua contraparte falada interpôs um obstáculo à distribuição internacional das obras cinematográficas: tornou-se necessário o desenvolvimento de técnicas de tradução dos diálogos dos filmes na língua de partida para a língua de chegada do público consumidor.

Dentre as técnicas desenvolvidas está a legendagem, que

consiste em representar pela escrita a tradução, para uma língua alvo, das trocas de diálogos originais enunciados pelos diferentes falantes, bem como de todas as outras informações verbais transmitidas visualmente (cartas, banners, encartes) ou pela audição (letras de música, voz off). (DIAZ-CINTAS, 2010DIAZ-CINTAS, J. (2010). Subtitling. In: GAMBIER, Y.; DOORSLAER, D. (Eds.). Handbook of Translation Studies. Amsterdam/Philadelphia: John Benjamins, pp. 344-349., p. 344)

A legendagem é uma modalidade de tradução estudada dentro dos Estudos da Tradução, mais especificamente na subárea Tradução Audiovisual (TAV), juntamente com outras três modalidades: a dublagem, o voice-over e a audiodescrição. Nas últimas décadas, além de seu uso já corriqueiro na disponibilização de produtos audiovisuais em diferentes idiomas, a legendagem tem sido empregada também como meio de acessibilidade, permitindo que pessoas com diferentes níveis de surdez tenham acesso às miríades de produções culturais televisivas, cinematográficas, digitais etc. Essa modalidade de legendagem tem sido chamada pelos pesquisadores da área de legendagem para surdos e ensurdecidos (LSE).

No Brasil, ainda estão sendo aperfeiçoados os critérios de qualidade necessários para que seu público alvo usufrua a contento das diferentes produções audiovisuais, tornando-as efetivamente acessíveis. Nesse sentido, os pesquisadores do grupo Legendagem e Audiodescrição² 2 https://grupoleaduece.blogspot.com.br (LEAD) da Universidade Estadual do Ceará (UECE) têm desenvolvido pesquisas no sentido de esboçar tais critérios de qualidade no contexto da comunidade surda brasileira. Sucintamente, as primeiras pesquisas (FRANCO; ARAÚJO, 2003FRANCO, E.; ARAÚJO. (2003). Reading Television: Checking deaf people’s Reactions to Closed Subtitling in Fortaleza, Brazil. The Translator: studies in intercultural communication, v. 9, n. 2, pp. 249-267. Disponível em: http://www.tandfonline.com/doi/abs/10.1080/13556509.2003.10799156?src. (15/03/2015).
http://www.tandfonline.com/doi/abs/10.10... ; ARAÚJO, 2004) consistiram em pesquisas exploratórias que testaram legendas do tipo closed caption produzidas pelos canais de televisão nacionais. Os depoimentos dos participantes apontavam que era a velocidade o fator responsável por problemas de recepção dessas legendas por parte dos surdos brasileiros.

Posteriormente, novas pesquisas exploratórias (ARAÚJO, 2008ARAÚJO. (2008). Por um modelo de legendagem para Surdos no Brasil. Tradução e comunicação: Revista Brasileira de Tradutores, n. 17, pp. 59–76. Disponível em: http://sare.anhanguera.com/index.php/rtcom/article/view/148/147. (24/03/2016).
http://sare.anhanguera.com/index.php/rtc... ) foram realizadas no sentido de testar diferentes modelos de legendagem com surdos cearenses para chegar a uma proposta que atendesse ao público brasileiro. O parâmetro apontado como responsável pela má recepção dos surdos foi o da velocidade. Esse modelo foi testado novamente (ARAÚJO; NASCIMENTO, 2011ARAÚJO.; NASCIMENTO, A. K. P. (2011). Investigando parâmetros de legendas para Surdos e Ensurdecidos no Brasil. Tradução em Revista, n. 11, pp. 1-18. Disponível em: http://www.maxwell.lambda.ele.puc-rio.br/18862/18862.PDF. (24/03/2016).
http://www.maxwell.lambda.ele.puc-rio.br... ; ARAÚJO; VIEIRA; MONTEIRO, 2013ARAÚJO.; VIEIRA, P. A.; MONTEIRO, S. M. M. (2013). Legendagem para surdos e ensurdecidos (LSE): um estudo de recepção com surdos da região sudeste. TradTerm, v. 22, pp. 283-302. Disponível em: http://www.revistas.usp.br/tradterm/article/view/69132/71589. (24/03/2016).
http://www.revistas.usp.br/tradterm/arti... , ARAÚJO, 2012) em uma pesquisa de âmbito nacional, na qual foram feitos testes de recepção com 34 surdos distribuídos em sete capitais brasileiras - Porto Alegre e Santa Catarina, na região Sul; Rio de Janeiro e Belo Horizonte, no Sudeste; Salvador e Fortaleza, no Nordeste; e Rio Branco, no Norte.

As coletas consistiam em apresentar aos participantes trechos de produtos audiovisuais, com o objetivo de confirmar uma hipótese: legendas rápidas (180 palavras por minuto - ppm) causariam problemas na compreensão das informações ali contidas, prejudicando a recepção, ao passo que legendas lentas (145ppm) seriam facilmente lidas pelos participantes. Curiosamente, os resultados dessa nova pesquisa foram de encontro à hipótese levantada: nas diferentes capitais, os participantes dos testes de recepção acompanharam eficientemente os filmes legendados com legendas rápidas desde que bem segmentadas. Uma reflexão posterior levou à postulação de uma nova hipótese, qual seja: a segmentação tem influência na recepção das legendas pelos surdos brasileiros.

Segmentação, de acordo com Diaz-Cintas e Remael (2007), significa dividir os diálogos traduzidos em segmentos - inserções de legenda - que possam ser compreendidos pelos espectadores. A segmentação pode seguir três critérios: os cortes de cena (segmentação visual); as pausas respiratórias dos falantes (segmentação retórica); e as características sintáticas e semânticas da mensagem (segmentação linguística). Sobre esses três critérios, a pesquisa de Chaves (2012CHAVES, E. G. (2012). Legendagem para Surdos e Ensurdecidos: um estudo baseado em corpus da segmentação nas legendas de filmes brasileiros em DVD. 126f. Dissertação (Mestrado em Linguística Aplicada). Universidade Estadual do Ceará, Fortaleza- CE. ; CHAVES, ARAÚJO, 2014CHAVES, E. G.; ARAÚJO. (2014). Segmentation tags: a proposal for the analysis of subtitles. In: ALUÍSIO, S. M.; TAGNIN, S E. O. (Orgs.) New language, technologies and linguistic research: a two way road. Newcastle upon Thyne: Cambridge Scholar’s Publishing, pp. 62-75.) sugeriu que a segmentação linguística seria aquela que traria mais dificuldades na recepção. Por essa razão, no triênio 2012-2014 foi levado a cabo o projeto de pesquisa denominado “A segmentação na legendagem para surdos e ensurdecidos (LSE): um estudo baseado em corpus” (ARAÚJO, 2015), abreviado como projeto CORSEL (Corpus, Segmentação e Legendagem). O projeto coletou legendas de diferentes programas televisivos - novelas, documentários e comédias de situação - visando a identificação de legendas com segmentação linguística problemática, sua classificação em categorias, bem como a elaboração de soluções para os problemas (ressegmentação).

O presente artigo apresenta os resultados obtidos para o gênero telenovela. Foram analisadas as legendas de quatro novelas. O corpus foi constituído pela extração das legendas de cinco episódios de cada uma dessas novelas. Além desta introdução, o artigo possui uma seção sobre as bases teóricas, a qual aborda, em maiores detalhes, a segmentação linguística e sua relação com outros parâmetros de legendagem; uma seção sobre a metodologia, a qual descreve os procedimentos realizados para coleta dos dados e posterior análise; uma seção de discussão dos resultados; e uma seção de considerações finais.

1. LEGENDAGEM PARA SURDOS E ENSURDECIDOS (LSE)

A LSE é um recurso de acessibilidade para espectadores surdos que consiste na inserção de legendas em produções audiovisuais. Essas legendas diferem daquelas para ouvintes por alguns aspectos: 1) introdução de informações adicionais dependentes do canal auditivo para que aqueles com deficiência possam acompanhar filmes e programas de televisão; 2) questões técnicas; e 3) concepção de tradução. (FRANCO; ARAÚJO, 2003FRANCO, E.; ARAÚJO. (2003). Reading Television: Checking deaf people’s Reactions to Closed Subtitling in Fortaleza, Brazil. The Translator: studies in intercultural communication, v. 9, n. 2, pp. 249-267. Disponível em: http://www.tandfonline.com/doi/abs/10.1080/13556509.2003.10799156?src. (15/03/2015).
http://www.tandfonline.com/doi/abs/10.10... ; ARAÚJO, 2004; ARAÚJO, 2005; ARAÚJO, 2007). As informações adicionais são de dois tipos: efeito sonoro e identificação do falante (ARAÚJO, 2008). Sobre as questões técnicas, podemos expor que as legendas para ouvintes, como as conhecemos hoje, têm no máximo duas linhas; são normalmente de cor branca ou amarela; duram no mínimo 1 e no máximo 6 segundos (D’YDEWALLE ET ALLI, 1987D’YDEWALLE, G.; PRAET, C.; VERFAILLIE, K.; VAN RENSBERGEN, J. (1987). Reading a message when the same message is available auditorily in another language: the case of subtitling. In: O’REGAN, J. K.; LÉVY-SCHOEN, A. (Eds.). Eye Movements: From Physiology to Cognition. Amsterdam, New York: Elsevier Science Publishers, pp. 313-321.); e possuem três velocidades que permitem que o espectador harmonize a leitura das legendas com o áudio e as imagens do filme: 145 palavras por minuto (ppm), 160 ppm e 180ppm (D’YDEWALLE ET ALLI, 1987; IVARSSON; CAROL, 1998IVARSSON, J.; CARROLL, M. (1998). Subtitling. Simrishamm, Suécia: TransEditHB.); DIAZ CINTAS; REMAEL, 2007DIAZ-CINTAS, J.; REMAEL, A. (2007). Audiovisual Translation: Subtitling. Manchester, UK, Kinderhook, NY, UK: St. Jerome Publishing.).

Essa harmonização entre imagem, áudio e legendas é conquistada com a redução do texto para que o espectador tenha tempo de ler as legendas, desfrutar das imagens e ainda ouvir o áudio original, no caso dos ouvintes. A redução é necessária porque os espectadores, surdos ou ouvintes, absorvem a fala muito mais rapidamente do que a escrita. Para que o telespectador assista à produção legendada com conforto, é preciso que a velocidade da fala seja de 145, 160 ou 180ppm. No caso de a fala ser mais rápida, as legendas precisarão ser editadas para que a recepção seja eficiente.

Para que a edição aconteça, algumas vezes pode ser necessária a segmentação de uma fala em duas ou mais legendas. Segundo Diaz Cintas e Remael, “quando segmentamos uma sentença, forçamos o cérebro a pausar seu processo linguístico por um instante, até os olhos localizarem a próxima informação linguística” (2007, p. 173). Isso significa que se a segmentação não for cuidadosa, os leitores farão esforço para decodificar o texto e, consequentemente, poderão se cansar mais rapidamente e perder o prazer proporcionado pelo filme ou programa. As legendas precisam ter um pensamento completo para serem entendidas no curto espaço de tempo em que são exibidas. Diaz Cintas e Remael (2007, p.172) propõem que..... a segmentação acontece dentro da mesma legenda ou entre legendas diferentes. O primeiro caso, a QUEBRA DE LINHA, diz respeito à divisão interna de uma legenda quando esta precisa ser dividida em duas linhas. O segundo caso, chamado também de SEGMENTAÇÃO, relaciona-se ao fato de o fenômeno acontecer entre duas ou mais legendas.

No que concerne à segmentação linguística (REID, 1990REID, H. (1990). Literature on the screen: subtitle translation for public broadcasting. In: BART, W.; D’HAEN, T. (Eds.). Something understood. Studies in Anglo- Dutch literary translation.Amsterdam: Rodopi, p. 97- 107., p. 100), Karamitroglou (1998KARAMITROGLOU, F. (1998). A Proposed Set of Subtitling Standards in Europe. Translation Journal, v. 2, n. 2, pp. 1-15. Disponível em: http://translationjournal.net/journal/04stndrd.htm. (10/03/2014).
http://translationjournal.net/journal/04... ) afirma que o texto legendado deve ser segmentado no mais alto nível sintático possível. Isso significa que, idealmente, cada legenda deve conter um pensamento completo composto por unidades semânticas nos níveis do período, da oração e dos sintagmas (nominais, verbais, preposicionais, adjetivais e adverbiais). Isso quer dizer que, quando uma oração ou um sintagma precisam ser enunciados em mais de uma linha, a segmentação deve acontecer de acordo com as regras da sintaxe (PEREGO, 2008).

Vejamos então o exemplo de uma segmentação problemática presente nas as legendas oferecidas por um partido político na campanha eleitoral de 2006 (ARAÚJO, 2009ARAÚJO. (2009). In Search of SDH Parameters for Brazilian Party Political Broadcasts. In: The Sign Language Translator and Interpreter, Manchester: St. Jerome Publishing Company, v. 3, n. 2, p. 157-167.:165).

	Legendas	Duração segundos: quadros	Caracteres
L1	Só neste ano, oitenta e cinco mulheres foram assassinadas	2:12	58
L2	no estado do Ceará. Enquanto isso, apenas três assassinos	2:20	56
L3	foram condenados. Essa impunidade aumenta os índices	2:16	52
L4	de violência doméstica e sexual contra as mulheres.	2:18	49

	Legendas	Duração	Caracteres
L1	Só neste ano, 85 mulheres foram assassinadas no estado do Ceará.	3:10	77
L2	Enquanto isso, apenas três assassinos foram condenados.	2:07	55
L3	Essa impunidade aumenta os índices de violência doméstica e sexual contra as mulheres.	3:20	83

Segundos: Quadros	Caracteres
01:00	16
01:04	17
01:08	18
01:12	20
01:16	23
01:20	25
02:00	29
02:04	32
02:08	34
02:12	36
02:16	38
02:20	40
03:00	44
03:04	46
03:08	48
03:12	50
03:16	52
03:20	54
04:00	58
04:04	60
04:08	62
04:12	64

Novela	Período da gravação
AEO	18 a 23 de junho e 25 a 30 junho de 2012
CC	16 a 27 de abril de 2012
CP	18 a 21 de junho e 26 a 28 de junho de 2012
AB	27 a 31 de junho de 2012

Número da legenda	<sub1⁵ 5 Abreviatura de subtitle, ‘legenda’ em inglês. >legenda1</sub1>
Linhas por legenda	<1L>, <2L> e <3L⁶ 6 A quantidade de 3 linhas por legenda não é recomendada por estudiosos de TAV por ser, segundo pesquisas (D’YDEWALLE et al., 1987), um fator que dificulta uma boa recepção. >
Tempo inicial e final de cada legenda	<t>início --> final</t>
Número de caracteres por linha	<cpl>
Velocidade de legenda baixa (145ppm) Velocidade de legenda média (160ppm) Velocidade de legenda alta (180ppm)	<veloc_leg_baixa> <veloc_leg_média> <veloc_leg_alta>

Sintagma Nominal (SN)	O SN é uma construção cuja estrutura tem por núcleo um substantivo ou um pronome, tendo por Especificador o artigo e os pronomes e por Complementadores os SAdjs e os SPs.
Sintagma Verbal (SV)	O SV é a construção que tem como núcleo o verbo. Como a oração é um verbo que articula seus argumentos, a única diferença entre o SV e uma oração é que no SV não figura o sujeito.
Sintagma Adjetival (SAdj)	O SAdj tem por Núcleo o adjetivo, que é uma classe basicamente predicadora, funcionando como adjunto adnominal, enquanto constituinte do sintagma nominal, ou como predicativo, enquanto constituinte do sintagma verbal (CASTILHO, 2012CASTILHO, A. T. (2012). Nova gramática do português brasileiro. São Paulo: Contexto., p. 516). O SAdj tem como Especificador advérbios predicativos qualificadores e como Complementador SPs e orações substantivas objetivas.
Sintagma Preposicional (SP)	O SP tem por núcleo a preposição, por Especificador o advérbio, enquanto o Complementador em um SP também pode ser: (i) um verbo, como em ‘para comer’, (ii) um pronome, como em ‘para mim’, ‘para quem’; (iii) um quantificador definido, como em ‘para dois’; (iv) um quantificador indefinido, como em ‘para muitos’, dentre outras possibilidades de realização.
Sintagma Adverbial (SAdv)	O SAdv tem como núcleo o advérbio e como Especificador e Complementador outros advérbios. Sintaticamente, Castilho (2012CASTILHO, A. T. (2012). Nova gramática do português brasileiro. São Paulo: Contexto.) diz que os advérbios mantêm relação entre si e com os adjetivos, verbos e orações inteiras.
Orações complexas	Enunciados que possuem mais de um verbo, ou seja, contêm mais de uma oração, podendo estabelecer relação de coordenação, subordinação e correlação entre si.

			PROSEGL
Novela	Nº de legendas	Tokens	VA	%	IFS (problemas de segmentação a cada mil palavras)
AEO	1849	14.856	333	17,9	22,4
CC	1725	13.112	243	14,0	18,5
CP	1282	9.744	324	25,2	33,2
AB	2847	22.998	310	10,8	13,5
TOTAL	7703	60.710	1210	15,7	19,9

Novela	SV	SN	SAdj	SAdv	SP	COORD	SUBORD
AEO	146	109	6	4	32	6	30
CC	85	80	2	6	31	12	27
CP	150	61	8	1	27	22	55
AB	149	71	10	3	36	5	36
TOTAL 1 (VA)	530	321	26	14	126	45	148
TOTAL 2 (%)	44,35	26,86	2,17	1,17	10,54	3,76	12,38

Novela	Legenda de 2L	Legenda de 3L	145ppm Vel. Baixa	160ppm Vel. Média	180ppm Vel. Alta
AEO	150	182	143	14	175
CC	115	127	75	11	156
CP	161	163	170	16	138
AB	131	178	77	23	209
TOTAL 1 (VA)	557	650	465	64	678
TOTAL 2 (%)	46,1	53,9	38,5	5,3	56,2

ETIQUETAS DE ANÁLISE DO SINTAGMA NOMINAL (SN)
<SN_especif+SN> <SN_subs+SAdj> <SN_subs+SP> <SN_núcleo>
ETIQUETAS DE ANÁLISE DO SINTAGMA VERBAL (SV)
<SV_composto> <SV_verbo+SAdv> <SV_(verbo)+oblíquo+verbo> <SV_verbo+SP>
ETIQUETAS DE ANÁLISE DO SINTAGMA ADJETIVAL (SAdj)
<SAdj_especif+SAdj>
ETIQUETAS DE ANÁLISE DO SINTAGMA PREPOSICIONAL (SP)
<SP_prep+SN> <SP_prep+SV> <SP_prep+SAdj>
ETIQUETAS DE ANÁLISE DO SINTAGMA ADVERBIAL (SAdv)
<SAdv_adv+adv>
ETIQUETAS DE ANÁLISE DE ORAÇÃO SUBORDINADA (SUBORD)
<SUBORD_conj/pron_rel+oração>
ETIQUETAS DE ANÁLISE DE ORAÇÃO COORDENADA (COORD)
<COORD_conj+oração>

Brasil

Brasil

A SEGMENTAÇÃO LINGUÍSTICA DAS LEGENDAS PARA SURDOS E ENSURDECIDOS (LSE) DE TELENOVELAS: UMA PESQUISA BASEADA EM CORPUS1 1 Este projeto teve financiamento do CNPq em forma de bolsa de produtividade de Vera Lúcia Santiago Araújo.

THE LINGUISTIC SEGMENTATION OF SUBTITLES FOR THE DEAF AND THE HARD-OF-HEARING (SDH) OF SOAP OPERAS: A CORPUS-BASED RESEARCH

RESUMO

ABSTRACT

INTRODUÇÃO

1. LEGENDAGEM PARA SURDOS E ENSURDECIDOS (LSE)

2. METODOLOGIA

3. RESULTADOS E DISCUSSÕES

3.1. Sintagma verbal (SV)

3.2. Sintagma nominal (SN)

3.3. Sintagma preposicional (SP)

3.4. Sintagma adjetival (SAdj)

3.5. Sintagma advervial (SAdv)

3.6. Orações coordenadas e subordinadas

3.7. Relação das características técnicas com os problemas de segmentação linguística

CONSIDERAÇÕES FINAIS

REFERÊNCIAS BIBLIOGRÁFICAS

Errata

Datas de Publicação

Histórico

A SEGMENTAÇÃO LINGUÍSTICA DAS LEGENDAS PARA SURDOS E ENSURDECIDOS (LSE) DE TELENOVELAS: UMA PESQUISA BASEADA EM CORPUS¹ 1 Este projeto teve financiamento do CNPq em forma de bolsa de produtividade de Vera Lúcia Santiago Araújo.