Acessibilidade / Reportar erro

Parser sintático para o português brasileiro: desafios e soluções

Syntactic parser for Brazilian Portuguese: challenges and Solutions

Resumo

Este artigo tem como objetivo apresentar o Parser Sintático para o Português Brasileiro - Parsero, desenvolvido a partir da Gramática Gerativa (CHOMSKY, 2015CHOMSKY, N. Estruturas sintáticas. São Paulo: Vozes, 2015.), aperfeiçoada pela Teoria X-Barra (CHOMSKY, 2014CHOMSKY, N. Ciência da linguagem. São Paulo: Editora UNESP, 2014.). Para tanto, foram utilizadas as regras desenvolvidas especialmente para o Português Brasileiro por Othero (2009)OTHERO, G. de A. A gramática da frase em português: algumas reflexões para a formalização da estrutura frasal em português. Porto Alegre: EDIPUCRS, 2009. Disponível em: Disponível em: https://bibliodigital.unijui.edu.br:8443/xmlui/handle/123456789/1490 . Acesso em: 16 out. 2021.
https://bibliodigital.unijui.edu.br:8443...
e adaptadas pelo nosso projeto para atender às necessidades de nosso Parser. A pesquisa utilizou como coleção lexical, para povoar um Banco de Dados Structured Query Language (SQL), o recurso Dicionário de Palavras Simples Flexionadas para o Português Brasileiro (DELAF_PB), disponibilizado pelo Projeto Unitex-PB, desenvolvido pelo Núcleo Interinstitucional de Linguística Computacional (NILC) e pelo Instituto de Ciências Matemáticas e de Computação (ICMC). Esse recurso, por sua vez, foi construído com base no formalismo francês - Dictionnarie Electronique du LADL (DELA) (MUNIZ, 2004MUNIZ, M. C. M. A construção de recursos linguístico-computacionais para o português do Brasil: o projeto de Unitex-PB. 2004. Dissertação de Mestrado - Instituto de Ciências Matemáticas de São Carlos, USP. Disponível em: http://ladl.univ-mlv.fr/brasil/bibliografia/oto/DissMuniz2004.pdf.
http://ladl.univ-mlv.fr/brasil/bibliogra...
). Como resultado, disponibilizamos a Base de Dados SQL com 1.193.295 unidades léxicas classificadas, o endereço com o código aberto do Parsero e um link para execução do aplicativo. Para desenvolver o Processador de Linguagem Natural (PLN), colocamos em prática estudos interdisciplinares em ciências da linguagem e ciências da computação, práticas necessárias para o desenvolvimento de programas inteligentes que consigam interagir com escritores e falantes do Português Brasileiro.

Palavras-chave:
Linguística computacional; Processamento de Linguagem Natural; Gramática gerativa; Parser sintático; Português brasileiro

Universidade Federal de Minas Gerais - UFMG Av. Antônio Carlos, 6627 - Pampulha, Cep: 31270-901, Belo Horizonte - Minas Gerais / Brasil, Tel: +55 (31) 3409-6009 - Belo Horizonte - MG - Brazil
E-mail: revistatextolivre@letras.ufmg.br