Análise Sintática Automática por Dependência

2012 
Define-se a linguistica como um estudo cientifico da linguagem humana, ou um estudo de fatos que compoem ela. A linguistica e uma parte do conhecimento amplamente debatida por especialistas. Uma das areas que integra o estudo da linguistica e a sintaxe: consiste no estudo de como a linguagem combina palavras para formar frases gramaticais, ou seja, uma analise sintatica. Na Ciencia da Computacao, uma analise sintatica (tambem conhecida como parsing no ingles) e o processo que analisa uma sequencia de entrada lida de um arquivo de computador ou teclado como uma sentenca e determina sua estrutura gramatical. Analisadores Sintaticos fazem parte da area de pesquisa de Processamento de Linguagem Natural (PLN) , que estuda problemas de compreensao e geracao automatica de linguas humanas naturais. Exemplos onde sao aplicados tais conhecimentos sao geracao automatica de texto, traducao automatica de textos, reconhecimento de voz e sumarizacao automatica. Este trabalho tem por objetivo o estudo de parsers no portugues brasileiro. O parser realiza a analise sintatica automatica de frases em termos de suas funcoes gramaticais, ou seja, se colocarmos uma frase como “o menino brinca”, o parser e capaz de processa-la e dar como saida a sinalizacao do que e artigo, sujeito e complemento da frase. A saida entao sera uma arvore onde os nos folha sao as palavras da sentenca. Um outro tipo de parser que nao tem sua saida como uma arvore e o parser por dependencia, que faz o uso da predicao das palavras, ou seja, cada palavra da frase tem uma relacao com seus dependentes. Por exemplo, saber a identidade do verbo ajuda a determinar qual e o sujeito e qual e o objeto na frase. Entretanto, para que o parser consiga fazer tais analises e necessario que ele seja treinado antes disso. Esse treinamento e feito com um corpus que consiste num texto com seus termos e palavras ja classificados com suas respectivas classes gramaticais, ou seja, o programa tera seu treinamento baseado em exemplos positivos de estruturas sintaticas. A eficiencia de um parser e medida atraves do quanto ele consegue recuperar a estrutura e rotular corretamente as classes gramaticais em relacao a um texto pre-anotado manualmente. Na lingua inglesa, o problema de parsing e significativamente estudado, sendo possivel o acesso facil a programas disponibilizados para a analise de frases em ingles. Infelizmente, a area de PLN e a analise sintatica no portugues ainda nao sao tao desenvolvidas, sendo os materiais encontrados sobre essa area geralmente de sites de universidades portuguesas. No Brasil, tanto sites como ate livros traduzidos sao um tanto escassos, como tambem de pesquisas voltadas a parsers que analisem o portugues brasileiro. Diante deste cenario, este trabalho, portanto, busca diminuir um pouco essa lacuna de parsers por dependencia para o portugues.
    • Correction
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []