Sistema automático de transcrição fonológica para o português / Automatic phonological transcription system for Portuguese

RESUMO : Os sistemas de transcricao automatica de grafema para fonema sao conhecidos como Graphem to phoneme (G2P). Neste trabalho, apresentamos um sistema automatic o de transcricao fonologica para o portugues, utilizando a tecnologia de estados finitos. Para o desenvolvimento desse sistema, seguimos os seguintes passos: a compreensao da relacao entre as formas graficas e as formas fonologica s da lingua, a construcao de um algoritmo, a implementacao desse algoritmo numa linguagem de programacao, o teste e a avaliacao do sistema num corpus d a li ngua portuguesa. Apos o desenvolvimento, os resultados mostraram que o sistema apresenta nivel satisfatorio para a maior quantidade de palavras dessa lingua; todavia, ainda precisa melhorar em outros aspectos, como a distincao entre o som aberto e o som fechado nas vogais anterior e posterior . PALAVRAS - CHAVE : Portugues; t ranscricao fonologica automatica; f orma grafica; f orma fonologica . ABSTRACT : The automatic grapheme transcription systems for phoneme are known as Graphem to phoneme (G2P). In this work, we present an Automatic phonological transcription system for Portuguese, using finite-state technology. For the development of this system, we follow these steps: the understanding of relationship between the graphical form and the phonological form of the language, the building of an algorithm, the implementation of this algorithm in a programming language, the testing and the evaluation of the system in a Portuguese language writing corpus . After the development, the results showed that the system presents a satisfactory level for the greatest amount of words of that language; however, it needs to be improved in other aspects, such as the distinction between open and closed sound in the anterior and posterior vowels . KEYWORDS : Portuguese; automatic phonological transcription; graphical form; phonological form . BECHARA, E. Moderna gramatica portuguesa . 38. ed. Rio de Janeiro: Lucerna, 2005. BEESLEY, K. R.; KARTTUNEN, L. Finite-State Morphology : Xerox Tools and Techniques, 2002. BIRD, S.; KLEIN, E.; LOPER, E. Learning to classify text. In: _____. Natural language processing with python . United States of America: O'Reilly, 2009, p. 221-257. Disponivel em: . Acesso em: mai. 2012. BRAGA, D.; COELHO, L.; RESENDE Jr., F. G. V. A Rule-Based Grapheme-to-Phone Converter for TTS Systems in European Portuguese, VI Int. Telecommunications Symposium , Fortaleza-CE, Brazil, 2006. p. 976-981. CARVAL HO, C. I. C. Transdutor de estados finitos para conversao de grafema para a pronuncia da variedade linguistica potiguar . 2016. 160 f. Tese (doutorado em Linguistica) – Universidade Federal do Ceara, Centro de Humanidades, Departamento de Letras Vernaculas, Fortaleza, 2016. CARVALHO, C. I. C. Conversor de transcricao fonetica automatica para as formas linguisticas da variedade linguistica potiguar. Dominios de Lingu@gem , [s.l.], v. 11, n. 3, p. 733-752, 30 jun. 2017. EDUFU. Disponivel em: . Acesso em: 10 ago. 2017. CHOMSKY, N.; HALLE, M. The sound pattern of english . New York: Harper e Row, 1968. HULDEN, M. Finite-State Syllabification . In: HULDEN, M . YLI-JYRA, A.; KARTTUNEN, L.; KARHUMAKI, J. FSMNLP 2005 , LNAI 4002, 2006, p. 86-96. HULDEN, M. Foma: a finite-state compiler and library. In: CONFERENCE OF THE EUROPEAN CHAPTER OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS, 12., 2008, Atenas. Proceedings... Atenas: Eacl, p. 29-32, 2008. Disponivel em: . Acesso em: 15 ago. 2013. JARGAS, A. M. Expressoes Regulares : uma abordagem divertida. Novatec Editora, 2006. SEARA, I. C.; NUNES, V. G.; LAZZAROTTO-VOLCAO, C. Fonetica e fonologia do portugues brasileiro . Editora Contexta, 2015. SILVA, T. C. Fonetica e fonologia do portugues . 10. ed. Sao Paulo: Contexto, 2014. TEIXEIRA, A.; OLIVEIRA, C.; MOUTINHO, L. On the Use of Machine Learning and Syllable Information in European Portuguese GraphemePhone Conversion, Proc. PROPOR 2006 , 2006. p. 212-215. VASILEVSKI, V. Construcao de um sistema computacional para suporte a pesquisa em fonologia do portugues do Brasil . 2008. 166f. Tese de doutorado - Pos-graduacao em Linguistica da Universidade Federal de Santa Catarina, 2008. VEIGA, A.; CANDEIAS, S.; PERDIGAO, F. Conversao de Grafemas para Fonemas em Portugues Europeu – Abordagem Hibrida com Modelos Probabilisticos e Regras Fonologicas. Linguamatica , v . 3, n o 1, 2, p . 39–51, d ez. 2011 .
