Hybrid Semantic Annotation: Rule-based and Manual Annotation of the Open American National Corpus with Top-Level Ontology

2019 
O processamento de linguagem natural ainda enfrenta o desafio de fazer com que as maquinas compreendam o significado contido nas palavras que ocorrem em uma frase. A anotacao semântica ajuda nesse processo adicionando metadados que atribuem significado aos lexemas. Existem diversos aspectos semânticos que podem ser anotados, tais como funcao, papel semântico e categorias ontologicas. As categorias ontologicas de nivel superior adicionam informacoes sobre a natureza do conceito denotado pelo lexema e permitem eliminar ambiguidades. A proposta de trabalho e uma abordagem hibrida de anotacao semântica baseada em ontologias de nivel topo aplicadas a um corpus em ingles americano. A pesquisa e dividida em duas etapas de anotacao, ambas usando as categorias de alto nivel topo do Schema.org como rotulos de anotacao. Na primeira etapa e criado um anotador baseado em regras, e na segunda etapa e feita uma anotacao manual para correcao e adicao de rotulos no corpus anotado na etapa anterior. A contribuicao deste trabalho e a geracao de um corpus anotado que pode ser usado no treinamento de anotadores automaticos.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    11
    References
    0
    Citations
    NaN
    KQI
    []