Hybrid Semantic Annotation: Rule-based and Manual Annotation of the Open American National Corpus with Top-Level Ontology
DOI:
https://doi.org/10.5752/P.2316-9451.2019v7n3p64-78Keywords:
Hybrid Semantic Annotation. Rule-based Annotation. Manual Annotation. Top-Level Ontology.Abstract
O processamento de linguagem natural ainda enfrenta o desafio de fazer com que as máquinas compreendam o significado contido nas palavras que ocorrem em uma frase. A anotação semântica ajuda nesse processo adicionando metadados que atribuem significado aos lexemas. Existem diversos aspectos semânticos que podem ser anotados, tais como função, papel semântico e categorias ontológicas. As categorias ontológicas de nível superior adicionam informações sobre a natureza do conceito denotado pelo lexema e permitem eliminar ambiguidades. A proposta de trabalho é uma abordagem híbrida de anotação semântica baseada em ontologias de nível topo aplicadas a um corpus em inglês americano. A pesquisa é dividida em duas etapas de anotação, ambas usando as categorias de alto nível topo do Schema.org como rótulos de anotação. Na primeira etapa é criado um anotador baseado em regras, e na segunda etapa é feita uma anotação manual para correção e adição de rótulos no corpus anotado na etapa anterior. A contribuição deste trabalho é a geração de um corpus anotado que pode ser usado no treinamento de anotadores automáticos.
Downloads
Downloads
Published
How to Cite
Issue
Section
License
I (we) submit the present work, an original and unpublished manuscript, from my (our) authorship, to Abakós - Magazine of Interdisciplinary Studies on Science and Informatics, and I (we) agree that the copyright related to this work will become property of PUC Minas Publisher. No partial or full reproduction is allowed, by any means (printed or electronic), dissociated from Abakós. Any reproduction requires prior written authorization granted by the Editor.
I (we) declare there is no type of interest conflict among the subject theme, author(s), organization(s), institution(s) and person(s).
I (we) recognize that Abakós is licensed under CREATIVE COMMONS:
Licença Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported (CC BY-NC-ND 3.0).