Publication:
Um método de indexação automática baseada em ontologia

Loading...
Thumbnail Image
Full text at PDC
Publication Date
2015-11-17
Advisors (or tutors)
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad Complutense de Madrid
Citations
Google Scholar
Research Projects
Organizational Units
Journal Issue
Abstract
O processo de indexação tem como objetivo representar resumidamente o conteúdo informacional de documentos por meio de um conjunto de termos. Com o surgimento da Web, as pesquisas em indexação automática receberam grande impulso, tendo em vista a necessidade recuperação desse imenso acervo documental. As linguagens de indexação tradicionais, utilizadas para traduzir o conteúdo temático de documentos de forma padronizada, sempre se mostraram eficientes na indexação manual. As ontologias abrem novas perspectivas para as pesquisas em indexação automática, pois oferecem uma estrutura conceitual e terminológica restrita a um determinado domínio, representada com linguagens processáveis por computador. O uso de ontologias no processo de indexação automática permite agregar a esse processo uma terminologia de um domínio específico e uma estrutura lógica e conceitual que pode ser utilizada para realizar inferências, permitindo uma expansão dos termos diretamente extraídos do texto do documento. Este trabalho apresenta um método para a construção e a utilização de ontologias no processo de indexação automática. A partir dos resultados apresentados, pode-se conclui-se que a utilização de ontologias no processo de indexação permite não só agregar novos recursos ao processo de indexação, mas também permite pensar em novas e avançadas funcionalidades em um sistema de recuperação de informação.
The indexing process aims to represent synthetically the informational content of documents by a set of terms whose meanings indicate the themes or subjects treated by them. With the emergence of the Web, research in automatic indexing received major boost with the necessity of retrieving documents from this huge collection. The traditional indexing languages, used to translate the thematic content of documents in standardized terms, always proved efficient in manual indexing. Ontologies open new perspectives for research in automatic indexing, offering a computer-processable language restricted to a particular domain. The use of ontologies in the automatic indexing process allows using a specific domain language and a logical and conceptual framework to make inferences, and whose relations allow an expansion of the terms extracted directly from the text of the document. This paper presents techniques for the construction and use of ontologies in the automatic indexing process. We conclude that the use of ontologies in the indexing process allows to add not only new feature to the indexing process, but also allows us to think in new and advanced features in an information retrieval system.
Description
UCM subjects
Keywords
Citation
Anderson, J.D., Perez-Carballo, J. (2001). The nature of indexing: how humans and machines analyze messages and texts for retrieval. Part I: Research, and the nature of human indexing. Information Processing and Management, 37, p.231-254. Daconta, M.C., Obrst, L.J., Smith, K.T. (2003). The Semantic Web: a guide to the Future of XML, Web Services, and Knowledge Management. Indianápolis: Wiley Publishing. Ducharme, Bob. (2013). Learning SPARQL: Querying and Updating with SPARQL 1.1. 2nd ed. Sebastopol (USA): O' Reilly. Esteban Navarro, M.A. (1996). El marco disciplinar de los lenguajes documentales: la Organización del Conocimiento y las ciencias sociales. Scire, Zaragoza, 2(1). Gómez-Pérez, A. (1999). Evaluation of taxonomic knowledge in ontologies and knowledge bases. In: Twelfth Workshop on Knowledge Acquisition, Modeling and Management, 12. Alberta, Canadá. Grishman, Ralph. (1997). Information extraction, techniques and challenges. In: International Summer School SCIE-97. New York. Proceedings… New York : Springer-Verlag. Gruber, T. (1995). Toward Principles for the Design of Ontologies Used for Knowledge Sharing. International Journal Human-Computer Studies, 43(5-6). Guimarães, F.J.Z. (2002). Utilização de ontologias no domínio B2C. Dissertação de Mestrado - Departamento de Informática, Pontifícia Universidade Católica do Rio de Janeiro. Guizzard G. (2005). Ontological Foundations for Structural Concept Models, Ph.D. Thesis, University of Twente, The Netherlands. Keyser, P. (2012). Indexing: from thesauri to the Semantic Web. Burlington, MA: Elsevier Science. Lancaster, F.W. (2004). Indexação e Resumos: teoria e prática. 2.ed. Brasília, DF: Briquet de Lemos. Manaf, N.A.A., Bechhofer, S. & Stevens, R. (2010). A Survey of Identiers and Labels in OWL Ontologies. Proceedings of the 6th International Workshop on OWL Experiences and Directions (OWLED). Novellino, M.S.F. (1996). Instrumentos e metodologias de representação da informação. Informação & Informação, Londrina, 1(2), p.37-45. Pérez, J., Arenas, M., & Gutierrez, C. (2006). Semantics and complexity of SPARQL. The Semantic Web-ISWC 2006, p.30–43. Ramalho, R.A.S. (2010). Desenvolvimento e utilização de ontologias em Bibliotecas Digitais: uma proposta de aplicação. Marília, 2010. 145 f. Tese (Doutorado em Ciência da Informação). Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Campus de Marília. Ramalho, R.A.S. (2006). Web Semântica: aspectos interdisciplinares da gestão de recursos informacionais no âmbito da Ciência da Informação. Dissertação (Mestrado em Ciência da Informação). Faculdade de Filosofia e Ciências – Universidade Estadual Paulista, Marília. Salton, G., & Yang, C.S. (1973). On the especification of term values in automatic indexing. Journal of the Americam Society for Information Science, 26(1). Salton, G.,& McGill, J.M. (1983). Introduction to Modern Information Retrieval. New York, McGraw-Hill. Santarem Segundo, J. E. (2010). Representação Iterativa: um modelo para repositórios digitais. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, Marília. Sarawagi, S. (2008). Information Extraction. Foundations and Trends in Databases, 1(3). Schultz, C.K. (Ed.). (1968). H. P. Luhn: Pioneer of information science: Selected works. New York: Spartan Books. Soergel, D. (1999). The rise of ontologies or the reinvention of classification. Journal of the American Society for Information Science. 50(12). Uschold, M. (1998) Knowledge level modelling concepts and terminology. The Knowledge Engineering Review, 13(1), p.5-29. Vickery, B. C. (1997). Ontologies. Journal of Information Science. 23(4).