Please use this identifier to cite or link to this item: http://www.alice.cnptia.embrapa.br/alice/handle/doc/940425
Title: Identificação da cobertura espacial de documentos usando mineração de textos.
Authors: VARGAS, R. N. P.
MOURA, M. F.
SPERANZA, E. A.
REZENDE, S. O.
Affiliation: ROSA NATHALIE PORTUGAL VARGAS, ICMC/USP; MARIA FERNANDA MOURA, CNPTIA; EDUARDO ANTONIO SPERANZA, CNPTIA; SOLANGE OLIVEIRA REZENDE, ICMC/USP.
Date Issued: 2012
Citation: In: BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS, 2012, Curitiba. Proceedings... Curitiba: SBC: UFPR, 2012.
Pages: 12 p.
Description: Resumo. Atualmente, é comum que usuários levem em consideração o contexto geográfico dos documentos nos processos de Recuperação de Informação. No entanto, os sistemas convencionais de extração de informação que estão baseados em palavras-chave não consideram que as palavras podem representar entidades geográficas espacialmente relacionadas com outras entidades nos documentos. Para resolver esse problema, é necessário viabilizar o georreferenciamento dos textos, ou seja, identificar as entidades geográficas presentes e associá-las com sua correta localização espacial. A identificação e desambiguação das entidades geográficas apresenta desafios importantes, principalmente do ponto de vista linguístico,Assim, a principal estratégia para superar os problemas de ambiguidade, compreende a identificação de evidências que auxiliem na identificação e desambiguação das localidades nos textos. O presente trabalho propõe uma metodologia que permite identificar e determinar a cobertura espacial dos documentos, denominada SpatialCIM. A metodologia SpatialCIM tem o objetivo de organizar os processos de resolução de topônimos. Para isso, foram propostas e desenvolvidas as abordagens de (1) Desambiguação por Pontos e a (2) Desambiguação Textual e Estrutural. Essas abordagens, exploram duas técnicas diferentes de desambiguação de topônimos, as quais, geram e desambiguam os caminhos geográficos associados aos topônimos reconhecidos para cada documento. A partir dos resultados obtidos, foi possível demostrar que as técnicas de desambiguação melhoram a precisão e revocação na classificação espacial dos documentos. Demonstrou-se também o impacto positivo do uso de uma ferramenta linguística no processo de reconhecimento das entidades geográficas. Assim, foi demostrada a utilidade dos processos de desambiguação para a obtenção da cobertura espacial dos documentos.
NAL Thesaurus: Vegetation cover
Keywords: Cobertura espacial
Mineração de texto
Text mining
Type of Material: Artigo em anais e proceedings
Access: openAccess
Appears in Collections:Artigo em anais de congresso (CNPTIA)

Files in This Item:
File Description SizeFormat 
1049782.pdf2.66 MBAdobe PDFThumbnail
View/Open

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace