Por favor, use este identificador para citar o enlazar este ítem: http://www.alice.cnptia.embrapa.br/alice/handle/doc/940425
Título: Identificação da cobertura espacial de documentos usando mineração de textos.
Autor: VARGAS, R. N. P.
MOURA, M. F.
SPERANZA, E. A.
REZENDE, S. O.
Afiliación: ROSA NATHALIE PORTUGAL VARGAS, ICMC/USP; MARIA FERNANDA MOURA, CNPTIA; EDUARDO ANTONIO SPERANZA, CNPTIA; SOLANGE OLIVEIRA REZENDE, ICMC/USP.
Año: 2012
Referencia: In: BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS, 2012, Curitiba. Proceedings... Curitiba: SBC: UFPR, 2012.
Páginas: 12 p.
Descripción: Resumo. Atualmente, é comum que usuários levem em consideração o contexto geográfico dos documentos nos processos de Recuperação de Informação. No entanto, os sistemas convencionais de extração de informação que estão baseados em palavras-chave não consideram que as palavras podem representar entidades geográficas espacialmente relacionadas com outras entidades nos documentos. Para resolver esse problema, é necessário viabilizar o georreferenciamento dos textos, ou seja, identificar as entidades geográficas presentes e associá-las com sua correta localização espacial. A identificação e desambiguação das entidades geográficas apresenta desafios importantes, principalmente do ponto de vista linguístico,Assim, a principal estratégia para superar os problemas de ambiguidade, compreende a identificação de evidências que auxiliem na identificação e desambiguação das localidades nos textos. O presente trabalho propõe uma metodologia que permite identificar e determinar a cobertura espacial dos documentos, denominada SpatialCIM. A metodologia SpatialCIM tem o objetivo de organizar os processos de resolução de topônimos. Para isso, foram propostas e desenvolvidas as abordagens de (1) Desambiguação por Pontos e a (2) Desambiguação Textual e Estrutural. Essas abordagens, exploram duas técnicas diferentes de desambiguação de topônimos, as quais, geram e desambiguam os caminhos geográficos associados aos topônimos reconhecidos para cada documento. A partir dos resultados obtidos, foi possível demostrar que as técnicas de desambiguação melhoram a precisão e revocação na classificação espacial dos documentos. Demonstrou-se também o impacto positivo do uso de uma ferramenta linguística no processo de reconhecimento das entidades geográficas. Assim, foi demostrada a utilidade dos processos de desambiguação para a obtenção da cobertura espacial dos documentos.
NAL Thesaurus: Vegetation cover
Palabras clave: Cobertura espacial
Mineração de texto
Text mining
Tipo de Material: Artigo em anais e proceedings
Acceso: openAccess
Aparece en las colecciones:Artigo em anais de congresso (CNPTIA)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
1049782.pdf2,66 MBAdobe PDFVista previa
Visualizar/Abrir

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace