Use este identificador para citar ou linkar para este item: http://www.alice.cnptia.embrapa.br/alice/handle/doc/940425
Título: Identificação da cobertura espacial de documentos usando mineração de textos.
Autoria: VARGAS, R. N. P.
MOURA, M. F.
SPERANZA, E. A.
REZENDE, S. O.
Afiliação: ROSA NATHALIE PORTUGAL VARGAS, ICMC/USP; MARIA FERNANDA MOURA, CNPTIA; EDUARDO ANTONIO SPERANZA, CNPTIA; SOLANGE OLIVEIRA REZENDE, ICMC/USP.
Ano de publicação: 2012
Referência: In: BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS, 2012, Curitiba. Proceedings... Curitiba: SBC: UFPR, 2012.
Páginas: 12 p.
Conteúdo: Resumo. Atualmente, é comum que usuários levem em consideração o contexto geográfico dos documentos nos processos de Recuperação de Informação. No entanto, os sistemas convencionais de extração de informação que estão baseados em palavras-chave não consideram que as palavras podem representar entidades geográficas espacialmente relacionadas com outras entidades nos documentos. Para resolver esse problema, é necessário viabilizar o georreferenciamento dos textos, ou seja, identificar as entidades geográficas presentes e associá-las com sua correta localização espacial. A identificação e desambiguação das entidades geográficas apresenta desafios importantes, principalmente do ponto de vista linguístico,Assim, a principal estratégia para superar os problemas de ambiguidade, compreende a identificação de evidências que auxiliem na identificação e desambiguação das localidades nos textos. O presente trabalho propõe uma metodologia que permite identificar e determinar a cobertura espacial dos documentos, denominada SpatialCIM. A metodologia SpatialCIM tem o objetivo de organizar os processos de resolução de topônimos. Para isso, foram propostas e desenvolvidas as abordagens de (1) Desambiguação por Pontos e a (2) Desambiguação Textual e Estrutural. Essas abordagens, exploram duas técnicas diferentes de desambiguação de topônimos, as quais, geram e desambiguam os caminhos geográficos associados aos topônimos reconhecidos para cada documento. A partir dos resultados obtidos, foi possível demostrar que as técnicas de desambiguação melhoram a precisão e revocação na classificação espacial dos documentos. Demonstrou-se também o impacto positivo do uso de uma ferramenta linguística no processo de reconhecimento das entidades geográficas. Assim, foi demostrada a utilidade dos processos de desambiguação para a obtenção da cobertura espacial dos documentos.
NAL Thesaurus: Vegetation cover
Palavras-chave: Cobertura espacial
Mineração de texto
Text mining
Tipo do material: Artigo em anais e proceedings
Acesso: openAccess
Aparece nas coleções:Artigo em anais de congresso (CNPTIA)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
1049782.pdf2,66 MBAdobe PDFThumbnail
Visualizar/Abrir

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace