Please use this identifier to cite or link to this item:
http://www.alice.cnptia.embrapa.br/alice/handle/doc/940425
Title: | Identificação da cobertura espacial de documentos usando mineração de textos. |
Authors: | VARGAS, R. N. P.![]() ![]() MOURA, M. F. ![]() ![]() SPERANZA, E. A. ![]() ![]() REZENDE, S. O. ![]() ![]() |
Affiliation: | ROSA NATHALIE PORTUGAL VARGAS, ICMC/USP; MARIA FERNANDA MOURA, CNPTIA; EDUARDO ANTONIO SPERANZA, CNPTIA; SOLANGE OLIVEIRA REZENDE, ICMC/USP. |
Date Issued: | 2012 |
Citation: | In: BRAZILIAN CONFERENCE ON INTELLIGENT SYSTEMS, 2012, Curitiba. Proceedings... Curitiba: SBC: UFPR, 2012. |
Pages: | 12 p. |
Description: | Resumo. Atualmente, é comum que usuários levem em consideração o contexto geográfico dos documentos nos processos de Recuperação de Informação. No entanto, os sistemas convencionais de extração de informação que estão baseados em palavras-chave não consideram que as palavras podem representar entidades geográficas espacialmente relacionadas com outras entidades nos documentos. Para resolver esse problema, é necessário viabilizar o georreferenciamento dos textos, ou seja, identificar as entidades geográficas presentes e associá-las com sua correta localização espacial. A identificação e desambiguação das entidades geográficas apresenta desafios importantes, principalmente do ponto de vista linguístico,Assim, a principal estratégia para superar os problemas de ambiguidade, compreende a identificação de evidências que auxiliem na identificação e desambiguação das localidades nos textos. O presente trabalho propõe uma metodologia que permite identificar e determinar a cobertura espacial dos documentos, denominada SpatialCIM. A metodologia SpatialCIM tem o objetivo de organizar os processos de resolução de topônimos. Para isso, foram propostas e desenvolvidas as abordagens de (1) Desambiguação por Pontos e a (2) Desambiguação Textual e Estrutural. Essas abordagens, exploram duas técnicas diferentes de desambiguação de topônimos, as quais, geram e desambiguam os caminhos geográficos associados aos topônimos reconhecidos para cada documento. A partir dos resultados obtidos, foi possível demostrar que as técnicas de desambiguação melhoram a precisão e revocação na classificação espacial dos documentos. Demonstrou-se também o impacto positivo do uso de uma ferramenta linguística no processo de reconhecimento das entidades geográficas. Assim, foi demostrada a utilidade dos processos de desambiguação para a obtenção da cobertura espacial dos documentos. |
NAL Thesaurus: | Vegetation cover |
Keywords: | Cobertura espacial Mineração de texto Text mining |
Type of Material: | Artigo em anais e proceedings |
Access: | openAccess |
Appears in Collections: | Artigo em anais de congresso (CNPTIA)![]() ![]() |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
1049782.pdf | 2.66 MB | Adobe PDF | ![]() View/Open |