Use este identificador para citar ou linkar para este item: http://www.alice.cnptia.embrapa.br/alice/handle/doc/1155913
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.authorVAZ, G. J.
dc.contributor.authorVEIGA, P. H. R. da C. da
dc.contributor.authorCALDAS, R. G.
dc.contributor.authorVIDAL, W. C. L.
dc.contributor.authorASSIS, C. P. de
dc.contributor.authorCORREA, J. L.
dc.contributor.authorMOURA, M. F.
dc.date.accessioned2023-08-15T15:23:43Z-
dc.date.available2023-08-15T15:23:43Z-
dc.date.created2023-08-15
dc.date.issued2023
dc.identifier.citationRevista Ibero-americana de Ciência da Informação, v. 16, n. 2, p. 311-328, maio/ago. 2023.
dc.identifier.issn1983-5213
dc.identifier.urihttp://www.alice.cnptia.embrapa.br/alice/handle/doc/1155913-
dc.descriptionEste trabalho apresenta uma metodologia de tratamento dos textos extraídos dos livros digitais da Coleção 500 Perguntas 500 Respostas da Embrapa a fim de que seu conteúdo possa ser indexado e acessado via um mecanismo de busca específico. A metodologia envolve a extração dos elementos essenciais dos livros, como imagens e arquivos HTML, o pré-processamento desses elementos, sua análise e edição, e a construção de componentes adequados para sua indexação. Além de um intenso trabalho de análise humana, são consideradas tecnologias como o formato Epub para livros digitais, o editor Sigil, scriptspara processamento de texto, padrões web de representação e Elasticsearch. Experimentos mostram que a metodologia viabiliza a disponibilização de textos bem formatados para sua indexação e seu uso em mecanismos de busca, propiciando uma rica experiência ao usuário, além de possibilitar a construção de novas soluções digitais. Nesse contexto, a curadoria digital é fundamental para agregar valor aos recursos digitais e atender às necessidades específicas de seus usuários.
dc.language.isopor
dc.rightsopenAccess
dc.subjectCuradoria digital
dc.subjectRecuperação da informação
dc.subjectProcessamento de texto
dc.subjectDisseminação da informação
dc.subjectIndexação
dc.subjectLivros digitais
dc.subjectDigital curation
dc.subjectText processing
dc.subjectIndexing
dc.subjectDigital books
dc.titleTratamento de texto extraído de livros digitais para a indexação em mecanismo de busca.
dc.typeArtigo de periódico
dc.subject.nalthesaurusInformation retrieval
dc.subject.nalthesaurusInformation dissemination
riaa.ainfo.id1155913
riaa.ainfo.lastupdate2023-08-15
dc.identifier.doihttps://doi.org/10.26512/rici.v16.n2.2023.42740
dc.contributor.institutionGLAUBER JOSE VAZ, CNPTIA; PEDRO HENRIQUE RODRIGUES DA CUNHA DA VEIGA, IZAGRO; RAFAEL GOMES CALDAS, IZAGRO; WYVIANE CARLOS LIMA VIDAL, CNPAE; CRISTIANE PEREIRA DE ASSIS, SUCOM; JORGE LUIZ CORREA, CNPTIA; MARIA FERNANDA MOURA, CNPTIA.
Aparece nas coleções:Artigo em periódico indexado (CNPTIA)

Arquivos associados a este item:
Arquivo TamanhoFormato 
AP-Tratamento-texto-2023.pdf812,63 kBAdobe PDFVisualizar/Abrir

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace