Use este identificador para citar ou linkar para este item:
http://www.alice.cnptia.embrapa.br/alice/handle/doc/5253
Título: | Easily labelling hierarchical document clusters. |
Autoria: | MOURA, M. F.![]() ![]() MACACINI, R. M. ![]() ![]() REZENDE, S. O. ![]() ![]() |
Afiliação: | MARIA FERNANDA MOURA, CNPTIA; RICARDO MARCONDES MARCACINI, USP; SOLANGE OLIVEIRA REZENDE, USP. |
Ano de publicação: | 2008 |
Referência: | In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 23.; SIMPÓSIO BRASILEIRO DE ENGENHARIA DE SOFTWARE, 22.; WORKSHOP EM ALGORITMOS E APLICAÇÕES DE MINERAÇÃO DE DADOS, 4., 2008, Campinas. Anais... Campinas: UNICAMP, Instituto de Computação, 2008. |
Páginas: | p. 37-45. |
Conteúdo: | One of the problems of automatic models that generate topic taxonomies is the process of creating the most significant term list that discriminates each document group. In this paper, a new method to label document hierarchical clusters is proposed, which is completely independent from the clustering method. This method automatically decides the number of the words in each label list, avoids word repetitions in a tree branch and provides a kind of cutting for the cluster tree. The obtained results were tested as search queries in a retrieval process and showed a very good performance. Additionally, the use of the method was experimented by some specialists in the text collection domain, trying to evaluate their understanding and expectations over the results. |
Thesagro: | Taxonomia |
NAL Thesaurus: | Cluster analysis Taxonomy |
Palavras-chave: | Dados semânticos |
Tipo do material: | Artigo em anais e proceedings |
Acesso: | openAccess |
Aparece nas coleções: | Artigo em anais de congresso (CNPTIA)![]() ![]() |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
easily.pdf | 943.36 kB | Adobe PDF | ![]() Visualizar/Abrir |