Por favor, use este identificador para citar o enlazar este ítem: http://www.alice.cnptia.embrapa.br/alice/handle/doc/1083387
Registro completo de metadatos
Campo DCValorLengua/Idioma
dc.contributor.authorBARROS, F. M. M.
dc.contributor.authorOLIVEIRA, S. R. de M.
dc.date.accessioned2017-12-23T23:30:10Z-
dc.date.available2017-12-23T23:30:10Z-
dc.date.created2017-12-22
dc.date.issued2017
dc.identifier.citationIn: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 11., 2017, Campinas. Ciência de dados na era da agricultura digital: anais. Campinas: Editora da Unicamp: Embrapa Informática Agropecuária, 2017.
dc.identifier.isbn978-85-85783-75-4
dc.identifier.urihttp://www.alice.cnptia.embrapa.br/alice/handle/doc/1083387-
dc.descriptionNeste trabalho, buscou-se construir e comparar modelos capazes de diferenciar textos sobre a cultura da cana-de-açúcar de outros textos relacionados a outras culturas ou criações. Para criar modelos de classificação de textos, os dados são transformados em matrizes termos-documentos, de forma que os dados apresentam alta dimensionalidade. Para construir melhores modelos de classificação de textos agrícolas foram testados: a) métodos de redução de dimensionalidade utilizando LDA (Latent Dirichlet Allocation) e PCA (Principal Component Analysis); b) número de tópicos/componentes principais; c) unigrama/bigrama; e d) algoritmos Random Forest, Gradiente Boosting e SVM (Support Vector Machine), de forma a determinar os fatores que mais impactam o AUC (Area Under the Curve). Os resultados demonstraram que os fatores estatisticamente significativos são o tipo de pré-processamento, com vantagem para LDA, e o tipo de algoritmo utilizado, com destaque para o SVM. O número de tópicos e de componentes principais e o uso de unigrama e bigrama não tiveram efeito estatisticamente significativo na performance dos modelos em termos de AUC.
dc.language.isoporpt_BR
dc.rightsopenAccesspt_BR
dc.subjectMineração de textos
dc.subjectAprendizado de máquina
dc.subjectRedução de dimensionalidade
dc.subjectSistema de informação agrícola
dc.subjectText mining
dc.subjectDimensionality reduction
dc.subjectAgricultural information systems
dc.subjectMachine Learningpt_BR
dc.titleAvaliação de métodos de detecção de tópicos em pré-processamento para classificação de textos agrícolas.
dc.typeArtigo em anais e proceedings
dc.date.updated2020-01-21T11:11:11Zpt_BR
dc.subject.thesagroAgricultura
dc.subject.nalthesaurusAgriculture
dc.description.notesSBIAgro 2017.
dc.format.extent2p. 615-624.
riaa.ainfo.id1083387
riaa.ainfo.lastupdate2020-01-21 -02:00:00
dc.contributor.institutionFLAVIO M. M. BARROS, Feagri/Unicamp; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA.
Aparece en las colecciones:Artigo em anais de congresso (CNPTIA)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
Avaliacaosbiagro2017.pdf890.3 kBAdobe PDFVista previa
Visualizar/Abrir

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace