Por favor, use este identificador para citar o enlazar este ítem:
http://www.alice.cnptia.embrapa.br/alice/handle/doc/1083387
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | BARROS, F. M. M. | |
dc.contributor.author | OLIVEIRA, S. R. de M. | |
dc.date.accessioned | 2017-12-23T23:30:10Z | - |
dc.date.available | 2017-12-23T23:30:10Z | - |
dc.date.created | 2017-12-22 | |
dc.date.issued | 2017 | |
dc.identifier.citation | In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 11., 2017, Campinas. Ciência de dados na era da agricultura digital: anais. Campinas: Editora da Unicamp: Embrapa Informática Agropecuária, 2017. | |
dc.identifier.isbn | 978-85-85783-75-4 | |
dc.identifier.uri | http://www.alice.cnptia.embrapa.br/alice/handle/doc/1083387 | - |
dc.description | Neste trabalho, buscou-se construir e comparar modelos capazes de diferenciar textos sobre a cultura da cana-de-açúcar de outros textos relacionados a outras culturas ou criações. Para criar modelos de classificação de textos, os dados são transformados em matrizes termos-documentos, de forma que os dados apresentam alta dimensionalidade. Para construir melhores modelos de classificação de textos agrícolas foram testados: a) métodos de redução de dimensionalidade utilizando LDA (Latent Dirichlet Allocation) e PCA (Principal Component Analysis); b) número de tópicos/componentes principais; c) unigrama/bigrama; e d) algoritmos Random Forest, Gradiente Boosting e SVM (Support Vector Machine), de forma a determinar os fatores que mais impactam o AUC (Area Under the Curve). Os resultados demonstraram que os fatores estatisticamente significativos são o tipo de pré-processamento, com vantagem para LDA, e o tipo de algoritmo utilizado, com destaque para o SVM. O número de tópicos e de componentes principais e o uso de unigrama e bigrama não tiveram efeito estatisticamente significativo na performance dos modelos em termos de AUC. | |
dc.language.iso | por | pt_BR |
dc.rights | openAccess | pt_BR |
dc.subject | Mineração de textos | |
dc.subject | Aprendizado de máquina | |
dc.subject | Redução de dimensionalidade | |
dc.subject | Sistema de informação agrícola | |
dc.subject | Text mining | |
dc.subject | Dimensionality reduction | |
dc.subject | Agricultural information systems | |
dc.subject | Machine Learning | pt_BR |
dc.title | Avaliação de métodos de detecção de tópicos em pré-processamento para classificação de textos agrícolas. | |
dc.type | Artigo em anais e proceedings | |
dc.date.updated | 2020-01-21T11:11:11Z | pt_BR |
dc.subject.thesagro | Agricultura | |
dc.subject.nalthesaurus | Agriculture | |
dc.description.notes | SBIAgro 2017. | |
dc.format.extent2 | p. 615-624. | |
riaa.ainfo.id | 1083387 | |
riaa.ainfo.lastupdate | 2020-01-21 -02:00:00 | |
dc.contributor.institution | FLAVIO M. M. BARROS, Feagri/Unicamp; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA. | |
Aparece en las colecciones: | Artigo em anais de congresso (CNPTIA)![]() ![]() |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Avaliacaosbiagro2017.pdf | 890.3 kB | Adobe PDF | ![]() Visualizar/Abrir |