Please use this identifier to cite or link to this item:
http://www.alice.cnptia.embrapa.br/alice/handle/doc/1083387| Title: | Avaliação de métodos de detecção de tópicos em pré-processamento para classificação de textos agrícolas. |
| Authors: | BARROS, F. M. M.![]() ![]() OLIVEIRA, S. R. de M. ![]() ![]() |
| Affiliation: | FLAVIO M. M. BARROS, Feagri/Unicamp; STANLEY ROBSON DE MEDEIROS OLIVEIRA, CNPTIA. |
| Date Issued: | 2017 |
| Citation: | In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 11., 2017, Campinas. Ciência de dados na era da agricultura digital: anais. Campinas: Editora da Unicamp: Embrapa Informática Agropecuária, 2017. |
| Pages: | p. 615-624. |
| Description: | Neste trabalho, buscou-se construir e comparar modelos capazes de diferenciar textos sobre a cultura da cana-de-açúcar de outros textos relacionados a outras culturas ou criações. Para criar modelos de classificação de textos, os dados são transformados em matrizes termos-documentos, de forma que os dados apresentam alta dimensionalidade. Para construir melhores modelos de classificação de textos agrícolas foram testados: a) métodos de redução de dimensionalidade utilizando LDA (Latent Dirichlet Allocation) e PCA (Principal Component Analysis); b) número de tópicos/componentes principais; c) unigrama/bigrama; e d) algoritmos Random Forest, Gradiente Boosting e SVM (Support Vector Machine), de forma a determinar os fatores que mais impactam o AUC (Area Under the Curve). Os resultados demonstraram que os fatores estatisticamente significativos são o tipo de pré-processamento, com vantagem para LDA, e o tipo de algoritmo utilizado, com destaque para o SVM. O número de tópicos e de componentes principais e o uso de unigrama e bigrama não tiveram efeito estatisticamente significativo na performance dos modelos em termos de AUC. |
| Thesagro: | Agricultura |
| NAL Thesaurus: | Agriculture |
| Keywords: | Mineração de textos Aprendizado de máquina Redução de dimensionalidade Sistema de informação agrícola Text mining Dimensionality reduction Agricultural information systems Machine Learning |
| ISBN: | 978-85-85783-75-4 |
| Notes: | SBIAgro 2017. |
| Type of Material: | Artigo em anais e proceedings |
| Access: | openAccess |
| Appears in Collections: | Artigo em anais de congresso (CNPTIA)![]() ![]() |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Avaliacaosbiagro2017.pdf | 890.3 kB | Adobe PDF | ![]() View/Open |








