Please use this identifier to cite or link to this item:
http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368
Title: | Multiple imputation to fill in missing data in soil physico-hydricalproperties database. |
Authors: | OLIVEIRA, L. M. de![]() ![]() LIMA, H. V. de ![]() ![]() RODRIGUES, S. ![]() ![]() CARVALHO, E. J. M. ![]() ![]() TORRES, L. C. ![]() ![]() |
Affiliation: | Luciana Maria de Oliveira, UFRA; Herdjania Veras de Lima, UFRA; Sueli Rodrigues, UFPI; EDUARDO JORGE MAKLOUF CARVALHO, CPATU; Lorena Chagas Torres, UFRA. |
Date Issued: | 2020 |
Citation: | Revista Ciência Agronômica, v. 51, n. 4, e20196817, 2020. |
Description: | Valores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geral |
Thesagro: | Base de Dados Solo |
Keywords: | Propriedades físico-hídricas Preditores de falta Dados incompletos Monte Carlo via Cadeias de Markov |
DOI: | 10.5935/1806-6690.20200079 |
Type of Material: | Artigo de periódico |
Access: | openAccess |
Appears in Collections: | Artigo em periódico indexado (CPATU)![]() ![]() |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Artigo-Luciana-Ufra-6817-34780-2-PB.pdf | 278.68 kB | Adobe PDF | ![]() View/Open |