Please use this identifier to cite or link to this item: http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368
Title: Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
Authors: OLIVEIRA, L. M. de
LIMA, H. V. de
RODRIGUES, S.
CARVALHO, E. J. M.
TORRES, L. C.
Affiliation: Luciana Maria de Oliveira, UFRA; Herdjania Veras de Lima, UFRA; Sueli Rodrigues, UFPI; EDUARDO JORGE MAKLOUF CARVALHO, CPATU; Lorena Chagas Torres, UFRA.
Date Issued: 2020
Citation: Revista Ciência Agronômica, v. 51, n. 4, e20196817, 2020.
Description: Valores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geral
Thesagro: Base de Dados
Solo
Keywords: Propriedades físico-hídricas
Preditores de falta
Dados incompletos
Monte Carlo via Cadeias de Markov
DOI: 10.5935/1806-6690.20200079
Type of Material: Artigo de periódico
Access: openAccess
Appears in Collections:Artigo em periódico indexado (CPATU)

Files in This Item:
File Description SizeFormat 
Artigo-Luciana-Ufra-6817-34780-2-PB.pdf278,68 kBAdobe PDFThumbnail
View/Open

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace