Use este identificador para citar ou linkar para este item: http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368
Título: Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
Autoria: OLIVEIRA, L. M. de
LIMA, H. V. de
RODRIGUES, S.
CARVALHO, E. J. M.
TORRES, L. C.
Afiliação: Luciana Maria de Oliveira, UFRA; Herdjania Veras de Lima, UFRA; Sueli Rodrigues, UFPI; EDUARDO JORGE MAKLOUF CARVALHO, CPATU; Lorena Chagas Torres, UFRA.
Ano de publicação: 2020
Referência: Revista Ciência Agronômica, v. 51, n. 4, e20196817, 2020.
Conteúdo: Valores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geral
Thesagro: Base de Dados
Solo
Palavras-chave: Propriedades físico-hídricas
Preditores de falta
Dados incompletos
Monte Carlo via Cadeias de Markov
Digital Object Identifier: 10.5935/1806-6690.20200079
Tipo do material: Artigo de periódico
Acesso: openAccess
Aparece nas coleções:Artigo em periódico indexado (CPATU)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Artigo-Luciana-Ufra-6817-34780-2-PB.pdf278,68 kBAdobe PDFThumbnail
Visualizar/Abrir

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace