Por favor, use este identificador para citar o enlazar este ítem: http://www.alice.cnptia.embrapa.br/alice/handle/doc/1130368
Título: Multiple imputation to fill in missing data in soil physico-hydricalproperties database.
Autor: OLIVEIRA, L. M. de
LIMA, H. V. de
RODRIGUES, S.
CARVALHO, E. J. M.
TORRES, L. C.
Afiliación: Luciana Maria de Oliveira, UFRA; Herdjania Veras de Lima, UFRA; Sueli Rodrigues, UFPI; EDUARDO JORGE MAKLOUF CARVALHO, CPATU; Lorena Chagas Torres, UFRA.
Año: 2020
Referencia: Revista Ciência Agronômica, v. 51, n. 4, e20196817, 2020.
Descripción: Valores faltantes em banco de dados é um problema comum e quase inevitável. A imputação múltipla (IM) é ummétodo estatístico eficiente para estimar valores ausentes em um conjunto de dados incompleto. Para testar essa abordagemem um banco de dados de solo, hipotetizamos que a imputação de dados ausentes fornece um banco de dados estatisticamentemais preciso do que a análise de casos completos (ACC). O objetivo geral do estudo foi avaliar a eficiência da IM usando oalgoritmo MICE (Imputação Multivariada por Equações Encadeadas) para preencher dados ausentes em um banco de dadosde propriedades físico-hídricas do solo e mostrar que é mais viável realizar a imputação do que a ACC. Análise preliminar dobanco de dados foi realizada para verificar a adequação do algoritmo proposto. A imputação dos dados faltantes de cada variávelfoi ajustada usando modelos de regressão linear. Variáveis com dados faltantes entram no modelo como variável dependente eas outras como covariáveis. As análises foram realizadas comparando os valores das estimativas, seus erros padrão e intervalosde confiança de 95%. O padrão de faltas foi do tipo multivariado arbitrário e, a matéria orgânica foi a variável com a maiorquantidade de dados faltantes. A significância das covariáveis variou de acordo com a variável a ser estimada. Os resultadosmostraram que o MICE apresentou melhor desempenho que a ACC, pois, embora a comparação estatística dos dois métodostenha sido semelhante, a imputação múltipla mantém o tamanho do banco de dados e preserva a distribuição geral
Thesagro: Base de Dados
Solo
Palabras clave: Propriedades físico-hídricas
Preditores de falta
Dados incompletos
Monte Carlo via Cadeias de Markov
DOI: 10.5935/1806-6690.20200079
Tipo de Material: Artigo de periódico
Acceso: openAccess
Aparece en las colecciones:Artigo em periódico indexado (CPATU)

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
Artigo-Luciana-Ufra-6817-34780-2-PB.pdf278,68 kBAdobe PDFVista previa
Visualizar/Abrir

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace