Please use this identifier to cite or link to this item: http://www.alice.cnptia.embrapa.br/alice/handle/doc/504313
Research center of Embrapa/Collection: Embrapa Acre - Tese/dissertação (ALICE)
Date Issued: 2005
Type of Material: Tese/dissertação (ALICE)
Authors: CARNEIRO JUNIOR, J. M.
Additional Information: JOSE MARQUES CARNEIRO JUNIOR, CPAF-Acre.
Title: Avaliação da heterogeneidade de variâncias utilizando dados simulados.
Publisher: 2005.
Pages: 88 f.
Language: pt_BR
Notes: Tese (Doutorado em Genética e melhoramento) - Universidade Federal de Viçosa, Viçosa. Orientador: Ricardo Frederico Euclydes.
Description: Estudos de simulação foram conduzidos com o objetivo de realizar uma análise comparativa, via simulação de dados, entre a metodologia clássica de estimação dos componentes de variância e predição dos valores genéticos REML ? BLUP e a metodologia Bayesiana que permite a inclusão de informação a priori e a utilização de distribuições robustas, como a normal contaminada, na avaliação genética dos animais. Foi simulado um genoma de 3000 centimorgans de comprimento, considerando uma única característica quantitativa, governada por 800 locos com dois alelos por loco, na qual a herdabilidade variou conforme a estrutura desejada de heterogeneidade de variâncias. Segundo a estrutura genômica proposta, foram simulados 1500 machos e 1500 fêmeas que formaram a população base. A partir da população-base foram formadas duas populações iniciais, uma grande e outra pequena. Com o propósito de avaliar o efeito dos diferentes tipos de heterogeneidade de variâncias, em populações com dois tamanhos, bem como comparar o método REML ? BLUP com o método Bayesiano, foram inseridos diferentes tipos de estruturas de heterogeneidade nas populações iniciais. Para obtenção destas estruturas de heterogeneidade foram feitos descartes estratégicos dos valores genéticos, ambientais, ou de ambos, de acordo com o tipo de heterogeneidade e o nível de variabilidade desejada: alta, média ou baixa. Para a metodologia Bayesiana foram utilizados três níveis de informação a priori: não informativo, pouco informativo e informativo. Para a estrutura com heterogeneidade ambiental foi empregado também o método Bayesiano, considerando distribuição normal contaminada para os resíduos. De forma geral foi verificado que a presença da heterogeneidade causa problemas para seleção dos melhores indivíduos, principalmente se a heterogeneidade estiver presente no componente ambiental. Os métodos comparados apresentaram resultados semelhantes quando priors não informativos foram utilizados, sendo que as populações de tamanho grande, de modo geral, apresentaram melhores estimativas. Para as populações pequenas as análises realizadas dentro dos subníveis apresentaram maiores problemas, devido ao pequeno tamanho das subpopulações formadas. Foi observado, para a metodologia Bayesiana, que o aumento no nível de informação a priori influenciou positivamente as estimativas dos componentes de variância, principalmente para as populações pequenas. A utilização da distribuição normal contaminada para os resíduos, não foi eficiente em eliminar os problemas causados pela presença da heterogeneidade de variâncias, sendo que para predição dos valores genéticos os resultados foram similares. Apesar do aumento de informação ter conduzido a estimativas mais acuradas de componentes de variância, a correlação de Spearman entre os valores genéticos reais e preditos não foi alterada quando níveis mais informativos foram utilizados. Contudo, foi verificado pelo Quadrado Médio do Erro que a predição dos valores genéticos foi sensivelmente mais acurada, quando o maior nível de informação foi utilizado. Conclui-se, portanto, que melhores predições dos valores genéticos, para populações pequenas, podem ser obtidas pela metodologia Bayesiana quando informações adicionais estão disponíveis. Studies on simulation were carried out aiming to achieve a comparative analysis, through data simulation, between the classic methodology REML - BLUP of the variance components estimation and genetic values prediction and the Bayesian methodology, that allows the inclusion of a priori information and the use of robust distributions, as the contaminated normal distribution, in the animal genetic evaluation. A genome of 3,000 length centimorgans was simulated, considering a single quantitative trait, governed by 800 loci with two alleles by locus, in which heritability varied accordingly with the heterogeneity variance structures desired. According to the genomic structure proposed, there were simulated 1,500 males and 1,500 females that formed the base population. Starting from the base population, two initial populations were formed: a large and a small one. With the purpose of evaluating different type of heterogeneity variance effects, in populations with two sizes, as well as to compare the method REML - BLUP with the Bayesian method, different types of heterogeneity structures were inserted in the initial populations. For obtaining these heterogeneity structures there were made strategic discards of genetic values, environmental, or both, in agreement with the heterogeneity type and the level of desired variability: high, medium or small. For Bayesian methodology, three a priori information levels were used: no informative, slightly informative and informative. For structure with environmental heterogeneity, it was also used the Bayesian method considering contaminated normal distribution for the residuals. In a general way, it was verified that the presence of the heterogeneity causes problems for the best individuals' selection, mainly if the heterogeneity occurs in the environmental component. The compared xmethods presented similar results when no informative priors were used, and large size populations presented, in general, better estimates. For small populations, the analyses accomplished inside of the subclass presented larger problems, due to small size of the formed subclass. It was observed, for the Bayesian methodology, that the increase the a priori information level influenced the estimates of variance components positively, mainly for the small populations. Using contaminated normal distribution for the residues, was not efficient in eliminating the problems caused by variances heterogeneity, and for genetic values prediction the results were similar. In spite of the increase of information to have led to accurate estimates of the variance components, the Spearman Correlation among the true genetic values and predicted was not altered when more informative levels were used. However, it was verified by the Mean Square Error that prediction genetic values was sensibly more accurate, when more information level was used. It is ended, therefore, that better predictions of the genetic values, for small populations, they can be obtained by the Bayesian methodology when additional information are available.
Thesagro: Genética Animal
Marcador Genético
Melhoramento Genético Animal
Data Created: 2006-05-23
Appears in Collections:Tese/dissertação (CPAF-AC)

Files in This Item:
File Description SizeFormat 
13200.pdf294,23 kBAdobe PDFThumbnail
View/Open

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace