Please use this identifier to cite or link to this item: http://www.alice.cnptia.embrapa.br/alice/handle/doc/503530
Research center of Embrapa/Collection: Embrapa Acre - Tese/dissertação (ALICE)
Date Issued: 2005
Type of Material: Tese/dissertação (ALICE)
Authors: ASSIS, G. M. L. de
Additional Information: GISELLE MARIANO LESSA DE ASSIS, CPAF-Acre.
Title: Efeito do número de genes na avaliação genética utilizando dados simulados.
Publisher: 2005.
Pages: 102 f.
Language: pt_BR
Notes: Tese (Doutorado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. Orientador: Ricardo Frederico Euclydes.
Keywords: Análise Bayesiana
Description: Foram simulados quatro distintos tipos de populações por meio do programa GENESYS com os objetivos de: verificar a influência do número de genes e do tamanho da população na estimação de componentes de variância e na predição de valores genéticos; verificar a adequabilidade do modelo infinitesimal como pressuposição nas análises genéticas; comparar as metodologias clássica e Bayesiana na análise genética de dados selecionados; e verificar a influência do nível de informação a priori ao utilizar metodologia Bayesiana. Dois processos seletivos foram aplicados por 10 gerações a partir da população-base formada por 120 (população pequena) ou por 2.400 indivíduos com registros (população grande): Seleção ao Acaso e Seleção Fenotípica. Foi considerado que dois diferentes números de genes governavam a característica sob seleção, para cada tamanho de população: 900 ou 10 pares de locos. Para as populações pequenas, foram realizadas 500 repetições de cada processo seletivo e para as populações grandes, 300 repetições. Na análise Bayesiana, três níveis de informação a priori foram considerados: não- informativo, pouco informativo e informativo. Os componentes de variância foram estimados utilizando-se somente a população-base, somente a população da 10a geração após seleção ou todas as populações, desde a população-base até a 10a geração após seleção. Os valores genéticos foram preditos para a população-base e para a 10a geração após seleção, considerando, porém, diferentes conjuntos de dados no processo de predição. A Porcentagem de Erro entre os componentes de variâncias estimados e os reais foi utilizada para comparar as metodologias, assim como as diferentes populações e gerações analisadas. Os valores genéticos, por sua vez, foram comparados por meio do Quadrado Médio do Desvio, da Porcentagem de indivíduos Selecionados em Comum entre os 15% melhores indivíduos e pela Correlação de Ordem entre os valores reais e preditos. Conforme os resultados obtidos, pôde-se concluir que quando a característica é governada por elevado número de genes, os componentes de variância genética aditiva e ambiental são satisfatoriamente estimados em populações selecionadas grandes ou pequenas pelas metodologias usuais, desde que os registros de todos os indivíduos e a matriz completa de parentesco sejam conhecidos. Por outro lado, quando a característica é governada por reduzido número de genes, estimativas menos acuradas do componente de variância genética aditiva são obtidas em populações grandes e, caso as informações de parentescos e registros anteriores sejam desconhecidos, o erro na estimação desse componente aumenta consideravelmente, em populações grandes ou pequenas. Verificou-se também que os valores genéticos são superestimados sob seleção fenotípica quando os registros de todos os indivíduos e a matriz completa de parentesco são incluídos nas análises, independentemente do tamanho da população. A queda na acurácia é ainda mais acentuada quando a característica é governada por reduzido número de genes, sendo a classificação correta dos indivíduos também prejudicada. A inclusão do registro de todos os indivíduos, assim como da matriz de parentesco completa beneficiam a classificação adequada dos indivíduos. Verificou-se também que o modelo infinitesimal não é adequado para ser utilizado como pressuposição nas análises genéticas quando a característica é governada por poucos genes, independentemente do tamanho da população. Ao comparar as metodologias REML e Bayesiana verificou-se que, em geral, essas metodologias produzem resultados bastante semelhantes na estimação dos componentes de variância. Para análises com menor quantidade de dados, no entanto, estimativas mais acuradas são obtidas ao se utilizar priors informativos por meio da análise Bayesiana. Concluiu-se também que a acurácia na predição dos valores genéticos, assim como a classificação dos indivíduos não são alteradas pelo nível de informação a priori das análises Bayesianas, cujos resultados também se assemelham aos da metodologia EBLUP. Four different population types were simulated using GENESYS program with the following objectives: to verify the influence of the number of genes and the population size on variance component estimation and on breeding values prediction; to verify the infinitesimal model as an appropriate assumption on genetic analyses; to compare the classic and Bayesian methodologies on the genetic analysis of selected data; and to verify the influence of a priori information level in Bayesian methodology. Two selective processes were applied for 10 generations starting from base population formed by 120 (small population) or by 2,400 individuals with records (large population): Random Selection and Phenotypic Selection. It was considered that two different numbers of genes governed the trait under selection, for each population size: 900 or 10 pairs of loci. Five hundred repetitions of each selective process for small populations and three hundred repetitions were accomplished for large populations. On Bayesian analysis, three a priori information levels were considered: no-informative, slightly informative and informative. Variance components were estimated using only base population, only population of the 10 th generation after selection or all of populations, from base population up to 10 th selection generation. Breeding values were predicted for base population and for 10 th selection generation, considering, however, different groups of data on the prediction process. Error Percentage between estimated and real variance components was used to compare the methodologies, as well as the different populations and generations analyzed. Genetic values were compared using Average Square Deviation, Percentage of Common Individuals selected among the 15% better individuals and Rank Correlation among predicted and real values. According to the results, it was concluded that when the trait is xgoverned by high number of genes, the genetic additive and environmental variance component are well estimated by usual methodologies in large or small selected populations, since data of all animals and complete relationship matrix are known. On the other hand, when the trait is governed by reduced number of genes, less accurate estimates of additive genetic variance are obtained in large populations and, when relationship information and previous data are unknown, estimate errors of that component increase considerably, in large or small populations. It was also verified that breeding values are overestimated under phenotypic selection when data of all individuals and complete relationship matrix are included on analyses, independently of population size. Accuracy decrease is more accentuated when the trait is governed by reduced number of genes, being the correct classification of individuals also affected. The inclusion of all data, as well as complete relationship matrix benefit the appropriate classification of individuals. It was also verified that the infinitesimal model is not appropriate to be used as assumption in genetic analyses when the trait is governed by few genes, independently of population size. When comparing REML and Bayesian methodologies, it was verified that, in general, these methodologies produce similar results on variance components estimation. However, when analyses are performed with smaller amount of data, informative priors using Bayesian analysis yields more accurate estimates. Finally, accuracy of breeding values prediction, as well as the rank of individuals are not changed by a priori information level on Bayesian analyses, whose results are also similar to the EBLUP methodology.
Thesagro: Genética
Data Created: 2006-04-28
Appears in Collections:Tese/dissertação (CPAF-AC)

Files in This Item:
File Description SizeFormat 
13075.pdf364,1 kBAdobe PDFThumbnail
View/Open

FacebookTwitterDeliciousLinkedInGoogle BookmarksMySpace