首页 / 一种基于多性状的基因组选择进行林木多性状聚合育种的方法

一种基于多性状的基因组选择进行林木多性状聚合育种的方法有效专利 发明

技术领域

[0001] 本发明属于林木遗传育种技术领域,具体地涉及一种基于多性状的基因组选择进行林木多性状聚合育种的方法。

相关背景技术

[0002] 传统的林木遗传改良需要通过田间对比试验和性状测定,估算各种遗传参数和评价种源、家系、单株或无性系的表现,来培育符合林业生产需求的林木良种。然而林木的生产性状大多属于微效多基因控制,而且林木开花、授粉及子代测定,往往周期比较长,一般在数十年,因而,要进行林木多性状的聚合育种,周期更长,尤其是当性状比较多且性状相关比较复杂时。漫长的世代时间以及大多数复杂性状晚期表达的特性历来都是林木育种所面临的巨大困难和挑战。因此,有必要研发探索一种高效地林木多性状聚合育种的方法。
[0003] 基因组选择(Genomic Selection,GS)技术是一种基于动植物育种群体,利用芯片技术采集群体个体高密度基因组SNP的基因分型数据,然后构建个体间的基因组关系矩阵,通过GBLUP法获取个体全基因组育种值的新型分子育种技术。它与传统育种技术相比,优点在于可以突破遗传材料生长时间限制,在幼期即可估计个体的基因组育种值,并据此进行早期预测与选择,从而显著缩短育种周期。目前,基因组选择已广泛应用于各国畜禽分子育种中,尤其在奶牛、猪和鸡育种方面。但是目前,还未见有基于多性状的基因组选择进行林木多性状聚合育种的报道。

具体实施方式

[0043] 下面结合说明书附图和具体实施例对本发明作出进一步地详细阐述,所述实施例只用于解释本发明,并非用于限定本发明的范围。下述实施例中所使用的试验方法如无特殊说明,均为常规方法;所使用的材料、试剂等,如无特殊说明,为可从商业途径得到的试剂和材料。
[0044] 本发明的方法可以适用于任何已有的试验设计,利用SNP标记信息构建的基因组关系矩阵G开展林木基因组选择分析,可针对生长、材性、抗性等性状,进行林木多性状聚合育种,尤其适用于杂交子代测定林或无性系试验林的亲本的反向选择。可以满足任意生长阶段的林木多性状聚合育种。
[0045] 下面对本发明的方法做进一步的描述。
[0046] 实施例1
[0047] 本发明的林木多性状聚合育种方法,包括无性系个体表型数据采集、无性系谱系信息及A矩阵构建、SNP标记分型数据及G矩阵构建、多性状模型建立和数据分析步骤;具体如下:
[0048] 1.无性系个体表型数据采集
[0049] (1)试验材料为:桉树无性系试验林,参试无性系共165个,每个无性系大约40株。
[0050] 抽样30个桉树无性系,每个无性系5株,分别测定树高(h)、胸径(dbh)、材积(v)、心材比例(cpro)、木材密度(wd)、木材吸水率(wpro)、管胞长度(tl)和管胞宽度(tw)及管胞长宽比(lrt),然后进行性状聚类分析,按正负相关归类,得到性状的两大归类信息;
[0051] (2)根据性状的归类信息,每类选取容易测定的一个代表性状,对所有参试的无性系进行相应表型测定,得到多性状的表型数据。
[0052] 2.无性系谱系信息及A矩阵构建
[0053] 收集无性系号及其亲本号,采用R程序包kinship2生成谱系,并构建加性相关矩阵A。利用ASReml-R直接构建A的逆矩阵。
[0054] 3.SNP分型数据及G矩阵构建
[0055] SNP分型数据是采用高通量SNP芯片对无性系多态性的基因分型数据集,用于计算无性系间的基因组相关矩阵。
[0056] 具体构建方法:须提取所有无性系的DNA,采用SNP芯片EucHIP60K.BR(含60728个SNP标记)进行基因型测定。读取SNP芯片数据文件,用Beagle程序进行缺失基因型填补,然后选取SNP最小等位基因频率(MAF)0.01作为质量控制标准,剔除最小等位基因频率(MAF)低于0.01和染色体位置未知的SNP,最终41160个SNP用于分析。G矩阵及其逆矩阵,参照文献Isik等人(2016)的方法(Isik F,Bartholomé J,Farjat A,Chancerel E,Raffin A,Sanchez L,Plomion C,Bouffier L.Genomic selection in maritime pine.Plant Science,2016,242:108–119)。
[0057] 4.多性状模型建立
[0058] 为了实现本发明目的,本发明的方案设置了2种分析模型进行了比较,模型方案如下:
[0059] 模型1,BLUP模型,包含了表型值y,总体均值μ(固定效应),无性系Clone(随机效应)和残差e,其中无性系随机效应的矩阵为加性相关矩阵A。
[0060] 模型2,GBLUP模型,包含了表型值y,总体均值μ(固定效应),无性系Clone(随机效应)和残差e,其中无性系随机效应的矩阵为基因组关系矩阵G。
[0061] 5.数据分析
[0062] (1)由图1可知,抽样测定的9个性状,可分为2类:h、dbh、v和wpro聚为一类,其它5个聚为一类。
[0063] 第一类性状主要为生长性状,选择胸径dbh;第二类性状为材性性状,选择木材密度wd,作为后续所有无性系的表型测定性状。
[0064] (2)图2中,颜色越偏红色,表示个体间的亲缘关系越弱,颜色越偏黄色,表示个体间的亲缘关系越强。因此,基于谱系信息的无性系间加性相关矩阵结果显示,大部分无性系及其亲本之间的亲缘关系比较弱。
[0065] (3)图3的颜色图与图2一样,但基于SNP分型信息的无性系间基因组关系矩阵图,明显与谱系信息的加性相关矩阵图不同,前者明显可以看出无性系及其亲本间存在比较强的亲缘关系,表明基因组关系矩阵比加性相关矩阵更能捕获个体间的遗传关系。
[0066] (4)基于上述两种模型,利用ASReml-R软件分别估算分差组分,具体结果见表1。
[0067] 对于模型1(BLUP模型),性状1的无性系遗传方差Vc为86.83,残差Ve为181.85,性状2的无性系遗传方差Vc为397.34,残差Ve为811.15。
[0068] 对于模型2(GBLUP模型),性状1的无性系遗传方差Vc为98.32,残差Ve为181.86,性状2的无性系遗传方差Vc为466.63,残差Ve为811.66。
[0069] 与模型1比较,两个性状,模型2的残差基本没有变化,但无性系遗传方差都增加了,可见模型2比模型1拟合的结果更好,即基因组选择技术采用的基因组关系矩阵更能捕获个体间的遗传关系。
[0070] 表1 模型遗传参数估计值
[0071]
[0072] 注:Vc为无性系遗传方差,Ve为误差。
[0073] 此外,输出了参数无性系所有个体的两个性状的全基因组育种值(GEBV)和传统育种值(ABV),只输出GEBV前10%的个体,如表2所示。从表2可知,BLUP模型和GBLUP模型,所获得个体的全基因组育种值GEBV基本上都小于传统育种值ABV,即传统的BLUP模型存在高估育种值的情况。基于上述多性状模型分析的结果可知,GBLUP模型是优选模型,如果每个性状只取最好的10个个体作为亲本,则对于性状1,亲本应选1169、185、1131、1153、1107、1167、1172、1106和p20,对于性状2,亲本应选择163、172、1172、1123、165、151、p20、164、
1154和147。值得关注的是,在本轮分析中,原有的12个亲本,仅有亲本P20号保留下来了,表明其遗传基因确实不错。此外,个体1172和亲本P20在两个性状全基因组育种值均排名靠前,而之前的性状聚类分析结果显示,性状1和性状2之间应呈现负相关,因此,个体1172和亲本120应属于相关破坏者,在多性状聚合育种中,对于这类个体,应给予特别关注。
[0074] 表2 模型遗传参数估计值
[0075]
[0076] (5)基于上述分析可知,模型2,即利用SNP标记信息构建G矩阵的多性状模型为最优模型,即本发明的最佳分析模型。通过多性状的最佳模型,可捕获遗传材料间更多的遗传关系,进而精确估算遗传误差,并进一步精确估算全基因组育种值,据此来筛选不同性状全基因组育种值高的个体进行杂交,于是快速达到林木多性状聚合育种的目的。
[0077] 显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

当前第1页 第1页 第2页 第3页
相关技术
性状基因组相关技术
性状聚合相关技术
林元震发明人的其他相关专利技术