欢迎参加e-Maize 挑战赛

1 奖励方式

本次e-Maize挑战赛的得胜者将分为:优胜奖一名,优秀奖若干名。

优胜奖获得者将获得100000人民币(税前),优秀奖获得者将获得10000人民币(税前)。获胜者将被邀请参加由华中农业大学和清华大学举办的e-Maize冬令营和研讨会。

2 比赛时间

即日起至2017年10月1日,随时都可以提交您的预测结果和方法。

3 目标和愿景

"生物学中的下一个重大进化将由数学、统计和计算方法驱动,需要被吸收到主流生物培训中,将生物学转变为定量科学。" 我们希望通过本次挑战赛,利用我们提供的基因组学数据和参赛选手的创新性数据分析方法(如机器学习),直接从基因型预测作物的生长发育的表型。本次实践的成功,将会让我们看到整个玉米产业从“资源集约型”向“技术集约型”的转变,并为作物育种行业带来革命性的改变。

本次e-Maize挑战赛以玉米分子育种中“杂种优势”的遗传学问题为驱动,以大规模测交群体的“基因型”数据(高密度SNP标记)为输入,以多环境重复测量的“表型”数据为预测目标。

4 数据简介

我们期望参赛者通过学科交叉,建立起一个精准、稳健、高效的计算分析方法,实现利用基因组学大数据来精准预测具有强优势表型的杂交组合。

本次竞赛涉及到一个玉米不完全双列杂交(NCII设计如下图所示)群体,共6210个杂交种。其设计方案为:父本为国内玉米育种界常用的30个优良自交系,母本为207个具有广泛变异的自交系。该群体设计几乎涵盖所有目前全国广泛推广的玉米杂交种的杂种优势群,为从基因组水平上进行杂种优势预测提供了理想的研究群体,也为杂交育种提供了具有高配合力的优良中间材料。



审核委员会将在同一标准下,在Test set上,按照表型预测值和真实测量值之间的吻合度,来评价不同方法的预测准确性和稳健性。如果出现准确度差异低于1%的不同方法,以速度更快的为胜方。


5 数据文档及提交方式

说明文档:

利用第二代测序技术,我们已完成杂交种的母本(207个材料)和父本(30个材料)进行了低覆盖度(1x)全基因组重测序,共抽提出约190万有代表性的SNP(tag-SNP)标记,每条玉米染色体分布约150K到280K的SNP标记。这套tag-SNP标记,即为本次竞赛所用基因型数据。

本次竞赛所涉及的所有玉米杂交种,已完成全国五个典型玉米种植生态区的田间播种和表型数据收集。我们将五个环境下测量的表型数据,利用最优线性无偏预测(best linear unbiased prediction, BLUP)方法,估算每个材料的遗传效应值,以校正环境间的实验误差。考虑到不同的杂种优势程度,本次竞赛确定目标性状为开花期、株高和产量三个性状,代表低度、中度和高度的杂种优势。这套杂交种表型BLUP数据,即为本次竞赛所用表型数据。

数据说明文档 报名并下载数据


提交方式:

提交内容具体参考“数据说明文档”。 请在提交前在训练集(Training Set)上预估一下您模型的准确性,即在训练数据集中通过计算预测值与真实值之间的Pearson Correlation,来预估您的准确度(参赛要求每种性状的Pearson相关系数,PCC,都要大于0.5),建议您使用 10-fold or 5-fold Cross-validation 来预估您的预测。

对于在Training Set上表型预测PCC大于0.7的参赛作品,我们将在后台的Test Set上做最终的测试。

需提交的模板文件 提交

6 参赛规则和版权信息

主办方拥有数据的所有版权,我们也将会对您所提交的内容严格保密,但获奖者的方法需要和主办方的数据一起正式发表在国际权威期刊。

更多细则

7 背景知识


7.1 杂种优势

杂种优势是一种生物界普遍存在的遗传现象,是指杂合体在一种或多种性状上优于两个亲本的现象。例如不同品系、不同品种、甚至不同种属间进行杂交所得到的杂种一代往往比它的双亲表现更强大的生长速率和代谢功能,从而导致器官发达、体型增大、产量提高,或者表现在抗病、抗虫、抗逆力、成活力、生殖力、生存力等的提高(如下图)。

更多请参考百度百科: 杂种优势



7.2 玉米的遗传特点和育种方式

目前,玉米生产上几乎全部采用杂交种,具有高产、早熟、株型合理的强优势杂交种的选育已经成为玉米种业激烈竞争的核心。玉米不仅是世界上重要的粮食作物,还是重要的饲料和生物能源原料来源,年种植面积超过5亿亩。玉米作为世界上最早利用杂种优势的作物,其杂种优势的利用为世界粮食安全做出了巨大贡献。由于不同种质材料的杂交组合的杂种优势存在很大差异,常规育种模式下,通过大规模杂交实验来筛选强优势组合是唯一的育种途径。在人工成本、经费投入和土地面积等因素限制下,一个玉米杂交品种的选育往往需耗时6-8年之久。

更多请参考百度百科:玉米, 育种, 杂交育种



7.3 现代基因组学改变传统育种方式

在基因组时代,单个材料的基因型分析已经远远低于表型鉴定成本,并仍呈逐年下降的趋势。在猪、牛等家畜育种过程,基因组选择策略发挥了卓有成效的作用,在同样育种周期里,能成倍的提高育种增益。相比而言,由于植物系谱关系的复杂性,常规基因组选择策略效果仍显捉襟见肘。因此,在统计分析方法上的突破,发展新的算法,有效整合海量的基因组数据,对植物杂交组合的性状表型进行精准预测,这是目前农作物分子育种中亟待解决的核心问题。

更多请参考百度百科:基因组学基因型表型分子育种