欢迎参加e-Maize 挑战赛

Final Submit Rank Table


Rank Name Trait1 Trait2 Trait3 Sum
Rank Name Trait1 Trait2 Trait3 Sum
1Xupeng_Chen0.83030.88550.65562.3714
2Jiabo_Wang0.8280.70270.67012.2008
3Haixiao_Dong0.85310.42430.62491.9023
4Yao_Zhou20.76960.47810.65161.8993
5Shuqin_Jiang0.57290.62740.69391.8942
6Mang_Wang30.70650.5290.6491.8845
7Ao_Li0.71850.47820.62731.824
8Wenwei_Xiong0.56470.54420.65161.7605
9Huanhuan_Tai0.56870.5190.63171.7194
10Jiwei_Chang0.66190.34030.64781.65
11Ning_Gao20.56670.48210.59581.6446
12Hengde_Li30.55850.46810.60251.6291
13Hao_Zhou10.54060.48050.60681.6279
14Xiang_Yu30.49940.68940.42971.6185
15Pengfei_Hong10.54530.47290.58191.6001
16Yang_Xu0.49450.51410.59011.5987
17Tianxiong_Yao0.50270.47520.60911.587
18Sheng_Yu40.52640.47640.56261.5654
19runsheng20.52190.440.59891.5608
20Xingjie_Hao10.48850.47130.59681.5566
21Yanru_Cui10.4870.47520.59331.5555
22Shijie_Zhang30.52240.38120.64451.5481
23Tianqi_Wang10.53130.47370.51841.5234
24Kun_Yang10.52060.42130.57161.5135
25jojen10.50530.41530.56331.4839
26Zhiyu_Tan10.43540.44090.60011.4764
27Daoming_Wang10.5330.38320.51581.432
28Yumin_Huang10.41060.44230.57531.4282
29Hui_Wang0.47880.24310.61221.3341
30SuperString10.41760.18580.19950.8029
31Tang_Zhou0.38770.05840.33440.7805
32Tianyu_Hu0.31530.0220.15890.4962
33Jinliang_Yang-0.2954-0.02990.1252-0.2001

截止10月5日24:00,主办方共收到14组最终版结果。预测排名中,如您的姓名后有数字(如Yao_Zhou2),则表示主办方并未收到您的最终版结果,此结果为您多次提交结果的最优版。

1 奖励方式

本次e-Maize挑战赛的得胜者将分为:优胜奖一名,优秀奖若干名。

优胜奖获得者将获得100000人民币(税前),优秀奖获得者将获得10000人民币(税前)。获胜者将被邀请参加由华中农业大学和清华大学举办的e-Maize冬令营和研讨会。

2 比赛时间

即日起至2017年10月1日,随时都可以提交您的预测结果和方法。

3 目标和愿景

"生物学中的下一个重大进化将由数学、统计和计算方法驱动,需要被吸收到主流生物培训中,将生物学转变为定量科学。" 我们希望通过本次挑战赛,利用我们提供的基因组学数据和参赛选手的创新性数据分析方法(如机器学习),直接从基因型预测作物的生长发育的表型。本次实践的成功,将会让我们看到整个玉米产业从“资源集约型”向“技术集约型”的转变,并为作物育种行业带来革命性的改变。

本次e-Maize挑战赛以玉米分子育种中“杂种优势”的遗传学问题为驱动,以大规模测交群体的“基因型”数据(高密度SNP标记)为输入,以多环境重复测量的“表型”数据为预测目标。

4 数据简介

我们期望参赛者通过学科交叉,建立起一个精准、稳健、高效的计算分析方法,实现利用基因组学大数据来精准预测具有强优势表型的杂交组合。

本次竞赛涉及到一个玉米不完全双列杂交(NCII设计如下图所示)群体,共6210个杂交种。其设计方案为:父本为国内玉米育种界常用的30个优良自交系,母本为207个具有广泛变异的自交系。该群体设计几乎涵盖所有目前全国广泛推广的玉米杂交种的杂种优势群,为从基因组水平上进行杂种优势预测提供了理想的研究群体,也为杂交育种提供了具有高配合力的优良中间材料。



审核委员会将在同一标准下,在Test set上,按照表型预测值和真实测量值之间的吻合度,来评价不同方法的预测准确性和稳健性。如果出现准确度差异低于1%的不同方法,以速度更快的为胜方。


5 数据文档及提交方式

说明文档:

利用第二代测序技术,我们已完成杂交种的母本(207个材料)和父本(30个材料)进行了低覆盖度(1x)全基因组重测序,共抽提出约190万有代表性的SNP(tag-SNP)标记,每条玉米染色体分布约150K到280K的SNP标记。这套tag-SNP标记,即为本次竞赛所用基因型数据。

本次竞赛所涉及的所有玉米杂交种,已完成全国五个典型玉米种植生态区的田间播种和表型数据收集。我们将五个环境下测量的表型数据,利用最优线性无偏预测(best linear unbiased prediction, BLUP)方法,估算每个材料的遗传效应值,以校正环境间的实验误差。考虑到不同的杂种优势程度,本次竞赛确定目标性状为开花期、株高和产量三个性状,代表低度、中度和高度的杂种优势。这套杂交种表型BLUP数据,即为本次竞赛所用表型数据。

数据说明文档 报名并下载数据


提交方式:

提交内容具体参考“数据说明文档”。 请在提交前在训练集(Training Set)上预估一下您模型的准确性,即在训练数据集中通过计算预测值与真实值之间的Pearson Correlation,来预估您的准确度(参赛要求每种性状的Pearson相关系数,PCC,都要大于0.5),建议您使用 10-fold or 5-fold Cross-validation 来预估您的预测。

对于在Training Set上表型预测PCC大于0.7的参赛作品,我们将在后台的Test Set上做最终的测试。

请将预测结果文件,参赛作品说明文档(模型简要介绍),发送至邮箱IMAZE101@163.COM。我们将会对您所提交的内容严格保密。

需提交的模板文件 提交

6 参赛规则和版权信息

有关e-MAIZE最终评奖方案及规则的说明

为给予参赛算法以专业而客观的评价,本次e-MAIZE大赛决定采用科学界普遍认可的peer-review策略,广邀业内知名的学者出任本次e-MAIZE挑战赛的评委。

本次e-MAIZE比赛计划分为三个阶段:

一)预测结果提交及优化阶段(5月1日―10月1日)。在此阶段,参赛选手可自由提交结果,并根据主办方反馈调试模型算法(截止日期后,新的结果提交视为无效结果);

二)预测算法评价阶段(10月1日―11月1日)。在此阶段,主办方后台测试参赛算法的预测效果,结合评审委员会的专业意见,判定不同算法的名次。具体方案如下:

[1] 截止日后,主办方会最终统一反馈所有提交算法的预测效果,参赛选手需据此自行评估,并于截止日后3日内提交一版最优预测结果,作为本次e-MAIZE挑战赛的预测结果的最终版;

[2] 基于最终版预测结果,主办方将提名前10名参赛者(算法)入围获奖候选人。入围名单及信息,将在大赛主页和QQ群予以公布。

[3] 在收到主办方通知后,入围候选人需要在7天内提交最终版结果对应的算法相关文件。具体如下:

① 算法相关原代码(需详细注明运行环境和步骤,主办方不负责对运行问题进行调试,多次沟通无果后,则视作候选人放弃评奖资格);

② 算法的详细说明(需特别注明创新之处;如组队,需注明个人贡献,主办方不承担因版权所属纠纷,产生的责任);

③ 候选人个人简历(需包含个人基本信息、教育和学术背景等);

④ 版权声明文件(候选人需对算法拥有传播版权,或获正式授权,否则主办方保留取消其评奖资格的权利);

⑤ 如在规定时间内,主办方未收到候选人提交的算法相关文件(①-④),该候选人视为自动放弃评奖资格。主办方将遴选下一名参赛者入围候选人,并在网站和QQ群予以公告。

[4] 主办方将设计完整的方案,计划为期1个月,对候选人提交的算法进行统一地测试,以评估算法预测效果的真实性、在不同抽样条件下的稳健性和运算速度等方面,并出具评估报告。

[5] 在主办方评估报告的基础上,评审委员会将充分、客观地考量不同算法的功效、新颖性以及应用前景,并出具评审报告。评审委员会将审慎决定挑选出5位入围候选人。

三)e-MAIZE冬令营暨颁奖阶段(11月3―4日,武汉,暂定)。在此阶段,主办方将邀请前5名入围候选人(或团队)参加e-MAIZE冬令营研讨会进行现场答辩。获奖者以学术报告的形式展示算法细节,评审委员将现场给予专业地点评,并最后评选出3名获奖者及名次。冬令营的相关日程,主办方将据实际情况予以安排。

关于e-MAIZE比赛规则及版权的说明

1. 主办方拥有数据的所有版权,在未经主办方正式书面授权下,任何团体或个人,不得以任何公开地形式传播数据,或基于此数据的任何结果;

2. 参赛者需对提交的算法拥有传播版权,或获版权持有者正式授权,应出具书面版权说明。如存在虚假行为,主办方有权随时终止其评奖资格。主办方不承担后续因算法版权从属问题,而导致的任何纠纷。

3. 参赛者应该严格、真实地提交相关信息,任何虚假或不完整信息将对评奖产生不利影响。主办方承诺对参赛者的提交内容严格保密,并尊重其知识产权。

4. 获奖者的算法需要和主办方的数据一起正式发表在国际权威期刊,否则视为放弃获奖资格。在文章发表的同时,获奖者可以和主办方一起对算法进行产权保护。

5. 更多e-MAIZE比赛细则和版权声明,请参赛者详细阅读主页【6 参赛规则和版权信息】的 “更多细则”

6. 主办方保留对比赛规则和版权的最终解释权。主办方将于大赛主页和QQ群及时公告相关动态,参赛者在继续参与比赛的情况下,视为完全理解并认可e-MAIZE的比赛规则。主办方不承担,因质疑规则,而导致的任何后续纠纷责任。

更多细则

7 背景知识


7.1 杂种优势

杂种优势是一种生物界普遍存在的遗传现象,是指杂合体在一种或多种性状上优于两个亲本的现象。例如不同品系、不同品种、甚至不同种属间进行杂交所得到的杂种一代往往比它的双亲表现更强大的生长速率和代谢功能,从而导致器官发达、体型增大、产量提高,或者表现在抗病、抗虫、抗逆力、成活力、生殖力、生存力等的提高(如下图)。

更多请参考百度百科: 杂种优势



7.2 玉米的遗传特点和育种方式

目前,玉米生产上几乎全部采用杂交种,具有高产、早熟、株型合理的强优势杂交种的选育已经成为玉米种业激烈竞争的核心。玉米不仅是世界上重要的粮食作物,还是重要的饲料和生物能源原料来源,年种植面积超过5亿亩。玉米作为世界上最早利用杂种优势的作物,其杂种优势的利用为世界粮食安全做出了巨大贡献。由于不同种质材料的杂交组合的杂种优势存在很大差异,常规育种模式下,通过大规模杂交实验来筛选强优势组合是唯一的育种途径。在人工成本、经费投入和土地面积等因素限制下,一个玉米杂交品种的选育往往需耗时6-8年之久。

更多请参考百度百科:玉米, 育种, 杂交育种



7.3 现代基因组学改变传统育种方式

在基因组时代,单个材料的基因型分析已经远远低于表型鉴定成本,并仍呈逐年下降的趋势。在猪、牛等家畜育种过程,基因组选择策略发挥了卓有成效的作用,在同样育种周期里,能成倍的提高育种增益。相比而言,由于植物系谱关系的复杂性,常规基因组选择策略效果仍显捉襟见肘。因此,在统计分析方法上的突破,发展新的算法,有效整合海量的基因组数据,对植物杂交组合的性状表型进行精准预测,这是目前农作物分子育种中亟待解决的核心问题。

更多请参考百度百科:基因组学基因型表型分子育种