2024年8月5日,张明方教授等团队联合浙江省农业科学院龚亚明研究员团队在国际遗传学顶级期刊Nature Genetics发表了“Reference genome sequence and population genomic analysis of peas provide insights into the genetic basis of Mendelian and other agronomic traits”的研究论文,首次揭示了菜用豌豆与粮用豌豆分化的基因组遗传基础,并对孟德尔性状在内的57个重要农艺性状相关基因进行了系统分析鉴定,研究结果为豌豆种质创新提供强大的组学大数据基础和基因组育种新策略。

导读
豆类作物对保障全球食物和营养安全至关重要,是人类和动物食物蛋白的主要来源,豌豆是全球第四大豆类作物。豌豆作为孟德尔研究发现其遗传定律的模式物种,在现代遗传学研究历史中具有重要地位。豌豆遗传多样性丰富,在世界各地均有种植。食用豌豆可分为粮用豌豆和菜用豌豆,我国菜用豌豆年种植面积约2000万亩,栽培面积和产量占世界总量的50%以上。长期的选择驯化和改良过程导致粮用豌豆和菜用豌豆重要农艺性状和生物学性状上有明显分化,但关于菜用豌豆与粮用豌豆群体遗传分化以及孟德尔性状和其他重要农艺性状的基因组遗传基础尚未被完全解析。

菜用豌豆ZW1的基因组组装和比较基因组分析
单菜用豌豆与粮用豌豆在形态和生理上具有显著差异。粮用豌豆成熟后收获,其种子作为食物;而菜用豌豆则在未成熟时收获,分为菜用种子豌豆和菜用豆荚豌豆两种形式。
菜用豌豆可分为新鲜、罐装和冷冻三种消费形式。Veg-seed豌豆特征为较大的种子和豆荚,且每荚种子数量较粮用豌豆多。成熟时,Veg-seed豌豆的种子通常呈现皱缩或凹陷状,而粮用豌豆种子则为圆形。至于Veg-pod豌豆,其豆荚在成熟时会收缩,而其他品种则表现为膨胀。自交系豌豆品种"ZW1",广受中国消费者喜爱,以其不定生长习性和干种子皱缩特性著称。本研究采用PacBio HiFi测序和Hi-C技术,成功组装了ZW1的高质量染色体级别参考基因组,命名为PeaZW1。PeaZW1基因组共注释出43,957个蛋白质编码基因,平均基因长度5,524碱基对,每个基因平均含4.21个外显子。基因组中还注释了非编码RNA,包括137个miRNAs、14,875个rRNAs、21,546个tRNAs和8,568个snRNAs。重复序列总长度3.43 Gb,占基因组的87.27%,其中LTRs-RTs占23.14%。
作者对PeaZW1与先前发表的参考基因组PeaZW6进行了共线性分析,结果显示两者高度共线。PeaZW1的BUSCO得分为99.44%,QV得分为39.00,显示出其组装质量极高。作者还鉴定了基因组中的2,932 Mb共线性块和162 Mb重排区域,其中包括234 Mb的倒位和187 Mb的易位。在PeaZW6和PeaZW1之间,共发现10,862,422个SNPs和1,226,270个InDels。

豌豆基因组变异图谱和群体结构
314份豌豆材料的重测序分析,包括野生物种,揭示了497,546,431个SNPs,其中28,912,046个优质SNPs用于群体遗传分析。Faststructure分析将豌豆分为六个群体结构,其中P. sativum I主要由野生祖先组成,P. sativum II和III包括不同表型的豌豆品种。P. sativum III表现出最低的核苷酸多样性和最高的连锁不平衡(LD)衰减。P. sativum II与P. sativum III之间存在显著的群体差异,分化最大的基因组区域与共生真菌和脂质运输有关。

与孟德尔性状相关的候选基因位点
作者对237个自然群体进行了两年的连续表型分析。通过全基因组关联研究(GWAS),作者量化并分析了57个关键农艺性状,这些性状涵盖了产量、品质以及抗性和耐受性。研究结果揭示了235个与这些性状显著相关的遗传位点。三内含子的一个4.0 kb序列缺失比之前报告的更长。表征了6个孟德尔性状的候选基因,包括Le基因(PsGA3ox1)与茎长相关,a基因(pshlh)与花色和多种表型相关,i基因(PsSGR)与子叶颜色相关,R基因(PsSBE1)与种子形状相关,以及GP基因与豆荚颜色相关。研究发现了多个与这些性状相关的变异,如PsGA3ox1的Ala到Thr变化、pshlh的剪接供体位点变异、PsSGR的非同义变体和剪接区域位点变异、PsSBE1的内含子区域变异,以及Psat0s4355g0080启动子中的SNP变异。这些发现为理解豌豆的遗传多样性和表型多样性提供了重要信息,并为分子育种提供了潜在的基因资源。

荚果形态和种脐性状遗传位点的解剖
通过GWAS分析,揭示了控制豌豆荚果型(V/P)的遗传位点,蔬菜豆荚豌豆,蔬菜种子豌豆和谷物豌豆三者之间的豆荚壁结构不同。显著的GWAS信号位于Chr1(373-393 Mb),与F2群体的BSA结果一致,指向PsCLE42基因,该基因编码一种CLE蛋白,参与干细胞身份和细胞分裂的调节。PsCLE42的一个有害突变导致过早终止密码子,且该突变主要出现在蔬菜豆荚型豌豆中,表达量显著高于其他类型。此外,还发现了控制种脐颜色的位点,位于Chr1(454-457 Mb),与编码多酚氧化酶的PsPPO1基因相关。PsPPO1的外显子缺失导致移码突变,与白色种脐相关,且这一无功能单倍型在多数豌豆品种中固定。

控制豆荚和种子发育的基因模块
作者对22个不同组织的RNA-seq分析和WGCNA鉴定出19个基因模块,其中3个模块与荚果发育紧密相关,涉及次级细胞壁合成和木质素代谢。发现了可能调控次级细胞壁生物合成的基因网络,包括多个关键基因。另外两个模块与种子发育高度相关,涉及可溶性糖、淀粉、脂质和蛋白质代谢。k-means聚类分析揭示了种子和荚果发育过程中的6种表达模式,为理解调控网络提供信息。还发现了284个GWAS位点附近的基因在种子发育中特异性表达,以及ZW1与ZW6品种间在代谢相关基因表达上的差异。

总结
本研究旨在通过构建高质量的豌豆基因组参考序列,并结合大规模重测序数据,解析豌豆的遗传变异图谱,揭示其遗传多样性和进化历程。同时,通过全基因组关联研究(GWAS),鉴定与重要农艺性状相关的候选基因位点,特别是孟德尔遗传性状(如茎长、花色、子叶色、种子形状等)的遗传基础。