近日,由浙江大学 浙江省园艺作物品质改良重点实验室、云南省农业科学院、华南农业大学以及德国慕尼黑工业大学等多家单位共同合作在“Nature Communications”发表题为“The giant genome of lily provides insights into the hybridization of cultivated lilies”的研究论文。在本研究中,发表了泸定百合(Lilium sargentiae,基因组大小为 35.66 Gb)和嘉兰(Gloriosa superba,基因组大小为 5.09 Gb)的参考基因组。

导读
百合是经济上重要的单子叶植物,以其观赏花、球茎和大型基因组而闻名。它们的基因组信息的缺失阻碍了进化研究和基于基因组的育种工作。泸定百合和嘉兰百合是泸定百合目中最流行的观赏植物和切花之一。它们具有相似的花结构,但在茎变态上有所不同:泸定百合有鳞茎,而嘉兰百合有根状茎,这为比较泸定百合目中器官发展提供了理想的研究对象。尽管只有秋水仙科家族能够合成秋水仙碱,但比较泸定百合和嘉兰百合的基因组提供了对秋水仙碱起源和进化的见解。此外,它们对比鲜明的基因组大小将使人们能够探索巨大泸定百合基因组背后的进化机制。在本研究中,我们采用 PacBio HiFi 和 Hi-C 技术的组合来阐明L. sargentiae和G. superba的巨大基因组,并为百合植物物种的进化、比较基因组学和分子研究提供重要的基因组资源。

L. sargentiae和G. superba的基因组测序、组装和注释
对于从头全基因组测序,L. sargentiae和G. superba分别生成了 602.05 Gb 和 82.50 Gb 的 PacBio HiFi 长读长数据,以及分别为 1.07 TB (Tb) 和 594.24 Gb Hi-C 短读长数据。 我们还分别生成了L. sargentiae(2.12 Tb) 和G. superba(362.28 Gb) 的短读长数据估计它们的基因组大小和杂合性。为泸定百合目物种的291个样本获得了转录组数据,每个样本平均为8.63 Gb,总共为2.63 Tb的短读数据。因此,总共获得了约7.45 Tb的测序数据。泸定百合(L. sargentiae)基因组序列的最终组装长度为47.09 Gb(contig N50 = 0.93 Mb;scaffold N50 = 2.85 Gb),而嘉兰百合(G. superba)基因组序列的最终组装长度为5.15 Gb(contig N50大小= 0.48 Mb;scaffold N50大小 = 0.56 Gb)。基于从头和基于证据的预测,分别为L. sargentiae和G. superba注释了47,139和54,617个蛋白质编码基因,平均长度分别为42,804和9,984 bp,均长于其他已发表的被子植物基因。
L. sargentiae和G. superba的进化和谱系特异性WGD事件
对来自18个目的26种开花植物物种进行了系统发育基因组分析,包括12个单子叶目的9个。系统发育树揭示了8个单子叶目的一致进化位,L. sargentiae和G. superba形成一个单系群,与天门冬目物种相邻,泸定百合目和天门冬目物种构成了一个独特的群,与包含棕榈目、姜目和禾本科物种的群相邻。在物种内部和之间的基因组比较清楚地表明,L. sargentiae和G. superba都经历了两次全基因组复制(WGD)事件;在L. sargentiae和G. superba的自我比较中,同源block的比例为3:1,L. sargentiae和G. superba的分布显示了额外的峰值在Ks=0.73和Ks=0.55,分别表明在95-103百万年前和72-78百万年前发生了两个独立的WGD事件。这些结果表明,L. sargentiae和G. superba在泸定百合科和秋水仙科中分别经历了谱系特异性的WGD事件。百合超大的基因组是由最近的长末端重复逆转录转座子(LTR)塑造而成。系统发育分析揭示了百合栽培品种的多样化和独立起源。


泸定百合的系统发育和泸定百合栽培品种的起源
百合属包含约100种野生物种,并通过杂交等方法培育出众多品种。基于360个核基因,对51个野生物种和34个育种品种进行了系统发育基因组分析,揭示了百合分为两个单系群。系统发育分析显示,栽培品种有多个独立起源。特别是,野生百合可能为未来育种提供未充分利用的遗传资源。核心基因序列相似性分析显示,群内百合间共享基因组单倍型比例高于不同群间。L. browni与多种百合共享独特的基因组单倍型,可能广泛参与了百合的形成。转录组分析显示,部分栽培百合显示出多拷贝转录本的簇数量高于单拷贝,暗示了杂交的存在,而其他栽培百合可能通过驯化和突变育种培育。

L. sargentiae鳞茎和G. superba百合根状茎形成过程中涉及的基因的扩张演化
L. sargentiae和G. superba的鳞茎与根状茎是两种改良的茎源根茎,分别作为储存和繁殖器官,使植物能在逆境中生存。通过比较基因组和转录组分析,发现在淀粉和蔗糖代谢中涉及的基因家族在这两种百合中都有显著扩张,这些基因在储存器官的启动和扩展中扮演重要角色。泸定百合的基因组中,与蔗糖和淀粉代谢相关的基因家族如SUS1/4、APL2/3/4、SS2、BAM1、BAM3和CWINV的同源基因拷贝数量平均比嘉兰百合多出八个,主要是通过串联重复产生的。特别地,泸定百合中有15个SUS1/4同源基因,而嘉兰百合中只有五个。这些基因的扩张和表达增强了鳞茎和根状茎中蔗糖和淀粉代谢,这是这两种器官的主要天然成分。

L. sargentiae和G. superba的花器官基因
L. sargentiae和G. superba百合的花被片对其观赏性至关重要。通过鉴定和分析A、B、C和E类MADS-box基因,发现L. sargentiae含有多个MADS基因,而G. superba百合中这些基因的数量较少。特别是在B类PI 基因上,两个物种都经历了独立的复制事件。在E类MADS基因中,L. sargentiae的AGL2同源基因在不同分支中有不同的表达模式。在花发育的不同阶段,L. sargentiae和G. superba百合的A类和B类MADS基因表达广泛。L. sargentiae的LsaAGL6和G. superba百合的GsuAGL6在花被片中表达水平高,E类基因在G. superba百合中的表达普遍较高。

G. superba中秋水仙素的起源、演化和功能
G. superba中含有丰富的秋水仙素,这是一种在叶子、花朵和根茎中发现的生物碱。鉴定了多个与秋水仙素生物合成相关的基因同源序列,特别是一个名为CYP75A109-OMTs的基因簇,它包含了与秋水仙素相关的O-甲基转移酶基因和细胞色素P450基因的同源基因。这些基因在根茎中高度表达,并可能协同作用于秋水仙素的生物合成过程。此外,G. superba中还发现了两个P450编码基因的串联簇,这些基因可能参与秋水仙素的生物合成。相比之下,L. sargentiae中缺乏这些基因簇,LC-MS分析也未在其鳞茎和花蕾中检测到秋水仙素,表明秋水仙素的生物合成在秋水仙科中可能独立起源。

总结
1、作者揭示了百L. sargentiae(47.09 Gb)和G.superba(5.15 Gb) 的参考基因组组装。L. sargentiae代表了迄今为止发表的最大的测序真核生物基因组。
2、百合超大的基因组是由最近的长末端重复逆转录转座子(LTR)塑造而成。系统发育分析揭示了百合栽培品种的多样化和独立起源。百合超大的基因组是由最近的长末端重复逆转录转座子(LTR)塑造而成。
3、系统发育分析揭示了百合栽培品种的多样化和独立起源。XTH22、SOC1 和 AP1/FUL-like 基因的同源基因在百合鳞茎的发育、芽生长转变及花蕾生长转变中起重要调控作用。4、在嘉兰(G. superba)中鉴定出秋水仙碱生物合成基因簇,而在泸定百合(L. sargentiae)中缺失。这表明秋水仙碱在秋水仙科中的独立进化路径。5、这些基因组学研究成果深化了对百合目(Liliales)进化的理解,为未来的育种和分子研究奠定了基础,同时也为百合属植物的遗传改良提供了重要参考。这些信息将有助于推动百合作为经济作物的应用潜力开发。