油橄榄(Olea europaea L.)被称为“总理树”,是我国重要的木本油料树种,是国务院办公厅《关于加快木本油料产业发展的意见》中明确提出的10个木本油料植物之一,具有巨大的市场潜力和发展前景。我国油橄榄育种还处于传统育种的阶段,特色代谢物精细鉴定方法及相关基因调控网络没有建立,未能进入到分子育种阶段,其主要原因之一是缺乏高质量的油橄榄基因组图谱。
近日,Horticulture Research在线发表了我所题为De novo assembly of a new Olea europaea genome accession using nanopore sequencing的研究论文。
该研究采用Oxford Nanopore三代测序和HiC技术,对适合于高密度栽植和机械化采收的油橄榄品种“豆果”(Olea europaea L. subsp. europaea cv. ‘Arbequina’)进行了全基因序列测定(图1A-B)。高质量基因组的获得的最大的难点在于基因组的组装,油橄榄基因组流式细胞仪测定及Survey的结果显示,油橄榄基因组大小约为1.30 Gb,为高杂合度(1.09%)和高重复序列(56.18%)的基因组,这更加大了油橄榄基因组的组装的难度(图1C-D)。为了获得最佳的组装效果,该研究采用了Canu, Wtdgb, SMARTdenovo, Canu+Wtdgb, SMARTdenovo+Canu, Wtdgb+SMARTdenovo, Wtdgb+SMARTdenovo+Canu七种方法对测定数据进行了组装,最终获得了Contig N50=4670 kb,Scafford N50=41979 kb的组装结果。由于油橄榄在全球受到广泛关注,之前已经有两个基于二代测序为主的油橄榄基因组,该研究将组装结果与之进行比较发现,基因组的质量相对于之前的研究有数量级的提高(图1E)。
图1油橄榄基因组的survey及组装。A.油橄榄品种豆果(cv. ‘Arbequina’)的花絮。B.油橄榄品种豆果的果实。C.流式细胞仪测定油橄榄基因组大小。采用毛果杨(Populus trichocarpa)作为测定的内标。Mean:每个细胞的荧光平均值CV:变异系数。X轴表示相对含量,Y轴表示图中的事件数。D.油橄榄基因组K-mer分析。21-mer频率分布。E.油橄榄不同版本的基因组组装比较,蓝色代表本研究基因组。
橄榄苦苷和羟基酪醇是橄榄油中最重要的营养成分,它们对人体的主要功能包括抗氧化、软化血管、降低胆固醇、降血糖等,同时它们还是橄榄油特别苦味和辣味的来源。目前为止,关于橄榄苦苷和羟基酪醇生物合成通路的研究大多以代谢物本身的化学合成及推导为主,通路关键中间产物和基因信息不足。基于此,该研究对油橄榄不同组织橄榄苦苷和羟基酪醇合成通路关键代谢物含量及结构基因的表达进行分析,并利用上述测定的高质量基因组信息确定了202个基因参与了橄榄苦苷和羟基酪醇生物合成,这些结构基因的数量是已发表研究的两倍。最终结合关键代谢物含量变化及结构基因的表达绘制了油橄榄橄榄苦苷和羟基酪醇生物合成通路(图2)。
图2油橄榄橄榄苦苷和羟基酪醇生物合成通路。蓝色是该基因的缩写,括号中的红色数字表示该基因家族中已检测到的基因数目,括号中的绿色数字表示该家族中总转录本数目。热图显示差异基因的表达水平:黄色至红色代表高于基因的log10(FPKM)数据;绿色到蓝色表示低于基因的log10(FPKM)数据。
该研究利用Oxford Nanopore三代测序和HiC技术对油橄榄基因组进行了De novo测序,获得了高质量的染色体级别基因组图谱,为油橄榄的遗传改良以及提质增效提供了重要的理论基础。
我所饶国栋副研究员为本文第一作者,张建国研究员为通讯作者,相关工作得到了国家重点研发计划子课题(2018YFD1000603-03)和中央级公益性科研院所专项资金项目(CAFYBB2018QB001)的支持。
论文链接:https://www.nature.com/articles/s41438-021-00498-y
Horticulture Research科睿唯安JCR2019影响因子:5.404,位于园艺一区(第1/36名),植物科学一区(第16/234名),遗传学一区(第24/177名)。2020年中科院期刊分区(基础版):位于园艺小类一区,植物科学小类一区,遗传学小类一区,农林科学大类一区(Top期刊)。