

-
首页
-
科技服务
- 基因组构建
- 动植物基因组
- T2T基因组
- 泛基因组
- 真菌基因组
- 细菌基因组
- 线粒体基因组
- 重测序测序分析
- 动植物全基因组重测序
- 外源片段插入检测
- 转录组测序分析
- 二代有参转录组
- 二代无参转录组
- 关联分析与育种
- 性状关联分析
- 基因组选择育种
-
资源中心
- GenomeSearch
- 技术分享
- 送样建议
- 引物设计
-
新闻资讯
-
关于万摩
- 公司简介
- 项目成果
-
加入万摩


-
首页
-
科技服务
- 基因组构建
- 动植物基因组
- T2T基因组
- 泛基因组
- 真菌基因组
- 细菌基因组
- 线粒体基因组
- 重测序测序分析
- 动植物全基因组重测序
- 外源片段插入检测
- 转录组测序分析
- 二代有参转录组
- 二代无参转录组
- 关联分析与育种
- 性状关联分析
- 基因组选择育种
-
资源中心
- GenomeSearch
- 技术分享
- 送样建议
- 引物设计
-
新闻资讯
-
关于万摩
- 公司简介
- 项目成果
-
加入万摩
项目文章丨《Horticulture Research》八倍体草莓高质量单倍型基因组发布
点击蓝字丨关注我们吧!
草莓作为全球广泛栽培的水果,其属于蔷薇科(Rosaceae)草莓属(Fragaria),迄今为止,已经鉴定了24种草莓属的物种的倍性,其倍性跨越二倍体到十倍体。其中栽培草莓(Fragaria × ananassa)为多年生的草本植物,是一个复杂的八倍体,大多数位点具有高杂合度,且存在多达四个的二倍体祖先,导致栽培草莓的遗传分析相当困难,其杂交祖先至今仍存在争议。虽然前期研究已有一些栽培草莓的基因组发表,但其连续性和完整性仍不够理想,同时目前还没有关于八倍体草莓基因组单倍型的组装及研究。

2023年1月,农林科学一区Top期刊Horticulture Research在线发表了沈阳农业大学草莓科研团队题为“High-quality haplotype-resolved genome assembly of cultivated octoploid strawberry”的研究论文,组装出八倍体栽培草莓(2n=8x=56)高质量单倍型基因组,为栽培草莓后续的基因表达调控、遗传进化分析和农艺性状相关研究提供了重要参考。
博士研究生毛健鑫、青年教师王岩为论文第一作者,草莓科研团队负责人张志宏教授为论文通讯作者。该研究得到国家自然科学基金重点项目和“兴辽英才”项目资助。万摩科技为本研究提供测序、基因组组装和注释等服务。
本研究利用二代illumina、三代PacBio HiFi以及Hi-C技术测序并组装得到了两套高质量单倍型基因组序列,该序列为八倍体草莓首次发表的单倍型基因组,并且多条染色体0 gap,仅由一条contig构成。其中染色体最短的染色体约为22Mb,而组装的N50已经达到约27Mb。

图1. 栽培草莓不同组装版本的比较
Hap1(825Mb,contig N50 26.70Mb)和Hap2(808Mb,contig N50 27.51 Mb),在使用embryophyta_odb10 库对基因组进行BUSCO评估后,显示其完整BUSCOs比例分别为98.2%和98.0%;同时Hap1注释到104,957个蛋白编码基因,Hap2注释到102,356个蛋白编码基因;使用embryophyta_odb10 库对注释得到的蛋白编码基因进行BUSCO评估,显示其完整BUSCOs比例均为99.6%。

图2. 单倍型基因特征信息
通过对基因组的共线性分析,首次发现相较于”Camarosa”,Hap1和Hap2均在2-1染色体上发现了约10 Mb的倒位和易位,为了验证该结构变异是否真实存在,通过共线性分析发现该倒位和易位同样存在于“Wongyo 3115”和“Royal Royce”基因组上。并且通过Hi-C互作图来看,如果将该连续的contig打断调整至与”Camarosa”基因组序列一致时,Hi-C热图会显示异常断点,该结果代表支持此处的结构变异。

图3.chr2-1 的结构变异示意及验证
通过转录组分析发现,有约72%的基因(75,199/104,957 in Hap1,74,547/102,356 in Hap2)在根、茎尖、叶子和成熟的果实中有表达,约66%的基因(49,236/104,957 in Hap1,49,191/102,356 in Hap2)在四个组织中均有表达。同时也检测到大量的组织特异表达基因,以Hap1为例,有1,344个基因只在叶子中表达、1,753个基因只在根表达、4,343个基因只在茎尖表达和2,096个基因只在成熟的果实中表达。
栽培草莓起源于四个二倍体物种,通过对花青素合成途径相关基因的分析,揭示了等位基因结构多样性和等位基因表达的复杂性,例如,FaDFR1基因在6个单倍型染色体上( 2-1-2、2-2-1、2-2-2、2-3-1、2-3-2、和2-4-2),但不在另外两个单倍型染色体上(2-1-1和2-4-1),并且通过测序reads覆盖和各基因证据的验证,确定不是组装或者注释引起的差异。某些基因也表现出其少数等位基因在不同发育时期占主导地位,如FaMYB10基因,在8个单倍型染色体上均存在,但位于染色体1-2-1 (FxaYL_121g0707540)和染色体1-2-2 (FxaYL_122g0790550)的FaMYB10基因表达量分别占T(turning)和R(ripening)阶段FaMYB10总表达量的99.18%和97.65%。
本研究首次得到了八倍体草莓的单倍型基因组,相较于其他版本基因组,极大地提升了连续性,减少了可能的连接错误,提高了后续变异检测的准确性。高质量的基因组是后续一系列工作的基石,关于结构变异的影响和等位基因不同的表达模式仍有待进一步的研究。“艳丽”草莓的基因组和基因序列已经上传到国际蔷薇科植物基因组数据库,其为后续一系列研究奠定了基础。
参考文献:
Jianxin Mao, Yan Wang, Baotian Wang, Jiqi Li, Chao Zhang, Wenshuo Zhang, Xue Li, Jie Li, Junxiang Zhang, He Li, Zhihong Zhang, High-quality haplotype-resolved genome assembly of cultivated octoploid strawberry,Horticulture Research,2023;,uhad002,https://doi.org/10.1093/hr/uhad002
关于万摩科技
武汉万摩科技有限公司(下称“万摩科技”)成立于2021年,总部位于武汉软件新城,是一家以多组学数据分析和研发为技术核心的科技公司。公司专注于为科研院校、研究机构、测序公司、制药公司、农业生产及育种公司提供基因测序、数据分析、软件研发、数据库搭建和平台开发服务。
基于二、三代基因测序,万摩科技深耕生物信息技术的开发和应用。依托团队十多年的技术积累,万摩科技每年完成上百个物种的基因组从头构建。同时,在泛基因组构建、性状关联遗传位点定位、转基因和基因编辑插入片段检测等多个领域建立了极具优势和特色的技术与应用体系。

万摩科技亦致力于成为一家数据公司。数据是生命科学表现与解读的承载体,数据的广泛连接与深度挖掘是多组学技术应用的必经之路。万摩科技聚焦于成为这一产业发展过程中的引领者,推动多组学数据多频次多维度的解析,促进组学技术的广泛应用。
万摩科技秉承“专注生命科学,勇攀技术高峰”的理念,致力于“打造生命科学数据创新应用中心,力争成为生物科技转化先锋企业”的发展愿景,力图通过不断的原始创新与积累,促进生物技术的数据化转型,让生命科学更好更快的应用并服务人类社会。