

-
首页
-
科技服务
- 基因组构建
- 动植物基因组
- T2T基因组
- 泛基因组
- 真菌基因组
- 细菌基因组
- 线粒体基因组
- 重测序测序分析
- 动植物全基因组重测序
- 外源片段插入检测
- 转录组测序分析
- 二代有参转录组
- 二代无参转录组
- 关联分析与育种
- 性状关联分析
- 基因组选择育种
-
资源中心
- GenomeSearch
- 技术分享
- 送样建议
- 引物设计
-
新闻资讯
-
关于万摩
- 公司简介
- 项目成果
-
加入万摩


-
首页
-
科技服务
- 基因组构建
- 动植物基因组
- T2T基因组
- 泛基因组
- 真菌基因组
- 细菌基因组
- 线粒体基因组
- 重测序测序分析
- 动植物全基因组重测序
- 外源片段插入检测
- 转录组测序分析
- 二代有参转录组
- 二代无参转录组
- 关联分析与育种
- 性状关联分析
- 基因组选择育种
-
资源中心
- GenomeSearch
- 技术分享
- 送样建议
- 引物设计
-
新闻资讯
-
关于万摩
- 公司简介
- 项目成果
-
加入万摩
项目文章丨海洋中的“懒汉”——䲟鱼高质量染色体水平基因组组装注释

䲟鱼也被叫做吸盘鱼,号称是海洋中最懒的鱼。䲟鱼属于硬骨鱼纲、鲈形目、䲟科、䲟属,广泛分布于热带和温带的沿海和近海海域。有别于其他鱼类,䲟鱼拥有一种可用来吸附在宿主上的椭圆形吸盘,这种吸盘由它的背鳍演化而来,从头顶延伸至躯体的前部,是它们赖以生存的法宝。
䲟鱼吸附到宿主身上后,吸盘边缘的唇圈组织将会和宿主皮肤表面接触密封,并产生一些粘液来增强密封性。而吸盘里的鳞片在肌肉的控制下向上抬起从而扩大内部的体积,产生负压,此时外部环境的气压或水压就会将吸盘鱼紧紧压在宿主身上。䲟鱼宿主很多,像鲸鱼、鲨鱼、海豚、海龟、船体,甚至潜水员都能成为䲟鱼的附着对象,寻求到宿主后,䲟鱼便可安心的移动旅行,躲避捕食者,增强求偶和繁殖能力,改善鳃的通风换气,扩大取食机会。此外,䲟鱼独特的吸盘和吸附习惯使其成为仿生和适应性进化研究的良好对象,但目前已有的研究对于䲟鱼的生物学背景的理解很有限,为揭示其独特的进化进程和遗传机制,浙江海洋大学教授高天翔教授团队联合万摩科技破译了䲟鱼的基因组。

文章原名:An improved chromosome-level genome assembly and annotation of Echeneis naucrates
文章译名:改进的䲟鱼染色体水平基因组组装与注释
发表时间:2024年5月4日
发表期刊:scientific data
IF:9.8
文章作者:高天翔、刘凯、刘启(万摩科技)、王丹阳
点击文末“阅读原文”查看文章原文
本研究利用Illumina、PacBio和Hi-C测序数据,成功组装了䲟鱼高质量染色体水平基因组,组装基因组大小572.85 Mb,Contig N50大小23.19 Mb,挂载染色体数目为24条,并预测了22161个蛋白编码基因。本研究工作增强了䲟鱼基因组的实用性,并为该物种的基因组学、生物学和适应性进化的未来研究提供了有价值的基础。
01
高质量的䲟鱼基因组组装和Hi-C挂载
利用Hifiasm软件对测序产生的33.14 Gb的PacBio HiFi数据进行初步Contig水平的基因组组装,随后利用purge_haplotigs软件对组装基因组进行去冗余,最后得到588.30 Mb大小的Contig水平组装基因组,包含54条Contigs,N50大小23.19 Mb,组装BUSCO完整性评估达到97.5%。
利用HiCUP分析流程对测序产生的76.56 Gb的Hi-C数据进行处理,产生互作矩阵,随后3D-DNA分析流程利用互作矩阵将初步组装去冗余基因组的Contigs锚定到染色体上,紧接着利用Juicebox Assembly Tools调图软件对互作热图进行人工调整和评估,最后得到染色体水平的基因组,基因组大小570.71 Mb,挂载率达到99.63%。

图1 䲟鱼基因组组装的Hi-C互作热图
02
重复序列注释
结合同源搜索和从头预测来鉴定䲟鱼基因组中的重复序列元件。使用Tandem Repeat Finder和LTR_FINDER两个软件进行基因组重复序列的从头预测,并利用RepeatMasker和RepeatProteinMask两个软件将基因组序列比对Repbase数据库来鉴定基因组序列中已知的重复元件。最后在基因组中共鉴定到15.57%的重复序列,其中重复DNAs,LINEs,,SINEs和LTRs分别占比整个基因组大小的5.74%,4.03%,2.27%和1.85%。
表1 䲟鱼基因组转座元件统计

03
基因预测和功能注释
使用重复序列掩蔽基因组,通过结合从头预测、同源预测和转录本预测三种策略对䲟鱼基因组进行蛋白编码基因预测。从头预测利用Augustus和Genscan软件来进行;同源基因预测基于不同物种蛋白序列tblastn比对基因组来实现,这些物种包括黑尻鲹,䲟鱼,斑马鱼,高体鰤,红鳍东方鲀和黄条鰤;转录本预测则先通过HISAT2软件将五个组织的转录组测序数据比对基因组,然后利用StringTie和TransDecoder两个软件预测假定的转录本结构。最后利用MAKER和HiFAP软件对三种策略预测结果进行整合去冗余,分别得到22161个和22086个基因,注释BUSCO完整性评估达到95.4%。预测的蛋白编码基因功能注释基于NR、Swiss-Prot、TrEMBL、KOG、AnimalTFDB、KEGG、InterPro和Pfam数据库进行,最后21402(96.90%)个基因注释到相对应的功能。
表2 䲟鱼基因组基因预测统计


图2 䲟鱼基因组组装圈图统计
表3 预测基因的功能注释统计

04
基因组组装比较
䲟鱼染色体水平组装基因组之前已经发表,但基因组组装和注释完整性需要进一步完善。已发表的组装版本仍然有着较多基因组缺口,平均每100 kb有着110.13个Gap。而本研究组装的䲟鱼基因组有着极低的碱基缺失,平均每100 kb只有0.4个Gap。组装基因组Contig N50大小23.19 Mb,显著超过了之前组装版本12.4 Mb的N50大小。同时基于脊椎动物的共同特征序列(CCCTAA/TTAGGG)于每条染色体两端进行搜索来鉴定端粒,最后在23条染色体中共鉴定得到了38个端粒序列。综上所述,本研究中䲟鱼组装基因组综合评估超越了之前组装发表的基因组。
表4 本研究和已发表的䲟鱼组装版本组装指标比较


图3 本研究和已发表的䲟鱼基因组组装版本比较
本研究组装了䲟鱼高质量染色体水平基因组,Contig N50大小23.19 Mb,挂载到24条染色体上,组装BUSCO评估达到97.5%,组装QV值达到52.01,同时在23条染色体中鉴定到端粒序列,且组装基因组综合评估超越了之前发表的䲟鱼基因组,这些都表明组装的䲟鱼基因组有着高度完整性、连续性和准确性。本研究组装的䲟鱼高质量基因组为遗传资源利用和独特的生物学特征的进一步研究提供了宝贵的基础。
关于万摩科技
武汉万摩科技有限公司(下称“万摩科技”)成立于2021年,总部位于武汉软件新城,是一家以多组学数据分析和研发为技术核心的科技公司。公司专注于为科研院校、研究机构、测序公司、制药公司、农业生产及育种公司提供基因测序、数据分析、软件研发、数据库搭建和平台开发服务。
基于二、三代基因测序,万摩科技深耕生物信息技术的开发和应用。依托团队十多年的技术积累,万摩科技每年完成上百个物种的基因组从头构建。同时,在泛基因组构建、性状关联遗传位点定位、转基因和基因编辑插入片段检测等多个领域建立了极具优势和特色的技术与应用体系。

万摩科技亦致力于成为一家数据公司。数据是生命科学表现与解读的承载体,数据的广泛连接与深度挖掘是多组学技术应用的必经之路。万摩科技聚焦于成为这一产业发展过程中的引领者,推动多组学数据多频次多维度的解析,促进组学技术的广泛应用。
万摩科技秉承“专注生命科学,勇攀技术高峰”的理念,致力于“打造生命科学数据创新应用中心,力争成为生物科技转化先锋企业”的发展愿景,力图通过不断的原始创新与积累,促进生物技术的数据化转型,让生命科学更好更快的应用并服务人类社会。

T:027-63494989
E:service@onemore-tech.com