Cyclotides prediction in Leptopetalum
biflorum based on de novo transcriptome assembly and annotation(基于从头转录组组装和注释的双花耳草环肽预测)
[摘要] 目的 双花耳草(Leptopetalum
biflorum)的转录组测序数据缺乏,许多环肽尚未被发现。本研究旨在建立基于从头转录组组装的工作流程来系统性预测双花耳草中的环肽,为环肽的发现及功能分析提供参考。方法
对双花耳草的根、叶和花进行转录组测序(RNA-seq),获得两组转录组测序数据。采用FastQC和MultiQC进行测序质量评估。利用Trinity对双花耳草进行从头转录组组装,并通过读取支持法(Read Support)和BUSCO工具分析对组装质量进行评估。Eggnog-mapper和Trinotate用于注释GO术语(GO
Terms)和KEGG通路。利用Transdecoder预测基因序列的开放阅读框(ORFs)和蛋白编码区(coding regions),并通过SignalP软件预测包含信号肽和信号肽剪接位点的氨基酸序列。使用本团队开发的FindCRP
2.0(Find Cyclotide Peptide)软件对获得的氨基酸序列进行环肽预测。结果 利用双花耳草转录组测序数据共组装了171,310个转录本和103,299个基因,转录本平均长度为1,139.89,基因平均长度为780.87。在这些基因中,约30%的基因在其他植物物种中表现出同源性。GO功能分析结果显示有23,265个基因(22.52%)被注释到41个GO Terms(Level 2)。KEGG通路注释结果显示有23,682个基因(22.92%)包含了5,171个KO注释,共参与484条通路。FindCRP共预测到17个潜在环肽序列,其中15个序列具有同源基因。值得注意的是,有5个潜在环肽序列与它们各自的同源基因序列完全一致(100%)。此外,三维结构预测结果显示2个没有任何同源基因序列的潜在环肽序列具备成环能力。结论
本研究建立了利用RNA-seq数据进行从头转录组组装的工作流程来预测双花耳草中的环肽序列,以及在该工作流程中应用自主开发的FindCRP预测工具检测潜在环肽序列。完成了双花耳草的转录本注释并预测了潜在环肽序列,预测结果中的潜在环肽序列与已知环肽具有显著的同源性。
[关键词] 双花耳草;从头组装;环肽