土壤重要动物白符䖴( Folsomia candida )基因组的重新组装与注释

2020 
目的本文利用公开可用的PacBio测序数据进行白符䖴(Folsomia candida)基因组的重新组装和注释,以提升该物种基因组组装的连续性和注释基因的完整性。 方法使用Flye和Falcon进行组装,使用quickmerge合并组装结果。基因注释由MAKER完成,整合了从头(de novo)预测、转录本和蛋白质同源证据。其中转录组基于StringTie组装结果。 结果新组装的基因组大小为221.09 Mb,共113条序列(scaffolds),其中最长scaffold为30.07 Mb,N50长度为13.5 Mb。新组装的基因组组装结果基于通用单拷贝直系同源基因(BUSCO)的完整性评估为96.5%。MAKER注释流程预测了20 080个蛋白质编码基因,其中80.56%和96%的基因获得转录组和UniProt蛋白质数据支持,蛋白质编码基因BUSCO完整性评估为92.4%。此外,结构注释鉴定了253 665条(22.3%)重复序列和661个非编码RNA。基因家族进化分析鉴定了8 876个基因家族,其中48个家族发生了快速进化(扩张或收缩)事件。 结论白符䖴基因组的重新组装与注释的版本与原版本相比有显著提高,scaffold N50由6.5 Mb提高到13.5 Mb,蛋白质编码基因的完整性由84%提高到92.4%。基因家族进化分析为六足动物的进化及土壤生态毒理学提供重要的基础资料和新视角。
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []