首页 » 99链接平台 » 兰州大学研究团队开发群体SV合并软件(PanPop)助力泛基因组研究(合并基因组兰州大学群体研究)

兰州大学研究团队开发群体SV合并软件(PanPop)助力泛基因组研究(合并基因组兰州大学群体研究)

admin 2024-10-24 07:34:44 0

扫一扫用手机浏览

文章目录 [+]

PanPop的核心算法为PART(PAnop’s Realign and Part,图1a),可以整合并过滤多个SV-caller的结果。
PART不同于传统SV合并算法,研究人员创新性的使用了SV重比对和再分割技术,得以将以往难以合并的长片段、高差异的SV切割为多个较短且简单的SV。
同时,PART还会合并相似的单倍型进而得到更多的Biallelic-SV,大幅度降低了后续SV分析的难度。
同时PanPop流程还集成了从reads到个体/群体SV的整套流程,且自由度极高。
并且,在群体SV合并过程中,PanPop还可以根据深度信息自动填充缺失信息,显著降低缺失率。

通过比较PanPop和目前大部分的SV合并软件,可以发现PanPop的综合表现最优。
在单个体、多SV-Caller的整合中,发现整合5个SV-Caller时可以明显提高准确性。
而且在过滤SV时,确保单个SV至少被两个SV-Caller支持,可以明显降低假阳性率,综合表现最优(图1b,c)。
在多个体的群体SV合并中,PanPop可以在保持高准确性的同时,得到较低的缺失率和较多的Biallelic-SV(图2)。

此外,值得一提的是PanPop是基于多线程开发的软件,可以充分的利用更多资源进而快速处理大规模的基因组数据,大大提高了合并的效率,确保了PanPop在海量数据处理中的优势。
同时PanPop已经开源可免费使用(https://github.com/starskyzheng/panpop),提供傻瓜式安装、一键启动、全集群满载、高度可定制的分析策略。
其各项关键参数都在控制文件中且均可手动调整,以适用不同的分析情况,且PanPop专门提供了一个独立的程序入口,可以直接处理各种VCF文件。

兰州大学研究团队开发群体SV合并软件(PanPop)助力泛基因组研究(合并基因组兰州大学群体研究) 99链接平台
(图片来自网络侵删)

图1. PART算法示意图(a)和单个体多SV-caller合并的软件间比较(b,c)

图2. 群体SV合并

目前,该研究结果在Nature Communications杂志在线发表(https://doi.org/10.1038/s41467-024-45244-9),题目为“A sequence-aware merger of genomic structural variations at population scale”。
目前刘建全课题组已普遍采用PanPop进行SV分析,且已有牦牛泛基因组文章已经见刊于Nature Communications(https://doi.org/10.1038/s41467-023-41220-x)。
兰州大学刘建全和杨勇志教授为论文通讯作者,在读博士研究生郑泽宇为第一作者。
该研究受到了科技部重点研发计划(2023YFF0805600)、甘肃省基础研究创新群体、国家自然基金(32170219)、中央高校兰州大学优秀青年支持计划项目和草种创新和草地农业生态系统国家重点实验室青年英才培育计划的资助,以及兰州大学超算中心、生态学院实验中心西部生态环境与区域发展大数据计算平台和兰大管理学院数据中心机房提供的计算资源。

来源:兰州大学生态学院

编辑:李江萍

责任编辑:彭倩

标签:

相关文章