黄酮类化合物是植物合成的重要次生代谢产物,除了对健康有益外,它们对茶叶品质产生重要影响。黄酮的生物合成途径涉及多种酶,产生不同的代谢产物。在植物中,不同物种基因组中参与类黄酮生物合成的关键基因拷贝数存在显著差异。尽管目前有多种基因鉴定工具可供使用,采用不同工具和参数可能导致对同一基因组进行注释时得到不同的结果,特别是在区分具有非常相似序列的多拷贝基因时,存在难以准确区分的情况。在面对大规模群体分析时,使用精确的注释参数对大量输入数据进行准确鉴定变得至关重要。
2024年3月,BeveragePlant Research 在线发表了华南农业大学基因组学与生物信息学研究中心张群洁副研究员团队题为GFAnno: Integrated Method for Plant FlavonoidBiosynthesis Pathway Gene Annotation 的研究论文。
论文介绍了一个名为“GFAnno”的开源软件包,GFAnno接受蛋白质序列文件作为输入,只需要一条命令就可以准确的注释出黄酮代谢通路18个基因。

该软件使用HMMSearch和BLASTP的经典注释流程,为了确保提供注释参数的准确性,该软件使用11种双子叶植物、7种单子叶植物和2种基部被子植物基因组构建了三个数据集:种子数据集,测试数据集和验证数据集。研究者首先使用已有试验验证的蛋白序列构建种子数据集,利用测试数据集依据输入序列的保守结构域覆盖度(h_cov)、与种子序列的整体相似性(q_iden)、输入序列的整体完整性(t_cov和q_cov),结合目标基因的系统发育关系来进行参数调优。最后该工作使用验证物种数据集确认参数的准确性。该研究提供了所有参数选择和验证的中间过程,以证实软件提供参数的准确性与稳定性。从研究结果可以看到,GFanno提供的参数能有效地排除各种结构不完整和异常的蛋白序列,并且能正确区分出细胞色素P450 (CYP450)中类黄酮3′5’-羟化酶(F3′5′H)和类黄酮3′-羟化酶(F3′H)等基因家族中序列高度相似的基因。
这项研究不仅为当前进行的茶树泛基因组研究提供了一种方便、精确的靶基因注释软件,同时为分析类黄酮生物合成途径和进行催化酶序列比较设定了标准。
该软件可以从https://github.com/qunjie-zhang/gfanno下载获得。
图1 GFAnno中的参数筛选流程图2 对CYP450中四个基因的参数筛选华南农业大学硕士研究生杜柳旭、博士研究生卢翠和硕士研究生王振涛为该论文的共同第一作者,张群洁副研究员为该论文的通讯作者。该研究得到了国家自然科学基金(32170625),华南农业大学双一流学科推进项目(2021B10564001)和广东省特支计划的支持。
团队介绍:
华南农业大学农学院基因组学与生物信息学研究中心是一个面向作物育种的综合研究平台。张群洁副研究员团队焦距于植物基因组的进化研究,重点关注植物次生代谢通路的进化,非编码RNA的进化,以及农作物及经济作物的杂种优势利用。
原文链接:
https://doi.org/10.48130/bpr-0023-0041特邀作者:杜柳旭、张群洁编辑:顾笑寅关于 Beverage Plant Research
Beverage Plant Research 是一本开放获取的期刊,致力于传播饮料作物领域研究进展,专注于发表本领域原创研究文章、综述、评论和观点。主题范围包括但不限于饮料植物生物学、品质与化学分析、饮料植物与人类健康等。本刊由中国农业科学院茶叶研究所、中国茶叶学会与Maximum Academic Press联合出版,期刊主编由中国农业科学院茶叶研究所陈宗懋院士与美国伊利诺伊理工大学Brian Schaneberg博士共同担任。目前期刊已被Scopus、CABI等国际知名大型数据库收录。
期刊官网:
www.maxapress.com/bpr
投稿链接:
mc03.manuscriptcentral.com/bevpr
关注园艺植物研究
园艺植物研究公众号专注于园艺植物(果树、蔬菜、观赏植物、饮料植物、药用植物等)领域的最新研究进展,点击下方名片关注园艺植物研究!