功能注释结果统计
使用Eggnog数据库对Trinity组装得到的转录本进行功能注释。注释到的数据库包含以下类型:
- query: trinity组装得到的基因ID
- seed_ortholog: 预测到的正交群(ortholog)的标识符
- evalue: 正交群与序列的比对期望值(E-value),用于评估比对结果的显著性
- score: 正交群与序列的比对得分,表示它们之间的相似程度
- eggNOG_OGs: Orthologous Group (OG) 号码,用于标识正交群
- max_annot_lvl: 与正交群关联的分类学信息,例如物种或分类单元
- COG: Clusters of Orthologous Groups (COG) 号码,用于描述基因和蛋白质的进化关系
- description: 序列的描述信息或注释概述
- Preferred_name: 既gene symbol
- GOs: Gene Ontology (GO) 注释,用于描述基因功能、细胞组分和生物过程的术语
- EC: Enzyme Commission (EC) 号码,用于标识酶的催化功能
- KEGG_ko: KEGG Orthology (KO) 标识符,用于标记与KEGG数据库中代谢通路和功能相关的基因
- KEGG_Pathway: 代谢通路的注释信息
- KEGG_Module: 代谢模块的注释信息
- KEGG_Reaction: 参与的生物反应的注释信息
- KEGG_rclass: 反应类别的注释信息
- BRITE: BRITE 层次结构的注释信息,用于描述生物实体的层次分类
- KEGG_TC: Transporter Classification (TC) 号码,用于标识膜转运蛋白的分类
- CAZy: 碳水化合物活性酶库(Carbohydrate-Active enZYmes)的注释信息,包括能催化碳水化合物降解、修饰、以及生物合成的相关酶系家族
- BiGG_Reaction: Biochemical, Genetic, and Genomic (BiGG) 数据库的注释信息
- PFAM是一个用于识别和注释蛋白质家族的数据库。它将具有相似结构和功能的蛋白质归类到相同的家族中
对常用的数据库COG_category,GOs,EC,KEGG_ko,CAZy,BiGG_Reaction,PFAMs注释信息进行统计,结果如下UpSet图所示。