目前提供注释的通用功能数据库主要有GO、KEGG、COG、NR、Pfam、TCDB和Swiss-Prot等。
功能注释基本步骤如下:
1)将预测基因的蛋白序列与各功能数据库进行Diamond 比对(evalue ≤ 1e-5);
2)比对结果过滤:对于每一条序列的比对结果,选取 score 最高的比对结果(默认identity>=40%,coverage>=40%)进行注释。
本项目进行的编码基因的注释结果统计如下图所示:

图6-5-1 基因功能分析结果统计图

分析所用软件的版本

软件 版本

参考文献