目前提供注释的通用功能数据库主要有GO、KEGG、COG、NR、Pfam、TCDB和Swiss-Prot等。 功能注释基本步骤如下: 1)将预测基因的蛋白序列与各功能数据库进行Diamond 比对(evalue ≤ 1e-5); 2)比对结果过滤:对于每一条序列的比对结果,选取 score 最高的比对结果(默认identity>=40%,coverage>=40%)进行注释。 本项目进行的编码基因的注释结果统计如下图所示: