KEGG注释结果说明

结果简介

KEGG 全称为 Kyoto Encyclopedia of Genes and Genomes,1995 年由 Kanehisa Laboratories 推出 0.1 版,目前发展为一个综合性数据 库,其中最核心的为 KEGG PATHWAY 数据库。该数据库将生物通路划分为八大类,每一大类下还有细分,每一类均标示上与之相关的 基因,同时以图形的方式展示出来。通过该数据库注释,可以方便地寻找与行使某一类功能相关的所有注释上的基因。

使用emapper注释工具,将细菌基因组prokka注释结果中的.faa文件的基因蛋白序列作为query查询序列,到eggnog蛋白数据库做比对搜索,获得KEGG_Pathway_map_id注释信息,用R语言做分类统计。

目录结构

KEGG ├── *.kegg.txt 【KEGG 注释结果按分类汇总】 ├── *.pdf 【KEGG 分类统计图,pdf格式】 └── *.png 【KEGG分类统计图】

格式说明

*.kegg.txt – KEGG 注释结果按分类汇总

用制表符分割的文本文档,用 excel 打开。

主要展示基因的 KEGG 注释结果,按分类汇总,实例如下图:

image-20230406160129733

文件内容说明如下

行数说明
1KEGG 二级分类
2相应功能上的基因数目

*.png - GO 分类统计图

PNG 格式,用图片浏览器打开。

图片示例如下:

img

图中右边为图例,给出对应样品注释上的一级分类,纵坐标为注释到的KEGG pathway,横坐标为注释的基因个数。

*.pdf - KEGG 分类统计图,pdf格式

图片展示内容与*.png 一样。

 

目录