KEGG 全称为 Kyoto Encyclopedia of Genes and Genomes,1995 年由 Kanehisa Laboratories 推出 0.1 版,目前发展为一个综合性数据 库,其中最核心的为 KEGG PATHWAY 数据库。该数据库将生物通路划分为八大类,每一大类下还有细分,每一类均标示上与之相关的 基因,同时以图形的方式展示出来。通过该数据库注释,可以方便地寻找与行使某一类功能相关的所有注释上的基因。
使用emapper注释工具,将细菌基因组prokka注释结果中的.faa文件的基因蛋白序列作为query查询序列,到eggnog蛋白数据库做比对搜索,获得KEGG_Pathway_map_id注释信息,用R语言做分类统计。
KEGG ├── *.kegg.txt 【KEGG 注释结果按分类汇总】 ├── *.pdf 【KEGG 分类统计图,pdf格式】 └── *.png 【KEGG分类统计图】
用制表符分割的文本文档,用 excel 打开。
主要展示基因的 KEGG 注释结果,按分类汇总,实例如下图:
文件内容说明如下
行数 | 说明 |
---|---|
1 | KEGG 二级分类 |
2 | 相应功能上的基因数目 |
PNG 格式,用图片浏览器打开。
图片示例如下:
图中右边为图例,给出对应样品注释上的一级分类,纵坐标为注释到的KEGG pathway,横坐标为注释的基因个数。
图片展示内容与*.png 一样。