GO注释结果说明

结果简介

GO 的全称是 Gene Ontology,1988 年由基因本体联合会创立基因本体论数据库,其分为三大类:1)细胞学组件(Cellular Component): 用于描述亚细胞结构、位置和大分子复合物,如核仁、端粒和识别起始的复合物等;2)分子功能(Molecular Function):用于描述基因、 基因产物个体的功能,如与碳水化合物结合或 ATP 水解酶活性等;3)生物学途径(Biological Process):用于描述分子功能的有序组合, 达成更广的生物功能,如有丝分裂或嘌呤代谢等。

使用emapper注释工具,将细菌基因组prokka注释结果中的.faa文件的基因蛋白序列作为query查询序列,到eggnog蛋白数据库做比对搜索,获得GO注释信息,用R语言做分类统计。

目录结构

GO ├── *.gene_go.txt 【GO 注释结果按基因汇总】 ├── *.go.txt 【GO 注释结果按分类汇总】 ├── *.pdf 【GO 分类统计图,pdf格式】 └── *.png 【GO 分类统计图】

格式说明

*.gene.go.txt – GO 注释结果按基因汇总

用制表符分割的文本文档,用 excel 打开。

主要展示基因的 GO 注释结果,按基因汇总,实例如下图

image-20230406155718420

文件内容说明如下:

列数列标题说明
1Gene_id基因 ID
2GO_number该基因注释到的 GO 编号个数
3GO_id; GO_description; GO_classGO 数据库注释,用分号分割,包括 GO 编号,GO 功能说明,GO 高级分类。每列为一个 GO 注释结果

*.go.txt – GO 注释结果按分类汇总

用制表符分割的文本文档,用 excel 打开。

主要展示基因的 GO 注释结果,按分类汇总,实例如下图:

image-20230406160129733

文件内容说明如下

行数说明
1GO 二级分类
2相应功能上的基因数目

*.png - GO 分类统计图

PNG 格式,用图片浏览器打开。

图片示例如下:

BcG44big

图中右边为图例,给出对应样品注释上的三个 GO 本体学一级分类下的 GO 功能分类; 纵坐标为 GO 功能分类,不同颜色对应右边不同的类型,横坐标为基因的个数

*.pdf - GO 分类统计图,pdf格式

图片展示内容与*.png 一样。

目录