GO注释结果说明结果简介 目录结构格式说明 *.gene.go.txt – GO 注释结果按基因汇总 *.go.txt – GO 注释结果按分类汇总*.png - GO 分类统计图 *.pdf - GO 分类统计图,pdf格式
GO 的全称是 Gene Ontology,1988 年由基因本体联合会创立基因本体论数据库,其分为三大类:1)细胞学组件(Cellular Component): 用于描述亚细胞结构、位置和大分子复合物,如核仁、端粒和识别起始的复合物等;2)分子功能(Molecular Function):用于描述基因、 基因产物个体的功能,如与碳水化合物结合或 ATP 水解酶活性等;3)生物学途径(Biological Process):用于描述分子功能的有序组合, 达成更广的生物功能,如有丝分裂或嘌呤代谢等。
使用emapper注释工具,将细菌基因组prokka注释结果中的.faa文件的基因蛋白序列作为query查询序列,到eggnog蛋白数据库做比对搜索,获得GO注释信息,用R语言做分类统计。
GO ├── *.gene_go.txt 【GO 注释结果按基因汇总】 ├── *.go.txt 【GO 注释结果按分类汇总】 ├── *.pdf 【GO 分类统计图,pdf格式】 └── *.png 【GO 分类统计图】
用制表符分割的文本文档,用 excel 打开。
主要展示基因的 GO 注释结果,按基因汇总,实例如下图
文件内容说明如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | Gene_id | 基因 ID |
2 | GO_number | 该基因注释到的 GO 编号个数 |
3 | GO_id; GO_description; GO_class | GO 数据库注释,用分号分割,包括 GO 编号,GO 功能说明,GO 高级分类。每列为一个 GO 注释结果 |
用制表符分割的文本文档,用 excel 打开。
主要展示基因的 GO 注释结果,按分类汇总,实例如下图:
文件内容说明如下
行数 | 说明 |
---|---|
1 | GO 二级分类 |
2 | 相应功能上的基因数目 |
PNG 格式,用图片浏览器打开。
图片示例如下:
图中右边为图例,给出对应样品注释上的三个 GO 本体学一级分类下的 GO 功能分类; 纵坐标为 GO 功能分类,不同颜色对应右边不同的类型,横坐标为基因的个数
图片展示内容与*.png 一样。