TCDB注释结果说明结果简介 目录结构格式说明*.TCDB.anno.tsv-TCDB结果注释文件*.TCDB.family.catalog.tsv-TCDB 三级家族分类统计列表*.TCDB.m8.txt- TCDB 数据库进行 BLAST 比对结果*.TCDB.sumInfo.txt- TCDB 一级分类统计列表tcdb_summed_up_summary.pdf-TCDB 一级分类统计图tcdb_summed_up_summary.png-TCDB 一级分类统计图常用格式m8 文件
TCDB,全称是 Transporter Classification Database,转运蛋白分类数据库,是生物化学和分子生物学国际联盟(IUBMB)批准用于 膜转运蛋白,包括离子通道(ion channels)的分类系统(TC system)。该分类系统被设计成类似于酶分类的 EC 号系统,不同之处在于 它混合了功能的和系统发育的信,提供了 TC 编号、信息和超过 600 个转运蛋白家族的实例数据。转移系统以 5 个级别进行分类, 每个级别都对应于 TC 编号里的一个字母或数字,每个字母或数字都代表一个特定类型的转运蛋白。 TC 编号(TC#)通常包含 5 部分,每部分是一个字母或数字,分别以点分割,例如“V.W.X.Y.Z”。从左到右分类级别依次递增,V 是数字,代表 TC system 的第一级,也是最高级;W 是字母,代表 TC system 的第二级;X 是数字,代表 TC system 的第三级,对应于 转运蛋白家族分类信息;Y 是数字,代表 TC system 的第四级,对应于转运蛋白子家族;Z 是数字,代表 TC system 的第五级。可参考 http://www.tcdb.org/browse.php 的说明。
使用 Diamond 软件,把目标物种的氨基酸序列,与 TCDB 数据库进行比对,把目标物种的基因和其相对应的功能注释信息结合起来, 得到注释结果。由于每一条序列比对结果可能超过一条,为保证其生物意义,注释时保留一条最优比对结果作为该基因的注释。最后ᨀ 供的 Diamond 结果为 M8 格式,同时还提供部分数据库的注释结果汇总。
如无特殊说明,以下内容中的“*”代表目标物种的样品名
TCDB/ ├──*.TCDB.anno.tsv【TCDB结果注释文件】 ├──*.TCDB.family.catalog.tsv【TCDB 三级家族分类统计列表】 ├──*.TCDB.m8.txt 【 TCDB 数据库进行 BLAST 比对结果】 ├──*.TCDB.sumInfo.txt【 TCDB 一级分类统计列表】 ├── tcdb_summed_up_summary.pdf【TCDB 一级分类统计图】 └── tcdb_summed_up_summary.png【TCDB 一级分类统计图】
制表符分割的文本文档,使用 excel 打开。
文件内容举例如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | query_seq_id | 目标物种的氨基酸序列的 ID,编号的有效字符有[a-zA-Z0-9.:^x!+_?-] |
2 | TCDB_gene_id | 数据库序列ID |
3 | TC_number | TCDB编号 |
4 | Identity | 目标物种的氨基酸序列与数据库序列比对的 Identity 值。 |
5 | E_value | 目标物种的氨基酸序列与数据库序列比对的 E-value 值。 |
6 | bitscore | 目标物种的氨基酸序列与数据库序列比对的比对得分 |
7 | TCDB_gene_discription | TCDB 功能描述 |
8 | Organism | 来源物种 |
9 | gene_name | 基因名 |
10 | NCBI_id | 来源物种NCBI分类号 |
制表符分割的文本文档,使用 excel 打开。
文件内容举例如下:
文件说明如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | TC_family | TCDB 三级家族分类。 |
2 | family_discription | 功能分类说明 |
3 | gene_number | 注释到对应功能分类的基因列表 |
4 | gene_ID_list | 注释到对应功能分类的基因列表 |
m8 格式,使用 excel 打开。
m8 格式详细说明见【4 常用格式】中【4.1 m8 文件】部分。
制表符分割的文本文档,使用 excel 打开。
分别统计 TCDB 一级分类的基因注释情况。文件内容举例如下
文件内容说明如下:
行数 | 说明 |
---|---|
1 | 一级分类类型 |
2 | 对应类型的总基因个数 |
图片展示内容与*.png 一样。
PNG 格式,用图片浏览器打开。
对应*.TCDB.sumInfo.txt文件。
图片示例如下:
格式为列表格式的 BLAST/ Diamond 比对结果。
m8 格式举例如下:
文件内容说明如下:
列数 | 说明 |
---|---|
1 | 目标物种的氨基酸序列的 ID,编号的有效字符有[a-zA-Z0-9.:^x!+_?-] |
2 | 数据库序列的 ID |
3 | 目标物种的氨基酸序列与数据库序列比对的 Identity 值 |
4 | 目标物种的氨基酸序列与数据库序列比对的长度 |
5 | 目标物种的氨基酸序列与数据库序列比对区域的比对错配数 |
6 | 目标物种的氨基酸序列与数据库序列比对区域的比对空位数。 |
7 | 目标物种的氨基酸序列的比对起始坐标 |
8 | 目标物种的氨基酸序列的比对终止坐标 |
9 | 数据库序列的比对起始坐标 |
10 | 数据库序列的比对终止坐标 |
11 | 目标物种的氨基酸序列与数据库序列比对的期望值 |
12 | 目标物种的氨基酸序列与数据库序列比对的比对得分 |