T3SS 注释结果说明结果简介 目录结构格式说明*.isnot_secretion.faa-不是T3SS分泌蛋白,fasta格式*.is_secretion.faa-T3SS分泌蛋白,fasta格式*.secretion.sum.xls-EffectiveT3 软件预测结果统计*.t3ss.txt-EffectiveT3 软件预测结果文件常用格式 FASTA 格式
III 型分泌系统(Type III secretion system,T3SS)主要是革兰氏阴性菌的分泌蛋白分泌到细胞外的运输途径,因此 III 型分泌系统效 应蛋白(Type III secretion system Effector protein)与革兰氏阴性致病菌致病机理有关。
使用软件 EffectiveT3 对输入的氨基酸序列进行预测,通过其内部特定的计算模型对每条氨基酸序列进行评分,分值越高,可信度越高,选出评分高于阈值的序列,认为这些序列为 III 型分泌系统效应蛋白。
如无特殊说明,以下内容中的“*”代表目标物种的样品名。
T3SS/ ├──*.isnot_secretion.faa【不是T3SS分泌蛋白,fasta格式】 ├──*.is_secretion.faa【T3SS分泌蛋白,fasta格式】 ├──*.secretion.sum.xls【EffectiveT3 软件预测结果统计】 └──*.t3ss.txt【EffectiveT3 软件预测结果文件】
FASTA 文件,可用文本编辑器打开。
格式实例详细说明见【4 常用格式】中【4.1 FASTA 格式】部分
FASTA 文件,可用文本编辑器打开。
格式实例详细说明见【4 常用格式】中【4.1 FASTA 格式】部分
制表符分割的文本文档,使用 excel 打开。
文件内容举例如下
文件内容说明如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | all_pep_sum_num | 目标物种的基因总个数 |
2 | true_secret_nums | 预测为 III 型分泌系统效应蛋白的个数 |
3 | false_secret_nums | 预测为非 III 型分泌系统效应蛋白的个数。 |
以“;”分割的文本文档,使用 excel 打开。
文件内容举例如下
文件内容说明如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | Id | 目标物种的氨基酸序列的 ID,编号的有效字符有[a-zA-Z0-9.:^x!+_?- |
2 | Description | 软件 EffectiveT3 预测的分值,取值范围为[-1, 1] |
3 | Score | 软件 EffectiveT3 预测的分值,取值范围为[-1, 1] |
4 | is secreted | 软件 EffectiveT3 预测结果判定(TRUE 或 FALSE)。 |
FASTA 格式(又称为 Pearson 格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。序列文件的第一行是由大于号">"或分号";"打头的任意文字说明(习惯常用">"作为 起始),用于序列标记。从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号。通常核苷酸符号大小写均可,而氨基 3 酸常用大写字母。如:
>Prophage_1_Scaffold1_1405541_1494989 TGCCAAAAGGATCAGGCAAAGTATTATCGCAAAACAAAAAAGCAAACCATGATTACTTTATAGAAGAAACCTATGAAACAGGC