噬菌体结果注释结果说明

结果简介

整合在宿主基因组上的温和噬菌体的核酸称之为前噬菌体。

通过软件 phiSpy 预测前噬菌体。

如无特殊说明,以下内容中的“*”代表目标物种的样品名。

目录结构

Prophage ├── *phage.fasta 【噬菌体结果文件,fasta格式】 ├──*prophage_coordinates.tsv 【噬菌体结果预测文件】 ├──*prophage.gff3【噬菌体结果文件,gff格式】 └──*prophage.tsv【噬菌体结果位置信息】

格式说明

*_phage.fasta -噬菌体结果文件,fasta格式

根据预测的前噬菌体的位置,从基因组序列中截取的前噬菌体序列。FASTA 文件,可用文本编辑器打开。

格式实例详细说明见【4 常用格式】中【4.1 FASTA 格式】部分

*_prophage_coordinates.tsv -噬菌体结果预测文件

包含了溶源噬菌体的id,contig,起始位置,终止位置和att区域。

制表符分割的文本文档,使用 excel 打开。

文件内容举例如下:

image-20230412154123925

文件内容说明如下:

列数列标题说明
1ppid噬菌体编号
2contig噬菌体所在的重叠群
3start噬菌体的起始位置
4stop噬菌体的停止位置
5start_attL如果我们可以检测到att站点,则附加列为:attL开始;
6end_attL结束;
7start_attRattR的开始;
8end_attR结束;
9sequence_attLattL位点序列
10sequence_attRattR位点序列
11explanation解释为什么为这个噬菌体选择这个att站点。

*_prophage.gff3-噬菌体结果文件,gff格式

这是GFF3的噬菌体信息。与*_prophage_coordinates.tsv相对应。

格式实例详细说明见gff3链接。

*_prophage.tsv-噬菌体结果位置信息

包含了溶源噬菌体的id,contig,起始位置,终止位置和att区域。

制表符分割的文本文档,使用 excel 打开。

常用格式

FASTA 格式

FASTA 格式(又称为 Pearson 格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。序列文件的第一行是由大于号">"或分号";"打头的任意文字说明(习惯常用">"作为 起始),用于序列标记。从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号。通常核苷酸符号大小写均可,而氨基 3 酸常用大写字母。如:

>Prophage_1_Scaffold1_1405541_1494989 TGCCAAAAGGATCAGGCAAAGTATTATCGCAAAACAAAAAAGCAAACCATGATTACTTTATAGAAGAAACCTATGAAACAGGCATCG TGCTGCAGGGAACGGAGATTAAGTCCATCCGC

目录