噬菌体结果注释结果说明结果简介 目录结构格式说明 *_phage.fasta -噬菌体结果文件,fasta格式*_prophage_coordinates.tsv -噬菌体结果预测文件*_prophage.gff3-噬菌体结果文件,gff格式*_prophage.tsv-噬菌体结果位置信息常用格式FASTA 格式
整合在宿主基因组上的温和噬菌体的核酸称之为前噬菌体。
通过软件 phiSpy 预测前噬菌体。
如无特殊说明,以下内容中的“*”代表目标物种的样品名。
Prophage ├── *phage.fasta 【噬菌体结果文件,fasta格式】 ├──*prophage_coordinates.tsv 【噬菌体结果预测文件】 ├──*prophage.gff3【噬菌体结果文件,gff格式】 └──*prophage.tsv【噬菌体结果位置信息】
根据预测的前噬菌体的位置,从基因组序列中截取的前噬菌体序列。FASTA 文件,可用文本编辑器打开。
格式实例详细说明见【4 常用格式】中【4.1 FASTA 格式】部分
包含了溶源噬菌体的id,contig,起始位置,终止位置和att区域。
制表符分割的文本文档,使用 excel 打开。
文件内容举例如下:
文件内容说明如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | ppid | 噬菌体编号 |
2 | contig | 噬菌体所在的重叠群 |
3 | start | 噬菌体的起始位置 |
4 | stop | 噬菌体的停止位置 |
5 | start_attL | 如果我们可以检测到att站点,则附加列为:attL开始; |
6 | end_attL | 结束; |
7 | start_attR | attR的开始; |
8 | end_attR | 结束; |
9 | sequence_attL | attL位点序列 |
10 | sequence_attR | attR位点序列 |
11 | explanation | 解释为什么为这个噬菌体选择这个att站点。 |
这是GFF3的噬菌体信息。与*_prophage_coordinates.tsv相对应。
格式实例详细说明见gff3链接。
包含了溶源噬菌体的id,contig,起始位置,终止位置和att区域。
制表符分割的文本文档,使用 excel 打开。
FASTA 格式(又称为 Pearson 格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注释。序列文件的第一行是由大于号">"或分号";"打头的任意文字说明(习惯常用">"作为 起始),用于序列标记。从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号。通常核苷酸符号大小写均可,而氨基 3 酸常用大写字母。如:
>Prophage_1_Scaffold1_1405541_1494989 TGCCAAAAGGATCAGGCAAAGTATTATCGCAAAACAAAAAAGCAAACCATGATTACTTTATAGAAGAAACCTATGAAACAGGCATCG TGCTGCAGGGAACGGAGATTAAGTCCATCCGC