SV结果说明

结果简介

SV 是结构变异(Structural Variation)的缩写,是指在基因组中发生的较大、较复杂的结构性变异,通常包括插入、删除、倒位和复制等类型。SV 与单核苷酸多态性(Single Nucleotide Polymorphism, SNP)相比,其变异的区域更大,更容易对基因功能和表达产生影响.细菌 SV 结果是对比两个或多个细菌基因组的差异分析结果,可以用于研究不同菌株之间的差异、进化关系、毒力和耐药性等方面。

如无特殊说明,以下内容中的“*”代表目标物种的样品名

目录结构

SV

├── *.fna*genomes.txt[中间文件] ├── **.sv.dot.png【SV点图,相关解释见共线性分析】 ├── * *.sv.dot.svg【SV点图,相关解释见共线性分析】 ├── **.sv.out【SV结果文件】 ├── **.sv.png【SV结果文件图】 ├── *_*.sv.summary[SV类型汇总] └── **.sv.vcf【SV结果文件VCF格式】

格式说明

*_*.sv.out-SV结果文件

制表符分割的文本文档,使用 excel 打开。文件内容实例如下:

image-20230613151833968

文件各列内容说明如下:

列编号说明
1参考基因组中的染色体ID
2参考基因组中的起始位置(基于1,包括起始位置)
3参考基因组中的终止位置(基于1,包括终止位置)
4参考序列(仅适用于SNP和indel)
5查询序列(仅适用于SNP和indel)
6查询中染色体ID
7查询中的起始位置(基于1,包括起始位置)
8查询中的终止位置(基于1,包括终止位置)
9唯一ID(注释类型+编号)
10父ID(注释类型+编号)
11注释类型
12拷贝状态(用于复制)

在这里,注释类型可以具有以下含义:

注释类型含义注释类型含义
SYN同源区域SYNAL同源区域内的比对
INV翻转区域INVAL翻转区域内的比对
TRANS转位区域TRANSAL转位区域内的比对
INVTR翻转转位区域INVTRAL翻转转位区域内的比对
DUP重复区域DUPAL重复区域内的比对
INVDP翻转重复区域INVDPAL翻转重复区域内的比对
NOTAL未比对区域SNP单核苷酸多态性
CPG查询中的拷贝增加CPL查询中的拷贝减少
HDR高度分化的区域TDM串联重复
INS查询中的插入DEL查询中的删除

*_*.sv.summary-SV类型汇总

类型汇总,tsv打开方式。使用 excel 打开。

**.sv.vcf-SV结果文件VCF格式

SV结果文件信息已转换为 VCF (v4.3) 文件格式。然而,由于 VCF 基于参考基因组位置,我们不会在 VCF 文件中输出查询基因组中未对齐的区域,因为不可能将它们写入参考基因组中的位置上下文中。

 

*_*.sv.png-SV结果文件图

可以很直白的看出参考基因组和查询基因组序列的变异情况。

目录