SV 是结构变异(Structural Variation)的缩写,是指在基因组中发生的较大、较复杂的结构性变异,通常包括插入、删除、倒位和复制等类型。SV 与单核苷酸多态性(Single Nucleotide Polymorphism, SNP)相比,其变异的区域更大,更容易对基因功能和表达产生影响.细菌 SV 结果是对比两个或多个细菌基因组的差异分析结果,可以用于研究不同菌株之间的差异、进化关系、毒力和耐药性等方面。
如无特殊说明,以下内容中的“*”代表目标物种的样品名
SV
├── *.fna*genomes.txt[中间文件] ├── **.sv.dot.png【SV点图,相关解释见共线性分析】 ├── * *.sv.dot.svg【SV点图,相关解释见共线性分析】 ├── **.sv.out【SV结果文件】 ├── **.sv.png【SV结果文件图】 ├── *_*.sv.summary[SV类型汇总] └── **.sv.vcf【SV结果文件VCF格式】
制表符分割的文本文档,使用 excel 打开。文件内容实例如下:
文件各列内容说明如下:
列编号 | 说明 |
---|---|
1 | 参考基因组中的染色体ID |
2 | 参考基因组中的起始位置(基于1,包括起始位置) |
3 | 参考基因组中的终止位置(基于1,包括终止位置) |
4 | 参考序列(仅适用于SNP和indel) |
5 | 查询序列(仅适用于SNP和indel) |
6 | 查询中染色体ID |
7 | 查询中的起始位置(基于1,包括起始位置) |
8 | 查询中的终止位置(基于1,包括终止位置) |
9 | 唯一ID(注释类型+编号) |
10 | 父ID(注释类型+编号) |
11 | 注释类型 |
12 | 拷贝状态(用于复制) |
在这里,注释类型可以具有以下含义:
注释类型 | 含义 | 注释类型 | 含义 |
---|---|---|---|
SYN | 同源区域 | SYNAL | 同源区域内的比对 |
INV | 翻转区域 | INVAL | 翻转区域内的比对 |
TRANS | 转位区域 | TRANSAL | 转位区域内的比对 |
INVTR | 翻转转位区域 | INVTRAL | 翻转转位区域内的比对 |
DUP | 重复区域 | DUPAL | 重复区域内的比对 |
INVDP | 翻转重复区域 | INVDPAL | 翻转重复区域内的比对 |
NOTAL | 未比对区域 | SNP | 单核苷酸多态性 |
CPG | 查询中的拷贝增加 | CPL | 查询中的拷贝减少 |
HDR | 高度分化的区域 | TDM | 串联重复 |
INS | 查询中的插入 | DEL | 查询中的删除 |
类型汇总,tsv打开方式。使用 excel 打开。
SV结果文件信息已转换为 VCF (v4.3) 文件格式。然而,由于 VCF 基于参考基因组位置,我们不会在 VCF 文件中输出查询基因组中未对齐的区域,因为不可能将它们写入参考基因组中的位置上下文中。
可以很直白的看出参考基因组和查询基因组序列的变异情况。