├── all_assembly_stats.xls[最终组装结果统计结果]
├── all_sample_gc_depth_stat.xls[基因组gc_depth估计结果统计表]
├── all_sample_genomesize_stat.xls[基因组大小估计结果统计表]
│   ├──*.final.assembly.fasta[最终组装序列]
│   ├──*.final.stat.xls[统计文件]
│   ├── genome_gc_depth[GC-Depth分析文件夹]
│   │   ├──*.gc_depth_describe.txt[GC-Depth分析及污染评估的文字描述]
│   │   ├──*.gc_depth.pdf[GC-Depth图片,pdf格式]
│   │   └──*.gc_depth.png[GC-Depth图片,png格式]
│   └── genome_size[基因组大小评估分析文件夹]
│       ├── plot.png[基因组大小评估分析文件结果图]
│       └── summary.txt[基因组大小评估分析文件夹结果]

使用unicycler[2]软件(默认参数:--keep 0 --min_fasta_length 1000),以质控后的clean data作为输入数据,做基因组组装。 组装出来的基因组序列文件请查看*final.assembly.fasta文件。

表2-1-1 样品基因组组装结果统计(all_assembly_stats.xls )

sampleID contigs Total contig length Contig N50 Largest contig GC content %
C1 117 4863531 187445 398091 50.64
C2 117 4863531 187445 398091 50.64
Z1 113 3971325 209062 453425 38.93

  1. Sample ID: 样本ID
  2. Type:类型,质粒或染色体;
  3. Contig ID:序列ID;
  4. Size(bp):序列长度
  5. GC%:GC含量

基因组大小是指单倍体细胞核中的所含的DNA的总量。预测未知基因组大小的方法可以通过 Illumina 测序数据的 k-mer 分析进行估计。

表2-2-1 基因组大小估计结果统计表(all_sample_genomesize_stat.xls)

sampleID Heterozygosity Genome_Haploid_Length
C1 0.08 4970504.0
C2 0.08 4970504.0
Z1 0.37 3635336.0

  1. sampleID: 样本ID
  2. Heterozygosity:杂合率
  3. Genome_Haploid_Length(bp):基因组大小


表2-2-2 基因组GC_depth分析结果(all_sample_gc_depth_stat.xls)

sampleID ill_depth ill_reslut
C1 175 样本无明显污染
C2 175 样本无明显污染
Z1 438 样本无明显污染

  1. sampleID: 样本ID
  2. ill_depth:二代测序数据测序深度
  3. ill_reslut:二代测序数据GC_depth分析结果


软件 版本
quast 2.1.5
unicycler 2.2.1
bwa 0.7.17-r1188
Jellyfish 1
GenomeScope V1


