菌种鉴定结果说明

结果简介

细菌鉴定是指将未知细菌按生物学特征放入系统中某一适当位置和已知菌种比较其相似性,并通过对比分析方法确定细菌分类地位的过程。细菌鉴定方法包括生化鉴定、核酸检测、血清学鉴定、自动化仪器鉴定及质谱技术等。

使用Prokka预测的所有16s序列结果与SILVA-16S数据库进行blastn得到结果。同时,使用物种分类号(默认:16s物种分类)从NCBI上下载同分类号的基因组序列(下载最多十个)。将组装好的序列与下载的基因组进行比较ANI,AAI和TETRA,以确定组装出来的基因组物种归属。 ANI和TETRA是通过pyani得到的(使用默认参数:-m ANIb 和-m TETRA),AAI是通过CompareM得到的(使用默认参数:aai_wf)。

如无特殊说明,以下内容中的“*”代表目标物种的样品名。

目录结构

04.Bac_is_species/ ├── 16s_ani_sum.tsv 【所有样本基因组16s与ani结果】 ├── all_bac_taxid_16s.txt 【所有样本16s统计结果】 ├── * │ ├── ncbi_ftp_list.tsv 【ncbi下载地址文件】 │ ├── win_rename.bat 【window10重命名脚本】 │ ├── mac_lunix_rename.sh 【mac/lunix重命名脚本】 │ └── 16s_ANI 【ANI结果文件夹】 │ ├── aai_heatmap.svg【aai热图】 │ ├── aai_matrix.tsv 【aai矩阵表】 │ ├── aai_summary.tsv 【aai汇总表】 │ ├── ANIb_percentage_identity.pdf 【ani汇总图】 │ ├── ANIb_percentage_identity.png 【ani汇总图】 │ ├── ANIb_percentage_identity.tab【ani汇总表】 │ ├── TETRA_correlations.pdf【 TETRA汇总图】 │ ├── TETRA_correlations.png【TETRA汇总图】 │ └── TETRA_correlations.tab【TETRA汇总表】

格式说明

ncbi_ftp_list.tsv -ncbi下载地址文件

制表符分割的文本文档,使用 excel 打开。

文件内容举例如下:

image-20230423170457303

文件内容说明如下:

列数列标题说明
1final_name最后使用的文件名
2assembly_idncbi登陆号
3ftp_pathncbi下载地址

其中第三列为ftp_path,ncbi下载地址,老师可以使用该列链接地址通过浏览器或迅雷等下载地址下载文件,并通过我们提供的重命名脚本将下载的文件重命名。

win_rename.bat -windows重命名脚本

重命名脚本,在win10/11版本测试通过。将本脚本移动到通过ncbi_ftp地址下载文件夹内,双击(或使用管理员权限运行)脚本。

mac_lunix_rename.sh -mac/lunix重命名脚本

重命名脚本,在win10/11版本测试通过。将本脚本移动到下载文件夹内,打开终端后将此脚本添加可执行权限后运行脚本可自动重命名下载文件。

all_bac_taxid_16s.txt – 所有样本16s统计结果

制表符分割的文本文档,使用 excel 打开。

文件内容举例如下:

image-20230407144449378

文件内容说明如下:

列数列标题说明
1sampleID样本名
216S_id16s序列编号
316S_start16S序列在染色体开始位置(bp)
416S_end16S序列在染色体结束位置(bp)
5species_name16s序列鉴定得出的物种名
6taxidNCBI物种分类号

 

all_bac_taxid_16s.txt-所有样本基因组16s与ani结果

制表符分割的文本文档,使用 excel 打开。

文件内容举例如下:

image-20230407150442637

 

文件内容说明如下:

列数列标题说明
1sampleID样本名
216s_median_ANI(%)ANI 结果中位数
316s_median_AAI(%)AAI 结果中位数
416s_median_TETRA(%)TETRA结果中位数
516s_max_ANI_strians(max_ANI_score(%))ANI结果最大的菌株名(ANI得分) ; 菌株名其名称构成为Reference Sequence ID+ 物种名(属名首字母+种名前四个字母)+菌株名(前四个字母)
616s_is_same_species与16s结果是否一致 :与16s结果是否一致按照max_ANI_score(%)是否大于95判断,若大于95则是True。此结果只做一个参考,不做最终结果
7species_name16s序列鉴定得出的物种名
8taxidNCBI物种分类号

若ANI结果和16s一致,则第六列16s_is_same_species为True。

aai_heatmap.svg-aai热图

svg格式图片,使用图片浏览器打开。

文件内容举例如下:

aai_heatmap

 

如图,样本在图中表示为 final.assembly。可以直接看样本与其他基因组AAI的比值。

aai_matrix.tsv -aai矩阵表

制表符分割的文本文档,使用 excel 打开。 与aai_heatmap.svg文件相对应。

文件内容举例如下:

image-20230407152842777

aai_summary.tsv -aai汇总表

制表符分割的文本文档,使用 excel 打开。 与aai_heatmap.svg文件相对应。

文件内容举例如下:

image-20230407153829134

文件内容说明如下:

列数列标题说明
1#Genome A第一个基因组的标识符
2Genes in A第一个基因组中的基因数量
3Genome B第二个基因组的标识符
4Genes in B第二基因组中的基因数量
5# orthologous genes在两个基因组之间鉴定出的直系同源基因的数量
6Mean AAI直系同源基因的平均氨基酸同一性(AAI)
7Std AAIAAI在直系同源基因中的标准差
8Orthologous fraction (OF)两个基因组之间的直系同源分数(OF)定义为直系同源基因的数量除以任一基因组中的最小基因数

ANIb_percentage_identity.pdf -ani汇总图

图片展示内容与ANIb_percentage_identity.png 一样。

ANIb_percentage_identity.png -ani汇总图

PNG 格式,用图片浏览器打开。

图片示例如下:

ANIb_percentage_identity

如图,样本在图中表示为 final.assembly。ANI结果大小见左上方图例,通常若是同种物种(ANI>95%)在热图表现为红色。

ANIb_percentage_identity.tab-ani汇总表

制表符分割的文本文档,使用 excel 打开。 与ANIb_percentage_identity.png文件相对应。

文件内容举例如下:

image-20230407161030446

TETRA_correlations.pdf- TETRA汇总图

图片展示内容与TETRA_correlations.png 一样。

TETRA_correlations.png -TETRA汇总图

PNG 格式,用图片浏览器打开。

图片示例如下:

TETRA_correlations 如图,样本在图中表示为 final.assembly。ANI结果大小见左上方图例,通常若是同种物种(ANI>95%)在热图表现为红色。

TETRA_correlations.tab-TETRA汇总表

制表符分割的文本文档,使用 excel 打开。 与TETRA_correlations.png 文件相对应。

文件内容举例如下:

image-20230407161310425

目录