菌种鉴定结果说明 结果简介 目录结构 格式说明ncbi_ftp_list.tsv -ncbi下载地址文件 win_rename.bat -windows重命名脚本mac_lunix_rename.sh -mac/lunix重命名脚本all_bac_taxid_16s.txt – 所有样本16s统计结果all_bac_taxid_16s.txt-所有样本基因组16s与ani结果aai_heatmap.svg-aai热图aai_matrix.tsv -aai矩阵表aai_summary.tsv -aai汇总表ANIb_percentage_identity.pdf -ani汇总图ANIb_percentage_identity.png -ani汇总图ANIb_percentage_identity.tab-ani汇总表TETRA_correlations.pdf- TETRA汇总图TETRA_correlations.png -TETRA汇总图TETRA_correlations.tab-TETRA汇总表
细菌鉴定是指将未知细菌按生物学特征放入系统中某一适当位置和已知菌种比较其相似性,并通过对比分析方法确定细菌分类地位的过程。细菌鉴定方法包括生化鉴定、核酸检测、血清学鉴定、自动化仪器鉴定及质谱技术等。
使用Prokka预测的所有16s序列结果与SILVA-16S数据库进行blastn得到结果。同时,使用物种分类号(默认:16s物种分类)从NCBI上下载同分类号的基因组序列(下载最多十个)。将组装好的序列与下载的基因组进行比较ANI,AAI和TETRA,以确定组装出来的基因组物种归属。 ANI和TETRA是通过pyani得到的(使用默认参数:-m ANIb 和-m TETRA),AAI是通过CompareM得到的(使用默认参数:aai_wf)。
如无特殊说明,以下内容中的“*”代表目标物种的样品名。
04.Bac_is_species/ ├── 16s_ani_sum.tsv 【所有样本基因组16s与ani结果】 ├── all_bac_taxid_16s.txt 【所有样本16s统计结果】 ├── * │ ├── ncbi_ftp_list.tsv 【ncbi下载地址文件】 │ ├── win_rename.bat 【window10重命名脚本】 │ ├── mac_lunix_rename.sh 【mac/lunix重命名脚本】 │ └── 16s_ANI 【ANI结果文件夹】 │ ├── aai_heatmap.svg【aai热图】 │ ├── aai_matrix.tsv 【aai矩阵表】 │ ├── aai_summary.tsv 【aai汇总表】 │ ├── ANIb_percentage_identity.pdf 【ani汇总图】 │ ├── ANIb_percentage_identity.png 【ani汇总图】 │ ├── ANIb_percentage_identity.tab【ani汇总表】 │ ├── TETRA_correlations.pdf【 TETRA汇总图】 │ ├── TETRA_correlations.png【TETRA汇总图】 │ └── TETRA_correlations.tab【TETRA汇总表】
制表符分割的文本文档,使用 excel 打开。
文件内容举例如下:
文件内容说明如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | final_name | 最后使用的文件名 |
2 | assembly_id | ncbi登陆号 |
3 | ftp_path | ncbi下载地址 |
其中第三列为ftp_path,ncbi下载地址,老师可以使用该列链接地址通过浏览器或迅雷等下载地址下载文件,并通过我们提供的重命名脚本将下载的文件重命名。
重命名脚本,在win10/11版本测试通过。将本脚本移动到通过ncbi_ftp地址下载文件夹内,双击(或使用管理员权限运行)脚本。
重命名脚本,在win10/11版本测试通过。将本脚本移动到下载文件夹内,打开终端后将此脚本添加可执行权限后运行脚本可自动重命名下载文件。
制表符分割的文本文档,使用 excel 打开。
文件内容举例如下:
文件内容说明如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | sampleID | 样本名 |
2 | 16S_id | 16s序列编号 |
3 | 16S_start | 16S序列在染色体开始位置(bp) |
4 | 16S_end | 16S序列在染色体结束位置(bp) |
5 | species_name | 16s序列鉴定得出的物种名 |
6 | taxid | NCBI物种分类号 |
制表符分割的文本文档,使用 excel 打开。
文件内容举例如下:
文件内容说明如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | sampleID | 样本名 |
2 | 16s_median_ANI(%) | ANI 结果中位数 |
3 | 16s_median_AAI(%) | AAI 结果中位数 |
4 | 16s_median_TETRA(%) | TETRA结果中位数 |
5 | 16s_max_ANI_strians(max_ANI_score(%)) | ANI结果最大的菌株名(ANI得分) ; 菌株名其名称构成为Reference Sequence ID+ 物种名(属名首字母+种名前四个字母)+菌株名(前四个字母) |
6 | 16s_is_same_species | 与16s结果是否一致 :与16s结果是否一致按照max_ANI_score(%)是否大于95判断,若大于95则是True。此结果只做一个参考,不做最终结果 |
7 | species_name | 16s序列鉴定得出的物种名 |
8 | taxid | NCBI物种分类号 |
若ANI结果和16s一致,则第六列16s_is_same_species为True。
svg格式图片,使用图片浏览器打开。
文件内容举例如下:
如图,样本在图中表示为 final.assembly。可以直接看样本与其他基因组AAI的比值。
制表符分割的文本文档,使用 excel 打开。 与aai_heatmap.svg文件相对应。
文件内容举例如下:
制表符分割的文本文档,使用 excel 打开。 与aai_heatmap.svg文件相对应。
文件内容举例如下:
文件内容说明如下:
列数 | 列标题 | 说明 |
---|---|---|
1 | #Genome A | 第一个基因组的标识符 |
2 | Genes in A | 第一个基因组中的基因数量 |
3 | Genome B | 第二个基因组的标识符 |
4 | Genes in B | 第二基因组中的基因数量 |
5 | # orthologous genes | 在两个基因组之间鉴定出的直系同源基因的数量 |
6 | Mean AAI | 直系同源基因的平均氨基酸同一性(AAI) |
7 | Std AAI | AAI在直系同源基因中的标准差 |
8 | Orthologous fraction (OF) | 两个基因组之间的直系同源分数(OF)定义为直系同源基因的数量除以任一基因组中的最小基因数 |
图片展示内容与ANIb_percentage_identity.png 一样。
PNG 格式,用图片浏览器打开。
图片示例如下:
如图,样本在图中表示为 final.assembly。ANI结果大小见左上方图例,通常若是同种物种(ANI>95%)在热图表现为红色。
制表符分割的文本文档,使用 excel 打开。 与ANIb_percentage_identity.png文件相对应。
文件内容举例如下:
图片展示内容与TETRA_correlations.png 一样。
PNG 格式,用图片浏览器打开。
图片示例如下:
如图,样本在图中表示为 final.assembly。ANI结果大小见左上方图例,通常若是同种物种(ANI>95%)在热图表现为红色。
制表符分割的文本文档,使用 excel 打开。 与TETRA_correlations.png 文件相对应。
文件内容举例如下: