Nanopore 纳米孔 测序数据处理 微生物 16S全长 Centrifuge的安装和使用

linux Centrifuge 纳米孔测序 微生物 16S全长

EPI2ME在线网站处理

差不多2021.6这之前不用注册,后面要注册了。而且只对购买仪器的开发-555-

操作流程官方学习网站github

操作流程官方学习网站Centrifuge指南

官网也描述到用Centrifuge分类物种

Nanopore 纳米孔 测序数据处理 微生物 16S全长 Centrifuge的安装和使用
Nanopore 纳米孔 测序数据处理 微生物 16S全长 Centrifuge的安装和使用

本地服务器处理如下流程:

① 拿到公司提供给你fastq格式文件,进行barcode和质量过滤,裁剪,这部分参考宏基因组处理吧。我自己用了NanoFilt处理,FastQC质量评估

② 下载安装 github下载

网络不行就直接下载,解压后,拉进去服务器,体积小,很快。
切换到拉进去的文件夹 设置安装在的目录 /home/XXX/

设置PATH环境变量,也是启动软件的命令

③ 根据需求下载参考的序列的数据库 indexes下载地址

下面画红色的地方,找到你对应要的,16S直接右边的bacteria
== 建议用迅雷破解版的等等下载,15M每秒,比较快==

Nanopore 纳米孔 测序数据处理 微生物 16S全长 Centrifuge的安装和使用
Nanopore 纳米孔 测序数据处理 微生物 16S全长 Centrifuge的安装和使用
不能直接去掉那些hit小于500的,这些应该定义为unassigned。
bug提示,需要变量需要character

⑦ result.tsv的理解:readID重复的次数等于numMatches的个数(所以我们提取result的报告需要将numMatches全部转化成1);seqID对应准确的taxonomy(但readID的hit是不同的,通过过滤hit,将相同的taxonomy合起来),而相同的readID对应不同的seqID(注意他们的hit是相同的,这里说明序列可能错误比对上多个物种的可能,而numMatces说明这个序列seqID比对上的多个,{下图3},说明分配到种水平是不准确的,只能处理到属水平)

所以需要将numMatches全部转化成1。然后在seqID匹配上taxonomy。

Nanopore 纳米孔 测序数据处理 微生物 16S全长 Centrifuge的安装和使用
Nanopore 纳米孔 测序数据处理 微生物 16S全长 Centrifuge的安装和使用

继续⑦, 去掉重复匹配到多个种水平的序列后,==测序量的read序列数。24690

来源:qsub

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年8月19日
下一篇 2021年8月19日

相关推荐