生信入门:序列比对之blast在线和本地使用

主要内容

1 背景

2 在线blast

3 本地blast

3.1 老版本blast

3.2 新版本blast

背景

序列比对(Sequence Alignment)的基本问题是比较两个或两个以上序列的相似性。

blast作为一种序列相似性比对工具,是生物信息分析最常用的一款软件,必须掌握。不管是做两序列相似性的简单比对,还是引物特异性、序列的来源等个性化分析,都会用到blast比对。许多看似高大上的基因分析,都可归类于序列间的比较,因此blast是生信分析中基础性的工具。

image

Nucleotide BLAST

核酸序列到核酸库中的一种查询,库中存在的每条已知序列都将同所查序列作一对一的核酸序列比对。

Protein BLAST

蛋白序列到蛋白库中的一种查询,库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。

BLASTX

核酸序列到蛋白库中的一种查询,先将核酸序列翻译成蛋白序列,再对翻译成的每一条序列作一对一的蛋白序列比对。

TBLASTN

蛋白序列到核酸库的一种查询,与BLASTX相反,它是将库中的核酸序列翻译成蛋白质序列,再对所查序列作蛋白与蛋白的比对。

我们点击“Nucleotide BLAST”后就到了blastn的初始界面,输入以下序列

GACGCGGCCGTCGAGGGCGCTCAGGTGGACTTCGACACCGCCAGCCGCATCGAGAGCCGCTACTTCACCCAGCTGGTCACCGGCCAGGTCGCCAAGAACATGATCCAGGCGTTCTTCTTCGACCTCCAGCACATCAACGGCGGCGGCTCCCGCCCCGAGGGCATCGAGCCGGTCAAGATCAACAAGATCGGTGTGCTCGGCGCGGGCATGATGGGCGCCGGCATCGCCTACGTCTCGGCCAAGGC

数据库可以有很多选择,默认是nr/nt库

image

发现这是一段来 Mycobacterium avium 的序列。

image.gif

可以选择 Somewhat similar sequences (blastn) 进行再次比对

image

本地blast

老版本blast

一些老的服务器上面自带的只有老版本的blast

很简单的两个步骤:formatdb 建库和 blast 比对

首先建库,把database.fasta这个序列文件变成blast专用的库,-p选项中的T是代表蛋白库,F是代表核酸库

然后需要用-p来选择比对程序,核酸比核酸是blastn

我们输出格式的m8,这个格式很重要,我们还可以设置-a控制cpu数量,和-e控制阈值等

新版本blast

也是两个步骤:makeblastdb 建库和 blast 比对

blastn比对

查看结果


感谢您的支持,欢迎点赞和转发!

长按下方二维码,即可关注 “基因的生物信息学分析”。

image

相关阅读

生信入门:Fasta与Fastq格式文件详解

生信入门:如何将测序原始数据上传NCBI

一文搞定细菌基因组De Novo测序分析

来源:基因的生物信息学分析

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年3月2日
下一篇 2020年3月2日

相关推荐