生物信息学软件_高通量测序技术|生信的发展,常用数据格式及分析软件

0e7a1eae76f678f920d960b7a3a965cb.png

02

FASTQ

fbd9c0a07d706cbb0f9d2e43b76931c8.png

SAM文件比对结果(record)部分,每一个read只占一行,从左到右被分为12列,分别记录信息如下:

(1)序列或者read的名称,例E00510:569:HCJWCCCX2:1:1104:31649:14265

(2)SMA标记(flag),例如163。为二进制数字,描述序列的比对模式、方向等信息,不同数字代表不同意思。

(3)read比对到的参考染色体。

  (4)   read在参考序列5’端起始位置。

(5)MAPQ,描述比对的质量,数字越大,特异性越高。

(6)CIGAR表示read比对的具体情况,记录插入、缺失及错配等比对信息。

(7)配对mate序列比对到的染色体号,“=”表示与该序列的在同一条染色体上,“*”表示该序列无配对序列。

(8)配对mate序列所在染色体上的位置。

(9)DNA模板的长度。

(10)read序列信息。

(11)read碱基质量信息。

(12)比对程序的标记(tag)信息。

04

VCF文件

VCF文件格式是用于描述单核苷酸变异(SNV)、插入或者缺失、结构变异(SV)、拷贝数变异(CNV)等变异的一种文件格式。目前大多数的变异检测软件输出的变异结果都是以VCF格式存储。

VCF文件分为两部分,第一部分为说明文件,第二部分为突变信息。

说明文件各行以2个“#”符号开头,内容是对正文INFO列出现的标签和FORMAT列中的基因型的解释说明。突变信息共10列。

96c4d67b8f3645804abb610fa1af69ec.png d1afa736ae408be4c5bce4a3f6e0600c.png

20201030  文库构建原理及特点

1dcd35ff95e94e9aafc04b847131bc22.png

20201120  生信的发展,常用数据格式及分析软件

欢迎关注WeDiscover

实验技术 | 生物安全 | 质量管理

生物信息 | 遗传解读 | 运营

a8c66191a6a370511bf5bbdd1fa632ec.png

相关资源:jFB精良分班软件绿色版-教育工具类资源-CSDN文库

来源:weixin_39819152

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年11月1日
下一篇 2020年11月1日

相关推荐