使用shapeit进行单倍型分析

欢迎关注”生信修炼手册”!

shapeit是一款单倍型分析工具,运算速度快,准确率高,是impute2官方推荐的pre-phasing工具,官网如下

http://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html

对应的文献发表在nature method上,链接如下

https://www.nature.com/articles/nmeth.1785

通过隐马可夫模型来分析单倍型,简化的模型示意如下

使用shapeit进行单倍型分析

采用了3个不同的数据集,比较了运行时间和错误率,shapeit错误率最低,运行速度最快。

该软件的基本用法如下

需要指定的参数分成了以下3个部分

1. input  unphased genotypes

支持以下3种格式

  1. ped/map

  2. bed/bim/fam

  3. gen/sample

  4. vcf

前两种为plink软件的格式,是GWAS分析最常见的文件格式,第三种格式是WTCCC默认的文件格式 第四种是最常见的VCF格式。

不同类型的输入文件对应的用法如下

对于gen/sample文件格式,可以通过这个软件来进行格式转换,

2. genetic map

参考基因组对应的连锁图谱,可以提高单倍型分析的准确性,官方提供了hapmap项目的连锁图谱供下载,链接如下

http://mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html#formats

使用shapeit进行单倍型分析

每列之间用空格分隔,第一列为snp位点所在的染色体名称,第二列为snp id,第三列为染色体的位置,第四列为不同样本中该位点的分型结果,0代表ref allle, 1代表alt allel, 每两列对应一个样本。

后缀为sample的文件内容如下所示

使用shapeit进行单倍型分析

来源:生信修炼手册

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年8月10日
下一篇 2019年8月10日

相关推荐