BSA分析拟南芥F2代分离群体混池测序

1. 实验背景

为了研究拟南芥对高温响应的基因,我们对拟南芥的野生型Col进行了EMS诱变,通过对诱变后的种子多代的高温筛选,我们发现了一个对高温敏感的突变体,该突变体的下胚轴的长度在高温下要比野生型显著的短。之后,将此突变体和野生型Col进行杂交,F1表现长下胚轴,F1自交,F2出现了明显的性状分离,即表现长下胚轴和短下胚轴两种类型(长:短~3:1),遗传分析表明该突变是一个隐形突变,有单基因控制。

2. 实验设计及测序

对F2群体中的长,短下胚轴的两种类型的材料分别取30株,然后混合提取DNA,建立两个DNA池,long-pool, short-pool。之后选取亲本Col,及突变体进行建库测序。 一共四个样品,采用ILUMINA双端测序。每个材料测序40~50X。 公司返回的数据,每个样品大约是7Gb.根据拟南芥基因组的大小125Mb,本次测序每个样品的深度大约是56X。返回的原始数据如下:

3. 数据分析。

(1)创建序列回帖的参考基因组index, GATK call SNP 的index。根据参考基因组fastq名称运行一下脚本

在上面的ref文件夹中运行该脚本,会生成bwa比对的参考基因组文件的INDEX。 以及GATK所需要的dict.这个时候要把GATK的dict 该一个名称,比如:mv Athaliana_447_TAIR10.fa.dict Athaliana_447_TAIR10.dict。 不然下边GATKcall SNP 会报错

运行完之后的ref 包含如下:

(2)对每个原始数据进行质控,去除接头,低质量的reads; bwa进行比对;samtools 对bam文件进行排序、索引。最后使用GATK call SNP 生成GVCF文件。这个脚本如下:

对每一个样品运行上面的脚本,然后会在输出的文件夹中创建四个样品的文件名,每个文件名之内包含三个文件夹,分别是bwa, cleanfq, gatk.

来源:samhuairen

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年6月13日
下一篇 2020年6月13日

相关推荐