RNA 21. SCI 文章中单基因富集分析

图片

另外还有肿瘤克隆进化线上培训课程,有研究这个方向的老师,扫码预约记得来听啊!

图片

基本思路

单基因富集分析并不是说拿单个基因来进行富集分析,单个基因怎么能进行富集分析呢个基因根本没法进行统计检验。

其实,这里说的单基因并不是拿单个基因来富集,而是基于单个基因来进行富集分析,这个“基于”,就是以单个基因为基础,向外扩展,抓取与其相关的基因,然后用这些相关的基因来进行功能富集

所以,要理解这个单基因富集分析的意思,这样一说就已经很明了了。针对单个基因我们可以做什么/p>

主要有两种做法:

1. 定性分组

我们可以根据给定基因的表达值对样本进行分组,然后识别在两组样本之间差异表达的基因,最后用这些差异表达基因来进行功能富集。

2. 定量相关

通过计算其他基因与目标基因表达之间的相关性,将具有显著相关的基因作为一个集合,也可以进行富集分析。

3. 定性分组与定量相关结合

简单说就是通过给定基因的表达对样本分组,然后做差异分析,同时做该基因与其他基因之间的关系,对差异基因进一步筛选,获得最后的基因集进行后续的功能上的分析等。

实操演练

1. 软件安装

我们选安装几个软件包,如limma,做基因表达差异分析,TCGAbiolinks自带函数TCGAanalyze_DEA 可以满足分析,软件安装及加载, 如下:

2. 数据读取

TCGA 数据库下载数据,结直肠癌包括结肠癌和直肠癌两部分的合并,因此我们现在两个数据集 TCGA-COAD 和 TCGA-READ 的基因 count 数据,在进行转换为 TPM/RPKM,进行后续的分析。

3. 定性分组

我们以 PD-L2 基因为例,我们发现PD-L1的基因在结直肠癌中的 symbol 为 PDCD1LG2,以该基因表达值的中位值来对样本进行分组,并做差异分析,如下:

RNA 21. SCI 文章中单基因富集分析

5. 定性分组与定量相关结合

由于差异基因的个数过多,我们可以通过定量相关性,选择R2>0.6的高度相关的基因做后续的分析,如下:

6. 富集分析(GO/KEGG)

对格式化识别出的差异基因进行富集分析,包括GO和KEGG,如下:

GO富集分析

RNA 21. SCI 文章中单基因富集分析

RNA 21. SCI 文章中单基因富集分析

差异基因分析

RNA 21. SCI 文章中单基因富集分析

绘制GSEA富集图

图片

KEGG富集分析

由于基因集KEGG富集的结果我们通过参数pvalueCutoff = 0.2进行筛选,并绘制气泡图,如下:

来源:桓峰基因

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年4月2日
下一篇 2022年4月2日

相关推荐