GO和KEGG富集分析详细步骤

GO和KEGG富集分析


文章目录

  • GO和KEGG富集分析
    • @[toc]
    • 1. 将差异表达结果的基因名称转化为id
    • 2. GO富集分析
    • 3. GO圈图绘制
    • 4. KEGG富集分析
    • 5. KEGG圈图绘制

1. 将差异表达结果的基因名称转化为id

因为GO和KEGG分析需要用到id,所以这一步需要将基因名字转换为id。具体步骤如下:

  1. 新建空白文件夹,将差异分析得到的diff.xls复制粘贴到文件夹中

  2. 因为在这里只需要diff.xls中的基因名称和logFC两列,所以只复制这两列粘贴到新建的文本文件symbol.txt,如下图所示:

    GO和KEGG富集分析详细步骤

    可以看到后面已经有了id这一列了,至此本步骤结束。

2. GO富集分析

GO(gene ontology)是基因本体联合会(Gene Onotology Consortium)所建立的数据库,旨在建立一个适用于各种物种的、对基因和蛋白质功能进行限定和描述的、并能随着研究不断深入而更新的语言词汇标准。GO是多种生物本体语言中的一种,提供了三层结构的系统定义方式,用于描述基因产物的功能。在转录组项目中,GO功能分析一方面给出差异表达转录本的GO功能分类注释;另一方面给出差异表达转录本的GO功能显著性富集分析。

下面介绍GO分析的步骤:

  1. 将含有基因id的文本文件id.txt复制粘贴到新的文件夹中

  2. 新建R语言脚本,命名为GO.R,其代码如下:

    这里GO分析用到的包为”clusterProfiler”,画图用到的包为”enrichplot”。在代码中会设置p值和q值,设置的都是0.05,如果该条件下分析得到的可用基因较少,可将q设置为0,只看p值,但这样准确性也会降低一些。

  3. 打开R软件,运行上述代码,最终得到的结果如下图所示,下图按顺序分别是柱状图、气泡图以及GO分析结果。

    GO和KEGG富集分析详细步骤
    GO和KEGG富集分析详细步骤

    左半圆圈为基因名字,从下到上按照logFC进行排序得,圆圈右半部分为GO的名称,基因与GO之间得连线表示这个基因存在于该GO上。

    GO和KEGG富集分析详细步骤
    GO和KEGG富集分析详细步骤
    GO和KEGG富集分析详细步骤

    至此,KEGG圈图绘制结束。

    文章知识点与官方知识档案匹配,可进一步学习相关知识Go技能树首页概览1915 人正在系统学习中

    来源:涂apple

    声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年4月17日
下一篇 2022年4月17日

相关推荐