点击上方蓝色「宏基因组」关注我们!专业干货每日推送!
原文为自自Microbial association network construction tutorial http://psbweb05.psb.ugent.be/conet/microbialnetworks/index.php
简介Introduction
本文提供MENA, LSA, SparCC和 CoNet四种网络构建方法,作者为CoNet作者。由宏基因组公众号翻译整理,并补充及更新部分程序参数。
说明:计算过程在Ubuntu16.04系统的服务器,没服务器的伙伴可以使用QIIME提供的虚拟机;网络可视化在Win10上安装Cytoscape展示及导出。
必须软件Prerequisites
-
最新版Windows版 Cytoscape下载并安装 http://www.cytoscape.org/
-
在Cytoscape的App Manager中安装CoNet和CytoCluster http://systemsbiology.vub.ac.be/conet
-
注册MENA web server: http://129.15.40.240/mena/
-
安装LSA http://hallam.microbiology.ubc.ca/fastLSA/install/index.html
-
Spacc安装 https://bitbucket.org/yonatanf/sparcc
-
注册在线微生物管理平台Qiita: microbial study management platform https://qiita.ucsd.edu/ # username: woodcorpse@163.com
-
安装biom: include by QIIME,末安装可先参考安装QIIME
-
安装R包igraph用于可视化SparCC结果
示例数据 Data
Environmental Microbiology 12(11), 2998-3006 (2010).
http://psbweb05.psb.ugent.be/conet/microbialnetworks/files.php
MENA
http://129.15.40.240/mena/ 自己注册个新用户
-
上传数据:Upload your dataset, arctic_soils_filtered.txt
-
构建网络:Construct the network, 选择数据submit,参数为1,keep blank, do not take alogarithm,其它为默认,Submit
-
查看结果:回主界面,点击Search datasets and networks,每个有项目名、参数和最右边有运行状态,done为完成;点结果列表的名字可看结果,选择不同参数构建网络 Constrcut the netowrk;
-
分析网络:Analyze the networks — Network reports,点击每项按默认参数执行; 如Global Network properties,网络属性,如边、点数据信息;Individual nodes’ centrality为每个点的属性,如node.degree, Clustering.Coefficient;Module Separation and modularity calculation
-
可视化:分析网络中的可视化,可以在线简单成像,也可下载cytoscape格式sif文件及边点注释文件本地分析;并替换所有_为-,替换np为pp,便于后期与Conet比较
-
Cytoscapes分析:打开软件
-
打开网络文件 File — Import — Network — File — arctic 0.540.sif;
-
打开点属性 File->Import->Table->File — node attribution文件;
-
布局设置 Layout->yFiles Layouts->Organic;
-
设置颜色 style,在样式右链下前头中选择 new style,输入名字如“mena”,再设置Fill color的Map选项,Column选择No. module按模块编号上色,Mapping type选择Discrete Mapping,再手动调置每一类的颜色。
-
导出位图和矢量图;File – Export – Network view as Graph – 分别选择pdf和png保存,png大小为200%,dpi=300;但有时图像尺寸会有问题,需要用AI调整PDF,再输出png或tiff;调整后结果如下:保存至本地。
SparCC
网络接口工具,对数据组成的的鲁棒性更强(0和极大值处理更好);
相关系数矩阵结果使用R可视化,本地或Rstudio服务器
网络分析 Network analysis
-
比较Conet与MENA的一致性
保存Conet为sif格式:File – Export – NetWork – conetNetwork.sif;
修改其格式与MENA一致便于比较:用Editplus打开conetNetwork.sif,用正则表达式替换tt为tppt;
使用Cytoscape打开:Import – Network – File打开,
比较点和边:Tools – Merge – 选择两网络添加至右边,选择Intersect,再点Merge; 看到只有62个点和16条边重合,重合的边极少/p> -
全局网络分析 Global network analysis
Tools->Network Analyzer->Network Analysis->Analyze network,选择默认的无向网络undirected,确定,可获得网络的属性的面板,包括网络参数、密度、样式路径长度和簇系数、节点度分布、节点特异属性(such as 离心率eccentricity and 中介中心性betweenness centrality) -
中心节点Hub nodes
分析后的网络点有很多属性,按degree排序即可找到中心节点,本数据为Acidobacteria。 -
网络聚类Network clustering
基因表达网络中,簇用来预测未知功能的基因,与表达相似基因功能相近。微生物相关网络可以发现相似的生活方式。
先选择正相关的边:从Cytoscape选择,没成功;CoNet输出的为正相关网络,方法链接也没説具体操作;
打开Apps – CytoCluster,选择 OH-PIN algorithm ,点Analyze current network。结果显示在另一个面板上,有一些clusters,按由大到小排列。比如我们想分析第一个cluster的物种属性,选择cluster1,点Creat sub-network,可查看该子网按之前物种颜色分类的结果。 -
联合环境因素分析 Neighbors of environmental parameter
选择pH点(没找到,再点邻近的点,可找到相pH正或负相关的OTU
结论 Conclusions
-
网络是精糙无标度(适应结点度分布的权力法则)和小世界(路径长度短特点);
-
如果只看正相关边,网络分为两个主要的簇,由不同的分类学群主载;
-
如果看pH值的邻近节点,发现两个负相关的簇:一个与pH正相关,另一个相反;
对于生物学观点,全局网络属性意义不大。然而,网络形成两个物种分类学特异的簇,暗示苔原土壤存在两个不同的微生物群落。人类也观察到在肠道和阴道中有明显不同的微生物群落。可变的微生物群落是有争意的,因为不清楚群落是否真的不同,还是梯度的渐变。我们可以接受这两种差点,因为有一些部分是重叠的。
当探索临近的pH结点,我们看到Solibacteres和Acidobacteria在其中一个正相关簇中占主导,并与pH呈负相,意味着它们喜欢酸性环境。我们看到另一个簇中Chloracidobacteria和Alphaproteobacteria占主导,且与pH正相关。这些微生物更喜欢基础环境。
结论是土壤pH驱动微生物群落改变。与数据原文结论一致。
此外,我们还发现了更细分类单元与pH的相关性。如Acidobacteria门中的Chloracidobacteria纲与pH正相关,是该门中的特异的纲。结果可以根据pH反苔原土壤中的主要细菌门类。
名词解释 Resources
-
CoNet无向网络:为什么CoNet返回的是无向网络用于选择配置。答案是所有5个选择相似、不相似和相关测量是不对称的,相似的A与B与B与A是相同的。
-
CoNet和Cytoscape中心节点的检测:找有最多正或负相关边的节点,在Node table中,点Degree即按其排序,找到最多度的点。
-
从随机千分文件中恢复CoNet网络 Restore the CoNet network from random score files:为了基于之前计算好的permutations and bootstraps文件而生成网络。
-
正相关边的聚类:为什么只聚类正相关的边,因为我们感兴趣在一起的物种共有一些特征。大部分聚类算法不能区分正或负相关的边,负相关的也会聚类在一起。
-
Cytoscape中选择正相关边:Select -> Use filter(找不到, choose “edge.interactionType” as column and click “Add”. Select “copresence” and click “Apply Filter”. Go to Select -> Nodes and click “Nodes connected by selected edges”. Go to File -> New -> Network and click “From selected nodes, selected edges”. Finally, layout the network (e.g. Layout->yFiles Layouts-> Organic).
猜你喜欢
10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑
系列教程:微生物组入门 Biostar 微生物组 宏基因组
专业技能:学术图表 高分文章 生信宝典 不可或缺的人
一文读懂:宏基因组 寄生虫益处 进化树
必备技能:提问 搜索 Endnote
文献阅读 热心肠 SemanticScholar Geenmedical
扩增子分析:图表解读 分析流程 来源:刘永鑫Adam
声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!