加权基因共表达网络(WGCNA)
加权基因共表达网络构建(Weighted Gene Co-Expression Network Analysis, WGCNA)是一种从高通量数据中挖掘模块(module)信息的算法。在该方法中module被定义为一组具有类似表达谱的基因,如果某些基因在一个生理过程或不同组织中总是具有相类似的表达变化,那么我们有理由认为这些基因在功能上是相关的,可以把他们定义为一个模块(module)。这似乎有点类似于进行聚类分析所得到结果,但不同的是,WGCNA的聚类准则具有生物学意义,而非常规的聚类方法(如利用数据间的几何距离),因此该方法所得出的结果具有更高的可信度。
前置分析条件
样本数量建议达到15以上。
客户可选择参数
- 图片文件,包括png,PDF格式;
- Cytocape文件:可以cytoscape打开进行细节调整;
- 文本文件:每个mRNA/lncRNA的Degree,每个mRNA与lncRNA之间的相关性,Pvalue。
Demo数据
1.基因共表达网络构建和模块划分
选定合适的网络构建参数,建立起加权共表达网络模型,来对基因进行分类,将数千基因划分成为若干模块。
上图中,每一种颜色表示一种颜色对应聚类树上的每个基因属于同一个模块,如果某些基因在一个生理过程或不同组织中总是具有相类似的表达变化,那么这些基因在功能上可能相关,可以把他们定义为一个模块(module)。
2.确定基因与性状的关联(若有性状数据)
通过建立网络模型,得到基因模块。而将这些模块与性状相关联,计算两者间的相关系数,则可揭示基因模块与性状的关联。
颜色越深则模块与形状关联越紧密。紫色代表正相关,黄绿色代表负相关。在本例中MEbrown模块与体重(weight)性状具有最高的相关性。
3.模块基因功能富集分析
对核心模块进行GO和KEGG富集分析从而判断影响核心模块的核心功能和通路。
?上图为基因富集结果柱状图,每个条目对应的柱子长度代表条目中基因数量,柱子颜色代表富集pValue,颜色越深,pValue越小,富集越显著。
4.模块内基因相互作用网络分析
为了进一步探究每一模块内基因的相互作用状况,我们绘制了每一模块中的基因作用网络。每个模块选择了连接度最高的前50个基因来绘制基因网络。
每个节点代表模块中的基因,节点大小代表连接度的高低,从网络中寻找连接度高的基因节点,可做为进一步深入研究的对象。