加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集, 并根据基因集的内连性和基因集与表型之间的关联鉴定候补生物标记基因或治疗靶点。相比于只关注差异表达的基因,WGCNA利用数千或近万个变化最大的基因或全部基因的信息识别感兴趣的基因集,并与表型进行显著性关联分析。一是充分利用了信息,二是把数千个基因与表型的关联转换为数个基因集与表型的关联,免去了多重假设检验校正的问题。
在使用WGCNA(Weighted Gene Co-expression Network Analysis)进行基因共表达网络分析时,确定软阈值(soft thresholding power)是一个关键步骤。软阈值用于将基因间的相关性矩阵转换为邻接矩阵,从而构建加权网络。
在WGCNA中,层级聚类树(dendrogram)用于展示基因表达数据的聚类结果,并将基因划分为不同的共表达模块。每个模块通常用不同的颜色表示。
通过计算模块特征基因(Module Eigengenes, MEs)之间的相关性,可以了解不同模块之间的关系,并进一步探索模块与表型数据的关联。
通过计算模块特征基因(Module Eigengenes, MEs)与样本表型数据之间的相关性,可以揭示模块与特定表型(如疾病状态、实验条件等)之间的关联