图模型的估计和推断一直是统计学中重要的研究问题。为了刻画高维变量之间的条件相关关系,宾夕法尼亚州州立大学Bing Li教授最近基于非线性充分降维的方法提出了充分图模型(Sufficient Graphical Model)。(本文整理于2021年3月26日清华大学统计学论坛Bing Li教授特邀报告。)
Bing Li教授首先介绍了图模型这一研究领域条件变量,并回顾了其中几种常用的模型——高斯图模型、Copula高斯图模型、非参数图模型和可加图模型。考虑到高斯图模型等参数模型需要较强的正态性或可加性等假设条件,而非参数图模型会在变量维数较高时难以估计,Bing Li教授提出了基于非线性充分降维方法的充分图模型,可以适用于数据不服从联合正态且变量维数较高的情形。
在充分图模型中,节点 与 之间没有边相连当且仅当两个节点的对应变量满足
其中 表示除i和j之外的所有节点的对应变量生成的最小代数。为了估计各节点之间是否有边相连,Bing Li 教授提出先进行非线性降维,然后检验上述条件独立性是否成立,从而避免了变量维数过高带来的问题,并估计得到充分图模型的相应结构。在一定假设条件下,该方法具有较快的收敛速度和变量选择的相合性,且可以正确估计出潜在图模型的真实结构。
随后,Bing Li 教授介绍了模拟实验的设计和计算结果,发现上述方法在变量之间非线性相关和高维情况下具有优秀表现,ROC曲线显著优于其他同类方法。最后,Bing Li教授介绍了该方法在DREAM 4 Challenge project 数据集上的应用条件变量,发现相比其他现有模型和算法,充分图模型对于不同的网络结构均有非常好的估计结果。
文字 |余成
编辑|张卓婧、侯禹珊
审核 |张静怡
水木数据派
清华大学统计学研究中心
投稿邮箱:
stats@tsinghua.edu.cn