学术科研
2025年10月29日下午,北京师范大学教授郭旭,中国人民大学副教授张政、罗翔宇以及首都师范大学教授周洁应邀于诚信楼715会议室举办“高维建模与因果推断”专家报告会。本次报告会由英国上市365郝美玲教授主持,英国上市365二十余名师生参加。
郭旭老师的讲座题目为《流式数据下密度卷积支持向量机的估计与推断》。该报告研究了密度卷积支持向量机(DCSVM)在高维流数据下的系数估计与推断问题。首先,提出了一种适用于流数据场景的可更新lasso估计量,该估计量通过优化经二次逼近得到的代理损失函数来实现。该方法仅需当前批次数据及有限、可更新、易存储的汇总统计量,并从理论上给出了估计误差界。为进一步构建有效的统计推断框架,该研究提出了在线纠偏lasso估计量,并建立了其渐近正态性。在数值计算方面,研究采用了适用于高维模型且计算效率高的近似点梯度下降算法,并通过模拟与实际数据分析验证了方法的良好性能。郭老师指出,当前流数据研究通常假设各批次数据量趋于无穷,且在高维情形下存储汇总统计量仍占用较大内存,未来研究将致力于解决这两类问题。

张政老师的讲座题目为《基于平衡神经网络加权法的通用处理模型高效纠偏估计》。由于在医学、经济学及社会科学研究中,准确评估一项政策或治疗(即“干预”)的实际效果至关重要。然而,传统的因果推断方法在面对高维混杂变量时,长期受困于估计偏差与“维数灾难”的挑战,尽管已有针对二元干预的先进方法提出去偏估计策略,但在小样本情况下这些方法往往表现不稳定。此外,若将其直接扩展至一般干预模型,则可能带来较高的计算复杂度。针对这一核心难题,一般干预模型的平衡神经网络加权方法被提出。该方法利用深度神经网络缓解维数灾难,同时通过校准保持协变量的最优平衡,从而实现去偏且稳健的估计。此方法适用于多种干预模型,包括均值、分位数、分布性以及非对称最小二乘干预效应,可处理离散、连续及混合类型的干预变量。所提出的估计量具有速率双重稳健性和渐近正态性,并且其渐近方差达到半参数效率下界。此外,研究团队进一步开发了基于加权自助法的统计推断流程,使得有效影响函数或得分函数无需被估计。

罗翔宇老师的讲座题目为《空间信息整合型调整兰德指数——面向空间转录组聚类评估的优化方法》随着空间转录组聚类方法的日益增多,如何准确评估不同方法的聚类效果成为关注焦点。传统的调整兰德指数(ARI)未考虑空间转录组数据中的空间信息,导致其对空间聚类方法的评估不够全面。为解决这一难题,罗翔宇老师团队创新性地提出了空间感知兰德指数(spRI)及其校正版本空间感知调整兰德指数(spARI)。新指标创新性地引入了空间距离权重,当比较两个聚类划分时,spRI会为存在分歧的样本对分配基于其空间距离的权重,而传统方法对此类样本对始终赋予零权重。这一空间感知特性使spRI能够根据样本间的实际距离自适应地区分不同情况,为评估聚类结果的空间连贯性提供了更精准的度量工具。spARI则通过统计校正进一步消除了随机因素的影响,确保其在零模型下的期望值为零。通过模拟研究和两个真实数据集的验证,spARI指标在评估聚类方法时展现出比传统ARI更优异的性能,为空间转录组研究提供了更可靠的评估标准。

周洁老师的讲座题目为《半参数联合模型评估纵向替代指标疗效——在慢性肾病临床试验中的应用》。在需要长期随访以评估主要终点的临床试验中,如何利用更早出现、成本更低的替代终点准确评估治疗效果,一直是医学与统计学界关注的重点。以慢性肾病(CKD)临床试验为例,治疗效应常通过肾小球滤过率(GFR)的年变化率,即GFR斜率这一纵向替代指标来呈现。然而,患者死亡或肾功能衰竭等终点事件的发生会导致GFR测量中止,使得对GFR斜率治疗效应的准确估计变得复杂。针对这一难题,周洁老师的团队提出了一个半参数联合建模框架,能够同时处理纵向测量过程与终点事件过程。在该模型中,纵向结果(如GFR轨迹)采用半参数形式建模,其与终点事件的关系则为非参数形式,而终点事件本身通过半参数Cox模型进行刻画。这一设计不仅增强了模型的灵活性,使其能够轻松扩展至非线性纵向轨迹的分析,也为准确估计治疗对替代终点(如GFR斜率)的影响提供了可靠工具。研究中提出了基于估计方程的参数估计方法,并从理论上推导了估计量的统计性质,通过模拟研究验证了其在有限样本下的良好表现。此外,他们还利用“氯沙坦治疗2型糖尿病肾病终点事件研究”(RENAAL)的试验数据,成功评估了氯沙坦对GFR斜率的具体效应。

讲座最后,四位老师与现场的英国上市365师生开展了互动交流,围绕研究方法的适用场景、未来可拓展的方向及相关理论性质等议题,展开了深入而细致的探讨。
报告人简介:
郭旭,现任北京师范大学英国上市365教授,博士生导师。现主持国家自然科学基金青年科学基金项目B类(原国家自然科学基金优秀青年基金)。曾荣获北京师范大学第十一届“最受本科生欢迎的十佳教师”,北京师范大学第十八届“青教赛”一等奖,以及北京市第十三届“青教赛”三等奖。目前主要关注高维回归模型中的假设检验问题,同时也对机器学习算法在统计推断中的作用感兴趣,已发表高水平学术论文40余篇,包括统计学和计量经济学国际顶尖期刊JRSSB,JASA, Biometrika, JOE, JBES和机器学习顶会NeurIPS。
张政,中国人民大学长聘副教授、博士生导师,现任统计与大数据研究院副院长。2011年本科毕业于东南大学数学系,2015年获香港中文大学统计系博士学位。现任中国现场统计研究会统计交叉科学研究分会常务理事、因果推断分会理事。长期从事统计因果推断的理论、方法及其应用研究,在JRSS-B, JOE, Quantitative Economics, JMLR,JBES等期刊发表论文二十余篇。主持国家自然科学基金2项。
罗翔宇,自2018年9月起任职于中国人民大学统计与大数据研究院,现任长聘副教授。2014年本科毕业于中国科学技术大学统计与金融系,2018年获香港中文大学统计系博士学位。主要研究兴趣为贝叶斯统计、非参数贝叶斯、生物信息学及统计计算等领域。长期致力于通过构建新型统计模型,解决实际生物学问题,在统计方法与生命科学交叉研究中持续开展创新性工作。
周洁,首都师范大学数学科学学院教授。主要从事生存分析、复发事件与纵向数据的研究,在JASA,Biometrics, Statistica Sinica等国内外统计学权威期刊上发表SCI论文20余篇,主持3项国家自然科学基金项目以及多项北京市科研项目。
(通讯员:杨瑞宇 胡灏楠 摄影:杨瑞宇 审核:郭伟)
