[本站讯]近日,金融研究院严晓东副研究员依托山东大学陈增敬教授非线性概率理论研究团队完成的合作论文“Strategic two sample test via two-armed bandit process”在英国皇家统计协会会刊Journal of the Royal Statistical Society Series B: Statistical Methodology2023年第4期正式发表。
本论文基于彭实戈院士的非线性期望开创了“策略极限理论”,为策略博弈过程产生的非独立同分布样本的统计推断研究提供了基础理论。本研究旨在通过检验两个总体参数之间的差异来介绍原创的“策略极限理论”的应用思路,从而证明非线性期望理论在统计推断中的优势。基于独立同分布样本的经典检验统计量往往将原始数据视为可交换的,而本文的检验统计量打破了这种结构,提出采用强化学习最简单模型“双臂老虎机”的策略博弈过程对数据进行整合,构建了针对策略的检验统计量,亦被称为“策略统计量”。利用策略极限理论在更大的概率空间中研究了渐近分布,并且该研究推导出了渐近分布密度函数的显式表达式,对应的非线性中心极限定理被称为“策略中心极限定理”。渐近分布表明,与经典的中心极限定理相比,所提出的统计量在零假设下更集中,在备选假设下更分散,从而提高了检验的功效。仿真和实际数据研究为理论结果提供了有利证据,并在使用有限样本时获得了更强大的power。
团队开创的“策略极限理论”,变革了传统统计方法研究范式,后续开展的相关研究在大数据以及迁移学习、在线学习和强化学习等可解释和可信赖的理论与方法研究上取得重大突破。
统计学四大顶刊指的是统计学领域公认的四大顶级杂志,其中包括 Journal of the Royal Statistical Society, Series B (JRSSB:皇家B) 、Annals of Statistics(AOS) 、Journal of the American Statistical Association (JASA)、和Biometrika。 其中JRSSB是由英国皇家统计学会主办的学术期刊,该刊为季刊,每期收录15篇左右的文章,年文章总数50篇左右,属于四大期刊中发表难度系数最大的杂志。以2022年为例,统计四大期刊年发文量如下:
严晓东副研究员在大数据统计分析与统计机器学习领域从事一线的教学和研究工作,研究方向主要集中在非线性期望下统计推断理论研究。近5年,在统计学顶级期刊JRSSB、AOS、JASA等发表论文30余篇,以主持人获得了国家自然科学面上基金和青年基金、国家统计局、省自然科学和社会科学以及济南市科技局等项目资助。
论文链接:https://doi.org/10.1093/jrsssb/qkad061