报告人:曹原
工作单位: 香港大学
报告题目:基于算法分析的过参数化神经网络学习理论研究
报告时间:2026年6月23日(周二)下午14:00-17:00
报告地点:D2-116
摘要:现代机器学习模型往往包含大量参数。对于这类过参数化模型,训练损失函数可能存在无穷多个极小值,因此不同的训练算法可能收敛到不同的解。尽管这些解在训练集上都能实现零误差,但在测试数据上的预测误差却可能有很大差异。因此,理解现代机器学习模型的泛化能力,需要深入分析训练算法对泛化性能的影响。本报告将探讨近期关于过参数化神经网络的基于算法分析的理论学习保证。介绍“良性过拟合”现象的理论分析;讨论并比较梯度下降、full batch Adam和stochastic Adam三种优化算法在测试数据上的表现。研究结果突显优化算法在现代大规模神经网络实际应用中的关键作用。
报告人简介:曹原,香港大学计算与数据科学学院助理教授。2012年本科毕业于复旦大学,2018年获普林斯顿大学博士学位,2018-2021年任加州大学洛杉矶分校博士后研究员;曹教授研究兴趣包括深度学习理论、非凸优化和高维统计学等。
欢迎数理学院的师生前来听讲!