“北京大学博雅人工智能讲堂”2025年春季学期开讲，王立威教授主讲“人工智能与大模型的前世今生：从GPT到DeepSeek”

时间：2025-03-17

2025年3月14日，由教务长办公室、教务部、研究生院、信息科学技术学院、马克思主义学院联合主办的“北京大学博雅人工智能讲堂”2025年首场讲座开讲。北京大学智能学院王立威教授以“人工智能与大模型的前世今生：从GPT到DeepSeek”为题作了精彩报告。全校500余名师生参加讲座，讲座由教务长办公室主任孙华主持。

北京大学副校长兼教务长王博出席本场讲座并致辞。他指出，人工智能已全方位渗透到每位师生的教学、科研与日常生活之中，成为推动当今社会变革的核心力量。近年来，北京大学积极推进课程体系建设，深化学科交叉融合，主动探索人工智能赋能教育变革的有效途径。作为学校数智教育课程体系的重要组成部分，“博雅人工智能讲堂”与“形势与政策”课程紧密结合，围绕人工智能技术的发展脉络、交叉学科的突破方向以及未来产业变革的趋势等维度进行深入探讨，培养学生独立思考能力，增强其使命感与责任感。自2024年4月开讲以来，讲堂已成功举办12期活动，邀请了来自数学、物理、计算机科学、工程技术、人文社科等多个领域的院士及权威专家，分享前沿科技的发展动态与未来趋势，成功搭建了一个跨学科的学术交流平台。在2025年春季学期，讲堂全新推出“青年科学家系列”，将邀请人工智能领域的杰出青年学者，从算法创新、模型演进、核心技术、应用拓展等多个角度，系统地阐述人工智能的基础理论体系与关键技术突破，为师生带来更为丰富多元的学术体验。

王博致辞

王立威主讲

讲座中，王立威详细讲解了人工智能的发展历程。他提道，1956年的达特茅斯会议标志着人工智能的诞生，然而在早期，由于数据匮乏、算力不足以及方法尚不完善，人工智能难以实现大规模应用。20世纪80年代，神经网络的出现为人工智能发展带来新的转机，后又因技术瓶颈陷入低谷。直到2010年深度学习的兴起，在随后的15年里，以大模型为代表的新技术不断涌现，真正推动了人工智能的爆发式增长。

讲座现场

王立威进一步分析了以ChatGPT、DeepSeek为代表的头部大模型的技术特点和技术模块。大模型具有参数量大、数据量大、计算资源需求大这三大显著特点，其核心技术模块包括大规模预训练、监督微调以及对齐人类偏好。大模型通过“自监督学习”的方式，采用海量无标注数据进行训练，利用“词元预测”（next token prediction）技术掌握语言和知识。随着强化学习技术的发展，大模型分化出基座模型与推理模型，王立威在讲座中系统对比了两者在训练范式、核心技术、擅长能力等方面的差异。以“DeepSeek-R1”为代表的推理模型，凭借强化学习实现了推理能力的显著提升，充分展现出人工智能在处理复杂任务上的巨大潜力。此外，王立威还与师生共同探讨了大模型的能力。他认为，当前在围棋和人脸识别等领域，人工智能的表现已远超人类顶尖水平，但在大多数任务上，大模型仅能达到高于人类平均水平的能力，与人类顶尖专家相比仍存在较大差距。讲座最后，王立威指出，以DeepSeek为代表的中国团队，秉持工匠精神，通过技术开源不断追求工程技术创新，有力推动并引领着人工智能领域的快速深入发展。

师生提问交流

在交流环节，针对师生们提出的人工智能超越人类的方式、数据使用合规性、企业级大模型部署成本、大模型文学创作水平、模型架构创新以及人工智能对教育的影响等问题，王立威一一进行了回应。他表示，人工智能若要超越人类，需获取远超人类所能接触到的信息，比如通过自我博弈获取新数据。对于大模型的文学创作，他认为目前确实难以达到顶尖水平，但未来在新题材创作上或许能实现创新突破。

信息来源：北大新闻网

上一篇文章: 北京大学开展党员基本培训，深入学习贯彻全国教育大会精神
下一篇文章: