培训咨询:010-62753034
您的当前位置: 北京大学继续教育学院» 新闻中心» 校园热点

“北京大学博雅人工智能讲堂”2025年春季学期开讲,王立威教授主讲“人工智能与大模型的前世今生:从GPT到DeepSeek”

时间:2025-03-17

2025年3月14日,由教务长办公室、教务部、研究生院、信息科学技术学院、马克思主义学院联合主办的“北京大学博雅人工智能讲堂”2025年首场讲座开讲。北京大学智能学院王立威教授以“人工智能与大模型的前世今生:从GPT到DeepSeek”为题作了精彩报告。全校500余名师生参加讲座,讲座由教务长办公室主任孙华主持。

北京大学副校长兼教务长王博出席本场讲座并致辞。他指出,人工智能已全方位渗透到每位师生的教学、科研与日常生活之中,成为推动当今社会变革的核心力量。近年来,北京大学积极推进课程体系建设,深化学科交叉融合,主动探索人工智能赋能教育变革的有效途径。作为学校数智教育课程体系的重要组成部分,“博雅人工智能讲堂”与“形势与政策”课程紧密结合,围绕人工智能技术的发展脉络、交叉学科的突破方向以及未来产业变革的趋势等维度进行深入探讨,培养学生独立思考能力,增强其使命感与责任感。自2024年4月开讲以来,讲堂已成功举办12期活动,邀请了来自数学、物理、计算机科学、工程技术、人文社科等多个领域的院士及权威专家,分享前沿科技的发展动态与未来趋势,成功搭建了一个跨学科的学术交流平台。在2025年春季学期,讲堂全新推出“青年科学家系列”,将邀请人工智能领域的杰出青年学者,从算法创新、模型演进、核心技术、应用拓展等多个角度,系统地阐述人工智能的基础理论体系与关键技术突破,为师生带来更为丰富多元的学术体验。

王博致辞

王立威主讲

讲座中,王立威详细讲解了人工智能的发展历程。他提道,1956年的达特茅斯会议标志着人工智能的诞生,然而在早期,由于数据匮乏、算力不足以及方法尚不完善,人工智能难以实现大规模应用。20世纪80年代,神经网络的出现为人工智能发展带来新的转机,后又因技术瓶颈陷入低谷。直到2010年深度学习的兴起,在随后的15年里,以大模型为代表的新技术不断涌现,真正推动了人工智能的爆发式增长。

讲座现场

王立威进一步分析了以ChatGPT、DeepSeek为代表的头部大模型的技术特点和技术模块。大模型具有参数量大、数据量大、计算资源需求大这三大显著特点,其核心技术模块包括大规模预训练、监督微调以及对齐人类偏好。大模型通过“自监督学习”的方式,采用海量无标注数据进行训练,利用“词元预测”(next token prediction)技术掌握语言和知识。随着强化学习技术的发展,大模型分化出基座模型与推理模型,王立威在讲座中系统对比了两者在训练范式、核心技术、擅长能力等方面的差异。以“DeepSeek-R1”为代表的推理模型,凭借强化学习实现了推理能力的显著提升,充分展现出人工智能在处理复杂任务上的巨大潜力。此外,王立威还与师生共同探讨了大模型的能力。他认为,当前在围棋和人脸识别等领域,人工智能的表现已远超人类顶尖水平,但在大多数任务上,大模型仅能达到高于人类平均水平的能力,与人类顶尖专家相比仍存在较大差距。讲座最后,王立威指出,以DeepSeek为代表的中国团队,秉持工匠精神,通过技术开源不断追求工程技术创新,有力推动并引领着人工智能领域的快速深入发展。

师生提问交流

在交流环节,针对师生们提出的人工智能超越人类的方式、数据使用合规性、企业级大模型部署成本、大模型文学创作水平、模型架构创新以及人工智能对教育的影响等问题,王立威一一进行了回应。他表示,人工智能若要超越人类,需获取远超人类所能接触到的信息,比如通过自我博弈获取新数据。对于大模型的文学创作,他认为目前确实难以达到顶尖水平,但未来在新题材创作上或许能实现创新突破。

信息来源:北大新闻网