7月2日,“2023全球数字经济大会人工智能高峰论坛”在北京举办。论坛由爱集微、北京集智未来人工智能产业创新基地有限公司、中国电信股份有限公司北京分公司承办,北京人工智能产业联盟、中国信息通信研究院、国家工业信息安全发展研究中心支持。在论坛上,清华大学计算机系长聘教授、人工智能研究院副院长朱军发表了《人工智能技术现状、发展趋势与安全态势》的深度解读。他指出,过去十年,人工智能最大的变化趋势是从从小模型变成大模型。大模型有三大关键技术:内容学习、思维链和指令学习,以及基于人类反馈的强化学习。ChatGPT大语言模型的出现是该领域最受关注的成果之一,它实现了超强的能力展示,能够理解意图和上下文等。朱军还强调了多模态发展的重要性,如大脑为参照,人是多模态感知的系统,天然希望能够处理多模态数据。目前,ChatGPT和大语言模型的应用已经广泛起来,并且多模态模型的发展也引起了业界的高度关注。在AIGC的技术路线上,Transformer语言模型和序列数据和扩散概率模型的图像、视频、3D生成是两条重要的技术路线。朱军介绍了团队在AIGC方面的相关进展,他们通过长时间的积累,去年的算法工作被早期的Stable Diffusion和DALLE2采用,还训练了多模型扩散的深度模型Diffuser,可以支持任意模态的转化和生成。他们正在快速优化模型的性能,并且正在对标行业最好的MidJourney快速追赶。有了多模态基座模型,应用场景是非常丰富的,除了文本以外,包括视频、图像、音频等等生成任务都有可能受益,甚至启发新的应用。