《云起·策问》聚焦数字与实体经济创新实践,讲述光环背后的故事,记录时代人物、传播创新精神,致敬科学的力量。
日前,国家工业信息安全发展研究中心发布了《AI大模型发展白皮书》,其中提到,随着ChatGPT应用的现象级火爆,AI大模型呈现出快速发展趋势,正在掀起新一轮人工智能发展浪潮,大模型基座化或将重塑人工智能产业链和全球市场竞争格局。有人赞叹ChatGPT超高的工作效率,也有人质疑ChatGPT或带来更大的危害;更多人好奇地想知道人工智能将如何改变我们未来的生活。
AI大模型对全球经济的影响不言而喻。为打造更具竞争力的世界级人工智能产业集群,上海市五部门联合制定的《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》正式发布,聚焦大模型创新能力、创新要素供给、大模型创新应用、以及创新环境。在此背景下,上海徐汇汇聚了上海人工智能实验室、三大国家级开放创新平台等顶尖机构和企业创新平台,集聚人工智能相关企业和机构近200家,在大模型和生成式人工智能领域的影响力不断提升。
你或许没有听说过“央视听媒体大模型”,但你可能已经领略到近年来在传媒业,数字媒体编创、数字虚拟主播等新技术带给新闻生产颠覆性的变革。其实在这背后提供技术支持的正是坐落于徐汇西岸的上海人工智能实验室,这家新型研发机构创设两年来,以推出以“书生”通用大模型体系为代表的一系列突出成果,赋能着千行百业。
安全与发展是一体两翼的关系。从人工智能伦理研究的不断推进,到如今AI大模型的出现为安全领域带来全新挑战,大模型所涌现能力的根源尚不可知。
大语言模型打通了ChatGPT的“任督二脉”,缩短了几十年、上百年的预想诞生周期而横空出世。ChatGPT的诞生正如人类的进化,当脑容积大到一定程度,质变就发生了。AIGC诞生于与人类进化相似的进程之“和”,又在升级速度、思维方式上大有“不同”。也为AI与人脑“和而不同”的共生共赢提供了理论基础。本期嘉宾和很多人工智能研究员一样,认为人类不仅不会迷失和无用,还终将在人工智能的帮助下找到新的发展方向,在与AI“和而不同”的和谐共处中,去创造更多美好的未知,完成自我价值的实现。人类文明与人工智能将在未来的世界你携手共进,共创光明的未来。价值对齐作为AI对齐的重要组成部分,是保障AI价值观安全重要手段。那么上海人工智能实验室在这方面有什么洞察呢?通用大模型赋能千行百业的同时,有哪些伦理与价值隐忧值得关注?发展人工智能有哪些短板需要克服?未来还有哪些路要走?
本期节目,李策走进上海人工智能实验室,对话实验室主任助理、上海交通大学人工智能研究院副院长王延峰,一同探索构建人类友好型AI发展体系的意义与重要性。
嘉宾简介
王延峰,教授,博士生导师,上海市第十六届人大代表,上海人工智能实验室主任助理,上海交通大学人工智能研究院副院长。国家科技创新2030——“新一代人工智能”重大项目指南编制专家组成员、国家科技创新2030 ——“新一代人工智能”重大项目管理专家组成员、国家发改委“互联网+”行动专家咨询委员会成员、国家发改委人工智能产业咨询专家委员会成员。
以下为精选节目对话实录:
“书生”大模型体系 赋能千行百业
李策:上海人工智能实验室虽然成立的时间不长,但是取得了很多引人注目的成果,比如风乌气象大模型、央视听媒体大模型等,那么除此之外还有没有其他我们没有关注到的一些方向呢?
王延峰:上海人工智能实验室作为一个新型研发机构,到现在为止将近三年时间,应该讲还是取得了骄人的成绩。目前我们也是基础大模型中唯一全面开源来支持整个生态体系的,这个非常关键,因为我们作为信息研发机构,要支撑整个行业的发展。
我们都知道很多大厂都有大模型的能力,但是我们绝大部分行业其实没有能力做大模型原创研发。所以要用我们的基础模型开源,我们的“书生”大模型体系,包括“书生·浦语”、“书生·多模态”、“书生·天际”(3D领域)来开源出去,来服务于千行百业,这是一个我们的科研成果。
还有一个细节方面,也是非常令人振奋的。今年的6月21日我们收到了CVPR(国际计算机视觉与模式识别会议)顶会的确认,我们有一篇论文拿到了全球最佳论文奖(Best Paper Award)。全球总共9,000多篇文章会选出10篇最佳论文候选,唯一一篇最佳论文来自我们。获奖论文成果是自动驾驶大模型。
CVPR在学术界影响力巨大,今年的最佳论文,也是CVPR40多年来第一篇由全部国内机构作者创作的论文。
李策:在今年的科创大会上我们看到了央视听媒体大模型,通过一个诗词的插图,就能够生成对应的诗句。这个底层逻辑是什么?
王延峰:我们做的央视听媒体大模型也是跟央视深度合作的在垂直领域的大模型,同样也是基于我们实验室开发“书生”通用大模型体系研发的。刚才您举的一个场景的例子,它本质上是基于书生的技术架构,再加上央视多年来积累的垂直领域海量数据,以及央视对业务场景的深度理解所产生的。
通用人工智能回归“赢家通吃”规则
李策:对于大模型,可能很多老百姓都不太理解它具体的内涵和外延是什么,有没有一个通俗的例子,能够深入浅出地给我们来科普一下到底大模型?它的底层逻辑是什么?我们都知道算力算法包括大数据对于人工智能都很重要,那么怎么来理解大模型呢?
王延峰:如果把时间线拉长,这轮AI浪潮从2016年掀起了,业界普遍认为,当年Alpha Go战胜李世石掀起了全球第三次人工智能的浪潮,到2022年11月30日,ChatGPT的横空出世带来了新的通用大模型时代。
从2016年的第三次浪潮开启后,AI本身的热度其实有所降低,只是ChatGPT又把它重新拉起来了。这里隐含着一个产业界和学术界非常关注的问题:2016年Alpha Go战胜李世石带来的是专用智能。什么叫专用智能?就是我们在某一个领域,都要有一个算法、一个模型来做,甚至我们在某一个领域的某一个任务,都要有一个算法,那么它就意味着什么呢?这轮AI会看起来很火很热,有这么多创业公司融资数十亿美金的体量,但是不大不强。不大不强表现在哪呢?营业额不大,利润为负,核心问题就是因为它是专用智能,我们面临任何一个新的问题都要去开发一个新的算法、新的模型去解决这个问题,导致很多AI公司沦为软件公司。
2022年11月30日ChatGPT的横空出世,让大家看到了通用人工智能的端倪——一个大模型可以解决各种任务。从经济学的角度很好理解,一个大模型可以解决各种任务,就意味着有了规模性,因为只要把这个大模型练好了,就可以处理各个任务,边际成本几乎为零,或者边际成本在急剧下降,也就是有了规模经济。
另外一点,ChatGPT出来后,两个月时间全球日活用户达到了1亿,这在全球历史上诞生的所有APP中是第一的,它会把AI从原来的很火很热但不大不强的To B市场,带到了To C市场,那么也就意味着回到了互联网“赢家通吃”的规则。
AI的核心是可计算性 关键在于构建人类友好型发展体系
李策:ChatGPT是风靡全网的,那么在您看来的话它有没有核心技术上的突破,未来的话很多人会认为它的出现也会带来一些风险,那么您的观察里面机遇在哪里,风险又在哪里?
王延峰:我先回答您前面第一个问题,就是ChatGPT的核心技术,它有非常强的核心技术,我给它总结为资金高度密集、人才高度密集、技术高度密集以及工程高度密集。
第二,关于安全的问题,可以从两个维度来看,第一个维度就是价值观的安全,因为它是生成式AI,目前可能很多结果还不可控,那么就要加强它的技术可控性,可以从输入端、语料端,让它用可控,有价值,利用高质量预训练语料来提升它的输出质量;另一方面,在功能性上,大家谈得更多的是他是否会超过人类,超过人类后会不会颠覆人类的发展,在这方面就是我们一定要建构人类友好型的AI发展体系。
我个人认为还没有真的从功能上到了超级人工智能时代,但是值得我们从现在开始就要正视、规划这个问题。
李策:也就是说我们可能害怕的是生成式AI它有自我意识,可能已经往超级智能的方向有所演进,那么我们在利用人工智能这一点的时候,是不是要防范的是对它底层演算模型所开发的这批人,他们有可能会控制,而不是说AI本身?
王延峰:从科技研究的角度,我个人认为还没有到那个程度。AI,本质上最底层的逻辑是Computing,就是计算。
如果意识和情感都计算,那么AI就可能有意识、有情感。如果我们从另外一个维度来定义意识和情感是不可计算的,那么AI就不可能有意识和情感,因为从底层逻辑来说,AI必须可计算。
如果AI计算的架构和语料数据的架构一旦超乎人类的想象,会不会产生不可想象的智能?这个是有可能的,但是这并没有否认了“可计算”这件事。在超级人工智能到来的过程中,如何实现人类友好的超级人工智能?这就需要我们的开发者以及整个的舆论道德领域,都要有一系列的规划。
用知识产权保护原创 以长周期鼓励技术创新
李策:创新是国家发展和经济成长的活力和动力,从科研的角度您觉得未来人工智能怎么样才能够有更好的创新?我们需要在什么地方补短板呢?
王延峰:目前各方都在加大对人工智能的投入力度,我们也在快速前进。鼓励原创,在国家层面永远是非常重要的,因为只有鼓励原创,保护好原创,才会有更多一流的人才、一流的科学家愿意做原创性的东西,才能带动良性循环。
知识产权保护体系和营造原创的科研氛围同样重要。要有人真正甘坐十年冷板凳,去啃基础研究的硬骨头,基础研究是原创中的原创。
李策:板凳愿坐十年冷,文章不写一句空。人工智能领域的知识产权或者专利的保护在最近几年有没有得到显著的进步呢?
王延峰:人工智能这个领域相对比较特殊,我们在知识产权专利的布局方面,因为它从诞生的第一天起,就非常重视这个领域。目前在AI领域,大家对知产权或者对专利对整体的尊重,还是非常国际化的。但是因为很多这样的专利知识产权,它需要比较长时间的才能看到它价值的显现,所以要让这些原创的技术或者从事原创的人员有比较宽松的这样的一个环境来做这件事,从社会或国家的层面要鼓励更长周期的发展。
李策:我们都知道上海要建成国际经济金融贸易航运和科技创新中心,要发挥好五个核心功能,那么要建成全球具有影响力的科技创新中心,你认为差距在哪里?上海人工智能实验室在这里面也扮演很重要的角色,未来还有哪些路要走呢?
王延峰:从大国重器到人工智能、机器人以及生物制药,上海科创都取得了一系列令人瞩目的成绩,这十年的整个成果回答总书记对上海的定位,应该讲还是有底气的。
但是我们必须要充分看到我们距离总书记的期望,还是有差距的,这个差距在于面对我们现在所面临的这个百年未有之大变局的国际形势。我们需要以更大的胸怀,更开放的态度,来感化、拉动整个的全球科技交流的大循环,这可能是在面向未来十年里非常重要的一件事。
第二是青年科学家勇挑重任。其实我们实验室从第一天诞生起,就有很多博士毕业三五年,甚至博士刚毕业的青年学者带领团队完成非常重要的任务,我们希望在整个大环境中,也要有这样的氛围和趋势,让我们的青年科学家勇挑重担。(推广)
主持人李策与本期嘉宾在上海人工智能实验室拍摄现场