云起·策问|从数据到算力 上海为大模型产业构建“生态社区”

副标题:

来源:央视网  |  2023-12-13 15:01:50
央视网 | 2023-12-13 15:01:50
原标题:
正在加载

《云起·策问》聚焦数字与实体经济创新实践,讲述光环背后的故事,记录时代人物、传播创新精神,致敬科学的力量。

无论对于科技界、经济界乃至整个社会的发展,新的数字科技既是重大机遇,也意味着更大的挑战。大模型(LLM),是通过大规模的数据、算法和计算能力训练出的高精度深度学习模型。它能预测天气,为消费者提供个性化选择,辅助金融决策,帮程序员“写代码”......丰富的应用场景,将人工智能赋能产业发展,造福百姓生活发挥得淋漓尽致。自2022年11月ChatGPT发布以来,月活用户突破亿级,成为史上增长最快的消费者应用。

在上海市委市政府的支持下,徐汇区在2017年成为上海首个人工智能发展集聚区,2019年入选全国首批战略性新兴产业集群并获国务院表彰。目前,徐汇区集聚了上海人工智能实验室、期智研究院、三大国家级开放创新平台等顶尖科研机构和企业创新平台,创新高地初步成型;汇聚包括安谋、腾讯、商汤等领军企业在内的近800家企业和机构,2022年总产近千亿、近五年年均增长34.2%,产业规模稳步增长;形成“两极两带”空间布局,相继打造西岸智塔、西岸数字谷、漕河泾元创未来、北杨人工智能创新中心等标杆载体,连续6年承办世界人工智能大会,品牌影响显著提升。

在大模型和生成式人工智能领域,徐汇已汇聚了相关企业和机构近200家,包括互联网大厂、AI企业、生态链场景公司等多元参与者。近期,首批根据《生成式人工智能服务管理暂行办法》通过大模型备案的8家机构企业中,徐汇区占3家,分别为上海人工智能实验室(书生通用大模型体系)、商汤(日日新大模型体系)、MiniMax(ABAB大模型);两批次《境内深度合成服务算法备案清单》中,上海共21个、其中徐汇区占14个,产业集聚度、显示度、影响力走在全国前列,为打造大模型和生成式人工智能生态集聚区打下基础。2023年9月28日,坐落于徐汇滨江的“模速空间”正式揭牌,是全国首个大模型专业孵化和加速载体,不仅推动大模型赋能千行百业,共同营造开放活跃的生态,也持续推动各类垂直场景小模型“首发首秀”。同时,徐汇区成功申报第三批全国知识产权运营服务体系建设重点城市项目,获批全国首批国家知识产权强市建设试点城区,每万人高价值发明专利拥有量、每万户市场主体的平均有效商标拥有量、商标集聚度、活跃度、“专精特新”企业户均知识产权水平指数均位居全市首位。

其中,在徐汇区土生土长的星环科技是国内极少数掌握核心技术的公司,致力于打造“云计算+大数据+数据库+数据开发与智能分析”的基础平台产品;而孵化于模速空间的无问芯穹则是由清华大学电子系师生创建的智能科技公司,致力于提供行业最优的算力解决方案。

虽然国产大模型的正走向“用起来”的新阶段,但在大模型结构本身的创新仍有不足,此外,算力的供不应求也限制了中小企业的成长。那么我们该如何应对人工智能给日常生活带来的变革?对标国外大模型的发展,我国有怎样的优势与不足?大模型的应用落地有什么好的实践?对于国内算力供不应求的局面有什么好的解决方案,未来又有怎样的发展趋势呢?

本期节目,李策走进模速空间,对话中国经济体制改革研究会副会长 樊纲等,共话人工智能时代的机遇和挑战。

嘉宾简介

樊纲:经济学博士,中国经济体制改革研究会副会长,中国(深圳)综合开发研究院院长,北京大学汇丰商学院教授,中国社会科学院研究员,国家级有突出贡献的中青年专家。

孙元浩:星环信息科技(上海)股份有限公司创始人、CEO,上海市信息化专家委员会大数据专业委员会委员,中国人工智能产业发展联盟理事。

夏立雪:无问芯穹智能科技有限公司联合创始人、CEO,入选AI2000人工智能全球最具影响力学者榜单(芯片方向top100)以及斯坦福学科Top2% 科学家榜单。

以下为精选节目对话实录:

樊纲:以知识产权为保障,拥抱AI时代新变化

李策:伴随着数字经济的发展,专利商标版权其实也很重要。知识产权在哪些方面可以支持以人工智能为代表的数字经济的发展?

樊纲:这不是哪些方面了。这是技术创新对经济发展的重要作用。创新是由企业和个人把一些奇思怪想形成新技术的过程,而这个过程不是我们学者能事先知道的,它随时可能出现,有时不是革命性的,有时是革命性的,有时改变了我们一个小的生产方式,有时改变我们大的生产系统。那么在这个问题上,最重要的就是我们如何通过保护知识产权,鼓励人们更多地去创新,使得发明家们能够不断涌现出新的技术。

过去因为落后,我们的发展着重发挥了后发优势。那么越往前走,我们逐步走到前沿了,也就是所谓的无人区,那么就要靠自己创造了。但是我们由于过去一直在学习中,我们对于创造这件事儿,一方面我们还不习惯于自己创造,另一方面我们的制度也不是围绕创造来设计的,包括大家的观念也不是为了创造而设计的,于是大家不太重视知识产权,不重视版权等方面的保护。

那么到了走到前沿的这一步,如何通过知识产权的保护,通过制度的保护,使得我们的企业和个人能够有足够的激励去进行创造性的活动。以前我们主要在学习,今后我们主要要创新,因此这些制度上的问题都要跟上,以形成一种鼓励企业和个人努力创造的氛围与环境。

李策:我国在人工智能方面,通过海量的数据和存储,已经处于世界第一梯队。在您的观察里,目前我国人工智能的发展主要的突出成就在哪个方面?还有什么样的挑战?

樊纲:方方面面都可能发生进一步的突破,包括我们的生活中越来越多用到AI,用到机器人。至于哪个领域具体有什么突破,我不知道,我们不是做技术的,我们也不知道现在发展的一些前沿,但是你能看到方方面面都在发展。

我们有很好的例子,一个产业的一个新技术出现,会带动一大批产业的出现,而且用途非常广,不仅仅是在生产中,而且在生活中,具有非常广阔的前景。

李策:有部分观点认为,未来随着人工智能的发展,可能对于人类的工作岗位产生替代和挤出的效应,您认为人工智能的发展会使失业率上升吗?

樊纲:200年前开始这个问题就被提出来了,那时候机器替代人,后来任何一个自动化的发展,人们都在问这个问题。早年因为这个问题,很多地方出现砸机器的现象,因为工人把失业原因归罪于人工智能。

那么现在当然人们会提出这个问题,但是你就想一想,人类社会总是不断提出问题,解决问题。过去两三百年来,随着技术的发展,人们是怎么解决这个问题的?

一个重要的方面是减少每个人的工作时间。从这个角度来看,机器实际上替代了人,把人解放出来,把人从一些繁冗的劳动中解放出来,创造了更多的休闲。

所以说如果问是不是人工智能的发展导致人们的失业,我说人们首先创造了它们,带给人们更多的闲暇。闲暇在经济学当中是幸福的来源。实际上人类的幸福的增长,人类的发展过程,技术进步的发展过程,很大程度上解放了人类,使我们的工作时间减少,而有更多的时间享受生活。

这些新的技术的发展,真正的产生的结果是改变了人们的生活方式。人们闲暇的增长,一定会产生更多的与闲暇相关的新工作或新经济部门,抑或使得部分原有部门加以扩大,如说旅游、休闲健身等服务业。这类行业给予人们更多时间可以去追求艺术,去发展其他爱好,锻炼身体等,会有更多这些方面的职业被创造出来,所以我个人不是很悲观。人类这几百年来就是这么过来的,这几百年不仅工作没少。从全球化的角度来说,越来越多的人被卷进了现代化,越来越多的人得到了就业,收入也是在增长,无论如何无论怎么说,全世界这几十亿人生活水平也在不断提高。

所以我不建议大家很悲观地来看待这件事情,要看到它对人类的发展所做出的更深层次的贡献,看到我们未来生活方式和生产方式的变化,用一种积极的观点来看待我们的技术进步。

当然了这里还要解决很多问题,这种调整过程这种变化过程可能是均衡或不均衡的,人们所享受到的调整成果也不尽相同,甚至有人反而“享受”了它的负面结果。所以这也需要一些社会政策来帮助大家转型,帮助大家适应这种新的技术带来的新变化。

孙元浩:辅助决策的大模型赋能千行百业

李策:我们都知道最近有一些热词,如人工智能、区块链、大数据、大模型、向量数据库,对于普通受众而言,我们如何能直观地了解大模型呢?

孙元浩:谷歌在18年提出了大模型的架构,后来大家发现把这个模型的神经网络(参数规模)变大,类似于模仿人脑,即大模型有类似人类神经元的参数。参数规模越大,相当于神经元越多。

大模型的一个优势是能容纳很多知识。我们可以通过训练大模型,把过往的知识全部告诉它,它就能过目不忘,全部记在“脑子“里,那就叫大模型训练。

训练完大模型后,针对已有的知识,它能够像人一样对答如流。这样的大模型称为大语言模型。

当然,现在大模型过渡到了多模态,也就是不局限于读语言,还可以去看图片、视频等,这样的大模型称为多模态大模型。

李策:您认为在大模型这个领域可预见的未来里,有什么挑战呢?

孙元浩:这个重要的挑战就在于,我需要让大模型学会行业知识。通用大模型目前已经达到一个大学本科生的水平了,但是本科生变成一个金融专家可能还需要十年。因而,怎么把这个行业的知识整理好,并能运用到模型里,解决行业的特定问题,是目前的一大挑战。

李策:现在对比国外的话,我们国内的大模型处于什么水平?还有多远的差距?

孙元浩:我们国家今年差不多出现了大概上百个模型,现在更多的创新点集中在训练的语料与训练方法上,以及更重要的应用创新,即把大模型运用到各行各业。这些方面我国是有优势的,发展比较快。

但是目前我们用的还是开源的网络结构,在模型结构本身上的创新还比较少。因此现在欠缺的是在基础理论的层次上,目前看来距离世界领先的大模型可能差至少一代以上。当然这样的现状可能还需要像模速空间这样,聚集一大批大模型企业,研究大模型结构、训练方法、应用场景等,需要大家共同努力。

李策:大模型在商业化层面有没有一些很好的落地实践?就今年而言有哪些新的突破?

孙元浩:现在大模型的基本用途,第一类就是构建各类的知识库。比如企业内部的知识库(规章制度、产品信息、产品维修等),此类落地场景称为知识库的场景。第二类场景,是目前在快速推进的数据分析大模型。用大模型增强大数据,让用户能通过自然语言获得所需数据。

李策:对非专业人士而言,大模型是比较抽象的,但算法已经渗透到了我们生活的方方面面,如投资、炒股等,星环的产品在辅助决策方面有无比较突出的地方?

孙元浩:星环的产品主要针对数据分析软件和大模型训练工具。我们用大模型增强数据分析能力。现在在金融行业,目前用大数据和大模型的主要应用场景,是做客户分析、事件分析。

如果需要了解有哪些主要的企业,每家企业的经营状况怎样,这些大模型能帮你去收集相关的信息,帮你整理出报告。它可能是投资研究报告,也可以不光是分析个别公司,它能分析全市场所有的金融情报,总结规律。比如,总结人工智能板块在过去一段时间表现如何,与二级市场行情是有什么关联度,总结出这样的规律后,就把它作为素材,称为因子,运用到后续的投资策略中,这一块已经开始实践了。目前有不少金融机构正在尝试使用大模型做数据分析,以及金融情报分析。

夏立雪:致力于提升算力效率 连通国内算力生态链

李策:在2020年的时候,马斯克说他预计在2025年人工智能会超过人类,那么通用式人工智能的出现,已经使AI逐渐有了自主意识,那么无问芯穹在这个方面有什么样的研究发现?在商业化落地转化和应用层面有没有新的突破呢?

夏立雪:现在其实我们看到ChatGPT在大家的工作生活中已经展现了自己的能力,但是现在距离真正能产生爆点的一些商业化产品还有一定的距离。在国内,有非常多的创业者和有想法有创造能力的人都在走向这样一个方向。

但是我们现在也确实看到一个问题,就是在这个过程中,大家对于算力是有很高的需求的,而整体的算力在国内又是不足的,所以这就形成一个供不应求的一个市场关系。这对于好的创业者来说,他可能会有很好的想法,却不一定有很强的资源和资金的能力,所以他们实际上是被排除在大模型场景孵化的门槛之外了。

无问芯穹在大模型孵化的阶段更希望能够通过自己的技术,让国内很多没有被用好和没有被用起来的算力能够发挥出价值,本质上其实是增大了整个国内在算力这边的供应量,使得我们这些小玩家也能够享受到廉价好用的算力,更专注在做自己的场景孵化工作,而非花精力去到市场上去想尽办法采购算力。这是无问芯穹团队在这个时间点想要为社会提供的价值。

李策:大模型号称是能够重塑千行百业,目前为人所熟知的有百川大模型、商汤的日日新大模型,还有书生通用大模型,那么无问芯穹与这些大模型相比,差异性在哪里?

夏立雪:从出发点来说,无问芯穹是希望算力的效率更高,这也是我们核心技术的体现。算力的效率实际上也就体现了,做一件事情到底需不需要这么大的模型,本身也是一个算力效率的体现。

所以我们和这些通用基座大模型相比,会更关注行业,做一些模型的压缩,提出一些针对行业的“中模型”,也就是说可能有很多企业都在去做通用的大模型,而我们是基于这些大模型往下去做不同行业的“中模型”,这会是我们不同的出发点。

李策:算力其实是人工智能发展的重要支撑,那么展望未来,这个领域的趋势是怎样的,又有什么机遇和挑战?

夏立雪:首先,算力这一部分,现在在国内还没有被很好地发挥出来,但是我们有很多好的国产化的算力芯片并没有被真正使用算力的客户所接触到。这里主要是因为整个生态链还没有打通,包括在算力上的软件生态并没有搭建起来,所以很多技术路线是非常分散的,那这样的话就没有办法形成一种循序渐进的关系,这也进一步导致了整个国内算力稀缺的情况。

所以我们也是想从这个角度解决这个问题。因为我们自身非常擅长做软件到硬件的联合优化,推出了从模型到硬件的适配平台,让开发者不断地关注底层的算力是什么,同时对底层的好的芯片的提供方来说,也可以获得真实的业务场景的反馈,不断迭代优化自己的硬件和软件设计。这个是我们现在看到的国内算力未来的发展趋势,那时也会有很多好的国产化芯片有很好的产业前景。那在这个时间点,它更需要有一个人牵头把中间的生态做起来。我们是希望能够在这件事情,也为社会做一些贡献。(制片人:李策,统筹:汤艾一)


编辑:贾凡 责任编辑:罗川
点击收起全文
扫一扫 分享到微信
|
正在阅读:云起·策问|从数据到算力 上海为大模型产业构建“生态社区”
扫一扫 分享到微信
手机看
扫一扫 手机继续看
A- A+