院士谈智能、模型 VS 数据 AI、数字化转型,这场 AI 开发者盛会的技术干货来了
2022 年,院士如何看待未来人工智能的发展?未来 AI 是模型驱动还是数据驱动?当前 AI 开发的难题有哪些?
2 月 26 日,在以"构建融通开放新生态"为主题的 WAIC 2022 上海人工智能开发者大会主论坛上,来自学界的院士大咖,产业界的技术专家,就这些问题展开了深刻的探讨。
中国工程院院士、中国人工智能学会监事长蒋昌俊院士,南方科技大学副校长及讲席教授、美国国家工程院院士张东晓发表了主旨演讲。
在圆桌论坛上,来自学界、业界的多位代表就数字化转型、AI 开发难题等开发者关心的热点话题展开了深入讨论。
物质、信息和智能是我们在发展过程中非常重要的几个标符。在这次的主旨演讲中,中国工程院院士、中国人工智能学会监事长蒋昌俊首先回顾了 16 世纪以来人类在这三个方面进行的探索以及取得的主要成就,然后在此基础上谈了谈他对于智能的思考。
蒋昌俊提到,当前人们对智能的认知局限于连续结构和离散结构,在此之外的结构形式还有待探索;深度学习算法从理论上来说没有根本性的变化,还是基于神经层次结构,无非是处理的层次更多更广;直到今天,智能世界还没有在理论上形成一个公认的理论基础。
"人除了可计算的思维,还有说不清的思维,比如说顿悟、灵感等等。"他认为,在这一轮的智能发展中,不可预测性、不确定性是需要重点考虑的 AI 基础问题。
南方科技大学副校长及讲席教授、美国国家工程院院士张东晓关于理论指导下的人工智能话题进行了分享。
模型驱动与数据驱动两者在模式、映射关系等方面各有不同。在解决实际问题中,是选择模型驱动还是数据驱动?
张东晓认为,数据在足够多的情况下能够以任何精度拟合任何函数,数据驱动可以实现很好的预测能力。
但是,仅依靠数据还不行。以深度学习神经网络为例,其学习的模式架构可以将物理规律、工程控制、增加的经验等信息综合起来进行训练,增强可解释性和更好的稳健性,核心在于知识在深度学习框架中的嵌入。
张东晓表示,如何从数据中挖掘模型、得到知识是 AI 的最高境界。"在行业 + AI 的探索中,数据驱动与模型驱动的有机结合有助于解决实际行业问题。"
在探讨数字化转型的圆桌论坛中,上海科技大学副教务长、信息科学与技术学院副院长虞晶怡,宾通智能 CEO 龚超慧和燧原科技人工智能计算专家、产品市场部总经理高平分别发表了对元宇宙的看法。
「元宇宙首先要具备沉浸式的体验,由于 AI 等技术的发展,我认为当前出现了新的机会。我们必须为此构建数据驱动的引擎。」虞晶怡说道。「除娱乐领域之外,元宇宙的应用方向还有很多,比如智慧城市的三维模型重建。最近谷歌和 Waymo 使用神经网络的方法进行了旧金山大量街区的城市重建,其方法和传统技术完全不同,可以快速渲染,将大型城市压缩到很小的数据集中,但是它不可编辑。在智慧城市里面,元宇宙大有可为。」
「从现有技术手段来看,元宇宙概念就是使用一些图象、视觉技术描述认知中的物理宇宙,希望通过其它技术手段重新呈现它。」龚超慧表示,「将来很有可能会出现全新的技术手段,能够在虚拟和物理世界之间形成闭环和互动,我们可能会在这个世界里面创造全新的交互形式,进而带来全新的商业模式和应用场景。」
「我认为元宇宙是数字经济的一种新形态,需要强大的算力支撑。元宇宙进行的内容生产已经远远超过我们现在所理解的,基于视频等媒介的互联网内容基础,未来我们需要海量的计算力支持虚拟环境渲染,产生的算力需求需要 AI 数据去加以支撑,」高平表示。「对于 2B 企业而言,可能会出现大量的,基于元宇宙 2B 底座,在这之上是开发者们构建的业务,人们将会各自去发挥才能,让元宇宙产业生态枝繁叶茂。」
开发者是一个身份,有的开发者在高校从事算法研究,有的开发者在企业从事 AI 应用的开发,还有一些在跨界工作,开发者的职业是多重多样的。在这场圆桌对话中,几位嘉宾一起探讨了 2022 年 AI 开发的难点。
首先谈及 AI 算法研发相比于几年前是变简单了还是更难了,几位嘉宾阐述了自己的观点。
上海交通大学约翰・霍普克罗夫特计算机科学中心长聘教轨助理教授、博士生导师温颖从生态发展的角度阐述了 AI 算法研发难度的变化。他说:2015 年深度学习已经崭露头角,但当时还没有一个完善的工具去做研究。2015 年底 TensorFlow 首次发布,2016、2017 年生态才逐渐成熟。如今大模型的驱动和新的算法让模型的门槛变得更高了,需要很高的算力。
东方理工高等研究院助理教授陈云天则表示 AI 算法的研发变得更简单了,一方面是因为出现了更多的框架,另一方面是当下良好的开源风气让计算机和其他学科的交叉领域有了更多进展。
上海人工智能实验室通用视觉组计算机视觉研究员何逸楠也表示 AI 开发和几年前相比,入门是更加容易了,并且有更多的开发者在社区中贡献开源代码,也有很多大厂开源的工具和平台。开发者现在要做的就是提升自己的知识能力,解决更加上层的问题。
那么在基础打好之后,现阶段面临的更高级别的挑战有哪些呢?
何逸楠指出,当下首先要面对的挑战是数据问题,训练模型需要采集大量数据,其次还要提升训练效率。
陈云天也表示,在小数据上做机器学习是一项挑战,另外可解释性和知识嵌入也是需要解决的难题。
温颖则提到,强化学习虽然已在游戏方面取得了一些比较大的进展,但它在现实应用场景中还没有完全体现出其作用,想尝试把大模型用在强化学习中。
2022-05-06 00:44:56