赋能中小微企业 AI 实践,构建 AI 蓝领教培体系,特斯联将普惠 AI 进行到底
玉花飞半夜, 翠浪舞明年。2022 年北京冬奥会的开幕恰逢中国传统二十四节气中的立春, 开幕式以二十四节气倒计时开场, 以"雪花"作为核心意象串联, 压轴节目《雪花》更是将"雪"的意象渲染得淋漓尽致 -- 漫天流动的风雪在滑冰运动员的脚下实时消散, 数百名儿童亦如粒粒雪花晶莹 -- 冰雪的高洁与春天的生机相交融, 中华文化的浪漫就孕育在这中间。
据冬奥组委会介绍,《雪花》的空灵是由专项团队开发的一套"基于人工智能技术的演出实时特效系统"所实现的 -- 表演过程中, 国家体育场中架设的四台摄像机实时拍摄演员表演的画面, 随后摄像机将视频信号传送到边缘计算系统中进行三维信号重组与渲染, 生成的艺术形象随即呈现在现场的地面 LED 大屏幕上与演员互动 -- 整个过程只需不到几十毫秒的时间。渲染的实时、互动的流畅均需要强大的算力、高效的 AI 算法支撑。
北京冬奥会开幕式现场图片来源: 人民网
冬奥会开幕式总导演张艺谋早先就曾表示:"本次开幕式的理念是用科技让开幕式'人少而不空, 空灵而浪漫'。"无疑, 冬奥会的成功举办, 让 AI 这项新兴技术的强大潜力更直观地呈现在观众眼前。然而尽管 AI 技术的研发不断突破创新, 其在产业端的落地应用却不像看起来那么简单。
AI 发展迅猛, 中小微企业仍受制约
长期以来, 数据、算力、算法被视为 AI 发展的"三架马车", 然而对于多数企业而言, 这三驾马车却同时成为了难以跨越的门槛, 制约着 AI 产业的进一步发展乃至产业数字化转型的进程。
一方面,AI 算法对研发能力的要求极高, 中小微企业难以与掌握资源的大企业竞争、获得研发所需的相应人才、能力; 另一方面,AI 模型的训练依赖大量数据, 而数据同样往往只掌握在大企业手中; 而即便是对于同时掌握了研发能力和数据资源的企业来说, 模型复杂程度攀升及数据量急剧增加所带来的对算力要求的提升, 亦进一步推升了算力的成本。这些都使 AI 技术难以有效应用落地 -- 于大多数企业而言,AI 所描绘的旖旎远景仍似蜃楼难以触及。
与此同时, 对于整个产业来说,AI 迅猛发展的同时,AI 人才需求亦呈现出了巨大的缺口。高盛所发布的《全球人工智能产业布局》数据显示, 在 2017 年全球的新兴人工智能项目之中, 我国人工智能项目占比高达 51%, 而在同年全球人工智能人才储备方面, 我国的人工智能人才却仅占 5%。报告预测, 到 2030 年, 我国人工智能人才缺口将超过 500 万人。随着双减政策下职业教育成为教育发展的新选择, 如何携手高职专院校培养专业技术 / 技能人才, 反哺产业人才缺口, 成为当前 AI 产业发展及职业教育发展的一条全新探索路径。
据此, 特斯联人工智能开放创新中心应运诞生。
2022 年, 首个特斯联人工智能开放创新中心 (下称: 科创中心) 正式于德阳 AI PARK 落地运营。德阳 AI PARK 是特斯联继重庆 AI PARK 之后打造的又一座集聚未来城市体验及城市科技的研发基地, 其中位于园区三层的科创中心则成为了这座新落成的园区的关键亮点。
特斯联德阳 AI PARK 效果图
以算法、数据、算力赋能中小微企业 AI 发展
科创中心是特斯联所打造的人工智能计算中心 (AICC), 同时兼备着算法孵化、科研共享、及人才培养的使命。据特斯联介绍, 这是公司以创新研发反哺产业生态, 助力产业发展的第一步。
据特斯联相关技术负责人介绍, 科创中心的设立旨在充分贯通学术生态和产业生态, 使学术生态得以基于产业数据研发相应的预训练模型, 并以"成本共担"的方式, 为 AI PARK 周边的中小微企业提供 AI 所需的算力、数据、算法模型等核心要素, 让各体量、具备不同 AI 基础的企业均能通过学术机构所研发出的模型, 以低代码、模块化的生产方式依据自身的需求, 实现自有知识产权算法的孵化及既有成熟算法的调用, 进而推动更高效的 AI 产业实践。
特斯联人工智能开放创新中心实景图
作为特斯联核心 AI 能力落地的载体, 科创中心具备算力、数据、模型三大核心能力的输出:
算力方面, 特斯联以科创中心为单位面向中小微企业提供算力, 不同的科创中心其规模、设施亦不尽相同。德阳科创中心占地约 240 平方米, 一期规划算力达全精度 31P、双精度 2P、单精度 125P、半精度 65P。而尤其值得注意的是, 未来科创中心的算力并非仅由单个科创中心的算力构成, 还将融汇全国各地多个科创中心节点, 供给于产业。
数据层面, 以 AI PARK 智能交互终端采集的本地数据、特斯联自身近万项目积累的产业数据、与地方政府大数据局的合作数据, 以及科研公开数据为基础, 德阳科创中心目前已接入 89TB 数据。特斯联科创中心将算力下沉到数据端组成智算节点, 通过联邦学习体系, 使数据对研究机构可用及部分有条件可见。科研机构随即通过智算节点, 基于联邦学习实现预训练模型的研究。预训练模型则可通过评测, 上载到 TACOS (特斯联城市级 AIoT 操作系统) 的九章算法赋能平台, 为产业所用, 实现产业算法的孵化。
算法模型方面, 基于前述体系, 目前特斯联在计算机视觉、自然语言处理、推荐预测、知识图谱四个方向共十三个细分项, 与学术生态及产业合作伙伴展开深入合作, 并建立了庞大的模型库。通过弱监督及大模型训练体系, 学术机构所研发出的模型可实现在 TACOS 的挂载, 并通过 TACOS 的 AI Develop Studio 向产业提供算法训练的服务。基于弱监督体系, 中小微企业用户可以基于无标签数据进行算法训练, 降低算法对数据的依赖。同时弱监督及大模型训练体系尽可能地降低了算法研发过程中的人工参与程度, 让算法训练标准化、流程化。
九章算法赋能平台用户界面
不具备 AI 能力的用户也可通过简单的"拖拉拽"方式调用相应模型
据特斯联透露, 入驻科创中心的企业均可通过 TACOS 及九章算法赋能平台直接调用相应的预训练模型 -- 截至 2022 年 2 月底, 据 TACOS 显示, 已有逾 800 家企业注册九章算法赋能平台并入驻特斯联科创中心, 共计调用算法超过 120 万次, 而科创中心携手学术生态也已累计生成了数百个预训练模型。
自研核心技术体系: 以沉默数据降低 AI 研发门槛
据特斯联科创中心负责人介绍, 弱监督大模型训练体系、联邦学习安全训练体系是科创中心最核心的技术亮点。
科创中心致力于通过九章算法赋能平台向不具备 AI 能力或弱 AI 能力的用户提供 AI 算法孵化服务能力, 因而弱化机器学习对标签数据的依赖、弱化人工参与算法训练, 就成为了重中之重。
有别于行业常见的算法研发范式, 特斯联将算力与数据相结合, 建立了特斯联的智算体系, 通过科创中心节点将算力下沉与数据绑定, 形成算法 + 数据的分布式计算单元, 并通过九章 AI 算法赋能平台的 AI Research Studio 基于联邦学习安全训练体系将这一能力提供给科研学术生态。科研学术生态对于这些数据仅有部分有条件可见和使用的权限。基于这些分布式智算节点, 科研学术生态可实现预训练模型的研究, 并将研究的预训练模型通过评测后上载到九章算法赋能平台的 AI Develop Studio 供产业使用, 这些数据对于产业是完全不可见的。从技术上保证了数据的安全性。
在特斯联看来, 其打造的核心技术体系最关键的能力就在于, 使城市中庞大的沉默数据资源, 能够真正有效地为产业所用。而这也是科创中心得以赋能企业 AI 开发的基础。
2021 年, 特斯联完成了基于弱监督和大模型核心技术的里程碑级突破, 并实现了与学术生态所研究的预训练模型的一键加载。
"蓝领"AI 教培体系, 反哺产业人才缺口
不止于对企业的赋能, 特斯联对科创中心还有更高远的野望。
借由德阳科创中心的启动, 特斯联宣布将正式升级其人才战略, 在不断投入加码自身研发团队的基础之上, 还将构建完善的"蓝领"AI 教培体系, 为产业源源不断输送 AI 人才。
据介绍, 特斯联的"蓝领"AI 教培体系将以科创中心为实践基地, 以 TACOS 及九章算法赋能平台为基础展开。面向广泛的本地高职专院校, 特斯联将打造系列基于 TACOS 的 AI 教培课程、教材、软硬件实训及考核方案, 为高职专学生提供基础 AI 能力支持。以科创中心为桥梁, 高职专学生得以针对企业具体的需求进行 AI 实习实践, 学以致用。同时, 特斯联还将充分拉通产学研各界, 以最新研究成果赋能前沿产业 AI 发展, 打造从科研到应用的 AI 发展闭环。
从研发到应用, 再以市场反馈反哺科研创新, 这对于 AI 产业来说是一个螺旋式发展的过程。借由科创中心, 特斯联希望能进一步缩短 AI 技术从实验室到市场的路径, 使研发更具场景针对性, 也使市场的需求能更快速地为研究机构所了解。
历经逾 60 年, 人工智能已从最初的计算、感知阶段发展到认知阶段, 而下一阶段的突破离不开更靠近市场的应用实践。通过打造集算力、数据、算法模型能力于一体的科创中心, 特斯联要做的是为各类企业打造流程化、低门槛的 AI 基础设施, 让更多玩家参与到 AI 发展的浪潮之中, 让 AI 更'接地气', 也为产业输送更多 AI 人才。
据悉,2022 年, 特斯联还将进一步在沈阳、重庆等 AI PARK 落地科创中心, 让 AI 产业在全国范围内高速、高质量发展。
2022-05-06 00:51:50