小米 AI 实验室入选《麻省理工科技评论》中国“2021 人工智能创新研究院”
近日,《麻省理工科技评论》中国发布了《2021 人工智能创新研究院(AI Labs)报告》,多元且客观地描摹 AI 技术创新和未来技术趋势的年度图景,从而预见改变中国,甚至改变世界的技术力量。同时,报告遴选出 10 家具有技术创新力和引领力的企业 AI 研究院,小米 AI 实验室成功入选。这是对小米技术实力的认可。
小米 AI 实验室以"AI 渗透 C 端生活场景,延续完善 AIoT 战略布局"上榜。
《麻省理工科技评论》中国公布了小米 AI 实验室的上榜理由:"小米围绕 "手机 ×AIoT" 战略与核心业务需求,为用户提供丰富的智能生活体验。其自研技术广泛应用于智能手机、音箱等智能硬件产品以及电商等互联网服务业务中,并打造了业内领先的智能生活助理小爱同学,将 AI 技术全面融入 C 端用户细分生活场景。"
小米于 2014 年成立小米 AI 研究院的前身小米探索实验室,2016 年初正式成立小米 AI 实验室,研究方向包括计算机视觉、声学、语音、NLP、知识图谱、机器学习等多个领域。
报告指出,小米作为一家以智能手机、智能硬件和 IoT 平台为核心的消费电子及智能制造公司,关注基于硬件的 AI 技术支撑,将语音交互作为基础能力进行构建,优势体现在应用场景多样化、数据丰富度高。个性化、精细化、多模态和安全隐私性作为小米技术发展方向,AI 技术将更多地融入 C 端用户细分生活场景,通过软硬件技术结合的方式,在保证用户隐私安全的情况下,提供精细化服务,更加理解生活、贴近生活。
作为小米 AI 技术的 "试验田" 和 "弹药库",小米 AI 实验室旨在研发业内一流的 AI 技术,为公司的关键业务交付关键 AI 能力。与此同时,结合公司重大战略需求,开展探索性预研工作,为公司未来储备核心 AI 技术,提升公司技术品牌影响力。
小米 AI 自主研发技术,目前已经在计算机视觉、声学、语音、NLP、知识图谱、机器学习等研究方向取得一系列成果。
计算机视觉领域
小米 AI 实验室在手机相机和 AIoT 设备上已经落地了 40 多项视觉核心算法,为用户打造极致的拍照体验。其中,2021 年有 20 多项算法落地 10 款以上机型,另 20 多项预研算法正在进行中,也将逐渐落地到旗舰手机上。在全球最权威的第三方评测机构 DXO Mark 榜单上,AI 实验室的 HDR、人像超清、边缘画质提升技术助力小米手机 3 次登顶。魔法系列如魔法换天、魔法分身等分割效果好,速度快,体验新奇有趣。此外,由 AI 实验室和相机部联合打造的小米 12 计算摄影技术"万物追焦",拍照快、追焦稳,广获用户好评。
声学领域
小米 AI 实验室致力于人工智能声学技术的研究及工程落地,为小米手机及 IoT 全生态硬件产品打造业界领先的音频体验。目前 AI 通话降噪、协同唤醒、协同放音、空间音频等技术已在手机、电视、小爱、耳机等 60 余款产品中落地。2018 年小米建成国内首家全自动远场声学实验室并成为中国人工智能产业联盟首批联合实验室,小米远场声学测试规范确立为联盟测试标准。近年来团队牵头发起国际标准 1 项、国家标准 2 项、行业标准 2 项、团体标准 4 项及企业标准 2 项,为小米在远场声学领域奠定了行业领先优势。
语音领域
小米 AI 实验室在语音识别、语音唤醒、声纹识别、口语评测、语音合成、歌唱合成、AI 作曲与编曲等方面均取得了重大的突破。目前,小爱同学每日承接 1.9 亿次语音请求。小米 AI 实验室已经将 AI 语音技术落地到小米手机、平板、手表、手环、耳机、电视、音箱、手表、四足机器狗等产品上。与此同时,团队连续在 Interspeech 和 ICASSP 等国际语音顶级会议上发表了 10 多篇学术论文,并为公司夺得 5 项语音识别、语音唤醒和声纹识别技术的国际比赛冠军。
新一代 KaIdi
新一代语音团队由集团首席语音科学家 Daniel Povey 博士领衔,在维护现有 Kaldi 项目的同时,致力于开发新一代 Kaldi 项目。Kaldi 作为过去 10 来年业界最引人注目的开源语音项目,在科研界和产业界都取得了巨大成功。新一代 Kaldi 是小米纯自主研发的全新的面向未来的开源语音识别框架,该项目在推动语音识别技术发展的同时,也将提高小米语音识别技术的国际竞争力和影响力。经过一年多紧锣密鼓的开发,目前新一代 Kaldi 的三个子项目 --K2、Lhotse 和 Icefall,基本开发完成,并且已经在 2021 年 8 月的 InterSpeech 会议上正式对外发布,这意味着新一代 Kaldi 项目已经布局完成。相信随着新一代 Kaldi 的发布和广泛使用,将会彻底改变人们实现语音识别的方式。
小米集团首席语音科学家 Daniel Povey
NLP 领域
研发自然语言处理核心技术,打造领先的技术平台和创新产品。团队重点打造了搜索、推荐、广告、多模态、机器翻译、人机对话和文本创作等方向。
搜索、推荐、广告支持了小米商城、有品、新零售、广告推荐等业务。利用多模态技术自动生成广告创意,成功支持广告投放。机器翻译广泛应用到小爱同学、手机、MIUI 传送门与网页翻译、小爱老师、小爱鼠标等设备。设备端翻译体验业界领先,同声传译已上线到小爱面对面同传、会议同传、AI 字幕、通话翻译等场景,成为小米高端机型产品宣传页功能。人机对话方面重点研发了闲聊对话功能,是小爱同学在手机、音响等重要设备中用户最喜欢使用的功能之一。机器写作基于最新的预训练生成技术在对联、诗歌生成领域达到接近人类水平的效果,应用到小爱同学节日运营传播;语言风格转换技术成功支持了小爱同学多款自定义音色的语言风格定制。
知识图谱领域
此外,小米 AI 实验室在图谱构建和图谱应用领域均取得了重大突破。在图谱构建方面,小米 AI 实验室联合 OpenKG 进行了知识图谱的开源工作。另外在实体链接技术方面,2 次获得了中文短文本实体链接比赛的第一名。在图谱应用方面,知识图谱广泛应用于小爱,每日承接数亿次 query 请求,并在 2021 年 CCKS 的知识问答比赛中揽得第一名。智能客服业务依托知识图谱平台,打造了在线客服机器人、智能外呼、智能 IVR 等产品,为公司每年节省上千名客服人力。
在报告的洞察部分,《麻省理工科技评论》中国指出,企业的 AI 研究院是打造业务新增长曲线的主要阵地,其无形当中酝酿着新的破局点和增长点。在相机方向,小米 AI 实验室通过应用计算机视觉相关算法技术,提升拍照清晰度、对焦精确度、操作趣味性。在语音交互方向,小爱同学从语音助手逐步升级为智能生活助手。而 NLP 和知识图谱则在互联网内容领域应用广泛。总体来说,围绕小米 "手机 xAIoT" 的核心战略,小米人工智能已经在关键的 AI 产品和技术方面做好了完整布局。
技术创新只有与社会、行业、市场紧密结合,才能最大限度推动商业成果落地,从而真正做到改变人们的生产生活。未来,小米 AI 实验室将不断探索科技新高度,用人工智能的技术和产品,让更多人享受科技带来的美好生活。
2022-05-06 15:51:15