卷积 了解更多有关卷积的内容
-
英特尔用 ViT 做密集预测效果超越卷积:性能提高 28%,在线可玩
用全卷积网络做密集预测 (dense prediction),优点很多。但现在,你可以试试 Vision Transformer 了 --英特尔最近用它搞了一个密集预测模型,结果是相比全卷积,该模型在
2022-05-06 图像 模型 卷积 任务 结果 数据 人员 特征 研究人员 研究 性能 效果 全局 结构 训练 不同 一致 一致性 分辨率 地址 -
饿了么“确定食物热量”相关专利获授权:通过卷积神经网络训练来提高精确度
IT之家 11 月 30 日消息,今日,拉扎斯网络科技(上海)有限公司(饿了么)获得"一种确定食物热量的方法和装置"专利授权,申请日期为 2018 年 4 月。企查查专利摘要显示,本发明实施例涉及热量
2022-05-06 热量 食物 成分 专利 卷积 神经 图片 热值 特征 质量 网络 之家 信息 名称 方法 装置 精确 神经网络 精确度 训练 -
字节跳动博士研制的“AI 音乐家”火了:可一键完美分离人声和伴奏
AI 可以写歌、填词、改换风格、续写音乐。今天,AI 又来做编曲人了。上传一段《Stay》,一键按下,伴奏和人声就轻松分离。人声颇有种在空旷地带清唱的清晰感,背景乐都能直接拿去做混剪了!这样惊人的效果
2022-05-06 残差 卷积 系统 人声 网络 研究 音乐 伴奏 数据 深度 编码 实验 训练 字节 两个 低音 信号 声音 大学 片段 -
华为人脸图像去除眼镜专利获授权
感谢IT之家网友 软媒新友2038191 的线索投递!IT之家 4 月 6 日消息,信息显示,4 月 5 日,华为技术有限公司"一种人脸图像中眼镜去除方法及装置"专利获授权。摘要显示,一种人脸图像中眼
2022-05-06 人脸 眼镜 特征 图像 面部 区域 卷积 方法 之家 信息 技术 眼睛 装置 检测 专利 华为 像素 公司 所在 摘要 -
量子 CNN 不存在梯度消失问题,物理学家已完成理论证明
量子计算机上的机器学习,也就是量子神经网络(QNN),有许多传统神经网络望尘莫及的潜力,比如量子数据分析。然而许多 QNN 架构,没法对大型问题进行训练,因为它们都存在着"贫瘠高原"(barren p
2022-05-06 量子 神经 神经网络 网络 梯度 研究 问题 贫瘠 函数 高原 卷积 成本 计算机 训练 人员 数据 材料 状态 研究人员 分析 -
效果爆炸的开源漫画变身 AI,火到服务器几度挤爆
"排队 1241 人,等待 2600 秒……"-- 这届网友为了看一眼自己在动漫里的样子,可真是拼了。"始作俑者"是一款可以把人像变动漫的生成器。只需一张图片或一段视频,无论男女老少、明星素人都可以一
2022-05-06 生成 特征 生成器 网友 效果 卷积 方法 动漫 图片 大小 版本 网络 视频 在线 漫画 相同 参数 照片 项目 有效 -
机器人第一次独立手术!最快 55 分钟缝合肠道,华裔教授带队研发,“结果显著优于外科医生”
没有人类指导,机器人自己就完成了手术?!结果还显著优于外科医生。最近,有这样一项实验引发了大家关注。美国约翰・霍普金斯研究团队设计研发的手术机器人 STAR,在猪的软组织上首次独立完成腹腔镜肠道吻合手
2022-05-06 机器 机器人 软组织 运动 研究 结果 操作员 规划 跟踪 教授 肠道 人类 位置 卷积 团队 工具 时间 目标 系统 网络 -
2D 图片变 3D:最新 3D GAN 可生成三维几何数据,模型速度提升 7 倍
2D 图片变 3D,还能给出 3D 几何数据?英伟达和斯坦福大学联合推出的这个 GAN,真是刷新了 3D GAN 的新高度。而且生成画质也更高,视角随便摇,面部都没有变形。与过去传统的方法相比,它在速
2022-05-06 方法 效果 研究 输出 分辨率 斯坦 斯坦福大学 图像 神经 网络 鉴别 数据 速度 一致 位置 神经网络 英伟 生成 框架 解码器 -
机器学习研究今年谁最火?Reddit 为提名选手吵成一团
机器学习今年的热门研究,会是什么?近日,有网友在 Reddit 开了这么一个盘,立刻吸引了大批 MLer 的注意。有人提名自监督模型,有人认为表征学习越来越受到关注,还有人认为基于物理的机器学习才是未
2022-05-06 学习 机器 几何 深度 对称 网络 量子 问题 监督 解释 评论 对称性 数据 方法 这是 领域 检索 热门 就是 方向 -
各路 StyleGAN 大汇总,包括全景图生成、图像到图像翻译等
StyleGAN 在各种图像处理和编辑任务上,表现很惊艳。然而,"干一种活"就得换个体系重新"培训"一次,太麻烦。终于,有人细细研究了一下,发现:其实只通过预训练和潜空间上的一点小操作,就可以让 St
2022-05-06 图像 方法 空间 特征 生成 插值 作者 混合 效果 研究 选择 全景 不同 属性 用户 区域 姿势 样式 模型 维度 -
材料 3D 微观扫描图像易受损,AI 能高质量秒修复
8 月 19 日消息,近日,俄罗斯斯科尔科沃科学技术研究院和比利时鲁汶大学的研究人员设计出一种神经网络方法,可修复材料 3D 微观扫描图像。在材料研究中,想要看清材料微观结构,就需要对其进行扫描和成像
2022-05-06 图像 研究 材料 技术 网络 人员 研究人员 训练 算法 结构 生成 数据 学习 新材料 神经 神经网络 纤维 误差 新材 处理 -
华为首次自曝“天才少年”成果:入职不到一年算法研究用于千万台 Mate/P 系列手机,网友:值 200 万年薪!
要说起华为"天才少年",那话题度可以说是直接拉满。但在百万级年薪背后,"天才少年"们日常从事怎样的工作,却始终保持神秘。现在,下文终于来了 -- 华为首次主动公开"天才少年"最新动向:2019 年入职
2022-05-06 华为 算法 研究 天才 少年 像素 模型 团队 图像 处理 方法 网络 论文 年薪 成功 方向 计算机 实验室 精度 结构 -
8 核 CPU + 14 核 GPU,吉利首款国产 7nm 车规级智能座舱芯片“龍鹰一号”正式面市
IT之家 12 月 10 日消息,今天,吉利宣布由旗下芯擎科技自研的中国第一颗 7 纳米制程车规级 SOC 芯片"龍鹰一号"正式面世。2022 年三季度,"龍鹰一号"将实现量产,并于年底按计划前装量产
2022-05-06 吉利 芯片 安全 智能 核心 支持 之家 安全岛 引擎 技术 旗下 科技 车型 最高 操作系统 主力 信息 关键 内存 制程 -
“非深度网络”12 层打败 50 层,普林斯顿 + 英特尔:更深不一定更好
"深度"是深度神经网络(DNN)的关键词。但网络越深也就意味着,训练时反向传播的链条更长,推理时顺序计算步骤更多、延迟更高。而深度如果不够,神经网络的性能往往又不好。这就引出了一个问题:是否有可能构建
2022-05-06 网络 深度 作者 性能 分辨率 神经 神经网络 实际 宽度 特征 子网 处理 延迟 推理 不同 任务 优势 关键 准确率 子结构 -
打造个人专属音效 酷狗“多音轨”人声、乐器任你调
1 月 22 日, 酷狗音乐 IOS 版本 11.0.8 更新, 此次版本更新让双端用户都能通过酷狗音乐 App 能够体验酷狗蝰蛇音效・多音轨功能。该功能是在 12 月随着酷狗音乐 11.0 安卓版本
2022-05-06 音效 功能 音乐 用户 多音 空间 蝰蛇 体验 乐队 同时 声音 效果 不同 听歌 市场 技术 音频 处理 乐器 更多 -
微软 Azure AI 又一里程碑:Neural TTS 新模型呈现真人般情感饱满的 AI 语音
IT之家 1 月 27 日消息,如何让 AI 语音有效模仿人类对话的丰富动态与情感,已成为全球研究者的共同挑战。据微软官方消息,就在不久前,微软 Azure Neural TTS(神经网络文本转语音)
2022-05-06 语音 真人 微软 模型 文本 研究 官方 用户 自然 视角 语言 对话 支持 逼真 之家 产品 功能 团队 声学 新一代 -
打打字就能指挥算法视频抠图,Transformer 掌握跨模态新技能
都说 Transformer 适合处理多模态任务。这不,在视频目标分割领域,就有人用它同时处理文本和视帧,提出了一个结构更简单、处理速度更快(每秒 76 帧)的视频实例分割框架。这个框架只需一串文本描
2022-05-06 序列 文本 视频 模态 指标 模型 实例 特征 结果 处理 任务 作者 数据 目标 对象 精度 试玩 生成 两个 人员 -
微软图像算法被 MIT 硕士破解,轻松还原加密图片(已开源)
微软号称"永不会被逆向"的图像加密算法,现在被 MIT 一位硕士小哥轻松破解了。只用几行代码,原本被加密为一串数字的图片便"原形毕露",可以看清其大致轮廓。要知道,谷歌、Facebook、Twitte
2022-05-06 图像 方法 哈希 图片 加密 算法 微软 数据 小哥 时间 照片 用户 网络 苹果 隐私 安全 技术 数字 结果 保护 -
高速无人机独立穿越森林:自主避障/规划路线,时速高达 40 公里
10 月 13 日消息,时速 40 公里的无人机,并不稀奇。但能用这个速度在茂密的森林里穿梭,还是"自己遛自己"的那种,你见过吗?如此高超的避障飞行走位,可不是人类用手柄操作出来的,全靠无人机的"自我
2022-05-06 无人机 处理 训练 飞行 控制器 控制 传感器 专家 环境 现实 轨迹 速度 信息 输入 传统 性能 相机 障碍 障碍物 高速 -
一键 Cosplay 各路动漫人物,快手算法工程师开发的这个 BlendGAN 火了
动漫、艺术作品里的人物,他们极具张力的形象往往给人们留下深刻的印象。但如果说现在,你也可拥有他们的同款造型呢?没错,依旧来自是"无所不能"的对抗生成网络(Generative Adversarial
2022-05-06 模型 风格 生成 不同 就是 混合 人物 动漫 快手 人脸 代码 效果 方法 样式 照片 编码 编码器 艺术 造型 学习