残差 了解更多有关残差的内容
-
字节跳动博士研制的“AI 音乐家”火了:可一键完美分离人声和伴奏
AI 可以写歌、填词、改换风格、续写音乐。今天,AI 又来做编曲人了。上传一段《Stay》,一键按下,伴奏和人声就轻松分离。人声颇有种在空旷地带清唱的清晰感,背景乐都能直接拿去做混剪了!这样惊人的效果
2022-05-06 残差 卷积 系统 人声 网络 研究 音乐 伴奏 数据 深度 编码 实验 训练 字节 两个 低音 信号 声音 大学 片段 -
只需要几张 2D 卫星图片就能重建洛杉矶 3D 模型,效果不输谷歌地球
看到下面这张动图,你会想到什么?是谷歌地球,还是苹果自带的 3D 地图?其实都不是,它是用卫星和航拍图片直接渲染生成的洛杉矶。很难想象,如此精细的城市 3D 模型,竟然是用几张不同角度和高度的 2D
2022-05-06 尺度 训练 模型 图像 相机 细节 场景 数据 作者 论文 越来越 阶段 越来 效果 城市 大学 神经 颜色 香港 香港中文大学 -
arXiv 最火论文:研究“注意力机制”,来自清华大学计算机系胡事民团队
清华计图胡事民团队的这篇注意力机制的综述火了!在上周的 arXiv 上,这是最热的一篇论文。推特以及 GitHub 上也有不低的热度。而这篇论文引用近 200 篇内容,对计算机视觉领域中的各种注意力机
2022-05-06 注意力 机制 通道 代表 选择 论文 清华 空间 团队 内容 分支 方法 模型 不同 代表性 时间 类别 大学 计算机系 清华大学 -
谷歌又买算法送手机了,最新方法让背景虚化细节到头发丝
当真是买算法送手机!这不,谷歌又给"亲儿子"Pixel 6 塞福利了,让手机抠图也能细节到头发丝。看这效果,原本模糊的头发轮廓,咻地一下,就变成了纤毫毕现的样子!连发丝之间的缝隙也能精准抠到。这样一来
2022-05-06 网络 手机 效果 方法 图像 算法 细节 人物 数据 由此 神经 神经网络 背景 人像 分辨率 情况 模式 这是 摄影 发丝 -
在线可玩!这款 AI 语音模型让派大星承认自己是钢铁侠,造假小扎对口型,火到挤爆服务器
你敢信,派大星当众宣称自己是钢铁侠,漫威宇宙和比基尼海滩梦幻联动:I am Iron Man!这深沉憨厚又有点喜感的嗓音,是派大星本星没错了。而小扎也疯狂乱入,直接抢了派大星的台词,喊海绵宝宝去抓水母
2022-05-06 模型 口型 语音 人物 文本 大星 在线 声音 网友 输入 任务 创作者 台词 宝宝 海绵 网络 视觉 质量 链接 杰克 -
可以装在手机里的 3D 姿态估计,模型尺寸仅同类 1/7,平均关节位置误差却只有 5 厘米
长久以来,三维姿态估计都在追求准确性上一路狂奔。但精度提高的同时,也带来了计算成本的上升。而刚刚被 CPVR 2021 接受的论文中所提出的模型,MobileHumanPose 却可以同时做到又小又好
2022-05-06 模型 参数 性能 研究 函数 团队 成本 结构 编码 编码器 解码器 三维 位置 关节 同类 姿态 误差 人体 场景 姿势 -
微软图像算法被 MIT 硕士破解,轻松还原加密图片(已开源)
微软号称"永不会被逆向"的图像加密算法,现在被 MIT 一位硕士小哥轻松破解了。只用几行代码,原本被加密为一串数字的图片便"原形毕露",可以看清其大致轮廓。要知道,谷歌、Facebook、Twitte
2022-05-06 图像 方法 哈希 图片 加密 算法 微软 数据 小哥 时间 照片 用户 网络 苹果 隐私 安全 技术 数字 结果 保护 -
英特尔用 ViT 做密集预测效果超越卷积:性能提高 28%,在线可玩
用全卷积网络做密集预测 (dense prediction),优点很多。但现在,你可以试试 Vision Transformer 了 --英特尔最近用它搞了一个密集预测模型,结果是相比全卷积,该模型在
2022-05-06 图像 模型 卷积 任务 结果 数据 人员 特征 研究人员 研究 性能 效果 全局 结构 训练 不同 一致 一致性 分辨率 地址 -
模型难复现不一定是作者的错,最新研究发现模型架构要背锅
在不同初始化条件下,同一神经网络经过两次训练可以得到相同的结果吗?CVPR 2022 的一篇研究通过将决策边界 (Decision Boundary)可视化的方法,给出了答案 -- 有的容易,有的很难
2022-05-06 模型 决策 训练 现象 边界 作者 不同 区域 方法 结果 研究 参数 误差 噪声 标签 碎片 可视化 观察 设计 架构 -
又一 AI 大牛回国任教!沈春华加盟浙江大学,曾获澳大利亚科研终身成就奖
又一计算机视觉大牛回国任教!曾任阿德莱德大学终身教授的沈春华,于这个月加盟浙江大学,个人官网显示已更新。▲ 图源沈春华个人主页这些年来,沈春华教授带领团队做出过 RefineNet、FCOS 等著名的
2022-05-06 春华 教授 大学 实例 计算机 检测 模型 算法 论文 莱德 阿德 阿德莱德 主页 方法 目标 终身 个人 研究 设计 澳大 -
效果爆炸的开源漫画变身 AI,火到服务器几度挤爆
"排队 1241 人,等待 2600 秒……"-- 这届网友为了看一眼自己在动漫里的样子,可真是拼了。"始作俑者"是一款可以把人像变动漫的生成器。只需一张图片或一段视频,无论男女老少、明星素人都可以一
2022-05-06 生成 特征 生成器 网友 效果 卷积 方法 动漫 图片 大小 版本 网络 视频 在线 漫画 相同 参数 照片 项目 有效 -
融云实时通信全链路质量追踪与指标体系构建
10月21日,在上海举办的QCon全球软件开发者大会上,融云联合创始人兼CTO杨攀作为出品人发起的技术专场「实时通信技术」,受到开发者的欢迎与关注。融云首席架构师李淼、视频算法专家黄震坤、流媒体架构师
2022-05-06 质量 问题 实时 时间 客户 服务 编码 网络 节点 链路 视频 过程 音视 信息 全球 情况 数据 音频 处理 服务器