wuvin
Always take risks!
Toggle navigation
wuvin
主页
实验室的搬砖生活
机器学习
公开的学术内容
公开的其他内容
About Me
归档
标签
友情链接
ZYQN
ihopenot
enigma_aw
hzwer
杨宗翰
RGBD 生成/预测
2023-05-09 16:07:38
147
0
0
wuvin
* 目前常规深度估计的SOTA 是 SwinV2 # HiMODE: A Hybrid Monocular Omnidirectional Depth Estimation Model * 室内全景图深度估计。似乎没有用到什么针对全景图的网络结构。 * ![title](https://leanote.com/api/file/getImage?fileId=63d87673ab6441170998fd71) * 他说是ST3D 的 SOTA 那就是吧 * ![title](https://leanote.com/api/file/getImage?fileId=63d876a1ab6441170998fd74) # 其他 * Generative Scene Synthesis via Incremental View Inpainting using RGBD Diffusion Models: 用的是 ScanNetV2 (1.4T RGBD数据)。 * NYU-Depth V2: 室内RGBD数据,大约2.8G有语义标注,其余400GB只有深度。 * KITTI Eigen Split: KITTI的子集,大约30GB的样子。 * NeRDi: 用的是 Dense Prediction Transformer (DPT) model (一种密集预测的ViT,来自论文[Vision Transformers for Dense Prediction](https://arxiv.org/pdf/2103.13413.pdf)),在一个共有 1.4M 张图的混合数据集上训练的(包括DIW,ETH3D,Sintel,KITTI,NYU,TUM)。有开源模型存档点。 * NeuralWindow Fully-connected CRFs for Monocular Depth Estimation: 上一篇的后续follow,没有混合数据集训练,但有NYUv2和KITTI的存档点。 * BinsFormer: 同样是后续SOTA之一。 * OmniFusion (CVPR2022) : 全景图单目深度估计。 * [Monocular-Depth-Estimation-Toolbox](https://github.com/zhyever/Monocular-Depth-Estimation-Toolbox): github 开源单目估计工具箱,支持四种SOTA模型,7种训练方法,4个主流数据集。劳模! # DAG: Depth-Aware Guidance with Denoising Diffusion Probabilistic Models * CVPR2023 文章,[代码](https://github.com/KU-CVLAB/DAG)暂时还没开源。 * 一个与深度密切相关的2D生成模型。 * ![title](https://leanote.com/api/file/getImage?fileId=63f4327dab6441171099da83) * 似乎质量还不错 * ![title](https://leanote.com/api/file/getImage?fileId=63f432a3ab6441171099da87)
上一篇:
全景图 Diffusion 生成
下一篇:
基于 Cross Attention 的 SD 控制
0
赞
147 人读过
新浪微博
微信
腾讯微博
QQ空间
人人网
提交评论
立即登录
, 发表评论.
没有帐号?
立即注册
0
条评论
More...
文档导航
没有帐号? 立即注册