wuvin
Always take risks!
Toggle navigation
wuvin
主页
实验室的搬砖生活
机器学习
公开的学术内容
公开的其他内容
About Me
归档
标签
友情链接
ZYQN
ihopenot
enigma_aw
hzwer
杨宗翰
20220325 Paper Reading
2022-03-18 18:06:46
165
0
0
wuvin
# InLoc: Indoor Visual Localization with Dense Matching and View Synthesis (2018) * 本文提出了一个先针对建筑建立3D地图,随后使用相机估计当前位姿的方案. ![title](https://leanote.com/api/file/getImage?fileId=623c20daab644142b47f50cc) * 本文的创新点: * 之前的方案无法在室内场景中提取足够的特征(如墙面)。本文采用 multi-scale dense CNN features (CNN提前预训练好,提取多层网络特征。) 用于图片描述和特征匹配。 * 本文通过将问询图像(query image)与一个通过3D模型合成的虚拟视角比较,来验证新视角是否解析正确。 * 具体流程: NetVLAD方法(一个使用 CNN 和聚类来进行图像检索的方法)查询图片和数据库图片,选取最高的100个,使用 multi-scale dense CNN features 来对这100进行重新排序,选出top 10 来通过合成视野进行验证。 ![title](https://leanote.com/api/file/getImage?fileId=623c2406ab644142b47f50e1) # From coarse to fine: Robust hierarchical localization at large scale (2019) * 本文的目标是控制算力消耗的同时最大化定位鲁棒性 ![title](https://leanote.com/api/file/getImage?fileId=623c248bab644142b47f50e4) * 流程也是对比输入与数据库图像得到初步的结果(Prior retrieval),再通过 covisibility clustering 来把依照3D结构中可以被prior frames共同观察到的地点提取出来。对于每个地点,匹配从输入图像中提取的2D关键点和地点中所包含的3D点,结合一些现有方法推断出6-DoF姿态即完成定位。 ![title](https://leanote.com/api/file/getImage?fileId=623c25c2ab644142b47f5155) * 训练的时候加了点多任务蒸馏 ![title](https://leanote.com/api/file/getImage?fileId=623c2682ab644142b47f51c4) # Unifying deep local and global features for image search (2020) * 提出了一个模型同时完成全局特征和局部特征的提取。 * 全局特征即把整张图用一个向量表示,局部特征则是提取纹理特征。 * 基于分类方法训练的模型得到的一般都是全局特征,而之前提取局部特征则是使用模型的某一层特征图通过处理得到。 ![title](https://leanote.com/api/file/getImage?fileId=623c2914ab644142b47f5286) * 全局head使用了 GemPooling(即每个数的p次方和再开p次根,p可学习,本文p固定为3) 而非 AdaptivePooling。 * Attention loss:重建图像使用带attention权重的pooling+softmax。 * ArcFace loss(在角度空间中最大化分类界限): ![title](https://leanote.com/api/file/getImage?fileId=623c2d6cab644142b47f52f9) * ![title](https://leanote.com/api/file/getImage?fileId=623c29e7ab644142b47f52b3)
上一篇:
20220414 Paper Reading
下一篇:
20220317 Paper Reading
0
赞
165 人读过
新浪微博
微信
腾讯微博
QQ空间
人人网
提交评论
立即登录
, 发表评论.
没有帐号?
立即注册
0
条评论
More...
文档导航
没有帐号? 立即注册