视觉定位方法分类与各自技术路线及局限性解析
该思维导图对视觉定位方法进行了分类,主要包括三类:基于结构的方法、场景坐标回归方法和无地图方法。基于结构的方法依赖点云地图,具备高精度但局限于存储效率和更新维护;场景坐标回归方法通过神经网络实现端到端定位,存储需求低,但依赖深度训练数据;无地图方法则涵盖绝对和相对位姿回归,但精度较低,依赖隐式学习几何关系。
源码
# 视觉定位方法分类
## 1. 基于结构的方法
- **技术路线**
- SfM/SLAM构建点云地图
- 层级化架构
- 图像检索
- 点云匹配
- 位姿解算
- **代表算法**
- HFNet
- 知识蒸馏特征
- Progressive Search
- 渐进式搜索
- **核心优势**
- 高精度
- 厘米级定位
- **局限性**
- 存储效率低
- 需存点云
- 描述符占用空间
- 更新维护困难
- 动态场景需重建
- 系统僵化
- 地图与描述符强绑定
## 2. 场景坐标回归方法
- **技术路线**
- 神经网络实现
- 直接回归像素
- 转化为3D坐标
- **代表算法**
- DSAC/DSAC++
- 可微分RANSAC方法
- HSCNet
- 分层场景编码方法
- **核心优势**
- 端到端定位
- 存储需求低
- 不依赖大型地图数据
- **局限性**
- 依赖深度训练数据
- 需点云
- 深度图数据
- 泛化能力差
- 场景依赖性高
## 3. 无地图方法
- **纯学习式**
- **技术路线**
- 绝对位姿回归(APR)
- PoseNet算法
- 相对位姿回归(RPR)
- Siamese网络
- **局限性**
- 精度低
- 隐式学习几何关系
图片
