19 KiB
EKF 改进建议报告
基于: 审查报告 + HANDOFF_v2.md + 全部相关源码精读
约束条件: 左右四个 VL53 侧向激光测距数据可信度不高;IMU yaw 准确度非常高
目标: 逐条回应审查报告发现,判断是否属实、是否需要修改,并给出具体改进方案
总体判断
审查报告整体质量很高,8 条发现中 7 条经代码验证属实,1 条需要在新约束条件下重新评估优先级。结合"VL53 可信度低、IMU yaw 准确度高"这一关键约束,改进策略需要做出重大调整:不应恢复侧墙航向观测,而应进一步强化 IMU 主导地位,同时用分侧补偿和自适应噪声解决横向偏置问题。
一、逐条回应审查报告
1. 横向偏置补偿模型不完整 — "持续偏右"头号嫌疑
审查报告结论: 属实
是否需要修改: 是,优先级最高
代码验证:
// app_tasks.c:422 — y_offset 硬编码为 0
.y_offset = 0.0f,
// corridor_ekf.c:382-396 — 只有单一 side_sensor_inset,无分侧区分
float inset = s_cfg.side_sensor_inset;
float d_center = (W - Rw) / 2.0f + inset; // 左右共用同一个 d_center
// vl53_calibration_config.h:23-51 — 四颗 VL53 的 offset 校准值各不相同
// 左前: 10000 um, 左后: 10000 um, 右前: 9000 um, 右后: 13000 um
分析: 四颗 VL53 的 offset 存在高达 4mm 的差异(9mm vs 13mm),但 EKF 只使用一个 side_sensor_inset 且设为 0.0。在 40cm 宽的走廊中每侧仅有 ~10cm 间距,4mm 差异等于 4% 的系统性横向偏置。这个偏置会被 EKF 当作"真实居中位置"持续输出给控制器。
加上 VL53 数据本身可信度不高这一约束,这个问题的严重性进一步放大——噪声大的传感器+系统性偏置=控制器持续偏向一侧。
2. EKF 取消侧墙航向观测,e_th 几乎完全依赖 IMU
审查报告结论: 属实
是否需要修改: 否,当前设计在新约束下是正确的
代码验证:
// corridor_ekf.c:345-350 注释明确说明了设计决策
// 设计决策 (方向 B — IMU 主导航向):
// 侧墙激光仅用于更新横向位置 e_y,不再构建航向观测 z_eth_L/z_eth_R。
// 侧墙前后差分 (d_lr-d_lf) 的噪声在 ±2cm 误差下过大,不适合做航向主观测。
分析: 审查报告建议"恢复低权重的侧墙航向修正"。但在"VL53 可信度不高"的约束下,这个建议不应采纳。理由:
- 侧墙航向观测依赖同侧前后 VL53 的差分:
atan2(d_lr - d_lf, L_s),传感器基线L_s = 12cm。如果单颗 VL53 噪声在 ±2cm 量级,差分噪声将达 ±2.8cm,对应航向噪声atan2(0.028, 0.12) ≈ 13°,这比 IMU yaw 的精度差了一个数量级。 - IMU yaw "准确度非常高"已被确认,它是航向估计的最佳来源。
- 引入低质量侧墙航向观测反而会污染 EKF 中高精度的 e_th 估计。
结论: 当前"IMU 主导航向"的设计方向 B 在本项目约束下是正确的。不需要恢复侧墙航向观测。
3. IMU yaw 参考锁定过早
审查报告结论: 属实
是否需要修改: 需要调整,但策略不同于审查报告建议
代码验证:
// corridor_filter.c:96-100
if (!s_imu_yaw_ref_set && out_state->conf >= 0.3f) {
s_imu_yaw_ref_rad = imu_yaw_continuous_rad - out_state->ee_th;
s_imu_yaw_ref_set = true;
}
分析: 审查报告建议"要求双侧观测稳定、e_y 和 e_th 较小、连续若干拍后再锁"。但考虑到 VL53 可信度低,依赖"双侧观测稳定"来判断是否可以锁定 yaw_ref 本身就不可靠。
更好的方案是:既然 IMU yaw 准确度非常高,yaw_ref 的锁定应该主要看入沟姿态是否对正,而不是看 VL53 是否收敛。具体来说:
- 入沟转向阶段 IMU 已经转了 85°+,转向完成时 IMU 的绝对 yaw 值就是走廊方向的最佳估计
- 可以直接在
transition_to(GNAV_REACQUIRE)时,用 IMU 当前 yaw 作为 yaw_ref(而不是等 VL53 收敛后再锁) - conf ≥ 0.3 这个门槛在 VL53 不可靠时意义不大
4. CorridorFilter_Update() 覆盖 EKF 的 conf 和诊断字段
审查报告结论: 属实,是确定性 bug
是否需要修改: 是
代码验证:
// corridor_filter.c:103-106
if (s_imu_yaw_ref_set) {
CorridorEKF_UpdateIMUYaw(imu_yaw_continuous_rad, s_imu_yaw_ref_rad, true);
CorridorEKF_GetState(out_state); // ← 覆盖了之前 Update() 写入的 conf、reject_mask、maha_d2
out_state->t_ms = obs->t_ms;
}
// corridor_ekf.c:568-587 — GetState() 重新计算 conf,只看 P_trace
float P_trace = s_state.P[0][0] + s_state.P[1][1] + s_state.P[2][2];
out->conf = clampf(1.0f - P_trace * 0.5f, 0.0f, 1.0f);
out->mahalanobis_d2 = 0.0f; // ← 清零
out->obs_reject_mask = 0U; // ← 清零
分析: CorridorEKF_Update() 精心计算了包含 valid_sides、reject_mask、side_factor 的 conf,但 GetState() 把这些全部丢弃,只用 P_trace 重算。这会让下游(安全层、重捕获判定)对 EKF 健康度的判断偏乐观。
5. 转向逻辑对 IMU 失效没有后备路径
审查报告结论: 属实
是否需要修改: 是,但优先级中等(因 IMU 准确度高,实际触发概率低)
代码验证:
// global_nav.c:223-224
float imu_yaw = board->imu_yaw_continuous.is_valid
? board->imu_yaw_continuous.value : 0.0f; // IMU 无效时用 0
// nav_script.c:259-265 — 注释写了 fallback,但没有实现
// 后备:如果 IMU 离线,退化回 EKF e_th 差值判定。
float imu_delta_deg = imu_yaw_continuous_deg - s_internal.turn_start_imu_yaw_deg;
delta_turned = imu_delta_deg * 0.01745329252f; // 始终用 IMU,无 fallback
分析: IMU 准确度高意味着此 bug 实际触发概率极低,但代码逻辑确实存在问题。IMU 无效时 yaw 变成 0,会导致转向角度计算完全错误。应该至少加一个 fail-safe(IMU 无效时立即停车)。
6. NavScript 的 EXIT 阶段不可达
审查报告结论: 属实,是确定性 bug
是否需要修改: 是(单沟测试模式下需要修复)
代码验证:
// nav_script.c:34 — pass_count 在入沟时置为 1
s_internal.pass_count = 1;
// 后续 CORRIDOR_FORWARD → TURN → CORRIDOR_BACKWARD → TURN → CORRIDOR_FORWARD 循环
// pass_count 没有递增逻辑,也没有基于 pass_count 跳转到 EXIT 的代码
分析: 状态机在 FORWARD ↔ BACKWARD 之间无限循环,永远到不了 EXIT。在单沟测试模式下,机器人会无限往返直到电量耗尽。与赛道模式无关(赛道走 GlobalNav),但作为测试工具应该修复。
7. HANDOFF_v2.md 与代码状态漂移
审查报告结论: 属实
是否需要修改: 是
代码验证:
// HANDOFF_v2.md:582 写的是 USE_GLOBAL_NAV = 1
// robot_params.h:385 实际值
#define USE_GLOBAL_NAV 0 // ← 文档说 1,代码是 0
// HANDOFF_v2.md:635 写 kd_theta = 0.1
// robot_params.h:229 实际值
#define PARAM_CTRL_KD_THETA 0.4f // ← 文档说 0.1,代码是 0.4
// HANDOFF_v2.md:636 写 kp_y = 3.0
// robot_params.h:238 实际值
#define PARAM_CTRL_KP_Y 4.0f // ← 文档说 3.0,代码是 4.0
// HANDOFF_v2.md:647 写 d_front_stop = 0.08
// robot_params.h:282 实际值
#define PARAM_SAFE_D_FRONT_STOP 0.10f // ← 文档说 0.08,代码是 0.10
分析: 多个关键参数值已漂移。对于正在调试"持续偏右"问题的人来说,如果按文档值理解系统行为会导致误判。
8. EKF 接口与实现存在漂移
审查报告结论: 属实
是否需要修改: 是(代码质量问题,不影响功能但影响维护)
代码验证:
// corridor_msgs.h:13 — 仍声明 3 维观测
#define EKF_OBS_DIM 3 // [z_ey, z_eth_L, z_eth_R]
// corridor_ekf.h:12-17 — 头文件注释仍描述 3 维观测模型
// 观测向量:z = [z_ey, z_eth_L, z_eth_R]^T
// corridor_ekf.c — 实际只做 1 维 e_y 更新 + 独立 1DOF IMU yaw 更新
// corridor_ekf.h:81 — K 矩阵仍按 3x3 分配
float K[EKF_STATE_DIM][EKF_OBS_DIM]; // 3x3,实际只用 3x1
分析: EKF_OBS_DIM 仍为 3,但实际只做 1DOF 侧墙更新。innovation[3] 数组从未被写入。S[3][3], S_inv[3][3], K[3][3] 分配了多余空间。不影响运行但浪费 RAM 且误导维护者。
二、基于"VL53 低可信度 + IMU yaw 高精度"的 EKF 改进方案
核心思路
既然 VL53 不可靠而 IMU 非常可靠,改进策略应该是:
- 航向估计: 完全信任 IMU,不引入侧墙航向观测(维持现状,审查报告第 2 条建议不采纳)
- 横向估计: 降低 VL53 的信任度(增大 R),但通过分侧补偿消除系统性偏置
- 置信度: 改用更保守的计算方式,不能因为 P_trace 小就认为状态好
改进 A: 分侧横向补偿 (解决"持续偏右")
问题本质: 左右 VL53 安装不对称+校准值不同,但 EKF 用同一个 d_center 处理左右观测。
改进方案: 在 CorridorEKFConfig_t 中新增 left_sensor_inset 和 right_sensor_inset,替代单一的 side_sensor_inset。
// corridor_ekf.h — 新增配置字段
typedef struct {
// ... 现有字段 ...
float left_sensor_inset; // 左侧 VL53 内缩距离 (实测)
float right_sensor_inset; // 右侧 VL53 内缩距离 (实测)
// 保留 side_sensor_inset 做向后兼容默认值
} CorridorEKFConfig_t;
// corridor_ekf.c — Update() 中分别计算左右期望读数
float d_center_left = (W - Rw) / 2.0f + s_cfg.left_sensor_inset;
float d_center_right = (W - Rw) / 2.0f + s_cfg.right_sensor_inset;
if (left_ok) {
z_ey += d_center_left - ((d_lf + d_lr) / 2.0f) - yoff;
valid_sides++;
}
if (right_ok) {
z_ey += ((d_rf + d_rr) / 2.0f) - d_center_right - yoff;
valid_sides++;
}
标定方法: 将机器人手动放在走廊正中央(卷尺确认),记录四颗 VL53 的原始读数。左侧期望读数 = (走廊宽 - 车宽)/2,与实际读数的差就是 left_sensor_inset,右侧同理。
改进 B: 增大 VL53 观测噪声 R_ey (适配低可信度传感器)
当前值: PARAM_EKF_R_EY = 0.002(相当于 VL53 标准差 ~4.5mm,过于乐观)
建议值: 根据 VL53 "可信度不高"的实际表现,建议调大到 0.01 ~ 0.02(标准差 ~10-14mm)
// robot_params.h
#define PARAM_EKF_R_EY 0.015f // 从 0.002 提高到 0.015,降低对 VL53 的信任度
效果: EKF 会更缓慢地跟踪 VL53 噪声跳变,横向估计更平滑。配合 IMU 高精度航向,控制器输出更稳定。
改进 C: 降低 IMU 航向观测噪声 R_eth_imu (充分利用高精度 IMU)
当前值: PARAM_EKF_R_ETH_IMU = 0.01
建议值: 既然 IMU yaw "准确度非常高",应该给更低的 R 值,让 EKF 更信任 IMU
// robot_params.h
#define PARAM_EKF_R_ETH_IMU 0.002f // 从 0.01 降低到 0.002
注意: 当前 R_eth_imu 的注释说"应明显大于侧墙航向观测 R_ETH",但既然侧墙航向观测已经被取消了,这个约束不再适用。
改进 D: 修复 conf 覆盖 bug
// corridor_filter.c — 改进 CorridorFilter_Update()
if (s_imu_yaw_ref_set) {
CorridorEKF_UpdateIMUYaw(imu_yaw_continuous_rad, s_imu_yaw_ref_rad, true);
// 修改: 只更新状态值(e_y, e_th, s, P),不覆盖 conf 和诊断字段
CorridorState_t imu_updated;
CorridorEKF_GetState(&imu_updated);
out_state->e_y = imu_updated.e_y;
out_state->e_th = imu_updated.e_th;
out_state->s = imu_updated.s;
memcpy(out_state->P, imu_updated.P, sizeof(out_state->P));
// 保留 out_state->conf, obs_reject_mask, mahalanobis_d2 来自 CorridorEKF_Update()
out_state->t_ms = obs->t_ms;
}
改进 E: IMU yaw 参考锁定策略优化
既然 IMU yaw 准确度高,锁定策略应改为:
// corridor_filter.c — 新的锁定策略
if (imu_yaw_valid) {
if (!s_imu_yaw_ref_set) {
// 方案: 不等 VL53 收敛,直接在 EKF reset 后的首拍用 IMU 当前 yaw 锁定
// 理由: IMU yaw 精度高,转向完成后 IMU 指向即走廊方向
// 此时 e_th 应为 0(刚 reset),所以 ref = imu_yaw - 0 = imu_yaw
s_imu_yaw_ref_rad = imu_yaw_continuous_rad; // 不减 e_th,因为刚 reset 为 0
s_imu_yaw_ref_set = true;
}
if (s_imu_yaw_ref_set) {
CorridorEKF_UpdateIMUYaw(imu_yaw_continuous_rad, s_imu_yaw_ref_rad, true);
// ... (用改进 D 的方式更新 out_state)
}
}
优势: 消除了审查报告第 3 条中"入沟偏角被固化为参考"的风险。因为 yaw_ref 在 reset 后立即锁定为 IMU 当前值(即转向完成后的方向),不会等到 VL53 不靠谱地"收敛"后才锁。
改进 F: VL53 单侧可用时的自适应 R
当只有一侧 VL53 有效时,观测质量明显下降,应该动态增大 R:
// corridor_ekf.c — Update() 中
float R_ey = s_cfg.r_ey;
if (valid_sides == 2) {
R_ey *= 0.5f; // 双侧观测,噪声更低(现有逻辑)
} else if (valid_sides == 1) {
R_ey *= 3.0f; // 新增: 单侧观测时大幅增大噪声,降低信任度
}
理由: 单侧 VL53 在可信度本就不高的情况下,缺少交叉验证,不应赋予和双侧同等的信任权重。
三、非 EKF 相关改进
改进 G: IMU 失效安全保护
// global_nav.c — execute_turn() 中加入 IMU 有效性检查
static void execute_turn(...)
{
if (!board->imu_yaw_continuous.is_valid) {
// IMU 失效: 立即停车,不继续盲转
out->override_v = 0.0f;
out->override_w = 0.0f;
out->use_override = true;
out->safety_mode = SAFETY_MODE_IDLE; // 停车
// 超时后会被外部超时保护捕获进入 ERROR
return;
}
// ... 正常转向逻辑 ...
}
改进 H: NavScript EXIT 路径修复
// nav_script.c — 在 CORRIDOR_BACKWARD 到端后,增加 pass_count 递增和退出判断
case SCRIPT_STAGE_CORRIDOR_BACKWARD: {
// ... 到端检测 ...
if (s_internal.end_armed && front_ok && obs->d_front <= s_cfg.d_entry_exit_front) {
s_internal.pass_count++; // ← 新增: 递增趟数
if (s_internal.pass_count >= 3) { // 例如走 3 趟后退出
s_stage = SCRIPT_STAGE_EXIT;
} else {
s_internal.turn_start_e_th = state->e_th;
s_internal.turn_start_imu_yaw_deg = imu_yaw_continuous_deg;
s_internal.turn_started = false;
s_internal.post_turn_stage = SCRIPT_STAGE_CORRIDOR_FORWARD;
s_stage = SCRIPT_STAGE_TURN_AT_END;
}
out->request_corridor = false;
}
break;
}
改进 I: EKF 接口维度清理
// corridor_msgs.h — 更新为实际使用的维度
#define EKF_OBS_DIM 1 // 实际只做 1DOF 侧墙更新 (z_ey)
// 或者如果考虑 IMU 独立更新:
// #define EKF_OBS_DIM_WALL 1
// #define EKF_OBS_DIM_IMU 1
同时更新 corridor_ekf.h 的头部注释,去掉 z_eth_L, z_eth_R 的描述,标注当前实际是 1DOF 侧墙 + 1DOF IMU 独立更新。
改进 J: 文档同步
更新 HANDOFF_v2.md 中以下不一致的参数值:
| 参数 | 文档值 | 代码实际值 | 操作 |
|---|---|---|---|
USE_GLOBAL_NAV |
1 | 0 | 更新文档为 0 |
kd_theta |
0.1 | 0.4 | 更新文档为 0.4 |
kp_y |
3.0 | 4.0 | 更新文档为 4.0 |
d_front_stop |
0.08 | 0.10 | 更新文档为 0.10 |
四、改进优先级排序
| 优先级 | 改进项 | 预期效果 | 工作量 |
|---|---|---|---|
| P0 | A: 分侧横向补偿 | 直接解决"持续偏右"根因 | 中 (改 EKF 配置 + 实测标定) |
| P0 | D: 修复 conf 覆盖 bug | 消除置信度虚高,安全层能正确响应 | 小 (改几行) |
| P1 | B: 增大 R_ey | 降低 VL53 噪声对控制的影响 | 小 (改一个参数) |
| P1 | C: 降低 R_eth_imu | 充分利用 IMU 高精度 | 小 (改一个参数) |
| P1 | E: yaw_ref 锁定优化 | 消除入沟偏角固化风险 | 小 (改几行) |
| P2 | F: 单侧自适应 R | 单侧退化时更鲁棒 | 小 |
| P2 | G: IMU 失效保护 | 防止 IMU 瞬断导致盲转 | 小 |
| P2 | H: NavScript EXIT 修复 | 单沟测试可正常收尾 | 小 |
| P3 | I: 接口维度清理 | 代码可维护性 | 中 |
| P3 | J: 文档同步 | 消除调试误判 | 小 |
五、建议调试验证流程
第 1 步: 实测标定 (P0-A)
- 将机器人用卷尺精确放在走廊正中央
- 记录四颗 VL53 的原始读数 (mm)
- 计算
left_sensor_inset= 理论值 - 实测左侧平均值 - 计算
right_sensor_inset= 理论值 - 实测右侧平均值 - 填入代码
第 2 步: 参数调整 (P1-B,C)
- 修改
R_ey = 0.015,R_eth_imu = 0.002 - 单沟
USE_GLOBAL_NAV=0模式验证 - 观察 e_y 估计值是否居中、是否平滑
第 3 步: 修复 bug (P0-D, P1-E)
- 修复 conf 覆盖
- 优化 yaw_ref 锁定
- 单沟验证:观察入沟后 conf 是否合理、e_th 是否稳定
第 4 步: 偏右验证
- 完成以上修改后,重新做单沟测试
- 如果偏右问题消失 → 核心问题已解决
- 如果仍有轻微偏向 → 微调
y_offset参数 (之前硬编码 0 的那个)
第 5 步: 赛道模式测试
- 切换
USE_GLOBAL_NAV=1 - 验证入沟重捕获是否正常
- 验证沟内偏右问题是否在多沟遍历中复现
六、总结
| 审查报告条目 | 是否属实 | 是否采纳建议 | 说明 |
|---|---|---|---|
| 1. 横向偏置不完整 | 属实 | 采纳并扩展 | 改为分侧补偿 |
| 2. 恢复侧墙航向观测 | 属实(现象) | 不采纳建议 | VL53 不可靠时恢复航向观测有害 |
| 3. yaw_ref 锁定过早 | 属实 | 部分采纳 | 改为 IMU 驱动的即时锁定 |
| 4. conf 覆盖 bug | 属实 | 采纳 | 确定性 bug 必须修复 |
| 5. IMU 失效无后备 | 属实 | 采纳 | 加 fail-safe 停车 |
| 6. EXIT 不可达 | 属实 | 采纳 | 确定性 bug |
| 7. 文档漂移 | 属实 | 采纳 | 对照代码更新 |
| 8. 接口维度漂移 | 属实 | 采纳 | 清理历史包袱 |
一句话结论: 在"VL53 可信度低 + IMU yaw 高精度"的约束下,正确的改进方向是"强化 IMU 主导 + 分侧标定消偏 + 降低 VL53 权重",而不是审查报告建议的"恢复侧墙航向观测"。EKF 的方向 B 设计决策在当前硬件条件下是正确的,只需要补齐横向偏置补偿和修复 conf 覆盖 bug 就能解决"持续偏右"的核心问题。