AntQO for MWDS
在 Dual-Bound Search 框架的下界端引入轻量 Ant-Q 模块,收紧 MWDS 的 LB
背景
最小加权支配集 (MWDS) 问题:在带正整数权重的无向图 $G = (V, E, w)$ 中,找权重和最小的支配集 $D \subseteq V$,使 $V \setminus D$ 的每个顶点都至少有一个邻居落在 $D$ 内。MWDS 是 NP-hard,常见应用包括无线骨干网构建与传感器布点。
ECAI 2025 baseline Dual-Deep 与 Dual-Fast 共享相同的 Dual-Bound Search (DBS) 外循环以及 IT-LBS 下界迭代收紧框架,仅 UB 子例程不同:
Dual-Deep | Dual-Fast | |
|---|---|---|
| UB 子例程 | DeepOpt(tabu + BMS + interfere/refix) | FastMWDS(tabu + BMS + CC + reduction) |
| 单轮 UB 用时 | 数十至数百秒 | 0.1–5 秒 |
| DBS 轮数 | 几十 | 几百 |
方法
保留 UB 端不动,在 LB 端的 pair 构造例程 ibmwds_init_bounds 中插入一个 $K$-蚂蚁的 Ant-Q 模块:
for each ant k = 1..K:
HEUR' = HEUR × AQ[v]^β // β = 3.0
aq_build_ordering() // q0 = 0.9 greedy / 1-q0 roulette
aq_count_violated()
score = bound · (1 − λ · n_viol / m)
update AQ with the best ant (蒸发 ρ = 0.05 + tight-pair bonus × 3)
两个具体变体:
- Deep-v6:$\beta = 3.0$,$\rho = 0.05$,$q_0 = 0.9$,$K = 5$,$\lambda = 0.3$;evaporation 限定在 active 顶点上;tight-pair bonus $\times 3$。
- Fast-v19:$\beta = 3.5$,全局 evaporation,不加 tight bonus;配合 3 级 adaptive gate,在简单实例上关闭 Ant-Q(关于这一关闭策略的设计见 关联笔记)。
结果
在两套测试集 T1 / T2(1045 与 1052 行 paired 样本)上:
| 指标 | Deep-v6 vs Dual-Deep | Fast-v19 vs Dual-Fast |
|---|---|---|
| Row-averaged gap ↓ | $-23.68\%\ /\ -31.23\%$ | $-6.92\%\ /\ -9.89\%$ |
| Per-instance win-rate (gap) | $99.34\%\ /\ 99.37\%$ | $66.86\%\ /\ 63.85\%$ |
| LB-paired loss 行数 | 0 / 2 | 329 / 280 |
| LB-paired win-rate | — | $61.39\%\ /\ 43.47\%$ |
现象与下一步
Ant-Q 在数值上严格收紧了下界,但 #opt 与 #min(UB 质量)几乎不变。在 IDCLB+DBS 框架下,LB 与 UB 之间唯一的耦合通道是硬证明规则 (v_State = Fixed / Deleted);数值上的 LB 收紧若不能多触发上述规则,对 UB 是不可见的。该现象的形式化分析见 LB 数值收紧与 #opt 的脱耦。
下一步是 Tight-pair → Forced-Fix(路线 I):当 ants 产出的 pair 触及 bound ratio $\to 1$ 区域时,把下一步 LB 收紧的方向偏向能触发 reduction 的 state transition。这相当于在 RL 信号中叠加一项”是否触发硬规则”的额外回报项。
代码与版本
- 内部报告:2026-04-24,gap 与
#opt不对称的分析、LB → UB 耦合 - 版本演进:
deep-v0→v3.1-stable→v4.x-tuning→v5.0-vertex-aq→deep-v6;fast-v0→fast-v19
实现基于 Dual-Deep 与 Dual-Fast 的 ECAI 2025 开源代码。