生成式 AI 的浪潮中,我们见证了从 Stable Diffusion 到 FLUX、Qwen-Image 等大规模扩散模型的画质飞跃。然而,这种飞跃并非没有代价。为了从纯噪声中 “雕刻” 出清晰的图像,这些模型通常需要进行40 到 100 步(NFE)的迭代去噪。这种延迟使得模型很难真正应用于实际的实时生成或大规模服务。
于是,“少步生成”(Few-step Generation)成为了必争之地。对于原本教师模型曲折的生成轨迹,目前的少步加速方案(如 Progressive Distillation, Distribution Matching 等)都在试图做同一件事:把弯路拉直,一步到达终点。
然而,原本高维空间的生成轨迹极其复杂,强行 “拉直” 会导致轨迹上的几何失配(Geometric Mismatch)。这直接导致了少步生成时的结构崩坏和细节丢失。
有没有一种方法,既能快,又能顺应原本蜿蜒的生成轨迹?
复旦大学与微软亚洲研究院带来的ArcFlow给出了答案:如果路是弯的,那就学会 “漂移”,而不是把路修直。