条件简化与剩余密度条件设计文档

背景问题

当前三阶段级联生成模型的条件系统主要有五个问题：

结构条件中的房间数和分支数指导意义有限。这两个标签依赖离散分档，噪声大，和最终生成质量的关系不稳定。
直接给模型输入整张图的最终密度仍然过于间接。模型拿到的是终态目标，但生成过程是逐步展开的，模型需要自己从当前地图里数出已经放了多少，再反推出还差多少，这对 Transformer 并不友好。
第一阶段缺少足够的全局统计条件。实验上第二、三阶段可以较好过拟合，但第一阶段明显更难，说明骨架生成还缺少能够直接约束复杂度的全局量。墙壁密度正好可以承担这个角色。
第二阶段除了门和怪物，入口也存在生成失控的问题。既然入口本来就属于第二阶段负责的功能性实体，那么它也应该进入同一套密度条件，而不是继续裸奔。
不适合直接把真实计数作为条件，也不适合用相对目标量做归一化。前者会把条件值拉得过大，后者又会让非零目标在初始时刻统一退化成 1，容易诱发整图铺满某类图块的极端行为。

因此，条件系统应统一改成“真实剩余密度”方案，并覆盖三个阶段需要的全部关键对象。

保留简化后的结构条件，只使用对称性和外围墙信息；删除房间数、分支数这类噪声较大的离散标签。

密度条件不再表示“最终应该有多少”，而是表示“当前还剩多少没放完”。所有密度都统一按固定地图面积计算：


d^{\text{remain}} = d^{\text{target}} - d^{\text{visible}}

其中：

这样做有两个直接好处：

结构条件继续采用两维：对称性和外围墙。

密度条件扩展为五维，顺序为：墙壁、门、怪物、入口、资源。

这样设计的原因是：

不单独加入 floor 密度，因为在地图总面积固定时，floor 和 wall 基本互补，额外增加一维收益有限。

第一阶段只使用墙壁剩余密度，用来约束骨架稠密程度。

第二阶段使用门、怪物、入口的剩余密度，用来约束功能性实体的总量，避免某一类实体明显过多。

第三阶段只使用资源剩余密度，用来约束资源分布总量。

虽然模型内部可以继续使用统一的条件接口，但语义上每个阶段只关注自己负责的那几维，其他维度在该阶段不提供有效信号。

密度条件不能在样本读取时一次性写死，而必须根据当前输入地图动态计算。也就是说，同一张目标地图在不同阶段、不同采样步、不同当前状态下，对应的剩余密度都可能不同。

这件事在训练和推理里都一样重要：

自由生成时，如果需要随机条件，建议从训练集真实分布中采样密度组合，而不是各维完全独立均匀采样。特别是墙壁密度和第二、三阶段实体密度往往存在耦合关系，独立采样容易产生不自然组合。

这套方案的目标不是单纯让损失更低，而是让条件真正可控。验证时应重点看四类现象：

验证指标建议以真实密度误差为主，计数误差可以作为辅助观察项。

这次改动不仅改变条件语义，也会改变密度条件的维度，因此旧 checkpoint 不再兼容。

旧模型学习的是整图最终密度，或相对目标量的剩余比例；新模型学习的是按总面积计的动态剩余密度，并且新增了第一阶段墙壁条件和第二阶段入口条件。两者不是同一套任务定义，需要从头训练。