ginka-generator/README.md

# GINKA 地图生成器

GINKA Model 是一个用于生成网格状魔塔地图的模型，采用 UNet 网络，允许输入自然语言，指定地图大小。

GINKA Model 内部集成了 Minamo Model 用于判别两个地图的相似性，用于计算损失值，指导 GINKA Model 训练，避免了传统拓扑图相似度计算的不可微性质，提高模型训练性能。

## 贡献 GINKA Model 数据集

对于 HTML5 魔塔，如果你想要贡献数据集，需要对你的魔塔进行手动数据处理，流程如下：

1. 选择楼层，可以是剧情层、战斗层等，但是需要满足下述条件
2. 楼层除边缘外不应出现墙壁堆叠（例如 2\*2，边缘可以有重叠）
3. 楼层中不应该有闲置怪，不应该在直线上有无间隔连续 3 个以上的怪物，不应该有无法到达的区域，不宜有过多的入口
4. 最外面一层围上一圈墙壁（箭头楼层切换除外）
5. 将所有的墙壁换成黄墙（数字 1）
6. 将所有的血瓶换成红血瓶（数字 31），所有红宝石换成最基础的红宝石（数字 27），蓝宝石换成最基础的蓝宝石（数字 28），道具全部换为幸运金币（数字 53），剑盾可以当成红蓝宝石看待，删除除此之外的资源
7. 所有钥匙换成黄钥匙（数字 21），所有门换成黄门（数字 81）
8. 所有箭头换成样板原版箭头（数字 91 至 94），所有上下楼梯换成样板原版楼梯（数字 87 和 88）
9. 怪物分为三个强度，弱怪，中怪，强怪，弱怪换为绿头怪（数字 201），中怪换成红头怪（数字 202），强怪换成青头怪（数字 203）
10. 在 `project` 文件夹下创建 `ginka-config.json` 文件，双击进入编辑，粘贴如下模板：

```json
{
    "clip": {
        "defaults": [0, 0, 13, 13],
        "special": {
            "MT11": [3, 3, 7, 7]
        }
    },
    "data": {
        "MT1": ["MT1 楼层的第一个描述", "MT1 楼层的第二个描述"]
    }
}
```

其中，`clip` 属性表示你的每张地图的那一部分会被当成数据集，例如填写 `[0, 0, 13, 13]` 就会让坐标为 `(0, 0)`，长宽为 `(13, 13)` 的矩形内容作为数据集。`special` 属性允许你针对单独的某几层设置不同的裁剪方式，例如设置 `MT11` 为 `[3, 3, 7, 7]` 等，如果没有设置默认使用 `defaults` 的裁剪方式。最好保证每个楼层大小一致，不然我还要手动分类。

`data` 是你的每一层的楼层描述，要求每一层都要有描述，每层描述可以有多个，要求可以准确或粗略描述楼层的一部分特征（不需要是全部，不然的话文字量会很大），不超过 64 个 token（每个中文字约 0.6 token，每个英文字母约 0.3 token），可以详细可以简略，推荐每层有三个描述以上，而且描述不要有过多的语义重复。

11. 在全塔属性中的楼层列表中去除不在数据集内的楼层
12. 将 `project` 文件夹打包发给我即可

## 贡献 Minamo Model 数据集

首先需要对你的塔的地图进行处理，参考 [GINKA Model 数据处理方式](#贡献-ginka-model-数据集)的 1-9 和 11 步，同时最好每张地图至少有几个空格（没有也没有影响，只不过会导致这个地图参与训练的次数降低）

与 GINKA Model 类似，在 `project` 文件夹中添加 `minamo-config.json` 文件，打开后将如下模板粘贴进去：

```json
{
    "clip": {
        "defaults": [0, 0, 13, 13],
        "special": {
            "MT11": [3, 3, 7, 7]
        }
    }
}
```

其中 `clip` 属性与 GINKA Model 的定义相同，参考上一小节即可。

将以上内容全部设置完毕后，将 `project` 文件夹打包发送给我，添加 `ginka-config.json` 时也可以作为 GINKA Model 训练集。

## 训练

如果你想自行训练模型，首先需要安装 `reqiurements.txt` 中所需的库，然后按照以下顺序操作：

1. 准备 Minamo Model 数据集，放置在根目录下，命名为 `minamo-dataset.json`
2. 执行 `python -m minamo.train`，等待训练完毕
3. 准备 GINKA Model 数据集，放置在根目录下，命名为 `ginka-dataset.json`
4. 执行 `python -m ginka.train`，等待训练完毕
5. 目录 `result/ginka.pth` 即为训练完毕的 GINKA 模型
6. （可选）准备 Minamo Model / GINKA Model 验证集，放置在根目录下，命名为 `minamo-eval.json` / `ginka-eval.json`，训练时每 10 个 epoch 会进行一次验证推理，建议使用与训练集不同的塔数据作为验证集。

准备训练集和验证集时，可以使用命令行脚本自动处理。首先进入 `data` 文件夹，然后运行 `pnpm i` 安装所有依赖，然后执行下面的脚本：

```bash
pnpm ginka "../ginka-dataset.json" "MyTower/project" # 通过 ginka-config.json 生成 GINKA 训练集
pnpm ginka "../ginka-eval.json" "MyTower/project" # 通过 ginka-config.json 生成 GINKA 验证集
pnpm minamo "../minamo-dataset.json" "MyTower/project" # 通过 minamo-config.json 生成 Minamo 训练集
pnpm minamo "../minamo-eval.json" "MyTower/project" # 通过 minamo-config.json 生成 Minamo 验证集
```