⚠️ 自动镜像 · 此页由 docs-site/scripts/mirror-adr.mjs 从 docs/adr/0006-predictions-partition-by-month.md 生成，请勿直接编辑此处；改源文件后 pnpm docs:build 会自动同步。

0006 — predictions 表按月 RANGE 分区

Context

predictions 表是项目里增长最快的事实表：每个 task × 每次 ML inference 落 1 行；千 task 项目跑 5 个 epoch 即 5k 行；规模化项目 / 流式 LLM 标注下，预计单项目每月 10w+ 行，全部写入单表。

观察到的痛点（v0.7.5 监控）：

ROADMAP 把「Predictions 表分区」放在 P2「监控触发再做」。v0.7.6 评估后选了两阶段实施。

按 RANGE(created_at) 月分区，但分两阶段落地以控制风险：

仅加 ix_predictions_created_at 单列 btree 索引。这一步：

完整迁移到 partitioned table：

重塑主键：predictions(id) PK → predictions(id, created_at) PK PG 要求 partition key 必须在 PRIMARY KEY 中。
改 FK：
- prediction_metas.prediction_id → 复合 FK (prediction_id, prediction_created_at) 需要在 prediction_metas 加 prediction_created_at 列并回填
- annotations.parent_prediction_id → 同样复合 FK 需要在 annotations 加 parent_prediction_created_at 列并回填
创建 partitioned 表：predictions_new PARTITION BY RANGE(created_at) 预创建过去 12 月 + 未来 3 月分区
数据搬迁：分批 INSERT chunked by month
rename swap：predictions → predictions_old; predictions_new → predictions
保留 predictions_old 7 天作为 rollback 缓冲
新建 cron task app.workers.cleanup.create_next_month_partition 每月 1 日提前创建下个月的分区

权衡了三个维度：

维度	评估
业务收益	当前 prediction 行数仍在 10w 级，Stage 1 索引已能覆盖 80% 查询。Stage 2 收益边际递减。
改动半径	`annotations.parent_prediction_id` 复合 FK 化 = annotations 表迁移，单表 100w+ 行，在线时间窗 ≥ 30min。
测试成本	alembic round-trip 必须在仿真数据集上跑通；CI 数据量小测不出真实迁移问题。
回滚成本	rename swap 一旦数据丢失需要 PITR 恢复。

结论：Stage 2 的成本（high）目前 ≪ 收益（low）。Stage 1 索引足以覆盖到下次扫描。

正向：

负向：

加监控告警（v0.7.7+）：

任一触发后启动 Stage 2。