脚手架外部化

Boom Yao

这里现在拆成三条线:文章用于对外输出,日志用于记录每天推进,小记用于随时收住还没长成文章的灵感、判断和句子。

Articles

文章

放长期有效的表达、判断和结构化输出。

进入文章

Logs

日志

记录每日产出、阶段推进和给自己的复盘材料。

进入日志

Notes

小记

收纳即时灵感、半成品判断和一闪而过但值得留下的片段。

进入小记

最新文章

  • llm
  • multi-agent
  • evaluation
  • legal-tech
  • human-ai-collaboration

不是多开几个 Agent,而是堵死 AI 提前收敛的路

这次要素式起诉状自动填表实验真正教会我的,不是 multi-agent 有多强,而是如果任务结构不对,AI 一定会把复杂目标偷换成一个更容易完成的代理目标。

  • llm
  • experimentation
  • evaluation
  • human-ai-collaboration
  • legal-tech

一场被指标带偏的 LLM 业务实验

这不是一篇调 prompt 的经验贴,而是一篇关于我如何和 Codex 一起,把一个本应服务业务的实验,逐步做成了一个奖励错误目标的系统的复盘。

最新日志

  • daily-log
  • codex-mobile
  • android
  • bridge
  • ux

2026-03-29 日志

这一天真正的推进,不是多做了几个移动端功能,而是把 codex-mobile 的连接与恢复,往“无需解释也能被信任”的产品标准上继续推进。

  • daily-log
  • codex-suite
  • bridge
  • mobile
  • ux

把原型逼成产品

这一天最明确的推进,不是单点功能完成,而是不断把能跑的原型往可信、直觉、成熟的产品体验上压。

  • daily-log
  • reading
  • redactor
  • codex-mobile
  • trust

把交互重新做成可信的一天

这一天反复处理的不是零散功能点,而是让系统表面与底层真实状态重新对齐。

  • daily-log
  • reading
  • redactor
  • codex-mobile
  • alignment

让不同表示重新对齐的一天

这一天真正推动我前进的,不是哪条线又多做了一点,而是越来越不愿意接受不同界面、不同链路和不同表示彼此说不拢。

最新小记

  • 小记
  • codex
  • agent

codex 有自己的节奏

codex 就好像有自己的节奏,在节奏中收到反馈它能一直干下去。

  • 小记
  • 灵感
  • 写作系统

先把灵感留下来

一些东西不该等到整理完再写。小记就是给那些还没长成文章、也不属于日终复盘的念头准备的入口。