Logs

把控制权从黑盒里拿回来

这一天的重心,是在多个方向上把原本依赖黑盒和默契成立的系统边界,拆成自己能看见、能验证、能接管的结构。

  • daily-log
  • openword
  • bclaw
  • wps
  • systems

4 月 16 日真正串起来的,不是哪一个项目突然单点突破,而是反复在做同一件事:把控制点从黑盒平台、黑盒协议和黑盒权限链路里一点点拿回来。当天能确认的主证据来自本地 Claude、本地 Codex、ChatGPT 导出和仓库产物;remote Codex 这一天没有形成额外证据,所以整条叙事主要靠本地链路闭合。回头看,最稳定的动作不是“它大概会工作”,而是把那些原本只能靠经验成立的东西,硬拆成自己能看见、能验证、能接管的结构。

上午到中午,这个方向先在 bclaw 上变得很具体。原本只是“手机上远程调用 Codex / Claude Code”的设想,继续往 workspace + session 这个核心心智收束,连接串解析、workspace 发现和 session/update 的流式时间线,都开始从抽象讨论变成直接改代码的对象。中间还补出了一条 Mac 侧 ACP bridge,让手机端和本地 agent CLI 之间先有一条可控通路。几乎同一时间,关于 Cloudflare Mesh、Tailscale、Headscale 的长讨论也在追同一个问题:如果以后真要做 AI agent 专用网络,控制面和数据面该怎么拆,哪些能力可以借,哪些必须自己握在手里。它和 bclaw 的距离没有表面上那么远,本质上都在追问同一类控制权问题。

白天后半段,openword 成了最重的技术现场,而且重心已经不是泛泛地“继续对齐 WPS”,而是更明确地围着 WPS 这个黑盒拆层。一条线是 geometry baseline:不断读 diff、补 capture 工具、更新 baseline,把 cell width、table layout、host block 这些误差压成能复现、能量化的小问题。另一条线是符号字体和渲染路径:Wingdings、checkbox、Kingsoft Confetti 这类别名和替代关系被翻出来后,WPS 就不再只是一个显示结果的参照物,而开始变成一个可以被逆向理解的对象。夜里对 WPSSDK 混淆 JS 的继续追问,也说明这里的摩擦还远没结束,但方向已经很清楚了:不是围着结果猜,而是继续往字体、布局和运行时逻辑内部钻。

下午到夜里,lvshe-fefachi 把同样的控制欲落到更贴近业务的地方。合同审查页里,修改审阅人、批量接受修订、一键修订异常、WPS 编辑器中的审阅用户名不同步,这些表面上像几件分散的小事,实际上都指向同一个事实:文档里的原位修改不是普通表单交互,只要顺序、定位或同步边界没讲清楚,结果就会立刻漂掉。所以这一天里既有 reviewer 按钮和展示层的调整,也有把批量接受改成按文档尾到头排序这种真正碰到底层行为的修正。另一边,对本地为什么拿不到 WPS editor 权限、能不能借 staging 关联把权限链路打通的调查,也还是同一种思路的延长线。一天看下来,最重要的收获不是某个任务已经彻底完成,而是越来越多系统不再只能“借来用一下”:无论是 WPS、Codex 协议,还是未来可能的 agent 网络,它们的边界、控制点和下一步该从哪里继续拆,已经比前一天清楚了很多。