·10 min 閱讀·技術筆記
我請 Claude Code 幫自己的開發流程跑了 7 輪實驗:一段優化 SpecFlow 的心得
上個月做了 SpecFlow 第一版,中間修修改改之後,我想到應該認真 review 這個流程到底有沒有效益。於是請 Claude Code 撰寫了一份 benchmark 實驗,連續跑 7 輪來優化整個流程與 prompt。這篇是這段路程的心得,以及一路上顛覆我對 prompt engineering 認知的反直覺發現。
AI AgentBenchmark可靠度工程Claude CodeSpecFlow心得