PinchBench 1.0k · Python 技能 PinchBench 是一个评估 LLM 模型作为 OpenClaw 编码智能体的基准测试系统。由 https://kilo.ai 的人类用 Rust 构建。 生态 openclaw benchmarktesting