Structured LLM Routing：用任务路由策略节省 40% 推理成本

不同任务适合不同模型，但手动选择成本高且不精确。这篇论文提出了 Structured LLM Routing 框架，根据任务特征动态路由到最合适的 LLM，节省 40% 成本。

不是所有请求都需要 GPT-4 级别。大部分请求（60-80%）其实是简单的，用便宜模型就够。路由策略的核心是准确分类。

对于 OpenClaw 这样的多模型 Agent 系统，Routing 策略可以直接落地。心跳消息用便宜模型、代码审查用中等模型、深度分析用最强模型。

推荐好物