OpenFugu

面向自有模型池的透明多模型路由。

一个 OpenAI-compatible 网关，用可配置策略编排本地和远程模型。在最终答案返回前，让每次 route、成本、延迟、重试、verifier、fallback 和基线对比都可见。

申请试用查看路线图

POSThttps://api.openfugu.dev/v1/chat/completions

Route 报告

openfugu/default

Schema 预览

成本

运行时字段

延迟

运行时字段

基线

配置字段

步骤模块成本延迟结果

classifypolicy engine已记录已记录任务类别

selectworker registry已记录已记录候选 worker

verifyoptional verifier已记录已记录检查决策

fallbackfallback chain已记录已记录触发时记录

网关入口

把模型编排层交付成一个接口。

OpenFugu 位于你已经在使用的模型池前面。它不会把调度藏进黑盒：policy、route choice、worker role、verifier result、fallback attempt、cost、latency 和固定模型对比都会变成可检查的系统输出。

Route 报告

openfugu/default

Schema 预览

成本

运行时字段

延迟

运行时字段

基线

配置字段

步骤模块成本延迟结果

classifypolicy engine已记录已记录任务类别

selectworker registry已记录已记录候选 worker

verifyoptional verifier已记录已记录检查决策

fallbackfallback chain已记录已记录触发时记录

本地运行时

llama.cpp
Ollama
LM Studio

远程 API

OpenAI
Claude
Gemini

开源模型

DeepSeek
Qwen
Llama / Gemma

私有 endpoint

vLLM
内部 API
团队服务

Eval replay

把每次路由变成可复盘的对照样本。

环节记录内容用途

输入画像任务约束先记录任务类型、上下文规模、隐私约束、质量风险和期望输出，再判断这次路由是否合理。

路由理由策略决策保存命中的 policy、候选 worker、最终选择、被排除模型和路由理由，让调度过程可以被审计。

基线重放固定 worker 输出同一个输入用一个固定 worker 重跑，人工查看答案差异、失败点和偏好，而不是只看抽象分数。

失败回流重试原因把 verifier 拒绝、fallback 触发、超时和低置信度样本回流到下一版 eval 集，后续再作为 router 训练数据。

Trace 信号

一次路由应该暴露什么。

OpenAI-compatible

接入已经兼容 OpenAI API 的工具，不需要修改调用方。

透明 trace

查看调度、worker、prompt、重试、verifier 输出和中间结果。

成本和延迟可见

记录预估成本、token 使用、耗时、重试和 provider 失败。

Verifier 和 fallback

对高风险答案做检查，并在超时、低置信度或坏输出时回退。

固定模型基线对比

把路由结果和固定模型结果对比，衡量真实改进。

策略层

先组合简单策略；有真实数据后再训练 conductor。

第一版 OpenFugu beta 在训练前也应该有用：显式策略、可追踪计划，以及基于真实用户任务的 eval replay。

申请 beta 试用

cheapest-good-enough

先尝试满足质量线的最低成本 worker。

verify-before-return

在答案返回调用方前，让更强模型进行检查。

fallback-chain

当置信度或可靠性下降时，重试下一个可用 worker。

fixed-model-baseline

用固定 worker 作为基线衡量编排效果，而不是凭感觉判断。

验证路线

先验证需求，再扩大能力。

OpenFugu 先验证透明路由是否解决真实问题，再根据用户反馈决定原型、eval 和模型支持优先级。

需求验证

确认谁真的需要透明多模型路由，以及他们当前使用哪些工具和模型池。

透明路由原型

展示 route trace、成本记录、延迟记录、失败重试和固定模型对照。

Beta 试用

邀请有明确模型池和真实任务的用户试用，收集可复盘的 eval 样本。

能力迭代

根据真实反馈调整策略优先级，决定优先支持的 worker/provider 和部署形态。

申请试用

帮助确定 OpenFugu 第一版 beta。

告诉我们你现在使用哪些工具、模型池里有哪些模型、固定模型在哪里失败，以及你更需要本地客户端、Docker 网关、团队服务还是云服务。

申请试用联系我们

1POST /v1/chat/completions

3 "model": "openfugu/default",

4 "policy": "quality_balanced",

5 "cost_budget": "<configured_limit>",

6 "verifier": true,

7 "baseline": "<fixed_worker>"