[RFC] 018 - 多模型服务商一期：架构设计 & AWS Bedrock / Zhipu / Gemini / Moonshot 支持 #737

arvinxx · 2023-12-20T09:46:00Z

arvinxx
Dec 20, 2023
Maintainer

背景

随着 LobeChat 的发展，社区同学对模型服务商的多样性也产生了新的诉求。我们不能只锚着 OpenAI ，而是要丰富模型服务商的多样性，为用户提供更多的会话选择。

支持不同服务商：

[Request] LLM 适配 #151
AWS Bedrock https://sdk.vercel.ai/docs/guides/providers/aws-bedrock
Google Model （Gemini 、Gemini Pro） https://sdk.vercel.ai/docs/guides/providers/google
ChatGLM [Bug] 暂时不支持chatglm的api调用 #1125
Moonshot AI 月之暗面 ✨ feat: support Moonshot AI #1232
replicate https://sdk.vercel.ai/docs/guides/providers/replicate
MinMax [Request] MiniMax 模型支持 #1053

支持本地模型 (详见 [RFC] 026 - 多模型服务商二期：支持本地 LLM （Ollama） #1283)
支持同一模型的不同 API Key (详见 [RFC] 027 - API Key 字段支持使用多个Key #1287)
支持更完整的 Azure OpenAI 配置（详见 [RFC] 025 - Azure OpenAI 实现重构 #1219）
其他 hack 的方案

[Request] 大神門能支持一下copilot-gpt4-service 嗎? #1093

arvinxx · 2024-01-12T04:11:00Z

arvinxx
Jan 12, 2024
Maintainer Author

技术选型讨论

AI SDK VS LangChain

大的方向上，我觉得 chatCompletion 这个模块仍然基于 OpenAI 和 Vercel AI SDK ，不用 LangChain 了，流式输出 functionCall 的问题已经过去快一周了，官方都没解决。

另外，现在整个社区的趋势就是接口调用的风格和规范会尽量对齐 OpenAI 的 chat completion。因此用 openai + vercel ai sdk 基本上可以满足 80% 主流模型的诉求。

回复存放之前的一些探索方案

1 reply

arvinxx Feb 1, 2024
Maintainer Author

对话重构为 LangChain 实现

坑点 1：LangChain 官方实现对 stream 中的错误处理不完善

参考官方文档，可以使用 pipe + parser 来简化 stream 实现：

 try {
    const parser = new HttpResponseOutputParser();
    const stream = await model.pipe(parser).stream(messages);

    return new Response(stream);
  } catch (error) {
  // error handle
}

如果请求是正常的，那么上述代码可以正常运行。

但一个巨坑的地方是如果stream 出错，catch 不会捕获错误，会直接退出运行。

已提 issue : langchain-ai/langchainjs#4015 。

坑点2： `HttpResponseOutputParser` 无法正常输出 OpenAI Function

HttpResponseOutputParser 类无法正常解析 tool_calls 的输出，导致返回的结果是空的。

issue： langchain-ai/langchainjs#4095

arvinxx · 2024-01-13T15:13:37Z

arvinxx
Jan 13, 2024
Maintainer Author

错误处理记录

Zhipu

初始化

密码不正确 InvalidAccessCode
API 出错 InvalidZhipuAPIKey

Chat 运行态

ZhipuBizError: Zhipu业务逻辑错误（参数非法、token 不正确等）

{
  "code": "1002",
  "message": "Authorization Token非法，请确认Authorization Token正确传递。"
}

AgentRuntimeError: Zhipu 模块运行出错（Lobe Runtime 侧的代码实现有问题触发报错）

{
  "message": "test",
  "name": "TypeError",
  "stack": "TypeError: test\n    at LobeZhipuAI.chat (webpack-internal:///(rsc)/./src/libs/agent-runtime/zhipu/index.ts:53:19)\n"
}

0 replies

snowyu · 2024-01-18T12:13:28Z

snowyu
Jan 18, 2024

@arvinxx The error handling with stream should be:

stream.on('error', (e) => handleError(e))
.pipe(b)
.on('error', (e) => handleError(e))
.pipe(c)
.on('error', (e) => handleError(e));

function handleError(e) { throw e; } // Maybe also some logging or smth.

2 replies

arvinxx Jan 18, 2024
Maintainer Author

thanks, I will try~

arvinxx Jan 20, 2024
Maintainer Author

@snowyu it doesn't work. But LangChain have solved this problem officially.

arvinxx · 2024-01-23T02:36:43Z

arvinxx
Jan 23, 2024
Maintainer Author

节奏

分为三期进行：

一期： ✨ feat: support Google / Zhipu / AWS Bedrock model providers #1173
- 支持业务诉求和用户呼声较多的三个服务商；
- 初步搭建第一版多模型服务商下的数据管理模型（前端）；
- 抽出初步的 Agent Runtime 调用运行时；
二期：
- 其余模型服务商；
- 本地 LLM 支持；
三期：
- Agent Runtime [Idea] LobeAgent Runtime #924
- 完善服务商配置

0 replies

arvinxx · 2024-01-29T05:59:26Z

arvinxx
Jan 29, 2024
Maintainer Author

Logo

Gemini https://icon-sets.iconify.design/logos/google-gemini/

3 replies

canisminor1990 Jan 29, 2024
Maintainer

约等于 google bard, gemini 的 logo 直接做 icon感觉太大了

Google Bard: https://simpleicons.org/?q=google+bard
Meta Llama: https://simpleicons.org/?q=meta
OpenAI: https://simpleicons.org/?q=OpenAI

ChatGLM 的他们还没传 simpleicons 么

canisminor1990 Jan 29, 2024
Maintainer

想搞个 llm logo & icon 仓库了

arvinxx Jan 29, 2024
Maintainer Author

要分两种

一种是model tag，我初步搞好了，在 https://github.com/lobehub/lobe-chat/blob/feat/model-provider/src/components/ModelTag/index.tsx

另外一种在设置里配置模型服务商，倒是可以用这种大的，更容易凸显品牌

arvinxx · 2024-01-29T11:27:44Z

arvinxx
Jan 29, 2024
Maintainer Author

实现思路

整体思路

1. model层调通
2. 路由改造，支持多模型服务商路由
3. 前端界面设置，支持配置服务商 api。目前由于settings部分需要globalStore进行水合，导致无法实现服务端数据的准确merge。需要先行改造 ♻️ refactor: refactor the setting storage from localStorage to indexedDB #1180
4. Chat会话界面改造 ModelTag，ModelSelect

LobeAIProvider

支持接口

初始化
ChatCompletition

错误类型

Apikey 错误
欠费
超过token数
RateLimitted

1 reply

arvinxx Feb 1, 2024
Maintainer Author

本次架构升级的考虑要点

模型元信息维护

需要有一个全局视角来维护与管理模型信息，包括 model id ，展示名称，maxToken ，是否支持function call 与 vision 等。

有了这个信息以后，我们就可以有一个更好的全局视角来管理模型

错误处理框架

和单一的模型服务商不再一样，需要精细化梳理各个模型服务商提供的错误类型，然后找到公共部分与差异化部分，并用一个统一的错误处理方案来承接。

服务端配置、客户端配置的合并与可视化配置

目前已经实现了从服务端读取配置作为客户端的默认值，并且支持用户在前端界面进行个性化配置

这里后续需要重点的是服务端可控性，提供一种灵活的方式允许服务端是否开启或关闭

OneAPI 兼容性

目前存在大量的用户仍在使用 oneapi 的方案来统一管理模型，我们需要提供一种机制来让这部分用户仍然可以进行相应的配置与管理。

arvinxx · 2024-01-29T12:23:45Z

arvinxx
Jan 29, 2024
Maintainer Author

需要注意的点：

不同的APIKey错误要唤起不同的api填写表单
后续需要优化 agent runtime 的实例初始化方案
ModelList 的自定义方案

0 replies

snowyu · 2024-01-29T14:01:42Z

snowyu
Jan 29, 2024

对于配置表单UI建议用JSONSchema统一生成: https://github.com/rjsf-team/react-jsonschema-form/

1 reply

arvinxx Jan 30, 2024
Maintainer Author

感谢建议，后续可以试试看

arvinxx · 2024-01-31T07:28:39Z

arvinxx
Jan 31, 2024
Maintainer Author

Zhipu AI 接入踩坑点记录

由于智谱 V4 的API 朝 OpenAI 对齐了，所以整体接入比较顺利，不过仍然存在几个坑点：

图片base64需要移除前缀；

智谱不支持 data:image/png;base64,UklGRqTNAABXRUJQVlA4WAoAAAA ，需要去掉前面的 data:image/png;base64,

`tool_calls` 流式有问题：

标准 OpenAI 的 tool_calls 输出如下：

chunk 0
{"choices":[{"index":0,"delta":{"role":"assistant","content":null,"tool_calls":[{"index":0,"id":"call_EOjIHZ8INcmtndup397Iy2R0","type":"function","function":{"name":"realtime-weather____fetchCurrentWeather","arguments":""}}]},"logprobs":null,"finish_reason":null}]}

chunk 1
{"choices":[{"index":0,"delta":{"tool_calls":[{"index":0,"function":{"arguments":"{\""}}]},"logprobs":null,"finish_reason":null}]}

chunk 2
{"choices":[{"index":0,"delta":{"tool_calls":[{"index":0,"function":{"arguments":"city"}}]},"logprobs":null,"finish_reason":null}]}

chunk 3
{"choices":[{"index":0,"delta":{"tool_calls":[{"index":0,"function":{"arguments":"\":\""}}]},"logprobs":null,"finish_reason":null}]}

chunk 4
{"choices":[{"index":0,"delta":{"tool_calls":[{"index":0,"function":{"arguments":"Hang"}}]},"logprobs":null,"finish_reason":null}]}

chunk 5
{"choices":[{"index":0,"delta":{"tool_calls":[{"index":0,"function":{"arguments":"zhou"}}]},"logprobs":null,"finish_reason":null}]}

chunk 6
{"choices":[{"index":0,"delta":{"tool_calls":[{"index":0,"function":{"arguments":"\"}"}}]},"logprobs":null,"finish_reason":null}]}

chunk 7
{"choices":[{"index":0,"delta":{},"logprobs":null,"finish_reason":"tool_calls"}]}

但 zhipu 的接口输出格式如下：

chunk 0
{"choices":[{"index":0,"finish_reason":"tool_calls","delta":{"role":"assistant","tool_calls":[{"id":"call_8349638559205414584","index":0,"type":"function","function":{"name":"realtime-weather____fetchCurrentWeather","arguments":"{\"city\":\"杭州\"}"}}]}}]}

chunk 1
{"choices":[{"index":0,"finish_reason":"tool_calls","delta":{"role":"assistant","content":""}}],"usage":{"prompt_tokens":153,"completion_tokens":20,"total_tokens":173}}

可以看到最后的一个输出的 chunk 是，delta 是 {"role":"assistant","content":""}，这个行为和 openai 的不一致。这就导致最终前端收到的 arguments 参数为空字符串，所以会出现问题

2 replies

arvinxx Feb 1, 2024
Maintainer Author

一期结论：针对 GLM 系列模型，本次上线版本先不放出 FC 功能，等智谱侧修复后再上线

Vision Model 由于集成 Google Genimini 时做了一下 base64 的解析与转换，因此可以复用实现兼容，等到时候同样更新修复后移除

MapleEve Mar 15, 2024

~~在 action.ts 中打个补丁会不会更好一点，因为GLM4的长文件处理效果比 GPT4 差不多，价格又便宜很多。~~

放弃了，等他官方支持再做流式

arvinxx · 2024-02-01T09:33:48Z

arvinxx
Feb 1, 2024
Maintainer Author

AWS Bedrock 接入笔记

基本上参考 https://sdk.vercel.ai/docs/guides/providers/aws-bedrock 来接入会比较顺利。

初始化client:

const bedrockClient = new BedrockRuntimeClient({
  region: process.env.AWS_REGION ?? 'us-east-1',
  credentials: {
    accessKeyId: process.env.AWS_ACCESS_KEY_ID ?? '',
    secretAccessKey: process.env.AWS_SECRET_ACCESS_KEY ?? '',
  },
});

chat 接口：

  // Ask Claude for a streaming chat completion given the prompt
  const bedrockResponse = await bedrockClient.send(
    new InvokeModelWithResponseStreamCommand({
      modelId: 'anthropic.claude-v2',
      contentType: 'application/json',
      accept: 'application/json',
      body: JSON.stringify({
        prompt: experimental_buildAnthropicPrompt(messages),
        max_tokens_to_sample: 300,
      }),
    }),
  );
 
  // Convert the response into a friendly text-stream
  const stream = AWSBedrockAnthropicStream(bedrockResponse);
 
  // Respond with the stream
  return new StreamingTextResponse(stream);

其中 max_tokens_to_sample 是必填项，否则会报错。另外比较有坑的是模型的 id，一开始配置的是这几个：

anthropic.claude-instant-v1
anthropic.claude-v2:1
meta.llama2-13b-chat-v1
meta.llama2-70b-chat-v1

但在接入 llama2 时则遇到了问题， llama 的 prompt 结构和 aws 的会有很大差别，比如 max_tokens_to_sample 就不支持，会报错：

{
  body: {
  httpStatusCode: 400,
  requestId: '*',
  extendedRequestId: undefined,
  cfId: undefined,
  attempts: 1,
  totalRetryDelay: 0
},
  message: 'Malformed input request: #: extraneous key [max_tokens_to_sample] is not permitted, please reformat your input and try again.',
  region: 'us-east-1',
  type: 'ValidationException'
}

所以计划一期先不上 llama2。

1 reply

arvinxx Feb 4, 2024
Maintainer Author

更新：Vercel AI SDK 有 llama 的示例： https://sdk.vercel.ai/docs/api-reference/aws-bedrock-stream#example-llama-2-models 。试了下可以用，因此本期可以上。

arvinxx · 2024-02-01T15:36:41Z

arvinxx
Feb 1, 2024
Maintainer Author

Google Gemini 接入

核心是代理问题，所以参考 google-gemini/generative-ai-js#29 (comment) 在 provider route 加了一个 proxy，在 proxy 模式下，使用 nodejs runtime，线上仍然使用 edge runtime

// due to the Chinese region does not support accessing Google / OpenAI
// we need to use proxy to access it
const proxyUrl = process.env.HTTP_PROXY_URL;
const useProxy = !!proxyUrl;

if (useProxy) {
  const { setGlobalDispatcher, ProxyAgent } = require('undici');

  setGlobalDispatcher(new ProxyAgent({ uri: proxyUrl }));
}
// undici only can be used in NodeJS.
// So when using proxy, switch to NodeJS runtime
export const runtime = useProxy ? 'nodejs' : 'edge';

0 replies

arvinxx · 2024-02-02T02:48:50Z

arvinxx
Feb 2, 2024
Maintainer Author

后续如何集成一个新 Provider

modelProviders 元信息

config/modelProviders 新建一个文件，填写模型服务商基础信息和模型基础信息

import { ModelProviderCard } from '@/types/llm';

const ZhiPu: ModelProviderCard = {
  chatModels: [
    {
      description: '最新的 GLM-4 、最大支持 128k 上下文、支持 Function Call 、Retreival',
      displayName: 'GLM-4',
      // functionCall: true,
      id: 'glm-4',
      tokens: 128_000,
    },
    {
      description:
        '实现了视觉语言特征的深度融合，支持视觉问答、图像字幕、视觉定位、复杂目标检测等各类多模态理解任务',
      displayName: 'GLM-4 Vision',
      id: 'glm-4v',
      tokens: 128_000,
      vision: true,
    },
    {
      description: '最新的glm-3-turbo、最大支持 128k上下文、支持Function Call、Retreival',
      displayName: 'GLM-3 Turbo',
      // functionCall: true,
      id: 'glm-3-turbo',
      tokens: 128_000,
    },
  ],
  id: 'zhipu',
};

export default ZhiPu;

服务端实现

添加环境变量

在 src/config/server/provider.ts 添加新的环境变量

新增runtime

在 runtime 新增实现 LobeRuntimeAI，

需要包包含初始化、 chat 接口，并需要实现初始化错误、业务逻辑错误这两个错误处理

路由集成

在 chat/provider/route 接入实现

默认配置集成

在 api/config 设定发给客户端是否开启的属性

客户端实现

模型/服务商 icon

Components/ModelIcon 补充判断逻辑

selectors

添加是否启用的逻辑

settings

增加一个设置面板渲染组件

api配置面板

在error/apikeyform新增配置表单

服务端：

服务端环境变量：config/server/provider.ts 新增 MOONSHOT_API_KEY 等环境变量；
Moonshot 运行时 libs/agent-runtime 新增 LobeMoonshotAI ，

实现 init 和 chat 两个方法；
完善相应的 InvalidMoonshotAPIKey 和 MoonshotBizError 两个错误状态

路由定义： api/chat/[provider]/agentRuntime.ts 新增 moonshotRuntime 初始化逻辑（客户端key 与环境变量）
服务端配置: api/config/route.ts 定义 Provider 默认开启逻辑
错误响应状态码处理： api/errorResponse.ts 定义 MoonshotBizError 状态码

客户端：

模型元数据定义（config/modelProviders），补充完善相应的模型元信息
模型设置： types/settings/modelProvider 定义 MoonshotConfig，在 const/settings 设定默认值；
取数 seletors： store/global/slices/settings/selector/modelProvider.ts 补充取数 selector （enableMoonshot、 moonshotAPIKey）
前端鉴权 token： services/_auth 补充获取 apiKey 相关逻辑；
模型UI （模型选择器、模型 Tag ）：
- Provider Logo: components/ModelProviderIcon 更新
- Model Logo: components/ModelIcon 更新
- Model Tag: components/ModelTag 更新
错误处理 features/Conversation/Error 新增一种对应的 APIKeyForm
全局模型设置 app/settings/llm 新增一个配置组件（可以拷贝复用 Zhipu ）

2 replies

sjy Feb 8, 2024

Really helpful, but I can't find the flow to update locales p.s: I don't have a valid OPEN_AI_KEY yet

gijigae Feb 18, 2024

@arvinxx, just want to say "Thank you!" not only for all the changes you have maintained, but also for the knowledge you have shared. The steps to add Moonshot really helped me understand the overall workflow around onboarding a new model provider. Keep up the good work!

arvinxx · 2024-02-04T07:50:53Z

arvinxx
Feb 4, 2024
Maintainer Author

特性跟踪

Google Gemini 支持

但个人感觉 Gemini Pro Vision 的视觉能力非常垃圾，还不支持多轮对话，根本没法在日常中使用

AWS Bedrock 支持

支持 AWS Bedrock （Claude / LLAMA 2）

智谱 GLM 支持

支持智谱 GLM 系列

个人试用下来真的比 Gemini 、Bedrock 之类的好太多了！！！国货之光！！！

Azure OpenAI 接入重构

TODO

1 reply

arvinxx Feb 4, 2024
Maintainer Author

API Key 填写

OpenAI	Zhipu	Google	Bedrock

对比

OpenAI	Zhipu	Google	Bedrock

[RFC] 018 - 多模型服务商一期：架构设计 & AWS Bedrock / Zhipu / Gemini / Moonshot 支持 #737

arvinxx Dec 20, 2023 Maintainer

背景

Replies: 13 comments · 14 replies

arvinxx Jan 12, 2024 Maintainer Author

技术选型讨论

arvinxx Feb 1, 2024 Maintainer Author

对话重构为 LangChain 实现

坑点 1：LangChain 官方实现对 stream 中的错误处理不完善

坑点2： HttpResponseOutputParser 无法正常输出 OpenAI Function

arvinxx Jan 13, 2024 Maintainer Author

错误处理记录

Zhipu

snowyu Jan 18, 2024

arvinxx Jan 18, 2024 Maintainer Author

arvinxx Jan 20, 2024 Maintainer Author

arvinxx Jan 23, 2024 Maintainer Author

节奏

arvinxx Jan 29, 2024 Maintainer Author

Logo

canisminor1990 Jan 29, 2024 Maintainer

canisminor1990 Jan 29, 2024 Maintainer

arvinxx Jan 29, 2024 Maintainer Author

arvinxx Jan 29, 2024 Maintainer Author

实现思路

整体思路

LobeAIProvider

arvinxx Feb 1, 2024 Maintainer Author

模型元信息维护

错误处理框架

服务端配置、客户端配置的合并与可视化配置

OneAPI 兼容性

arvinxx Jan 29, 2024 Maintainer Author

snowyu Jan 29, 2024

arvinxx Jan 30, 2024 Maintainer Author

arvinxx Jan 31, 2024 Maintainer Author

Zhipu AI 接入踩坑点记录

图片base64需要移除前缀；

tool_calls 流式有问题：

arvinxx Feb 1, 2024 Maintainer Author

MapleEve Mar 15, 2024

arvinxx Feb 1, 2024 Maintainer Author

AWS Bedrock 接入笔记

arvinxx Feb 4, 2024 Maintainer Author

arvinxx Feb 1, 2024 Maintainer Author

Google Gemini 接入

arvinxx Feb 2, 2024 Maintainer Author

后续如何集成一个新 Provider

modelProviders 元信息

服务端实现

添加环境变量

新增runtime

路由集成

默认配置集成

客户端实现

模型/服务商 icon

selectors

settings

api配置面板

sjy Feb 8, 2024

gijigae Feb 18, 2024

arvinxx Feb 4, 2024 Maintainer Author

特性跟踪

Google Gemini 支持

AWS Bedrock 支持

智谱 GLM 支持

Azure OpenAI 接入重构

arvinxx Feb 4, 2024 Maintainer Author

API Key 填写

arvinxx
Dec 20, 2023
Maintainer

Replies: 13 comments 14 replies

arvinxx
Jan 12, 2024
Maintainer Author

arvinxx Feb 1, 2024
Maintainer Author

坑点2： `HttpResponseOutputParser` 无法正常输出 OpenAI Function

arvinxx
Jan 13, 2024
Maintainer Author

snowyu
Jan 18, 2024

arvinxx Jan 18, 2024
Maintainer Author

arvinxx Jan 20, 2024
Maintainer Author

arvinxx
Jan 23, 2024
Maintainer Author

arvinxx
Jan 29, 2024
Maintainer Author

canisminor1990 Jan 29, 2024
Maintainer

canisminor1990 Jan 29, 2024
Maintainer

arvinxx Jan 29, 2024
Maintainer Author

arvinxx
Jan 29, 2024
Maintainer Author

arvinxx Feb 1, 2024
Maintainer Author

arvinxx
Jan 29, 2024
Maintainer Author

snowyu
Jan 29, 2024

arvinxx Jan 30, 2024
Maintainer Author

arvinxx
Jan 31, 2024
Maintainer Author

`tool_calls` 流式有问题：

arvinxx Feb 1, 2024
Maintainer Author

arvinxx
Feb 1, 2024
Maintainer Author

arvinxx Feb 4, 2024
Maintainer Author

arvinxx
Feb 1, 2024
Maintainer Author

arvinxx
Feb 2, 2024
Maintainer Author

arvinxx
Feb 4, 2024
Maintainer Author

arvinxx Feb 4, 2024
Maintainer Author