源Chat 服务端介绍

English / 简体中文

Yuan2.0 模型推理 API 部署

Yuan-2.0, 部署 docker 参考, 获取推理服务的request url：http://127.0.0.1:8000，[参考](https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/inference_server_cn.md)

接口服务部署

在本项目的根目录中有docker_build.sh和docker_run.sh，分别用于制作服务端镜像和启动服务端容器，你可以直接运行这两个命令，来制作和启动。需要注意的是，如果你的Yuan2.0模型服务部署在其他机器上，你需要在启动容器时，加上-e YUAN_2_URL=http://ip:port/yuan，来指定你的模型服务地址。

接口服务介绍

目前后端服务只提供一个接口供UI侧调用，后端使用编程语言为Python，提供接口为Restful方式。接口以SSE（Server Send Event）的方式与ui侧交互。

接口交互信息如下：

接口地址：

http://ip:port/sse/subscribe

其中，ip为服务部署的机器ip，port目前在docker中以5050对外暴露。即：http://ip:5050/sse/subscribe

请求方式：POST

请求数据类型：application/json

响应数据类型：text/event-stream

接口描述：用户发送推理请求，并接收推理结果

请求参数：

参数名称	参数说明	类型	备注
messages	用户请求信息	list[dict_object]	是
response_length	模型推理返回结果的最大 token 序列长度。该参数设置越大，模型生成答案耗时越长。设置过短可能影响生成结果的完整性。token 可能是一个字、词或者标点	int	否
temperature	temperature 值越大，模型的创造性越强，但生成效果不稳定。temperature 值越小，模型的稳定性越强，生成效果稳定。	float	否
top_p	生成 token 的概率累加，从最大概率的 token 往下开始取，当取到累加值大于等于 topP 时停止。当 topP 为 0 时，该参数不起作用。	float	否
top_k	挑选概率最高的 k 个 token 作为候选集。若 k 值为 1，则答案唯一。当 topK 为 0 时，该参数不起作用。该参数与top_p不能同时起作用。	int	否

对dict_object的补充描述，messages为字典列表，用于传递多轮对话信息，对话不宜超过10轮。

参数名称	参数说明	类型	备注
question	用户问题	string	是
answer	系统推理结果	string	否

请求示例：

{
	"messages":[
            {
                "question": "你好",
                "answer": "你好"
            },
            {
                "question": "1+1=?",
                "answer": ""
            }
        ],
	"top_p":0.9,
	"top_k":10,
	"response_length":50,
	"temperature":0.8
}

响应参数：

参数名称	参数说明	类型	备注
errCode	错误码	string	错误标识码
errMessage	错误信息	string	错误说明信息
exceptionMsg	异常信息	string	异常说明信息
flag	结果状态	boolean	true标识系统正常，false标识系统出错
resData	推理结果	dict_object	具体信息见下方补充说明

对resData的结构dict_object补充说明：

参数名称	参数说明	类型	备注
message	推理结果	string
time	推理完成时间	int	13位时间戳格式

以上即为接口服务描述，如需二次开发，可以到代码/src/python/yuan_processing/yuanchat.py中进行查看修改。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

源Chat 服务端介绍

Yuan2.0 模型推理 API 部署

接口服务部署

接口服务介绍

Files

README.md

Latest commit

History

README.md

File metadata and controls

源Chat 服务端介绍

Yuan2.0 模型推理 API 部署

接口服务部署

接口服务介绍