light-vllm

Does not support multiple machines and multiple GPUs

step 1 Simplify

大刀阔斧的删除以下模块

distributed ray
adapter_commons prompt_adapter lora
multimodal
spec_decode guided_decoding
async
usage metrics tracing observability

大概删除568个文件，修改47个文件后，终于又可以跑起来最简单的llm推理

step 2 Refactor

...

step 3 Modularization + Workflow

将工程拆分成可以即插即用的模型，并通过Workflow配置

step 4 Workflow Defined Engine

为不同架构的模型实现不同的模块，并按需加载所需的模块。我将这种架构称为“工作流定义引擎” Workflow Defined Engine，简称为“WDE”。

step 5 支持 prefill only models

请移步 [RFC]: Support encode only models by Workflow Defined Engine

step 6 全部接入Workflow Defined Engine

将所有东西移入wde文件夹，将所有东西移出wde文件夹，向wde致敬，删除wde文件夹

step 7 实现 decoding 模型异步调度

警告

这只是我个人实验（写着玩的）项目，快速测试各种想法

未经严格测试

我会把成熟功能提交到vllm仓库

生产环境请使用vllm

Warning

This is just my personal experiment project to quickly test various ideas

Not rigorously tested

I will submit tested features to the vllm

Use vllm for production environment

LICENSE

vllm is licensed under Apache-2.0.

Name		Name	Last commit message	Last commit date
Latest commit History 142 Commits
benchmarks		benchmarks
cmake		cmake
csrc		csrc
examples		examples
light_vllm		light_vllm
setup		setup
tests		tests
.clang-format		.clang-format
.dockerignore		.dockerignore
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
Dockerfile		Dockerfile
LICENSE		LICENSE
LICENSE-vllm		LICENSE-vllm
MANIFEST.in		MANIFEST.in
README.md		README.md
collect_env.py		collect_env.py
format.sh		format.sh
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Licenses found

Repository files navigation

light-vllm

step 1 Simplify

step 2 Refactor

step 3 Modularization + Workflow

step 4 Workflow Defined Engine

step 5 支持 prefill only models

step 6 全部接入Workflow Defined Engine

step 7 实现 decoding 模型异步调度

警告

Warning

LICENSE

About

Licenses found

Releases 5

Packages

Languages

License

Licenses found

noooop/light-vllm

Folders and files

Latest commit

History

Repository files navigation

light-vllm

step 1 Simplify

step 2 Refactor

step 3 Modularization + Workflow

step 4 Workflow Defined Engine

step 5 支持 prefill only models

step 6 全部接入Workflow Defined Engine

step 7 实现 decoding 模型异步调度

警告

Warning

LICENSE

About

Resources

License

Licenses found

Stars

Watchers

Forks

Releases 5

Packages 0

Languages

Packages