kssteven418

Sehoon Kim kssteven418

Achievements

SqueezeAILab/LLMCompiler SqueezeAILab/LLMCompiler Public

[ICML 2024] LLMCompiler: An LLM Compiler for Parallel Function Calling

Python 1.5k 109
SqueezeAILab/SqueezeLLM SqueezeAILab/SqueezeLLM Public

[ICML 2024] SqueezeLLM: Dense-and-Sparse Quantization

Python 642 43
Squeezeformer Squeezeformer Public

[NeurIPS'22] Squeezeformer: An Efficient Transformer for Automatic Speech Recognition

Python 245 19
I-BERT I-BERT Public

[ICML'21 Oral] I-BERT: Integer-only BERT Quantization

Python 226 32
LTP LTP Public

[KDD'22] Learned Token Pruning for Transformers

Python 93 17
BigLittleDecoder BigLittleDecoder Public

[NeurIPS'23] Speculative Decoding with Big Little Decoder

Python 85 10