LLM·§ · 推理与解码·27

推理加速与部署面试

vLLM、SGLang、TensorRT-LLM、KV-Cache、PagedAttention、量化——LLM Infra 方向的核心考点。

#vLLM#推理加速#KV Cache#PagedAttention#LLM 量化#TensorRT-LLM
§7.1

解码策略

8
§7.2

推理加速

6
§7.3

模型压缩

9
§7.4

推理框架

4
相关主题

本主题 27 道题,第 1 章免费阅读