请启用浏览器 JavaScript 以使用 Mentra。

Please enable JavaScript in your browser to use Mentra.

LLM·§七 · 推理与解码·27 题

推理加速与部署面试

vLLM、SGLang、TensorRT-LLM、KV-Cache、PagedAttention、量化——LLM Infra 方向的核心考点。

#vLLM#推理加速#KV Cache#PagedAttention#LLM 量化#TensorRT-LLM

§7.1

解码策略

8 题

§7.2

推理加速

6 题

§7.3

模型压缩

9 题

§7.4

推理框架

4 题

相关主题

Transformer 架构面试全攻略

RAG 检索增强生成面试指南

Attention 机制深度解析

RLHF / DPO / GRPO 对齐面试

SFT 与 PEFT 微调面试

多模态大模型 VLM 面试

本主题 27 道题，第 1 章免费阅读

进入完整基础索引 →面试准备指南