本页内容受版权保护 · 已添加水印 · 禁止任何形式转载
LLM·§ · Transformer 架构·32

Transformer 架构面试全攻略

从 Self-Attention 推导到 RoPE 旋转位置编码,从 Multi-Query Attention 到 FlashAttention——Transformer 架构是所有 LLM 面试的底层考点。

#Transformer 面试#Self-Attention 推导#RoPE 位置编码#FlashAttention#Multi-Head Attention
相关主题

本主题 32 道题,第 1 章免费阅读