§5.2.10
RWKV-Vision / RetNet 视觉变体?
- §5.2Vision Mamba / VMamba / Mamba2 在 CV 的应用与扫描方向设计?→
- §5.2Hiera / FastViT / EfficientFormer / EfficientViT 移动端 ViT?→
- §5.1ViT 的 Patchify + Linear Projection + [CLS] + Pos Embedding 完整流程?→
- §5.1ViT 为什么需要大数据或强增强(DeiT 蒸馏 token)?→
- §5.1Swin / Swin v2 的 Shifted Window Attention 与相对位置偏置?→
- §5.1PVT / Twins / CSwin / MViT / FocalNet 的层次化设计?→