§17.1.2
结构化剪枝(filter/channel)vs 非结构化剪枝?Network Slimming / Lottery Ticket?
- §17.1INT8 PTQ / QAT 在 CV 模型上的实现?per-tensor vs per-channel?→
- §17.1知识蒸馏:logits / feature / relation / DKD / 自蒸馏?→
- §17.1TensorRT 的 FP16 / INT8 校准、layer fusion、动态 shape?→
- §17.1ONNX 导出常见坑(动态 shape、自定义算子、opset)?→
- §17.1OpenVINO / NCNN / MNN / TFLite / CoreML / RKNN 的端侧部署对比?→
- §17.2FlashAttention 在视觉模型(ViT / DiT)的收益?→