MLLM·§ · 主流 VLM 架构(2024-2026)·34

多模态大模型 VLM 面试

LLaVA、Qwen-VL、InternVL、Gemini——主流视觉语言模型架构、训练数据、对齐方案。

#VLM 面试#LLaVA#Qwen-VL#InternVL#多模态面试
§3.1

LLaVA 家族

6
§3.2

Qwen-VL 家族

6
§3.3

InternVL 家族

5
§3.4

其他开源模型

12
§3.5

闭源模型

5
相关主题

本主题 34 道题,第 1 章免费阅读