§19.2.6
Genie / Sora 类世界模型对 CV 的冲击?
- §19.2DUSt3R / MASt3R / Spann3R / VGGT 端到端无标定多视图重建?→
- §19.2可驱动数字人(GaussianAvatars / SplatFormer)?→
- §19.1Vision Foundation Model 全景:CLIP / DINOv2/v3 / SAM2 / Depth Anything / VGGT / RAM / Grounding DINO 的定位?→
- §19.1Open-Vocabulary 检测/分割统一范式(YOLO-World、APE、OMG-Seg)?→
- §19.1Universal segmentation(OneFormer、Mask2Former、SEEM)?→
- §19.3VLM CoT / Visual CoT / Image-of-Thought / Chain-of-Spot?→