§19.1.1
Vision Foundation Model 全景:CLIP / DINOv2/v3 / SAM2 / Depth Anything / VGGT / RAM / Grounding DINO 的定位?
CV 计算机视觉 · 付费章节
每个框架的第 1 节免费。要读后续章节,可单独解锁本框架,或一次解锁 4 个框架。
或 Pro 订阅 ¥49/月 · 报名冲刺营 都包含解锁
- §19.1Open-Vocabulary 检测/分割统一范式(YOLO-World、APE、OMG-Seg)?→
- §19.1Universal segmentation(OneFormer、Mask2Former、SEEM)?→
- §19.1Open-Vocabulary 检测/分割统一范式(YOLO-World、APE、OMG-Seg)?→
- §19.1Universal segmentation(OneFormer、Mask2Former、SEEM)?→
- §19.2DUSt3R / MASt3R / Spann3R / VGGT 端到端无标定多视图重建?→
- §19.2可驱动数字人(GaussianAvatars / SplatFormer)?→