Segment Anything
提米概览
AI工具
“Meta 视觉分割大模型,万物皆可一键抠图”
🔥 提米指数:5 / 5.0
SAM (Segment Anything Model) 的发布,在计算机视觉(CV)领域绝对是一次“核爆级”的事件。提米哥认为,它对于 CV 界的意义,堪比 GPT-3 对于 NLP 界的意义,因为它标志着“视觉基础模型”时代的到来。在 SAM 出现之前,图像分割模型通常需要针对特定任务(比如分割人像、分割汽车)进行大量的标注数据训练,费时费力且泛化能力差。而 SAM 彻底颠覆了这个范式。你给它任何一张图片,完全不需要任何针对性的训练,只需要用鼠标在图上点一下或者画个框,它就能以惊人的精度把那个物体完整地分割(抠)出来!提米哥第一次玩它的在线 Demo 时,下巴都快惊掉了:无论是前景的人物、远处的建筑,还是水里的倒影、透明的玻璃杯,它都能精准识别并生成高质量的掩码(Mask)。这种“万物皆可分割”的零样本(Zero-shot)能力,源于它在 11 亿张图片和 10 亿个掩码构成的庞大数据集上的训练。它的出现,直接让无数做传统抠图、图像标注的公司感受到了降维打击。现在市面上我们看到的大部分“AI 抠图”、“魔术橡皮擦”工具,其背后或多或少都受到了 SAM 的启发,或者直接使用了它的技术。它不仅是一个模型,更是一个强大的工具和数据集,为下游的图像编辑、自动驾驶、医疗影像分析等应用提供了无限的可能性。
