北京智源推出通用视觉AI模型SegGPT:可自动追踪并分割影音中的物体
时间:2023-05-31 11:11 来源: IT之家 阅读量:6983
,在2023年中关村论坛人工智能大模型发展论坛中,北京智源人工智能研究院推出了旗下通用分割模型 SegGPT。
据称,SegGPT模型是智源通用视觉模型Painter的衍生模型,具备上下文推理能力,在训练完成后只需要提供示例即可推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等,都可以利用视觉提示词完成分割任务。
SegGPT也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割,并且可以用掩码的颜色作为物体的 ID,进行自动追踪。
IT之家经过查询知悉,此前 Meta 也发布了其基于AI的SegmentAnythingModel模型,具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出SEEM 模型,通过不同的视觉提示和语言提示,一键分割图像、视频。IT之家的小伙伴们可以从这里访问模型的论文链接。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
热点精选
- 创造历史芯片巨头英伟达市值一度突破万亿美元2023-05-31 10:27:14
- 三年再见,特斯拉CEO马斯克今日访华2023-05-31 09:06:44
- 揭秘英伟达万亿市值:黄仁勋在“AI寒冬”逆势2023-05-31 08:20:46
- 减产有分歧欧佩克内讧2023-05-31 08:02:42
- QBot木马升级为勒索工具,滥用Win10写2023-05-30 15:05:31
- 不只轻量化 更提升整车设计 解读奇瑞捷豹路虎2023-05-30 13:43:17
- 积极推进本土化和电气化进程 奇瑞捷豹路虎打造2023-05-30 13:34:03
- 市场预期建设步伐有望加快5月全国碳市场量价齐2023-05-30 13:24:32
- 荣耀90Pro机型行业首发3840Hz超高频2023-05-30 13:02:19
- 福特CEO盛赞比亚迪:完全垂直积极进取2023-05-30 12:46:15