互联网从业者的资讯社区
互联网从业者的资讯社区
下载 App 打开应用

Ferret - 在任何粒度上,随时随地引用和定位任何事物。

Ferret - Refer and ground anything anywhere at any granularity

#Apple#公司推出了一种新型的多模态大型语言模型(MLLM),在图像理解和语言处理方面表现出色,尤其在理解空间指代方面展现出显著优势。

A new type of multimodal large language model (MLLM) from #Apple# that excels in both image understanding and language processing, particularly demonstrating significant advantages in understanding spatial references.

https://www.producthunt.com/posts/ferret
https://zhijieshequ.com/post/npCuazMi
回复 简在我心

未登录无法操作

评论
列表为空,暂无内容

服务条款 隐私政策 Cookie 使用条款

© 2024 知结社区 | Powered by Fresns

弗雷森斯(苏州)科技有限公司

苏ICP备2021027795号-3

增值电信业务经营许可证:苏B2-20210954

广播电视节目制作经营许可证:(苏)字第02601号

不良信息举报: jubao@fresns.cn