AI 国际简讯 2025年02月18日 微软发布OmniParser V2.0工具,用于识别和解析屏幕上的可交互图标,新版本提升交互图标解析能力。 Meta Reality Labs 的研究团
2 个月前
12月6日,Meta AI推出了新开源模型Llama 3.3 70B。 Meta AI副总裁Ahmad Al-Dahle在社交媒体平台发布的一篇帖子中表示,这款仅支持文本的Llama 3.3 70B模
4 个月前
Meta的Transfusion模型代表了多模态AI领域的一个重要进展,成功地将Transformer架构与扩散模型(Diffusion models)结合起来,实现了对文本和图像的统一处理和生成。
8 个月前
Meta推出了其 “分割一切AI” 的第二代——SAM2,不仅能实时处理任意长度的视频,连视频中从未见过的物体也能轻松分割追踪。
9 个月前
据称,Llama3.1开源大模型的表现能力优于ChatGPT-4o。
9 个月前