近日,苹果公司与瑞士洛桑联邦理工学院(EPFL)联合开源了一款名为4M-21的多模态视觉模型。该模型具有广泛的通用性和灵活性,尽管只有30亿参数,但它可以执行数十种任务,包括图像分类、目标检测、语义分割、实例分割、深度估计和表面法线估计等。
4M-21模型在21种不同的模态下进行训练,能够处理包括图像、文本、音频等多种模态的任务。这种多模态能力使其在跨模态检索、可控生成和开箱即用性能方面表现出色。
4M-21还支持任意到任意模态的转换,进一步扩展了其应用范围。
4M-21模型的推出标志着从传统单模态优化模型向多模态综合处理能力的重大转变,展示了苹果在AI领域的强大实力和创新能力。
开源地址:https://github.com/apple/ml-4m/ 论文地址:https://arxiv.org/abs/2406.09406 在线demo:https://huggingface.co/spaces/EPFL-VILAB/4M
价格曾经炒到 10 万,一码难求的 AI 智能体平台 Manus(https://manus.im/)今日突然宣布开放注册。
免费福利与付费方案并行 - 免费福利 :自全面开放注册日起,海外所有用户每日均可免费使用一项任务,系统将提供 300 个积分支持。同时,平台还为所有用户发放一次性 1000 积分奖励,用于体验更多服务功能。不过需要注意的是,免费任务积分仅当日有效,不支持结转。
- 付费订阅方案 :平台目前提供三档付费订阅方案,价格分别为每月 19 美元、39 美元和 199 美元。用户可根据自身需求选择合适的方案,解锁更多访问权限、专属功能以及优先服务,进一步提升使用体验。
从2013年启航后,Printify就如火箭般窜升了,迅速成为全球领先的按需制作和落地平台!Printify就能将你的设计变成现实,做周边不要太棒!
✨ 一些你应该知道的亮点: ① 轻松一键上架:只需几分钟,你就可以通过Printify将产品发布到多个电商平台,像是Shopify, WooCommerce, Etsy等等。 ② 一直在成长的设计工具:内嵌强大的设计编辑器,即使你是设计小白也能创造出独一无二的产品。 ③ 闪电般的履行速度:平均24小时内完成生产并发货,让你的顾客快速收到心仪的物品。 ④ 零库存压力:无需担心库存积压,所有商品均在售出后才进行生产和配送。
喜欢今天的推荐吗?欢迎收藏,也期望大家在评论继续分享。
哎呀,昨晚 Meta 发布被称为最强开源的 Llama 3 系列模型了,大晚上扔了个炸弹啊!说实话,这事儿也不算太意外,毕竟 Meta 总是喜欢搞点大动作。他们这次带来的就是那个自称“有史以来最牛”的开源大模型——Llama 3系列。 咱们设计师,又可以借助这个新模型好好发挥一番了!
一起看看这个 GPT-4 级模型,它能干得过 GPT-4 么?
Llama 3模型的特点 - 规模与性能:Meta开源了两款不同规模的Llama 3模型,分别是8B和70B参数规模。Llama 3 8B在性能上与Llama 2 70B相当,而Llama 3 70B则在性能上媲美甚至超越了其他顶尖AI模型。 - 技术改进:Llama 3在预训练和后训练方面都有所改进,优化了模型的一致性和响应多样性,降低了出错率。 - 多模态与多语言:未来几个月,Meta将推出具备多模态、多语言对话和更长上下文窗口的新模型,其中包括超过400B的模型,预计将与现有的顶尖模型竞争。
Llama 3的性能测试 - 基准测试:Llama 3在多个测试中得分超越了其他同类模型,显示出其在推理、代码生成和遵循指令等方面的突破性提升。 - 人类评估数据集:Meta开发了一套新的高质量人类评估数据集,用于准确研究模型性能。
开源与闭源的辩论 - 开源优势:Meta坚定地支持开源路线,认为这有助于推动社区和公司双方的创新。 - 未来展望:尽管Llama 3为开源模型赢得了一场胜利,但关于开源与闭源的辩论仍在继续。未来,可能会有更高性能的模型出现,为这场辩论带来新的转折。
附上 Llama 3 体验地址:https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct