哎呀,昨晚 Meta 发布被称为最强开源的 Llama 3 系列模型了,大晚上扔了个炸弹啊!说实话,这事儿也不算太意外,毕竟 Meta 总是喜欢搞点大动作。他们这次带来的就是那个自称“有史以来最牛”的开源大模型——Llama 3系列。 咱们设计师,又可以借助这个新模型好好发挥一番了!
一起看看这个 GPT-4 级模型,它能干得过 GPT-4 么?
Llama 3模型的特点 - 规模与性能:Meta开源了两款不同规模的Llama 3模型,分别是8B和70B参数规模。Llama 3 8B在性能上与Llama 2 70B相当,而Llama 3 70B则在性能上媲美甚至超越了其他顶尖AI模型。 - 技术改进:Llama 3在预训练和后训练方面都有所改进,优化了模型的一致性和响应多样性,降低了出错率。 - 多模态与多语言:未来几个月,Meta将推出具备多模态、多语言对话和更长上下文窗口的新模型,其中包括超过400B的模型,预计将与现有的顶尖模型竞争。
Llama 3的性能测试 - 基准测试:Llama 3在多个测试中得分超越了其他同类模型,显示出其在推理、代码生成和遵循指令等方面的突破性提升。 - 人类评估数据集:Meta开发了一套新的高质量人类评估数据集,用于准确研究模型性能。
开源与闭源的辩论 - 开源优势:Meta坚定地支持开源路线,认为这有助于推动社区和公司双方的创新。 - 未来展望:尽管Llama 3为开源模型赢得了一场胜利,但关于开源与闭源的辩论仍在继续。未来,可能会有更高性能的模型出现,为这场辩论带来新的转折。
附上 Llama 3 体验地址:https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct
近日有内幕爆出,苹果公司不会在今年推出由 Apple Intelligence 驱动的全新 Siri。
苹果会计划在明年 1 月开启全新 Siri 测试,并在 iOS 18.4 中推出正式版本。另外,Siri 的其他功能,例如新设计和 ChatGPT 集成,将于今年晚些时候推出。此前的报道中,Gurman 指出 Apple Intelligence 也将出现在 Vision Pro 上,但要到明年。
苹果在 6 月举办的 WWDC 上推出了搭载 Apple Intelligence (Apple 智能)的全新 Siri,用户在升级到 iOS 18 后,可以更自然地与 Siri 对话,新的 Siri 还能够很好地理解上下文。
不过,全新 Siri 只支持 iPhone 15 Pro 及以上的设备,而即将推出的 iPhone 16 系列也将支持 Apple Intelligence。另外,Mac 和 iPad 设备需要搭载 M1 及以上的芯片才能使用 Apple Intelligence。
大家对新版的 Siri 有哪些期待呢?
4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3 Mini类似,是一款专门针对手机等移动设备的模型。
以下是一些重点信息的摘要: 1. 开源OpenELM: 苹果公司开源了一个名为OpenELM的大语言模型,这与微软开源的Phi-3 Mini类似,是专为移动设备设计的模型。 2. 模型参数: OpenELM提供了四种不同参数规模的模型,分别是2.7亿、4.5亿、11亿和30亿参数。 3. 功能: 该模型能够执行生成文本、代码、翻译、总结摘要等功能。 4. 预训练数据: 尽管最小的模型只有2.7亿参数,但苹果使用了1.8万亿tokens的数据进行预训练,这是其小参数下仍能表现出色的原因之一。 5. 深度神经网络库CoreNet: 苹果同时开源了用于训练OpenELM的深度神经网络库CoreNet,该库在开源后不久就在GitHub上获得了超过1100个星标。 6. 苹果的开源策略: 苹果通常在手机领域采取闭源策略,但此次开源可能是为了吸引用户,未来可能会推出闭源产品实现商业化。 7. 技术贡献: 苹果不仅发布了模型权重和推理代码,还发布了完整的训练和评估框架,包括数据准备、模型训练、微调和评估流程,以及多个预训练检查点和训练日志。 8. OpenELM架构: OpenELM的架构,包括其技术创新点,如无编码器的transformer架构、层级缩放策略、不使用全连接层中的可学习偏置参数等。 9. 训练流程与数据集: 苹果使用CoreNet作为训练框架,Adam优化算法,以及动态分词和数据过滤的方法。
开源地址:https://huggingface.co/collections/apple/openelm-instruct-models-6619ad295d7ae9f868b759ca?ref=maginative.com CoreNet地址:https://github.com/apple/corenet?ref=maginative.com 论文地址:https://arxiv.org/abs/2404.14619
Creative Upscaler 是由 Stability AI 推出的一款基于人工智能的图像增强工具,其主要功能是将低分辨率的图像提升至4K分辨率,并通过先进的机器学习算法为图像添加新的细节和内容,从而实现图像质量的显著提升。这一工具不仅能够放大图像,还能在不损失原始图像细节的基础上,创造出以前不存在的新细节,赋予图像新的生命力。
Creative Upscaler 的核心特点:
1. 分辨率提升:无论原始图像的分辨率如何,Creative Upscaler 都能将其放大至4K分辨率,使图像更加清晰和细腻。 2. 细节创造:通过结合文本提示和图像内容,Creative Upscaler 能够生成原本不存在的新细节,例如增强纹理、修复扭曲的脸部或添加新的视觉元素。这使得它不仅是一个简单的放大工具,更是一个能够创造新内容的条件生成模型。 3. 高质量转换:该工具能够保留原始图像的大部分特征,同时在较低创意设置下保持图像的自然性,适合需要高质量转换的用户。 4. 个性化调整:用户可以根据需求调整创造力等级,以决定是否适度增加或减少新细节的生成量,从而平衡原始图像特征与新内容之间的关系。 5. 适用范围广泛:Creative Upscaler 适用于艺术家、摄影师、设计师等专业人士,也适合普通用户用于社交媒体图像质量提升或商业宣传材料的视觉优化。
集图像精修、视频焕新、文案爆破于一身,创作者&营销人的终极效率工具包!
🏆 三大王炸功能,彻底释放你的创造力 ❶ 图像工厂:撕掉束缚,让每一张图都封神! - 背景杀手锏:人像/商品秒抠图,复杂光线/毛发动作一键完美分离(再也不用手动P半天!) - 缺陷消灭者:一键抹掉水印、划痕、路人甲,拯救废片于无形 - 魔法放大器:模糊背景聚焦主体/给照片加呼吸感/智能裁剪适配全网平台 - 灵魂出窍特效:静态图秒变动态大片,发朋友圈秒赞神器!
❷ 视频手术刀:无绿幕也能玩转电影级后期 - 背景隐身术:人物/物体瞬间悬浮,随手拍视频秒变专业级大片 - 画质急救包:低清变高清、模糊变锐利、暗淡变明亮,手机素材也能吊打专业拍摄 - 自动配音师:糖评论功能批量生成点赞过万的互动弹幕(亲测引流神器!)
❸ 文案印钞机:灵感枯竭时的救命稻草 - AI重写王:复制粘贴抄袭文,1秒生成原创度99%的高质量内容 - 金句制造机:输入关键词,蹦出直击人心的短文案(带货/表白/励志全场景适用) - 故事挖掘机:上传照片自动生成图文并茂的爆款故事模板,阅读量飙升不是梦!
工具地址:https://booltool.boolv.tech/home
4月25日晚,OpenAI联合创始人兼首席执行官Sam Altman,在斯坦福大学的英伟达(NVIDIA)礼堂进行了公开演讲,超过1000名学生排队参加此次活动。
Altman说:“GPT-5将会比GPT-4更强大,GPT-6将会比GPT-5更智能,OpenAI的终极目标始终都没有变就是实现——AGI(通用人工智能)。”
以下是本次演讲的一些关键信息总结: 1. Sam Altman的演讲:作为OpenAI的联合创始人兼首席执行官,Sam Altman在斯坦福大学的NVIDIA礼堂进行了演讲,吸引了超过1000名学生。 2. AI的未来发展:Altman认为,人类尚未达到AI的极限,并且OpenAI的目标是实现通用人工智能(AGI)。他提到GPT-5将比GPT-4更强大,而GPT-6将比GPT-5更智能。 3. 开源与闭源:Altman认为,为了实现AGI,需要大量的资金投入,因此开源可能不是最佳途径。OpenAI从最初的开源策略转变为闭源,以确保商业回报和持续创新。 4. 资金与投资:他提到,为了推动AGI的发展,无论每年需要多少资金,只要能为全人类和AI领域做出贡献,他都不在乎。 5. OpenAI的核心能力:OpenAI的核心能力在于技术变革,能够定义AI能力的下一个范式转变。 6. Sora模型:OpenAI发布了文生视频模型Sora,这可能会对影视、游戏开发、广告营销等行业产生重大影响。 7. 免费使用ChatGPT:OpenAI宣布无需注册就能免费使用ChatGPT,这有助于那些没有能力开发类似产品的国家或地区。 8. 英伟达与OpenAI的合作:英伟达创始人黄仁勋向OpenAI捐赠了先进的AI超级计算机,这表明了两家公司之间的紧密合作关系。