Creative Upscaler 是由 Stability AI 推出的一款基于人工智能的图像增强工具,其主要功能是将低分辨率的图像提升至4K分辨率,并通过先进的机器学习算法为图像添加新的细节和内容,从而实现图像质量的显著提升。这一工具不仅能够放大图像,还能在不损失原始图像细节的基础上,创造出以前不存在的新细节,赋予图像新的生命力。
Creative Upscaler 的核心特点:
1. 分辨率提升:无论原始图像的分辨率如何,Creative Upscaler 都能将其放大至4K分辨率,使图像更加清晰和细腻。 2. 细节创造:通过结合文本提示和图像内容,Creative Upscaler 能够生成原本不存在的新细节,例如增强纹理、修复扭曲的脸部或添加新的视觉元素。这使得它不仅是一个简单的放大工具,更是一个能够创造新内容的条件生成模型。 3. 高质量转换:该工具能够保留原始图像的大部分特征,同时在较低创意设置下保持图像的自然性,适合需要高质量转换的用户。 4. 个性化调整:用户可以根据需求调整创造力等级,以决定是否适度增加或减少新细节的生成量,从而平衡原始图像特征与新内容之间的关系。 5. 适用范围广泛:Creative Upscaler 适用于艺术家、摄影师、设计师等专业人士,也适合普通用户用于社交媒体图像质量提升或商业宣传材料的视觉优化。
近日有内幕爆出,苹果公司不会在今年推出由 Apple Intelligence 驱动的全新 Siri。
苹果会计划在明年 1 月开启全新 Siri 测试,并在 iOS 18.4 中推出正式版本。另外,Siri 的其他功能,例如新设计和 ChatGPT 集成,将于今年晚些时候推出。此前的报道中,Gurman 指出 Apple Intelligence 也将出现在 Vision Pro 上,但要到明年。
苹果在 6 月举办的 WWDC 上推出了搭载 Apple Intelligence (Apple 智能)的全新 Siri,用户在升级到 iOS 18 后,可以更自然地与 Siri 对话,新的 Siri 还能够很好地理解上下文。
不过,全新 Siri 只支持 iPhone 15 Pro 及以上的设备,而即将推出的 iPhone 16 系列也将支持 Apple Intelligence。另外,Mac 和 iPad 设备需要搭载 M1 及以上的芯片才能使用 Apple Intelligence。
大家对新版的 Siri 有哪些期待呢?
4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3 Mini类似,是一款专门针对手机等移动设备的模型。
以下是一些重点信息的摘要: 1. 开源OpenELM: 苹果公司开源了一个名为OpenELM的大语言模型,这与微软开源的Phi-3 Mini类似,是专为移动设备设计的模型。 2. 模型参数: OpenELM提供了四种不同参数规模的模型,分别是2.7亿、4.5亿、11亿和30亿参数。 3. 功能: 该模型能够执行生成文本、代码、翻译、总结摘要等功能。 4. 预训练数据: 尽管最小的模型只有2.7亿参数,但苹果使用了1.8万亿tokens的数据进行预训练,这是其小参数下仍能表现出色的原因之一。 5. 深度神经网络库CoreNet: 苹果同时开源了用于训练OpenELM的深度神经网络库CoreNet,该库在开源后不久就在GitHub上获得了超过1100个星标。 6. 苹果的开源策略: 苹果通常在手机领域采取闭源策略,但此次开源可能是为了吸引用户,未来可能会推出闭源产品实现商业化。 7. 技术贡献: 苹果不仅发布了模型权重和推理代码,还发布了完整的训练和评估框架,包括数据准备、模型训练、微调和评估流程,以及多个预训练检查点和训练日志。 8. OpenELM架构: OpenELM的架构,包括其技术创新点,如无编码器的transformer架构、层级缩放策略、不使用全连接层中的可学习偏置参数等。 9. 训练流程与数据集: 苹果使用CoreNet作为训练框架,Adam优化算法,以及动态分词和数据过滤的方法。
开源地址:https://huggingface.co/collections/apple/openelm-instruct-models-6619ad295d7ae9f868b759ca?ref=maginative.com CoreNet地址:https://github.com/apple/corenet?ref=maginative.com 论文地址:https://arxiv.org/abs/2404.14619
嘿,小伙伴们!🎉 今天给大家带来一款超酷、超有趣的工具——AI Emoji Generator! 这可不是普通的emoji库!Emoji AI 是一款革命性的AI工具,它拥有读心术般的超能力! 在这里,你可以找到各种各样的表情符号,从可爱的猫咪戴墨镜,到酷炫的宇智波鼬使用写轮眼,再到搞笑的鲨鱼戴礼帽,甚至还有流行的 Blackpink 表情符号!无论你是动漫迷、科技控,还是喜欢萌宠,这里都能满足你!
沟通魅力值Max Up! 1. 朋友圈/小红书文案:配上AI生成的表情,平平无奇的文字立刻吸睛指数爆表!轻松收获更多点赞评论! 2. 工作沟通/邮件:恰到好处的emoji能让语气更友好,表达更清晰,提升沟通效率!(当然,商务场合要适度哦) 3. 社群/聊天:成为群聊里的“表情包王者”,精准传达幽默、调侃、温暖或支持,拉近距离,活跃气氛! 4. 营销文案/广告语:用独特的emoji组合抓住用户眼球,让品牌形象更生动、更年轻!
官网地址;https://www.emojis.com/
近日,苹果公司与瑞士洛桑联邦理工学院(EPFL)联合开源了一款名为4M-21的多模态视觉模型。该模型具有广泛的通用性和灵活性,尽管只有30亿参数,但它可以执行数十种任务,包括图像分类、目标检测、语义分割、实例分割、深度估计和表面法线估计等。
4M-21模型在21种不同的模态下进行训练,能够处理包括图像、文本、音频等多种模态的任务。这种多模态能力使其在跨模态检索、可控生成和开箱即用性能方面表现出色。
4M-21还支持任意到任意模态的转换,进一步扩展了其应用范围。
4M-21模型的推出标志着从传统单模态优化模型向多模态综合处理能力的重大转变,展示了苹果在AI领域的强大实力和创新能力。
开源地址:https://github.com/apple/ml-4m/ 论文地址:https://arxiv.org/abs/2406.09406 在线demo:https://huggingface.co/spaces/EPFL-VILAB/4M