优设问答你的职场经验书

张小闲 邀你回答

2025/02/06

秒变4K!Creative Upscaler超级图像增强工具细节堪称完美~

Creative Upscaler 是由 Stability AI 推出的一款基于人工智能的图像增强工具,其主要功能是将低分辨率的图像提升至4K分辨率,并通过先进的机器学习算法为图像添加新的细节和内容,从而实现图像质量的显著提升。这一工具不仅能够放大图像,还能在不损失原始图像细节的基础上,创造出以前不存在的新细节,赋予图像新的生命力。

Creative Upscaler 的核心特点:

1. 分辨率提升:无论原始图像的分辨率如何,Creative Upscaler 都能将其放大至4K分辨率,使图像更加清晰和细腻。 2. 细节创造:通过结合文本提示和图像内容,Creative Upscaler 能够生成原本不存在的新细节,例如增强纹理、修复扭曲的脸部或添加新的视觉元素。这使得它不仅是一个简单的放大工具,更是一个能够创造新内容的条件生成模型。 3. 高质量转换:该工具能够保留原始图像的大部分特征,同时在较低创意设置下保持图像的自然性,适合需要高质量转换的用户。 4. 个性化调整:用户可以根据需求调整创造力等级,以决定是否适度增加或减少新细节的生成量,从而平衡原始图像特征与新内容之间的关系。 5. 适用范围广泛:Creative Upscaler 适用于艺术家、摄影师、设计师等专业人士,也适合普通用户用于社交媒体图像质量提升或商业宣传材料的视觉优化。

点赞 13 回答 1

大白(●—●) 邀你回答

2024/04/25

苹果也加入AI革新浪潮了,OpenELM 大模型开源,大模型领域会迎来新风向吗?

4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3 Mini类似,是一款专门针对手机等移动设备的模型。

以下是一些重点信息的摘要: 1. 开源OpenELM: 苹果公司开源了一个名为OpenELM的大语言模型,这与微软开源的Phi-3 Mini类似,是专为移动设备设计的模型。 2. 模型参数: OpenELM提供了四种不同参数规模的模型,分别是2.7亿、4.5亿、11亿和30亿参数。 3. 功能: 该模型能够执行生成文本、代码、翻译、总结摘要等功能。 4. 预训练数据: 尽管最小的模型只有2.7亿参数,但苹果使用了1.8万亿tokens的数据进行预训练,这是其小参数下仍能表现出色的原因之一。 5. 深度神经网络库CoreNet: 苹果同时开源了用于训练OpenELM的深度神经网络库CoreNet,该库在开源后不久就在GitHub上获得了超过1100个星标。 6. 苹果的开源策略: 苹果通常在手机领域采取闭源策略,但此次开源可能是为了吸引用户,未来可能会推出闭源产品实现商业化。 7. 技术贡献: 苹果不仅发布了模型权重和推理代码,还发布了完整的训练和评估框架,包括数据准备、模型训练、微调和评估流程,以及多个预训练检查点和训练日志。 8. OpenELM架构: OpenELM的架构,包括其技术创新点,如无编码器的transformer架构、层级缩放策略、不使用全连接层中的可学习偏置参数等。 9. 训练流程与数据集: 苹果使用CoreNet作为训练框架,Adam优化算法,以及动态分词和数据过滤的方法。

开源地址:https://huggingface.co/collections/apple/openelm-instruct-models-6619ad295d7ae9f868b759ca?ref=maginative.com CoreNet地址:https://github.com/apple/corenet?ref=maginative.com 论文地址:https://arxiv.org/abs/2404.14619

点赞 9 回答 2