比亚迪汉唐家族携手国际权威色彩机构Pantone,发布2024国潮代表色:银釉白、藕韵灰、暮山紫。三大国潮代表色以传统文化为灵感,引领中式“新国潮”设计走向世界。
“银釉白”灵感源自唐代官窑—邢窑白瓷,该瓷器是中国古代最早的官窑之一,朴素淡雅,纯白光亮,似银似雪。
“藕韵灰”给人一种温润纯净的视觉感官体验,淡雅而富有质感。
“暮山紫”配色的灵感来自于王勃的《滕王阁序》,原文“潦水尽而寒潭清,烟光凝而暮山紫”。 黄昏时刻,山间烟雾与夕阳交织,薄薄紫雾笼罩暮山,呈现出中国传统色的美学意境。再看暮山紫配色车,通体紫色很抓眼球,别有一番独特韵味。
比亚迪对中国文化的国潮力量掌握有自己的“心得”,三种代表色展现出历史独特的韵味。各位设计师对此有什么看法呢?
太疯狂了,还没有从 Sora 和 Pika 的 Lip Sync 的震惊中走出来,今天又发现一个 AI 驱动的电影生成和视频剪辑平台:LTX Studio。
LTX Studio 提供的可视化专业视频控制台,可以帮助用户进一步优化视频的细节达到商业级视频,并且附带语音解读而Sora目前无法提供。
核心功能: ⚡支持通过文字直接生成复杂的剧情视频,包含语音、音效以及视频画面,支持编辑画面内容。 ⚡支持通过故事板组织和剪辑生成的视频,你可以自定义演员场景和造型。
加入等待列表:https://ltx.studio
就在刚刚,马斯克将 OpenAI CEO&联合创始人 Sam Altman 告上法庭。马斯克指控OpenAI违反了其创立协议,该协议旨在开发对全人类有益的非营利性AI技术。
诉讼文件中提到,马斯克和其他原告认为OpenAI的管理层在2023年背离了其非营利的使命,转而与微软建立了独家合作关系,并将先进的AI技术GPT-4的秘密化,以服务于微软的商业利益。
马斯克之前也表达了对AGI的担忧,他与DeepMind联合创始人Demis Hassabis的会面,以及他对AI可能带来的社会威胁的担忧。马斯克和Altman共同创立OpenAI的初衷是确保AI技术的发展能够惠及全人类。然而,随着OpenAI在AI领域的领先地位日益巩固,尤其是在开发出GPT-4模型后,公司的方向发生了根本性转变。
在这场法律风暴中,在AI技术可能带来的潜在风险和利益之间,你更倾向于哪一方?
感兴趣的小伙伴可以戳链接详细了解:https://new.qq.com/rain/a/20240301A06PR600 1.2万字指控细节:https://www.courthousenews.com/wp-content/uploads/2024/02/musk-v-altman-openai-complaint-sf.pdf
OpenAI 周五在其官网上发表了博客文章,名为“驾驭合成声音的挑战和机遇”, 这也是 OpenAI 在官网首次展示了全新自定义音频模型“Voice Engine”。
用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。
除了能合成音频之外,OpenAI 还展示了Voice Engine很多其他际商业用途,例如,一位失去声音表达能力的女孩,在Voice Engine帮助下能像以前一样正常发音说话。
全文内容:OpenAI 官网
Voice Engine 应用场景: 1. 阅读助手:可以通过自然且富有情感的声音为非阅读者和儿童提供阅读辅助,实时个性化响应,与学生互动。 2. 内容翻译:可以翻译视频和播客等内容,使创作者和企业能够以流利且原汁原味的声音触达全球更多受众。 3. 服务全球:改善偏远地区的必要服务。 4. 帮助言语障碍人士:为言语障碍人士提供治疗应用,以及为有学习需求的人士提供教育增强功能,使残疾人能够进行交流。 5. 帮助病人恢复声音:帮助患有突发性或退行性言语障碍的患者恢复声音。
近日,谷歌DeepMind的研究人员推出了,首个无需数据标记、无监督训练的生成交互模型——Generative Interactive Environments,简称“Genie”。
Genie是一个具有110亿参数的模型,它能够根据图像、真实照片甚至草图生成可控制动作的视频游戏。这个模型的特点是无需数据标记和无监督训练,它通过3万小时、6800万段游戏视频进行了大规模训练,而且训练过程中没有使用任何真实动作标签或其他特定提示。
Genie的核心架构使用了ST-Transformer(时空变换器),这是一种结合了Transformer模型的自注意力机制与时空数据的特性,有效处理视频、多传感器时间序列、交通流量等时空数据的方法。ST-Transformer通过捕捉数据在时间和空间上的复杂依赖关系,提高了对时空序列的理解和预测能力。
Genie的架构主要由三大模块组成: 1. 视频分词器:基于VQ-VAE的模块,将原始视频帧压缩成离散的记号表示,以降低维度并提高视频生成质量。 2. 潜在动作模型:无监督学习模块,从原始视频中推断出状态变化对应的潜在动作,并实现对每一帧的控制。 3. 动力学模型:基于潜在动作模型学习到的动作关系,预测下一帧的视频。
除了视频游戏,你觉得 Genie 模型还能在哪些其他领域发挥作用?
前几天,马斯克一纸诉状将 OpenAI 告上法庭,这场 OpenAI 与马斯克之间的大战,显然硝烟愈浓。
3月6日,OpenAI在官网正式回应了马斯克的起诉,并公布了多封他在OpenAI时与Sam Altman、Greg Brockman、Ilya Sutskever等联合创始人的重要邮件。
以下为 OpenAI 这篇亮点满满的回应文章的部分重点: - 马斯克曾答应为 OpenAI 提供 10 亿美元,实际上只给了不到 4500 万美元; - 想构建真正 AGI 所需的资金远超预期,而 OpenAI 作为一个非盈利组织很难筹集到每年数十亿美元的投资。 - 马斯克早已了解 OpenAI 转为营利公司的计划,只是在 OpenAI 拒绝由他完全控制后,才愤而离开; - OpenAI 中的 Open 不等于开源。如今要求 OpenAI 恢复开源的马斯克,当初是理解并认同 OpenAI 的使命并不意味着开源 AGI 的。 - 自 Altman 回归 OpenAI 后似乎就杳无音信的 Ilya Sutskever,也赫然出现在了这篇回应的作者栏中。
官方原文:https://openai.com/blog/openai-elon-musk#email-4
今天英伟达(NVIDIA)在官网推出了,生成式AI(AIGC)专业认证,通过考试可获得行业认可的权威证书。
该认证支持远程报名和考试,适合软件工程师、数据工程师、云解决方案架构师、AI DevOps 工程师等,可增加就业竞争力成为大模型领域的专家。
认证考试将于太平洋时间3月18日开始,这是英伟达5年来首次举办的线下技术交流大会。考试内容包括机器学习、神经网络、提示工程、对齐、数据分析、实验设计、数据预处理、特征工程以及大语言模型的Python库和集成部署等。考试时间为1小时,包含50道题,费用为135美元。
认证详情地址:https://www.nvidia.com/en-us/learn/certification/generative-ai-llm-associate/
4月10日凌晨,谷歌在官网正式发布了Gemini1.5Pro,现在可在180多个国家/地区使用。
Gemini 1.5 Pro 不仅能够生成创意文本和代码,还能理解、总结上传的视频和音频内容,并且支持高达100万tokens的上下文。
在Google AI Studio开发平台中,用户可以免费试用Gemini 1.5 Pro,并且它支持中文提示。这使得用户能够通过简单的操作,上传视频或音频文件,并获取内容的深度总结。例如,用户可以上传一个视频并询问影片的内容,Gemini 1.5 Pro能够快速解析并提供答案。
Gemini 1.5 Pro还提供了音频理解功能,能够快速解析音频文件并总结其内容。这对于需要处理大量视频和音频内容的用户来说,无疑是一个巨大的帮助,因为它可以节省大量的时间。
谷歌还对Gemini API进行了性能优化,包括系统指令、JSON模式以及函数调用优化,这些改进显著提升了模型的稳定性和输出能力。系统指令功能允许用户根据特定需求控制模型的行为,JSON模式可以帮助开发者从文本或图像中提取结构化数据,而函数调用优化则支持开发者实现更全面的查询响应。
详情点此查看: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html
音频理解能力: https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb