今天,全球最大开源平台之一GitHub在官网宣布——GitHub Copilot Enterprise正式全面发布。
GitHub Copilot Enterprise核心模块之一GitHub Copilot,是一款基于OpenAI的GPT-4模型,并结合自身积累十多年真实、安全可靠的代码数据开发而成,开发人员通过文本提示就能获取、审核、扩展代码等功能。 其核心功能及亮点如下:
1. 基于OpenAI的GPT-4模型:GitHub Copilot Enterprise利用了先进的语言模型,结合了GitHub的大量代码数据,为开发人员提供智能的代码辅助。 2. 文本提示代码生成:开发人员可以通过简单的文本提示,让GitHub Copilot Enterprise帮助生成、审核和扩展代码。 3. 减少重复性工作:根据调查,大多数开发人员表示使用GitHub Copilot可以减少在重复性编码任务上的精力。 4. 节省搜索时间:GitHub Copilot Enterprise可以帮助开发人员减少在搜索信息上的时间,提高工作效率。 5. 深度了解企业代码库:GitHub Copilot Enterprise能够简化代码导航和理解,加速代码部署、问题解决和代码现代化。 6. 集成ChatGPT聊天功能:开发人员可以通过自然语言与GitHub Copilot Enterprise交流,提出关于代码的问题,并获取帮助。 7. 个性化代码建议:GitHub Copilot Enterprise可以根据企业的特定代码库和标准提供个性化的帮助和建议。 8. 快速审核拉取请求:通过分析拉取请求的差异,GitHub Copilot Enterprise可以帮助审核人员快速了解变更,节省时间并提供有价值的反馈。 9. Bing搜索引擎集成:为了帮助开发人员减少信息搜索时间,GitHub Copilot Enterprise集成了Bing搜索引擎,提供大规模的专业数据搜索。 10. 微调功能:GitHub Copilot Enterprise将推出基于用户个人代码库的微调功能,使得生成的代码更加个性化,进一步帮助开发者提高效率。 11. 价格和订阅:GitHub Copilot Enterprise的月费为39美元,提供了个人和商务版,包括无限的消息、交互、历史记录以及基于存储库的语义搜索等功能。
使用地址:https://github.com/features/copilot/plans
随着今年WWDC的临近,记者 Gurman 在其最新一期《Power On》专栏中,为我们揭秘了苹果在人工智能领域的最新进展。苹果将对其智能助手Siri进行升级,新版本的Siri将依托于苹果自主研发的LLM技术,为用户提供更为智能的服务。
除此之外,苹果还将在多个方面引入AI技术以增强用户体验,例如通过AI技术实现语音备忘录的自动转录、照片的智能修饰,以及Spotlight和Safari搜索功能的优化。而且,AI还将能够根据用户的短信内容,动态生成个性化的表情符号。
在个性化界面方面,苹果也做出了创新。用户将能够摆脱网格的限制,自由地在屏幕上摆放图标,并可以自定义图标的颜色,这一改进虽与AI无直接关系,但无疑将极大地提升用户体验。
同时,有消息称苹果将在即将到来的 iOS 18 和 macOS 15 系统中,为 Safari 浏览器加入一系列人工智能支持的新功能。
1、智能搜索。 苹果可能在搜索中引入 Ajax 语言模型来提供文本摘要。
2、Web橡皮擦:这一功能强调用户界面的简化和隐私保护的增强,允许用户自定义网页内容,删除不需要的元素,如广告和图片。
3、用户界面更新:苹果正在将 Safari 的关键工具集中到一个位置,以提高用户的访问效率。
4、 AI增强的视觉查找:苹果可能在2025年推出高级视觉搜索功能,允许用户通过图像获取信息,类似于 Siri 目前识别照片中的植物、宠物和地标的功能。
这些新功能的加入,将使Safari浏览器的使用体验更上一层楼,你觉得哪项最实用呢?
大家还记得 Sora 是什么时候发布的吗?2 月份,当时 OpenAI 发布之后,一夜之间就把 AI 视频生成界搅得天翻地覆啊,但是现在一点消息都没有了,反倒是其他平台遍地开花,特别是这个月,简直太爆炸了~
昨天深夜,Runway 放出酝酿了半年的全新版本 Gen-3 Alpha,也让我们再次见证了这些巨头的底蕴。
Runway Gen-3 Alpha 特点如下: 高保真视频生成:能够生成接近真实世界质量的视频内容,具有高度的细节和清晰度。 精细动作控制:模型能够精确控制视频中对象的动作和过渡,实现复杂场景的流畅动画。 逼真人物生成:特别擅长生成具有自然动作、表情和情感的逼真人类角色。 多模态输入:支持文字转视频、图像转视频、文字转图像等多种创作方式。 先进工具:支持运动画笔、相机控制和导演模式等专业创作工具。 增强的安全措施:引入新的内部视觉审核系统和 C2PA 标准,确保内容的安全性和可靠性。 高质量训练:使用高描述性的、时间密集的字幕进行训练,使模型能够理解和生成具有丰富时间动态的视频。
现在还在内测中,后期可以体验的时候再给大家分享地址!
PixelLab 是一款功能强大的工具,主要用于创建像素艺术动画和环境。以下是其主要功能和特点介绍:
动画功能 - 骨骼动画 :通过基于骨骼的动画系统,用户可以完全控制角色的动作,非常适合制作复杂且自然的动画效果。 - 文本生成动画 :用户可以通过描述想要的动作来生成动画,快速为角色创建行走、奔跑和攻击等动画。 - 动画迁移 :可以从现有的动画中进行迁移和修改,节省从头创建新动画的时间和精力。
旋转功能 - 多方向视图 :只需单击一下,即可创建角色和物体的完美精灵旋转,生成 4 或 8 个方向视图,非常适合等距和俯视游戏,适用于从简单到复杂设计的各种角色风格。 - 等距支持 :支持等距视图,允许用户创建具有 3D 效果的 2D 像素艺术风格。
风格与编辑功能 - 风格一致生成 :PixelLab 的模型可以根据参考图像进行调整,创建与游戏风格相匹配的角色和物品,保持视觉一致性。 - 真实情境感知修复 :与其他模型不同,该工具在编辑时能够看到并理解原始图像,这意味着在更改服装、添加配饰或修改环境时可以实现完美的风格匹配。
环境功能 - 场景生成 :用户可以通过文本描述生成详细的像素艺术场景和环境,非常适合创建氛围背景和游戏世界,能够生成高达 400x400 像素的场景。 - 游戏地图 :可以为俯视和横版滚动游戏创建可平铺的资产,生成能够无缝拼接在一起的一致地图瓷砖。
PixelLab 为像素艺术创作提供了全面的解决方案,无论是动画制作、角色和物品设计,还是场景和环境构建,都能满足用户的需求,是游戏开发者和像素艺术家的有力工具。
jitter.video去年让不少设计师眼前一亮!这是一款为咱们设计师和创意达人们量身定做的动画设计神器,目标就是让你做动画的时候省时又省力。来看看几个理由,为啥会是你工作中的新宠儿?
① 操作简单上手快:Jitter的设计界面友好,哪怕你是新手小白,也能迅速找到感觉。用它来搞品牌动画、社交媒体的小视频、网站或者APP上的小动效,都能得心应手。
② 功能强大样样精通:不管是动画UI、短视频、社交帖子,还是网站和应用的设计,Jitter全都能搞定。一个平台解决多个需求,直接把效率拉满!
③ 高效的工作流:和Figma的完美结合,让你在创作的时候更加专注,不用再为了那些复杂的编辑和动画设置烦恼。这样一来,团队合作也变得更加丝滑。
④ 专业级输出:不管是用来做吸睛的营销视频,还是打磨品牌的精美动画,Jitter都能满足高品质作品的追求。毕竟有丰富的工具和模板库支持!
微软 GitHub 于今年 7 月份面向企业用户推出了 Copilot Chat 工具,这是一个 AI 代码助手。现在 GitHub 宣布将 Copilot Chat 公测版扩展至个人用户,提供实时编程帮助。用户可通过订阅每月或每年的个人用户费用来体验该功能,提高编码效率和质量。
以下是GitHub Copilot Chat的主要功能: 1、实时指导:它可以为开发者提供实时的最佳实践、技巧和解决方案建议。 2、代码分析:开发者可以使用它来分解复杂的编程概念,并获取代码片段的详细解释。 3、修复安全问题:它能够识别代码中的安全漏洞,并为其提供修复建议。 4、简单的故障排除:除了识别代码中的问题,它还可以为开发者提供解决方案、解释和替代方法。 5、学习新的语言或框架:它可以帮助开发者快速学习新的编程语言或框架,并为他们提供相关的代码示例和建议。
OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”,是一款扩大聊天机器人应用范围的小型AI模型,它被标榜为功能强大且成本效益高的模型,并预留了未来整合图像、视频和音频处理能力的空间。
作为多模态技术推进的一部分,GPT-4o mini 即时起服务于ChatGPT的免费、Plus及Team用户,预计下周覆盖Enterprise用户。它是基于GPT-4o(5月发布,具备全面的多媒体处理能力和高速度)的精简版,优化了成本和响应速度,能处理长达128K tokens的上下文,特别提升了对非英文内容的支持,知识库更新至2023年10月。
在MMLU和MGSM基准测试中,GPT-4o mini表现出色,分别获得了82%和87.0%的分数,优于同类模型。目前,该模型已具备文本和图像处理功能,未来将扩展至视频和音频领域,大家觉得怎么样?
戳链接查看详情:GPT-4o mini
4月10日凌晨,谷歌在官网正式发布了Gemini1.5Pro,现在可在180多个国家/地区使用。
Gemini 1.5 Pro 不仅能够生成创意文本和代码,还能理解、总结上传的视频和音频内容,并且支持高达100万tokens的上下文。
在Google AI Studio开发平台中,用户可以免费试用Gemini 1.5 Pro,并且它支持中文提示。这使得用户能够通过简单的操作,上传视频或音频文件,并获取内容的深度总结。例如,用户可以上传一个视频并询问影片的内容,Gemini 1.5 Pro能够快速解析并提供答案。
Gemini 1.5 Pro还提供了音频理解功能,能够快速解析音频文件并总结其内容。这对于需要处理大量视频和音频内容的用户来说,无疑是一个巨大的帮助,因为它可以节省大量的时间。
谷歌还对Gemini API进行了性能优化,包括系统指令、JSON模式以及函数调用优化,这些改进显著提升了模型的稳定性和输出能力。系统指令功能允许用户根据特定需求控制模型的行为,JSON模式可以帮助开发者从文本或图像中提取结构化数据,而函数调用优化则支持开发者实现更全面的查询响应。
详情点此查看: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html
音频理解能力: https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb