优设问答你的职场经验书

刘谦Designer 邀你回答

2024/03/04

谷歌推出生成交互大模型 Genie,一张草图直接生成视频游戏!

近日,谷歌DeepMind的研究人员推出了,首个无需数据标记、无监督训练的生成交互模型——Generative Interactive Environments,简称“Genie”。

Genie是一个具有110亿参数的模型,它能够根据图像、真实照片甚至草图生成可控制动作的视频游戏。这个模型的特点是无需数据标记和无监督训练,它通过3万小时、6800万段游戏视频进行了大规模训练,而且训练过程中没有使用任何真实动作标签或其他特定提示。

Genie的核心架构使用了ST-Transformer(时空变换器),这是一种结合了Transformer模型的自注意力机制与时空数据的特性,有效处理视频、多传感器时间序列、交通流量等时空数据的方法。ST-Transformer通过捕捉数据在时间和空间上的复杂依赖关系,提高了对时空序列的理解和预测能力。

Genie的架构主要由三大模块组成: 1. 视频分词器:基于VQ-VAE的模块,将原始视频帧压缩成离散的记号表示,以降低维度并提高视频生成质量。 2. 潜在动作模型:无监督学习模块,从原始视频中推断出状态变化对应的潜在动作,并实现对每一帧的控制。 3. 动力学模型:基于潜在动作模型学习到的动作关系,预测下一帧的视频。

除了视频游戏,你觉得 Genie 模型还能在哪些其他领域发挥作用?

点赞 15 回答 3

首席爆料师 邀你回答

2024/02/28

GitHub Copilot Enterprise正式全面发布,ChatGPT编程时代真的来临了吗?

今天,全球最大开源平台之一GitHub在官网宣布——GitHub Copilot Enterprise正式全面发布。

GitHub Copilot Enterprise核心模块之一GitHub Copilot,是一款基于OpenAI的GPT-4模型,并结合自身积累十多年真实、安全可靠的代码数据开发而成,开发人员通过文本提示就能获取、审核、扩展代码等功能。 其核心功能及亮点如下:

1. 基于OpenAI的GPT-4模型:GitHub Copilot Enterprise利用了先进的语言模型,结合了GitHub的大量代码数据,为开发人员提供智能的代码辅助。 2. 文本提示代码生成:开发人员可以通过简单的文本提示,让GitHub Copilot Enterprise帮助生成、审核和扩展代码。 3. 减少重复性工作:根据调查,大多数开发人员表示使用GitHub Copilot可以减少在重复性编码任务上的精力。 4. 节省搜索时间:GitHub Copilot Enterprise可以帮助开发人员减少在搜索信息上的时间,提高工作效率。 5. 深度了解企业代码库:GitHub Copilot Enterprise能够简化代码导航和理解,加速代码部署、问题解决和代码现代化。 6. 集成ChatGPT聊天功能:开发人员可以通过自然语言与GitHub Copilot Enterprise交流,提出关于代码的问题,并获取帮助。 7. 个性化代码建议:GitHub Copilot Enterprise可以根据企业的特定代码库和标准提供个性化的帮助和建议。 8. 快速审核拉取请求:通过分析拉取请求的差异,GitHub Copilot Enterprise可以帮助审核人员快速了解变更,节省时间并提供有价值的反馈。 9. Bing搜索引擎集成:为了帮助开发人员减少信息搜索时间,GitHub Copilot Enterprise集成了Bing搜索引擎,提供大规模的专业数据搜索。 10. 微调功能:GitHub Copilot Enterprise将推出基于用户个人代码库的微调功能,使得生成的代码更加个性化,进一步帮助开发者提高效率。 11. 价格和订阅:GitHub Copilot Enterprise的月费为39美元,提供了个人和商务版,包括无限的消息、交互、历史记录以及基于存储库的语义搜索等功能。

使用地址:https://github.com/features/copilot/plans

点赞 20 回答 2

128位高手大咖在线答疑解惑

说清楚

完整的描述具体问题和细节

1

耐心等

回答问题需要认真思考,请耐心等待

2

巧咨询

还有疑问?及时追问获取更多答案

3
我要提问