
往期教程:
前几天做了一个用 Nano Banana Pro 生成 PPT 的 Claude Code Skills。
但其实我一直想做的是,实现一个到现在都没有 Agent 产品实现的能力:为生成的 PPT 加上演示动画,毕竟一个炫酷的 PPT 怎么能没有演示动画呢。
经过一天吭哧瘪肚跟 Claude Code 的激烈讨论,我终于搞定了,先看演示:
增加了动效之后的 PPT 看起来直接提升了一个档次,想象一下你在给甲方讲内容或者是一些公开的分享上掏出这么一手,然后说这都是 AI 做的,谁还能不相信你是 AI 专家。
介绍一下更新后的 PPT 生成 Skills 能力:
现在生成 PPT 的时候会询问你是否要生成视频转场,如果你选择生成的话他就会帮你导出一份图片的演示和视频演示。
其中视频演示包含两个部分,首先是一个写好的网页,方便你直接播放和演示,这里我还做了设计。
- 只有在切换页面的时候才会播放转场视频,然后就会替换为静态图片,方便你讲解。
- 在首页我专门做了无限循环的视频设计,我们在一些公开场合演讲经常要等人或者提前准备,这个时候 PPT 封面会一直是动态的,吸引大家的目光。

在这个演示页面,你点击空格就会开始播放演示视频,键盘的左右键可以切换上一页和下一页。
另外的话这个 Skills 也会帮你导出一个完整的演示视频,方便装X,你分享的时候可以直接发视频。

这是一个用在 Claude Code 或者 OpenCode 这类 CLI 工具的 Skills,所以我们首先需要安装。
我已经把项目开源了,里面有 Claude Code 帮我写得非常详细的安装指南。
顺便夸一下 Claude Code 写的这个 Readme 清晰而且详细,我自己写不知道得写到啥时候。
项目地址:https://github.com/op7418/NanoBanana-PPT-Skills

这里我们只讲怎么安装为 Skills ,其他的安装方式可以去上面项目内容中查看。
在安装前我们需要简单做一些准备,准备一可灵和谷歌的 API。
首先就是谷歌的 API,主要用于使用 NanoBanana Pro 模型生成图片。
可以去 AI Studio 获取(https://aistudio.google.com/api-keys),这里你的 API 需要开启付费,免费的无法调用 Nano Banana Pro 模型。

然后是可灵的 API 这里主要用于给 PPT 生成转场动画视频,我用的国内的版本。
你可以在这里充值(https://klingai.com/cn/dev/pricing?scrollTo=video),建议先用那个 69 块钱的体验包,这个并发只有 3 ,我已经在代码里面做了处理。

然后我们就可以在这里获取到需要的可灵 API 了(https://app.klingai.com/cn/dev/api-key)。
这里创建的时候会产生两个 Key 我们都需要。

安装方式也很简单,如果你已经装了 ClaudeCode 或者 OpenCode 这类支持 Skills 的 CLI 的话,直接把下面提示词发给他们就行。
这里需要注意的是你需要将提示词中的三个 API Key 改为你自己的,刚才我们都已经获取到了。
请帮我将 NanoBanana PPT Skills 安装为 Claude Code Skill: 1. 创建 Skill 目录: mkdir -p ~/.claude/skills/ppt-generator 2. 克隆项目到 Skill 目录: git clone https://github.com/op7418/NanoBanana-PPT-Skills.git ~/.claude/skills/ppt-generator 3. 进入目录并安装依赖: cd ~/.claude/skills/ppt-generator python3 -m venv venv source venv/bin/activate pip install google-genai pillow python-dotenv 4. 配置 API 密钥: cp .env.example .env 然后编辑 .env 文件,填入我的 API 密钥: GEMINI_API_KEY=YOUR_GEMINI_API_KEY KLING_ACCESS_KEY=YOUR_KLING_ACCESS_KEY KLING_SECRET_KEY=YOUR_KLING_SECRET_KEY 5. 验证安装: python3 generate_ppt.py --help 完成后,告诉我如何在 Claude Code 中使用这个 Skill。 我的 API 密钥: - GEMINI_API_KEY: YOUR_GEMINI_API_KEY_HERE - KLING_ACCESS_KEY: YOUR_KLING_ACCESS_KEY_HERE (可选) - KLING_SECRET_KEY: YOUR_KLING_SECRET_KEY_HERE (可选)
安装的时候建议开启 Plan 模式,这样出问题的几率会小点,同时如果安装过程中,出问题就让他自己修复就好。
Plan 的开启方式是按两次 Shift+ Tab 键。

安装完成之后我们就可以使用了,首先需要将你想要生成 PPT 的文档放到一个文件夹里面去,当然你也可以没有文档先让他调用搜索工具帮你写一个。
然后在这个文件夹里面启动 Claude Code 。
这里顺便推荐我的另一个开源项目 Claude-Start(https://github.com/op7418/ai-claude-start),可以快速切换 Claude Code 的模型提供商,方便你快速更换模型,实现多个 Claude Code 窗口用不同的模型启动。

启动了 Claude Code 之后我们就可以直接跟他说了,简单来说就是“调用 Skills 将当前文件夹下的 XXX 文档生成 PPT”。
Skills 启动之后就会有一系列的选项让你选择,比如你要生成几页的 PPT、只生成图片还是要带动效视频、图片分辨率是多少,通过键盘的方向键正常选择就可以,之后就是一路回车等待就可以了,全程不需要交互。

生成之后他会自动保存所有的 PPT 图片并且给你一个用来演示 PPT 的网页,你可以通过键盘在浏览器控制 PPT 的播放。

刚开始的 Skills 创建方法在上篇内容基本上已经说过了,那部分直到生成图片的部分还不是很复杂。
简单来说就是准备好所有的上下文文件,比如图片生成的提示词、Nano Banana Pro 的 API 文档以及你的 API Key 然后在那个文件夹打开跟 Claude Code 说你想要根据这些内容创建一个 Skills ,让他创建计划然后你审批继续就行。

当时整个架构还是比较简单的,加上视频生成之后我们需要将图片和视频一起在网页上演示,同时还需要输出一个完整的视频,这时候整个架构就比较复杂了。
我直接让 Claude Code 帮我画了个架构图,我们可以看一下。

整个流程主要的步骤大概是这样的:
- 先查找到用户输入的文档和内容对文档进行分析和内规划。
- 然后调用 PPT 生成模块和风格加载器
- 基于风格加载器和图片生成模块指导生成图片生成需要的提示词。
- 调用 Nano Banana Pro 的 API 生成图片,同时监控生成过程
- 图片生成完成后调用首尾帧提示词和生成图片为每个转场生成首尾帧提示词。
- 然后调用可灵 API ,用 Kling-2.6 视频模型的 Pro 模式生成转场视频
- 将生成的视频和图片路径放到演示网页的代码中生成一个演示网页
- 同时调用本地的 ffmpeg 将图片和视频剪辑成为一个完整的演示视频
- 最后输出完整视频和打开最后的演示网页。
这里比较重要的是在首尾帧提示词生成的时候,我设计了一个元提示词,Claude Code 会根据这个提示词和生成的图片来生成具体的提示词,这种元提示词后面会很有价值。

其中相对复杂的 FFmpeg 视频合成流程和播放器系统的流程是这样的。
虽然 FFmpeg 这里只是将图片和视频处理成一整个视频,但是涉及到的内容也很多,比如图片的时间控制,图片和视频分辨率的对齐最后的拼接和压缩。
好了今天内容就是这样了,这次这个复杂的 Skills 构建我自己也学到了非常多内容,建议大家都试试构建一个自己的 Agent,你就能理解 Agent 构建的难点和逻辑到底是什么样了,也能对市面上的同类产品有一个大致的判断。
我跟 Claude Code 老师也学到了很多的东西,比如让他帮我画流程图来解释整个 Agent 逻辑、API Key 应该怎么储存、让他帮我生成一个漂亮的 Readme 页面降低入门门槛,甚至学会了如何在 GitHub 增加演示视频。
而且我这个 Skills 基本全是用 Sonnet 4.5 模型生成的,,基本没有调用 Opus 模型,大概花了 20 美元的 API 费用,我觉得已经很强了,毕竟 20 美元你得到了一个通用的 PPT 生成 Agent。
结合今天早上 Anthropic 的人说他们的 Cowork 这个功能和现在的 ClaudeCode 基本都是 Claude Code 自己写的,我感觉 AI Coding 在最近已经到了一个临界点,它们已经开始自己指挥自己和自我复制了。
可能再过一年,我们回想现在这个节点,会发现它是一个非常重要的事件。
感谢各位的阅读,如果觉得对你有帮助的话,可以帮我点个赞,也可以推荐给你需要的朋友们!
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
AI辅助海报设计101例
已累计诞生 775 位幸运星
发表评论 为下方 2 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓