

前阵子接了一个线下培训项目,两天一夜。准备课件的时候我意识到一个问题:PPT的量太大了。两天的内容加起来上百页,每页都要有设计感。手工做的话,光PPT就得花好几天。

所以我给Claude Code写了一个专门做PPT的Skill。
这个培训PPT我肯定没法完整分享出来,给大家展示个测试场景吧。很多人做PPT都是为了辅助演讲或培训,所以我选了一个典型的知识讲解场景:给大学生讲清楚期货和期权。先让Claude Code写了一份两三千字的演讲稿,然后打了一句话:「帮我根据演讲稿做一个辅助的PPT」。
然后就去倒了杯咖啡。回来的时候,13页PPT已经生成好了,而且是两个版本——一个是可以在Keynote里继续编辑文字的Neo-Brutalism风格,另一个是用我个人形象生成的学习漫画风格,每一页都是完整的AI插画。


Skill这个概念我写过好几次了——去年10月Skills刚发布的时候写过一篇,今年1月skills.sh商店上线又写了一篇。简单说,Skill就是一个SOP能力包——你把做某件事的完整流程、参考知识、执行脚本打包在一起,AI以后每次做这件事都按同一套标准来。
今天这篇,我把这个PPT Skill的设计思路完整拆给你看。一是你可以直接拿去用,二是你看完之后,应该能自己设计类似的东西。
先说结果。
这个Skill支持两条制作路径。第一条是HTML转PPT,AI用代码生成每一页幻灯片,最后组装成.pptx文件。生成的PPT里所有文字都可以在Keynote或PowerPoint里直接编辑,中文渲染也是完美的。适合商务汇报、需要反复修改的场景。
第二条是全AI视觉,每一页都用Nano Banana Pro(Gemini的图片生成能力)直接生成一张完整的插画。视觉效果好很多,但文字不能后期编辑,中文偶尔会有小错误。适合演讲、发布会这种不需要改文字的场景。
Path A HTML可编辑版的PPT

Path B AI漫画版的PPT

两条路径可以同时跑。我那次就是让它并行生成的,HTML版和AI版各13页,总共不到20分钟。
然后是风格。现在内置了17种设计风格,从Snoopy漫画、浮世绘、敦煌壁画这种艺术感强的,到纽约时报杂志风、麦肯锡风这种商务感强的,都有。AI会根据你的主题自动推荐三个最合适的,你选一个就行。

还有一个我觉得挺有意思的功能:个人形象融入。你可以把自己的照片传给它,它会根据选定的风格生成一套角色设定图。之后每次做PPT,里面的人物都是你自己的形象。这样做出来的东西跟别人用同一个工具生成的完全不一样,有辨识度。

其实这个Skill的文件结构,跟上次那个数据分析Skill是一样的思路,就四样东西:
SKILL.md——核心指令文件,大概200行。定义了整个工作流:从确认协作模式、梳理内容、选择风格、到构建页面、组装PPTX,一共五步。每一步该做什么、有什么检查点、用户需要确认什么,都写清楚了。
references/——知识库,有5个参考文件。17种风格的完整参数(配色、排版、构图规范、提示词模板)都在这里。还有设计运动到风格的映射关系——比如用户说「我想要那种复古的感觉」,AI能知道这对应的是苏联构成主义或者复古广告风。
scripts/——执行脚本,3个。一个是generate_image.py,调用Gemini API生成图片;一个是html2pptx.js,把HTML页面转成可编辑的PPTX;还有一个create_slides.py,把图片拼成全屏PPTX。
assets/——视觉资产。17种风格各有一张样例图,既用来给用户看效果,也用来给AI做风格参照(垫图)。还有一个character文件夹,放你的个人形象。

这四样东西的分工其实很清晰:SKILL.md管流程,references管知识,scripts管执行,assets管素材。缺哪个都不完整。
如果只有SKILL.md没有references,AI做设计决策的时候就没有依据,「好看」全凭它自己理解。如果只有references没有scripts,AI知道该怎么做,但做不了——它会告诉你「你应该用什么工具去生成」,而不是直接帮你生成。
这也是Skill跟普通Prompt最大的区别。Prompt是一段对话,Skill是一个工作系统。
说几个我做这个Skill时遇到的问题,可能对你有参考价值。
第一个,HTML转PPT比想象中难。我一开始以为写个HTML页面,截图塞进PPT就行了。但这样做出来的PPT里全是图片,文字不能编辑。要做到真正可编辑,需要把HTML里的每个元素解析出来,转成PPTX里的文本框和形状。
这个转换有一堆限制:所有文字必须用p或h1-h6标签包裹,不能裸放在div里;p标签不能有背景色和边框(这些只能放在div上);不支持CSS渐变;不支持table元素。
我写了一个html2pptx.js脚本专门处理这件事,前后调了很多轮才把这些约束都踩明白。现在这些约束都写在了references/prompt-templates.md里,AI生成HTML的时候会自动遵守。
第二个,AI生成图片时风格一致性是个大问题。如果你每次都从文字prompt开始生成,即使描述得再详细,13页PPT出来风格也会飘。解决办法是用垫图——每次生成图片的时候,把风格样例图作为参考图传进去。这样AI会强制保持跟参考图一致的视觉风格。
同样的道理也用在个人形象上。我先生成一张角色设定图(三个表情的设定稿),之后每一页生成的时候都把这张设定图传进去,人物特征就不会跑。
第三个,关于风格推荐。我一开始做了5种风格,觉得够用了。后来发现,「专业极简」这种暗色底大留白的风格,AI生成出来效果很差——因为画面里缺乏视觉元素,AI不知道该画什么。反而是漫画、插画类的风格效果好很多,因为有明确的视觉语言。
所以现在17种风格里,排在前面的基本都是插画类的。商务极简类的我推荐走HTML路径,用代码精确控制排版,不依赖AI生成图片。
其实回头看,做一个Skill的思路挺简单的:
找到一个你反复在做的事情。每周都要做、流程相对固定、有明确产出的那种。做PPT、写周报、分析数据、做代码审查,都算。
然后把你做这件事的流程写出来。不是写给人看的流程文档,是写给AI看的执行指令。每一步该做什么,做完了交给用户确认还是直接往下走,都要明确。
接下来整理你的知识。你做这件事的时候,脑子里有哪些「隐性知识」?比如我做PPT的时候知道哪些风格适合什么场景,知道漫画风比极简风AI生成效果更好——这些东西,你不写出来AI永远不知道。放进references里,AI就能复用。
最后看看有没有可以脚本化的动作。把HTML转PPT、调用API生成图片、上传图片到图床——这些确定性的操作,写成脚本放在scripts里,AI就能直接执行,而不是告诉你「你应该怎么做」。
我觉得这个思路其实跟管理团队差不多。你不会每次都口头跟新人讲一遍流程、讲一遍标准、讲一遍工具在哪里。你会写SOP、整理知识库、准备好工具。Skill就是你给AI准备的这套东西。
这个PPT Skill我打包好了。
https://my.feishu.cn/wiki/Odn6w73bEiZRZykPargcOSANnDc?from=from_copylink
拿到之后,把整个文件夹丢到你的Cursor或Claude Code项目的.claude/skills/目录下就能用了。

有一个注意事项:如果你要用AI生成路径(就是那个Nano Banana Pro漫画风格),需要自己去Google AI Studio申请一个Gemini API Key。生成图片会消耗API额度。如果没有API Key,直接用HTML路径也完全可以,效果也不差。
说起来,我去年10月写过一篇文章,当时说的是:以前你得懂Prompt Engineering,现在你只需要懂你的业务。
几个月过去,我觉得这个判断依然成立。而且门槛还在继续降——skills.sh上已经有不少人在用别人打包好的Skill了,你甚至不需要自己写,直接装上就能用。
但如果你愿意花点时间自己设计,做出来的东西一定更贴合你的需求。毕竟没有人比你更了解你自己的工作流程。
欢迎关注作者微信公众号:「花叔」

复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。




发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
DeepSeek实用操作手册
已累计诞生 779 位幸运星
发表评论 为下方 1 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓