超详细实战案例复盘！ComfyUI 自定义节点开发全流程

AI 写代码不难，难的是少返工。这个「智能图像转场效果插件」插件案例，拆解了从需求、PRD 到四级测试的完整闭环。

一、全文速览图

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

深度教程！ComfyUI 局部重绘的3种工作流搭建方法和原理讲解

大家好，我是三石。

阅读文章 >

二、开发方法论总览

整个开发流程遵循一个核心循环：

需求探索 → 技术调研 → PRD文档 → 架构设计 → 编码 → 自我测试 → 本地测试 → 发现新需求 → 新PRD → 循环

核心原则：

不急着写代码 —— 先聊清楚再动手。写代码是最后一步，不是第一步。
文档先行 —— 每次动手前先把设计文档写好，PRD 是项目的"真北"。
写→测→改 —— 每写一个模块就测一次，发现问题立刻修，不要攒到最后一起测。
迭代而非瀑布 —— 一个版本做一个范围，不贪多。先跑通核心流程，再逐步补充。

为什么这么做？因为代码可以重写，但方向错了就是浪费时间。花 30% 的时间想清楚，能省 70% 的返工时间。

三、Phase 1：需求探索与思路整理

1. 目标

把"我想做一个 XX"这句模糊的话，变成一张清晰的需求清单。

2. 怎么做

不要自己闭门造车。通过结构化提问来逼迫自己想清楚：

必须回答的 6 个问题

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

实战：智能转场插件的需求探索

我们的项目起点是："想做一套 ComfyUI 的图像转场效果节点"。

通过讨论，逐步明确：

要做的：

淡入淡出转场（Fade）—— 最基础，透明度过渡
滑动转场（Slide）—— 四个方向推入推出
缩放转场（Zoom）—— 放大/缩小切换
共享缓动曲线引擎 —— 支持 ease-in、ease-out、spring 等
帧序列输入输出 —— 兼容 ComfyUI 视频工作流

不做的：

3D 透视翻转（PIL 无法实现真 3D）
音频驱动的节拍转场（另一个项目范畴）
预设管理系统（第一版不需要）

3. 引入外部参考

查阅了 Animate.css 的 80+ 动画效果库，发现所有转场动画本质上是 4 个属性随时间变化：

位移 (translateX/Y) → 画面从哪里来、到哪里去
缩放 (scale) → 画面的放大缩小
旋转 (rotate) → 画面的旋转角度
透明度 (opacity) → 画面的淡入淡出

这个发现直接影响了引擎架构——我们只需要一个通用的关键帧插值系统，不需要每个效果单独写动画逻辑。

4. 本阶段产出物

效果清单（3 个转场 + 缓动引擎）
每个效果的核心参数定义
明确的"做什么 / 不做什么"边界

四、Phase 2：技术调研与方案设计

1. 目标

确定"怎么实现"，做关键的技术选型。

2. 需要决策的核心问题

决策 1：渲染方式

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

转场效果的核心是图像混合和几何变换，计算量不大。选 CPU 渲染 ——稳定优先，不给用户制造显存问题。

决策 2：节点粒度

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

选方案 3（配置 + 渲染分离） ——配置节点零开销，渲染只遍历一遍帧序列，性能最优。

决策 3：内存管理

处理视频意味着大量帧数据（1080p × 30fps × 5s = 150 帧 ≈ 900MB）。

策略：

逐帧处理，不一次性加载所有帧到内存
中间结果及时释放 ——每帧渲染完立即释放 PIL 中间对象
缓存复用 ——同一参数的变换矩阵只计算一次

3. 本阶段产出物

技术方案选型及理由
性能风险评估和对策
核心数据流设计

五、Phase 3：PRD 文档编写

1. 目标

把前面所有的讨论落到纸面上，形成唯一权威的需求文档。

2. 为什么一定要写 PRD

项目长了，我怎么知道每次改了什么地方？没有文档就没法做版本管理。

PRD 不是形式主义，它解决三个问题：

开发时 ——对着文档写代码，不会做着做着忘了初衷
测试时 ——对着文档验收，每个功能点逐一检查
迭代时 ——新版本的 PRD 和旧版对比，清楚看到改了什么

3. PRD 文档结构模板

# [项目名] - 需求总结

## 版本：v1.0
## 日期：2026-XX-XX
## 模块：[模块名]

---

## 一、背景与痛点
- 现状分析（用户现在怎么做这件事）
- 核心痛点（现有方案有什么问题）
- 目标定义（我们要达到什么效果）

## 二、功能范围
- 做什么（本版本的功能列表）
- 不做什么（明确排除项）

## 三、技术架构
- 设计原则
- 目录结构
- 数据流图
- 输入输出规范（ComfyUI tensor 格式）
- 性能优化策略

## 四、功能详细规格
- 每个节点/效果的参数表
- 算法描述（数学公式、缓动曲线）
- 边界情况处理

## 五、共享模块规格
- 各引擎模块的 API 定义
- 函数签名和参数说明

## 六、关键决策记录
- 每个重要选择的"选了什么 + 为什么"

## 七、开发计划
- 阶段划分
- 依赖关系
- 哪些可以并行

4. 文档管理规范

项目文件夹/设计/
├── v1.0-[模块名]/
│ └── 需求总结.md ← 首版 PRD
├── v1.1-[模块名]/
│ └── 需求总结.md ← 迭代 PRD（不覆盖旧版）
└── v1.2-.../

铁律：每个版本的 PRD 独立归档，永远不覆盖旧版本。这样可以随时回溯"当时为什么这么设计"。

六、Phase 4：架构设计与项目搭建

1. 目标

把 PRD 变成代码骨架。先搭架子，再填内容。

2. ComfyUI 插件的标准目录结构

ComfyUI/custom_nodes/My-Plugin-Name/
├── __init__.py # 插件入口，注册所有节点
├── pyproject.toml # 项目元数据和依赖声明
├── core/ # 引擎层：共享的底层逻辑
│ ├── __init__.py
│ ├── module_a.py # 例如：缓动曲线库
│ ├── module_b.py # 例如：图像混合引擎
│ └── utils.py # 工具函数
└── nodes/ # 节点层：每个 ComfyUI 节点一个文件
├── __init__.py
├── node_type_1.py
├── node_type_2.py
└── node_type_3.py

为什么分 core/ 和 nodes/ 两层？

core/ 只关心算法逻辑，不知道 ComfyUI 的存在。可以独立测试。
nodes/ 只关心 ComfyUI 的接口规范，调用 core/ 的函数来干活。
好处：改引擎不影响节点定义，改节点参数不影响引擎。

3. ComfyUI 节点的基本写法

一个最小的自定义节点：

class TransitionFade:
"""淡入淡出转场"""

@classmethod
def INPUT_TYPES(cls):
return {
"required": {
"image_a": ("IMAGE",), # 前一个画面
"image_b": ("IMAGE",), # 后一个画面
"transition_frames": ("INT", { # 过渡帧数
"default": 15,
"min": 2,
"max": 120,
"step": 1,
}),
"easing": (["linear", "ease_in", "ease_out", "ease_in_out"],),
},
"optional": {
"custom_curve": ("STRING", {"default": ""}),
}
}

RETURN_TYPES = ("IMAGE",)
RETURN_NAMES = ("transition_frames",)
FUNCTION = "render"
CATEGORY = "Transition Effects"

def render(self, image_a, image_b, transition_frames, easing, custom_curve=""):
# 1. 将 tensor 转为 PIL
# 2. 逐帧计算混合比例（基于缓动曲线）
# 3. 逐帧混合两张图片
# 4. 转回 tensor 返回
return (result_tensor,)

注册到 __init__.py：

from .nodes.transition_fade import TransitionFade
from .nodes.transition_slide import TransitionSlide
from .nodes.transition_zoom import TransitionZoom

NODE_CLASS_MAPPINGS = {
"TransitionFade": TransitionFade,
"TransitionSlide": TransitionSlide,
"TransitionZoom": TransitionZoom,
}

NODE_DISPLAY_NAME_MAPPINGS = {
"TransitionFade": "Fade Transition (淡入淡出)",
"TransitionSlide": "Slide Transition (滑动转场)",
"TransitionZoom": "Zoom Transition (缩放转场)",
}

__all__ = ["NODE_CLASS_MAPPINGS", "NODE_DISPLAY_NAME_MAPPINGS"]

4. 搭建顺序

先引擎后节点 ——先完成 core/，测通了再写 nodes/。

Step 1: core/easing.py ← 缓动曲线（纯数学，零依赖）
Step 2: core/utils.py ← tensor↔PIL 转换（基础设施）
Step 3: core/blender.py ← 图像混合引擎（依赖 utils）
Step 4: nodes/xxx.py ← 各节点（依赖 core 完成）
Step 5: __init__.py ← 注册（最后一步）

七、Phase 5：编码开发

1. 目标

按 PRD 和架构写代码。注意：写代码是执行，不是设计。到这一步应该已经很清楚写什么了。

2. 开发策略

策略 1：引擎层逐模块完成

每个 core/ 模块写完后立即自测（见 Phase 6），确认无误再写下一个。不要一口气全写完再测。

策略 2：节点层可以并行

如果使用 AI 辅助开发，多个节点文件可以分配给不同的 Agent 并行编写——前提是引擎层已经完成且测试通过。

[core/ 完成并测试通过]
↓
并行开发多个节点
├── Agent 1 → transition_fade.py
├── Agent 2 → transition_slide.py
└── Agent 3 → transition_zoom.py

策略 3：每个节点文件完整自包含

一个节点文件包含：

类定义（INPUT_TYPES、RETURN_TYPES、FUNCTION、CATEGORY）
核心渲染方法
从 core/ 导入需要的函数

不要在节点之间产生依赖。节点 A 不应该 import 节点 B。

3. 编码规范（ComfyUI 特定）

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

八、Phase 6：自我测试（写→测→改→再测→再改）

1. 核心理念

这是最容易被跳过、也是最不能跳过的环节。

不要等全部写完再测。每写一个模块就测一次。发现问题立刻修，别带着 bug 往下走。

2. 四级测试体系

Level 1: 能不能 import（语法和依赖）
↓ 通过
Level 2: 函数输出对不对（逻辑正确性）
↓ 通过
Level 3: ComfyUI 认不认识这个节点（注册验证）
↓ 通过
Level 4: 节点之间数据能不能流通（集成验证）

Level 1：模块导入测试

每写完一个文件，第一件事就是试试能不能 import：

python3 -c "
from core.easing import ease_in, ease_out, spring_overshoot
print('easing.py OK')
"

如果报错，立刻修。常见问题：

拼写错误
循环导入
缺少依赖包

Level 2：单元功能测试

测试关键函数的输入输出是否符合预期：

python3 -c "
from core.easing import ease_out

# 边界值测试
assert ease_out(0.0) == 0.0, 't=0 应该返回 0'
assert ease_out(1.0) == 1.0, 't=1 应该返回 1'

# 单调性测试：ease_out 应该是递增的
v1 = ease_out(0.3)
v2 = ease_out(0.7)
assert v2 > v1, 'ease_out 应该单调递增'

# 缓出特性：前半段变化应该快于后半段
mid = ease_out(0.5)
assert mid > 0.5, 'ease_out(0.5) 应该 > 0.5（前快后慢）'

print(f'ease_out(0.5) = {mid:.4f} ✓')
print('所有断言通过')
"

python3 -c "
from core.blender import blend_crossfade
from PIL import Image
import numpy as np

# 创建两张测试图片
img_a = Image.new('RGB', (100, 100), (255, 0, 0)) # 纯红
img_b = Image.new('RGB', (100, 100), (0, 0, 255)) # 纯蓝

# t=0 应该是纯 A
result = blend_crossfade(img_a, img_b, t=0.0)
pixel = result.getpixel((50, 50))
assert pixel == (255, 0, 0), f't=0 应该是纯红，实际是 {pixel}'

# t=1 应该是纯 B
result = blend_crossfade(img_a, img_b, t=1.0)
pixel = result.getpixel((50, 50))
assert pixel == (0, 0, 255), f't=1 应该是纯蓝，实际是 {pixel}'

# t=0.5 应该是混合色
result = blend_crossfade(img_a, img_b, t=0.5)
pixel = result.getpixel((50, 50))
assert 100 < pixel[0] < 150, f'红色通道应该在中间值，实际是 {pixel[0]}'

print('blend_crossfade 测试通过 ✓')
"

Level 3：节点注册测试

模拟 ComfyUI 的加载方式，验证节点能被正确识别：

python3 -c "
import sys, os, importlib.util

# 模拟 ComfyUI 的包加载方式
plugin_dir = '/path/to/custom_nodes/My-Plugin'
spec = importlib.util.spec_from_file_location(
'My-Plugin',
os.path.join(plugin_dir, '__init__.py'),
submodule_search_locations=[plugin_dir]
)
mod = importlib.util.module_from_spec(spec)
mod.__path__ = [plugin_dir]
mod.__package__ = 'My-Plugin'
sys.modules['My-Plugin'] = mod

# ... 注册子包和子模块（略）...

spec.loader.exec_module(mod)

# 验证所有节点
mappings = mod.NODE_CLASS_MAPPINGS
print(f'注册了 {len(mappings)} 个节点：')
for name, cls in mappings.items():
# 检查 ComfyUI 要求的 4 个必要属性
assert hasattr(cls, 'INPUT_TYPES'), f'{name} 缺少 INPUT_TYPES'
assert hasattr(cls, 'RETURN_TYPES'), f'{name} 缺少 RETURN_TYPES'
assert hasattr(cls, 'FUNCTION'), f'{name} 缺少 FUNCTION'
assert hasattr(cls, 'CATEGORY'), f'{name} 缺少 CATEGORY'
print(f' ✓ {name} ({cls.CATEGORY})')

print('所有节点注册验证通过')
"

Level 4：集成测试

测试自定义数据类型能否在节点之间正确传递：

python3 -c "
# 模拟数据从 ConfigNode 传递到 RenderNode
config = make_transition_config(
effect='fade',
easing='ease_out',
duration_frames=15,
)
print(f'Config 创建成功: {config}')

# 模拟 RenderNode 接收 config
entries = resolve_config(config)
print(f'Config 解析成功: {len(entries)} 个关键帧')

# 模拟向后兼容（不传 config，直接传参数）
entries = resolve_config(config=None, effect='fade', duration=15)
print(f'向后兼容模式: {len(entries)} 个关键帧')

print('集成测试通过 ✓')
"

3. 常见问题速查表

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

5. 测试循环流程

写完一个模块
↓
运行 Level 1 测试 → 失败 → 修 import/语法 → 重测
↓ 通过
运行 Level 2 测试 → 失败 → 修逻辑 → 重测
↓ 通过
继续写下一个模块
↓
全部模块写完
↓
运行 Level 3 测试 → 失败 → 修注册 → 重测
↓ 通过
运行 Level 4 测试 → 失败 → 修接口 → 重测
↓ 通过
进入 Phase 7（本地测试）

九、Phase 7：本地集成测试

1. 目标

在真实的 ComfyUI 环境中跑通完整工作流。

2. 测试步骤

Step 1：准备环境

确保插件目录在 ComfyUI/custom_nodes/ 下
如果有字体依赖，放好字体文件
重启 ComfyUI（让它重新扫描 custom_nodes）

Step 2：查找节点

打开 ComfyUI → 右键画布 → 搜索你的节点类别名（如 "Transition Effects"）。

如果找不到节点：看 ComfyUI 的终端输出，通常会打印加载失败的原因。

Step 3：搭建最小测试工作流

[Load Image A] ──→ image_a ──→ [TransitionFade] ──→ [Preview Image]
[Load Image B] ──→ image_b ──↗ ↑
transition_frames = 15
easing = "ease_out"

先用最简单的参数跑通，确认基本功能正确。

Step 4：逐个效果测试

不要一次测所有节点。一个一个来：

TransitionFade —— 看淡入淡出是否平滑
TransitionSlide —— 看四个方向是否正确
TransitionZoom —— 看缩放中心是否正确

Step 5：边界情况测试

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

Step 6：记录问题

发现的问题不一定要立即全部修复。记录下来，分类：

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

十、Phase 8：迭代循环（v1.0 → v1.1）

1. 目标

根据测试反馈和新发现的需求，启动新一轮开发循环。

2. 触发迭代的典型场景

用户反馈 ——"能不能支持自定义缓动曲线？"
对接需求 ——发现插件需要与其他节点对接，需要新的数据类型
参考学习 ——分析了别人的插件工作流，发现自己缺了关键能力
技术债 ——v1.0 为了赶进度留下的临时方案需要替换

3. 实战案例：v1.0 → v1.1 迭代

v1.0 完成并测试后，分析了一个同类参考工作流，发现了关键缺失：

v1.0 的不足
v1.1 的改进
每个节点独立接受参数
新增 TransitionConfig 节点，配置统一管理
自定义数据类型缺失
新增 TRANSITION_DATA 类型在节点间传递
无法对接上游节点
新增格式兼容层
参数类型不统一
统一为 FLOAT

4. 迭代的规范流程

[发现新需求]
↓
讨论方案（可能要多轮）
- "这个功能要不要做？" → 可能砍掉
- "谁来做这件事？" → 可能交给上游节点
- "怎么实现最简洁？" → 最小改动原则
↓
编写 v1.1 PRD（独立归档，不覆盖 v1.0）
↓
编码 + 自我测试
↓
本地测试
↓
[准备 v1.2...]

5. 迭代中的关键纪律

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

十一、完整开发流程图

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

十二、附录：项目最终成果

1. 版本演进

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

2. 技术栈

超详细实战案例复盘！ComfyUI 自定义节点开发全流程

3. 代码结构

Plugin/
├── __init__.py # 入口：注册所有节点
├── pyproject.toml # 元数据和依赖
├── core/ # 引擎层（不依赖 ComfyUI）
│ ├── easing.py # 缓动曲线
│ ├── blender.py # 图像混合
│ └── utils.py # 工具函数
└── nodes/ # 节点层（ComfyUI 接口）
├── node_a.py
├── node_b.py
└── node_c.py