Google Gemini 是 Google 推出的一款强大的 AI 模型,支持对话、文本生成等多种功能。目前 ComfyUI 已集成 Google Gemini API,你可以直接在 ComfyUI 中使用相关节点来完成对话功能。

本篇指南中,我们将引导你完成对应对话功能。

使用 API 节点需要保证你已经正常登录,并在受许可的网络环境下使用,请参考API 节点总览部分文档来了解使用 API 节点的具体使用要求。

如果在加载下面的工作流文件时,你发现存在节点缺失,可能是因为以下情况:

  1. 你使用的 ComfyUI 版本不是最新的开发(nightly)版本。
  2. 你使用的 ComfyUI 版本是稳定(release)版本或桌面版(desktop)版本(不包含最新的功能更新)。
  3. 你使用的 ComfyUI 版本是最新的 commit 版本,但在启动过程中部分节点导入失败了。

请先确保你已经成功更新 ComfyUI 到最新的开发(nightly)版本, 请查看:如何更新 ComfyUI 部分了解如何更新 ComfyUI。

Google Gemini Chat 工作流

1. 工作流文件下载

请下载下面的 Json 文件并拖入 ComfyUI 中加载对应工作流。

下载 Json 格式工作流文件

2. 按步骤完成工作流的运行

在对应模板中我们构建了一个用于分析提示词生成的角色的提示词,用于将你的图像解读成对应的绘图提示词

你可参考图片中的序号来完成最基础的文生图工作流运行:

  1. Load Image 节点中加载你需要 AI 的解读图片
  2. (可选) 如果需要你可以修改Google Gemini 中的提示词,从而让 AI 来执行特定任务
  3. 点击 Run 按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车) 来执行对话。
  4. 等待 API 返回结果后,你可在 Preview Any 节点中查看对应 AI 返回的内容。

3. 补充说明

  • 目前文件输入节点 Gemini Input Files 需要先将文件上传至ComfyUI/input/ 目录下, 此节点正在改进,我们会在更新后修改模板
  • 工作流中提供了使用 Batch Images 来输入的示例,如果你有多张图片需要 AI 解读,可参考步骤图在使用右键来将对应的节点模式设置为 总是(always) 来启用