当前位置:首页AI 开源项目ComfyUI-Gemini:Gemini 1.5 Pro在ComfyUI中的全面集成

ComfyUI-Gemini:Gemini 1.5 Pro在ComfyUI中的全面集成

Gemini 1.5 Pro 已成功集成到 ComfyUI 中,这意味着用户现在不仅可以使用该模型生成提示词、描述图像,还能享受与其深入交流的乐趣。自2024年5月2日起,Gemini API 将开始收费,用户需在官方网站申请API密钥以继续使用服务。

home_open_ComfyUI_Gemini_1

主要功能

  1. 高级对话管理:支持系统指令设置,允许用户精细控制对话流程,实现更加智能的交互体验。
  2. 多模态交互能力:集成文本、图像以及文件读取功能,支持多种媒体类型的输入,包括视频和音频,上限为20GB。
  3. 扩展的输入限制:支持的输入token数量达到1048576,为用户提供了极大的灵活性。
  4. 严格的速率限制:每分钟最多两次请求,每日最多1000次,确保服务的稳定与高效。

新增功能

home_open_ComfyUI_Gemini_2

  • 文件上传支持:现支持单个文件上传,包括图片、文本文件、PDF和音频文件,未来将扩展到多文件上传。
  • 全面的训练和测试流程:提供了从预处理到自动打标,再到训练和测试的一条龙服务,特别适用于LoRa设备的数据处理。

使用方式

用户需要首先在 Gemini API 官网 申请自己的 API 密钥。Gemini 1.5 Pro的使用分为隐式和显式两种API Key方式,推荐使用隐式API Key以增强安全性。用户也可以选择显式输入API Key,但需要注意不要将包含密钥的工作流共享。

安装指南

推荐通过 ComfyUI Manager 进行安装,也可以手动安装。手动安装步骤如下:

  1. 克隆存储库到本地。
  2. 进入项目目录,安装必要的依赖。
  3. 重启 ComfyUI 以应用安装。
温馨提示:

文章标题:ComfyUI-Gemini:Gemini 1.5 Pro在ComfyUI中的全面集成

文章链接:https://yuntunft.cn/38376.html

更新时间:2024年07月05日

给TA打赏
共{{data.count}}人
人已打赏
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索