-
CogAgent-可免费商用的带 Agent 能力的视觉模型
CogAgent是什么? CogAgent是一个由清华大学智谱AI开发的基于CogVLM改进的新型视觉语言模型(VLM)。该模型专门设计用于理解和导航图形用户界面(GUI)。它采用了低分辨率和高分辨率图像编码器的双编码器系统,能够处理和理解复杂的GUI元素和文本内容。 CogAgent-18B拥有110亿的视觉参数和70亿的语言参数, 支持1120*1120分辨率的图像理解。在CogVL…- 54
- 0
CogAgent
云图NFT持续分享全球最新优质Al内容,每天更新,欢迎收藏
标签
CogAgent-共 0 个作品
今日上传
0个作品