-
Octopus V2-斯坦福推出的可在设备上运行的大模型
Octopus v2是什么? Octopus v2是由斯坦福大学研究团队最近推出的可在设备上运行的端侧AI模型,引起了开发者社区的广泛关注,一夜之间下载量超过了2000次。Octopus v2是一个拥有20亿参数的模型,能够在智能手机、汽车、个人电脑等设备上运行。它在准确性和延迟方面超越了GPT-4,且将上下文长度减少了95%。与基于RAG的Llama7B模型相比,Octopus v2的速度快了3…- 40
- 0
-
MobileAgent-阿里发布的自主多模式移动设备代理
MobileAgent是什么? MobileAgent是阿里巴巴和北京交通大学开发的可以模拟人类操作手机的自主多模态AI代理。该项目利用人工智能技术,特别是在多模态大型语言模型(如GPT-4V)的应用,以实现移动设备代理的自主决策和交互。 MobileAgent的主要特点 MobileAgent是一个纯视觉解决方案,不需要系统代码,而是通过分析图像来理解和操作手机。能够自主完成打开淘宝找帽子添加到…- 38
- 0
-
GitAgent-面壁智能联合清华大学发布的大模型智能体应用框架
GitAgent是面壁智能联合清华大学自然语言处理实验室发布的一种可以自主扩展工具箱的大模型智能体应用框架。通过 GitAgent,大模型智能体可以从 GitHub 上扩展工具集合,以应对复杂任务需求。 GitAgent 的工具箱扩充过程包括搜索、配置、应用和存储四个阶段。 在搜索阶段,GitAgent 会在 GitHub 上搜索适合用户需求的仓库,并判断仓库是否能用来解决问题。 在配置阶段,Gi…- 35
- 0
-
CogAgent-可免费商用的带 Agent 能力的视觉模型
CogAgent是什么? CogAgent是一个由清华大学智谱AI开发的基于CogVLM改进的新型视觉语言模型(VLM)。该模型专门设计用于理解和导航图形用户界面(GUI)。它采用了低分辨率和高分辨率图像编码器的双编码器系统,能够处理和理解复杂的GUI元素和文本内容。 CogAgent-18B拥有110亿的视觉参数和70亿的语言参数, 支持1120*1120分辨率的图像理解。在CogVL…- 54
- 0
AI代理
云图NFT持续分享全球最新优质Al内容,每天更新,欢迎收藏
标签
AI代理-共 0 个作品
今日上传
0个作品