Devin-首个全自主AI软件工程师智能体

AI视频
24年9月27日
编辑

admin

Devin是什么？

Devin 是由AI初创公司 Cognition 开发的全球首个全自主 AI 软件工程师，具备自主学习新技术、端到端构建和部署应用、自主查找和修复代码 Bug、训练和微调 AI 模型的能力。在 SWE-bench 基准测试中，Devin 展现出超越其他 AI 模型的性能，正确解决了实际编程问题。

官方介绍视频：

Devin的主要功能

Devin具备以下能力：

长期推理与规划：能够规划和执行需要数千个决策的复杂工程任务，记住每一步的相关上下文，随时间学习，并修复错误。
使用开发者工具：配备了包括 shell、代码编辑器和浏览器在内的常见开发者工具，在一个沙盒化计算环境中工作。
主动协作：能够实时报告进度，接受反馈，并根据需要与用户共同进行设计选择。
学习新技术：通过阅读博客文章等资料，学习如何使用不熟悉的技术。
端到端应用构建和部署：能够从头开始构建并部署应用程序，如模拟生命游戏的交互式网站，并将其部署到 Netlify。
自主查找和修复代码库中的 Bug：帮助维护和调试开源竞赛编程书籍。
训练和微调 AI 模型：设置大型语言模型的微调，只需提供一个 GitHub 研究仓库的链接。
处理开源仓库的问题：只需提供一个 GitHub 问题的链接，Devin 就能完成所有设置和上下文收集工作。
对成熟生产仓库做出贡献：作为 SWE-bench 基准测试的一部分，Devin 解决了 sympy Python 代数系统中的对数计算错误。
执行实际工作：在 Upwork 上完成实际的编程工作，编写和调试运行计算机视觉模型的代码，并在最后编译报告。

Devin的评测结果

Devin 在 SWE-bench 基准测试中的表现非常出色，这是一个挑战性的基准测试，要求参与者解决开源项目（如 Django 和 scikit-learn）中的实际 GitHub 问题。Devin 正确解决了 13.86% 的问题，这一比例远远超过了之前的技术水平，后者只能解决 1.96% 的问题。即使在只给定要编辑的确切文件的情况下，以往的最佳模型也只能解决 4.80% 的问题。Devin 在评估时是独立完成的，而其他模型则得到了辅助（即模型被告知需要编辑哪些文件）。这一结果显示了 Devin 在理解和解决实际编程问题方面的巨大优势。

如何使用Devin？

目前Devin还在内测中，感兴趣的用户可以访问Cognition的官网了解更多信息，并填写内测申请表以抢先体验。

申请通过后，即可在Devin官网体验：https://preview.devin.ai/

热门AI工具推荐：

用不了ChatGPT？推荐国产ChatGPT，点此免费使用
想免费AI绘画？推荐吐司AI绘画，立即免费使用
️ 想让AI帮你写论文？推荐笔灵论文写作，点击立即使用

温馨提示：

文章标题：Devin-首个全自主AI软件工程师智能体

文章链接：https://yuntunft.cn/9967.html

更新时间：2024年09月27日

给TA打赏

共{{data.count}}人

人已打赏

Devin是什么？ Devin 是由AI初创公司 Cognition 开发的全球首个全自主 AI 软件工程师，具备自主学习新技术、端到端构建和部署应用、自主查找和修复代码 Bug、训练和微调 AI 模型的能力。在 SWE-bench 基准测试中，Devin 展现出超越其他 AI 模型的性能，正确解决了实际编程问题。官方介绍视频： Devin的主要功能 Devin具备以下能力：长期推理与规划：能够规划和执行需要数千个决策的复杂工程任务，记住每一步的相关上下文，随时间学习，并修复错误。使用开发者工具：配备了包括 shell、代码编辑器和浏览器在内的常见开发者工具，在一个沙盒化计算环境中工作。主动协作：能够实时报告进度，接受反馈，并根据需要与用户共同进行设计选择。学习新技术：通过阅读博客文章等资料，学习如何使用不熟悉的技术。端到端应用构建和部署：能够从头开始构建并部署应用程序，如模拟生命游戏的交互式网站，并将其部署到 Netlify。自主查找和修复代码库中的 Bug：帮助维护和调试开源竞赛编程书籍。训练和微调 AI 模型：设置大型语言模型的微调，只需提供一个 GitHub 研究仓库的链接。处理开源仓库的问题：只需提供一个 GitHub 问题的链接，Devin 就能完成所有设置和上下文收集工作。对成熟生产仓库做出贡献：作为 SWE-bench 基准测试的一部分，Devin 解决了 sympy Python 代数系统中的对数计算错误。执行实际工作：在 Upwork 上完成实际的编程工作，编写和调试运行计算机视觉模型的代码，并在最后编译报告。 Devin的评测结果 Devin 在 SWE-bench 基准测试中的表现非常出色，这是一个挑战性的基准测试，要求参与者解决开源项目（如 Django 和 scikit-learn）中的实际 GitHub 问题。Devin 正确解决了 13.86% 的问题，这一比例远远超过了之前的技术水平，后者只能解决 1.96% 的问题。即使在只给定要编辑的确切文件的情况下，以往的最佳模型也只能解决 4.80% 的问题。Devin 在评估时是独立完成的，而其他模型则得到了辅助（即模型被告知需要编辑哪些文件）。这一结果显示了 Devin 在理解和解决实际编程问题方面的巨大优势。如何使用Devin？目前Devin还在内测中，感兴趣的用户可以访问Cognition的官网了解更多信息，并填写内测申请表以抢先体验。申请通过后，即可在Devin官网体验：https://preview.devin.ai/ 热门AI工具推荐：用不了ChatGPT？推荐国产ChatGPT，点此免费使用想免费AI绘画？推荐吐司AI绘画，立即免费使用 ️ 想让AI帮你写论文？推荐笔灵论文写作，点击立即使用

24年7月1日018

昆仑万维发布了一款名为「天工 SkyAgents」的 AI Agent 开发平台，旨在帮助用户零代码打造自己的 AI 智能体。 SkyAgents是什么？ SkyAgents是一个先进的AI Agents构建平台，它允许用户通过自然语言输入和可视化拖拽来快速构建服务于具体业务场景的AI Agents。这个平台深度集成了Skywork大语言模型，使得Agents能够感知用户意图并采取行动，做出更智能的决策，提高任务执行的准确性和效率。SkyAgents支持多Agents协作，适应不同的业务需求和场景，实现信息的聚合和流转。此外，SkyAgents提供高度自定义的编排工具，使得开发者无需编码即可灵活组装和配置AI Agents的行为。体验网址：https://agentspro.cn/#/ 天工 SkyAgents首页 SkyAgents可以做什么？该平台基于昆仑万维的「天工大模型」，具备自主学习和独立思考能力，用户可以通过自然语言构建自己的私人助理，并将不同任务模块化，实现问题预设、指定回复、知识库创建与检索、意图识别、文本提取等任务。使用「天工 SkyAgents」平台，用户无需代码编程，即可在几分钟之内部署属于自己的 AI Agents，完成各种私人定制需求。天工 SkyAgents-定制AI智能体对于企业用户而言，「天工 SkyAgents」可以用于构建个性化的应用，如企业 IT、智能客服、企业培训、HR、法律顾问等，并支持一键服务部署，确保在不同业务系统中的无缝接入。该平台通过模块化的大语言模型构件和图形界面，实现了完全无代码化操作，用户可以通过自然语言和简单操作进行任务设定和部署。此外，「天工 SkyAgents」具备数据检索增强能力，能够支持导入更多格式和更大规模的数据和知识，帮助大模型更好地应对实际需求。主要功能有：深度集成AI能力：提供智能决策支持，提高任务执行的准确性和效率。多Agents协作：支持根据业务需求实现多个AI Agents的协同作业。高度自定义编排：用户可以像搭积木一样灵活组装和配置AI Agents，无需编码。强大的AI模型：基于天工Skywork大语言模型，性能优越。灵活开放的Agents：支持接入协同办公平台，具有自带API能力。丰富的AI模块：提供多种AI能力模块组件，适配更多业务场景。便捷的工具组件：预置多类工具组件，增强扩展能力。对话式交互：通过对话方式与AI Agents交互，轻松使用。企业专属知识库：统一管理企业知识库，一键赋予AI业务知识。 SkyAgents适用人群 SkyAgents适用于需要快速构建和部署AI Agents以服务于特定业务场景的开发者和企业。它特别适合那些寻求提高工作效率、优化业务流程和增强决策智能的企业和团队。对于希望通过AI技术实现业务创新和自动化的用户，SkyAgents提供了一个强大且灵活的解决方案。

24年7月1日023

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部