作者:Shlok Khemani、Oliver Jaros 来源:Decentralised.co 翻译:善欧巴,金色财经
过去一年,Decentralised.co 深入研究了加密和人工智能的交叉领域。我们甚至构建了一个被超过 70,000 人使用的产品,用于跟踪人工智能代理和代理基础设施。尽管最近几周围绕该领域的狂热已经消退,但人工智能对技术和社会的影响是我们自互联网以来从未见过的。如果加密货币将成为未来的金融轨道,正如我们预测的那样,那么它与人工智能的交织将是一个反复出现的主题,而不是一次性的。
从这波浪潮中涌现出来的更有趣的项目类别之一是加密原生人工智能代理框架。它们是一个引人入胜的实验,将区块链的核心原则——无需许可的价值转移、透明度和一致的激励——带入人工智能开发。它们的开源性质为我们提供了一个难得的机会,可以窥探其内部运作,不仅分析它们的承诺,还分析它们的实际工作方式。
在这篇文章中,我们首先剖析代理框架的实际含义以及它们的重要性。然后,我们解决一个显而易见的问题:当像 LangChain 这样的成熟选项存在时,为什么我们需要加密原生框架?为此,我们分析了领先的加密原生框架及其在不同用例中的优势和局限性。最后,如果你正在构建一个人工智能代理,我们将帮助你决定哪个框架可能适合你的需求。或者,你是否应该使用框架进行构建。
让我们深入探讨。
抽象
“文明的进步在于扩展我们可以不假思索地执行的重要操作的数量。” - 阿尔弗雷德·诺斯·怀特海
想想我们的祖先是如何生活的。每个家庭都必须自己种植食物,制作自己的衣服,建造自己的住所。他们花费无数时间在基本的生存任务上,几乎没有时间做其他事情。即使在两个世纪前,近 90% 的人都在农业领域工作。今天,我们从超市购买食物,住在专家建造的房屋中,穿着在遥远工厂生产的衣服。曾经消耗几代人努力的任务已经变成了简单的交易。如今,全球只有 27% 的人口从事农业(发达国家降至 5% 以下)。
当我们开始掌握一项新技术时,熟悉的模式就会出现。我们首先了解基本原理——什么有效,什么无效,以及哪些模式不断出现。一旦这些模式变得清晰,我们就将它们打包成更容易、更快、更可靠的抽象。这些抽象释放了时间和资源,以应对更多样化和有意义的挑战。构建软件也是如此。
以 Web 开发为例。在早期,开发者需要从头开始编写所有内容——处理 HTTP 请求、管理状态和创建 UI——这些任务既复杂又耗时。随后出现了像 React 这样的框架,通过提供有用的抽象,极大地简化了这些挑战。移动开发也遵循了类似的路径。最初,开发者需要深入的、特定于平台的知识,直到 React Native 和 Flutter 等工具的出现,让他们能够一次编写代码并部署到任何地方。
机器学习中也出现了类似的抽象化模式。在 2000 年代初期,研究人员发现了 GPU 在 ML 工作负载中的潜力。起初,开发者不得不与图形基元和像 OpenGL 的 GLSL 这样的语言搏斗——这些工具并非为通用计算而构建。2006 年,英伟达推出 CUDA,让 GPU 编程变得更容易上手,并将 ML 训练带给更广泛的开发者群体,一切都发生了改变。
随着 ML 开发势头增强,出现了专门的框架来抽象 GPU 编程的复杂性。TensorFlow 和 PyTorch 让开发者能够专注于模型架构,而不是陷入底层 GPU 代码或实现细节的泥潭。这加速了模型架构的迭代,以及我们在过去几年中看到的 AI/ML 的快速进步。
我们现在看到人工智能代理也出现了类似的演变——一个能够做出决策并采取行动以实现目标的软件程序,就像人类助手或员工一样。它使用大型语言模型作为其“大脑”,并可以利用不同的工具,如搜索网络、进行 API 调用或访问数据库来完成任务。
要从头开始构建一个代理,开发者必须编写复杂的代码来处理每个方面:代理如何思考问题,如何决定使用什么工具以及何时使用,如何与这些工具交互,如何记住早期交互的上下文,以及如何将大型任务分解为可管理的步骤。每个模式都必须单独解决,导致重复工作和结果不一致。
这就是人工智能代理框架的用武之地。正如 React 通过处理 UI 更新和状态管理的棘手部分简化了 Web 开发一样,这些框架解决了构建人工智能代理中的常见挑战。它们为我们发现的有效模式提供了现成的组件,例如如何构建代理的决策过程、集成不同的工具以及在多个交互中维护上下文。
使用框架,开发者可以专注于使其代理独一无二的方面——其特定功能和用例——而不是重新构建这些基本组件。他们可以在几天或几周内创建复杂的人工智能代理,而不是几个月,更轻松地尝试不同的方法,并借鉴其他开发者和社区发现的最佳实践。
为了更好地理解框架的重要性,考虑一个构建帮助医生审查医疗报告的代理的开发者。如果没有框架,他们需要从头开始编写所有代码:处理电子邮件附件、从 PDF 中提取文本、以正确的格式将文本输入 LLM、管理对话历史以跟踪已讨论的内容,并确保代理做出适当的响应。对于并非其特定用例独有的任务,这是大量复杂的代码。
使用代理框架,许多这些构建块都可以直接使用。该框架处理读取电子邮件和 PDF,提供构建医疗知识提示的模式,管理对话流程,甚至有助于跟踪多个交流中的重要细节。开发者可以专注于使其代理与众不同的方面,例如微调医疗分析提示或添加针对诊断的特定安全检查,而不是重新发明常见的模式。原本可能需要几个月才能从头构建的内容,现在可以在几天内完成原型设计。
LangChain 已成为人工智能开发的瑞士军刀,为构建基于 LLM 的应用程序提供了灵活的工具包。虽然严格来说不是代理框架,但它提供了构建大多数代理框架的基本构建块,从用于排序 LLM 调用的链到用于维护上下文的内存系统。其广泛的集成生态系统和丰富的文档使其成为希望构建实用人工智能应用程序的开发者的首选起点。
然后是像 CrewAI 和 AutoGen 这样的多智能体框架,它们使开发者能够构建多个 AI 智能体协同工作的系统,每个代理都有其独特的角色和能力。这些框架不是简单地按顺序执行任务,而是强调通过对话进行智能体协作,以共同解决问题。
例如,在分配一份研究报告时,一个代理可能会概述其结构,另一个代理可能会收集相关信息,第三个代理可能会对最终草稿进行评论和完善。这就像组建一个虚拟团队,人工智能代理可以在其中讨论、辩论并共同改进解决方案。以这种方式协同工作以实现高层次目标的多代理系统通常被称为人工智能代理“集群”。
AutoGPT 虽然不是一个传统的框架,但它开创了自主人工智能代理的概念。它展示了人工智能如何接受一个高层次的目标,将其分解为子任务,并在极少的人工输入下独立完成。尽管它存在局限性,但 AutoGPT 引发了自主代理的创新浪潮,并影响了后续更结构化框架的设计。
但为什么是加密?
所有这些背景最终将我们带到了加密原生人工智能代理框架的兴起。此时,你可能会想,当我们在 Web2 中拥有像 Langchain 和 CrewAI 这样相对成熟的框架时,Web3 为什么还需要自己的框架?当然,开发者可以使用这些现有的框架来构建他们想要的任何代理?鉴于该行业喜欢将 Web3 强加于任何和所有叙事,这种怀疑是合理的。
我们认为,Web3 特定代理框架的存在有三个充分的理由。
在链上运行的金融代理
我们认为,未来大部分金融交易都将在区块链轨道上进行。这加速了对一类人工智能代理的需求,这类代理可以解析链上数据、执行区块链交易以及跨多个协议和网络管理数字资产。从可以检测套利机会的自动化交易机器人,到执行收益策略的投资组合经理,这些代理都依赖于区块链功能在其核心工作流程中的深度集成。
传统的 Web2 框架不提供用于这些任务的原生组件。您必须拼凑第三方库来与智能合约交互、解析原始链上事件并处理私钥管理 - 从而引入了复杂性和潜在漏洞。相反,专用的 Web3 框架可以开箱即用地处理这些功能,使开发人员能够专注于其代理的逻辑和策略,而不是与低级区块链管道搏斗。
原生协调和激励
区块链不仅仅涉及数字货币。它们提供了一个全球性的、信任最小化的记录系统,内置的金融工具可以增强多代理协调。开发人员可以使用链上原语(如质押、托管和激励池)来协调多个 AI 代理的利益,而不是依赖链下声誉或孤立的数据库。
想象一下一群代理协作完成一项复杂任务(例如,为训练新模型而进行数据标记)。每个代理的表现都可以在链上跟踪,并根据贡献自动分配奖励。基于区块链的系统的透明度和不变性允许公平的报酬、更强大的声誉跟踪和实时发展的激励方案。
加密原生框架可以明确地嵌入这些功能,让开发人员使用智能合约设计激励结构,而无需在每次需要代理信任或支付给另一个代理时重新设计轮子。
早期市场的新机遇
虽然像 LangChain 这样的框架已经具有了思想共享和网络效应,但人工智能代理领域仍处于起步阶段。目前尚不清楚这些系统的最终状态会是什么样子,而且没有一种方法能够锁定市场。
加密经济学激励为框架的构建、管理和货币化方式开辟了新的可能性,这些可能性无法完全映射到传统的 SaaS 或 Web2 经济学上。在这个早期阶段的实验可以为框架本身解锁新的货币化策略,而不仅仅是构建在框架之上的代理。
竞争者
ElizaOS与热门项目AI16Z相关联,是一个基于 Typescript 的框架,用于创建、部署和管理 AI 代理。它被设计为 Web3 友好的 AI 代理操作系统,允许开发人员构建具有独特个性的代理、用于区块链交互的灵活工具,并通过多代理系统轻松扩展。
Rig是 Playgrounds Analytics Inc. 开发的开源 AI 代理框架,使用 Rust 编程语言构建,用于创建模块化、可扩展的 AI 代理。它与AI Rig Complex (ARC)项目相关联。
Daydreams是一个生成代理框架,最初是为了创建链上游戏的自主代理而创建的,但后来扩展到执行链上任务。
Pippin是BabyAGI的创始人Yohei Nakajima开发的 AI 代理框架,旨在帮助开发人员创建模块化和自主的数字助理。Yohei 首先构建了一个独立代理,然后将其扩展为通用框架。
ZerePy是一个开源 Python 框架,旨在跨多个平台和区块链部署自主代理,重点关注创意 AI 和社交媒体集成。与 Pippin 一样,Zerepy 最初是独立代理Zerebro
-
免费下载或者VIP会员资源能否直接商用?本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
-
提示下载完但解压或打开不了?最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。
-
找不到素材资源介绍文章里的示例图片?对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
-
付款后无法显示下载地址或者无法查看内容?如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理
-
购买该资源后,可以退款吗?源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源
评论(0)