尽管人工智能代理的概念并不新鲜,但它一直很有吸引力。从星球大战中的C-3PO到学术界的定义,智能代理一直是人工智能的核心话题。随着ChatGPT、Claude和Gemini等在多种知识领域表现出强大理解和对话能力的模型的出现,AI代理的概念变得更加具体和可能。新的“视觉”能力和函数调用功能为AI代理的发展提供了新的可能性。
我们首先定义“座席能力要求”,明确座席需要执行的功能以及所需的熟练程度。随后,在“代理工程和设计”阶段,将评估可用技术以及如何构建和协调代理的结构。
该框架旨在提供一个实用的心智模型,虽然并不全面,但足以作为起点,随后可以根据实际需要进行细化和扩展。
代理工程框架
打造AI智能体的初衷是什么?它需要完成和实现什么?在多功能代理和多代理集群之间,哪个更适合特定任务?人类语言的灵活性使我们能够在多个维度上扩展和深化这些概念,但这也可能导致概念模糊。在这个框架中,我们尽量避免过度解析术语的语义差异,而更多地关注概念的普遍性和实用性。核心概念如下:
代理需要执行特定的工作。做好事情需要具体行动。动作的执行取决于代理的能力。能力必须达到一定的熟练程度。达到这种熟练程度需要适当的技能和技术协调。能力要求和设计
设计人工智能代理的第一步是明确代理的职责和目标。这可能是一个高级目标或分解为具体任务。例如,电子商务聊天机器人可能需要处理客户询问、分析客户行为并提供产品推荐;内容创建代理可能需要生成内容创意、文章草稿或博客。
定义任务后,确定代理执行这些任务所需的具体操作。这不仅仅是定义目标,更重要的是指定实现目标的行动步骤。这一阶段还需要考虑代理人的自主权。例如,内容创建代理的动作可以包括调用数据分析代理来获取趋势见解、基于趋势和受众偏好生成内容创意以及起草和修改文章。
所需能力的规范

现在我们已经概述了智能体执行工作所需采取的动作,这些动作要求智能体具有不同的专业能力,例如自然语言对话、信息检索、内容生成、数据分析、持续学习等。也可以用更技术层面来表达,比如API调用、函数调用等。例如,对于内容创建代理来说,所需的能力可能包括:
动态调用内容趋势代理的API。头脑风暴和总结能力。根据当前主题和趋势生成具有正确基调的内容。按照人类提供的编辑指令行事。在选择技术来实现这些功能时,请记住避免限制技术选项,以确保灵活性以适应未来的技术发展。例如,尽管大型语言模型(LLM)目前受到青睐,但大型动作模型(LAM)等其他模型的开发可能为实现所需功能提供新的可能性。
能力和熟练程度
确定代理所需的能力后,评估和定义每种能力所需的具体熟练程度至关重要。这包括设定准确性、效率和可靠性等性能基准。
例如,对于我们的内容创建机构,所需的熟练程度可能包括:
函数调用的可靠性为75%。函数调用失败的可解释率为99.99%。第一次尝试时,内容趋势代理的函数调用应至少在75% 的时间内产生相关主题。生成的内容创意在75% 的情况下会产生理想的主题。精准信息检索准确率达99.99%。生成用户反馈满意度为90% 或更高的编辑器。用户对最终草案的反馈满意度为90% 或更高。
代理工程与设计
确定所需的能力及其熟练程度后,下一步是确定如何通过现有技术和方法来满足这些要求。这涉及评估各种技术和方法,例如法学硕士、信息检索增强生成(RAG)、专用API 以及其他机器学习和人工智能模型,以确定它们是否能够达到所需的熟练程度。
在此过程中,重要的是要考虑每种技术或方法的优势和成本效益,以及它们对实现特定功能的适用性。
知识广博能力强

广泛的知识是指对广泛主题和领域的一般理解和信息。此类知识对于创建能够有效进行对话、理解上下文并针对各种主题提供相关响应的人工智能代理至关重要。
法学硕士— 如果您的代理人的能力需要广泛的知识熟练程度,那么好消息是法学硕士的发展仍在继续。从LlaMA3 等开源模型到OpenAI、Anthropic 和Google 的最新专有模型,有相当多的技术可以在如此广泛的人类语言和知识中提供高密度的一致性。即时工程——这个充满活力且非常活跃发展的领域专注于激活由法学硕士建模的适合上下文的知识领域。由于语言的千变万化的性质,掌握这门艺术可以显着提高我们代理的熟练程度。特定知识的熟练程度
特定知识涉及对特定领域或主题的更深入理解。在追求我们的熟练度目标时可以考虑哪些技术/技巧?
模型微调——在特定于上下文的数据集上微调法学硕士,使模型能够在特定设置中生成更多与上下文相关的响应。虽然不像RAG 那样流行,但随着代理工程不断受到关注,我们可能会发现熟练程度要求促使我们更频繁地转向这种技术。准确的信息
精确信息是指对于需要准确答案的任务至关重要的高度准确且具体的数据点。
函数调用(又名工具使用)——对无可争议的具体事实的幻觉是人工智能代理的一个主要问题,因此我们可以使用函数调用来检索特定信息。例如,电子商务代理可能使用定价API 来提供最新的产品价格,或使用股票市场API 来提供股票价值的实时更新。 Guardrails — Guardrails 可以帮助确保代理在其响应中提供精确且准确的信息。这可能涉及基于规则的约束、引导对话设计和意图预处理。机构解散与协调
明确Agent的任务、所需能力和技术后,下一步就是设计和协调Agent的具体结构。这可能涉及整合多种技术和方法来构建可以独立工作或在更广泛的系统中工作的人工智能代理。这包括考虑如何将不同的能力分配给一个或多个代理,以及如何开发可以轻松重新配置和适应新任务的代理结构。这个话题本身就值得写几篇文章,所以我们在这里不会深入讨论。
标题:从即时工程到代理工程:构建高效人工智能代理的战略框架概述
链接:https://www.ltthb.com/news/sypc/139760.html
版权:文章转载自网络,如有侵权,请联系删除!
用户评论
真的很好理解!我一直以为提示工程就是唯一的解决办法,没想到还有代理工程。这个框架太棒了,可以让我更高效地构建AI代理。期待了解更多具体的案例和应用!
有13位网友表示赞同!
标题说的对,这两年我觉得提示工程越来越困难了,效果提升的幅度越来越小。代理工程这个思路很有意思,可以利用已有的工具和模型来优化代理,也许是个很好的突破口!
有11位网友表示赞同!
看了这篇博文后感觉自己太落后了~ 虽然我一直在关注AI领域,但对代理工程的概念还是一头雾水,希望能详细一点介绍一下代理的类型和应用场景。
有19位网友表示赞同!
目前来说我还是更偏向于提示工程,觉得其操作相对简单易上手。不过代理工程确实可以解决一些提示工程难以应对的问题,未来或许会成为主流趋势吧
有19位网友表示赞同!
对于想要快速构建AI代理的开发者来说,这个框架非常实用!把“从零到一”的过程拆解成了几个步骤,并且给出了清晰的可操作指南。感谢作者分享这么好的资源!
有16位网友表示赞同!
如果说提示工程是AI技能提升的训练camp,那么代理工程就是升级后的教学系统,更加高效和全面对不对?这篇文章让我看到了新兴技术发展的趋势!
有14位网友表示赞同!
个人认为这篇博文缺乏实践案例的支持,只能提供一些理论基础。希望作者能在后续文章中分享一些具体的应用实例,让我更深入地理解代理工程的概念。
有20位网友表示赞同!
我一直觉得AI代理需要具备更多的灵活性,只有这样才能更好地应对复杂的任务场景。作者提出的这个框架可以帮助我们实现这样的目标吗?
有10位网友表示赞同!
对于初学者来说,这篇文章可能有些难度。建议作者能够对一些专业术语进行详细解释,以便更加广泛的读者群体能够理解。
有11位网友表示赞同!
代理工程和提示工程都能构建高效的AI代理,两者之间是相互补充的关系吧? 期待看到未来的发展趋势在这方面的结合!
有18位网友表示赞同!
这篇博文让我意识到,要构建高效的AI代理不仅仅需要强大的模型,更需要设计合理的策略框架。希望这个框架能够得到更多人的应用和推广!
有11位网友表示赞同!
我觉得这篇文章重点阐述了代理工程的不同类型, 对于了解不同场景下使用合适的代理策略很有帮助。 希望作者能分享更多关于代理选择和调优的经验。
有10位网友表示赞同!
虽然我很喜欢这个框架,但是我还是比较关心它的缺点或者局限性。毕竟任何技术都有其相应的缺陷,希望作者能够在这方面有所探讨
有10位网友表示赞同!
我对代理工程非常感兴趣!这篇文章介绍得很有条理, 帮助我初步了解了这个领域。 我期待看到更深入的探讨和实际应用案例。
有12位网友表示赞同!
这个框架听起来很棒,但我觉得一个好的代理模型还需要考虑伦理问题。如何在保证高效性的同时避免算法偏见? 这也是我们需要思考的重要议题!
有18位网友表示赞同!
对于我来说,提示工程比较容易理解,而代理工程还有一些模糊不清的地方。希望作者能用更多具体的例子来解释代理的运作机制。
有8位网友表示赞同!
我很想知道这个框架在实际应用中的效果如何? 期待看到一些案例证明其有效性!
有10位网友表示赞同!
这篇文章对代理工程的定义和分类给我提供了很好的概览, 也解答了我关于构建高效AI代理的一些疑惑。 希望能看到更多具体的应用场景和实例!
有11位网友表示赞同!