什么是目前生成式AI最火的应用形态?可能是各种Copilot,各种类ChatGPT的服务,而AI Agent也肯定是其中之一。
OpenAI联合创始人Andrej Karpathy曾在Twitter上表示:“提示工程(prompt engineering)的下一个前沿是AutoGPT(Agent)”
在亚马逊云的Amazon Bedrock平台发布会上,最闪亮的产品是Amazon Bedrock Agents,开发者可以基于它轻松创建各种生成式AI应用,来完成复杂任务。
那AI Agent是什么?可以把它理解成能自主理解、规划、执行复杂任务的人工智能系统。AI Agent可以在没有人类控制的情况下独立运行,通过接入API,AI Agent甚至可以浏览网页、使用应用程序、读写文件、使用信用卡付款等。
一家叫Fixie的初创公司在AI Agent领域颇有建树。它由连续创业者,前哈佛计算机教授创立,在今年早些时候获得了Redpoint领投,Madrona Venture和来自Google、Amazon和Apple等公司的现任和前任高管参与的1700万美元种子轮融资。
前哈佛教授与谷歌、苹果专家组团创业,硅谷顶级投资机构追着投
Fixie由来自Google和Apple的资深工程师、产品负责人和AI专家创立。它的主要创始人Matt Welsh(现担任首席架构师)是连续创业者,曾是哈佛大学计算机教授,也在Google和Apple担任过技术主管。
Fixie的其他几位联合创始人,CEO Zach Koch曾是Shopify的产品总监并在Google的Chrome和Android团队担任过产品负责人;CTO Justin Uberti曾是Google的Stadia、Duo和Hangouts Video团队负责人,也是WebRTC的发明者之一;首席AI科学家Hessam Bagherinezhad曾是Apple的AI/ML领导者,整个创始团队可谓相当豪华。
Fixie的创始人们认为大语言模型的价值不仅仅是补全文本,它真正的用武之地是链接外部API和数据源,进入企业的业务流程并自动化解决问题。
Fixie是一个基于云的平台,开发者不仅可以在这个平台上构建与外部系统、数据和工具互动的Agent,Fixie还会帮助开发者解决API接入和数据托管等一系列问题。
Madrona是第三次投资Matt Welsh参与创立的企业(前两次是Xnor和OctoML),它们认为Fixie的团队具有乐观主义,对客户的深度理解和关怀,而且有超高的人才密度。
Redpoint的董事总经理Erica Brescia表示:“现有的大语言模型非常强大,而且不断地进化,但它真正产生价值的地方是与企业内部数据和系统结合起来,从根本上改善企业的运营方式。Fixie将真正做到这一点—自动化手动工作,让人们专注于更高价值的任务。
我们相信Fixie将成为构建基于大模型的应用程序的标准,这些应用程序将促进企业中每个角色的工作流程—最终解锁巨大的生产力增长。”
搭建一个人人都可以构建Agent的平台,GPT-4、开源模型随便选
AI Agent可以做到很多复杂的任务,而且对于开发者,构建一个单独的Agent并不算困难,但是对于企业,他们需要一种方式来定义、构建、测试、部署、共享、保护、管理和监控他们的Agent。
Fixie的创立就是为了帮助企业应用开发者克服这些挑战。Fixie平台是一个基于云的PaaS服务,企业应用开发者可以轻松地创建在这个平台上构建基于各种大模型的Agent,这些Agent可以回答关于私有数据源的问题,从历史客户支持对话中获取信息,以及通过传统API与现有的企业资源进行交互。这个平台开源了它的SDK和示例代码,开发者可以在Fixie的GitHub Repo上获取。
Agent的内在原理
大模型具有通过示例学习新技能的能力,术语叫做少示例学习(Few-shot learning),通过少示例学习,开发者只要提供一些如何执行新任务的示例(例如发电子邮件、操作商用软件、联网),大模型就可以学会这些任务。
一个单独的Agent由一个基础提示、一组少示例和quote函数组成。基础提示为提示底层大语言模型如何与外部世界互动设定了舞台;少示例通过示例教导大语言模型如何处理传入的查询,向quote函数寻求帮助,以及如何将返回值融入其回复。
Fixie平台的价值在哪里?
Fixie内置了超过30个Agent,它们可以访问各种系统和工具,包括数据库、复杂的API(如GitHub)、生产力工具(如Google Calendar)以及Web搜索和Twitter等公共数据源。Fixie Agent SDK使构建自己的Agent变得非常简单,Agent构建好后,可以一键部署到云端,开发者也可以构建他们自己的Agent并提供给别人使用。之后,平台的功能还将进一步扩展。
在Fixie平台,每个Agent都可以使用自定义的大模型,除了默认支持的GPT-4外,还可以与商用或开源模型集成,包括AI21的Jurassic-2、GPT-NeoX或Cohere的Command。Agent可以生成和处理任意模态的媒体,比如使用Stable Diffusion生成图像并以各种方式操作它们。
Fixie对于ChatGPT的插件系统也有比较好的支持:用户可以构建一个调用ChatGPT插件的Fixie Agent,或构建一个调用Fixi Agent的ChatGPT插件。
Agent的使用示例
企业客户可以将Fixie构建的Agent用到客户支持、业务自动化、业务智能、内容生成、CRM自动化等领域。
例如,使用Fixie,企业客户可以构建一个Agent,将客户票据作为输入,并将查找客户的订单历史、发出退货标签和生成票据的草稿回复的过程自动化。
Fixie提供了核心平台,企业客户可以非常轻松地构建与平台集成的,私有的高度定制代理。而不是使用垂直集成的“客户票据AI”产品,使用Fixie,企业客户可以自定义大模型与其私有的数据和系统的每个方面的集成。
Fixie此前举办了一次黑客马拉松,在这次活动上,有团队构建了一个电子邮件助理Agent,它可以帮助用户的Gmail收件箱进行排序并生成写新电子邮件的提示,用户可以根据提示轻松的写好新邮件。
另一个参赛者构建了一个电影场景的Agent,这个Agent可以与Spotify API结合进行搜索,根据电影场景的文本描述找到电影中的特定歌曲。还有一个参赛团队构建了基于YouTube,为用户推荐特定主题的Agent。
OpenAI将Agent视为下一个主要方向,那创业公司还有机会么?
Agent代表了构建软件的基础性转变,它是一种新的软件形态。以前的大型软件,每一个功能都需要投入不少研发力量去开发维护,而一个Agent,只要它的基础大模型能力升级,或者花较少的成本把模型进行微调,能力就可以迭代升级。
开发者可以构建一个Agent解决一个单点问题,也可以用几个Agent组合起来协作解决更复杂的问题。
对于创业者,可以构建单个的Agent并不断迭代,例如BabyAGI,也可以像Fixie一样构建一个平台,让企业和开发者可以自由的开发Agent。
在文章一开头,我们就提到了亚马逊云对Agent的重视和投入,那么,面对科技巨头,创业者在这个方向还有机会么?
先说一个”坏消息“,生成式AI的领头羊OpenAI对Agent也十分重视。
“如果一篇论文提出了某种不同的模型训练方法,OpenAI内部会嗤之以鼻,认为都是我们玩剩下的。但是当新的AI Agents论文出来的时候,我们会十分认真且兴奋地讨论。” OpenAI联合创始人Andrej Karpathy在一次OpenAI的黑客马拉松上发表观点。
OpenAI联合创始人兼CEO Sam Altman也曾在多个场合表示,构建庞大AI模型的时代已经结束,AI Agent才是挑战。
外媒《The Information》指出,Sam Altman曾在5月私下告诉部分开发者,OpenAI希望将ChatGPT打造成个人工作助手,并有知情人士指出,OpenAI一直在关注如何使用聊天机器人来创建自主的AI Agent,相关功能很有可能部署在ChatGPT中。
那么好消息是,在同一场黑客马拉松上,Andrej Karpathy还说了这样的话:”普通人、创业者和极客在构建AI Agent方面相比OpenAI这样的公司更有优势。“
尽管有业内专家表示,想要实现可用的AI Agent,还需要大幅提高大模型的能力,但是能够找到适合Agent的应用场景,有创新能力创业者,显然应该行动起来了。
您可能关注:
OpenAI