美国科技巨头交锋新战场：AI智能体

36氪的朋友们·2024-04-23 09:36

微软、Meta、OpenAI、谷歌等开发AI智能体。

划重点

1微软、Meta、OpenAI以及谷歌等公司都在开发名为智能体的新人工智能软件，它们几乎可以在无人指导的情况下处理复杂任务。
2微软计划在下个月的开发者大会上宣布其智能体功能，OpenAI正在秘密研发能够操作计算机的智能体。
3研究人员正在寻找防止智能体失控的方法，比如错误地删除文件或在用户设备上执行有害操作。

腾讯科技讯据国外媒体报道，由于许多企业对投资对话型人工智能保持审慎态度，微软、OpenAI以及谷歌等人工智能领域的领军企业正积极推出新功能，力求将这项技术塑造为一项不可或缺的技术，能够在几乎无需客户指导的情况下处理复杂任务。

科技巨头新战场

以微软为例，据该公司内部员工透露，微软正在积极开发一款新软件，其强大功能包括根据客户的订单历史自动创建、发送并跟踪发票，甚至能够用另一种语言重写应用程序代码，并验证其是否按预期运行。这款新软件将借助OpenAI的先进技术进行升级，进一步完善微软现有的Copilots套件，该套件目前主要用于会议总结或草拟电子邮件等工作。据悉，微软计划在下个月的年度Build开发者大会上正式公布其中的部分新功能。

这些功能均属于被称为智能体（Agent）的范畴，这是一种能够在最少的人类干预下实现目标的人工智能软件。OpenAI、谷歌以及Facebook母公司Meta都在积极研发各自的智能体。尽管人工智能聊天机器人以其生成真实答案或向程序员推荐代码行的能力赢得了业界的广泛赞誉，但客户们普遍认为，要想进一步释放投资潜力，它们仍需要能够自动化处理更复杂任务的软件。

大型数据库提供商MongoDB的CEO戴夫·伊蒂切里亚（Dev Ittycheria）在谈及人工智能的当前应用时表示：“我注意到电子邮件中出现了一些新功能提示，比如‘你想用人工智能重写这张便条吗？’然而，这些功能并未真正给我的生活带来颠覆性的改变。”他进一步透露，Mongo的员工和客户都在期待更为出色的功能，才愿意在人工智能领域投入巨额资金，“我坚信智能体将是工作流程的下一个重大突破”。

OpenAI正在秘密研发一种全新的智能体，它们能够利用计算机的强大功能，同时操作多个应用程序，实现如将文档中的数据自动传输到电子表格等高效任务。除此之外，OpenAI和Meta也在积极开发另一类智能体，它们擅长处理复杂的多步骤任务，例如制定行程规划，并据此自动预订旅行住宿等。

谷歌的核心人工智能团队DeepMind也在这一领域展开研究，其成果得益于安莫尔·古拉蒂（Anmol Gulati）的杰出贡献。古拉蒂是初创公司Adept的联合创始人，该公司专注于开发能够使用计算机的智能体。

据一位熟知谷歌计划的知情人士透露，Adept已经成功筹集了超过4亿美元的资金，并计划在今年夏天推出全新的智能体服务。Adept首席执行官戴维·栾（David Luan）表示，该公司从基础开始构建人工智能系统，并通过分析人们在电脑上工作的视频来训练模型，如制作Excel电子表格等。经过精心训练的Adept模型已经能够在计算机上像人类一样执行各种操作，比如在网页导航中搜索网上房源，或在客户关系管理系统中记录电话内容。

当前智能体仍不完美

随着智能体概念逐渐在人工智能领域崭露头角，谷歌及其他公司的高管们或许会让客户感到些许困惑，因为他们对于智能体的定义存在分歧。举例来说，谷歌上周宣布的一系列所谓的智能体，但它们实质上仅仅是ChatGPT等会话聊天机器人的变种，这些变体经过训练能够处理特定任务，如支持客户服务互动。然而，它们往往并不具备执行多步骤任务的能力。

一年前，当开发人员发布了两个由大语言模型驱动的开源智能体后，智能体的概念首次引起了广泛关注。有人利用这些智能体创建了各种演示，这些演示中的智能体能够自动编写播客大纲或汇总商业竞争对手的研究。然而，当人们意识到这些智能体仍远未达到完美的境地后，这种炒作热潮便迅速降温。根据开发者的反馈，尽管这些可用的智能体能够构思出实现更大目标所需的任务列表，但它们的执行过程往往是成败参半，因为它们很容易陷入重复性的动作循环中。

面对这一现状，微软等公司并未急于推出最复杂的智能体，而是选择逐步改进其软件当前版本中的自动化功能。据一位微软员工透露，今年早些时候，微软成立了一个由云和人工智能执行副总裁斯科特·格思里（Scott Guthrie）领导的新团队，专注于为公司的Copilot产品开发智能体。例如，微软正在为Dynamics应用中的销售人员打造一项即将推出的智能体功能，该功能旨在主动提出应用可以执行的多步骤操作建议，而这些操作在以前通常需要用户明确指示Copilot来完成。

举例来说，微软计划中的功能将能够检测到企业客户尚未完成的大型产品订单，随后自动起草发票，并询问企业是否需要将该发票发送给下单的客户。据知情人士透露，一旦得到确认，智能体将能够自动追踪客户的回复和付款情况，并将这些信息准确记录在公司的系统中。

微软的一名员工透露，尽管微软研究部门的负责人彼得·李（Peter Lee）去年已经指示研究人员探索构建更复杂智能体程序的方法，如OpenAI正在研发的使用计算机的类型，但微软的研究团队仍在努力寻找防止智能体失控的对策，以防止其错误地删除文件或在用户设备上执行其他潜在的有害操作。

软件程序员可能是首批能够体验到高级智能体的专业人士，正如他们是最早受益于对话式人工智能的群体一样。这得益于微软旗下的GitHub Copilot，该工具能够在开发人员键入代码时为他们提供实时的代码行提示。GitHub首席执行官托马斯·多梅克（Thomas Dohmke）表示，在未来的一年里，GitHub Copilot将实现更多功能。他透露，当开发者描述他们在代码库中遇到的问题时，智能体将能够审查该问题，提出修复方案，并自动编写和运行相应的代码。

GitHub首席执行官托马斯·多姆克

多姆克进一步补充说：“我们目前的重点是构建能够处理更大任务的智能体。在不远的将来，我们将见证更多的智能体在协助开发者完成各项工作方面发挥重要作用。”

与此同时，Magic和Cognitive AI等初创公司也因声称它们的编码智能体能够胜任人类程序员的多项工作而备受瞩目。然而，这些说法尚需进一步的验证。

两大最新进展提供助力

最近的两项进展为人工智能提供商在开发具有更广泛用途的智能体方面带来了曙光，这些智能体能够执行诸如规划个人未来一周的约会、创建行程和地图，或是像人类一样精准地填写表格等复杂任务，同时能够整合来自各种数据源的信息。

美国加州大学伯克利分校的计算机科学教授、同时身为人工智能初创公司Anyscale和Databricks的联合创始人伊恩·斯托伊卡（Ion Stoica）指出，开发者在利用大语言模型生成合成数据方面取得了显著进步，这些合成数据进而可用于训练其他模型。在代码生成领域，这一技术尤为实用，因为开发者可以引导模型在一系列参数中创建并解决问题。

斯托伊卡进一步提到，第二个重要进展在于“Grounding”（基础训练），这主要涉及到将抽象、符号化的信息与现实世界中的具体事物或现象进行有效关联。在构建人工智能模型的过程中，这种能力使得模型能够自动验证其他模型的输出是否有效，例如测试一个模型生成的代码是否真正解决了特定问题。

斯托伊卡表示：“在未来一年里，我们将看到模型在解决问题和推理能力方面的显著跃升。这很大程度上取决于Grounding技术的进展：如果我能自动验证输出的有效性，那么我就可以利用大型模型本身来优化输出，这将带来革命性的变化。”

尽管智能体的发展尚未达到全面起飞的阶段，但人工智能提供商及其客户们仍在技术上做着不懈的努力，旨在消除当今聊天机器人常犯的错误，这些错误一直阻碍着企业在实际应用中广泛采纳这类技术。

Datadog的首席执行官奥利维尔·波梅尔（Olivier Pomel）指出：“即使聊天机器人的准确率能达到99%，但对于一些需要近乎完美精度的应用来说，这仍然远远不够。”Datadog是一家专注于帮助企业跟踪云应用性能的公司。

这种Grounding工作需要能够对人工智能模型产生的结果进行事实核查的软件支持，这与OpenAI及其同类公司形成鲜明对比，他们致力于开发规模越来越大的会话人工智能。这些大型模型的目标在于比其前身更加聪明、准确。OpenAI及其竞争对手寄望于更大的模型能够更好地为智能体提供动力，但关于大模型改进速度有多快，目前尚难预测。

本文来自“腾讯科技”，作者：金鹿，36氪经授权发布。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

美国科技巨头交锋新战场：AI智能体

美国科技巨头交锋新战场：AI智能体

科技巨头新战场

当前智能体仍不完美

两大最新进展提供助力

Recommend

5月中发布？vivo X100 Ultra长焦特写照公布 | 1199元，Note 12T Pro与三星S23 Ultra史...

Fortnite Festival now supports Rock Band 4 guitar controllers

Google Fires More Employees Over Protest of Cloud Contract With Israel - Slashdo...

California Is Grappling With a Growing Problem: Too Much Solar - Slashdot

方舟投资公司分析师：投资者别太在意特斯拉的短期困境

TCL宣布推出3款Mini LED电视新品，Q10K、Q10K Pro月底开售

Crypto Trader FalconX Unveils Institution-Friendly Custody, Trading and Credit S...

SAP Quality Notification creation from action box ...

C isn’t a Hangover; Rust isn’t a Hangover Cure

Should I pause codeforces for training???

About Joyk