苏州智能体“苏零”登顶全球权威评测

2025-04-29 07:00:00

人工智能的下一个战场，正在从大模型迈向智能体——这项能自主决策、执行复杂任务的技术，被公认为颠覆生产力的革命性引擎。在这场全球竞速中，中国力量成功站上巅峰。4月23日，由苏州市人工智能重点实验室自主研发的“苏零”智能体在全球权威评测GAIA中一举登顶，截至记者发稿时，“苏零”仍保持第一。

苏州智能体“苏零”登顶全球权威评测。苏州市人工智能重点实验室供图

智能体（Agent）是指能够感知环境并采取行动以实现特定目标的代理体，是大模型迈向真实世界应用的重要方向。它可以是软件、硬件或一个系统，具备自主性、适应性和交互能力。智能体通过感知环境中的变化（如通过传感器或数据输入），根据自身学习到的知识和算法进行判断和决策，进而执行动作以影响环境或达到预定的目标。

如果说大模型的智商测试是ChatGPT时代的“高考”，那么GAIA就是智能体技术的“奥林匹克”。GAIA是由国际顶尖团队联合打造的评测基准，用466道“魔鬼考题”模拟真实世界挑战，涵盖网页浏览与信息整合、多模态理解、代码执行与数据分析、文件处理及复杂的推理和任务规划。不同于其他聚焦于抽象模式识别的评测基准，GAIA更注重评估AI在真实世界任务中的表现，包括推理、多模态处理（文本、图像、音频）以及工具使用能力。

自2023年11月推出后，GAIA成为各大厂和创业公司争相竞逐的权威评测榜单，不断被刷新纪录。此次，“苏零”智能体凭借独特的多智能体协作与辩论机制、灵活的工具调用、自主决策和实时修正能力，以76.41%的准确率碾压一众国际选手。其中，在包含301个问题的测试集上，超越了微软、谷歌和硅谷AI独角兽公司H2O智能体等许多国际顶尖竞争对手。

苏州市人工智能重点实验室由苏州市政府联合苏州数智科技集团、中国科学技术大学苏州高研院等产学研龙头单位共建，是长三角区域首个以“人工智能+”为核心使命的创新平台。

（苏报融媒记者朱琦通讯员柳丹丹/文）

编辑：钱芳

本文分类：实时讯息
浏览次数：0 次浏览
本文链接：https://m.blin123.com/news/zkRA9YLRqg.html

上一篇 > 名胜区召开2025年西湖龙井茶联合执法专项行动总结会议
下一篇 > 一季度国际航班量和旅客量进一步增加

导航栏目

苏州智能体“苏零”登顶全球权威评测

相关推荐