微软为Copilot研究智能体增加多模型AI功能，提升准确性-新科技-资讯-头部财经

微软为Copilot研究智能体增加多模型AI功能，提升准确性

资讯 » 新科技 2026-04-04

微软正在为其Microsoft 365 Copilot"研究"智能体扩展新的多模型功能，旨在提高AI生成研究输出的准确性和深度。

此次更新引入了"批评"系统，该系统为生成和评估分配单独的角色，同时还有一个"委员会"功能，可以比较多个模型的输出，并突出显示一致性、分歧点和独特见解。

使用DRACO基准测试的内部测试显示，配备批评系统的研究智能体在综合评分上超越了之前报告的系统13.8%（7.0分）。

委员会功能并行运行多个模型以生成独立报告，通过判断系统综合关键差异和见解，帮助IT团队比较不同的解读。

"简单来说，这就像拥有一个聪明的专业人员加上一个严格的审查员，"Pareekh咨询公司CEO Pareekh Jain说道。"但这仍然是渐进式的，不是魔法。它减少了错误但不能完全消除错误。"

其他专家指出，仅仅模型协调可能不足以推动有意义的企业成果。

"多模型系统在与CRM和HRM系统等内部企业数据集成时才能发挥其全部潜力，"Counterpoint Research研究副总裁Neil Shah说道。"这确保了AI驱动的洞察在上下文中具有细致入微的特点，反映公司独特的市场地位、客户特征和决策者的具体要求。"

基准测试的局限性与现实考量

微软的DRACO基准测试结果看起来很强，但企业应该谨慎对待它们。

"将其视为最佳情况测试；它显示AI模型可以相互检查并发现错误，但真实的公司数据要复杂得多，包含冲突信息和过时文档，"Jain说道。"还存在判断偏见的风险；如果两个AI相似，审查员可能会错过相同的错误。虽然基准测试衡量逻辑，但它们无法捕捉真正的商业价值。"

向多模型系统的转变为企业IT团队引入了新的操作复杂性层面。系统更强大，但也更难管理。

组织现在必须跟踪包括初始草稿、批评和最终输出的交互链，而不是单一的输入输出流。

"这创建了更大的审计跟踪，安全和合规团队必须审查以了解决策是如何制定的，"Jain补充道。"它还增加了成本和延迟，因为一个问题可以触发许多模型调用。另一个挑战是责任归属。如果出现问题，很难知道哪个部分失败了，比如生成器、审查员还是管理它们的系统。"

分析师表示，这将要求企业重新思考围绕AI部署的治理框架。

"企业必须优先考虑对模型到输出选择过程的治理，以及如何混合或选择多个响应的细化，"Shah说道。"这种持续监控和校准将成为流程质量管理的基本组成部分。"Shah补充说，企业还需要结构化机制来评估输出及其现实影响，确保整个决策过程的可追溯性，并改善多模型系统随时间的管理方式。

Q&A

Q1：微软Copilot研究智能体的多模型功能是什么？

A：这是微软为Microsoft 365 Copilot"研究"智能体新增的功能，包括"批评"系统和"委员会"功能。批评系统为生成和评估分配单独角色，委员会功能则比较多个模型输出，突出一致性、分歧和独特见解，旨在提高AI研究输出的准确性和深度。

Q2：多模型AI系统会给企业带来哪些挑战？

A：主要挑战包括操作复杂性增加、成本和延迟提升、责任归属困难等。企业需要跟踪更复杂的交互链，审计跟踪更大，当出现问题时很难确定是生成器、审查员还是管理系统的问题。还可能存在判断偏见风险。

Q3：企业如何更好地部署多模型AI系统？

A：专家建议企业应与CRM、HRM等内部数据系统集成，确保AI洞察反映公司独特情况。需要重新思考治理框架，建立结构化评估机制，确保决策过程可追溯，并将持续监控和校准作为流程质量管理的基本组成部分。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。由用户投稿，经过编辑审核收录，不代表头部财经观点和立场。
证券投资市场有风险，投资需谨慎！请勿添加文章的手机号码、公众号等信息，谨防上当受骗！如若本网有任何内容侵犯您的权益，请及时联系我们。

张文宏再谈AI：“灵魂”与“共情”无法被取代

2026-04-0516阅读
5小时众筹破百万美金，Tiiny AI为什么能卖爆

2026-04-0516阅读
拨快创新的“秒针”：上海三本新刊如何将学术表盘交还实验室？

2026-04-0516阅读
小鹏天玑AI OS 6.1今日开启全量推送：辅助驾驶重磅升级原地就能开启NGP

2026-04-0516阅读
今日最佳：自制力太差怎么赚钱？

2026-04-0516阅读
少爷兵”腾讯，被AI揪出空调房

2026-04-0516阅读
关停Sora后OpenAI转身收购TBPN播客，亲自下场做媒体

2026-04-0516阅读
中小公司小程序制作平台推荐？开发一套小程序要多少钱？

2026-04-0516阅读
北京市互联网新闻信息服务单位许可信息（截至2026年3月31日）

2026-04-0516阅读
热点炸屏！美团京东屏蔽竞品AI大模型，2026大模型发展何去何从？

2026-04-0516阅读