
在大模子的多种应用气象中,实施专科功能的行业 Agent,无疑是培育出产效劳、竣事价值创造的利器。
联系词,千行百业包含着大齐的私域学问、行家警告和器具使用逻辑,使得智能体的行业应用构建存在千般门槛。
为了培育拓荒效劳,业界建议了诸如 Skills、OpenClaw 等优秀的工程框架,使得专科 Agent 的拓荒门槛日益镌汰,也让针对 Agent 应用的多维度算法优化需求愈发突显。
在此配景,华为诺亚方舟实验室近期在官网更新了面向行业应用的算法包 MindScale,这一技俩和会了实验室的算法改进基因与华为行业智能化业求执行警告。
其系统性梳理了 Agent 期间将"大模子"退换为"出产力"的算法技巧挑战,并给出了对应的技巧论文与昇腾代码竣事,为行业用户与拓荒者提供了径直的"上手指南"。

制约行业 Agent 发展的四大中枢挑战
在 MindScale 技俩中,征询东说念主员识别了在行业普及 Agent 应用的四大挑战:
使命流手工保养:依赖行家将业务章程"翻译"为 Agent 使命流;
历史学问复用难:历史推理旅途与反馈无法灵验使 Agent 系统自演进;
训推效劳瓶颈:大齐模子部署与迭代需求 + 想考旅途变长,资本压力陡升;
复杂推理测评:多步、多器具交汇推理,单精度目的无法准确反应模子效劳。
竣事使命流自进化与教唆词自动化闭环
为了鲁莽这些挑战,诺亚的征询东说念主员与多所合营单元沿途,给出了我方的守护决策。
举例,面向行业 Agent 拓荒中最常见的使命流(Workflow)拓荒场景,算法包中包含了自进化的 Agent 算法EvoFabric。
与手动索要使命流高度依赖行家警告不同,使用 SOP2Workflow 不错快速从当然谈话文档与历史器具库,径直生成可实施的 Workflow。

由用户书写的网页功能测试 SOP →自动生成的统统这个词 Workflow
为了竣事这么活泼的 Workflow 生成,征询东说念主员禁受了基于景色图引擎内核的 Agent 竣事,nba下注官网原生援手混编 Agent、器具等多种图节点,援手景色的改写和分组和会处理,竣事多智能体、多器具、多牵记气象的深度混编,图引擎还援手 DSL 文献的导入与导出,竣事复杂智能经过的快速复制、挪动与部署。
同期,该算法框架还不错竣事基于牵记的演进——多轮实施时,牵记模块行使轨迹牵记,以及那时的评估法例酿成警告优化坎坷文,竣事 Agent 越用越好。
另一个意旨的功能,是让模子初始我方进行" prompt 优化"。
领先,凤凰彩票官方网站基于前期照旧先行发布的 prompt 在线优化算法 SCOPE,拓荒者不错竣事在每步推理之间进行 prompt 在线优化,通过注入萃取历史旅途中的灵验信息竣事教唆词的快速优化,在 HLE 和 GAIA 等 agentic reasoning 的场景里不错赢得 20% 以上的精度培育。
此外,征询东说念主员还建议了"大模子 prompt 优化器" C-MOP,通过改进的样本登第与梯度更新计谋,守护了"文本梯度"的突破问题,竣事了基于正负例反馈的 prompt 自动优化,委果作念到了"反馈 ->演进"的 prompt 优化闭环。

C-MOP:和会正误双向样本感知与时序动量梯度的教唆词优化器榨干算力潜能并适配国产硬件生态
除了精度培育,MindScale 也细心面向行业场景模子的训推效劳优化,举例:
其中的 TrimR 用一个已预教师、指示微调的轻量考证器在线检测并截断不消中间想路,全程无需微调大模子或考证器;
配套工业级异步在线系统,适配大并发出产场景。
在 MATH、AIME、GPQA 等基准与多款 LRM 上,TrimR 在险些不影响准确率的前提下,将推理时延显耀镌汰,大并发场景最高可达约70% 提速,竣事骨子应用场景中的 Test Time Scaling。

TrimR:工业级想维链动态压缩算法框架
此外,为了适配行业场景高并发的推理压力,MindScale 还提供了新的基于 KV Cache 的推理决策。
与通用决策中 KV Cache 仅仅用来加快解码的"幕后器具"不同,征询东说念主员建议 KV-Embeddings,把 KV Cache 视作一种"免费附赠"的轻量默示,无需非凡贪图或存储好意思满隐景色,不错在链式默示推理(Chain-of-Embedding)和快慢想考切换等要害场景中,基于多款主流模子上竣事性能握平或反超专用 embedding 模子,同期将生成 token 数最高减少 5.7 ×。
这些法例标明—— KV Cache 不仅仅加快器,更是一块尚未被充分行使的"想考缓存",为大模子推理阶段的默示复用灵通了新的设想空间。
此外,诺亚方舟实验室与有关合营团队还在职务牵记、Agentic RAG、通用算法发现框架等多个方朝上,千里淀了大齐经过实战检会的、围绕行业智能优化的改进算法技巧架构。
同期,MindScale 还也包含了适配昇腾硬件的代码竣事,不错让行业拓荒的小伙伴们,基于国产算力竣事高精度、高效的 Agent 构建。
MindScale 主页(或点击文末"阅读原文"):
https://noah-mindscale.github.io/
华为诺亚方舟实验室主页:
https://www.noahlab.com.hk/#/home
* 本文系量子位获授权刊载,不雅点仅为原作家统统。
一键三连「点赞」「转发」「留神心」
迎接在挑剔区留住你的办法!
— 完 —
� � 点亮星标 � �
科技前沿浮现逐日见凤凰彩票