价值无处不在,世界财经资讯媒体平台。
手机版
访问手机版
世界总裁网 首页 头条资讯 世界企业 新闻内容

清华大学合作推出体验式协同学习框架:让AI总结历史经验,大幅提高学习能力

发布时间: 2024-1-3 06:25| 发布者: wangjing| 查看: 1531| 评论: 0

摘要: 1 月 2 日消息,机器学习和人工智能已经在各行各业掀起了新的变革浪潮,其重点表现形式是各种大模型支撑的“智能体”(agent),指能自主活动的软件或者硬件实体。这些“智能体”可以和用户进行自然对话,并根据对话 ...

 1 月 2 日动静,机械进修战野生智能曾经正在各止各业掀起了新的变化海潮,其重面表示情势是各类年夜模子支持的“智能体”(agent),指能自立举动的硬件大概硬件真体。

那些“智能体”能够战用户停止天然对话,并按照对话内乱容自力处置各类使命,展现了它们正在浩瀚范畴完全改动使命处理方法的潜力。

不外那些野生智能驱动的“智能体”面对的一个严重应战是,它们偏向于伶仃运转,常常会反复毛病,并接纳低效的试错办法,限定了它们的服从,障碍了它们的进修历程。

固然年夜言语模子连续开辟了高低文敏感影象、多步调计划战计谋性东西等初级功用,但那些“智能体”正在施行使命时凡是没法汲取汗青经历,从而招致其处理成绩的才能服从低下。

去自浑华年夜教、年夜连理工年夜教战北京邮电年夜教的科研团队克日推出了打破性框架--“体验式协同窗习”(Experiential Co-Learning),目的是年夜幅进步“智能体”的进修才能。

那一立异办法将已往的经历融进到“智能体”的操纵构造中,从而从头界说了“智能体”的合作战进修方法。

该框架包罗三个不成朋分的模块:配合逃踪(co-tracking)、配合影象(co-memorizing)战配合推理(co-reasoning),每一个模块皆正在加强“智能体”的合作战进修才能圆里阐扬着相当主要的感化。

配合逃踪:

“智能体”停止协作练习训练,对各类锻炼使命的“法式轨迹”停止详尽逃踪。这类跟踪为“智能体”分享经历战协作订定战略奠基了根底。

配合影象

按照内部情况反应,从那些轨迹中战略性天提与“快速方法”,从而进一步促进上述事情。那些“快速方法”被整开到“智能体”的个人经历库中,使他们可以参考已往的经历,增强将来的使命处理战略。

配合推理

分离了“智能体”的个人经历库,使它们可以经由过程细化指令战呼应停止更初级的互动。经由过程操纵各自的经历常识,“智能体”可为已知使命供给更有洞察力战更精确的处理计划。

团队正在布置“体验式协同窗习”以后,发明可明显进步“智能体”的进修才能,具有更下的合作服从,年夜年夜削减了反复性毛病战施行工夫,并削减了硬件开辟中对分外人力到场的需供。

“智能体”可以从已往的经历中回想并使用下量量的 "捷径",再分离底层 LLM 的才能,证实了机能的进步。

该框架使“智能体”可以从已往的经历中进修并有用操纵那些经历,从而补偿了它们正在操纵才能上的一个枢纽差异。

那一前进进步了自立“智能体”的服从,削减了它们对野生干涉的依靠,为将来的自力智能体系摊平了门路。

  • 0
    粉丝
  • 1531
    阅读
  • 0
    回复

关注世界总裁网

扫描关注,了解最新资讯

实时了解财经信息
掌握市场风云动态
助力商场共赢至胜
改变你所看到的世界
热门资讯
排行榜

关注我们: 微信订阅&APP下载

发现价值 创造价值

WNCEO.COM

世界总裁网版权所有 未经世界总裁网书面授权禁止复制或建立镜像内容

Email: service@wnceo.com 电话: +86-010-86398086

地址: 北京市朝阳区广渠路36号首城国际大厦10层 邮编: 100010

Copyright  ©2008-2024 世界总裁网All rights reserved. 工信部许可备案号:京ICP备12045339号-2