滚动

杜克大学研发新平台让AI可从人类反馈而不是大数据集中学习

2024-12-09 22:53:06    来源:盖世汽车   阅读量:13178   

盖世汽车讯 在第一堂驾驶课上,教练可能会坐到旁边,在每次车辆转弯、停下以及进行微调时,给出即时建议。倘若是父母,他们则可能会多次抓住方向盘并大喊“刹车”。随着时间流逝,此类纠正措施和意见会变成经验和直觉,让人们成为独立且具备能力的驾驶员。此外,虽然人工智能的发展让自动驾驶汽车成为了现实,但用于训练此类车辆的教学方法与副驾驶教练的方法仍有很大的差距。与提供具体建议和实时指导不同,AI主要通过庞大的数据集以及广泛的仿真实验进行学习,不管其应用场景如何。

杜克大学平台

据外媒报道,在此背景下,美国杜克大学和美国陆军研究实验室(Army Research Laboratory)的研究人员研发了一个平台,可帮助AI更像人类一样执行复杂任务。该AI框架的缩写为GUIDE。

杜克大学机械工程与材料科学、电气与计算机工程、计算机科学系教授兼杜克大学通用机器人实验室负责人Boyuan Chen表示:“对AI而言,基于有限学习信息的快速决策任务依旧是一项挑战,现有的训练方式通常受限于对庞大的现有数据集的依赖,并且对传统反馈方法的适应性也有限。我们的目标是通过引入实时连续的人类反馈,来缩小这一差距。GUIDE的工作方式是让用户实时观察AI的动作,并提供持续的细微反馈,类似于一位经验丰富的驾驶教练不会只喊‘左边’或‘右边’,而是提供详尽的指导,以让学员能够逐步改进,深入理解。”

在首次研究中,GUIDE帮助AI学会掌握捉迷藏游戏的最佳策略。该游戏包括两位甲壳虫状的玩家,一个为红色,一个为绿色。尽管两个玩家都由计算机控制,但只有红色玩家致力于提升其AI控制器的能力。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

中国商务网版权及免责声明:

1、凡本网来源注明“中国商务网” 域名:WWW.COPB.COM.CN的所有新闻稿件和图片作品,版权均属于中国商务网,未经本网授权,任何单位及个人不得转载、摘编或以其它方式使用上述作品。已经本网授权使用新闻稿件和图片作品的,应在授权范围内使用,并注明“来源:中国商务网”。违反上述声明者,本网将追究其相关法律责任。

2、凡本网注明 “来源:XXX(非中国商务网)”的新闻稿件和图片作品,系我方转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

3、如因新闻稿件和图片作品的内容、版权和其它问题需要同本网联系的,请在15个工作日内告知我方。

4、联系方式:中国商务网 电子邮件:ha17701574748@163.com