首页
研究人员教机器人人类想要什么
返回

研究人员教机器人人类想要什么

2022-12-19 手机硬件 By:佚名
最佳答案在电脑游戏中,赛车应该被优化,以提高其速度,同时沿着赛道行驶,然后汽车将踏板推到金属上,然后继续转弯。说明书上没有告诉汽车直行,所以是临时起意的。这个例子——在电脑游戏中很有趣,但在生活中并不多——是一个促使斯坦福大学研究人员建立更好的方法来设定自主系统目标的例子。计算机科学...

在电脑游戏中,赛车应该被优化,以提高其速度,同时沿着赛道行驶,然后汽车将踏板推到金属上,然后继续转弯。说明书上没有告诉汽车直行,所以是临时起意的。

这个例子——在电脑游戏中很有趣,但在生活中并不多——是一个促使斯坦福大学研究人员建立更好的方法来设定自主系统目标的例子。

计算机科学和电气工程助理教授多尔萨萨迪格和她的实验室将机器人设定目标的两种不同方法结合到一个过程中,在模拟和实际实验中,它们的表现都优于单个部分。研究人员在6月24日的机器人学:科学与系统会议上介绍了这项工作。

计算机科学研究生、《安迪帕兰》的主要作者安迪帕兰说:“未来,我完全希望世界上会有更多的自治系统,它们需要理解什么是好的或坏的概念。纸。“至关重要的是,如果我们想在未来部署这些自治系统,那么我们必须这样做。”

一种新的团队向机器人提供指令的系统——称为奖励功能——结合了演示(人类向机器人展示该做什么)和用户偏好调查,在用户偏好调查中,人们回答关于他们希望机器人如何行为的问题。

扎迪格说:“示威是有益的,但可能会带来干扰。另一方面,偏好最多只能提供一点信息,但更准确。”“我们的目标是充分利用两个世界的优势,更智能地合并这两个来源的数据,以更好地理解人类偏好的奖励功能。”

郑重声明:本文版权归原作者所有。转载文章只是为了传播更多的信息。如果作者信息标注有误,请第一时间联系我们修改或删除。谢谢你。

猜你喜欢
gtc证书查询(gtc证书)

gtc证书查询(gtc证书)

12-18 0 阅读
烟雾头怎么调win7(烟雾头怎么调)

烟雾头怎么调win7(烟雾头怎么调)

12-18 0 阅读
文科生适合报考的大学(文科)

文科生适合报考的大学(文科)

12-19 0 阅读
贪玩蓝月很赚钱吗(贪玩蓝月可以赚人民币吗)

贪玩蓝月很赚钱吗(贪玩蓝月可以赚人民币吗)

12-18 0 阅读
大学工科有哪些大的专业(大学工科类专业有哪些)

大学工科有哪些大的专业(大学工科类专业有哪些)

12-18 0 阅读
胆固醇正常范围对照表(胆固醇正常范围)

胆固醇正常范围对照表(胆固醇正常范围)

12-19 0 阅读
热门推荐
尚诚志 知乎(尚诚志)

尚诚志 知乎(尚诚志)

12-18 0 阅读
喝酒abcd怎么玩(abcd怎么玩)

喝酒abcd怎么玩(abcd怎么玩)

12-18 0 阅读
u盘隐藏文件怎么恢复显示(u盘隐藏文件怎么恢复)

u盘隐藏文件怎么恢复显示(u盘隐藏文件怎么恢复)

12-19 0 阅读
flash cs4序列号(flashmx2004序列号)

flash cs4序列号(flashmx2004序列号)

03-12 0 阅读
Realme 7 Pro的官方发布日期已公布 并承诺发表声明

Realme 7 Pro的官方发布日期已公布 并承诺发表声明

12-18 0 阅读
m100甲醇价格表(m100甲醇汽油)

m100甲醇价格表(m100甲醇汽油)

12-18 0 阅读
网线接头的颜色顺序图片(网线接头)

网线接头的颜色顺序图片(网线接头)

12-19 0 阅读
越南语错错错歌词(错错错歌词)

越南语错错错歌词(错错错歌词)

12-18 0 阅读
精华液的功效是什么(精华液的功效)

精华液的功效是什么(精华液的功效)

12-18 0 阅读
三相电功率计算公式及单位(三相电总功率计算公式)

三相电功率计算公式及单位(三相电总功率计算公式)

06-22 0 阅读