首页
深度学习网络可能更喜欢人类的声音
返回

深度学习网络可能更喜欢人类的声音

2022-12-19 科技信息 By:佚名
最佳答案数字革命是建立在二进制的基础上的,这些不可见的 1 和 0 称为位。计算机更喜欢用二进制数“说话”的观点很少受到质疑。根据哥伦比亚工程公司的新研究,这种情况可能即将改变。一个新的 美国国家科学基金会资助的研究由机械工程师三Hod Lipson和研究员陈博园证明,如果它们与人类语言的声...

数字革命是建立在二进制的基础上的,这些不可见的 1 和 0 称为位。计算机更喜欢用二进制数“说话”的观点很少受到质疑。根据哥伦比亚工程公司的新研究,这种情况可能即将改变。

一个新的 美国国家科学基金会资助的研究由机械工程师三Hod Lipson和研究员陈博园证明,如果它们与人类语言的声音文件,而不是数字数据标签编程,人工智能系统可能会达到更高的性能水平。

研究人员发现,“训练标签”由声音文件组成的神经网络在识别图像中的对象方面达到了比另一个使用简单二进制输入以更传统方式编程的网络更高的性能水平。

“要了解为什么这一发现很重要,”Lipson 说,“了解神经网络通常是如何编程的,以及为什么使用人声是一项激进的实验是很有用的。”

二进制数的语言简洁而精确地传达信息。相比之下,人类口语更具有音调和模拟性,并且在以数字文件形式捕获时,是非二进制的。由于数字是将数据数字化的有效方式,因此程序员在开发神经网络时很少偏离数字驱动的过程。

Lipson 和 Chen 推测,如果系统被“训练”为识别物体,例如,通过使用世界上进化程度最高的声音之一——人类说出特定单词的声音,神经网络可能会学得更快更好。

该团队以一种新颖的方式建立了实验神经网络。他们为它提供了一个数据表,其中包含一张动物或物体的照片,以及一个人类对所描绘的动物或物体的单词发音的音频文件。没有 1 和 0。

起初,研究人员惊讶地发现他们的预感是正确的——音频文件和二进制 1 和 0 之间没有明显的优势。控制神经网络和实验神经网络的表现同样出色,大约 92% 的时间都能正确识别照片中描绘的动物或物体。为了仔细检查他们的结果,研究人员再次进行了实验并得到了相同的结果。

将于 5 月 3 日在 国际学习代表会议上公布的结果是利普森哥伦比亚创意机器实验室更广泛努力的一部分,该实验室旨在创造能够通过与其他机器和人类互动而不是通过与其他机器和人类互动来理解周围世界的机器人。用精心预处理的数据直接编程。

猜你喜欢
一千卡等于多少脂肪?(一千卡等于多少脂肪)

一千卡等于多少脂肪?(一千卡等于多少脂肪)

12-18 0 阅读
禁封动漫名单(被禁的动漫名单大全集)

禁封动漫名单(被禁的动漫名单大全集)

12-18 0 阅读
官方候补通道已满(候补通道已排队未兑现是什么意思)

官方候补通道已满(候补通道已排队未兑现是什么意思)

12-18 0 阅读
人人影视正版下载安装(人人影视正式关闭)

人人影视正版下载安装(人人影视正式关闭)

12-18 0 阅读
中药苏木的功效与作用及禁忌(中药苏木的功效与作用)

中药苏木的功效与作用及禁忌(中药苏木的功效与作用)

12-18 0 阅读
支付宝好医保退保能退多少钱(好医保免费医疗金最高能领多少)

支付宝好医保退保能退多少钱(好医保免费医疗金最高能领多少)

03-11 0 阅读
热门推荐
lol转区在哪里申请(lol怎么转区申请)

lol转区在哪里申请(lol怎么转区申请)

12-18 0 阅读
嵊州拍婚纱照哪里好(拍婚纱照哪里好)

嵊州拍婚纱照哪里好(拍婚纱照哪里好)

12-18 0 阅读
汉字的起源及演变(汉字的来历 起源 演变)

汉字的起源及演变(汉字的来历 起源 演变)

12-19 0 阅读
西虹市属于哪个省份(西虹市在哪个省份)

西虹市属于哪个省份(西虹市在哪个省份)

12-18 0 阅读
安卓定位对方手机位置怎么弄(定位对方手机位置怎么弄)

安卓定位对方手机位置怎么弄(定位对方手机位置怎么弄)

12-18 0 阅读
产妇可以吃韭菜吗的短视频(产妇可以吃韭菜吗)

产妇可以吃韭菜吗的短视频(产妇可以吃韭菜吗)

12-19 0 阅读
谣言:Vivo xplay 5是第一款Spanddragon 810手机

谣言:Vivo xplay 5是第一款Spanddragon 810手机

12-18 0 阅读
生日蛋糕简笔画步骤(生日蛋糕简笔画)

生日蛋糕简笔画步骤(生日蛋糕简笔画)

12-18 0 阅读
长江音乐节(关于长江音乐节的介绍)

长江音乐节(关于长江音乐节的介绍)

12-19 0 阅读
吉林市民政局安丰广(吉林市民政局)

吉林市民政局安丰广(吉林市民政局)

11-13 0 阅读