办事指南

机器人Asimo可以同时理解三种声音

点击量:   时间:2017-12-23 02:02:02

科林巴拉斯(图片来源:IEEE)先进的人形机器人阿西莫刚刚获得了一个新的超级大国 - 它可以理解三个人同时大喊大叫目前,修改过的Asimo的新能力被用来判断石头剪刀比赛,其中有三个人一次叫出他们的选择但是,声音的数量和软件可以处理的句子的复杂性将来会增长京都大学的Hiroshi Okuno和日本的埼玉本田研究所的Kazuhiro Nakadai设计了新的软件,他们称之为HARK HARK使用八个麦克风阵列来计算每个声音的来源,并将其与其他声源隔离然后,该软件计算出在将单个语音传递到语音识别软件上进行解码之前,它是如何可靠地提取单个语音的质量控制步骤很重要其他声音可能会混淆语音识别软件因此,当将每个语音的补丁记录传递到语音识别系统时,声音文件中包含大量频率的大量背景噪声的任何部分都会被自动忽略 Okuno告诉“新科学家”杂志说,HARK系统实际上超越了正常的人类听力能力 “它可以同时收听几件事情,而不只是专注于一个特定的单一声源”虽然关注多个声音中的单个声音被称为“鸡尾酒派对效应”,Okuno称其能够专注于多个声音曾经是“圣德太子效应” “根据日本的传说,圣德太子同时听取了10人的请愿,”他说尽管HARK软件还不能同时理解10种声音,但Okuno和Nakadai表示,当安装在本田的Asimo机器人上时,它可以跟随三名玩家同时以70%到80%的准确度进行调用八个麦克风的阵列放置在Asimo的脸部和身体周围,这有助于它准确地检测和隔离同时的声音 Nakadai说:“声源数量及其方向不会提前提供给系统”英国谢菲尔德大学的Guy Brown对这项工作印象深刻,尽管他指出它主要是用现有的处理声音的元素构建的,比如获得一系列麦克风来定位声音,并使用自动化软件阻止录音中难以理解的部分 “主要的成就是将这项技术嵌入到机器人中,并使其全部以实时,互动的方式工作,”布朗说摇滚剪刀使用小词汇,使任务更容易 “显然,我们还有很长的路要走才能在'鸡尾酒会'的情况下与人类听众的表现相匹配,”他说事实上,当Okuno和Nakadai尝试使用他们的软件同时遵循几个复杂的句子时,由于三个人大喊餐馆订单,它只能识别30%到40%的内容德国海德堡Ruprecht-Karl大学的Alexander Gutschalk在处理鸡尾酒会效应时刚刚开展了大脑活动研究之一,并表示神经科学家和机器人专家之间的未来合作可以使机器人成为更好的派对会话者 Okuno和Nakadai上个月在加利福尼亚州帕萨迪纳举行的2008年IEEE机器人与自动化国际会议上展示了他们的工作机器人 - 在我们不断更新的特别报告中了解有关机器人革命的更多信息更多关于这些主题: