不止Alexa和AWS,揭秘亚马逊人工智能发展史
2014 年,顶尖的机器学习专家延恩·勒昆(Yann LeCun)在内部会议上为亚马逊的科学家们做了一次讲座。在他被邀请参加此次活动以及活动举行之间,勒昆接受了Facebook的职位邀请,但他还是来到了亚马逊的活动现场。勒昆回忆,在一个大约可容纳 600 人的礼堂里,他发表了演讲。随后他被领进一间会议室,不同的小组一个接一个进来,向他提问。然而当勒昆向他们提问时,这些人的反应都很迟钝。这让他感觉不好。他最终选择Facebook的职位部分也是因为,Facebook同意将人工智能团队的很大一部分工作开源。 由于缺乏内部人才,亚马逊动用强大的财力去收购具有这方面专业性的公司。利普表示:“在Alexa的发展早期,我们收购了许多公司。” 2011 年 9 月,亚马逊收购了语音转文本技术公司Yap。该公司擅长于将语音转换为文字。 2012 年,亚马逊又将来自英国剑桥的Evi收入麾下。该公司的软件可以像Siri一样对语音命令做出响应。 2013 年 1 月,亚马逊再次收购一家语音转文本技术公司,即来自波兰的Ivona。该公司的技术可以让Echo获得交谈能力。 然而,亚马逊的保密文化仍然不利于顶尖人才的加盟。埃里克斯·斯莫拉(Alex Smola)曾是亚马逊的招聘候选人之一。他是行业明星,曾供职于雅虎和谷歌。AWS深度学习和人工智能总经理马特·伍德(Matt Wood)表示:“他实际上是深度学习的教父之一。”(谷歌学术搜索上列出了 9 万多篇引用斯莫拉成果的论文。)亚马逊高管甚至不愿向候选人透露他们未来的工作内容。斯莫拉拒绝了亚马逊的邀请,选择去带领卡耐基梅隆大学的一所实验室。 林赛说:“甚至是在我们即将启动之前,还是有许多阻力。他们会说,‘为什么我要去亚马逊工作?我对卖别人东西不感兴趣。’” 亚马逊也有自己的办法。由于该公司从想象中的最终产品去反推,所以蓝图中包括许多尚未发明出来的功能。这些棘手的问题对雄心勃勃的科学家极具吸引力。语音功能需要一定水平的会话式人工智能,包括“唤醒词”(嘿,Alexa!)、监听和解释命令,给出合理的答案。这一切都不存在。 即使亚马逊没有给出任何细节,这个项目也吸引了罗希特·普拉萨德(Rohit Prasad)。普拉萨德是一名受到广泛认可的语音识别科学家,来自波士顿的技术承包商雷神BBN。(亚马逊也因此让他在自己老家组建一支团队。)他认为,亚马逊相关专业能力的缺乏是系统性问题,而不仅仅是小缺陷。他指出:“这里是一片空白。谷歌和微软开发语音技术已经有几年时间。在亚马逊,我们从头开始去开发,去解决困难的问题。”在 2013 年加入之后,他就被分配至Alexa项目。他表示:“设备用硬件来实现,但语音技术在很早就已经起步。” Echo项目中最棘手的部分在于远距离语音识别。为了解决这个问题,亚马逊被迫涉足新领域,并推动了机器学习整体的发展。远距离语音识别是指在一定距离远处识别语音,这样的语音命令可能被淹没在环境噪声中。挑战之一是,设备不能浪费一丁点时间去思考你究竟说的是什么。它必须把音频内容即时发送至云端,并迅速获得答案,给用户的感觉就是实时对话,而不会出现令人尴尬的冷场。开发机器学习系统,在嘈杂环境中理解并响应用户的语音命令,这需要大量数据,即用户与Echo互动的大量此类案例。当时并不清楚,亚马逊要从何处获得这样的数据。 作为亚马逊设备和服务副总裁的利普表示,远距离技术此前已经被实现,但当时是用在三叉戟潜艇的鼻锥上,研发耗资达到 10 亿美元。亚马逊希望将这种技术集成至一个可以放在厨房台面上的设备中,而价格必须足够便宜,从而吸引用户的购买。普拉萨德表示:“在我的团队中,90%的人都认为这根本做不到。在亚马逊以外,我们也有技术咨询委员会。我们没有告诉他们具体要做什么。但他们总是对我们提起,‘不管做什么,都不要碰远距离识别技术。’” (编辑:惠州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |