讯飞输入法创始人:从一个Demo到4亿用户,我的一些思考和努力
但是为什么我们敢往这个方向持续去投入呢?那是因为,原来的语音输入在技术上还是一种传统的在本地的过程。所以IBM的语音输入之所以没有流行开,除了电脑上的键盘、鼠标交互过于强势之外,还有就是因为它是一个本地的方式。它的技术进化速度,没有和使用群体规模的增长产生我们称之为“涟漪效应”的关系。 那什么叫“涟漪效应”?简单解释一下就是,当我们把一项技术初期推出去的时候,可能它并不是一项在大面积上都能达到完全使用水平的。但是,它仍然会接触到一小部分用户。 对于这一小部分用户来说,如果我们能够快速地到达他们,而且如果系统能够基于这部分用户的反馈形成数据。我们据此再形成一个二轮的迭代,马上就会有第二滴水滴下来,涟漪就会进一步地放大。它的适用群体的范围就会比初期的有所增长。而这样的一个过程,我们如果持续地去强化它,就是“涟漪效应”。 从技术角度来解释,其实我们的架构本身就是基于云计算去实现的。所有的技术更新,算法更新,还有资源更新,全都是在服务端无缝地完成的。所以,这首先它是在迭代的机制上,保证了不需要有一个很长的过程。 另外一方面就是,语音的这个算法现在是用大数据的方式再加上模式识别的训练,其实在几年前我们还是用传统的训练方式,现在都用深度神经网络的训练。所以,这样的数据越多,它的效果进化地越好。所以我们是以这样一个循环的方式去做的。 我们当时对语音的核心指标,比如识别率,有一个技术上的预判。随着用户的量级到了一定的规模,我们整个的语音识别效果是很快可以达到一个使用门槛的,甚至将来会达到完全可用的水平。 所以,基于对市场的把握还有对于设备形态和输入演进的判断,还有对于我们自有技术的分析,我们的产品推向市场的切入点和核心的定位就放到了语音输入上。 事实上,我们第一版推出的时候,我们的名字就叫讯飞语音输入法。当然我们不是只有语音输入法,我们还包含了手写输入和拼音输入。但是为了强化我们产品的定位,我们其实用了很长一段时间讯飞语音输入法这个名字。 我们在2010年的10月28号的时候,对外正式推出了第一个版本,主打的功能就是语音输入。 推出来之后,初期我们的语音用户,确实很多就是一些在电脑时代尝试过语音输入的用户,用过IBM的那个电脑单机版语音产品的用户。另外有一些是对于科技比较感兴趣的用户,这与我们之前预期的非常一致。 虽然我们初期的效果比起现在的水平是差很多,但是这些用户仍然会非常积极地使用,并且给我们提出了各种各样的改进意见。这些用户在圈子里的传播的速度也是非常的快。 所以,整个这个语音输入的品牌,在一个很小的群体里沉淀下来的。而且也很高兴看到就是,我们对整个行业的判断是正确的,特别是苹果发布了Siri之后。虽然它不解决输入问题,但它其实在行业里是点了一把有关语音技术的火。 然后,接下来我们就看到了,2010年讯飞推出语音输入法的时候是市场上独一份,短短的几年时间,各大输入法,像google、qq、百度、搜狗,陆续地标配了语音输入的功能。通过这一点,就说明现在对于语音输入,我们认为它已经是手机上标配的一种输入方式。 接下来还要面临的一个问题是,我们定位的这个产品方向很可能最后变成一个标配的产品,因为大家可能都看好这一点。 (编辑:惠州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |