AI语音芯片比拼“耐力”?
诸候争霸之下AI语音芯片初创企业如何走出进化路径?

AI芯片一直在经历落地的阵痛。

即使面向已有大量需求的图像识别和语音识别AI芯片,也同样要在不同应用中破除算法、数据、应用场景的壁垒,才能加以成全。而随着应用的深入,角逐其中的玩家还要在不断的迭代中持续进化,以形成闭环,加速落地。正如北京探境科技有限公司创始人兼CEO鲁勇所言,AI芯片像马拉松长跑,比的是耐力,而不是冲刺速度。在这场比赛中,不是要看谁跑得快,而是要看谁有潜力到达终点,谁在中途不走岔路。

多方角力

这显然是一场“马拉松”。随着市场局面渐次打开,各数势力的纷至沓来,欲在市场格局未定之际占据先机

而四种主流势力亦在各较短长。互联网和通信类巨头的长处在于数据和场景的支持,以及足够的资金和人才;成熟芯片设计公司在成本控制、芯片定义、供应链管理、渠道方面优势明显;初创芯片公司在芯片前沿架构和定制化方面可轻装前进;算法及方案公司在整合芯片下游算法和应用方案上具有优势。

虽然,先期AI语音芯片在集成方式、功能定位方面存在不同策略,但从通用走向专用的趋势已然明了,即无论是CPU直接进行AI算法加速、还是DSP+NN模块的方式,以及针对语音识别设计的AISC芯片,在灵活性及模型支持、成本、功耗等综合指标来看,未来通用型AI芯片将成为主流产品。

于是乎,在专用AI芯片的赛道上,各种“架构热”兴起,但无论是存内计算、模拟计算、光计算、类脑等,确实各有差异,但对于初创公司来说,若仅是采用“专用架构”已然没有太高的门槛,终级比拼的不仅是工程能力和客户能力的全面考验,还有持续迭代和进化的能力。

毕竟,以往规模的确很重要,但到今天可能更重要的不是规模,而是变化速度。

新进化

而在年中发布音旋风611以来,出货已趋百万级,这对于成立仅两年多的探境而言,殊为不易。而拿到越进下一阶竞争的“门票”之后,探境持续发力,在12月底一举发布了由低功耗系列、主打系列、旗舰系列组成的3大系列、6颗AI芯片组成的产品矩阵,包括首个离在线一体的语音识别解决方案以及具备AI双麦降噪功能的语音识别方案。

“组合拳”式的产品矩阵凸显出的是探境在算法和算力“接场景地气”的革新。 要知道,落地问题就是解决场景挑战问题。在实战演练中,探境科技副总裁李同治认为,智能家居应用的语音控制技术层面仍面临诸多挑战,包括由于高噪声、远场识别环境造成低信噪比情况,由于非稳态噪声对于降噪算法产生影响,以及在语音识别期间同时播放电视剧、音乐造成的多声源问题。

对此,探境科技采取的方式是各个击破。李同治介绍,完整的语音识别链路可分为麦克风输入、降噪处理、语音识别、识别结果输入四个环节。首当其冲要在降噪算法处理上下工夫。探境通过自研基于深度学习的AI降噪算法,不仅能够处理稳态的噪声,对一些非稳态的噪声和突发性的噪声也可高效过滤。而在降噪之后的语音识别环节,探境采用新型高计算强度神经网络HONN(High Operation Neural Network),其算法参数只是传统DNN算法的1/5,但算力却超过几百兆,远超DNN表现。实测结果显示,在信噪比大于10dB和5-10dB的环境中,HONN命令词识别准确率的提升分别为2%和10%。

但应用场景还有更严苛的情况,即0dB和负dB。为了提升这些场景下的识别率,还需要使用麦克风阵列。探境在双麦算法上也祭出了自己的独门绝技——频域复数子空间投影FCSP。 “这一算法克服了麦克风阵列的诸多缺点,通过采用一套基于深度学习的AI算法做信号增强,并将处理算法的参数和神经网络一起训练,整体优化之后抗噪性更强,并降低最后的识别错误率。”李同治指出。据测算在信噪比为0dB时,相对于传统的处理算法,FCSP相对识别错误率降低超过20%。

有了上述算法的“三大金刚”,探境的语音算法实现了跨越式的升级。然而,算法还需要在芯片载体上才能“发挥”实力。针对 AI 芯片存储墙难题,探境科技自主研了存储优先的SFA架构,解决了与数据和存储相关的带宽瓶颈、功耗瓶颈问题,具备高能效比和强通用性,相比其它“类CPU架构”可获得8~12倍的利用率收益。

SFA架构,使得算法与算力的最佳匹配层面“再上层楼”。有了软硬件的“加持”,探境还深知,提供芯片、算法、工具链等一站式整体方案才是进取之道。作为首款通用型芯片,可支持所有已知的神经网络,对数据类型也没有限制。另外,探境提供的工具链可以为零基础的客户使用,实现云侧端侧的无缝迁移,精度无损,大幅节约开发时间。

通过软硬一体的优化,在能效、成本、易用性、开发性整体提升的优势,探境最终在市场赢得了热烈的“掌声”。

未来进阶

而通过算法和算力的“双重”迭代,探境的耐力再度得到打磨,未来战略全景图也再次浮出水面。

鲁勇提及,一方面,语音AI芯片将持续迭化优化,未来探境还将语音芯片进行高维升级,推出更多在线离线一体化方案。另一方面,探境已把触角伸到了下一个红利市场——图像识别。探境的图像芯片在2019年Q4已流片成功,核心能效比IPS/W高达800,在某些领域已产生营收,未来将瞄准工业视觉、新零售、安防、辅助驾驶等市场开拓。

在端侧取得初步成果之后,探境的目光也向“云端”延伸。鲁勇透露,SFA架构打造的AI芯片具备强通用性,不仅适用于端侧,在云端也可适用于推理、训练。探境的云端 AI 芯片已提上日程,将于2021年推出。

“AI芯片蛋糕非常大,探境希望可以联合上下游一起,开放SDK和工具链,持续构建生态,与大量的合作伙伴一起落地更多的场景开发,从中一起创造价值。”鲁勇从共生的角度解读探境的价值网络。

正所谓商场如战场,而不同位置的企业,有不同的生死线;谋不同的位置,要有对应的资源配置和作战姿势。冲锋中的探境正全面出击,在激活存量、探索增量上努力求索。存量是核心的语音芯片业务,力求做穿做透;在这一基础上超越原有核心业务,找到新的增量即图像识别以及云端芯片。在AI芯片长久的耐力赛中,探境的潜能已然激发,更待兑现。

版权所有:北京探境科技有限公司 | 京ICP备18001236号