智器械(公众号:zhidxcom)
文 | Lina

智器械12月2日消息,上周,百度推出了一款新的语音辨认模型——全名叫“基于双数CNN搜集的语音加强和声学建模一体化的端到端语音辨认模型”,并推出了三款基于百度鸿鹄语音芯片的硬件模组及开辟板,和基于智能家居、智能车载、智能IoT设备这三大年夜场景的行业处理筹划(百度推新款语音辨认模型,精确率飙升30%,还有三款AI语音芯片模组

对话百度贾磊/喻友平:深度进修正往跨范畴融合高速生长

▲百度AI技巧生态部总经理喻友平、百度语音首席架构师贾磊

▲百度AI技巧生态部总经理喻友平、百度语音首席架构师贾磊

发布会当天,智器械与多数媒体一同对百度语音首席架构师贾磊、百度AI技巧生态部总经理喻友平停止了专访。贾磊告诉智器械,深度进修的下一步偏向就是这类跨范畴融合的技巧,今朝深度进修的端到端、跨学科整合方面正在快速生长,赓续对已有学科停止着颠覆。

一、深度进修的下一步:跨范畴融合

传统远场语音交互技巧,起重要对声响停止数字旌旗灯号处理(旌旗灯号加强、波束生成等),接着再对其停止语音辨认,触及数字旌旗灯号处理和语音辨认这两大年夜学科。

而百度新推出的基于双数CNN搜集的语音加强和声学建模一体化的端到端语音辨认模型则打破了上述传统流程,以一套深度进修模型代替全部流程。体系直接输入多路麦克风旌旗灯号,输入目标语音文字,不须要任何声学先验知识。

在采访中,贾磊告诉智器械,百度这款新模型在语音辨认过程当中就引入了语义懂得技巧,对声学与说话停止一体化的建模。

针对以后业内存在的“深度进修能否碰到技巧创新平台期成绩?”,贾磊认为以后深度进修还在快速生长傍边,深度进修的下一步偏向就是这类跨范畴融合的技巧,今朝深度进修的端到端、跨学科整合方面正在快速生长。

2、AI芯片核心思念:软件驱动芯片设计

在发布会现场,百度AI技巧生态部总经理喻友平还推出了三款基于百度鸿鹄语音芯片的硬件模组及开辟板。

对话百度贾磊/喻友平:深度进修正往跨范畴融合高速生长

百度的这款新模型搭配百度鸿鹄语音芯片,可以或许将语音辨认精确率进步30%以上。而即使设备没有搭载百度公用的鸿鹄语音芯片,而是搭载其他传统ARM芯片,这套新模型也能让远场语音辨认、初次唤醒精确率大年夜幅晋升。

贾磊告诉智器械,百度作为互联网巨擘,进军AI芯片的核心思念是以软件驱动芯片设计。市情上现有的传统芯片其实不合适公用的低功耗AI语音计算。

举个例子,如今支撑语音唤醒与识其他Arm架构芯片运转功率广泛在1W以上,难以满足家电产品的超低功耗需求。而今朝百度鸿鹄芯片的待机功率在100mW以下,满负荷运载功率在200mW以下,是极多数功耗可以或许符合国度3C认证标准的芯片,可以搭载在电视等家电产品中。

3、AI开放平台已完成范围营收,“增速很快”

喻友平说,百度大年夜脑开放平台今朝是国际办事范围最大年夜的AI开放平台,有228项开放的技巧才能,同时也办事着全国最大年夜群里的AI开辟者——逾越150万人,个中90%!95%以上是企业用户。

喻友平告诉智器械,以后,百度大年夜脑经过过程平台化的方法为企业供给AI技巧与处理筹划,今朝曾经完成了范围化的营收,并且营收增速异常快。

以后,百度大年夜脑所开放的AI技巧在公司集团外部具有着广泛的应用处景,比如百度地图、百度输入法等等。喻友平表示,外部有广泛应用使得百度可以或许对AI技巧停止打磨与积聚,在这个过程当中把愈来愈多的AI应用处景打造得加倍符合外部企业的需求,开放给各类厂商。