北京捷通华声科技股分无限公司——全方位野生智能手艺与办事供给商

北京捷通华声科技股分无限公司——全方位野生智能手艺与办事供给商

产物静态NEWS

北京捷通华声科技股分无限公司——全方位野生智能手艺与办事供给商

捷通华声灵云语音质检体系——深度神经收集的新利用

 宣布于:2015-03-21 19:35   阅读:
        媒介:深度神经收集(DNN)是近几年在财产界和学术界新型的一个机械进修范畴的热门话题。DNN算法胜利的将以往的智能辨认率前进了一个较着的层次,能够极大地前进图象、语音辨认的切确度,能够更快地鞭策智强人机交互(HCI)手艺的前进。
 

        自DNN成长以来,该手艺已胜利利用于语音辨认手艺范畴,并取得很好的成果,在挪动互联网中已完成遍及利用。近一年来,陪同语音质检体系在各在呼唤中间取得愈来愈广的正视,捷通华声经由过程与清华大学协作,胜利将深度神经收集利用到灵云语音质检阐发体系中,增进语音转写辨认率到达合用化程度,从而使语音质检品质与效力取得大幅晋升。
 

        深度进修神经收集是机械进修研讨中的一个新的范畴,其念头在于成立、摹拟人脑停止阐发进修的神经收集,它仿照人脑的机制来诠释数据,比方图象,声响和文本。2010年,微软雷德蒙研讨院发明深层收集可较着前进语音辨认的精度。尔后,微软亚洲研讨院在测试中发明利用DNN的语音辨认模子辨认毛病率比最低毛病率下降了33%之多,即相对辨认率晋升了6.6%。
 

        “使成果发生天翻地覆变更的是DNN,经由过程利用DNN,在平常对话中,最多能够使单词辨认毛病率比之前下降42%。这象征着,以往10个毛病,有4个能用这类体例处理。这是自HMM(隐马尔科夫模子)呈现以来,单项手艺使语音辨认切确度取得的最大晋升”,微软亚洲研讨院研讨员Frank Seide诠释道。
 
        较着,比起传统的夹杂高斯模子(GMM),DNN在辨认精度上具备相称的上风。
 

        在接纳了最早进的第4代深度神经收集算法后,捷通华声灵云语音辨认的通用语音辨认率到达93%以上,定制模子的辨认率到达97%以上,各项目标已到达国际最好水准。但是,在对其余声源的辨认才能上DNN是不是会有所冲破呢?2013年,捷通华声与清华大学协作,起头在灵云语音质检体系上利用DNN手艺。该体系以辨认“德律风通道语音”为焦点,将通话灌音中的语音信息提掏出来,经由过程灵云语音辨认转换成文本保管在体系中,再经由过程提取关头词、静音检测、情感检测、语速检测等体例对语音停止挑选阐发,从而得出质检成果。经由过程灵云语音质检体系,能够赞助客户将客服灌音数据停止各类阐发,从而针对性地改良呼唤中间的办事品质。此中除对企业本身呼唤中间质检以外,这套体系还能够为企业阐发客户的反映定见,跟踪泛博用户的热门题目,从而对公司的产物和办事提出优化倡议,完成加倍精准的市场决议计划。是以,“德律风通道语音”辨认的精度越高象征着语音质检的效力越高、客户休会越好。在利用DNN以后,客户遍及反映灵云语音质检的品质和效力已有较着的晋升,证实了DNN在多声源辨认中的合用才能。
 

        DNN的炽热虽早已引发语音企业的正视,而图象是DNN最早测验考试的利用范畴——它已使YouTube的视频分类前进了70%的切确率。而刚好图象辨认又是灵云的另外一条主打产物线:灵云智能图象。在语音辨认和DNN发生化学反映后,咱们有来由等候灵云智能图象辨认&DNN在票证、车牌、人脸等图象辨认范畴的更新的表现。
 

        捷通华声在语音辨认、图象辨认等手艺范畴周全利用DNN,取得了清华大学的大力撑持。2013年,清华大学财产基金入资捷通华声,成为捷通华声第二大股东,也是以成立了捷通华声与清华大学的计谋协作干系,并取得清华大学HCI范畴中壮大科研气力的撑持。捷通华声凭仗本身在智能语音、智能图象、天然说话懂得等手艺范畴的手艺堆集,与清华大学HCI手艺各范畴尝试室、专家传授成立起连系研讨机制,为持久成长HCI手艺奠基了坚固的根本。
 

        捷通华声这次与清华大学在DNN范畴的胜利协作,也标示清华大学在HCI手艺范畴的薄弱科研气力经由过程与市场需要的慎密连系,起头周全办事社会。将来成长,捷通华声将发挥清华大学在国度科技前进、公民经济扶植中的壮大鞭策力与影响力,周全推动灵云成长计谋,增进晋升清华大学HCI手艺在财产中的影响力,助力清华大学构建“学术超前、科研抢先、财产化推行最强”的带领位置,从而配合完成“灵云科技 源自清华办事环球”的计谋成长计划,为中国HCI财产化成长做出更大的进献。
 

        更多信息,请阅读灵云开辟平台: