融合多项智能应用,基于灵云平台构建人工智能生态

企业网 中字

在人工智能领域,场景应用、平台建设是并行的,如何打通多项AI能力,提供融合的智能服务,对国内AI企业提出了挑战。捷通华声作为国内人工智能产业的开拓者与领导者,早在2011年就推出了全球首个全方位人工智能平台——灵云(AIcloud.com)。该平台融合智能语音、智能图像、生物特征识别、智能语义等12项人工智能技术,并面向产业全面开放。为此,作为中国软件网策划的“2018中国AI应用、平台与生态”系列专访第二期,我们采访了捷通华声总经理武卫东,跟他聊一聊人智能应用和人工智能开放平台的发展逻辑,以及捷通华声的一些实践经验。

深化应用、构建平台,是人工智能厂商的未来

根据中国软件网《2017中国AI应用、平台与生态洞见报告》中调研数据显示,38%的人认为我国人工智能产业目前处于应用扩展、平台建设阶段;33%的人认为我国人工智能产业已经进入平台竞争、生态建设阶段。可见,大部分人都认为我国正在进行AI平台和生态建设。值得提出的是,应用落地和平台、生态建设是同步并举,人工智能厂商之间的竞争将在多个维度同时进行。要建成完善的AI平台和生态,预计还有5~10年时间。

武卫东认为,通过构建人工智能开放平台的方式,深化行业应用、聚集合作伙伴,进而构建人工智能产业生态是捷通华声重要的战略布局。捷通华声在这方面很早就进行了积极的探索,2011年,捷通华声的灵云平台就面向产业全面开放,并以“云 + 端”方式,为产业界提供语音合成(TTS)、语音识别(ASR)、麦克风阵列(SMA)、语音唤醒(VW)、手写识别(HWR)、光学字符识别(OCR)、人脸识别(AFR)、声纹识别(VPR)、指纹识别(FPR)、自然语言理解(NLU)、数据挖掘(DM)、机器翻译(MT)等全方位人工智能能力。通过将其积累的人工智能技术开放出来,捷通华声积累了众多的合作伙伴,并服务大量的行业客户。

融合多项智能应用,打通整个智能产业链条

武卫东指出,目前人工智能厂商大多提供单一的智能服务,比如语音识别、图像识别等,多项智能应用的融合度不高。但是就市场需求来看,用户想要的往往是多项智能服务,并且这些不同领域的智能应用要很好的融合,形成完善的解决方案。

捷通华声作为在智能语音领域领先的厂商,其能力不仅局限于语音领域,已经扩展到智能图像、智能语义、生物特征识别等领域。具体来看,捷通华声提供的智能服务包括:

智能语音领域,捷通华声能具备正确率为97%以上的语音识别能力,并能实现21种语言的语音合成服务,以及语义理解能力。另外,捷通华声还提供独具特色的声纹识别应用,可以根据说话人的语音特征,提供声纹鉴别和声纹确认,并作为生物特征识别的重要手段;

智能图像领域,捷通华声提供的OCR服务,除了支持识别汉语、英语之外,还支持维语、蒙语、藏语、朝鲜语、哈萨克、彝族等多种少数民族语言的识别。更进一步的,捷通华声具备手写识别能力,能将手写字迹转化成文本,识别准确率在99.9%以上。此外,捷通华声还支持人脸识别和指纹识别应用。

值得提出的是,捷通华声通过灵云平台来提供这些智能应用,致力于实现不同种类智能服务的融合,而不是简单的产品堆砌。在武卫东看来,单项智能的局限性较大,未来必然是多项智能的高度融合。为此,捷通华声突出全方位人工智能的能力建设,并以灵云平台为载体,向开发者、合作伙伴开放出来,共同赋能整个智能生态的发展。

声明: 本文系OFweek根据授权转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存