- 2012-7-10 16:03:53
- 类型:原创
- 来源:电脑报
- 报纸编辑:王诚
- 作者:朱文利
未来,每一部手机、汽车、家电、玩具都能听会说……
“这并不遥远,也就2、3年。”3月下旬,在科大讯飞举办的语音开发者大会上,科大讯飞董事长刘庆峰博士对本报记者说。
值得注意的是,在这场语音开发者大会上,不仅引来1000多位开发者更有投资人和业界领袖的青睐,还有联想投资数千万元的鼎立支持,李开复的现身说法,共同表示语音合成技术将改变人们的收听方式。
语音是人类最自然沟通方式
李开复表示,多年前盖茨就说过语音会改变世界。为什么一直没有改变?“一是云计算还没有达到那么高的水平。第二我觉得语音在过去二三十年总是应用不知道在哪里。”李开复认为,仅靠一少批的语音专家想不出更多的应用解决方案,因为语音是人类最自然沟通的方式,人们一旦开始用语音跟机器交流了就会把手机、电脑等终端当成人,用户非常高的期望值给开发者带来很大的挑战。
很多人想到语音就想到语音识别,其实还有语音合成。刘庆峰认为语音识别是第一位,目前业内语音识别准确率已经达到90%以上。第二是语音合成,自然度超过真人发音水平,任何一篇文章拿来无论是汽车还是电视读出来都可以达到真人水平。
而具体到新一代“语音云”及“讯飞语点”这样的产品上,在语音合成、语音搜索、语音听写能力的基础上,加强了自然语言理解、个性化语音识别、个性化语音合成、声纹识别、口语评测等新特性,让语音应用迅速扩展到用户生活中。
最常用的语义理解,因为有语音云的支持,刘庆峰博士说讯飞语点平均响应时间为1.5秒。现场演示中,刘博士的指令,提醒会议、找餐馆等,手机正确理解4条,错误两条。而如果用户丢了手机,即使别人碰巧知道开机的语音密码,只要不是手机主人说出来,捡手机的人也打不开手机锁。此外,如果用户希望系统学习谁的声音,把这个目标放上去三个月到半年系统就可以标准播放。比如,新闻联播的画面,但是播音员的话音是你最喜欢的一个人的声音。
各大公司发力语音技术
越来越多的公司认为,语音合成技术将改变人们的收听方式。3月初微软亚洲研究院展示的最新成果中,也有一项“将单一语言的文语转化变为混合语言”项目,可利用一位说话人的单一语言录音合成出不同语言的训练语料库,以此构建统计模型的多语言的文语转换系统。
微软首席研究官里克?雷斯特使用这款软件,他说了一段英语,然后这款软件把这段话翻译成了西班牙语、意大利语和中文普通话播放了出来。而这三种语言的发音听起来非常像拉希德本人。
网友Elfei2012 分享了一个语音应用的故事:一个瑞士的老头和一个重庆的姑娘,一个不会说中文,一个不会说英语。但是,通过谷歌翻译,他们在一起了,现在,有了微软的文语转化,语言障碍,地域分隔,就更不再是问题。
对于电脑和手机上的语音应用,大众点评的语音搜索、知乎网站的语音问答,都有大量用户在体验,充分展示了应者云集。百度技术副总裁王劲在3月23日的百度开发者大会上,也透露百度的语音输入服务将在今年底推出,API将提供给开发者。
至于汽车能听会写,现有的语应系统结合导航软件,车主只要说导航到**地,就可以自动导航到目的地,开车时,还可以语音点播歌曲、说给某某打电话,自动拨电话、实现语音搜索。(本报记者 朱文利)
报纸客服电话:4006677866 报纸客服信箱:pcw-advice@vip.sin*.c*m 友情链接与合作:987349267(QQ) 广告与活动:675009(QQ) 网站联系信箱:cpcw@cpcw*.c*m
Copyright © 2006-2011 电脑报官方网站 版权所有 渝ICP备10009040号