当前位置:首页 > 新闻资讯 > 科技生活 > 新闻
畅想未来:让每一部汽车都能听会说并不远
  • 2012-7-10 16:03:53
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:王诚
  • 作者:朱文利
【电脑报在线】李开复表示,多年前盖茨就说过语音会改变世界。为什么一直没有改变?“一是云计算还没有达到那么高的水平。第二我觉得语音在过去二三十年总是应用不知道在哪里。”李开复认为,仅靠一少批的语音专家想不出更多的应用解决方案,因为语音是人类最自然沟通的方式,人们一旦开始用语音跟机器交流了就会把手机、电脑等终端当成人,用户非常高的期望值给开发者带来很大的挑战。

     未来,每一部手机、汽车、家电、玩具都能听会说…… 

    “这并不遥远,也就2、3年。”3月下旬,在科大讯飞举办的语音开发者大会上,科大讯飞董事长刘庆峰博士对本报记者说。 

    值得注意的是,在这场语音开发者大会上,不仅引来1000多位开发者更有投资人和业界领袖的青睐,还有联想投资数千万元的鼎立支持,李开复的现身说法,共同表示语音合成技术将改变人们的收听方式。 

语音是人类最自然沟通方式

    李开复表示,多年前盖茨就说过语音会改变世界。为什么一直没有改变?“一是云计算还没有达到那么高的水平。第二我觉得语音在过去二三十年总是应用不知道在哪里。”李开复认为,仅靠一少批的语音专家想不出更多的应用解决方案,因为语音是人类最自然沟通的方式,人们一旦开始用语音跟机器交流了就会把手机、电脑等终端当成人,用户非常高的期望值给开发者带来很大的挑战。 

    很多人想到语音就想到语音识别,其实还有语音合成。刘庆峰认为语音识别是第一位,目前业内语音识别准确率已经达到90%以上。第二是语音合成,自然度超过真人发音水平,任何一篇文章拿来无论是汽车还是电视读出来都可以达到真人水平。 

    而具体到新一代“语音云”及“讯飞语点”这样的产品上,在语音合成、语音搜索、语音听写能力的基础上,加强了自然语言理解、个性化语音识别、个性化语音合成、声纹识别、口语评测等新特性,让语音应用迅速扩展到用户生活中。 

    最常用的语义理解,因为有语音云的支持,刘庆峰博士说讯飞语点平均响应时间为1.5秒。现场演示中,刘博士的指令,提醒会议、找餐馆等,手机正确理解4条,错误两条。而如果用户丢了手机,即使别人碰巧知道开机的语音密码,只要不是手机主人说出来,捡手机的人也打不开手机锁。此外,如果用户希望系统学习谁的声音,把这个目标放上去三个月到半年系统就可以标准播放。比如,新闻联播的画面,但是播音员的话音是你最喜欢的一个人的声音。 

各大公司发力语音技术

    越来越多的公司认为,语音合成技术将改变人们的收听方式。3月初微软亚洲研究院展示的最新成果中,也有一项“将单一语言的文语转化变为混合语言”项目,可利用一位说话人的单一语言录音合成出不同语言的训练语料库,以此构建统计模型的多语言的文语转换系统。 

    微软首席研究官里克?雷斯特使用这款软件,他说了一段英语,然后这款软件把这段话翻译成了西班牙语、意大利语和中文普通话播放了出来。而这三种语言的发音听起来非常像拉希德本人。 

    网友Elfei2012 分享了一个语音应用的故事:一个瑞士的老头和一个重庆的姑娘,一个不会说中文,一个不会说英语。但是,通过谷歌翻译,他们在一起了,现在,有了微软的文语转化,语言障碍,地域分隔,就更不再是问题。 

    对于电脑和手机上的语音应用,大众点评的语音搜索、知乎网站的语音问答,都有大量用户在体验,充分展示了应者云集。百度技术副总裁王劲在3月23日的百度开发者大会上,也透露百度的语音输入服务将在今年底推出,API将提供给开发者。 

    至于汽车能听会写,现有的语应系统结合导航软件,车主只要说导航到**地,就可以自动导航到目的地,开车时,还可以语音点播歌曲、说给某某打电话,自动拨电话、实现语音搜索。(本报记者 朱文利)

本文出自2012-06-25出版的《电脑报》第25期 A.新闻评论周刊
(网站编辑:admin)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交