当前位置:首页 > 新闻资讯 > IT业界 > 新闻
腾讯云ASR全新升级,多模态融合算法大幅提升准确率
  • 2024/1/10 9:30:19
  • 类型:转载
  • 来源:
  • 网站编辑:阿卡
【电脑报在线】近日,腾讯云宣布全面升级其语音识别(ASR)方案,基于大模型能力,复杂场景下的识别率提升了20%。

8d090fe4c0694627baa5be43e4b2ee29~noop.jpg

近日,腾讯云宣布全面升级其语音识别(ASR)方案,基于大模型能力,复杂场景下的识别率提升了20%。腾讯云ASR现已支持23种方言,采用业界首创的高性能引擎,并突破了现有ASR引擎的场景局限,可灵活应用于线下销售、下沉市场等场景。

通过自研多模态融合算法、蒸馏和半监督算法,腾讯云ASR强化了上下文理解能力,减少了语音数据的标记工作,提升了复杂识别环境的准确率。采用无监督学习,该方案加入大量未经标注的低资源数据,在垂类行业音频和方言音频上取得了重大突破。

如今,智能汽车普及、短视频配音、企业出海等趋势兴起,多语种、多方言的语音识别需求逐渐加大。腾讯云ASR采用了自研的高新技术,打造多项业界首创的高性能引擎,增强了ASR混合和识别能力。此外,还支持热词增强版、ASR情绪识别等多项业界首创功能,进一步改善了复杂音频和低信噪比识别效果。

升级后的腾讯云ASR不仅解决了现有ASR引擎在高并发和高可用性方面的局限,还在智能客服、语音输入法等应用场景展现出强大的灵活性和广泛性。各行业的音频都能获得相对高性能和准确地转写服务,助力企业提高效率、降低成本。在百应科技和KK键盘等场景中,腾讯云ASR的应用已取得了显著的成果。

展望未来,腾讯云将继续推动语音识别能力创新升级,助力更多应用场景将技术力价值转化为生产力价值,推动产业发展。