腾讯云ASR全新升级，多模态融合算法大幅提升准确率

【电脑报在线】近日，腾讯云宣布全面升级其语音识别(ASR)方案，基于大模型能力，复杂场景下的识别率提升了20%。

8d090fe4c0694627baa5be43e4b2ee29~noop.jpg

近日，腾讯云宣布全面升级其语音识别(ASR)方案，基于大模型能力，复杂场景下的识别率提升了20%。腾讯云ASR现已支持23种方言，采用业界首创的高性能引擎，并突破了现有ASR引擎的场景局限，可灵活应用于线下销售、下沉市场等场景。

通过自研多模态融合算法、蒸馏和半监督算法，腾讯云ASR强化了上下文理解能力，减少了语音数据的标记工作，提升了复杂识别环境的准确率。采用无监督学习，该方案加入大量未经标注的低资源数据，在垂类行业音频和方言音频上取得了重大突破。

如今，智能汽车普及、短视频配音、企业出海等趋势兴起，多语种、多方言的语音识别需求逐渐加大。腾讯云ASR采用了自研的高新技术，打造多项业界首创的高性能引擎，增强了ASR混合和识别能力。此外，还支持热词增强版、ASR情绪识别等多项业界首创功能，进一步改善了复杂音频和低信噪比识别效果。

升级后的腾讯云ASR不仅解决了现有ASR引擎在高并发和高可用性方面的局限，还在智能客服、语音输入法等应用场景展现出强大的灵活性和广泛性。各行业的音频都能获得相对高性能和准确地转写服务，助力企业提高效率、降低成本。在百应科技和KK键盘等场景中，腾讯云ASR的应用已取得了显著的成果。

展望未来，腾讯云将继续推动语音识别能力创新升级，助力更多应用场景将技术力价值转化为生产力价值，推动产业发展。

读者活动

48小时点击排行

编辑推荐

论坛热帖