其乐融融的IT技术小站

标签:语音识别

语音识别

语音识别的发展之路要怎么走

2

其乐融融 发布于 2023/10/28 02:30:46

目前,语音交互赛道已汇集了互联网巨头、知名硬件企业、电商平台、传统家电厂商以及各类人工智能初创公司,特别是近几年以智能音箱为代表的语音交互产品在国内外的火爆,极大地激发了语音交互技术的应用和发展。

阅读()评论(0)赞 ()

语音识别

AI智能语音识别算法 下篇

10

其乐融融 发布于 2023/10/27 02:30:36

 [[397599]]一、神经网络当前常用的语音识别框架如下图其背后的逻辑是在特征提取时采用的神经网络里面的DNN技术DNN技术可以分为两种,一种是CNN模型,一种是RNN模型二、解码器

阅读()评论(0)赞 ()

语音识别

AI智能语音识别算法 上篇

4

其乐融融 发布于 2023/10/27 02:30:33

 [[397592]]一、声源定位1、电扫阵列当系统扫描到输出信号功率最大时所对应的波束方向就是认为是声源的DOA方向,从而可以声源定位。电扫阵列的方式存在一定的局限,仅仅适用于

阅读()评论(0)赞 ()

语音识别

如何三步搭建一套声纹系统

6

其乐融融 发布于 2023/10/27 02:30:29

声纹检索,顾名思义就是说话人识别,通过声音来验证或者识别说话人的声音。声纹识别的关键步骤就是声音向量化,将说话人的声音将其转化成结构化的向量。阿里云AnalyticDB向量版,提供了一套声纹验证检索的解决方案。用户只需要使用简单的几条SQL命令,三步之内就可以搭建一套高精度的声纹检索验证服务。

阅读()评论(0)赞 ()

语音识别

基于Transformer的高效、低延时、流式语音识别模型

12

其乐融融 发布于 2023/10/27 02:30:18

微软 Azure 语音团队与微软亚洲研究院的研究员们一起提出了一套结合 Transformer 家族的编码器和流式 Transducer 框架的解决方案,并提出了 Mask is all you need 的方法对模型进行快速训练以及解码,让 Transformer 模型能够在普通的计算设备上进行快速的语音识别。

阅读()评论(0)赞 ()

语音识别

2021年中国AI语音识别行业市场现状与发展前景分析

5

其乐融融 发布于 2023/10/26 02:30:31

语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令的能力。随着语音技术与智能手机、平板电脑等电子产品芯片集成的深入发展,用户交互体验水平将得到大幅提升,用户认知和习惯得以培养,中国智能语音市场规模将会继续保持稳步扩张态势。

阅读()评论(0)赞 ()