其乐融融的IT技术小站

语音识别

语音识别

AI智能语音识别算法 下篇

10

其乐融融 发布于 2023/10/27 02:30:36

 [[397599]]一、神经网络当前常用的语音识别框架如下图其背后的逻辑是在特征提取时采用的神经网络里面的DNN技术DNN技术可以分为两种,一种是CNN模型,一种是RNN模型二、解码器

阅读()评论(0)赞 ()

语音识别

AI智能语音识别算法 上篇

4

其乐融融 发布于 2023/10/27 02:30:33

 [[397592]]一、声源定位1、电扫阵列当系统扫描到输出信号功率最大时所对应的波束方向就是认为是声源的DOA方向,从而可以声源定位。电扫阵列的方式存在一定的局限,仅仅适用于

阅读()评论(0)赞 ()

语音识别

如何三步搭建一套声纹系统

6

其乐融融 发布于 2023/10/27 02:30:29

声纹检索,顾名思义就是说话人识别,通过声音来验证或者识别说话人的声音。声纹识别的关键步骤就是声音向量化,将说话人的声音将其转化成结构化的向量。阿里云AnalyticDB向量版,提供了一套声纹验证检索的解决方案。用户只需要使用简单的几条SQL命令,三步之内就可以搭建一套高精度的声纹检索验证服务。

阅读()评论(0)赞 ()

语音识别

基于Transformer的高效、低延时、流式语音识别模型

12

其乐融融 发布于 2023/10/27 02:30:18

微软 Azure 语音团队与微软亚洲研究院的研究员们一起提出了一套结合 Transformer 家族的编码器和流式 Transducer 框架的解决方案,并提出了 Mask is all you need 的方法对模型进行快速训练以及解码,让 Transformer 模型能够在普通的计算设备上进行快速的语音识别。

阅读()评论(0)赞 ()

语音识别

2021年中国AI语音识别行业市场现状与发展前景分析

5

其乐融融 发布于 2023/10/26 02:30:31

语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令的能力。随着语音技术与智能手机、平板电脑等电子产品芯片集成的深入发展,用户交互体验水平将得到大幅提升,用户认知和习惯得以培养,中国智能语音市场规模将会继续保持稳步扩张态势。

阅读()评论(0)赞 ()

语音识别

很遗憾,自然语言理解是AI尚未攻克的领域

0

其乐融融 发布于 2023/10/26 02:30:26

短短几年之内,深度学习算法得到了长足发展,不仅在棋类游戏中击败了全球很优秀的选手,也能够以等同于、甚至超越人类的准确率识别人脸。但事实证明,人类语言仍是一项独特且深邃的难题,亦是AI技术所面对的最为艰巨的挑战之一。

阅读()评论(0)赞 ()

语音识别

从2020世界人工智能大会看AI智能语音技术的新发展

3

其乐融融 发布于 2023/10/26 02:30:20

从2020人工智能大会上看,智能语音领域正在呈现多元化的发展趋势,医疗领域对于智能语音的需求也逐渐在增加。同时随着智能语音技术的发展成熟,与智能语音相关的附属品和新领域也相继出现,高科技智能产品也更具有特色。本文详细的讲解了人工智能技术在语音助手方面的应用和发展。

阅读()评论(0)赞 ()

语音识别

使用Python和Keras创建简单语音识别引擎

5

其乐融融 发布于 2023/10/25 02:30:11

语音识别是机器或程序识别口语中的单词和短语并将其转换为机器可读格式的能力。通常,这些算法的简单实现有一个有限的词汇表,它可能只识别单词/短语。但是,更复杂的算法(例如Cloud Speech-to-Text和Amazon Transcribe)具有广泛的词汇量,并包含方言、噪音和俚语。

阅读()评论(0)赞 ()