基于残差收缩网络的声纹阵列识别方法与流程

文档序号：37796130发布日期：2024-04-30 17:06阅读：6来源：国知局

本发明涉及人工智能算法，尤其是指基于残差收缩网络的声纹阵列识别方法。

背景技术：

1、声纹识别在电力、电缆施工方面，设备诊断、检修方面，都有广泛的应用。然而，这些应用中，周围环境噪声情况嘈杂，所采集的声纹序列都存在不同程度的噪声干扰。传统ai网络对时间序列进行分类方法可大致分为基于距离的方法，基于特征的方法以及基于深度学习的方法。传统方法需要手动处理特征和人为的选择分类器，深度学习方法没有针对时间序列数据的特点对网络结构进行有效设计，很难取得良好的效果。

2、时间序列数据往往面临着两个问题：时间尺度的选择与噪声干扰。一个良好的时间序列分类算法应该能够捕获不同时间尺度的时间序列数据，因为长期特征反映总体趋势，短期特征反映局部区域的细微变化。同时，时间序列数据又容易受到噪声的干扰而失去意义。能否对时间序列数据进行有效的时间尺度的选择和有效的噪声处理将对时间序列分类效果产生重要影响，目前已有的考虑到时间尺度的时间序列分类算法并不理想，并且很少能够对噪声问题提出有针对的解决方法。

技术实现思路

1、本发明的目的是克服现有技术中的通过时间序列对声纹识别时容易受到噪声干扰，造成声纹识别效果下降的缺陷，提供一种基于残差收缩网络的声纹阵列识别方法。

2、本发明的目的是通过下述技术方案予以实现：

3、基于残差收缩网络的声纹阵列识别方法，包括以下步骤：

4、步骤1，对数据进行预处理；

5、步骤2，对预处理完成的数据进行局部卷积；

6、步骤3，构建残差网络，将局部卷积的卷积特征串联；

7、步骤4，通过残差网络计算收缩阈值，通过收缩阈值限定进行对声纹阵列进行识别。

8、作为优选，所述的步骤1中，预处理的过程包括数据映射、数据平滑滤波和数据采样。

9、作为优选，所述的数据映射具体为：

10、采用数据恒等映射，保留原有数据，时间序列数据公式如下式所示：

11、

12、t1，t2，……，tn表示从1到n的时间段；

13、所述的数据平滑滤波具体为：

14、对于给定的时间序列数据，使用具有不同窗口大小的移动平均值生成具有不同平滑度的多个新时间序列；

15、对于窗口大小为l的滤波器，对第i个数据到第i+l-1的时间序列数据进行滤波，滤波处理如公式(2)所示，原时间序列如公式(3)所示，滤波处理后的数据如公式(4)所示：

16、

17、t＝{t1，t2，…，ti，ti+1，…，ti+l-1，…tn}?????????(3)

18、

19、所述的数据采样具体为：

20、设采样率为k，新的时间序列如公式(5)所示；采样率具有不同的取值，k＝1,2,3……；通过对数据进行不同的采样，可以将数据切分成多个序列；

21、

22、作为优选，所述的步骤2具体为：局部卷积从输入时间序列中下采样得到不同长度的多个时间序列，对每个新生成的时间序列应用独立的一维局部卷积；一维局部卷积包括卷积计算和池化计算来提取每个分支的特征；不同分支的卷积相互独立。

23、作为优选，所述的步骤3具体为：

24、残差网络包括网络结构和分类算法，将提取的特征串联起来，再应用三个卷积块进行特征提取，之后在三个残差块构成的残差网络中进行特征提取和分类；所述的三个卷积块的结构由卷积层，批归一化和激活函数relu构成；每一个残差块经过所述的conv和所述的bn两个完整的卷积块，与当前卷积块求和并进行所述的relu激活计算。

25、作为优选，所述的步骤4中，通过残差网络计算收缩阈值具体为：

26、全连接残差网络结构经过一个卷积块和卷积层后，求平均值，再通过两个全连接层学习收缩系数，收缩系数与求收缩系数之前的数据相乘获得搜索阈值。

27、本发明的有益效果是：本发明通过对于改进的全连接多尺度残差网络的时间序列分类，处理了时间序列中时间尺度选择问题；本发明通过对网络本身的优化更好的对时间序列中的数据进行噪声处理，提高识别和分类精度。

技术特征：

1.基于残差收缩网络的声纹阵列识别方法，其特征是，包括以下步骤：

2.根据权利要求1所述的基于残差收缩网络的声纹阵列识别方法，其特征是，所述的步骤1中，预处理的过程包括数据映射、数据平滑滤波和数据采样。

3.根据权利要求2所述的基于残差收缩网络的声纹阵列识别方法，其特征是，所述的数据映射具体为：

4.根据权利要求3所述的基于残差收缩网络的声纹阵列识别方法，其特征是，所述的步骤2具体为：局部卷积从输入时间序列中下采样得到不同长度的多个时间序列，对每个新生成的时间序列应用独立的一维局部卷积；一维局部卷积包括卷积计算和池化计算来提取每个分支的特征；不同分支的卷积相互独立。

5.根据权利要求4所述的基于残差收缩网络的声纹阵列识别方法，其特征是，所述的步骤3具体为：

6.根据权利要求5所述的基于残差收缩网络的声纹阵列识别方法，其特征是，所述的步骤4中，通过残差网络计算收缩阈值具体为：

技术总结
本发明公开了一种基于残差收缩网络的声纹阵列识别方法，包括以下步骤：步骤1，对数据进行预处理；步骤2，对预处理完成的数据进行局部卷积；步骤3，构建残差网络，将局部卷积的卷积特征串联；步骤4，通过残差网络计算收缩阈值，通过收缩阈值限定进行对声纹阵列进行识别。本发明通过对于改进的全连接多尺度残差网络的时间序列分类，处理了时间序列中时间尺度选择问题；本发明通过对网络本身的优化更好的对时间序列中的数据进行噪声处理，提高识别和分类精度。

技术研发人员：顾伟,秦建松,章立宗,丁梁,陈浩,赵伟苗,杨彪,殷常斌,张金鹏,苗伟,刘炜,汪磊,王建军,任基铭,严铭铭,蒋春锋,陈岳峰,张晓波,邬明亮,刘安文,李勇,黄强强,陈扬军,杨智海,崔佳嘉,冯新江,梁皓,魏健,陈文浩,陶旭东,林开福,孙局宾,张中,傅伟栋,吴涛,张黎捷,邢恩恺,施光南,张继轩,董钦,沈旭东,金钢,贺明
受?；さ募际跏褂谜撸?/b>国网浙江省电力有限公司双创中心
技术研发日：
技术公布日：2024/4/29

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：顾伟,秦建松,章立宗,丁梁,陈浩,赵伟苗,杨彪,殷常斌,张金鹏,苗伟,刘炜,汪磊,王建军,任基铭,严铭铭,蒋春锋,陈岳峰,张晓波,邬明亮,刘安文,李勇,黄强强,陈扬军,杨智海,崔佳嘉,冯新江,梁皓,魏健,陈文浩,陶旭东,林开福,孙局宾,张中,傅伟栋,吴涛,张黎捷,邢恩恺,施光南,张继轩,董钦,沈旭东,金钢,贺明
技术所有人：国网浙江省电力有限公司双创中心
我是此专利的发明人

上一篇：一种转角窗帘盒的制作方法
上一篇：一种搅拌设备用桶盖结构的制作方法

相关技术

基于毫米波雷达的语音合成方法...
语音交互设备
一种朗读评测方法和装置、电子...
一种快速提醒声光电子蜂鸣器的...
由电子设备执行的方法、电子设...
一种声纹识别方法及系统
可调多角度的手风琴架的制作方...
一种智能语音交互方法及装置与...
一种水下声音分类模型训练方法...
语音应用场景切换方法、可穿戴...

网友询问留言已有0条留言

还没有人留言评论。精彩留言会获得点赞！

1

精彩留言，会给你点赞！