本发明涉及数字音频、深度学习等,尤其涉及一种音频检测方法、装置、电子设备及存储介质。
背景技术:
1、随着数字音频技术的发展,语音功能的应用越来越广泛,例如越来越多的聊天软件提供了语音聊天功能。音频数据所记录的内容通常是具有真实性的,但是如果音频数据被篡改,其真实性将受到影响。因此,为了确定音频数据的真实性,需要对音频数据进行检测以确定音频数据是否被篡改。
2、相关技术的音频检测技术通常只能检测一种篡改类别,适用场景单一,检测效果不佳,无法满足用户需求。
技术实现思路
1、本申请实施方式旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请实施方式的目的在于提出一种音频检测方法、装置、电子设备、存储介质及程序产品。
2、本申请实施方式提供一种音频检测方法,所述方法包括:提取待检测音频数据的第一声学特征数据;基于所述第一声学特征数据,检测所述待检测音频数据的篡改类别;在所述篡改类别为目标篡改类别的情况下,利用与所述目标篡改类别对应的篡改定位方式检测所述待检测音频数据的篡改位置。
3、本申请另一实施方式提供一种音频检测装置,所述装置包括:提取???、第一检测??楹偷诙觳饽??。提取???,用于提取待检测音频数据的第一声学特征数据;第一检测???,用于基于所述第一声学特征数据,检测所述待检测音频数据的篡改类别;第二检测???,用于在所述篡改类别为目标篡改类别的情况下,利用与所述目标篡改类别对应的篡改定位方式检测所述待检测音频数据的篡改位置。
4、本申请实施方式提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项实施方式所述的方法的步骤。
5、本申请另一实施方式提供计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项实施方式所述的方法的步骤。
6、本申请另一实施方式提供一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行上述任一项实施方式所述的方法的步骤。
7、上述实施方式中,通过提取待检测音频数据的第一声学特征数据;基于第一声学特征数据,检测待检测音频数据的篡改类别;在篡改类别为目标篡改类别的情况下,利用与目标篡改类别对应的篡改定位方式检测待检测音频数据的篡改位置。本发明适用于检测和定位不同篡改类别的音频数据,提高音频检测的效果。
1.一种音频检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一声学特征数据,检测所述待检测音频数据的篡改类别包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述第一声学特征数据进行特征提取,得到高维特征数据包括:
4.根据权利要求3所述的方法,其特征在于,所述基于高维特征数据,对所述待检测音频数据进行分类,得到所述篡改类别包括:
5.根据权利要求1-4中任意一项所述的方法,其特征在于,所述利用与所述目标篡改类别对应的篡改定位方式检测所述待检测音频数据的篡改位置包括:
6.根据权利要求5所述的方法,其特征在于,所述多个音频数据片段包括多个静音数据片段和/或多个有声数据片段;所述相似度包括任意两个静音数据片段对应的第二声学特征数据之间的相似度和/或任意两个有声数据片段对应的第二声学特征数据之间的相似度。
7.根据权利要求1-4中任意一项所述的方法,其特征在于,所述目标篡改类别包括以下至少一项:
8.根据权利要求4所述的方法,其特征在于,神经网络模型包括所述多个编码网络和所述解码网络;所述神经网络模型是经过以下方式训练得到的:
9.一种音频检测装置,其特征在于,所述装置包括:
10.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的方法的步骤。