一种自适应的鼾声信号检测方法

文档序号：10600535阅读：720来源：国知局

一种自适应的鼾声信号检测方法
【专利摘要】本发明提供了一种自适应的鼾声信号检测方法，步骤如下：步骤1，对获得的睡眠音频信号进行端点检测得到声音事件；步骤2，对步骤1获得的声音事件进行特征提取，得到Mel频率倒谱系数；步骤3，对步骤2所提取的特征进行聚类，确定鼾声和非鼾声信号。本发明可以有效检测出睡眠音频信号中的鼾声信号，检测结果准确，性能优良。
【专利说明】
_种自适应的声信号检测方法
技术领域
[0001] 本发明属于音频信号处理领域，特别设计一种自适应的鼾声信号检测算法。
【背景技术】
[0002] 鼾声是入睡后发出的粗重鼻息声。打鼾是一种十分普遍的现象，大约有20 %~ 40%的人群患有打鼾症状。睡眠时上气道咽腔肌肉张力相对降低，上气道塌陷。当气流通过上气道的狭窄部位时，气流变得湍急并引起组织振动，从而出现鼾声。更具体地，打鼾可以表征为软腭、咽壁、会厌和舌头的振动。打鼾不仅困扰患者、影响同伴，还会对患者健康造成威胁。响亮的呼噜声可能会吵得旁人整夜不得安睡，使得同伴睡眠质量大大降低，甚至可能患上继发性睡眠障碍，造成工作生活的不和谐。打鼾还是睡眠呼吸障碍最常见的症状。阻塞性睡眠呼吸暂停综合症也是一种伴有打鼾的呼吸疾病，它会导致患者白天的嗜睡和疲劳，也是心血管疾病的一个诱因。目前诊断和评估打鼾的主要技术手段是多导睡眠图，但是它需要患者整夜待在睡眠实验室中并连接大量的生理电极。由于具有非侵入式、廉价易用的特点，鼾声信号的声学分析方法已引起广泛关注和研究，并表现出极大的潜力。
[0003] Duckitt等人[20]提出一种基于隐马尔可夫模型(Hidden Markov Model，ΗΜΜ)和 Mel频率倒谱系数特征(Mel-Frequency Cepstral Coefficients，MFCCs)的方案，将音频信号分成鼾声、呼吸、羽绒被噪声、其他噪声和无声五个类别，但是鼾声判别的准确度仅有 82%-89%<Xa VuS〇glu等人[21]利用信号能量和过零率进行声音事件的检测，并提出声音事件的500Hz子带能量分布特征，经过主成分分析(Principal ComponentAnalysis，PCA)发现二维特征上鼾声非鼾声的分布存在明显差异，因此利用稳健线性回归(Robust Linear Regression，RLR)分析将声音事件分成鼾声非鼾声两个类别，取得了较好的鼾声检测性能。 Dafna等人[22]则提出一种基于高斯混合模型(Gaussian Mixture Model，GMM)的方法，并提取声音事件在时间域、能量域和频域上的声学特征进行分析，其鼾声判别的准确度达到 96.02%。以上介绍的方法都是监督的，需要训练数据，也有无监督的检测算法。Azarbarzin 等人[23]，[24]提出了一种无监督的鼾声检测算法，利用PCA分析了声音事件的500Hz子带能量分布特征，并采用K-均值(K-means，KM)或模糊C-均值(Fuzzy C-means，FCM)聚类算法将声音事件分成鼾声、呼吸和噪声三个类别。值得注意的是500Hz子带能量分布特征并不能表征人耳听觉特性，这可能会导致较差的阳性预测值(Positive Predictive Value，PPV)。
[0004] 总之，监督的鼾声检测方法通常需要比较大的训练数据，而且其鼾声检测的性能也受制于训练数据的选择。相比较而言，目前无监督的方法虽然不需要训练数据，但是其检测性能还不够优越。

【发明内容】

[0005] 本发明的目的在于提供一种高效、可靠的自适应的鼾声信号检测方法，从睡眠音频信号中检测出鼾声信号。
[0006] 实现本发明的技术解决方案为:一种自适应的鼾声信号检测方法，步骤如下：
[0007] 步骤I，对获得的睡眠音频信号进行端点检测得到声音事件；
[0008] 步骤2，对步骤1获得的声音事件进行特征提取，得到Mel频率倒谱系数；
[0009]步骤3,对步骤2所提取的特征进行聚类，确定鼾声和非鼾声信号。
[0010] 进一步地，步骤1所述对获得的睡眠音频信号进行端点检测得到声音事件，具体如下：
[0011] (1.1)对睡眠音频信号进行预处理，包括带通滤波和归一化，得到信号Y;
[0012] (1.2)初始化声音事件检测时间点，n = L+1;定义时间预设值Γ;
[0013] (1.3)在当前时间点η，定义一个如下形式的矩形盒子：
[0014] B(L,H,n,Yn) = [n-L,n]X[Yn-H,Yn+H]
[0015]其中，Yn是信号Y在时间点n时的采样值;L>1，表示矩形盒子的宽度;2H>0,表示矩形盒子的高度;其中矩形盒子的参数H设置如下：
[0016] 计算Ns内每M ms的信号采样点绝对值之和，并选取其中的最小值作为H值设置的参考值，设选取的N s内的信号为Y(n)，每Mms的S个采样点看作一帧，第i帧记为Yi(n)，共有 fn帧，则右-
[0017]
[0018] 其中，a为与采样频率相关的系数；
[0019] (1.4)在当前时间点11，对落入矩形盒子8仏，!1，11，￥11)中的采样点进行计数，并用1^ (η)表示如下：
[0020]
[0021 ] 其中，Yn-定会在矩形盒子B(L，H，n，Yn)中，Yn不计入bui(n);
[0022] (1.5)如果满足如下关系就给出标记，否则不给出标记，关系式如下：
[0023] bLH(nKLX0
[0024] 其中，0<θ<1;
[0025] (1.6)如果时间点已到达数据末尾，则转到步骤(1.7);否则，矩形盒子右移固定数量的采样点，也就是η自增固定数值，转到步骤(1.3);
[0026] (1.7)对于所有给出标记的矩形盒子，该矩形盒子所在时间就是声音事件所在时间；对于相隔时间Sr的矩形盒子进行合并，认为是同一个声音事件;判别出的声音事件如果持续时长 < 预设值r则丢弃，认为不可能是鼾声信号。
[0027] 进一步地，步骤2所述对步骤1获得的声音事件进行特征提取，得到Mel频率倒谱系数，具体如下：
[0028] (2.1)将声音信号进行Nl点傅里叶变换，公式如下：
[0029]
[0030]其中，此处j为虚数单位，OSKNl-I，y[m]是输入的声音事件音频信号，w[m]是 Hamming窗函数；
[0031] (2.2)计算通过Mel滤波器的输出能量Ε(σ)，
[0032]
[0033] 其中1彡〇彡M，M是Mel尺度下滤波组的数目，|Y(1) I2是Mel频率带中第1条谱线信号的能量，Wc3(I)则是与|Y(1) I2相应的第1条谱线的频率响应函数；
[0034] (2.3)进行对数计算和离散余弦变换DCT得到Mel频率倒谱系数Cm:
[0035]
[0036]其中，m(〇-0.5)是求DCT变换的公式，Cm是Mel频率倒谱系数。
[0037] 进一步地，步骤3所述对步骤2所提取的特征进行聚类，确定鼾声和非鼾声信号，具体如下：
[0038] (3.1)初始化算法，从η个声音事件的d维特征集X= Ix1，…，χη}中选取k个作为聚类中心C={ci，···，ck};
[0039] (3.2)对于每个声音事件的特征X1，计算其隶属函数m(Cj I Xl)和权重函数w(Xl);其中^#父，乂={11，一，1 11}表示11个声音事件的(1维特征集，1]1((^|1〇表示声音事件的特征11属于聚类中心Cj的比重，W(X 1)表示声音事件的特征^在重新计算聚类中心时的影响程度；
[0040] (3.3)对于每个聚类中心根据声音事件特征X1的隶属函数和权重函数重新计算位置，
[0041]
[0042] (3.4)重复步骤(3.2)和步骤(3.3)直至收敛，收敛判断方法是目标函数不再发生变化即图形曲线上目标函数值趋于稳定，或达到指定迭代次数。
[0043]本发明与现有技术相比，其显著优点为：（1)可以自适应地进行睡眠音频信号中的鼾声信号检测；（2)检测结果准确，性能优良；（3)能够及时准确地分析整夜的音频信号，检测出其中的鼾声信号，具有非侵入式、廉价易用的优点。
[0044]下面结合说明书附图对本发明做进一步说明。
【附图说明】
[0045] 图1为本发明自适应的鼾声信号检测方法的流程图。
[0046] 图2为本发明的一段待处理的睡眠音频信号图。
[0047] 图3为本发明的声音事件的端点检测的结果图。
[0048] 图4为本发明的鼾声信号检测的结果图。
【具体实施方式】
[0049] 结合图1，本发明自适应的鼾声信号检测算法，方法步骤如下：
[0050] 步骤1，对获得的睡眠音频信号进行端点检测得到声音事件，具体如下：
[0051] (1.1)对睡眠音频信号进行预处理，包括带通滤波和归一化，得到信号Y;
[0052] (1.2)初始化声音事件检测时间点，n = L+1;定义时间预设值r为200ms;
[0053] (1.3)在当前时间点n，定义一个如下形式的矩形盒子：
[0054] B(L，H，n，Yn) = [n-L，n]X[ Yn-H，Υη+Η ]
[0055] 其中，Yn是信号Y在时间点η时的采样值;L> I，表示矩形盒子的宽度;2H>0,表示矩形盒子的高度;其中矩形盒子的参数H设置如下：
[0056] 计算Ns内每M ms的信号采样点绝对值之和，并选取其中的最小值作为H值设置的参考值，设选取的N s内的信号为Y(n)，每Mms的S个采样点看作一帧，第i帧记为Yi(n)，共有 fn帧，则有，
[0057]
[0058] 其中，a为与采样频率相关的系数;对于本文而言，考虑到信号的采样频率为8KHZ， a设置为525时可以取得较好的端点检测性能。
[0059] (1.4)在当前时间点11，对落入矩形盒子8仏，!1，11，￥11)中的采样点进行计数，并用1^ (η)表示如下：
[0060]
[0061 ] 其中，Yn-定会在矩形盒子B(L，H，n，Yn)中，Y n不计入bui(n);
[0062] (1.5)如果满足如下关系就给出标记，否则不给出标记，关系式如下：
[0063] bLH(nKLX0
[0064] 其中，0<θ<1;
[0065] (1.6)如果时间点已到达数据末尾，则转到步骤(1.7);否则，矩形盒子右移固定数量的采样点，也就是η自增固定数值，使采样点重叠80%，转到步骤(1.3);
[0066] (1.7)对于所有给出标记的矩形盒子，该矩形盒子所在时间就是声音事件所在时间；对于相隔时间Sr的矩形盒子进行合并，认为是同一个声音事件;判别出的声音事件如果持续时长 < 预设值r则丢弃，认为不可能是鼾声信号。
[0067] 步骤2,对步骤1获得的声音事件进行特征提取，得到Mel频率倒谱系数，具体如下：
[0068] (2.1)将声音信号进行Nl点傅里叶变换，公式如下：
[0069]
[0070]其中，此处j为虚数单位，OSKNl-I，y[m]是输入的声音事件音频信号，w[m]是 Hamming窗函数；
[0071] (2.2)计算通过Mel滤波器的输出能量Ε(σ)，
[0072]
[0073]其中1彡〇彡M，M是Mel尺度下滤波组(Mel窗）的数目，I Y(I) 12是Mel频率带中第1条谱线信号的能量，w。⑴则是与|γ(ι) I2相应的第1条谱线的频率响应函数；
[0074] (2.3)进行对数计算和离散余弦变换DCT得到Mel频率倒谱系数(MFCC) Cm:
[0075]
[0076]其中，m(〇-0.5)是求DCT变换的公式，Cm是Mel频率倒谱系数。
[0077]步骤3,对步骤2所提取的特征进行聚类，确定鼾声和非鼾声信号，具体如下：
[0078] (3.1)初始化算法，从η个声音事件的d维特征集X= Ix1，…，χη}中选取k个作为聚类中心C={ci，···，ck};
[0079] (3.2)对于每个声音事件的特征X1，计算其隶属函数m(Cj I Xl)和权重函数w(Xl);其中^#父，乂={11，一，1 11}表示11个声音事件的(1维特征集，1]1((^|1〇表示声音事件的特征11属于聚类中心Cj的比重，W(X 1)表示声音事件的特征^在重新计算聚类中心时的影响程度；
[0080] (3.3)对于每个聚类中心根据声音事件特征X1的隶属函数和权重函数重新计算位置，
[0081：
[0082] (3.4)重复步骤(3.2)和步骤(3.3)直至收敛，收敛判断方法是目标函数不再发生变化即图形曲线上目标函数值趋于稳定，或达到指定迭代次数。
[0083] 实施例1
[0084] 步骤1中声音事件的端点检测的具体方法为：
[0085] 步骤1.1，对睡眠音频信号进行预处理，包括滤波（50~4000Hz带通)和归一化，得到信号Y;
[0086] 步骤1.2，初始化声音事件检测时间点，n = L+1。定义时间预设值r;
[0087] 步骤1.3,在当前时间点η，定义一个如下形式的矩形盒子，
[0088] B(L,H,n,Yn) = [n-L,n] Χ[Υη-Η,Υη+Η]
[0089] 其中，Yn是信号Y在时间点η时的采样值;L> I，表示矩形盒子的宽度;2Η>0，表示矩形盒子的高度。
[0090 ]步骤1.4，在当前时间点η，对落入矩形盒子B (L，H，η，Yn)中的采样点进行计数， [0091：
[0092] 可以注意到的是，Yn-定会在矩形盒子B(L，H，n,Yn)中，它不计入Im(η)。
[0093] 步骤1.5,如果满足如下关系就给出标记(否则不给出标记），
[0094] bLH(n)^LX0
[0095] 其中，0<θ<1。
[0096] 步骤1.6,如果时间点已到达数据末尾，则转到步骤1.7;否则，矩形盒子右移一定数量的采样点，也就是η自增一定数值，转到步骤1.3;
[0097] 步骤1.7,对于所有给出标记的矩形盒子，认为该矩形盒子所在时间就是声音事件所在时间。对于相隔不高于200ms的矩形盒子，进行合并，认为是同一个声音事件。判别出的声音事件如果时长低于200ms，则丢弃，认为不可能是鼾声信号。
[0098] 步骤1中所述矩形盒子的参数H的设置如下：
[0099]计算IOs内每500ms的信号采样点绝对值之和，并选取其中的最小值作为H值设置的参考值。设选取的IOs内的信号为x(n)，每500ms(N个采样点)看作一帧，第i帧记为Xi(n)，共有fn帧，则有，
[0100]
[0101] 其中，a为系数。
[0102] 步骤2中声音事件的Mel频率倒谱系数获取步骤如下：
[0103] 步骤2.1，将声音信号进行Nl点傅里叶变换，公式如下：
[0104]
[0105] 其中，此处j为虚数单位，OSKNl-I，y[m]是输入的声音事件音频信号，w[m]是 Hamming窗函数；
[0106] 步骤2.2，计算通过Mel滤波器的输出能量E(〇)，
[0107]
[0108] 其中1彡σ彡M，M是Mel尺度下滤波组的数目，|Y(1) I2是Mel频率带中第1条谱线信号的能量，Wc3(I)则是与|Y(1) I2相应的第1条谱线的频率响应函数；
[0109] 步骤2.3，进行对数计算和离散余弦变换DCT得到Mel频率倒谱系数Cm:
[0110]
[0111]其中，m(〇-0.5)是求DCT变换的公式，Cm是Mel频率倒谱系数。
[0112] 步骤3中聚类算法以K-调和均值(k-harmonic means，KHM)聚类为例，步骤如下：
[0113] 步骤3.1，算法初始化，初始化算法，从η个声音事件的d维特征集X= {XI，…，Xn}中选取k个作为聚类中心C={C1，-_，ck}。如果只需要将信号分为鼾声和非鼾声两类，则取值为 k = 2〇
[0114] 步骤3.2,计算目标函数，
[0115]
[0116] 其中，Xi e X，X ={X1，…，χη}表示η个声音事件的d维特征数据点集;P是输入参数，通常P彡2,可以取值为p = 3.5。
[0117] 步骤3.3,对于每个声音事件的特征Xi，计算其在每个中心Cj的隶属函数m(Cj I Xi) 和权重函数W(Xi)，
[0118]
[0119]
[0120] 其中，隶属函数m(Cj I Xl)表示声音事件的特征xj于中心的比重，权重函数W(X1) 表示声音事件的特征Xi在重新计算中心时的影响程度；
[0121] 步骤3.4,对于每个中心根据所有声音事件的特征^的隶属函数和权重函数，重新计算其位置，
[0122]
[0123] 步骤3.5,重复步骤3.2~3.4直到满足给定的迭代次数或者目标函数KHM(X，C)不再产生明显变化；
[0124] 步骤3.6，根据最大的隶属函数m(Cj I Xi)，将各声音事件的特征Xi分到中心Cj中。
[0125] 通过以上步骤最后就能从睡眠音频信号中检测出鼾声信号。
[0126] 结合图2~4,首先需要采集到睡眠时的音频信号，为了方便处理，对音频信号进行分割，图2是一段分割后的睡眠音频信号;对该信号做相应的预处理和端点检测，识别出其中的声音事件，图3给出了声音事件的端点检测结果，红线标记就是检测出的声音事件;然后提取声音事件的Mel频率倒谱系数特征;最后根据KHM算法对其进行聚类，从而区分出鼾声信号，如图4所示，绿线标记就是检测出的鼾声信号。综上所述，本发明可以自适应地进行睡眠音频信号中的鼾声信号检测，检测结果准确、性能优良。
【主权项】
1. 一种自适应的韩声信号检测方法，其特征在于，步骤如下：步骤1，对获得的睡眠音频信号进行端点检测得到声音事件；步骤2,对步骤1获得的声音事件进行特征提取，得到Mel频率倒谱系数；步骤3,对步骤2所提取的特征进行聚类，确定韩声和非韩声信号。2. 根据权利要求书1所述的自适应的韩声信号检测方法，其特征在于，步骤1所述对获得的睡眠音频信号进行端点检测得到声音事件，具体如下： (1.1) 对睡眠音频信号进行预处理，包括带通滤波和归一化，得到信号Y; (1.2) 初始化声音事件检测时间点，η = L+1;定义时间预设值Γ; (1.3) 在当前时间点η，定义一个如下形式的矩形盒子： B(L,H,n,Yn) = [n-L,n]X[Yn-H,Yn+H] 其中，Υη是信号Y在时间点η时的采样值;L> 1，表示矩形盒子的宽度;2H>0，表示矩形盒子的高度;其中矩形盒子的参数Η设置如下：计算Ns内每Mms的信号采样点绝对值之和，并选取其中的最小值作为Η值设置的参考值，设选取的化内的信号为Υ(η)，每Mms的S个采样点看作一帖，第i帖记为Υι(η)，共有fn帖，则有，其中，a为与采样频率相关的系数； (1.4) 在当前时间点n，对落入矩形盒子B(L，H，n，Yn)中的采样点进行计数，并用bLH(n) 表示如下：其中，Υη-定会在矩形盒子Β?Χ,Η,η,Υη)中，Υη不计入bLH(n); (1.5) 如果满足如下关系就给出标记，否则不给出标记，关系式如下： bLH(n)《LX 白其中，0<θ<1; (1.6) 如果时间点已到达数据末尾，则转到步骤（1.7);否则，矩形盒子右移固定数量的采样点，也就是η自增固定数值，转到步骤(1.3); (1.7) 对于所有给出标记的矩形盒子，该矩形盒子所在时间就是声音事件所在时间；对于相隔时间的矩形盒子进行合并，认为是同一个声音事件;判别出的声音事件如果持续时长《预设值Γ则丢弃，认为不可能是韩声信号。3. 根据权利要求书1所述的自适应的韩声信号检测方法，其特征在于，步骤2所述对步骤1获得的声音事件进行特征提取，得到Mel频率倒谱系数，具体如下： (2.1)将声音信号进行N1点傅里叶变换，公式如下：其中，此处j为虚数单位，〇《1《^-1，7[111]是输入的声音事件音频信号，*[111]是 Hamming窗函数； (2.2) 计算通过Me 1滤波器的输出能量E (曰），其中是Mel尺度下滤波组的数目，|Υ(1) I2是Mel频率带中第1条谱线信号的能量，胖。(1)则是与|Υ(1) I2相应的第1条谱线的频率响应函数； (2.3) 进行对数计算和离散余弦变换DCT得到Mel频率倒谱系数Cm:其中，m( σ-0.5)是求DCT变换的公式，Cm是Mel频率倒谱系数。4.根据权利要求书1所述的自适应的韩声信号检测方法，其特征在于，步骤3所述对步骤2所提取的特征进行聚类，确定韩声和非韩声信号，具体如下： (3.1) 初始化算法，从η个声音事件的d维特征集X= 1x1，…，xn}中选取k个作为聚类中屯、 C=ki，...，ck}; (3.2) 对于每个声音事件的特征xi，计算其隶属函数m(cj|xi)和权重函数w(xi);其中，xi eX，X= {xi,…，χη}表示η个声音事件的d维特征集，m(cj |xi)表示声音事件的特征xi属于聚类中屯、C北勺比重，W(Xi)表示声音事件的特征XI在重新计算聚类中屯、时的影响程度； (3.3) 对于每个聚类中屯、cj，根据声音事件特征XI的隶属函数和权重函数重新计算位置，(3.4) 重复步骤(3.2)和步骤(3.3)直至收敛，收敛判断方法是目标函数不再发生变化即图形曲线上目标函数值趋于稳定，或达到指定迭代次数。
【文档编号】A61B5/00GK105962897SQ201610271099
【公开日】2016年9月28日
【申请日】2016年4月27日
【发明人】洪弘, 顾李萍, 马干军, 杨宇鑫, 顾陈, 李彧晟, 朱晓华
【申请人】南京理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：洪弘;顾李萍;马干军;杨宇鑫;顾陈;李彧晟;朱晓华;
技术所有人：南京理工大学;
我是此专利的发明人

上一篇：一种人机工程学数据的测试及分析处理方法
上一篇：心率睡眠监测系统及监测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。