功率时延谱 matlab,改进的互功率谱时延估计算法

前言

基于麦克风阵列的声源定位是利用麦克风阵列拾取多路声音信 , 结合声源和阵列结构之间的几何关系, 得到声源的位置信息. 由于麦克风阵列在时域和频域的基础上增加了空域信息, 因此对声音信息的处理能力明显增强[. 其优势主要体现于: 具有空间选择性、能够应用于声 源自动跟踪、能够识别同时发生的多个声源以及用于近场测距等.

目前的声源定位研究主要可分为二维空间定位与三维空间定位、近场定位与远场定位、方向定位与距离定位等几类. 其中, 基于到达时间差(Time Differences Of Arrival, TDOA)的声源定位算法在视频会议、车载导航、机器人、医疗诊断及海洋探测等领域的应用极为广泛[. 基于TDOA的定位方法是一种双步定位法. 该方法首先进行时延估计(Time Delay Estimation, TDE)估计声源信 到达麦克风对的时间差, 进而通过几何关系来确定声源的位置.

上世纪八十年代, Knapp和Carter[提出了利用互相关函数估计时延的广义互相关法(Generalized Cross Correlation, GCC), 将两路语音信 的互功率谱进行滤波后提取峰值作为时延估计值. GCC算法得到了广泛的应用, 而鉴于GCC算法受混响的影响较大, 一些学者对其做了改进, Champagne[提出的倒谱预滤波(CEpstral Prefiltering, CEP)技术先对信 进行预滤波, 有目的地去除信 中受混响影响较严重的部分, 再将预滤波后的信 通过GCC方法进行时间延迟估计; 此后, 又陆续出现了基于子空间分解的自适应特征值分解(Adaptive Eigenvalue Decomposition Algorithm, AEDA)[和基于声学传递函数比(Acoustic Transfer Functions ratio, ATF)[来进行时延估计的方法, 能够有效克服混响和噪声的影响.

1994年Omologo[提出了互功率谱相位 (Cross-power Spectrum Phase, CSP)算法. 这种方法对中低混响有很好的抑制作用, 吸引了一大批学者的关注, 有一些文献对其进行了改进, 出现了很多基于CSP算法的时延估计算法和应用场景

1 互功率谱相位算法

对于由I个麦克风组成的阵列, 给定一个声源, 在理想环境下第i个麦克风在t时刻接收到的信 可表示为:

${x_i}(t) = {alpha _i}s(t – {tau _i}) + {v_i}(t) = {h_i}(t) * s(t) + {n_i}(t)$

(1)

其中, αi(αi

显然, 麦克风阵列中的各阵元信 具有相关性. 第i、j个麦克风信 的互相关函数如下:

${R_{{x_i}{x_j}}}(tau ) = E[{x_i}(t){x_j}(t – tau )]$

(2)

其中,

$E[ cdot ]$为求期望.

假设噪声与声源信 不相关, 式(2)可简化为:

${R_{{x_i}{x_j}}}(tau ) = {alpha _i}{alpha _j}{R_{{s_i}{s_j}}}(tau – {tau _{ij}}) + {R_{{v_i}{v_j}}}(tau )$

(3)

其中,

${R_{{s_i}{s_j}}}(tau )$为声源信 的自相关函数,

${R_{{v_i}{v_j}}}(tau )$为噪声信 vi(t)和vj(t)的互相关函数.

由自相关函数的性质可知, 当τ-τij=0, 即τ=τij时,

${R_{{x_i}{x_j}}}(tau )$取得最大值. 故只要找到信 xi(t)与xj(t)互相关函数的最大值, 便能求出麦克风i和麦克风j之间的时延.

这就表明, TDOA值可以从互相关函数峰值处得到. 但是在现实环境中, 声音会经过多次反射再次到达麦克风, 故麦克风接收到的语音信 由声源与噪声的直达波和反射波组成. 这些反射波的存在会形成伪峰, 严重影响时延估计的准确性(如

CSP算法就是基于上述情况所提出来. 对式(3)做傅里叶变换得到xi(t)与xj(t)的互功率谱:

${P_{{X_i}{X_j}}}(omega ) = {alpha _i}{alpha _j}{P_{{S_i}{S_j}}}(omega ){e^{ – jomega {tau _{ij}}}} + {P_{{V_i}{V_j}}}(omega )$

(4)

其中,

${P_{{X_i}{X_j}}}(omega )$、${P_{{S_i}{S_j}}}(omega )$、${P_{{V_i}{V_j}}}(omega )$ 分别为

${R_{{x_i}{x_j}}}(tau )$、${R_{{s_i}{s_j}}}(tau )$、${R_{{v_i}{v_j}}}(tau )$的功率谱函数. 定义相位加权函数为[:

图 1

Fig. 1

图 2 改进CSP算法流程图

2.1 预处理

首先将双通道语音信 进行归一化处理, 归一化后样本数据数值范围是[–1,1]. 然后, 对归一化的数据进行分帧、加窗处理, 用于减小语音截断误差, 其中, 帧长为512, 帧移为64, 窗类型为汉明窗. 最后, 对分帧加窗后的语音信 进行端点检测, 以降低算法运算量. 端点检测后分别得到语音开始帧、结束帧以及语音发生段[B,E], 如B1=B2时, B=B1=B2; 当B1≠B2时, B=max(B1,B2). 同理, 当E1=E2时, E=E1=E2; 当E1≠E2时, E=min(E1,E2).

2.2 合理时延区间计算

当语音混有强噪声、强混响时, 互功率谱函数的计算受噪声和混响的影响出现误差, 进而影响峰值检测. 为了减少错误的时延估计值, 降低无效的计算量, 我们引入一个合理时延区间, 对所有无效时延进行剔除, 从而提高算法计算效率与时延精度.

如S到麦克风m2的夹角为θ, 麦克风m1与m2间的距离为d12, 有:

$cos theta = frac{{{l_{e{m_2}}}}}{{{d_{12}}}}$

(7)

图 3

Fig. 3

图 4 声源到两路麦克风信

其中, e为从麦克风m1向Sm2作垂线的交点,

${l_{e{m_2}}}$为e到m2的距离.

一般情况下, 声源S到麦克风阵列的距离远大于阵列孔距d12. 因此, 用曲线m1’m2近似代替直线m1e, 式(7)可化为:

$cos theta approx frac{{{l_{{m_1}'{m_2}}}}}{{{d_{12}}}} = frac{{tau cdot c}}{{{d_{12}}}}$

(8)

其中,

${l_{{m_1}'{m_2}}}$为麦克风m1的映射m1’到麦克风m2的距离, τ为麦克风m1与m2的时延, c为声速.

为了方便表示, 用采样点数N来表示时延的大小, N与τ的关系为:

$N = tau cdot Fs$

(9)

其中, Fs为采样频率.

将式(9)带入式(8), 且由-1≤cosθ≤1可得:

$ – frac{{{d_{12}} cdot Fs}}{c} le N le frac{{{d_{12}} cdot Fs}}{c}$

(10)

考虑到由曲线m1’m2代替直线m1e的误差, 当声源与麦克风阵列距离越近时误差越大. 由于阵列孔距较小, 忽略声源与麦克风阵列的距离小于孔距等极少数情况. 当声源到麦克风阵列距离与阵列孔距相等时, 如d12的二分之一.

图 5

Fig. 5

表 1 不同r值取得最小误差的次数

r

1

0.95

0.9

0.85

0.8

0.75

0.7

0.65

num

5

4

9

44

19

6

11

1

表 1 不同r值取得最小误差的次数

2.3 多帧信 加权

$tau = ({tau _1} + {tau _2} + {tau _3} + {tau _4} + {tau _5})/5$

(12)

其中, τ1, …, τ5分别为语音发生段前5帧信 的时延.

3 实验分析

3.1 MATLAB仿真

表 2(Table 2)

图 6 信 采集设备

实验使用双通道直线型麦克风矩阵, 麦克风间距0.6 m, 阵列距地面75 cm. 实验室房间长7.28 m, 宽5.56 m, 高3.4 m. 以房间左上角建立三维坐标, 麦克风m1、m2坐标分别为(3,0.6,0.75)与(3.6,0.6,0.75).

受试者首先站在靠近麦克风m2的角落处, 当录音开始时, 实验者从麦克风m2向麦克风m1方向处走动, 并在过程中, 在设定好的位置S1至S5处拍手(这些位置分别位于麦克风阵列的π/6、π/3、π/2、2π/3、5π/6处), 走完一圈为一组语音信 , 重复录制250遍, 共得到250组语音信 . 录制过程如

图 7

Fig. 7

图 8 麦克风阵列误差校准

3.2.3 实验结果

表 3(Table 3)

e632e3bb8d0acd9ab5b6d0fac245109d.gif

表 3 算法改进前后错误率(%)

正确率角度分组

π/6

π/3

π/2

2π/3

5π/6

CSP算法

17.2

12.8

6.8

11.2

19.2

7.2

6.3

3.2

5.6

8

4.1

3.7

1.3

3.0

3.9

表 3 算法改进前后错误率(%)

4 结束语

文章知识点与官方知识档案匹配,可进一步学习相关知识算法技能树首页概览34601 人正在系统学习中 相关资源:Yalefree雅乐简软件_打软件-WindowsServer工具类资源…

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年2月18日
下一篇 2021年2月18日

相关推荐