Route
Contact aitiyu
2025-03-08 20:54:29
爱体育(AITIYU)官方网站(访问: hash.cyou 领取999USDT)
2、信号处理方法和装 置, 属于音频处理技术领域。所述方法包括 : 获取 麦克风采集的语音信号 ; 检测语音信号是否属于 清音信号, 清音信号包括正常清音信号和喷麦信 号, 喷麦信号是指气流从发声者嘴巴喷至麦克风 而产生的语音信号 ; 若语音信号属于清音信号, 则检测语音信号是否属于喷麦信号 ; 若语音信号 属于喷麦信号, 则对语音信号进行抑制处理, 该抑 制处理包括能量衰减处理、 删除处理和静默处理 中的至少一种。本发明解决了相关技术中针对喷 麦的处理方式存在实时性差和效率低的问题 ; 提 高了喷麦处理的实时性和效率, 且无需人工后期 修复, 达到了自动检测抑制喷麦的效果。 (51)Int.Cl。
3、. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书4页 说明书20页 附图5页 (10)申请公布号 CN 104409081 A (43)申请公布日 2015.03.11 CN 104409081 A 1/4 页 2 1. 一种语音信号处理方法, 其特征在于, 所述方法包括 : 获取麦克风采集的语音信号 ; 检测所述语音信号是否属于清音信号, 所述清音信号包括正常清音信号和喷麦信号, 所述喷麦信号是指气流从发声者嘴巴喷至所述麦克风而产生的语音信号 ; 若所述语音信号属于所述清音信号, 则检测所述语音信号是否属于所述喷麦信号 ; 若所述语音信号属于所述喷麦信号, 则对所述。
4、语音信号进行抑制处理, 所述抑制处理 包括能量衰减处理、 删除处理和静默处理中的至少一种。 2. 根据权利要求 1 所述的方法, 其特征在于, 所述对所述语音信号进行抑制处理之前, 还包括 : 将所述语音信号的频带划分为 N 个子频带, N 2 且 N 为整数 ; 计算所述语音信号在所述 N 个子频带内的能量分布 ; 根据所述能量分布确定所述语音信号的喷麦类型。 3. 根据权利要求 2 所述的方法, 其特征在于, 所述对所述语音信号进行抑制处理, 包 括 : 若所述语音信号的喷麦类型为带正常清音的喷麦信号, 则根据所述能量分布将所述 N 个子频带划分为清音频段、 衔接频段和喷麦频段 ; 计算所。
5、述衔接频段中每个子频带内各个 频点的平均能量 ; 根据所述平均能量的最小值对所述喷麦频段内各个频点的能量进行衰 减 ; 或者, 若所述语音信号的喷麦类型为不带正常清音的轻喷麦信号, 则根据所述能量分布将所 述 N 个子频带划分为高频喷麦频段和低频喷麦频段 ; 计算所述高频喷麦频段内各个频点的 平均能量 ; 根据所述平均能量对所述低频喷麦频段内各个频点的能量进行衰减 ; 或者, 若所述语音信号的喷麦类型为不带正常清音的强喷麦信号, 则根据预设衰减系数对所 述语音信号中各个频点的能量进行衰减。 4. 根据权利要求 1 所述的方法, 其特征在于, 所述检测所述语音信号是否属于所述喷 麦信号, 包括 。
6、: 获取所述语音信号的频域分布特性 ; 根据所述频域分布特性检测所述语音信号是否属于所述喷麦信号。 5. 根据权利要求 4 所述的方法, 其特征在于, 当所述频域分布特性为能量谱重心时, 所 述获取所述语音信号的频域分布特性, 包括 : 按照如下公式计算所述语音信号的能量谱重心 WF(i) : 其中, i 表示所述语音信号在语音序列中的帧序号, i 0 且 i 为整数 ; L 表示第 i 帧语 音信号的帧长, L 1 且 L 为整数 ; k 表示所述第 i 帧语音信号中第 k 个频点, k 0, L-1 且 k 为整数 ; Y(k,i)2表示所述第 i 帧语音信号中第 k 个频点的能量 ;。
7、 权 利 要 求 书 CN 104409081 A 2 2/4 页 3 所述根据所述频域分布特性检测所述语音信号是否属于所述喷麦信号, 包括 : 检测所述语音信号的能量谱重心 WF(i) 是否小于能量谱重心阈值 ; 若小于所述能量谱重心阈值, 则确定所述语音信号属于所述喷麦信号。 6.根据权利要求1至5任一所述的方法, 其特征在于, 所述检测所述语音信号是否属于 清音信号, 包括 : 检测所述语音信号是否属于非浊音信号, 所述非浊音信号包括所述清音信号和非人声 信号 ; 若所述语音信号属于所述非浊音信号, 则计算所述语音信号的第一特征值, 所述第一 特征值为能量或者倒谱距离 ; 根据所述第一特。
8、征值检测所述语音信号是否属于所述清音信号。 7. 根据权利要求 6 所述的方法, 其特征在于, 所述检测所述语音信号是否属于非浊音 信号, 包括 : 计算所述语音信号的第二特征值, 所述第二特征值为谱熵值、 过零率、 相关性、 分形维 数中的任意一种 ; 根据所述第二特征值检测所述语音信号是否属于所述非浊音信号 ; 或者, 检测所述语音信号是否存在预定特性, 所述预定特性为基音周期、 谐波、 共振峰中的任 意一种 ; 若所述语音信号不存在所述预定特性, 则确定所述语音信号属于所述非浊音信号。 8.根据权利要求1至5任一所述的方法, 其特征在于, 所述检测所述语音信号是否属于 清音信号, 包括 。
9、: 计算所述语音信号的第一特征值, 所述第一特征值为能量或者倒谱距离 ; 根据所述第一特征值检测所述语音信号是否属于所述人声信号, 所述人声信号包括所 述清音信号和浊音信号 ; 若所述语音信号属于所述人声信号, 则计算所述语音信号的第二特征值, 所述第二特 征值为谱熵值、 过零率、 相关性、 分形维数中的任意一种 ; 根据所述第二特征值检测所述语音信号是否属于所述清音信号。 9.根据权利要求1至5任一所述的方法, 其特征在于, 所述检测所述语音信号是否属于 清音信号, 包括 : 计算所述语音信号的第一特征值, 所述第一特征值为能量或者倒谱距离 ; 根据所述第一特征值检测所述语音信号是否属于所述。
10、人声信号, 所述人声信号包括所 述清音信号和浊音信号 ; 若所述语音信号属于所述人声信号, 则检测所述语音信号是否存在预定特性, 所述预 定特性为基音周期、 谐波、 共振峰中的任意一种 ; 若所述语音信号不存在所述预定特性, 则确定所述语音信号属于所述清音信号。 10. 一种语音信号处理装置, 其特征在于, 所述装置包括 : 语音获取模块, 用于获取麦克风采集的语音信号 ; 清音检测模块, 用于检测所述语音信号是否属于清音信号, 所述清音信号包括正常清 音信号和喷麦信号, 所述喷麦信号是指气流从发声者嘴巴喷至所述麦克风而产生的语音信 号 ; 喷麦检测模块, 用于当所述语音信号属于所述清音信号时。
11、, 检测所述语音信号是否属 权 利 要 求 书 CN 104409081 A 3 3/4 页 4 于所述喷麦信号 ; 喷麦抑制模块, 用于当所述语音信号属于所述喷麦信号时, 对所述语音信号进行抑制 处理, 所述抑制处理包括能量衰减处理、 删除处理和静默处理中的至少一种。 11. 根据权利要求 10 所述的装置, 其特征在于, 所述装置还包括 : 频带划分模块, 用于将所述语音信号的频带划分为 N 个子频带, N 2 且 N 为整数 ; 能量计算模块, 用于计算所述语音信号在所述 N 个子频带内的能量分布 ; 类型确定模块, 用于根据所述能量分布确定所述语音信号的喷麦类型。 12. 根据权利要求。
12、 11 所述的装置, 其特征在于, 所述喷麦抑制模块, 包括 : 第一频段划分单元, 用于当所述语音信号的喷麦类型为带正常清音的喷麦信号时, 根 据所述能量分布将所述 N 个子频带划分为清音频段、 衔接频段和喷麦频段 ; 第一能量计算 单元, 用于计算所述衔接频段中每个子频带内各个频点的平均能量 ; 第一能量衰减单元, 用 于根据所述平均能量的最小值对所述喷麦频段内各个频点的能量进行衰减 ; 或者, 第二频段划分单元, 用于当所述语音信号的喷麦类型为不带正常清音的轻喷麦信号 时, 根据所述能量分布将所述 N 个子频带划分为高频喷麦频段和低频喷麦频段 ; 第二能量 计算单元, 用于计算所述高频喷。
13、麦频段内各个频点的平均能量 ; 第二能量衰减单元, 用于根 据所述平均能量对所述低频喷麦频段内各个频点的能量进行衰减 ; 或者, 第三能量衰减单元, 用于当所述语音信号的喷麦类型为不带正常清音的强喷麦信号 时, 根据预设衰减系数对所述语音信号中各个频点的能量进行衰减。 13. 根据权利要求 10 所述的装置, 其特征在于, 所述喷麦检测模块, 包括 : 频域分布获 取单元和喷麦检测单元 ; 所述频域分布获取单元, 用于获取所述语音信号的频域分布特性 ; 所述喷麦检测单元, 用于根据所述频域分布特性检测所述语音信号是否属于所述喷麦 信号。 14. 根据权利要求 13 所述的装置, 其特征在于, 。
14、所述频域分布获取单元, 还用于当所述频域分布特性为能量谱重心时, 按照如下公式 计算所述语音信号的能量谱重心 WF(i) : 其中, i 表示所述语音信号在语音序列中的帧序号, i 0 且 i 为整数 ; L 表示第 i 帧语 音信号的帧长, L 1 且 L 为整数 ; k 表示所述第 i 帧语音信号中第 k 个频点, k 0, L-1 且 k 为整数 ; Y(k,i)2表示所述第 i 帧语音信号中第 k 个频点的能量 ; 所述喷麦检测单元, 还包括 : 重心检测子单元和喷麦确定子单元 ; 所述重心检测子单元, 用于检测所述语音信号的能量谱重心 WF(i) 是否小于能量谱重 心阈值 ; 所。
15、述喷麦确定子单元, 用于当所述语音信号的能量谱重心 WF(i) 小于所述能量谱重心 权 利 要 求 书 CN 104409081 A 4 4/4 页 5 阈值时, 确定所述语音信号属于所述喷麦信号。 15. 根据权利要求 10 至 14 任一所述的装置, 其特征在于, 所述清音检测模块, 包括 : 非 浊音检测单元、 第一特征值计算单元和第一清音检测单元 ; 所述非浊音检测单元, 用于检测所述语音信号是否属于非浊音信号, 所述非浊音信号 包括所述清音信号和非人声信号 ; 所述第一特征值计算单元, 用于当所述语音信号属于所述非浊音信号时, 计算所述语 音信号的第一特征值, 所述第一特征值为能量或。
16、者倒谱距离 ; 所述第一清音检测单元, 用于根据所述第一特征值检测所述语音信号是否属于所述清 音信号。 16. 根据权利要求 15 所述的装置, 其特征在于, 所述非浊音检测单元, 包括 : 第二特征值计算子单元, 用于计算所述语音信号的第二特征值, 所述第二特征值为谱 熵值、 过零率、 相关性、 分形维数中的任意一种 ; 非浊音检测子单元, 用于根据所述第二特征 值检测所述语音信号是否属于所述非浊音信号 ; 或者, 特性检测子单元, 用于检测所述语音信号是否存在预定特性, 所述预定特性为基音周 期、 谐波、 共振峰中的任意一种 ; 非浊音确定子单元, 用于当所述语音信号不存在所述预定 特性时。
17、, 确定所述语音信号属于所述非浊音信号。 17. 根据权利要求 10 至 14 任一所述的装置, 其特征在于, 所述清音检测模块, 包括 : 第 一计算单元、 人声检测单元、 第二计算单元和第二清音检测单元 ; 所述第一计算单元, 用于计算所述语音信号的第一特征值, 所述第一特征值为能量或 者倒谱距离 ; 所述人声检测单元, 用于根据所述第一特征值检测所述语音信号是否属于所述人声信 号, 所述人声信号包括所述清音信号和浊音信号 ; 所述第二计算单元, 用于当所述语音信号属于所述人声信号时, 计算所述语音信号的 第二特征值, 所述第二特征值为谱熵值、 过零率、 相关性、 分形维数中的任意一种 ;。
18、 所述第二清音检测单元, 用于根据所述第二特征值检测所述语音信号是否属于所述清 音信号。 18. 根据权利要求 10 至 14 任一所述的装置, 其特征在于, 所述清音检测模块, 包括 : 第 一计算单元、 人声检测单元、 特性检测单元和清音确定单元 ; 所述第一计算单元, 用于计算所述语音信号的第一特征值, 所述第一特征值为能量或 者倒谱距离 ; 所述人声检测单元, 用于根据所述第一特征值检测所述语音信号是否属于所述人声信 号, 所述人声信号包括所述清音信号和浊音信号 ; 所述特性检测单元, 用于当所述语音信号属于所述人声信号时, 检测所述语音信号是 否存在预定特性, 所述预定特性为基音周期。
19、、 谐波、 共振峰中的任意一种 ; 所述清音确定单元, 用于当所述语音信号不存在所述预定特性时, 确定所述语音信号 属于所述清音信号。 权 利 要 求 书 CN 104409081 A 5 1/20 页 6 语音信号处理方法和装置 技术领域 0001 本发明涉及音频处理技术领域, 特别涉及一种语音信号处理方法和装置。 背景技术 0002 在人们的日常工作和生活中经常会用到麦克风。在使用麦克风说话或唱歌时, 却 常常会遇到喷麦的困扰。 0003 针对喷麦, 常用的处理方式包括如下两种 : 第一, 人们在使用麦克风时, 控制嘴巴 和麦克风之间的距离、 角度, 以尽可能地减少喷麦情况的发生 ; 第二。
20、, 采用后期人工修复的 方式, 由技术人员从录制的音频中找出喷麦位置, 并进行手动衰减处理。 0004 在实现本发明的过程中, 发明人发现上述技术至少存在以下问题 : 上述第一种方 式无法完全避免喷麦情况的发生, 而上述第二种方式在处理实时性和处理效率方面也存在 很大不足。 发明内容 0005 为了解决上述技术中针对喷麦的处理方式存在实时性差和效率低的问题, 本发明 实施例提供了一种语音信号处理方法和装置。所述技术方案如下 : 0006 第一方面, 提供了一种语音信号处理方法, 所述方法包括 : 0007 获取麦克风采集的语音信号 ; 0008 检测所述语音信号是否属于清音信号, 所述清音信号。
21、包括正常清音信号和喷麦信 号, 所述喷麦信号是指气流从发声者嘴巴喷至所述麦克风而产生的语音信号 ; 0009 若所述语音信号属于所述清音信号, 则检测所述语音信号是否属于所述喷麦信 号 ; 0010 若所述语音信号属于所述喷麦信号, 则对所述语音信号进行抑制处理, 所述抑制 处理包括能量衰减处理、 删除处理和静默处理中的至少一种。 0011 可选的, 所述对所述语音信号进行抑制处理之前, 还包括 : 0012 将所述语音信号的频带划分为 N 个子频带, N 2 且 N 为整数 ; 0013 计算所述语音信号在所述 N 个子频带内的能量分布 ; 0014 根据所述能量分布确定所述语音信号的喷麦类。
22、型。 0015 可选的, 所述对所述语音信号进行抑制处理, 包括 : 0016 若所述语音信号的喷麦类型为带正常清音的喷麦信号, 则根据所述能量分布将所 述 N 个子频带划分为清音频段、 衔接频段和喷麦频段 ; 计算所述衔接频段中每个子频带内 各个频点的平均能量 ; 根据所述平均能量的最小值对所述喷麦频段内各个频点的能量进行 衰减 ; 0017 或者, 0018 若所述语音信号的喷麦类型为不带正常清音的轻喷麦信号, 则根据所述能量分布 将所述 N 个子频带划分为高频喷麦频段和低频喷麦频段 ; 计算所述高频喷麦频段内各个频 说 明 书 CN 104409081 A 6 2/20 页 7 点的平均。
23、能量 ; 根据所述平均能量对所述低频喷麦频段内各个频点的能量进行衰减 ; 0019 或者, 0020 若所述语音信号的喷麦类型为不带正常清音的强喷麦信号, 则根据预设衰减系数 对所述语音信号中各个频点的能量进行衰减。 0021 可选的, 所述检测所述语音信号是否属于所述喷麦信号, 包括 : 0022 获取所述语音信号的频域分布特性 ; 0023 根据所述频域分布特性检测所述语音信号是否属于所述喷麦信号。 0024 可选的, 当所述频域分布特性为能量谱重心时, 所述获取所述语音信号的频域分 布特性, 包括 : 0025 按照如下公式计算所述语音信号的能量谱重心 WF(i) : 0026 0027。
24、 其中, i 表示所述语音信号在语音序列中的帧序号, i 0 且 i 为整数 ; L 表示第 i 帧语音信号的帧长, L 1 且 L 为整数 ; k 表示所述第 i 帧语音信号中第 k 个频点, k 0, L-1 且 k 为整数 ; Y(k,i)2表示所述第 i 帧语音信号中第 k 个频点的能量 ; 0028 所述根据所述频域分布特性检测所述语音信号是否属于所述喷麦信号, 包括 : 0029 检测所述语音信号的能量谱重心 WF(i) 是否小于能量谱重心阈值 ; 0030 若小于所述能量谱重心阈值, 则确定所述语音信号属于所述喷麦信号。 0031 可选的, 所述检测所述语音信号是否属于清音信。
25、号, 包括 : 0032 检测所述语音信号是否属于非浊音信号, 所述非浊音信号包括所述清音信号和非 人声信号 ; 0033 若所述语音信号属于所述非浊音信号, 则计算所述语音信号的第一特征值, 所述 第一特征值为能量或者倒谱距离 ; 0034 根据所述第一特征值检测所述语音信号是否属于所述清音信号。 0035 可选的, 所述检测所述语音信号是否属于非浊音信号, 包括 : 0036 计算所述语音信号的第二特征值, 所述第二特征值为谱熵值、 过零率、 相关性、 分 形维数中的任意一种 ; 根据所述第二特征值检测所述语音信号是否属于所述非浊音信号 ; 0037 或者, 0038 检测所述语音信号是否。
26、存在预定特性, 所述预定特性为基音周期、 谐波、 共振峰中 的任意一种 ; 若所述语音信号不存在所述预定特性, 则确定所述语音信号属于所述非浊音 信号。 0039 可选的, 所述检测所述语音信号是否属于清音信号, 包括 : 0040 计算所述语音信号的第一特征值, 所述第一特征值为能量或者倒谱距离 ; 0041 根据所述第一特征值检测所述语音信号是否属于所述人声信号, 所述人声信号包 括所述清音信号和浊音信号 ; 0042 若所述语音信号属于所述人声信号, 则计算所述语音信号的第二特征值, 所述第 二特征值为谱熵值、 过零率、 相关性、 分形维数中的任意一种 ; 说 明 书 CN 104409。
27、081 A 7 3/20 页 8 0043 根据所述第二特征值检测所述语音信号是否属于所述清音信号。 0044 可选的, 所述检测所述语音信号是否属于清音信号, 包括 : 0045 计算所述语音信号的第一特征值, 所述第一特征值为能量或者倒谱距离 ; 0046 根据所述第一特征值检测所述语音信号是否属于所述人声信号, 所述人声信号包 括所述清音信号和浊音信号 ; 0047 若所述语音信号属于所述人声信号, 则检测所述语音信号是否存在预定特性, 所 述预定特性为基音周期、 谐波、 共振峰中的任意一种 ; 0048 若所述语音信号不存在所述预定特性, 则确定所述语音信号属于所述清音信号。 0049。
28、 第二方面, 提供了一种语音信号处理装置, 所述装置包括 : 0050 语音获取模块, 用于获取麦克风采集的语音信号 ; 0051 清音检测模块, 用于检测所述语音信号是否属于清音信号, 所述清音信号包括正 常清音信号和喷麦信号, 所述喷麦信号是指气流从发声者嘴巴喷至所述麦克风而产生的语 音信号 ; 0052 喷麦检测模块, 用于当所述语音信号属于所述清音信号时, 检测所述语音信号是 否属于所述喷麦信号 ; 0053 喷麦抑制模块, 用于当所述语音信号属于所述喷麦信号时, 对所述语音信号进行 抑制处理, 所述抑制处理包括能量衰减处理、 删除处理和静默处理中的至少一种。 0054 可选的, 所述。
29、装置还包括 : 0055 频带划分模块, 用于将所述语音信号的频带划分为N个子频带, N2且N为整数 ; 0056 能量计算模块, 用于计算所述语音信号在所述 N 个子频带内的能量分布 ; 0057 类型确定模块, 用于根据所述能量分布确定所述语音信号的喷麦类型。 0058 可选的, 所述喷麦抑制模块, 包括 : 0059 第一频段划分单元, 用于当所述语音信号的喷麦类型为带正常清音的喷麦信号 时, 根据所述能量分布将所述 N 个子频带划分为清音频段、 衔接频段和喷麦频段 ; 第一能量 计算单元, 用于计算所述衔接频段中每个子频带内各个频点的平均能量 ; 第一能量衰减单 元, 用于根据所述平均。
30、能量的最小值对所述喷麦频段内各个频点的能量进行衰减 ; 0060 或者, 0061 第二频段划分单元, 用于当所述语音信号的喷麦类型为不带正常清音的轻喷麦信 号时, 根据所述能量分布将所述 N 个子频带划分为高频喷麦频段和低频喷麦频段 ; 第二能 量计算单元, 用于计算所述高频喷麦频段内各个频点的平均能量 ; 第二能量衰减单元, 用于 根据所述平均能量对所述低频喷麦频段内各个频点的能量进行衰减 ; 0062 或者, 0063 第三能量衰减单元, 用于当所述语音信号的喷麦类型为不带正常清音的强喷麦信 号时, 根据预设衰减系数对所述语音信号中各个频点的能量进行衰减。 0064 可选的, 所述喷麦检。
31、测模块, 包括 : 频域分布获取单元和喷麦检测单元 ; 0065 所述频域分布获取单元, 用于获取所述语音信号的频域分布特性 ; 0066 所述喷麦检测单元, 用于根据所述频域分布特性检测所述语音信号是否属于所述 喷麦信号。 0067 可选的, 所述频域分布获取单元, 还用于当所述频域分布特性为能量谱重心时, 按 说 明 书 CN 104409081 A 8 4/20 页 9 照如下公式计算所述语音信号的能量谱重心 WF(i) : 0068 0069 其中, i 表示所述语音信号在语音序列中的帧序号, i 0 且 i 为整数 ; L 表示第 i 帧语音信号的帧长, L 1 且 L 为整数 ; 。
32、k 表示所述第 i 帧语音信号中第 k 个频点, k 0, L-1 且 k 为整数 ; Y(k,i)2表示所述第 i 帧语音信号中第 k 个频点的能量 ; 0070 所述喷麦检测单元, 还包括 : 重心检测子单元和喷麦确定子单元 ; 0071 所述重心检测子单元, 用于检测所述语音信号的能量谱重心 WF(i) 是否小于能量 谱重心阈值 ; 0072 所述喷麦确定子单元, 用于当所述语音信号的能量谱重心 WF(i) 小于所述能量谱 重心阈值时, 确定所述语音信号属于所述喷麦信号。 0073 可选的, 所述清音检测模块, 包括 : 非浊音检测单元、 第一特征值计算单元和第一 清音检测单元 ; 。
33、0074 所述非浊音检测单元, 用于检测所述语音信号是否属于非浊音信号, 所述非浊音 信号包括所述清音信号和非人声信号 ; 0075 所述第一特征值计算单元, 用于当所述语音信号属于所述非浊音信号时, 计算所 述语音信号的第一特征值, 所述第一特征值为能量或者倒谱距离 ; 0076 所述第一清音检测单元, 用于根据所述第一特征值检测所述语音信号是否属于所 述清音信号。 0077 可选的, 所述非浊音检测单元, 包括 : 0078 第二特征值计算子单元, 用于计算所述语音信号的第二特征值, 所述第二特征值 为谱熵值、 过零率、 相关性、 分形维数中的任意一种 ; 非浊音检测子单元, 用于根据所述。
34、第二 特征值检测所述语音信号是否属于所述非浊音信号 ; 0079 或者, 0080 特性检测子单元, 用于检测所述语音信号是否存在预定特性, 所述预定特性为基 音周期、 谐波、 共振峰中的任意一种 ; 非浊音确定子单元, 用于当所述语音信号不存在所述 预定特性时, 确定所述语音信号属于所述非浊音信号。 0081 可选的, 所述清音检测模块, 包括 : 第一计算单元、 人声检测单元、 第二计算单元和 第二清音检测单元 ; 0082 所述第一计算单元, 用于计算所述语音信号的第一特征值, 所述第一特征值为能 量或者倒谱距离 ; 0083 所述人声检测单元, 用于根据所述第一特征值检测所述语音信号是。
35、否属于所述人 声信号, 所述人声信号包括所述清音信号和浊音信号 ; 0084 所述第二计算单元, 用于当所述语音信号属于所述人声信号时, 计算所述语音信 号的第二特征值, 所述第二特征值为谱熵值、 过零率、 相关性、 分形维数中的任意一种 ; 0085 所述第二清音检测单元, 用于根据所述第二特征值检测所述语音信号是否属于所 述清音信号。 说 明 书 CN 104409081 A 9 5/20 页 10 0086 可选的, 所述清音检测模块, 包括 : 第一计算单元、 人声检测单元、 特性检测单元和 清音确定单元 ; 0087 所述第一计算单元, 用于计算所述语音信号的第一特征值, 所述第一特。
36、征值为能 量或者倒谱距离 ; 0088 所述人声检测单元, 用于根据所述第一特征值检测所述语音信号是否属于所述人 声信号, 所述人声信号包括所述清音信号和浊音信号 ; 0089 所述特性检测单元, 用于当所述语音信号属于所述人声信号时, 检测所述语音信 号是否存在预定特性, 所述预定特性为基音周期、 谐波、 共振峰中的任意一种 ; 0090 所述清音确定单元, 用于当所述语音信号不存在所述预定特性时, 确定所述语音 信号属于所述清音信号。 0091 本发明实施例提供的技术方案带来的有益效果是 : 0092 通过对麦克风采集的语音信号进行实时检测, 当检测出该语音信号属于喷麦信号 时, 对该语音。
37、信号进行抑制处理 ; 解决了背景技术中针对喷麦的处理方式存在实时性差和 效率低的问题 ; 提高了喷麦处理的实时性和效率, 且无需人工后期修复, 达到了自动检测抑 制喷麦的效果。 附图说明 0093 为了更清楚地说明本发明实施例中的技术方案, 下面将对实施例描述中所需要使 用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本发明的一些实施例, 对于 本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他 的附图。 0094 图 1 是本发明一个实施例提供的语音信号处理方法的方法流程图 ; 0095 图 2 是本发明另一实施例提供的语音信号处理方法的方法流程图。
38、 ; 0096 图 3 是本发明再一实施例提供的语音信号处理方法的方法流程图 ; 0097 图 4 是本发明一个实施例提供的语音信号处理装置的结构方框图 ; 0098 图 5 是本发明另一实施例提供的语音信号处理装置的结构方框图 ; 0099 图 6 是本发明一个实施例提供的电子设备的结构示意图。 具体实施方式 0100 为使本发明的目的、 技术方案和优点更加清楚, 下面将结合附图对本发明实施方 式作进一步地详细描述。 0101 首先, 对本发明各个实施例中涉及的一些名词进行定义和说明 : 0102 1、 浊音信号 : 是指麦克风采集到的因发声者声带振动而产生的语音信号。 0103 2、 清音。
39、信号 : 是指麦克风采集到的因发声者声带不振动而产生的语音信号。清音 信号包括正常清音信号和喷麦信号。 0104 3、 喷麦信号 : 是指气流从发声者嘴巴喷至麦克风而产生的语音信号。 0105 4、 正常清音信号, 是指清音信号中除喷麦信号之外的语音信号, 是发声者处于说 话、 唱歌等发声状态时正常产生的清音信号。 0106 在实现本发明实施例的过程中, 发明人发现 : 喷麦信号属于清音信号, 但喷麦信号 说 明 书 CN 104409081 A 10 6/20 页 11 和正常清音信号又存在区别。 所以, 通过对麦克风采集的语音信号进行实时检测, 比如逐帧 检测, 当检测出该麦克风采集的语音。
40、信号属于清音信号时, 根据喷麦信号和正常清音信号 的区别, 进一步检测该采集到的语音信号是否属于喷麦信号, 进而在检测出属于喷麦信号 的情况下, 对该采集到的语音信号做实时的抑制处理。 0107 请参考图 1, 其示出了本发明一个实施例提供的语音信号处理方法的方法流程图, 本实施例以该语音信号处理方法应用于诸如手机、 平板电脑、 膝上型便携式计算机、 台式计 算机之类的电子设备中。该语音信号处理方法可以包括如下几个步骤 : 0108 步骤 102, 获取麦克风采集的语音信号。 0109 步骤 104, 检测语音信号是否属于清音信号, 清音信号包括正常清音信号和喷麦信 号, 喷麦信号是指气流从发。
41、声者嘴巴喷至麦克风而产生的语音信号。 0110 步骤 106, 若语音信号属于清音信号, 则检测语音信号是否属于喷麦信号。 0111 步骤 108, 若语音信号属于喷麦信号, 则对语音信号进行抑制处理, 该抑制处理包 括能量衰减处理、 删除处理和静默处理中的至少一种。 0112 综上所述, 本实施例提供的语音信号处理方法, 通过对麦克风采集的语音信号进 行实时检测, 当检测出该语音信号属于喷麦信号时, 对该语音信号进行抑制处理 ; 解决了背 景技术中针对喷麦的处理方式存在实时性差和效率低的问题 ; 提高了喷麦处理的实时性和 效率, 且无需人工后期修复, 达到了自动检测抑制喷麦的效果。 0113。
42、 请参考图 2, 其示出了本发明另一实施例提供的语音信号处理方法的方法流程图, 本实施例以该语音信号处理方法应用于诸如手机、 平板电脑、 膝上型便携式计算机、 台式计 算机之类的电子设备中。该语音信号处理方法可以包括如下几个步骤 : 0114 步骤 201, 获取麦克风采集的语音信号。 0115 电子设备获取麦克风采集的语音信号。其中, 麦克风可以是电动式、 电容式、 压电 式、 电磁式、 碳粒式、 半导体式等任意类型的麦克风, 本实施例对此不作具体限定。 麦克风采 集发声者产生的语音信号后, 以有线或无线的方式传输给电子设备。 当然, 在其它可能的实 施方式中, 麦克风可集成于电子设备中, 。
43、成为电子设备的一部分。另外, 为了提高处理的实 时性, 电子设备可以逐帧获取麦克风采集的语音信号, 并后续对语音信号进行逐帧检测和 处理。 0116 步骤 202, 检测语音信号是否属于清音信号。 0117 语音信号可划分为浊音信号、 清音信号和非人声信号三种。 其中, 浊音信号是指麦 克风采集到的因发声者声带振动而产生的语音信号 ; 清音信号是指麦克风采集到的因发声 者声带不振动而产生的语音信号 ; 非人声信号是指非发声者产生的语音信号, 如背景噪声 或无声。另外, 清音信号包括正常清音信号和喷麦信号。正常清音信号是指清音信号中除 喷麦信号之外的语音信号, 是发声者处于说话、 唱歌等发声状态。
44、时正常产生的清音信号。 0118 在本实施例中, 本步骤可以包括如下两个子步骤 : 0119 第一, 检测语音信号是否属于非浊音信号。 0120 非浊音信号是指语音信号中除浊音信号之外的语音信号, 包括清音信号和非人声 信号。 0121 在第一种可能的实施方式中, 电子设备可通过如下两个步骤检测语音信号是否属 于非浊音信号 : 说 明 书 CN 104409081 A 11 7/20 页 12 0122 1、 计算语音信号的第二特征值, 第二特征值为谱熵值、 过零率、 相关性、 分形维数 中的任意一种。 0123 其中, 谱熵值是指语音信号的能量谱的熵值, 与语音信号在频域的能量谱密度分 布有。
45、关。谱熵值越大, 表明语音信号在频域的能量谱密度分布越均匀 ; 反之, 谱熵值越小, 表明语音信号在频域的能量谱密度分布越不均匀。 非浊音信号和浊音信号的谱熵值存在区 别, 非浊音信号的谱熵值较大, 而浊音信号的谱熵值较小。 通过谱熵值可对非浊音信号和浊 音信号进行区分。 0124 过零率(英文 : Zero-crossing Rate ; 简称 : ZCR)是指单位时间内信号值通过零值 的次数, 常用于语音信号分析中。 非浊音信号和浊音信号的过零率存在区别, 非浊音信号的 过零率较大, 而浊音信号的过零率较小。 通过过零率可对非浊音信号和浊音信号进行区分。 0125 另外, 在其它可能的实施。
46、方式中, 还可通过语音信号的相关性或者分形维数对非 浊音信号和浊音信号进行区分。非浊音信号的相关性较小, 而浊音信号的相关性较大。非 浊音信号的分形维数较大, 而浊音信号的分形维数较小。 0126 在一个具体的例子中, 以计算语音信号的谱熵值为例。电子设备按照下述公式计 算语音信号的谱熵值 H(i) : 0127 0128 其中, i 表示语音信号在语音序列中的帧序号, i 0 且 i 为整数 ; L 表示第 i 帧语 音信号的帧长, L 1 且 L 为整数 ; k 表示第 i 帧语音信号中第 k 个频点, k 0, L-1 且 k 为整数 ; P(k,i) 表示归一化谱概率密度。 0129 。
47、其中, 电子设备可按照下述公式计算归一化谱概率密度 P(k,i) : 0130 0131 其中, Y(k,i)2表示第 i 帧语音信号中第 k 个频点的能量。 0132 2、 根据第二特征值检测语音信号是否属于非浊音信号。 0133 当第一特征值为谱熵值时, 检测语音信号的谱熵值是否大于预设谱熵值门限值 ; 若大于预设谱熵值门限值, 则确定该语音信号属于非浊音信号。 否则, 确定该语音信号属于 浊音信号。其中, 预设谱熵值门限值是根据实际需求预先设定的经验值。 0134 当第二特征值为过零率时, 检测语音信号的过零率是否大于预设过零率门限值 ; 若大于预设过零率门限值, 则确定该语音信号属。
48、于非浊音信号。 否则, 确定该语音信号属于 浊音信号。其中, 预设过零率门限值是根据实际需求预先设定的经验值。 0135 当第二特征值为相关性时, 检测语音信号的相关性是否小于预设相关性门限值 ; 若小于预设相关性门限值, 则确定该语音信号属于非浊音信号。 否则, 确定该语音信号属于 浊音信号。其中, 预设相关性门限值是根据实际需求预先设定的经验值。 0136 当第二特征值为分形维数时, 检测语音信号的分形维数是否大于预设分形维数门 限值 ; 若大于预设分形维数门限值, 则确定该语音信号属于非浊音信号。否则, 确定该语音 信号属于浊音信号。其中, 预设分形维数门限值是根据实际需求预先设定的经验值。 0137 在第二种可能的实施方式中, 电子设备可通过如下两个步骤检测语音信号是否属 说 明 书 CN 104409081 A 12 8/20 页 13 于非浊音信号 : 0138 1、 检测语音信号是否存在预定特性, 预定特性为基音周期、 谐波、 共振峰中的任意 一种。 0139 其中, 基音周期是指发声者通过声带振动发出浊音时的声带振动周期。非浊音信 号不存在基因周期, 而浊音信号存在基音周期。 因此, 电子设备可通过检测语音信号是否存 在基音周期以区分该语音信号属于非浊音信号还是浊音信号。另外, 在其它可能的实施方 式中。
RF电路610可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器680处理;另外,将涉及上行的数据发送给基站。通常,RF电路610包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、LNA(LowNoiseAmplifier,低噪声放大器)、双工器等。此外,RF电路610还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通 信标准或协议,包括但不限于GSM(GlobalSystemofMobilecommunication,全球移动通讯系统)、GPRS(GeneralPacketRadioService,通用分组无线服务)、CDMA(CodeDivisionMultipleAccess,码分多址)、WCDMA(WidebandCodeDivisionMultipleAccess,宽带码分多址)、LTE(LongTermEvolution,长期演进)、电子邮件、SMS(ShortMessagingService,短消息服务)等。
搜索您想要找的内容!
地址:广东省广州市 电话:HASHKFK 手机:HASHKFK
Copyright © 2012-2023 爱体育(AITIYU)官方网站户外滑雪培训设备有限公司 版权所有 非商用版本 ICP备案编号: