CN107910019A

CN107910019A - 一种人体声音信号处理及分析方法

Info

Publication number: CN107910019A
Application number: CN201711239852.6A
Authority: CN
Inventors: 徐静波; 苑韬; 张海英
Original assignee: Institute of Microelectronics of CAS
Current assignee: Institute of Microelectronics of CAS
Priority date: 2017-11-30
Filing date: 2017-11-30
Publication date: 2018-04-13
Anticipated expiration: 2037-11-30
Also published as: CN107910019B

Abstract

本发明提供一种人体声音信号处理及分析方法，包括：步骤一、采集固定内容的人体声音信号并处理获得功率谱数据；步骤二、划分五音系列频率范围，计算每个音系列频率范围内的功率谱数据占五音系列频率范围内功率谱数据的比例；步骤三、根据固定内容中的每个固定内容的比例，赋予权值并进行计权统计；步骤四、将固定内容的每个固定内容的对应音的计权统计结果相加得到总权值范围；步骤五、对总权值范围划分权值阶段，根据不同所述权值阶段的声音的特征总结人体的特征。本发明能够更加直观、全面、准确地描述人体声音特征。

Description

一种人体声音信号处理及分析方法

技术领域

本发明涉及信号处理分析技术领域，尤其涉及一种人体声音信号处理及分析方法。

背景技术

声音是人类传递交换信息的重要方式，同时，声音与人体健康状态之间也存在密切的关联。例如，中医理论主张可以通过辨识人体当前声音信号与健康状态正常时声音信号的差异来判断人体当前的健康程度。其中，基于五声(呼、笑、歌、哭、呻)及五音(角、徵、宫、商、羽)应五脏(肝、心、脾、肺、肾)理论，中医闻诊可以通过辨识患者说话声音、语言的变化，以及呼吸、咳嗽、呕吐、呃逆、嗳气、太息、喷嚏、肠鸣、婴儿啼哭等声音信息，预见疾病等人体身体健康状况的变化。

但是，传统中医闻诊方法停留在依靠医生的主观听觉对人体声音信号进行判断的阶段，由于医生感官的个体差异，以及个体心理、环境的影响，在对人体声音信号的分析判断会产生差异。出于健康判断目的考虑而对人体声音信号进行分析、判断的标准化、客观化成为亟待解决的问题。

因此，近年来，为实现对人体声音信号分析判断的标准化、客观化，人们用仪器对声音进行客观、定量的记录、计算、分析和判断，了解人体声音的变化，提高健康情况的预见性。例如，语图仪、声谱仪、喉声气流图仪、频谱分析仪等仪器设备，通过利用傅里叶变换、小波变换、希尔伯特-黄变换等信号处理方法，获取时域、频域、功率谱等有辅助分析判断意义的声音信息，进而根据振幅、频率、泛音等信息反映出响度、音调、音品等声音特性，从而将受试者的声音信息与正常健康状况的对比者的声音信息进行比对，得出声音的差异性。

但是，由于人的说话声音具有非线性特征，声音的时域、频域、功率谱数据是二维的平面曲线图形，使用机器设备进行常规的数据处理、分析方式，难以获得直观、明晰的分析结果。

因此，在现有技术的基础上，仍需要设计一种人体声音信号分析方法，解决现有技术中使用时域、频域、功率谱数等二维平面曲线图形态的指标难以全面描述人体声音特征的技术问题。

发明内容

本发明提供的人体声音信号处理及分析方法，能够针对现有技术的不足，解决现有技术设备难以全面、准确地描述人体声音特征的问题。

本发明提供的人体声音信号处理及分析方法，包括：

步骤一、采集固定内容的人体声音信号并处理获得所述人体声音信号的功率谱数据；

步骤二、划分所述功率谱数据的五音系列频率范围，计算所述五音中的每个音系列频率范围内的功率谱数据占所述五音系列频率范围内的功率谱数据的比例；

步骤三、根据所述固定内容中的每个固定内容的所述比例，赋予权值并进行计权统计；

步骤四、将所述固定内容的每个固定内容的对应音的所述计权统计结果相加得到总权值范围；

步骤五、对所述总权值范围划分权值阶段，根据不同所述权值阶段的声音的特征总结人体的特征。

可选地，上述步骤一中包括采集所述人体声音信号的初始数据，并滤除环境噪声后得到所述功率谱数据。

可选地，上述固定内容由多名测试者读出，且每名测试者重复多次读出所述固定内容。

可选地，上述步骤二中划分五音系列频率范围包括将261-523Hz的音程分别划分出261-293Hz、293-329Hz、329-392Hz、392-440Hz、440-523Hz的频率区间作为宫、商、角、徵、羽的基本频率范围，并在每个所述频率区间进行1/8、1/4、1/2分频和2、4、8倍频，得到所述宫、商、角、徵、羽五音的系列频率范围。

可选地，上述步骤二中的所述比例根据所述每名测试者的重复次数求数学平均值。

可选地，当上述步骤二中的所述比例大于50％，则赋权值4；比例为不超过50％范围的相同音的所有固定内容中的最大值，则赋权值2；比例为不超过50％范围的相同音的所有固定内容中的第二大值，则赋权值1；比例为不超过50％范围的相同音的所有固定内容中的第三大值，则赋权值0；比例为不超过50％范围的相同音的所有固定内容中的最小值，则赋权值-1。

可选地，上述步骤四中包括在所述多名测试者的总权值中选出最大总权值和最小总权值，并以最大总权值减去最小总权值得到所述总权值范围。

可选地，上述步骤五包括将所述多名测试者分为权值较大、权值较小以及权值中等的三组人群，用于根据每组的声音能量-频率分布特点总结人体的特征。

可选地，上述步骤五还包括根据人体体质类型或疾病特征进一步将所述各组人群分为不同小组。

可选地，上述步骤五还包括结合中医的形色、望、问、切的结果对分组进行调整。

本发明提供的人体声音信号处理及分析方法，基于现代音乐理论和中医理论，通过将不同频率系列范围内的人体声音的功率数据辅以权值，从而将人体声音数据的呈现形式由二维平面曲线图形转为数值，能够更加直观、全面、准确地描述人体声音特征。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

下面结合附图和实施例对本发明作进一步的详细说明。

图1为本发明一个实施例提供的人体声音信号处理及分析方法的步骤流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一：

本发明的一个实施例提供了一种人体声音信号处理及分析方法。图1示出了本发明一个实施例提供的人体声音信号处理及分析方法的步骤流程图。

如图1所示，S11表示采集L个测试者重复M次的N个固定文字的人体声音信号。在本发明的实施例中，具体地，由测试者说出固定内容，由此获得人体声音信号的初始数据。优选的，由多个测试者进行测试，测试者的数量为L；每个测试者对固定内容重复多次，重复的次数为M；固定内容包括但不限于元音、辅音、单字、短语等，且固定文字为多个，固定文字的数量为N。由此获得人体声音信号的初始数据数量为L×M×N组。

S12表示处理得到L×M×N组初始功率谱数据；滤除环境噪声后，得到L×M×N组功率谱数据。具体地，在本实施例中，经过对人体声音信号的初始数据的采集和初步处理，得到L×M×N组人体声音信号的初始功率谱数据。经过环境噪声的滤除后，得到L×M×N组人体声音信号的功率谱数据。结合现代音乐理论与中医理论，对每组人体声音信号的功率谱数据划分宫、商、角、徵、羽五音的每个音的系列频率范围。

S13表示划分每组功率谱的五音的系列频率范围；计算每个音的系列频率范围内的功率谱数据占五个音系列频率范围内功率谱数据总和的比例；计算M次重复后的五音各自的数学平均值。具体地，在本实施例中，计算每个人体声音信号在五音的每个音的系列频率范围内的功率谱数据占人体声音信号在五个音系列频率范围内功率谱数据总和的比例，得到每个测试者的每个固定文字内容的功率谱数据在M次重复过程中的五音各自的平均值P_宫、P_商、P_角、P_徵、P_羽。

S14表示分别对N个固定文字的五音各自的数学平均值赋予权值进行计权统计。具体地，在本实施例中，分别对N个固定文字内容的P_宫、P_商、P_角、P_徵、P_羽赋予权值并进行计权统计，如果某个音的N个固定文字内容中的某个字的平均值比例大于50％，则给该音的该字的平均值赋权值4；如果某个音的N个固定文字内容中的某个字的平均值比例是不超过50％范围中的最大值，则给该音的该字的平均值赋权值2；如果某个音的N个固定文字内容中的某个字的平均值比例是不超过50％范围中的次大值，则给该音的该字的平均值赋权值1；如果某个音的N个固定文字内容中的某个字的平均值比例是不超过50％范围中的第三大的值，则给该音的该字的平均值赋权值0；如果某个音的N个固定文字内容中的某个字的平均值比例是最小值，则给该音的该字的平均值赋权值-1。

S15表示将N个固定文字的五音权值相加得到总权值；在L个测试者的总权值中找出每个音的总权值最大值V_max、最小值V_min；计算得到每一个音的总权值范围V＝V_max-V_min。具体地，在本实施例中，将每个测试者的N个固定文字内容的五音权值分别相加，得到每个测试者的总权值V_宫、V_商、V_角、V_徵、V_羽。由于共有L个测试者，则V_宫、V_商、V_角、V_徵、V_羽各有L个。在每个音的L个数值中找出每一个音的总权值最大值V_max、最小值V_min，从而计算得到每一个音的总权值范围V＝V_max-V_min。

S16表示针对每个音，将测试者初步分为权值大(权值大于95％V)、权值小(权值小于5％V)、权值中(权值介于5％V和95％V之间)的三组样本。具体地，在本实施例中，针对每个音，将测试者初步分为权值大(权值大于95％V)、权值小(权值小于5％V)、权值中(权值介于5％V和95％V之间)的三组样本，五个音共有15组样本。

S17表示根据五个音的样本声音的能量—频率分布特点挖掘具有特定权值范围的声音的人体共性特征。具体地，在本实施例中，根据分析调整后的15组样本声音的能量—频率分布特点，挖掘在五音中具有特定权值范围的声音的人体共性特征。

实施例二：

本发明的另一个实施例提供了一种人体声音信号处理及分析方法。在本实施例中，由测试者读出“床”、“前”、“明”、“月”、“光”5个单字，由此获得人体声音信号的初始数据。优选的，由7个测试者进行测试；每个测试者对固定的文字内容重复6次。由此获得人体声音信号的初始数据数量为210组(5×6×7)。

经过对人体声音信号的初始数据的采集和初步处理，得到210组人体声音信号的初始功率谱数据。经过环境噪声的滤除后，得到210组人体声音信号的功率谱数据。结合现代音乐理论与中医理论，对每组人体声音信号的功率谱数据划分宫、商、角、徵、羽五音的每个音的系列频率范围。典型的，可以将261-523Hz音程，划分出261-293Hz、293-329Hz、329-392Hz、392-440Hz、440-523Hz区间，分别为宫、商、角、徵、羽的基本频率范围。每个区间频率范围再进行1/8、1/4、1/2分频和2、4、8倍频，得到宫、商、角、徵、羽的系列频率范围。

进一步的，计算每个人体声音信号在五音的每个音的系列频率范围内的功率谱数据占人体声音信号在五个音系列频率范围内功率谱数据总和的比例。例如，对于某测试者将其读出的“床”、“前”、“明”、“月”、“光”中的每个字划分宫商角徵羽的系列频率范围，并分别对“床”、“前”、“明”、“月”、“光”中的每个字计算五音的每个音的系列频率范围内的功率谱数据占五音系列频率范围内功率谱数据的比例。

例如对于“床”字，可以将某测试者第1遍读出的“床”字分别在宫、商、角、徵、羽五音的系列频率范围内划分为宫_床1、商_床1、角_床1、徵_床1、羽_床1。“床”字的五音系列频率范围内功率谱数据之和为：

∑_床1＝宫_床1+商_床1+角_床1+徵_床1+羽_床1

则在6次重复过程中，“床”字宫音的平均值P_宫床为：

同理，对于该测试者，在6次重复过程中，“床”字商、角、徵、羽音的平均值P_商床、P_角床、P_徵床、P_羽床分别为：

进一步的，分别对N个固定文字内容的P_宫、P_商、P_角、P_徵、P_羽赋予权值并进行计权统计。例如，在宫音中，“床”、“前”、“明”、“月”、“光”字的宫音平均值比例分别为52％、28％、10％、9％、1％。因此，给“床”、“前”、“明”、“月”、“光”字的宫音平均值P的赋权值分别为4、2、1、0、-1。

进一步的，将每个测试者的N个固定文字内容的五音权值分别相加，得到每个测试者的总权值V_宫、V_商、V_角、V_徵、V_羽，分别为：

V_宫＝P_宫床·λ_宫床+P_宫前·λ_宫前+P_宫明·λ_宫明+P_宫月·λ_宫月+P_宫光·λ_宫光

V_商＝P_商床·λ_商床+P_商前·λ_商前+P_商明·λ_商明+P_商月·λ_商月+P_商光·λ_商光

V_角＝P_角床·λ_角床+P_角前·λ_角前+P_角明·λ_角明+P_角月·λ_角月+P_角光·λ_角光

V_徵＝P_徵床·λ_徵床+P_徵前·λ_徵前+P_徵明·λ_徵明+P_徵月·λ_徵月+P_徵光·λ_徵光

V_羽＝P_羽床·λ_羽床+P_羽前·λ_羽前+P_羽明·λ_羽明+P_羽月·λ_羽月+P_羽光·λ_羽光

由于共有7个测试者，则V_宫、V_商、V_角、V_徵、V_羽各有7个。在每个音的7个数值中找出五音中每一个音的总权值最大值V_max、最小值V_min，从而计算得到五音中每一个音的总权值范围V＝V_max-V_min。

进一步的，针对每个音，将测试者初步分为权值大(权值大于95％V)、权值小(权值小于5％V)、权值中(权值介于5％V和95％V之间)的三组样本，五个音共有15组样本。根据分析调整后的15组样本声音的能量—频率分布特点，挖掘在五音中具有特定权值范围的声音的人体共性特征。

优选的，可以结合中医理论，结合形色、望、问、切等结果，对15组样本进行调整。

特别的，本发明的实施例还可结合具体的中医理论及临床辨证结果，根据人体体质类型、不同疾病的特征进一步细分宫、商、角、徵、羽五个音的测试小组。

本实施例提供的人体声音信号处理及分析方法，基于现代音乐理论和中医理论，通过将不同频率系列范围内的人体声音的功率数据辅以权值，从而将人体声音数据的呈现形式由二维平面曲线图形转为数值，能够更加直观、全面、准确地描述人体声音特征。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种人体声音信号处理及分析方法，其特征在于，包括：

2.根据权利要求1所述的人体声音信号处理及分析方法，其特征在于，所述步骤一中包括采集所述人体声音信号的初始数据，并滤除环境噪声后得到所述功率谱数据。

3.根据权利要求1所述的人体声音信号处理及分析方法，其特征在于，所述固定内容由多名测试者读出，且每名测试者重复多次读出所述固定内容。

4.根据权利要求1所述的人体声音信号处理及分析方法，其特征在于，所述步骤二中划分五音系列频率范围包括将261-523Hz的音程分别划分出261-293Hz、293-329Hz、329-392Hz、392-440Hz、440-523Hz的频率区间作为宫、商、角、徵、羽的基本频率范围，并在每个所述频率区间进行1/8、1/4、1/2分频和2、4、8倍频，得到所述宫、商、角、徵、羽五音的系列频率范围。

5.根据权利要求3所述的人体声音信号处理及分析方法，其特征在于，所述步骤二中的所述比例根据所述每名测试者的重复次数求数学平均值。

6.根据权利要求3所述的人体声音信号处理及分析方法，其特征在于，当步骤二中的所述比例大于50％，则赋权值4；比例为不超过50％范围的相同音的所有固定内容中的最大值，则赋权值2；比例为不超过50％范围的相同音的所有固定内容中的第二大值，则赋权值1；比例为不超过50％范围的相同音的所有固定内容中的第三大值，则赋权值0；比例为不超过50％范围的相同音的所有固定内容中的最小值，则赋权值-1。

7.根据权利要求3所述的人体声音信号处理及分析方法，其特征在于，所述步骤四中包括在所述多名测试者的总权值中选出最大总权值和最小总权值，并以最大总权值减去最小总权值得到所述总权值范围。

8.根据权利要求3所述的人体声音信号处理及分析方法，其特征在于，所述步骤五包括将所述多名测试者分为权值较大、权值较小以及权值中等的三组人群，用于根据每组的声音能量-频率分布特点总结人体的特征。

9.根据权利要求8所述的人体声音信号处理及分析方法，其特征在于，所述步骤五还包括根据人体体质类型或疾病特征进一步将所述各组人群分为不同小组。

10.根据权利要求8所述的人体声音信号处理及分析方法，其特征在于，所述步骤五还包括结合中医的形色、望、问、切的结果对分组进行调整。