CN107910019A - 一种人体声音信号处理及分析方法 - Google Patents

一种人体声音信号处理及分析方法 Download PDF

Info

Publication number
CN107910019A
CN107910019A CN201711239852.6A CN201711239852A CN107910019A CN 107910019 A CN107910019 A CN 107910019A CN 201711239852 A CN201711239852 A CN 201711239852A CN 107910019 A CN107910019 A CN 107910019A
Authority
CN
China
Prior art keywords
acoustical signal
weights
human
scope
notes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711239852.6A
Other languages
English (en)
Other versions
CN107910019B (zh
Inventor
徐静波
苑韬
张海英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Microelectronics of CAS
Original Assignee
Institute of Microelectronics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Microelectronics of CAS filed Critical Institute of Microelectronics of CAS
Priority to CN201711239852.6A priority Critical patent/CN107910019B/zh
Publication of CN107910019A publication Critical patent/CN107910019A/zh
Application granted granted Critical
Publication of CN107910019B publication Critical patent/CN107910019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Instructional Devices (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供一种人体声音信号处理及分析方法,包括:步骤一、采集固定内容的人体声音信号并处理获得功率谱数据;步骤二、划分五音系列频率范围,计算每个音系列频率范围内的功率谱数据占五音系列频率范围内功率谱数据的比例;步骤三、根据固定内容中的每个固定内容的比例,赋予权值并进行计权统计;步骤四、将固定内容的每个固定内容的对应音的计权统计结果相加得到总权值范围;步骤五、对总权值范围划分权值阶段,根据不同所述权值阶段的声音的特征总结人体的特征。本发明能够更加直观、全面、准确地描述人体声音特征。

Description

一种人体声音信号处理及分析方法
技术领域
本发明涉及信号处理分析技术领域,尤其涉及一种人体声音信号处理及分析方法。
背景技术
声音是人类传递交换信息的重要方式,同时,声音与人体健康状态之间也存在密切的关联。例如,中医理论主张可以通过辨识人体当前声音信号与健康状态正常时声音信号的差异来判断人体当前的健康程度。其中,基于五声(呼、笑、歌、哭、呻)及五音(角、徵、宫、商、羽)应五脏(肝、心、脾、肺、肾)理论,中医闻诊可以通过辨识患者说话声音、语言的变化,以及呼吸、咳嗽、呕吐、呃逆、嗳气、太息、喷嚏、肠鸣、婴儿啼哭等声音信息,预见疾病等人体身体健康状况的变化。
但是,传统中医闻诊方法停留在依靠医生的主观听觉对人体声音信号进行判断的阶段,由于医生感官的个体差异,以及个体心理、环境的影响,在对人体声音信号的分析判断会产生差异。出于健康判断目的考虑而对人体声音信号进行分析、判断的标准化、客观化成为亟待解决的问题。
因此,近年来,为实现对人体声音信号分析判断的标准化、客观化,人们用仪器对声音进行客观、定量的记录、计算、分析和判断,了解人体声音的变化,提高健康情况的预见性。例如,语图仪、声谱仪、喉声气流图仪、频谱分析仪等仪器设备,通过利用傅里叶变换、小波变换、希尔伯特-黄变换等信号处理方法,获取时域、频域、功率谱等有辅助分析判断意义的声音信息,进而根据振幅、频率、泛音等信息反映出响度、音调、音品等声音特性,从而将受试者的声音信息与正常健康状况的对比者的声音信息进行比对,得出声音的差异性。
但是,由于人的说话声音具有非线性特征,声音的时域、频域、功率谱数据是二维的平面曲线图形,使用机器设备进行常规的数据处理、分析方式,难以获得直观、明晰的分析结果。
因此,在现有技术的基础上,仍需要设计一种人体声音信号分析方法,解决现有技术中使用时域、频域、功率谱数等二维平面曲线图形态的指标难以全面描述人体声音特征的技术问题。
发明内容
本发明提供的人体声音信号处理及分析方法,能够针对现有技术的不足,解决现有技术设备难以全面、准确地描述人体声音特征的问题。
本发明提供的人体声音信号处理及分析方法,包括:
步骤一、采集固定内容的人体声音信号并处理获得所述人体声音信号的功率谱数据;
步骤二、划分所述功率谱数据的五音系列频率范围,计算所述五音中的每个音系列频率范围内的功率谱数据占所述五音系列频率范围内的功率谱数据的比例;
步骤三、根据所述固定内容中的每个固定内容的所述比例,赋予权值并进行计权统计;
步骤四、将所述固定内容的每个固定内容的对应音的所述计权统计结果相加得到总权值范围;
步骤五、对所述总权值范围划分权值阶段,根据不同所述权值阶段的声音的特征总结人体的特征。
可选地,上述步骤一中包括采集所述人体声音信号的初始数据,并滤除环境噪声后得到所述功率谱数据。
可选地,上述固定内容由多名测试者读出,且每名测试者重复多次读出所述固定内容。
可选地,上述步骤二中划分五音系列频率范围包括将261-523Hz的音程分别划分出261-293Hz、293-329Hz、329-392Hz、392-440Hz、440-523Hz的频率区间作为宫、商、角、徵、羽的基本频率范围,并在每个所述频率区间进行1/8、1/4、1/2分频和2、4、8倍频,得到所述宫、商、角、徵、羽五音的系列频率范围。
可选地,上述步骤二中的所述比例根据所述每名测试者的重复次数求数学平均值。
可选地,当上述步骤二中的所述比例大于50%,则赋权值4;比例为不超过50%范围的相同音的所有固定内容中的最大值,则赋权值2;比例为不超过50%范围的相同音的所有固定内容中的第二大值,则赋权值1;比例为不超过50%范围的相同音的所有固定内容中的第三大值,则赋权值0;比例为不超过50%范围的相同音的所有固定内容中的最小值,则赋权值-1。
可选地,上述步骤四中包括在所述多名测试者的总权值中选出最大总权值和最小总权值,并以最大总权值减去最小总权值得到所述总权值范围。
可选地,上述步骤五包括将所述多名测试者分为权值较大、权值较小以及权值中等的三组人群,用于根据每组的声音能量-频率分布特点总结人体的特征。
可选地,上述步骤五还包括根据人体体质类型或疾病特征进一步将所述各组人群分为不同小组。
可选地,上述步骤五还包括结合中医的形色、望、问、切的结果对分组进行调整。
本发明提供的人体声音信号处理及分析方法,基于现代音乐理论和中医理论,通过将不同频率系列范围内的人体声音的功率数据辅以权值,从而将人体声音数据的呈现形式由二维平面曲线图形转为数值,能够更加直观、全面、准确地描述人体声音特征。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
下面结合附图和实施例对本发明作进一步的详细说明。
图1为本发明一个实施例提供的人体声音信号处理及分析方法的步骤流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
本发明的一个实施例提供了一种人体声音信号处理及分析方法。图1示出了本发明一个实施例提供的人体声音信号处理及分析方法的步骤流程图。
如图1所示,S11表示采集L个测试者重复M次的N个固定文字的人体声音信号。在本发明的实施例中,具体地,由测试者说出固定内容,由此获得人体声音信号的初始数据。优选的,由多个测试者进行测试,测试者的数量为L;每个测试者对固定内容重复多次,重复的次数为M;固定内容包括但不限于元音、辅音、单字、短语等,且固定文字为多个,固定文字的数量为N。由此获得人体声音信号的初始数据数量为L×M×N组。
S12表示处理得到L×M×N组初始功率谱数据;滤除环境噪声后,得到L×M×N组功率谱数据。具体地,在本实施例中,经过对人体声音信号的初始数据的采集和初步处理,得到L×M×N组人体声音信号的初始功率谱数据。经过环境噪声的滤除后,得到L×M×N组人体声音信号的功率谱数据。结合现代音乐理论与中医理论,对每组人体声音信号的功率谱数据划分宫、商、角、徵、羽五音的每个音的系列频率范围。
S13表示划分每组功率谱的五音的系列频率范围;计算每个音的系列频率范围内的功率谱数据占五个音系列频率范围内功率谱数据总和的比例;计算M次重复后的五音各自的数学平均值。具体地,在本实施例中,计算每个人体声音信号在五音的每个音的系列频率范围内的功率谱数据占人体声音信号在五个音系列频率范围内功率谱数据总和的比例,得到每个测试者的每个固定文字内容的功率谱数据在M次重复过程中的五音各自的平均值P、P、P、P、P
S14表示分别对N个固定文字的五音各自的数学平均值赋予权值进行计权统计。具体地,在本实施例中,分别对N个固定文字内容的P、P、P、P、P赋予权值并进行计权统计,如果某个音的N个固定文字内容中的某个字的平均值比例大于50%,则给该音的该字的平均值赋权值4;如果某个音的N个固定文字内容中的某个字的平均值比例是不超过50%范围中的最大值,则给该音的该字的平均值赋权值2;如果某个音的N个固定文字内容中的某个字的平均值比例是不超过50%范围中的次大值,则给该音的该字的平均值赋权值1;如果某个音的N个固定文字内容中的某个字的平均值比例是不超过50%范围中的第三大的值,则给该音的该字的平均值赋权值0;如果某个音的N个固定文字内容中的某个字的平均值比例是最小值,则给该音的该字的平均值赋权值-1。
S15表示将N个固定文字的五音权值相加得到总权值;在L个测试者的总权值中找出每个音的总权值最大值Vmax、最小值Vmin;计算得到每一个音的总权值范围V=Vmax-Vmin。具体地,在本实施例中,将每个测试者的N个固定文字内容的五音权值分别相加,得到每个测试者的总权值V、V、V、V、V。由于共有L个测试者,则V、V、V、V、V各有L个。在每个音的L个数值中找出每一个音的总权值最大值Vmax、最小值Vmin,从而计算得到每一个音的总权值范围V=Vmax-Vmin
S16表示针对每个音,将测试者初步分为权值大(权值大于95%V)、权值小(权值小于5%V)、权值中(权值介于5%V和95%V之间)的三组样本。具体地,在本实施例中,针对每个音,将测试者初步分为权值大(权值大于95%V)、权值小(权值小于5%V)、权值中(权值介于5%V和95%V之间)的三组样本,五个音共有15组样本。
S17表示根据五个音的样本声音的能量—频率分布特点挖掘具有特定权值范围的声音的人体共性特征。具体地,在本实施例中,根据分析调整后的15组样本声音的能量—频率分布特点,挖掘在五音中具有特定权值范围的声音的人体共性特征。
实施例二:
本发明的另一个实施例提供了一种人体声音信号处理及分析方法。在本实施例中,由测试者读出“床”、“前”、“明”、“月”、“光”5个单字,由此获得人体声音信号的初始数据。优选的,由7个测试者进行测试;每个测试者对固定的文字内容重复6次。由此获得人体声音信号的初始数据数量为210组(5×6×7)。
经过对人体声音信号的初始数据的采集和初步处理,得到210组人体声音信号的初始功率谱数据。经过环境噪声的滤除后,得到210组人体声音信号的功率谱数据。结合现代音乐理论与中医理论,对每组人体声音信号的功率谱数据划分宫、商、角、徵、羽五音的每个音的系列频率范围。典型的,可以将261-523Hz音程,划分出261-293Hz、293-329Hz、329-392Hz、392-440Hz、440-523Hz区间,分别为宫、商、角、徵、羽的基本频率范围。每个区间频率范围再进行1/8、1/4、1/2分频和2、4、8倍频,得到宫、商、角、徵、羽的系列频率范围。
进一步的,计算每个人体声音信号在五音的每个音的系列频率范围内的功率谱数据占人体声音信号在五个音系列频率范围内功率谱数据总和的比例。例如,对于某测试者将其读出的“床”、“前”、“明”、“月”、“光”中的每个字划分宫商角徵羽的系列频率范围,并分别对“床”、“前”、“明”、“月”、“光”中的每个字计算五音的每个音的系列频率范围内的功率谱数据占五音系列频率范围内功率谱数据的比例。
例如对于“床”字,可以将某测试者第1遍读出的“床”字分别在宫、商、角、徵、羽五音的系列频率范围内划分为宫床1、商床1、角床1、徵床1、羽床1。“床”字的五音系列频率范围内功率谱数据之和为:
床1=宫床1+商床1+角床1+徵床1+羽床1
则在6次重复过程中,“床”字宫音的平均值P宫床为:
同理,对于该测试者,在6次重复过程中,“床”字商、角、徵、羽音的平均值P商床、P角床、P徵床、P羽床分别为:
进一步的,分别对N个固定文字内容的P、P、P、P、P赋予权值并进行计权统计。例如,在宫音中,“床”、“前”、“明”、“月”、“光”字的宫音平均值比例分别为52%、28%、10%、9%、1%。因此,给“床”、“前”、“明”、“月”、“光”字的宫音平均值P的赋权值分别为4、2、1、0、-1。
进一步的,将每个测试者的N个固定文字内容的五音权值分别相加,得到每个测试者的总权值V、V、V、V、V,分别为:
V=P宫床·λ宫床+P宫前·λ宫前+P宫明·λ宫明+P宫月·λ宫月+P宫光·λ宫光
V=P商床·λ商床+P商前·λ商前+P商明·λ商明+P商月·λ商月+P商光·λ商光
V=P角床·λ角床+P角前·λ角前+P角明·λ角明+P角月·λ角月+P角光·λ角光
V=P徵床·λ徵床+P徵前·λ徵前+P徵明·λ徵明+P徵月·λ徵月+P徵光·λ徵光
V=P羽床·λ羽床+P羽前·λ羽前+P羽明·λ羽明+P羽月·λ羽月+P羽光·λ羽光
由于共有7个测试者,则V、V、V、V、V各有7个。在每个音的7个数值中找出五音中每一个音的总权值最大值Vmax、最小值Vmin,从而计算得到五音中每一个音的总权值范围V=Vmax-Vmin
进一步的,针对每个音,将测试者初步分为权值大(权值大于95%V)、权值小(权值小于5%V)、权值中(权值介于5%V和95%V之间)的三组样本,五个音共有15组样本。根据分析调整后的15组样本声音的能量—频率分布特点,挖掘在五音中具有特定权值范围的声音的人体共性特征。
优选的,可以结合中医理论,结合形色、望、问、切等结果,对15组样本进行调整。
特别的,本发明的实施例还可结合具体的中医理论及临床辨证结果,根据人体体质类型、不同疾病的特征进一步细分宫、商、角、徵、羽五个音的测试小组。
本实施例提供的人体声音信号处理及分析方法,基于现代音乐理论和中医理论,通过将不同频率系列范围内的人体声音的功率数据辅以权值,从而将人体声音数据的呈现形式由二维平面曲线图形转为数值,能够更加直观、全面、准确地描述人体声音特征。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种人体声音信号处理及分析方法,其特征在于,包括:
步骤一、采集固定内容的人体声音信号并处理获得所述人体声音信号的功率谱数据;
步骤二、划分所述功率谱数据的五音系列频率范围,计算所述五音中的每个音系列频率范围内的功率谱数据占所述五音系列频率范围内的功率谱数据的比例;
步骤三、根据所述固定内容中的每个固定内容的所述比例,赋予权值并进行计权统计;
步骤四、将所述固定内容的每个固定内容的对应音的所述计权统计结果相加得到总权值范围;
步骤五、对所述总权值范围划分权值阶段,根据不同所述权值阶段的声音的特征总结人体的特征。
2.根据权利要求1所述的人体声音信号处理及分析方法,其特征在于,所述步骤一中包括采集所述人体声音信号的初始数据,并滤除环境噪声后得到所述功率谱数据。
3.根据权利要求1所述的人体声音信号处理及分析方法,其特征在于,所述固定内容由多名测试者读出,且每名测试者重复多次读出所述固定内容。
4.根据权利要求1所述的人体声音信号处理及分析方法,其特征在于,所述步骤二中划分五音系列频率范围包括将261-523Hz的音程分别划分出261-293Hz、293-329Hz、329-392Hz、392-440Hz、440-523Hz的频率区间作为宫、商、角、徵、羽的基本频率范围,并在每个所述频率区间进行1/8、1/4、1/2分频和2、4、8倍频,得到所述宫、商、角、徵、羽五音的系列频率范围。
5.根据权利要求3所述的人体声音信号处理及分析方法,其特征在于,所述步骤二中的所述比例根据所述每名测试者的重复次数求数学平均值。
6.根据权利要求3所述的人体声音信号处理及分析方法,其特征在于,当步骤二中的所述比例大于50%,则赋权值4;比例为不超过50%范围的相同音的所有固定内容中的最大值,则赋权值2;比例为不超过50%范围的相同音的所有固定内容中的第二大值,则赋权值1;比例为不超过50%范围的相同音的所有固定内容中的第三大值,则赋权值0;比例为不超过50%范围的相同音的所有固定内容中的最小值,则赋权值-1。
7.根据权利要求3所述的人体声音信号处理及分析方法,其特征在于,所述步骤四中包括在所述多名测试者的总权值中选出最大总权值和最小总权值,并以最大总权值减去最小总权值得到所述总权值范围。
8.根据权利要求3所述的人体声音信号处理及分析方法,其特征在于,所述步骤五包括将所述多名测试者分为权值较大、权值较小以及权值中等的三组人群,用于根据每组的声音能量-频率分布特点总结人体的特征。
9.根据权利要求8所述的人体声音信号处理及分析方法,其特征在于,所述步骤五还包括根据人体体质类型或疾病特征进一步将所述各组人群分为不同小组。
10.根据权利要求8所述的人体声音信号处理及分析方法,其特征在于,所述步骤五还包括结合中医的形色、望、问、切的结果对分组进行调整。
CN201711239852.6A 2017-11-30 2017-11-30 一种人体声音信号处理及分析方法 Active CN107910019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711239852.6A CN107910019B (zh) 2017-11-30 2017-11-30 一种人体声音信号处理及分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711239852.6A CN107910019B (zh) 2017-11-30 2017-11-30 一种人体声音信号处理及分析方法

Publications (2)

Publication Number Publication Date
CN107910019A true CN107910019A (zh) 2018-04-13
CN107910019B CN107910019B (zh) 2021-04-20

Family

ID=61849439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711239852.6A Active CN107910019B (zh) 2017-11-30 2017-11-30 一种人体声音信号处理及分析方法

Country Status (1)

Country Link
CN (1) CN107910019B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109452932A (zh) * 2018-12-20 2019-03-12 广州华久信息科技有限公司 一种基于声音的体质辨识方法及设备
CN112162181A (zh) * 2020-09-27 2021-01-01 北京南洋思源智能科技有限公司 一种监测方法、装置及计算机可读存储介质
CN112603266A (zh) * 2020-12-23 2021-04-06 新绎健康科技有限公司 一种用于获取目标五音特征的方法及系统

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101740010A (zh) * 2008-11-21 2010-06-16 索尼株式会社 信息处理设备、声音分析方法和程序
CN102342858A (zh) * 2010-08-06 2012-02-08 上海中医药大学 中医声诊采集与分析系统
CN103377656A (zh) * 2012-04-16 2013-10-30 联想(北京)有限公司 一种音频文件的五音分析方法、播放器及电子设备
CN103971702A (zh) * 2013-08-01 2014-08-06 哈尔滨理工大学 声音监控方法、装置及系统
CN104538041A (zh) * 2014-12-11 2015-04-22 深圳市智美达科技有限公司 异常声音检测方法及系统
CN105280196A (zh) * 2015-11-19 2016-01-27 科大讯飞股份有限公司 副歌检测方法及系统
CN105590633A (zh) * 2015-11-16 2016-05-18 福建省百利亨信息科技有限公司 一种用于歌曲评分的曲谱生成方法和设备
US20160180864A1 (en) * 2011-02-10 2016-06-23 Dolby Laboratories Licensing Corporation Vector noise cancellation
CN105719661A (zh) * 2016-01-29 2016-06-29 西安交通大学 一种弦乐器演奏音质自动判别方法
CN106157951A (zh) * 2016-08-31 2016-11-23 北京华科飞扬科技股份公司 进行音频断句的自动拆分方法及系统
CN106384599A (zh) * 2016-08-31 2017-02-08 广州酷狗计算机科技有限公司 一种破音识别的方法和装置
US20170060880A1 (en) * 2015-08-31 2017-03-02 Bose Corporation Predicting acoustic features for geographic locations
CN106531187A (zh) * 2016-11-09 2017-03-22 上海航动科技有限公司 一种呼叫中心绩效考核方法及系统
CN107257528A (zh) * 2017-06-14 2017-10-17 山东浪潮云服务信息科技有限公司 一种基于加权谱熵的啸叫检测方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101740010A (zh) * 2008-11-21 2010-06-16 索尼株式会社 信息处理设备、声音分析方法和程序
CN102342858A (zh) * 2010-08-06 2012-02-08 上海中医药大学 中医声诊采集与分析系统
US20160180864A1 (en) * 2011-02-10 2016-06-23 Dolby Laboratories Licensing Corporation Vector noise cancellation
CN103377656A (zh) * 2012-04-16 2013-10-30 联想(北京)有限公司 一种音频文件的五音分析方法、播放器及电子设备
CN103971702A (zh) * 2013-08-01 2014-08-06 哈尔滨理工大学 声音监控方法、装置及系统
CN104538041A (zh) * 2014-12-11 2015-04-22 深圳市智美达科技有限公司 异常声音检测方法及系统
US20170060880A1 (en) * 2015-08-31 2017-03-02 Bose Corporation Predicting acoustic features for geographic locations
CN105590633A (zh) * 2015-11-16 2016-05-18 福建省百利亨信息科技有限公司 一种用于歌曲评分的曲谱生成方法和设备
CN105280196A (zh) * 2015-11-19 2016-01-27 科大讯飞股份有限公司 副歌检测方法及系统
CN105719661A (zh) * 2016-01-29 2016-06-29 西安交通大学 一种弦乐器演奏音质自动判别方法
CN106157951A (zh) * 2016-08-31 2016-11-23 北京华科飞扬科技股份公司 进行音频断句的自动拆分方法及系统
CN106384599A (zh) * 2016-08-31 2017-02-08 广州酷狗计算机科技有限公司 一种破音识别的方法和装置
CN106531187A (zh) * 2016-11-09 2017-03-22 上海航动科技有限公司 一种呼叫中心绩效考核方法及系统
CN107257528A (zh) * 2017-06-14 2017-10-17 山东浪潮云服务信息科技有限公司 一种基于加权谱熵的啸叫检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANJUN YAN ET AL: "A multi-instance multi-label learning approach to objective auscultation analysis of traditional Chinese medicine", 《2011 4TH INTERNATIONAL CONFERENCE ON BIOMEDICAL ENGINEERING AND INFORMATICS》 *
沈小静: "基于小波包变换和支持向量机的中医声诊客观化研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109452932A (zh) * 2018-12-20 2019-03-12 广州华久信息科技有限公司 一种基于声音的体质辨识方法及设备
CN112162181A (zh) * 2020-09-27 2021-01-01 北京南洋思源智能科技有限公司 一种监测方法、装置及计算机可读存储介质
CN112162181B (zh) * 2020-09-27 2024-06-04 北京南洋思源智能科技有限公司 一种监测方法、装置及计算机可读存储介质
CN112603266A (zh) * 2020-12-23 2021-04-06 新绎健康科技有限公司 一种用于获取目标五音特征的方法及系统

Also Published As

Publication number Publication date
CN107910019B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
Sroka et al. Human and machine consonant recognition
Krom Consistency and reliability of voice quality ratings for different types of speech fragments
Barsties et al. The improvement of internal consistency of the Acoustic Voice Quality Index
Panek et al. Acoustic analysis assessment in speech pathology detection
CN103054586B (zh) 一种基于汉语言语测听动态词表的汉语言语自动测听方法
CN109727608A (zh) 一种基于中文语音的病态嗓音评估方法
AU2013274940B2 (en) Cepstral separation difference
Lehto et al. Changes in objective acoustic measurements and subjective voice complaints in call center customer-service advisors during one working day
CN106073706A (zh) 一种面向简易精神状态量表的个性化信息和音频数据分析方法及系统
Khan et al. Cepstral separation difference: A novel approach for speech impairment quantification in Parkinson's disease
CN107910019A (zh) 一种人体声音信号处理及分析方法
Shrivastav et al. Pitch strength of normal and dysphonic voices
Barsties et al. The influence of voice sample length in the auditory-perceptual judgment of overall voice quality
Pierce et al. A field-based approach to establish normative acoustic data for healthy female voices
Zwan et al. System for automatic singing voice recognition
Anand et al. Using pitch height and pitch strength to characterize type 1, 2, and 3 voice signals
Huq et al. Data Augmentation using Reverb and Noise in Deep Learning Implementation of Cough Classification
Buder et al. Quantitative and graphic acoustic analysis of phonatory modulations
Zacharakis et al. Revisiting the luminance-texture-mass model for musical timbre semantics: A confirmatory approach and perspectives of extension
Reilly et al. Voice Pathology Assessment Based on a Dialogue System and Speech Analysis.
RU2559689C2 (ru) Способ определения риска развития заболеваний индивида по его голосу и аппаратно-программный комплекс для реализации способа
Sol et al. Towards Automated Vocal Mode Classification in Healthy Singing Voice—An XGBoost Decision Tree-Based Machine Learning Classifier
Laures-Gore et al. The Atlanta motor speech disorders corpus: motivation, development, and utility
CN114678039A (zh) 一种基于深度学习的歌唱评价方法
Kopf et al. The perception of breathiness in the voices of pediatric speakers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant