CN111640451A - 一种成熟度评估方法及装置、存储介质 - Google Patents

一种成熟度评估方法及装置、存储介质 Download PDF

Info

Publication number
CN111640451A
CN111640451A CN202010377268.2A CN202010377268A CN111640451A CN 111640451 A CN111640451 A CN 111640451A CN 202010377268 A CN202010377268 A CN 202010377268A CN 111640451 A CN111640451 A CN 111640451A
Authority
CN
China
Prior art keywords
sound
target
low
maturity
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010377268.2A
Other languages
English (en)
Other versions
CN111640451B (zh
Inventor
刘文龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinsheng Communication Technology Co ltd
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Shanghai Jinsheng Communication Technology Co ltd
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jinsheng Communication Technology Co ltd, Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Shanghai Jinsheng Communication Technology Co ltd
Priority to CN202010377268.2A priority Critical patent/CN111640451B/zh
Publication of CN111640451A publication Critical patent/CN111640451A/zh
Application granted granted Critical
Publication of CN111640451B publication Critical patent/CN111640451B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Investigating Or Analyzing Materials By The Use Of Ultrasonic Waves (AREA)

Abstract

本申请实施例公开了一种成熟度评估方法及装置、存储介质,方法包括:获取当前场景下敲击目标瓜果产生的目标敲击声音;对目标敲击声音进行特征提取,得到目标声音特征;利用声音分析模型对目标声音特征进行分析,确定出目标瓜果的成熟度;声音分析模型为具备利用声音信息评估成熟度功能的模型。

Description

一种成熟度评估方法及装置、存储介质
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种成熟度评估方法及装置、存储介质。
背景技术
对于西瓜、甜瓜等瓜果,消费者在购买时需要根据其成熟度进行购买。通常情况下,消费者可以依靠自身经验,观察瓜果外表和听瓜果的敲击声音来判定成熟度。
目前,由于消费者经验有限,依靠自身经验主观评估瓜果成熟度,容易出现误判的现象。因此,为了较为准确的评估西瓜等瓜果的成熟度,可以采用糖度测量、导电性测量、重量测量、光谱特性来评估。例如,生西瓜和书西瓜的含水量、糖分等离子浓度不同,从而导电率也可不相同,一般熟西瓜电阻小,生西瓜电阻大,从而可以根据测量西瓜的导电率评估西瓜的成熟度。
然而,上述瓜果成熟度评估的方式,大部分是需要一种专用的测量设备进行相应信息的测量,之后,将测量的结果与设定的阈值比较以评估,不仅灵活性较低,而且即使是同一品种的瓜果,个体之间也存在一定的差异,设定的阈值难以适合每个个体,从而导致准确性也较低。
发明内容
本申请实施例提供一种成熟度评估方法及装置、存储介质,提高了瓜果成熟度评估的灵活性和准确性。
本申请实施例的技术方案是这样实现的:
本申请实施例提供了一种成熟度评估方法,所述方法包括:
获取当前场景下敲击目标瓜果产生的目标敲击声音;
对所述目标敲击声音进行特征提取,得到目标声音特征;
利用声音分析模型对所述目标声音特征进行分析,确定出所述目标瓜果的成熟度;所述声音分析模型为具备利用声音信息评估成熟度功能的模型。
在上述方法中,所述获取当前场景下敲击目标瓜果产生的目标敲击声音,包括:
获取所述当前场景下的当前场景声音;
对所述当前场景声音进行低频短时能量分析,得到场景低频能量值;
基于所述场景低频能量值,获取所述目标敲击声音。
在上述方法中,所述对所述当前场景声音进行低频短时能量分析,得到场景低频能量值,包括:
按照预设单位时长对所述当前场景声音片段划分,得到至少一个场景声音片段;
确定所述至少一个场景声音片段中,每个场景声音片段各自对应的低频能量值,得到至少一个低频能量值;
计算所述至少一个低频能量值的均值,得到所述场景低频能量值。
在上述方法中,所述确定所述至少一个场景声音片段中,每个场景声音片段各自对应的低频能量值,得到至少一个低频能量值,包括:
对所述至少一个场景声音片段中,每个场景声音片段分别进行频域变换,得到至少一个频域变换结果;
针对所述至少一个频域变换结果中的每个变换结果,利用频率信息低于预设频率信息的分量确定出一个低频能量值,得到所述至少一个低频能量值。
在上述方法中,所述基于所述场景低频能量值,获取所述目标敲击声音,包括:
基于预设调节参数和所述场景低频能量值,确定低频能量阈值;
在所述当前场景声音下,持续获取时长为预设单位时长的候选声音片段,并确定获取到的候选声音片段各自对应的低频能量值;
在获取到的第N个候选声音片段对应的第N个低频能量值,高于所述低频能量阈值的情况下,确定所述第N个候选声音片段为敲击起始声音片段;N为大于等于1的自然数;
在继续获取到的第M个候选声音片段对应的第M个低频能量值,低于或等于所述低频能量阈值的情况下,确定所述第M个候选声音片段为敲击终止声音片段;M为大于N的自然数;
将获取到的从所述第N个候选声音片段到所述第M个候选声音片段的全部候选声音片段,确定为所述目标敲击声音。
在上述方法中,所述基于所述场景低频能量值,获取所述目标敲击声音之前,所述方法还包括:
输出敲击所述目标瓜果的提示信息。
在上述方法中,所述利用声音分析模型对所述目标声音特征进行分析,确定出所述目标瓜果的成熟度之前,所述方法还包括:
获取样本场景声音、无噪声环境下敲击样本瓜果产生的样本敲击声音,以及所述样本敲击声音对应的真实成熟度;所述样本瓜果与所述目标瓜果为同一品种瓜果;
将所述样本场景声音和所述样本敲击声音进行融合,得到样本融合声音;
对所述样本融合声音进行特征提取,得到样本声音特征;
基于所述样本声音特征和所述真实成熟度,对预设分析模型进行模型训练,得到所述声音分析模型。
在上述方法中,所述基于所述样本声音特征和所述真实成熟度,对预设分析模型进行模型训练,得到所述声音分析模型,包括:
利用所述预设分析模型对所述样本声音特征进行分析,确定出所述样本瓜果对应的预测成熟度;
确定所述预测成熟度和所述真实成熟度之间的差异,得到差异结果;
基于所述差异结果对所述预设分析模型进行参数调节,得到所述声音分析模型。
本申请实施例提供了一种成熟度评估装置,所述装置包括:
声音获取模块,用于获取当前场景下敲击目标瓜果产生的目标敲击声音;;
特征提取模块,用于对所述目标敲击声音进行特征提取,得到目标声音特征;
模型评估模块,用于利用声音分析模型对所述目标声音特征进行分析,确定出所述目标瓜果的成熟度;所述声音分析模型为具备利用声音信息评估成熟度功能的模型。
在上述装置中,所述声音获取模块,具体用于获取所述当前场景下的当前场景声音;对所述当前场景声音进行低频短时能量分析,得到场景低频能量值;基于所述场景低频能量值,获取所述目标敲击声音。
在上述装置中,所述声音获取模块,具体用于按照预设单位时长对所述当前场景声音片段划分,得到至少一个场景声音片段;确定所述至少一个场景声音片段中,每个场景声音片段各自对应的低频能量值,得到至少一个低频能量值;计算所述至少一个低频能量值的均值,得到所述场景低频能量值。
在上述装置中,所述声音获取模块,具体用于对所述至少一个场景声音片段中,每个场景声音片段分别进行频域变换,得到至少一个频域变换结果;针对所述至少一个频域变换结果中的每个变换结果,利用频率信息低于预设频率信息的分量确定出一个低频能量值,得到所述至少一个低频能量值。
在上述装置中,所述声音获取模块,具体用于基于预设调节参数和所述场景低频能量值,确定低频能量阈值;在所述当前场景声音下,持续获取时长为预设单位时长的候选声音片段,并确定获取到的候选声音片段各自对应的低频能量值;在获取到的第N个候选声音片段对应的第N个低频能量值,高于所述低频能量阈值的情况下,确定所述第N个候选声音片段为敲击起始声音片段;N为大于等于1的自然数;在继续获取到的第M个候选声音片段对应的第M个低频能量值,低于或等于所述低频能量阈值的情况下,确定所述第M个候选声音片段为敲击终止声音片段;M为大于N的自然数;将获取到的从所述第N个候选声音片段到所述第M个候选声音片段的全部候选声音片段,确定为所述目标敲击声音。
在上述装置中,还包括:信息提示模块;
所述信息提示模块,用于输出敲击所述目标瓜果的提示信息。
在上述装置中,还包括:声音融合模块和模型训练模块;
所述声音获取模块,还用于获取样本场景声音、无噪声环境下敲击样本瓜果产生的样本敲击声音,以及所述样本敲击声音对应的真实成熟度;所述样本瓜果与所述目标瓜果为同一品种瓜果;
所述声音融合模块,用于将所述样本场景声音和所述样本敲击声音进行融合,得到样本融合声音;
所述特征提取模块,还用于对所述样本融合声音进行特征提取,得到样本声音特征;
所述模型训练模块,用于基于所述样本声音特征和所述真实成熟度,对预设分析模型进行模型训练,得到所述声音分析模型。
在上述装置中,所述模型训练模块,具体用于利用所述预设分析模型对所述样本声音特征进行分析,确定出所述样本瓜果对应的预测成熟度;确定所述预测成熟度和所述真实成熟度之间的差异,得到差异结果;基于所述差异结果对所述预设分析模型进行参数调节,得到所述声音分析模型。
本申请实施例提供了一种成熟度评估装置,所述装置包括处理器、存储器和通信总线;
所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;
所述处理器,用于执行所述存储器中存储的成熟度评估程序,以实现上述成熟度评估方法。
本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述成熟度评估方法。
本申请实施例提供了一种成熟度评估方法及装置、存储介质,方法包括:获取当前场景下敲击目标瓜果产生的目标敲击声音;对目标敲击声音进行特征提取,得到目标声音特征;利用声音分析模型对目标声音特征进行分析,确定出目标瓜果的成熟度;声音分析模型为具备利用声音信息评估成熟度功能的模型。本申请实施例提供的技术方案,利用声音分析模型对敲击瓜果产生的声音进行分析,从而确定出成熟度,不仅提高了评估的准确性,而且整个评估方式可以集成在移动终端等电子设备,提高了评估的灵活性。
附图说明
图1为本申请实施例提供的一种成熟度评估方法的流程示意图;
图2为本申请实施例提供的一种获取目标敲击声音的流程示意图;
图3为本申请实施例提供的一种示例性的特征提取的流程示意图;
图4为本申请实施例提供的一种示例性的模型分析的流程示意图;
图5为本申请实施例提供的一种模型训练的流程示意图;
图6为本申请实施例提供的一种成熟度评估装置的结构示意图一;
图7为本申请实施例提供的一种成熟度评估装置的结构示意图二。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅仅用于解释相关申请,而非对该申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关申请相关的部分。
本申请实施例提供了一种成熟度评估方法,通过成熟度评估装置实现。成熟度评估装置可以是手机、平板电脑等电子设备,本申请实施例不作限定。图1为本申请实施例提供的一种成熟度评估方法的流程示意图。如图1所示,成熟度评估方法主要包括以下步骤:
S101、获取当前场景下敲击目标瓜果产生的目标敲击声音。
在本申请的实施例中,成熟度评估装置可以获取当前场景下敲击目标瓜果产生的目标敲击声音。
需要说明的是,在本申请的实施例中,目标瓜果为可以通过声音信息评估成熟状态的瓜果,例如,西瓜、甜瓜等。具体的目标瓜果本申请实施例不作限定。
具体的,在本申请的实施例中,成熟度评估装置获取当前场景下敲击目标瓜果产生的目标敲击声音,包括:获取当前场景下的当前场景声音;对当前场景声音进行低频短时能量分析,得到场景低频能量值;基于场景低频能量值,获取目标敲击声音。
需要说明的是,在本申请的实施例中,成熟度评估装置自身可以配置有麦克风等声音采集器件,从而可以实现当前场景声音的采集,当然,也可以利用独立的声音采集装置采集当前场景声音,并将当前场景声音传输给成熟度评估装置。具体的当前场景声音的获取方式可以根据实际硬件配置确定,本申请实施例不作限定。
需要说明的是,在本申请的实施例中,当前场景声音为对瓜果进行成熟度评估所处的当前场景的声音,实际上也就是当前环境下的声音,具体的当前场景声音本申请实施例不作限定。
具体的,在本申请的实施例中,成熟度评估装置对当前场景声音进行低频短时能量分析,得到场景低频能量值,包括:按照预设单位时长对当前场景声音片段划分,得到至少一个场景声音片段;确定至少一个场景声音片段中,每个场景声音片段各自对应低频能量值,得到至少一个低频能量值;计算至少一个低频能量值的均值,得到场景低频能量值。
需要说明的是,在本申请的实施例中,成熟度评估装置中预先存储有设置的单位预设时长,由于获取到的当前场景声音可以是一段时长的声音,例如3秒的当前场景声音,因此,可以按照预设单位时长对其进行片段划分。例如,预设单位时长为n,成熟度评估装置可以将当前场景声音中每n时长的声音作为一个场景声音片段,从而得到至少一个场景声音片段。具体的预设单位时长和场景声音片段本申请实施例不作限定。
具体的,在本申请的实施例中,成熟度评估装置确定至少一个场景声音片段中,每个场景声音片段各自对应的低频能量值,得到至少一个低频能量值,包括:对至少一个场景声音片段中,每个场景声音片段分别进行频域变换,得到至少一个频域变换结果;针对至少一个频域变换结果中的每个变换结果,利用频率信息低于预设频率信息的分量确定出一个低频能量值,得到至少一个低频能量值。
需要说明的是,在本申请的实施例中,成熟度评估装置针对每个场景声音片段,可以分别进行傅里叶变换,即频域变换,从而得到相应的频域变换结果,具体可以按照以下公式(1)实现:
Figure BDA0002480424680000081
其中,x(n)为一个场景声音片段,N为傅里叶变换的点数,k为傅里叶变换的频率信息,k值越大表示频率越高,k值越小表示频率越低,X(k)为x(n)在频率信息为k的情况下的频域分量。需要说明的是,在本申请的实施例中,针对于一个场景声音片段得到的频域变换结果,实际上包括其在不同频率信息上的分量。
需要说明的是,在本申请的实施例中,若场景声音片段有T个,成熟度评估装置针对于每个场景声音片段,可以分别按照以下公式(2)获取对应的低频部分的能量值,得到相应的场景低频能量值:
Figure BDA0002480424680000082
其中,M-1小于等于公式(1)中k的最大值,即N-1,X(k)为场景声音片段x(n)在频率信息为k的情况下的分量,e(t)即为利用x(n)的频域变换结果中,频率信息从0至M-1的M个分量得到x(n)相应的场景低频能量值。M-1的取值可以根据实际需求预先设置,本申请实施例不作限定。
可以理解的是,在本申请的实施例中,考虑到敲击瓜果产生的声音主要是低频,为了避免当前场景下人说话的声音的影响,成熟度评估装置主要利用场景声音片段中低频部分的分量进行能量计算。
需要说明的是,在本申请的实施例中,若场景声音片段有T个,对应的场景低频能量值分别为e(0)、e(1)、……,e(T-1),成熟度评估装置可以按照以下公式(3)计算至少一个低频能量值的均值,得到场景低频能量值:
Figure BDA0002480424680000091
其中,E0为场景低频能量值。
需要说明的是,在本申请的实施例中,成熟度评估装置在基于场景低频能量值,获取目标敲击声音之前,还可以执行以下步骤:输出敲击目标瓜果的提示信息。
可以理解的是,在本申请的实施例中,在获取敲击目标瓜果产生的目标敲击声音之前,成熟度评估装置可以先输出提示信息,用于提示用户针对目标瓜果进行敲击,之后,成熟度评估装置从而实现目标敲击声音的获取。成熟度评估装置输出的提示信息可以为在配置的显示界面上输出文字信息以进行提示,也可以是输出特定的提示声音进行提示。具体的提示信息的类型本申请实施例不作限定。
需要说明的是,在本申请的实施例中,为了更好的获取到敲击目标瓜果的声音,因此,对于一次完整的敲击声音的获取,建议用户连续不间断敲击目标瓜果多下,例如,不间断连续敲击三下,从而能够较为准确的捕捉到敲击的声音,避免时长太多,间隔太久,获取到的声音过短,难以进行后续成熟度评估。当然,连续不间断敲击多下的方式成熟度评估装置也可以在输出提示信息时,包含在提示信息中。
具体的,在本申请的实施例中,成熟度评估装置基于场景低频能量值,获取目标敲击声音,包括:基于预设调节参数和场景低频能量值,确定低频能量阈值;在当前场景声音下,持续获取时长为预设单位时长的候选声音片段,并确定获取到的候选声音片段各自对应的低频能量结果;在获取到的第N个候选声音片段对应的第N个低频能量结果,高于低频能量阈值的情况下,确定第N个候选声音片段为敲击起始声音片段;N为大于等于1的自然数;在继续获取到的第M个候选声音片段对应的第M个短时能量几个,低于或等于低频能量阈值的情况下,确定第M个候选声音片段为敲击终止声音片段;M为大于N的自然数;将获取到的从第N个候选声音片段到第M个候选声音片段的全部候选声音片段,确定为目标敲击声音。
需要说明的是,在本申请的实施例中,成熟度评估装置中存储有预设调节参数。成熟度评估装置可以将预设调节参数与场景低频能量值的乘积,确定为低频能量阈值。例如,预设调节参数为k,场景低频能量值为E0,成熟度评估装置将k×E0确定为场景低频能量阈值。
需要说明的是,在本申请的实施例中,成熟度评估装置可以实时进行声音获取,其在当前场景声音下,持续获取时长为预设时长的声音片段,将每个声音片段均作为一个候选声音片段,并且,在获取到每个候选声音片段的同时,针对候选声音片段确定对应的低频能量值。其中,成熟度评估装置确定每个候选声音片段对应的低频能量值的方式,与上述确定每个场景声音片段各自对应的低频能量值的方式完全相同,在此不再赘述。
需要说明的是,在本申请的实施例中,成熟度评估装置是持续获取时长为预设单位时长的候选声音片段,即获取到的声音的时长每达到预设时长就确定为一个候选声音片段。其中,成熟度评估装置在获取到第N个候选声音片段时,如果其对应的低频能量值,即第N个低频能量值,高于低频能量阈值,则表征在获取第N个候选声音片段时,用户已经开始敲击目标瓜果了,因此,可以将第N个候选声音片段作为敲击起始声音片段,并继续进行候选声音片段的获取,以及确定相应的低频能量值,之后,在继续获取到第M个候选声音片段时,如果其对应的低频能量值,即第M个低频能量值,低于或者等于低频能量阈值,则表征在获取第M个候选声音片段时,用户已经停止敲击目标瓜果了,因此,可以将第M个候选声音片段作为敲击终止声音片段,从而将获取到的从第N个候选声音片段到第M个候选声音片段的全部候选声音片段,作为目标敲击声音。成熟度评估装置通过声音低频部分能量的变化可以较为准确的判断一次目标瓜果被敲击是否完成,从而得到一次完成的连续敲击目标瓜果的声音。
需要说明的是,在本申请的实施例中,成熟度评估装置可以获取一次完整敲击所产生的目标敲击声音,也可以获取多次完整敲击产生的多次目标敲击声音。上述获取过程为一次完整的敲击声音的获取过程,对于多次而言,成熟度评估装置获取的方式仅需要重新重复同样的步骤即可,在此不再赘述。
图2为本申请实施例提供的一种获取目标敲击声音的流程示意图。如图2所示,成熟度评估装置配置有麦克风,从而采用麦克风实时获取声音,针对获取的声音分窗,即获取时长达到预设单位时长的候选声音片段,之后,确定相应的低频能量值E,并与场景低频能量值E0和预设调节参数k乘积得到的低频能量阈值进行比较,从而在大于该阈值的情况下,开始进行目标敲击声音的存储,即以该候选声音片段为起始,开始存储获取到的候选声音片段,并继续进行声音分窗,获取候选声音片段并计算低频能量值,从而在出现某一候选声音片段的低频能量值低于或等于低频能量阈值的情况下,结束存储,将这一段时间内存储的声音确定为目标敲击声音。
S102、对目标敲击声音进行特征提取,得到目标声音特征。
在本申请的实施例中,成熟度评估装置在获取到目标敲击声音之后,即可对目标敲击声音进行特征提取,得到目标声音特征。
需要说明的是,在本申请的实施例中,成熟度评估装置对目标敲击声音的特征提取方式可以根据实际需求预先设置,例如,可以采用梅尔频率倒谱系数(Mel-scaleFrequency Cepstral Coefficients,MFCC)、小波包分解等方式。具体的特征提取方式本申请实施例不作限定。
图3为本申请实施例提供的一种示例性的特征提取的流程示意图。如图3所示,成熟度评估装置采用MFCC特征提取方式进行特征提取,需要说明的是,预加重步骤,即对目标敲击声音采用高通滤波器进行预加重,该高通滤波器的数学表达式为:H(z)=1-az-1,其中,a为修正系数,通常取值范围为0.95-0.97;分帧加窗步骤,用于将信号分为很多帧数,再平滑其边缘,具体采用的是汉明窗,汉明窗的具体数学表达式为:
Figure BDA0002480424680000111
其中,n为整数,n=0,1,2,……,M,M为傅里叶变换的点数,在本申请的实施例中,M可以取1024,目标敲击声音采样率为16000Hz,即每次输入64ms声音数据提取特征;梅尔滤波步骤,是将能量谱转换为符合人耳听觉的梅尔谱,梅尔谱的数学表达式为:
Figure BDA0002480424680000121
其中,f为傅里叶变换后的频点;最后,对梅尔谱取对数,做离散余弦变换,得到的系数即为目标声音特征。此外,上述特征提取过程是每一帧64ms的声音数据的特征提取过程,在实际特征提取的过程中,若输入的目标敲击声音的时长为t,可以每次取一帧64ms数据提取一次MFCC特征,两帧之间的数据重叠32ms,输出的目标声音特征具体为
Figure BDA0002480424680000122
的二维矩阵。
S103、利用声音分析模型对目标声音特征进行分析,确定出目标瓜果的成熟度;声音分析模型为具备利用声音信息评估成熟度功能的模型。
在本申请的实施例中,成熟度评估装置在获得目标声音特征之后,即可利用声音分析模型对目标声音特征进行分析,确定出目标瓜果的成熟度。
需要说明的是,在本申请的实施例中,成熟度评估装置中存储有声音分析模型,成熟度评估装置利用声音分析模型对目标声音特征进行分析,即可得到目标瓜果的成熟度。其中,声音分析模型输出的目标瓜果的成熟度具体为目标瓜果成熟的概率。
需要说明的是,在本申请的实施例中,声音分析模型的类型可以是卷积神经网络(Convolutional Neural Networks,CNN)模型,也可以是其它类型的模型。具体的声音分析模型本申请实施例不作限定。
图4为本申请实施例提供的一种示例性的模型分析的流程示意图。如图4所示,声音分析模型为CNN模型,目标声音特征依次经过声音分析模型的第一卷积层、第二卷积层、第一全连接层、第二全连接层和归一化层进行处理,从而输出目标瓜果的成熟度。
需要说明的是,在本申请的实施例中,为了保证成熟度评估的准确性,成熟度评估装置可以获取到多次目标敲击声音,对于得到多次目标敲击声音,可以分别利用声音分析模型进行成熟度评估,从而根据多个评估结果按照特定的决策策略进行最终成熟度的确定。例如,获取三次目标敲击声音,采取若两次目标敲击声音得到的成熟的概率大于阈值T,则认为目标瓜果成熟,否则认为不成熟。
需要说明的是,在本申请的实施例中,成熟度评估装置在利用声音分析模型对目标声音特征进行分析,确定出目标瓜果的成熟度之前,实际上需要先进行模型训练,从而得到声音分析模型。
图5为本申请实施例提供的一种模型训练的流程示意图。如图5所示,在本申请的实施例中,成熟度评估装置在利用声音分析模型对目标声音特征进行分析,确定出目标瓜果的成熟度之前,还可以执行以下步骤:
S501、获取样本场景声音、无噪声环境下敲击样本瓜果产生的样本敲击声音,以及样本敲击声音对应的真实成熟度;样本瓜果与目标瓜果为同一品种瓜果。
需要说明的是,在本申请的实施例中,样本瓜果可以包括同一品种的不同成熟度的瓜果,相应的,样本敲击声音可以包括敲击不同成熟度的瓜果产生的声音。
示例性的,在本申请的实施例中,样本瓜果和目标瓜果均为西瓜,敲击西瓜产生的声音采集主要是采集熟西瓜和生西瓜的声音,主要是根据西瓜授粉之后成熟的时间来分阶段进行采集,一般成熟为28天左右。具体的,跟踪一块瓜田,从西瓜授粉阶段开始标记500个西瓜,均为样本瓜果,到了第22天的时候采集其中200个西瓜采摘,并在无噪声的实验室进行敲击西瓜的声音录制,这一批采集的声音为生西瓜的声音,并在录制后进行开瓜验证是否为生西瓜。待到授粉28天时,再次采摘200个西瓜,并在实验室进行敲击西瓜的声音录制,这一批采集的声音为熟西瓜的声音,并在录制后进行开瓜验证是否为熟西瓜。其中,开瓜验证的结果实际上就是真实成熟度。
需要说明的是,在本申请的实施例中,样本场景声音的采集主要是考虑到消费者购买瓜果时会涉及到各种场景声音,主要有超市、水果店、水果摊等。本方案采集各类卖瓜果的场景,每种场景录制一个小时的声音,作为样本场景声音。
S502、将样本场景声音和样本敲击声音进行融合,得到样本融合声音。
可以理解的是,在本申请的实施例中,在实际进行敲击目标瓜果的声音录制时,肯定存在有当时场景的场景声音,如各种噪声,而上述样本敲击声音的采集因此,在模型训练时成熟度评估装置需要将样本敲击声音和样本场景声音进行融合,即叠加到一起,形成与实际应用场景符合的样本融合声音。
S503、对样本融合声音进行特征提取,得到样本声音特征。
需要说明的是,在本申请的实施例中,成熟度评估装置对样本融合声音进行特征提取的方式与上述步骤S103中的特征提取方式相同,在此不再赘述。
S504、基于样本声音特征和真实成熟度,对预设分析模型进行模型训练,得到声音分析模型。
具体的,在本申请的实施例中,成熟度评估装置基于样本声音特征和真实成熟度,对预设分析模型进行模型训练,得到声音分析模型,包括:利用预设分析模型对样本声音特征进行分析,确定出样本瓜果对应的预测成熟度;确定预测成熟度和真实成熟度之间的差异,得到差异结果;基于差异结果对预设分析模型进行参数调节,得到声音分析模型。
需要说明的是,在本申请的实施例中,预设分析模型可以为是卷积神经网络模型,也可以是其它类型的模型,模型中的参数的设置均为预设的初始参数。成熟度评估装置可以先将样本声音特征输入预设分析模型,从而得到对应的预测成熟度,之后,衡量其与样本瓜果的真实成熟度之间的差距,衡量的方式就是计算损失函数,具体采用的损失函数可以为交叉熵损失函数,得到的结果就是差异结果。最终,成熟度评估装置根据差异结果,进行预设分析模型中参数的调节,直至差异结果小于一定阈值,从而将得到的模型确定为声音分析模型。
本申请实施例提供了一种成熟度评估方法,包括:获取当前场景下敲击目标瓜果产生的目标敲击声音;对目标敲击声音进行特征提取,得到目标声音特征;利用声音分析模型对目标声音特征进行分析,确定出目标瓜果的成熟度;声音分析模型为具备利用声音信息评估成熟度功能的模型。本申请实施例提供的技术方案,利用声音分析模型对敲击瓜果产生的声音进行分析,从而确定出成熟度,不仅提高了评估的准确性,而且整个评估方式可以集成在移动终端等电子设备,提高了评估的灵活性。
本申请实施例还提供了一种成熟度评估装置。图6为本申请实施例提供的一种成熟度评估装置的结构示意图一。如图6所示,成熟度评估装置主要包括:
声音获取模块601,用于获取当前场景下敲击目标瓜果产生的目标敲击声音;
特征提取模块602,用于对所述目标敲击声音进行特征提取,得到目标声音特征;
模型评估模块603,用于利用声音分析模型对所述目标声音特征进行分析,确定出所述目标瓜果的成熟度;所述声音分析模型为具备利用声音信息评估成熟度功能的模型。
在本申请一实施例中,所述声音获取模块601,具体用于获取所述当前场景下的当前场景声音;对所述当前场景声音进行低频短时能量分析,得到场景低频能量值;基于所述场景低频能量值,获取所述目标敲击声音。
在本申请一实施例中,所述声音获取模块601,具体用于按照预设单位时长对所述当前场景声音片段划分,得到至少一个场景声音片段;确定所述至少一个场景声音片段中,每个场景声音片段各自对应的低频能量值,得到至少一个低频能量值;计算所述至少一个低频能量值的均值,得到所述场景低频能量值。
在本申请一实施例中,所述声音获取模块601,具体用于对所述至少一个场景声音片段中,每个场景声音片段分别进行频域变换,得到至少一个频域变换结果;针对所述至少一个频域变换结果中的每个变换结果,利用频率信息低于预设频率信息的分量确定出一个低频能量值,得到所述至少一个低频能量值。
在本申请一实施例中,所述声音获取模块601,具体用于基于预设调节参数和所述场景低频能量值,确定低频能量阈值;在所述当前场景声音下,持续获取时长为预设单位时长的候选声音片段,并确定获取到的候选声音片段各自对应的低频能量值;在获取到的第N个候选声音片段对应的第N个低频能量值,高于所述低频能量阈值的情况下,确定所述第N个候选声音片段为敲击起始声音片段;N为大于等于1的自然数;在继续获取到的第M个候选声音片段对应的第M个低频能量值,低于或等于所述低频能量阈值的情况下,确定所述第M个候选声音片段为敲击终止声音片段;M为大于N的自然数;将获取到的从所述第N个候选声音片段到所述第M个候选声音片段的全部候选声音片段,确定为所述目标敲击声音。
在本申请一实施例中,所述装置还包括:信息提示模块604(图中未示出);
所述信息提示模块604,用于输出敲击所述目标瓜果的提示信息。
在本申请一实施例中,所述装置还包括:声音融合模块605和模型训练模块606(图中未示出);
所述声音获取模块601,还用于获取样本场景声音、无噪声环境下敲击样本瓜果产生的样本敲击声音,以及所述样本敲击声音对应的真实成熟度;所述样本瓜果与所述目标瓜果为同一品种瓜果;
所述声音融合模块605,用于将所述样本场景声音和所述样本敲击声音进行融合,得到样本融合声音;
所述特征提取模块602,还用于对所述样本融合声音进行特征提取,得到样本声音特征;
所述模型训练模块606,用于基于所述样本声音特征和所述真实成熟度,对预设分析模型进行模型训练,得到所述声音分析模型。
在本申请一实施例中,所述模型训练模块606,具体用于利用所述预设分析模型对所述样本声音特征进行分析,确定出所述样本瓜果对应的预测成熟度;确定所述预测成熟度和所述真实成熟度之间的差异,得到差异结果;基于所述差异结果对所述预设分析模型进行参数调节,得到所述声音分析模型。
图7为本申请实施例提供的一种成熟度评估装置的结构示意图二。如图7所示,装置包括处理器701、存储器702和通信总线703;
所述通信总线703,用于实现所述处理器701和所述存储器702之间的通信连接;
所述处理器701,用于执行所述存储器702中存储的成熟度评估程序,以实现上述成熟度评估方法。
本申请实施例提供了一种成熟度评估装置,获取当前场景下敲击目标瓜果产生的目标敲击声音;对目标敲击声音进行特征提取,得到目标声音特征;利用声音分析模型对目标声音特征进行分析,确定出目标瓜果的成熟度;声音分析模型为具备利用声音信息评估成熟度功能的模型。本申请实施例提供的成熟度评估装置,利用声音分析模型对敲击瓜果产生的声音进行分析,从而确定出成熟度,不仅提高了评估的准确性,而且整个评估方式可以集成在移动终端等电子设备,提高了评估的灵活性。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述成熟度评估方法。计算机可读存储介质可以是易失性存储器(volatile memory),例如随机存取存储器(Random-Access Memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(Read-Only Memory,ROM),快闪存储器(flash memory),硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD);也可以是包括上述存储器之一或任意组合的各自设备,如移动电话、计算机、平板设备、个人数字助理等。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的实现流程示意图和/或方框图来描述的。应理解可由计算机程序指令实现流程示意图和/或方框图中的每一流程和/或方框、以及实现流程示意图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在实现流程示意图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在实现流程示意图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在实现流程示意图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本实用申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种成熟度评估方法,其特征在于,所述方法包括:
获取当前场景下敲击目标瓜果产生的目标敲击声音;
对所述目标敲击声音进行特征提取,得到目标声音特征;
利用声音分析模型对所述目标声音特征进行分析,确定出所述目标瓜果的成熟度;所述声音分析模型为具备利用声音信息评估成熟度功能的模型。
2.根据权利要求1所述的方法,其特征在于,所述获取当前场景下敲击目标瓜果产生的目标敲击声音,包括:
获取所述当前场景下的当前场景声音;
对所述当前场景声音进行低频短时能量分析,得到场景低频能量值;
基于所述场景低频能量值,获取所述目标敲击声音。
3.根据权利要求2所述的方法,其特征在于,所述对所述当前场景声音进行低频短时能量分析,得到场景低频能量值,包括:
按照预设单位时长对所述当前场景声音片段划分,得到至少一个场景声音片段;
确定所述至少一个场景声音片段中,每个场景声音片段各自对应的低频能量值,得到至少一个低频能量值;
计算所述至少一个低频能量值的均值,得到所述场景低频能量值。
4.根据权利要求3所述的方法,其特征在于,所述确定所述至少一个场景声音片段中,每个场景声音片段各自对应的低频能量值,得到至少一个低频能量值,包括:
对所述至少一个场景声音片段中,每个场景声音片段分别进行频域变换,得到至少一个频域变换结果;
针对所述至少一个频域变换结果中的每个变换结果,利用频率信息低于预设频率信息的分量确定出一个低频能量值,得到所述至少一个低频能量值。
5.根据权利要求2所述的方法,其特征在于,所述基于所述场景低频能量值,获取所述目标敲击声音,包括:
基于预设调节参数和所述场景低频能量值,确定低频能量阈值;
在所述当前场景声音下,持续获取时长为预设单位时长的候选声音片段,并确定获取到的候选声音片段各自对应的低频能量值;
在获取到的第N个候选声音片段对应的第N个低频能量值,高于所述低频能量阈值的情况下,确定所述第N个候选声音片段为敲击起始声音片段;N为大于等于1的自然数;
在继续获取到的第M个候选声音片段对应的第M个低频能量值,低于或等于所述低频能量阈值的情况下,确定所述第M个候选声音片段为敲击终止声音片段;M为大于N的自然数;
将获取到的从所述第N个候选声音片段到所述第M个候选声音片段的全部候选声音片段,确定为所述目标敲击声音。
6.根据权利要求2所述的方法,其特征在于,所述基于所述场景低频能量值,获取所述目标敲击声音之前,所述方法还包括:
输出敲击所述目标瓜果的提示信息。
7.根据权利要求1所述的方法,其特征在于,所述利用声音分析模型对所述目标声音特征进行分析,确定出所述目标瓜果的成熟度之前,所述方法还包括:
获取样本场景声音、无噪声环境下敲击样本瓜果产生的样本敲击声音,以及所述样本敲击声音对应的真实成熟度;所述样本瓜果与所述目标瓜果为同一品种瓜果;
将所述样本场景声音和所述样本敲击声音进行融合,得到样本融合声音;
对所述样本融合声音进行特征提取,得到样本声音特征;
基于所述样本声音特征和所述真实成熟度,对预设分析模型进行模型训练,得到所述声音分析模型。
8.根据权利要求7所述的方法,其特征在于,所述基于所述样本声音特征和所述真实成熟度,对预设分析模型进行模型训练,得到所述声音分析模型,包括:
利用所述预设分析模型对所述样本声音特征进行分析,确定出所述样本瓜果对应的预测成熟度;
确定所述预测成熟度和所述真实成熟度之间的差异,得到差异结果;
基于所述差异结果对所述预设分析模型进行参数调节,得到所述声音分析模型。
9.一种成熟度评估装置,其特征在于,所述装置包括:
声音获取模块,用于获取当前场景下敲击目标瓜果产生的目标敲击声音;
特征提取模块,用于对所述目标敲击声音进行特征提取,得到目标声音特征;
模型评估模块,用于利用声音分析模型对所述目标声音特征进行分析,确定出所述目标瓜果的成熟度;所述声音分析模型为具备利用声音信息评估成熟度功能的模型。
10.一种成熟度评估装置,其特征在于,所述装置包括处理器、存储器和通信总线;
所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;
所述处理器,用于执行所述存储器中存储的成熟度评估程序,以实现权利要求1-8任一项所述的成熟度评估方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-8任一项所述的成熟度评估方法。
CN202010377268.2A 2020-05-07 2020-05-07 一种成熟度评估方法及装置、存储介质 Active CN111640451B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010377268.2A CN111640451B (zh) 2020-05-07 2020-05-07 一种成熟度评估方法及装置、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010377268.2A CN111640451B (zh) 2020-05-07 2020-05-07 一种成熟度评估方法及装置、存储介质

Publications (2)

Publication Number Publication Date
CN111640451A true CN111640451A (zh) 2020-09-08
CN111640451B CN111640451B (zh) 2023-01-31

Family

ID=72333166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010377268.2A Active CN111640451B (zh) 2020-05-07 2020-05-07 一种成熟度评估方法及装置、存储介质

Country Status (1)

Country Link
CN (1) CN111640451B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114740091A (zh) * 2022-06-14 2022-07-12 湖南大学 基于声学分析和机器学习的西瓜成熟度检测方法及系统
WO2023029311A1 (zh) * 2021-08-31 2023-03-09 合肥美的电冰箱有限公司 水果成熟度检测方法、装置、设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1194807A (ja) * 1997-09-24 1999-04-09 Ono Sokki Co Ltd 果実の熟度測定方法と熟度測定装置
US20070079644A1 (en) * 2005-10-12 2007-04-12 Clark Brian W Ripe melon detector
US20080144927A1 (en) * 2006-12-14 2008-06-19 Matsushita Electric Works, Ltd. Nondestructive inspection apparatus
US20140122044A1 (en) * 2011-06-17 2014-05-01 Nec Corporation Harvest-time ripeness estimation device, harvest-time ripeness estimation method and program
UA111414C2 (uk) * 2014-09-15 2016-04-25 Василь Васильович Молебний Спосіб визначення ступеня стиглості кавунів
CN205879875U (zh) * 2016-07-09 2017-01-11 石河子大学 一种哈密瓜成熟度声学无损检测装置
CN108520758A (zh) * 2018-03-30 2018-09-11 清华大学 一种视听觉跨模态物体材质检索方法及系统
CN109459499A (zh) * 2018-12-26 2019-03-12 广东机电职业技术学院 一种基于stm32的西瓜熟度快速检测仪及方法
CN109856345A (zh) * 2019-03-12 2019-06-07 潍坊学院 一种水果质量识别方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1194807A (ja) * 1997-09-24 1999-04-09 Ono Sokki Co Ltd 果実の熟度測定方法と熟度測定装置
US20070079644A1 (en) * 2005-10-12 2007-04-12 Clark Brian W Ripe melon detector
US20080144927A1 (en) * 2006-12-14 2008-06-19 Matsushita Electric Works, Ltd. Nondestructive inspection apparatus
CN101206196A (zh) * 2006-12-14 2008-06-25 松下电工株式会社 无损检查装置
US20140122044A1 (en) * 2011-06-17 2014-05-01 Nec Corporation Harvest-time ripeness estimation device, harvest-time ripeness estimation method and program
UA111414C2 (uk) * 2014-09-15 2016-04-25 Василь Васильович Молебний Спосіб визначення ступеня стиглості кавунів
CN205879875U (zh) * 2016-07-09 2017-01-11 石河子大学 一种哈密瓜成熟度声学无损检测装置
CN108520758A (zh) * 2018-03-30 2018-09-11 清华大学 一种视听觉跨模态物体材质检索方法及系统
CN109459499A (zh) * 2018-12-26 2019-03-12 广东机电职业技术学院 一种基于stm32的西瓜熟度快速检测仪及方法
CN109856345A (zh) * 2019-03-12 2019-06-07 潍坊学院 一种水果质量识别方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张玉新,赵洋,陶佳: "基于音频特性的西瓜成熟度无损检测技术研究", 《河北农业大学学报》 *
张玉新: "基于音频特性的西瓜成熟度无损检测技术研究", 《中国优秀博硕士学位论文全文数据库》 *
肖珂等: "西瓜成熟度音频无损检测技术", 《农机化研究》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023029311A1 (zh) * 2021-08-31 2023-03-09 合肥美的电冰箱有限公司 水果成熟度检测方法、装置、设备及存储介质
CN114740091A (zh) * 2022-06-14 2022-07-12 湖南大学 基于声学分析和机器学习的西瓜成熟度检测方法及系统
CN114740091B (zh) * 2022-06-14 2022-09-06 湖南大学 基于声学分析和机器学习的西瓜成熟度检测方法及系统

Also Published As

Publication number Publication date
CN111640451B (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
CN108597498B (zh) 一种多麦克风语音采集方法及装置
US8140331B2 (en) Feature extraction for identification and classification of audio signals
CN107928673B (zh) 音频信号处理方法、装置、存储介质和计算机设备
CN106486131B (zh) 一种语音去噪的方法及装置
CN110033756B (zh) 语种识别方法、装置、电子设备及存储介质
CN107293286B (zh) 一种基于网络配音游戏的语音样本收集方法
CN106558308B (zh) 一种互联网音频数据质量自动打分系统及方法
US20150213798A1 (en) Method and Apparatus for Evaluating Voice Quality
KR20140079369A (ko) 사운드 신호를 주파수 처프 도메인으로 변환하는 것을 포함하는 사운드 신호 프로세싱 시스템 및 방법
CN111640451B (zh) 一种成熟度评估方法及装置、存储介质
CN102881289A (zh) 一种基于听觉感知特性的语音质量客观评价方法
CN111080109B (zh) 客服服务质量评价方法、装置及电子设备
CN108701469A (zh) 咳嗽声音识别方法、设备和存储介质
JP5634959B2 (ja) 雑音/残響除去装置とその方法とプログラム
CN108877823A (zh) 语音增强方法和装置
CN111540342B (zh) 一种能量阈值调整方法、装置、设备及介质
CN110767239A (zh) 一种基于深度学习的声纹识别方法、装置及设备
CN110136729B (zh) 模型生成方法、音频处理方法、装置及计算机可读存储介质
WO2017045429A1 (zh) 一种音频数据的检测方法、系统及存储介质
CN103514877A (zh) 振动信号特征参数提取方法
KR102026226B1 (ko) 딥러닝 기반 Variational Inference 모델을 이용한 신호 단위 특징 추출 방법 및 시스템
CN109389988B (zh) 音效调整控制方法和装置、存储介质及电子装置
CN112151055B (zh) 音频处理方法及装置
CN111755025B (zh) 一种基于音频特征的状态检测方法、装置及设备
CN107993666B (zh) 语音识别方法、装置、计算机设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant