CN108364661B - 可视化语音性能评估方法、装置、计算机设备及存储介质 - Google Patents

可视化语音性能评估方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN108364661B
CN108364661B CN201711346946.3A CN201711346946A CN108364661B CN 108364661 B CN108364661 B CN 108364661B CN 201711346946 A CN201711346946 A CN 201711346946A CN 108364661 B CN108364661 B CN 108364661B
Authority
CN
China
Prior art keywords
spectrogram
evaluation
local
input signal
local evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711346946.3A
Other languages
English (en)
Other versions
CN108364661A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Original Assignee
Haier Uplus Intelligent Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haier Uplus Intelligent Technology Beijing Co Ltd filed Critical Haier Uplus Intelligent Technology Beijing Co Ltd
Priority to CN201711346946.3A priority Critical patent/CN108364661B/zh
Publication of CN108364661A publication Critical patent/CN108364661A/zh
Application granted granted Critical
Publication of CN108364661B publication Critical patent/CN108364661B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种可视化语音性能评估方法、装置、计算机设备及存储介质,其中,方法包括以下步骤:确定语谱图中的局部评估区域,并获取局部评估区域的参数值;确定选取的评估指标,并获取评估指标的计算公式;根据局部评估区域中的参数值和计算公式,计算评估指标的评估值,并将评估值在语谱图中进行显示。利用本发明的技术方案,可以在可视化的语谱图中进行局部评估区域的选择,得到局部评估区域的精确语音质量,给用户提供了一种直观、灵活、便利的语音质量评估方式。

Description

可视化语音性能评估方法、装置、计算机设备及存储介质
技术领域
本发明涉及信号处理领域,特别涉及一种可视化语音性能评估方法、装置、计算机设备及存储介质。
背景技术
信号处理技术是智能家居领域、通信领域非常重要的技术,而经过信号处理后的语音信号质量评估也是一个非常重要的课题,以往有一些语音质量评估的指标,如PESQ(Perceptual evaluation of speech quality,主观语音质量评估)、降噪量等都是固定的全局指标,且不具有直观性,这会使得指标的使用者无法对重点的局部语音区域进行较精确且直观的语音质量评估。
发明内容
为了解决现有技术中缺少对重点的局部语音区域进行较精确且直观的语音质量评估的问题,本发明提供了一种可视化语音性能评估方法、装置、计算机设备及存储介质。
本发明提供的可视化语音性能评估方法,包括以下步骤:
确定语谱图中的局部评估区域,并获取局部评估区域的参数值;
确定选取的评估指标,并获取评估指标的计算公式;
根据局部评估区域中的参数值和计算公式,计算评估指标的评估值,并将评估值在语谱图中进行显示。
可选的,在本发明的可视化语音性能评估方法中,确定语谱图中的局部评估区域包括:
当语谱图的数量为一个时,接收在语谱图中选取的局部评估区域;
当语谱图的数量为多个时,接收在第一个语谱图中选取的第一局部评估区域;根据第一局部评估区域的位置,遍历剩余的所有语谱图,从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域,第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。
可选的,在本发明的可视化语音性能评估方法中,在确定语谱图中的局部评估区域之前,还包括:根据输入信号得到语谱图。
可选的,在本发明的可视化语音性能评估方法中,根据输入信号得到语谱图信息,包括:
对输入信号进行分帧处理、加窗处理及FFT变换,得到输入信号中每帧信号的FFT变换系数;
根据输入信号中每帧信号的FFT变换系数,得到与输入信号对应的语谱图。
本发明还提供了一种可视化语音性能评估装置,包括:评估区域确定模块、评估指标确定模块及评估结果显示模块;
评估区域确定模块,用于确定语谱图中的局部评估区域,并获取局部评估区域的参数值;
评估指标确定模块,用于确定选取的评估指标,并获取评估指标的计算公式;
评估结果显示模块,用于根据局部评估区域中的参数值和计算公式,计算评估指标的评估值,并将评估值在语谱图中进行显示。
可选的,在本发明可视化语音性能评估装置中,评估区域确定模块具体用于:
当语谱图的数量为一个时,接收在语谱图中选取的局部评估区域;
当语谱图的数量为多个时,接收在第一个语谱图中选取的第一局部评估区域;根据第一局部评估区域的位置,遍历剩余的所有语谱图,从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域,第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。
可选的,在本发明可视化语音性能评估装置中,还包括语谱图构建模块;
语谱图构建模块,用于在确定语谱图中的局部评估区域之前,根据输入信号得到语谱图。
可选的,在本发明可视化语音性能评估装置中,语谱图构建模块具体用于:
对输入信号进行分帧处理、加窗处理及FFT变换,得到输入信号中每帧信号的FFT变换系数;
根据输入信号中每帧信号的FFT变换系数,得到与输入信号对应的语谱图。
本发明还提供了一种计算机可读存储介质,存储介质上存储有计算机程序,程序被处理器执行时实现上述方法的步骤。
本发明还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现上述方法的步骤。
本发明的有益效果如下:
本发明实施例提供的可视化语音性能评估方法、装置、计算机设备及存储介质,可以在可视化语谱图中进行局部评估区域的选择,得到局部评估区域的精确语音质量,给用户提供了一种直观、灵活、便利的语音质量评估方式。
附图说明
图1为本发明方法实施例中可视化语音性能评估方法的流程示意图;
图2为本发明装置实施例中可视化语音性能评估装置的结构示意图;
图3为本发明实例1中可视化语音性能评估方法的流程示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决现有技术中缺少对重点的局部语音区域进行较精确且直观的语音质量评估的问题,本发明提供了一种可视化语音性能评估方法、设备及计算机可读存储介质,以下结合附图对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
根据本发明的方法实施例,提供了一种可视化语音性能评估方法,图1为本发明方法实施例中可视化语音性能评估方法的流程示意图,如图1所示,本发明方法实施例的可视化语音性能评估方法,包括以下步骤:
S101:确定语谱图中的局部评估区域,并获取局部评估区域的参数值。
语谱图用来表示输入语音信号的时频域信息,能够给人以非常直观的显示,其中横轴表示时间,纵轴表示频率,颜色表示能量。
在本发明方法实施例中,局部评估区域的位置不局限,可以选定整个语谱图中的任意位置。
可选的,确定语谱图中的局部评估区域包括:
当语谱图的数量为一个时,接收在语谱图中选取的局部评估区域;
当语谱图的数量为多个时,接收在第一个语谱图中选取的第一局部评估区域;根据第一局部评估区域的位置,遍历剩余的所有语谱图,从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域,第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。即采用本发明方法实施例的技术方案,可对多组语音(多个语谱图)同时进行比较。
可选的,确定语谱图中的局部评估区域包括:当局部评估区域的数量为多个时,分别确定语谱图中的多个局部评估区域。即在本发明方法实施例中,局部评估区域的数量不局限,可以选定整个语谱图中的多个局部评估区域。
可选的,局部评估区域中的参数值包括:局部评估区域内每帧信号的FFT变换系数。
S102:确定选取的评估指标,并获取评估指标的计算公式。
在本发明方法实施例中,可选评估指标不做限定,可以为LSD(logspectraldistance,对数谱距离)、降噪量等各种语音评估指标,还可以根据需求自定义评估指标及计算公式。
S103:根据局部评估区域中的参数值和计算公式,计算评估指标的评估值,并将评估值在语谱图中进行显示。
进一步,在本发明方法实施例的可视化语音性能评估方法中,还包括:当评估指标的数量为多个时,将每一个评估指标的名称及对应的评估值在语谱图中进行显示。
进一步的,在本发明方法实施例的可视化语音性能评估方法中,在确定语谱图中的局部评估区域之前,还包括:根据输入信号得到语谱图。
可选的,根据输入信号得到语谱图信息,包括:
对输入信号进行分帧处理、加窗处理及FFT变换,得到输入信号中每帧信号的FFT变换系数;
根据输入信号中每帧信号的FFT变换系数,得到与输入信号对应的语谱图。
可选的,在对输入信号进行分帧处理之前,还包括:
将输入信号以预设的参考信号为标准进行对齐,以消除输入信号的延迟。
本发明方法实施例提供的可视化语音性能评估方法,不局限于任何一种评估指标,不局限于具体的评估位置,可以在可视化语谱图中进行局部评估区域的选择,得到局部评估区域的精确语音质量,给用户提供了一种直观、灵活、便利的语音质量评估方式。
根据本发明的装置实施例,提供了一种可视化语音性能评估装置,图2为本发明装置实施例中可视化语音性能评估装置的结构示意图,如图2所示,本发明装置实施例的可视化语音性能评估装置包括:评估区域确定模块20、评估指标确定模块22及评估结果显示模块24,以下对各模块进行具体的描述。
评估区域确定模块20,用于确定语谱图中的局部评估区域,并获取局部评估区域的参数值。
可选的,在本发明装置实施例可视化语音性能评估装置中,评估区域确定模块20具体用于:
当语谱图的数量为一个时,接收在语谱图中选取的局部评估区域;
当语谱图的数量为多个时,接收在第一个语谱图中选取的第一局部评估区域;根据第一局部评估区域的位置,遍历剩余的所有语谱图,从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域,第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。即采用本发明装置实施例的技术方案,可对多组语音(多个语谱图)同时进行比较。
可选的,在本发明装置实施例可视化语音性能评估装置中,评估区域确定模块20具体用于:当局部评估区域的数量为多个时,分别确定语谱图中的多个局部评估区域。即在本发明装置实施例中,局部评估区域的数量不局限,可以选定整个语谱图中的多个局部评估区域。
可选的,局部评估区域中的参数值包括:局部评估区域内每帧信号的FFT变换系数。
评估指标确定模块22,用于确定选取的评估指标,并获取评估指标的计算公式。
在本发明装置实施例中,可选评估指标不做限定,可以为LSD(logspectraldistance,对数谱距离)、降噪量等各种语音评估指标,还可以根据需求自定义评估指标及计算公式。
评估结果显示模块24,用于根据局部评估区域中的参数值和计算公式,计算评估指标的评估值,并将评估值在语谱图中进行显示。
进一步,在本发明装置实施例的可视化语音性能评估装置中,评估结果显示模块24具体用于:当评估指标的数量为多个时,将每一个评估指标的名称及对应的评估值在语谱图中进行显示。
进一步的,在本发明装置实施例可视化语音性能评估装置中,还包括语谱图构建模块;
语谱图构建模块,用于在确定语谱图中的局部评估区域之前,根据输入信号得到语谱图。
可选的,在本发明装置实施例可视化语音性能评估装置中,语谱图构建模块具体用于:
对输入信号进行分帧处理、加窗处理及FFT变换,得到输入信号中每帧信号的FFT变换系数;
根据输入信号中每帧信号的FFT变换系数,得到与输入信号对应的语谱图。
可选的,在本发明装置实施例可视化语音性能评估装置中,语谱图构建模块具体用于:在对输入信号进行分帧处理之前,将输入信号以预设的参考信号为标准进行对齐,以消除输入信号的延迟。
本发明装置实施例提供的可视化语音性能评估装置,不局限于任何一种评估指标,不局限于具体的评估位置,可以在可视化语谱图中进行局部评估区域的选择,得到局部评估区域的精确语音质量,给用户提供了一种直观、灵活、便利的语音质量评估方式。
本发明还提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如下步骤:
步骤11:确定语谱图中的局部评估区域,并获取局部评估区域的参数值。
可选的,确定语谱图中的局部评估区域包括:
当语谱图的数量为一个时,接收在语谱图中选取的局部评估区域;
当语谱图的数量为多个时,接收在第一个语谱图中选取的第一局部评估区域;根据第一局部评估区域的位置,遍历剩余的所有语谱图,从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域,第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。即采用本发明方法实施例的技术方案,可以跨窗口选定局部评估区域,当第一个语谱图中的第一局部评估区域变动时,剩余的所有语谱图中个局部评估区域也随之变动。
可选的,确定语谱图中的局部评估区域包括:当局部评估区域的数量为多个时,分别确定语谱图中的多个局部评估区域。
可选的,局部评估区域中的参数值包括:局部评估区域内每帧信号的FFT变换系数。
步骤12:确定选取的评估指标,并获取评估指标的计算公式。
步骤13:根据局部评估区域中的参数值和计算公式,计算评估指标的评估值,并将评估值在语谱图中进行显示。
进一步,处理器执行程序时实现如下步骤:当评估指标的数量为多个时,将每一个评估指标的名称及对应的评估值在语谱图中进行显示。
进一步的,处理器执行程序时实现如下步骤:在确定语谱图中的局部评估区域之前,根据输入信号得到语谱图。
可选的,根据输入信号得到语谱图信息,包括:
对输入信号进行分帧处理、加窗处理及FFT变换,得到输入信号中每帧信号的FFT变换系数;
根据输入信号中每帧信号的FFT变换系数,得到与输入信号对应的语谱图。
可选的,在对输入信号进行分帧处理之前,还包括:将输入信号以预设的参考信号为标准进行对齐,以消除输入信号的延迟。
本发明实施例提供的计算机设备,不局限于任何一种评估指标,不局限于具体的评估位置,可以在可视化语谱图中进行局部评估区域的选择,得到局部评估区域的精确语音质量,给用户提供了一种直观、灵活、便利的语音质量评估方式。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,程序被处理器执行时实现如下步骤:
步骤21:确定语谱图中的局部评估区域,并获取局部评估区域的参数值。
可选的,确定语谱图中的局部评估区域包括:
当语谱图的数量为一个时,接收在语谱图中选取的局部评估区域;
当语谱图的数量为多个时,接收在第一个语谱图中选取的第一局部评估区域;根据第一局部评估区域的位置,遍历剩余的所有语谱图,从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域,第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。
可选的,确定语谱图中的局部评估区域包括:当局部评估区域的数量为多个时,分别确定语谱图中的多个局部评估区域。
可选的,局部评估区域中的参数值包括:局部评估区域内每帧信号的FFT变换系数。
步骤22:确定选取的评估指标,并获取评估指标的计算公式。
步骤23:根据局部评估区域中的参数值和计算公式,计算评估指标的评估值,并将评估值在语谱图中进行显示。
进一步,程序被处理器执行时实现如下步骤:当评估指标的数量为多个时,将每一个评估指标的名称及对应的评估值在语谱图中进行显示。
进一步的程序被处理器执行时实现如下步骤:在确定语谱图中的局部评估区域之前,根据输入信号得到语谱图。
可选的,根据输入信号得到语谱图信息,包括:
对输入信号进行分帧处理、加窗处理及FFT变换,得到输入信号中每帧信号的FFT变换系数;
根据输入信号中每帧信号的FFT变换系数,得到与输入信号对应的语谱图。
可选的,在对输入信号进行分帧处理之前,还包括:
将输入信号以预设的参考信号为标准进行对齐,以消除输入信号的延迟。
本发明实施例提供的计算机可读存储介质,不局限于任何一种评估指标,不局限于具体的评估位置,可以在可视化语谱图中进行局部评估区域的选择,得到局部评估区域的精确语音质量,给用户提供了一种直观、灵活、便利的语音质量评估方式。
为了更加详细的说明本发明实施例,给出实例1。
图3为本发明实例1中可视化语音性能评估方法的流程示意图。如图3所示,本发明实例1中可视化语音性能评估方法包括以下步骤:
(1)信号对齐:首先将所有输入信号以参考信号(图3中的原始纯净参考语音)为标准进行对齐,其中对齐方法可以是用户输入所有输入信号的延迟,根据延迟信息,调整所有输入语音信号,使其与参考信号对齐。
(2)FFT变换:对所有输入信号进行分帧、加窗、FFT变换等操作,得到所有信号、所有语音帧的FFT变换系数,从而可以得到整个语谱图信息。
(3)语谱图:用户可在显示的语谱图上选型一个或多个语音性能局部评估区域,并将所选局部评估区域的区域信息传输给核心处理模块。
(4)评估指标库:用户可在评估指标库中选择所需的评估指标,并获取获取评估指标的计算公式。用户还可以在评估指标库中自定义添加评估指标及其计算公式。
(5)核心处理模块:根据局部评估区域中的参数值(局部评估区域内每帧信号的FFT变换系数)和计算公式,计算评估指标的评估值。
(6)评估结果显示:将核心处理模块得到的全部结果,在语谱图上显示出来。
本发明实例1基于语谱图来显示结果给使用者提供了一种非常直观的语音质量评估方式。本发明实例1提供的可视化语音性能评估方法不局限于任何一种评估指标,并且可以选定多个局部评估区域同时进行评估,可对多组语音性能同时做比较,对多组语音性能的评估提供了更加直观、便捷的方式。
以上仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种可视化语音性能评估方法,其特征在于,包括:
确定语谱图中的局部评估区域,并获取所述局部评估区域的参数值;
确定选取的评估指标,并获取所述评估指标的计算公式;
根据所述局部评估区域中的参数值和所述计算公式,计算所述评估指标的评估值,并将所述评估值在所述语谱图中进行显示;
所述确定语谱图中的局部评估区域包括:
当所述语谱图的数量为多个时,接收在第一个语谱图中选取的第一局部评估区域;根据所述第一局部评估区域的位置,遍历剩余的所有语谱图,从所述剩余的所有语谱图中分别选取与所述第一局部评估区域的位置相同的区域,所述第一局部评估区域和所述与所述第一局部评估区域的位置相同的区域共同构成所述局部评估区域。
2.如权利要求1所述的可视化语音性能评估方法,其特征在于,所述确定语谱图中的局部评估区域还包括:
当所述语谱图的数量为一个时,接收在所述语谱图中选取的局部评估区域。
3.如权利要求1或2所述的可视化语音性能评估方法,其特征在于,在确定语谱图中的局部评估区域之前,还包括:根据输入信号得到语谱图。
4.如权利要求3所述的可视化语音性能评估方法,其特征在于,所述根据输入信号得到语谱图信息,包括:
对所述输入信号进行分帧处理、加窗处理及FFT变换,得到所述输入信号中每帧信号的FFT变换系数;
根据所述输入信号中每帧信号的FFT变换系数,得到与所述输入信号对应的语谱图。
5.一种可视化语音性能评估装置,其特征在于,包括:评估区域确定模块、评估指标确定模块及评估结果显示模块;
所述评估区域确定模块,用于确定语谱图中的局部评估区域,并获取所述局部评估区域的参数值;
所述评估指标确定模块,用于确定选取的评估指标,并获取所述评估指标的计算公式;
所述评估结果显示模块,用于根据所述局部评估区域中的参数值和所述计算公式,计算所述评估指标的评估值,并将所述评估值在所述语谱图中进行显示;
所述评估区域确定模块具体用于:
当所述语谱图的数量为多个时,接收在第一个语谱图中选取的第一局部评估区域;根据所述第一局部评估区域的位置,遍历剩余的所有语谱图,从所述剩余的所有语谱图中分别选取与所述第一局部评估区域的位置相同的区域,所述第一局部评估区域和所述与所述第一局部评估区域的位置相同的区域共同构成所述局部评估区域。
6.如权利要求5所述的可视化语音性能评估装置,其特征在于,所述评估区域确定模块具体还用于:
当所述语谱图的数量为一个时,接收在所述语谱图中选取的局部评估区域。
7.如权利要求5或6所述的可视化语音性能评估装置,其特征在于,还包括语谱图构建模块;
所述语谱图构建模块,用于在确定语谱图中的局部评估区域之前,根据输入信号得到语谱图。
8.如权利要求7所述的可视化语音性能评估装置,其特征在于,所述语谱图构建模块具体用于:
对所述输入信号进行分帧处理、加窗处理及FFT变换,得到所述输入信号中每帧信号的FFT变换系数;
根据所述输入信号中每帧信号的FFT变换系数,得到与所述输入信号对应的语谱图。
9.一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述程序被处理器执行时实现权利要求1至4中任意一项所述方法的步骤。
10.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至4中任意一项所述方法的步骤。
CN201711346946.3A 2017-12-15 2017-12-15 可视化语音性能评估方法、装置、计算机设备及存储介质 Active CN108364661B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711346946.3A CN108364661B (zh) 2017-12-15 2017-12-15 可视化语音性能评估方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711346946.3A CN108364661B (zh) 2017-12-15 2017-12-15 可视化语音性能评估方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN108364661A CN108364661A (zh) 2018-08-03
CN108364661B true CN108364661B (zh) 2020-11-24

Family

ID=63010182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711346946.3A Active CN108364661B (zh) 2017-12-15 2017-12-15 可视化语音性能评估方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN108364661B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090026504A (ko) * 2007-09-10 2009-03-13 삼성전자주식회사 음성 신호의 스펙트럼 평가 방법 및 장치
CN106558318A (zh) * 2015-09-24 2017-04-05 阿里巴巴集团控股有限公司 音频识别方法和系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103716470B (zh) * 2012-09-29 2016-12-07 华为技术有限公司 语音质量监控的方法和装置
CN104183171B (zh) * 2013-05-23 2016-10-19 杭州灵机科技有限公司 一种基于电子乐谱的乐器演奏水平精准评判的系统和方法
CN204790994U (zh) * 2015-07-17 2015-11-18 廖加斌 调音用多功能显示器
CN106816158B (zh) * 2015-11-30 2020-08-07 华为技术有限公司 一种语音质量评估方法、装置及设备
CN105679335B (zh) * 2015-12-21 2019-08-13 南京华苏科技有限公司 基于无线分析的语音质量评估方法及系统
CN106340286B (zh) * 2016-09-27 2020-05-19 华中科技大学 一种通用的实时乐器演奏评价系统
CN106653055A (zh) * 2016-10-20 2017-05-10 北京创新伙伴教育科技有限公司 在线英语口语评估系统
CN106920545B (zh) * 2017-03-21 2020-07-28 百度在线网络技术(北京)有限公司 基于人工智能的语音特征提取方法和装置
CN107293306B (zh) * 2017-06-21 2018-06-15 湖南省计量检测研究院 一种基于输出的客观语音质量的评估方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090026504A (ko) * 2007-09-10 2009-03-13 삼성전자주식회사 음성 신호의 스펙트럼 평가 방법 및 장치
CN106558318A (zh) * 2015-09-24 2017-04-05 阿里巴巴集团控股有限公司 音频识别方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于模型的语音增强方法及质量评估研究;尹伟;《中国博士学位论文全文数据库》;20120215;I136-4 *

Also Published As

Publication number Publication date
CN108364661A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
US20200058320A1 (en) Voice activity detection method, relevant apparatus and device
KR20190045278A (ko) 음성 품질 평가 방법 및 음성 품질 평가 장치
JP6099556B2 (ja) 音声識別方法および装置
US10339956B2 (en) Method and apparatus for detecting audio signal according to frequency domain energy
US20170133040A1 (en) Abnormal Frame Detection Method and Apparatus
US9058821B2 (en) Computer-readable medium for recording audio signal processing estimating a selected frequency by comparison of voice and noise frame levels
CN106486131A (zh) 一种语音去噪的方法及装置
EP2465113B1 (en) Method, computer program product and system for determining a perceived quality of an audio system
Manfredi et al. Validity of jitter measures in non-quasi-periodic voices. Part II: The effect of noise
CN103067322A (zh) 评估单通道音频信号中的音频帧的语音质量的方法
EP2927906A1 (en) Method and apparatus for detecting voice signal
US9484044B1 (en) Voice enhancement and/or speech features extraction on noisy audio signals using successively refined transforms
US9530434B1 (en) Reducing octave errors during pitch determination for noisy audio signals
CN107221342A (zh) 话音信号处理电路
CN104978966B (zh) 音频流中的丢帧补偿实现方法和装置
US20190385590A1 (en) Generating device, generating method, and non-transitory computer readable storage medium
CN108364661B (zh) 可视化语音性能评估方法、装置、计算机设备及存储介质
Nortier et al. Unsupervised speech enhancement with diffusion-based generative models
CN106340310B (zh) 语音检测方法及装置
CN109119089B (zh) 对音乐进行通透处理的方法及设备
CN115512718A (zh) 用于存量语音文件的语音质量评价方法、装置及系统
Ganapathy et al. Temporal resolution analysis in frequency domain linear prediction
CN114302301A (zh) 频响校正方法及相关产品
Sangiorgi et al. Objective analysis of the singing voice as a training aid
Gunawan et al. Separation of harmonic musical instrument notes using spectro-temporal modeling of harmonic magnitudes and spectrogram inversion with phase optimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210209

Address after: 266101 Haier Industrial Park, 1 Haier Road, Laoshan District, Shandong, Qingdao

Patentee after: Qingdao Haier Technology Co., Ltd.

Patentee after: Haier Smart Home Co., Ltd.

Address before: Room 601-606, 6 / F, Pacific International Building, 106 Zhichun Road, Haidian District, Beijing 100086

Patentee before: HAIER UPLUS INTELLIGENT TECHNOLOGY (BEIJING) Co.,Ltd.

TR01 Transfer of patent right