CN112992144B - 应用于电力领域的智能语音调控方法 - Google Patents

应用于电力领域的智能语音调控方法 Download PDF

Info

Publication number
CN112992144B
CN112992144B CN202110430321.5A CN202110430321A CN112992144B CN 112992144 B CN112992144 B CN 112992144B CN 202110430321 A CN202110430321 A CN 202110430321A CN 112992144 B CN112992144 B CN 112992144B
Authority
CN
China
Prior art keywords
waveform
instruction
voice
key
regulation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110430321.5A
Other languages
English (en)
Other versions
CN112992144A (zh
Inventor
杜浩良
马翔
支月媚
崔建业
郭云鹏
吕磊炎
吴炳超
宋昕
方璇
黄剑峰
项中明
吴华华
黄健
朱英伟
李振华
周东波
谷炜
李英
阙凌燕
张小聪
沈曦
吴烨
邢佳源
钱凯洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Zhejiang Electric Power Co Ltd
Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
State Grid Zhejiang Electric Power Co Ltd
Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Zhejiang Electric Power Co Ltd, Jinhua Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical State Grid Zhejiang Electric Power Co Ltd
Priority to CN202110430321.5A priority Critical patent/CN112992144B/zh
Publication of CN112992144A publication Critical patent/CN112992144A/zh
Application granted granted Critical
Publication of CN112992144B publication Critical patent/CN112992144B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本申请实施例提出的应用于电力领域的智能语音调控方法,包括从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形;基于环境噪声波形对关键语音波形进行叠加降噪;根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理,得到针对设备操作的指令语句波形;结合设备操作专有名词库确定对应每条指令语句波形的指令文本,根据设备调控指令语句结构获取每个指令文本的关键要素构建标准化的设备调控指令。基于波峰持续时长对语音波形进行断句能够有效保证断句后的波形对应依据完整的指令,进而根据断句后的语音波形进行指令文本转换,得到较为准确的设备调控指令。进而提升设备调控的准确性。

Description

应用于电力领域的智能语音调控方法
技术领域
本申请涉及语音处理领域,尤其涉及应用于电力领域的智能语音调控方法。
背景技术
保障电网的安全稳定运行,是电网电力供应等行业服务的基础重要环节。随着电网规模的不断扩大,随之而来调度相关方面的工作量也成倍增加,这将越来越多的占用调控人员的精力。目前语音识别技术正逐步的应用于电网调度工作中。但传统语音识别方法的理论假设与实际情况有很大不同,因此实际应用中很难达到预期的性能,而深度学习是大数据处理的重要机器学习理论,对语音识别具有重要的借鉴意义。
发明内容
本申请提出了应用于电力领域的智能语音调控方法,通过对语音信号波形进行叠加降噪的方式降低环境噪声的影响,进而借助波峰持续时长进行断句的处理方式能够尽可能保证单次完整指令的获取,从而有效提升语音指令识别的准确性。
本申请实施例提出的应用于电力领域的智能语音调控方法,包括:
S1,从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形;
S2,基于环境噪声波形对关键语音波形进行叠加降噪,得到降噪后的关键语音波形;
S3,根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理,得到针对设备操作的指令语句波形;
S4,结合设备操作专有名词库确定对应每条指令语句波形的指令文本,根据设备调控指令语句结构获取每个指令文本的关键要素,基于得到的关键要素构建标准化的设备调控指令;
S5,基于得到的设备调控指令完成电力设备调控。
可选的,所述S1包括:
S11,接收针对电力设备调控的通话文件,从通话文件中筛选出语音信号波形;
S12,对得到的语音信号波形进行频谱分析,筛选出对应设备调控指令的关键语音波形以及对应噪声的环境噪声波形。
可选的,所述S12包括:
S121,获取语音信号波形,提取语音信号波形中的幅值;
S122,对接收到的幅值进行聚类得到两个聚类中心,将其中的较大值作为关键语音中心幅值,将较小值作为环境噪声中心幅值;
S123,按预设宽容度从语音信号中筛选幅值接近关键语音幅值的语音信号波形存储为关键语音波形,筛选幅值接近环境噪声幅值的语音信号波形存储为环境噪声波形。
可选的,所述S2包括:
S21,计算环境噪声波形中多个幅值的方差;
S22,如果方差高于预设值,获取最大的五个幅值的出现频率,按得到的出现频率在环境噪声波形中对最大的五个幅值对应的波形进行均匀分布处理,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
S23,统计强化后环境噪声波形的相位以及对应每个相位的幅值,构建用于消噪的环境噪声波形;
S24,将S23得到的环境噪声与关键语音波形进行叠加降噪,得到降噪后的关键语音波形。
可选的,所述S2包括:
S25,如果方差低于或等于预设值,将环境噪声波形的持续时长进行调整,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
继续执行步骤S23至步骤S24的处理过程。
可选的,所述S3包括:
S31,获取降噪后的关键语音波形中的波峰;
S32,按预设的峰值宽容度对波峰的出现时刻进行拓展,将拓展后波峰的维持时长作为波峰持续时长;
S33,按得到的波峰持续时长对关键语音波形进行分割,将每一份保存为一条指令语句波形。
可选的,所述S32包括:
S321,计算减去宽容度后的波峰修正值;
S322,在波峰两侧筛选高于波峰修正值的目标峰值,得到包括多个目标峰值以及波峰在内的拓展区间,将拓展区间对应的维持时长作为波峰持续时长。
可选的,所述S4包括:
S41,播放每条指令语句波形,结合设备操作专有名词库确定对应每条指令语句波形的指令文本;
S42,获取设备调控指令语句结构,根据设备调控指令语句结构对每个指令文本进行筛选,得到包含操作设备对象、操作参数详情在内的关键要素;
S43,对得到的关键要素进行指令完整性复核;
S44,将通过复核后的关键要素按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令。
可选的,所述S43包括:
S431,接收关键要素并记录接收时刻;
S432,判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻;
S433,根据接收时刻判断指令发出时刻对应的关键要素是否处于有效期内;
S434,如果在有效期内则判定通过指令完整性复核。
可选的,所述S42中包括通过TF-IDF算法提取关键字的操作。
有益效果:
通过降噪处理提升操作指令的有效率,通过断句处理提升指令详情的准确性。
附图说明
图1是本申请实施例提出的应用于电力领域的智能语音调控方法的流程示意图。
具体实施方式
本申请实施例提出的应用于电力领域的智能语音调控方法,如图1所示,包括:
S1,从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形;
S2,基于环境噪声波形对关键语音波形进行叠加降噪,得到降噪后的关键语音波形;
S3,根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理,得到针对设备操作的指令语句波形;
S4,结合设备操作专有名词库确定对应每条指令语句波形的指令文本,根据设备调控指令语句结构获取每个指令文本的关键要素,基于得到的关键要素构建标准化的设备调控指令;
S5,基于得到的设备调控指令完成电力设备调控。
在实施中,为了解决现有技术中采用传统语音识别技术带来的识别精度低下的缺陷,本申请提出了一种新式的智能语音调控方法,基于对语音信号波形进行叠加降噪并基于降噪后语音波形中波峰持续时长的特性实现断句处理,由于在正常的语音调控指令中,针对一个设备的调控语句基本上会使用一句话进行描述,因此基于波峰持续时长对语音波形进行断句能够有效保证断句后的波形对应依据完整的指令,进而根据断句后的语音波形进行指令文本转换,可以得到较为准确的设备调控指令。
具体的,本申请提出的智能语音调控方法,主要包含两个特性,其一为叠加降噪,其二为波峰断句。以下分别就两个特征进行解释说明。
为了实现叠加降噪,首先需要执行S1,以便从接收到的语音信号波形中获取到关键语音波形以及环境噪声波形。
由于环境噪声一般表现为稳定的中低频噪声,因此在接收到的语音信号波形中幅度较低且表现为波动较小的波形代表环境噪声,相对于代表设备操控指令的关键语音波形则由于包含升降调的语音会表现为幅度较高且波动较为明显,因此基于上述两个指标依次执行步骤S11-S12以便获取降噪后的关键语音波形。
S11,接收针对电力设备调控的通话文件,从通话文件中筛选出语音信号波形;
S12,对得到的语音信号波形进行频谱分析,筛选出对应设备调控指令的关键语音波形以及对应噪声的环境噪声波形。
在实施中,步骤S11中的具体执行方式是从通话文件中直接筛选本地生成的语音文件即可,常用的文件扩展后缀为.wav、.mp3等。步骤S12提出的基于频谱分析的方案则是基于前文中提及到的波形幅值实现的,具体包括如下内容:
S121,获取语音信号波形,提取语音信号波形中的幅值;
S122,对接收到的幅值进行聚类得到两个聚类中心,将其中的较大值作为关键语音中心幅值,将较小值作为环境噪声中心幅值;
S123,按预设宽容度从语音信号中筛选幅值接近关键语音幅值的语音信号波形存储为关键语音波形,筛选幅值接近环境噪声幅值的语音信号波形存储为环境噪声波形。
具体的,在基于幅值进行关键语音波形与环境噪声波形的提取时,考虑到单纯依靠阈值进行二者的划分可能会损失部分细节,降低后续设备调控指令的转换质量,这里在步骤S122-S123中基于幅值进行聚类、并按聚类中心幅值大小分别确定关键语音幅值以及环境噪声幅值。考虑到聚类算法已是成熟使用的技术,此处就不在赘述。
值得注意的是,在执行步骤S123时引入了宽容度这一概念,目的是通过对语音信号波形的幅值以类似于滤波器的方式进行过滤,以便于尽可能降低突发噪声对后续方案的影响,如果最终S4得到的设备调控指令效果不佳,可以考虑对此处的宽容度数值进行调节,以便实现更好的效果。
在得到分离后的关键语音波形和环境噪声波形后,即可执行S2以便实现基于环境噪声波形对关键语音波形的降噪处理。具体包括如下内容:
S21,计算环境噪声波形中多个幅值的方差;
S22,如果方差高于预设值,获取最大的五个幅值的出现频率,按得到的出现频率在环境噪声波形中对最大的五个幅值对应的波形进行均匀分布处理,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
S23,统计强化后环境噪声波形的相位以及对应每个相位的幅值,构建用于消噪的环境噪声波形;
S24,将S23得到的环境噪声与关键语音波形进行叠加降噪,得到降噪后的关键语音波形;
S25,如果方差低于或等于预设值,将环境噪声波形的持续时长进行调整,得到持续时长与关键语音波形相同的强化后的环境噪声波形;继续执行步骤S23至步骤S24的处理过程。
在实施中,首先选取环境噪声波形中的多个幅值,进而计算幅值之间的方差。考虑到环境噪声波形的持续时长通常情况下会短于关键语音波形的持续时长,这样无法使用前者对后者进行叠加降噪,因此本步骤中提出了基于方差判断环境噪声的变化幅度是否剧烈。
如果变化剧烈则说明进行降噪的强度较高,此时需要对已有的环境噪声进行强化以及增大持续时长的处理。其中强化处理如步骤S22所示。具体为获取五个最大幅值出现的频率,例如在时长为10s的环境噪声波形中,分别于第1s、2.5s、3s、5s、8.5s出现了五个最大幅值,而关键语音波形的持续时长为30s,因此根据30/10的比例对出现最大幅值的时长进行等比例增长,从而根据增强后的环境噪声进行降噪,以凸显环境噪声对后续降噪过程的作用。
在获取到降噪后的关键语音波形后,对其进行断句处理,得到对应每条设备操作指令的指令语句波形,即S3的内容如下所示:
S31,获取降噪后的关键语音波形中的波峰;
S32,按预设的峰值宽容度对波峰的出现时刻进行拓展,将拓展后波峰的维持时长作为波峰持续时长;
S33,按得到的波峰持续时长对关键语音波形进行分割,将每一份保存为一条指令语句波形。
在实施中,由于在诵读设备操作指令时,由于讲出指令内容后的波形幅值肯定会高于未讲出时的波形幅值,因此执行步骤S31中获取波形中波峰的操作,以便确定具体指令出现的时刻。
进一步,考虑到在诵读设备操作指令时,波形幅值会较为稳定地持续一段时长,因此同样引入宽容度的概念对波峰出现的时刻进行适当拓展。选取拓展后的时长对应的关键语音波形进行分割,得到分割后的波形即为一条指令语句波形。
其中执行步骤S32进行拓展的具体内容包括:
S321,计算减去宽容度后的波峰修正值;
S322,在波峰两侧筛选高于波峰修正值的目标峰值,得到包括多个目标峰值以及波峰在内的拓展区间,将拓展区间对应的维持时长作为波峰持续时长。
这里将减去宽容度后的波峰修正值作为拓展基准的目的是考虑到实际环境噪声中不可避免的会引入部分设备高速运转等类似的高频环境噪声,而该类噪声又很难在降噪过程中被消除,因此考虑到后期指令划分的准确性,此处还需要根据常见的高频环境噪声设定波峰修正值,进而在波峰两侧筛选高于波峰修正值的目标峰值。
在得到指令语句波形后,可以将指令语句波形中的内容转化为指令文本,进而根据指令文本的关键要素构建标准化的设备调控指令。具体内容如下:
S41,播放每条指令语句波形,结合设备操作专有名词库确定对应每条指令语句波形的指令文本;
S42,获取设备调控指令语句结构,根据设备调控指令语句结构对每个指令文本进行筛选,得到包含操作设备对象、操作参数详情在内的关键要素;
S43,对得到的关键要素进行指令完整性复核;
S44,将通过复核后的关键要素按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令。
在实施中,初步得到指令文本的方式是播放得到的指令语句波形,结合已有的设备操作专有名词库确定对应每条指令语句波形的指令文本。
考虑到直接得到的指令文本中会存在语法错误、逻辑混乱的问题,还需执行步骤S42以便根据对应设备调控指令语句结构对得到的指令文本进行筛选,从而得到包含操作设备对象、操作参数详情在内的关键要素。例如“12号变压器”、“5点”、“断路检修”、“确保无故障运行1000小时”的字样。
具体的S42的执行内容包括通过TF-IDF算法提取关键字的操作。
在实施中,词频TF(Term Frequency)表示词语在文档d中出现的概率,计算公式如下:
Figure 538408DEST_PATH_IMAGE002
式中,
Figure 594613DEST_PATH_IMAGE003
是该词语
Figure 57955DEST_PATH_IMAGE004
在文档
Figure 605611DEST_PATH_IMAGE005
中出现的次数,而分母则是在文档
Figure 572430DEST_PATH_IMAGE006
中所有字 词的出现次数之和,
Figure 62186DEST_PATH_IMAGE008
Figure 481666DEST_PATH_IMAGE009
Figure 833013DEST_PATH_IMAGE011
均为词语选取时的相关序号。
逆文档频率IDF(Inverse Document Frequency):表示语料库中包含词语
Figure 919918DEST_PATH_IMAGE012
的文 档的数目的倒数,计算公式如下:
Figure 596887DEST_PATH_IMAGE013
式中,
Figure 769242DEST_PATH_IMAGE014
表示语料库中文档的总数,
Figure 907968DEST_PATH_IMAGE015
表示包含词语
Figure 114959DEST_PATH_IMAGE016
的文档数量。如 果该词语不出现在语料库中,就会导致被除数为0,因此一般情况下使用
Figure 697250DEST_PATH_IMAGE017
, TF-IDF在实际中主要是将上面的两者相乘,即
Figure 91322DEST_PATH_IMAGE018
,计算公式如下:
Figure 50051DEST_PATH_IMAGE020
得到的结果即为提取到的关键字。
在筛选得到关键指令后,为了保证最终生成的设备调控指令完整,需要再次执行步骤S43对的得到的、用于构建设备调控指令的关键要素进行指令完整性复核,验证是否已完全包括设备对象、操作参数详情等构成设备调控指令的全部必要元素。
其中,S43进行复核的具体内容包括:
S431,接收关键要素并记录接收时刻;
S432,判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻;
S433,根据接收时刻判断指令发出时刻对应的关键要素是否处于有效期内;
S434,如果在有效期内则判定通过指令完整性复核。
在实施中,为了提高最终得到指令的准确性,一方面需要判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻;另一方面还需要结合关键要素的接收时刻对关键要素是否处于有效期内进行判定,防止在指令有效期外进行指令合成并执行带来的严重后果。
在通过复核后执行步骤S44按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令即可,例如“5点”对“12号变压器”进行“断路检修”,目的实现“确保无故障运行1000小时”,其中双引号内的短语是已得到的关键要素,其余部分为通用模板中构建标准化的元素。
由于根据通用模板构建的标准化的设备调控指令中包含了构建设备操作指令所必须的全部要素,因此根据前述内容最终得到的设备调控指令能够较为准确地完成电力设备调控。
以上所述仅为本申请的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (6)

1.应用于电力领域的智能语音调控方法,其特征在于,包括:
S1,从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形;
S2,基于环境噪声波形对关键语音波形进行叠加降噪,得到降噪后的关键语音波形;
S3,根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理,得到针对设备操作的指令语句波形;
S4,结合设备操作专有名词库确定对应每条指令语句波形的指令文本,根据设备调控指令语句结构获取每个指令文本的关键要素,基于得到的关键要素构建标准化的设备调控指令;
S5,基于得到的设备调控指令完成电力设备调控;
所述S1包括:
S11,接收针对电力设备调控的通话文件,从通话文件中筛选出语音信号波形;
S12,对得到的语音信号波形进行频谱分析,筛选出对应设备调控指令的关键语音波形以及对应噪声的环境噪声波形;
所述S12包括:
S121,获取语音信号波形,提取语音信号波形中的幅值;
S122,对接收到的幅值进行聚类得到两个聚类中心,将其中的较大值作为关键语音中心幅值,将较小值作为环境噪声中心幅值;
S123,按预设宽容度从语音信号中筛选幅值接近关键语音幅值的语音信号波形存储为关键语音波形,筛选幅值接近环境噪声幅值的语音信号波形存储为环境噪声波形;
所述S3包括:
S31,获取降噪后的关键语音波形中的波峰;
S32,按预设的峰值宽容度对波峰的出现时刻进行拓展,将拓展后波峰的维持时长作为波峰持续时长;
S33,按得到的波峰持续时长对关键语音波形进行分割,将每一份保存为一条指令语句波形;
所述S32包括:
S321,计算减去宽容度后的波峰修正值;
S322,在波峰两侧筛选高于波峰修正值的目标峰值,得到包括多个目标峰值以及波峰在内的拓展区间,将拓展区间对应的维持时长作为波峰持续时长。
2.根据权利要求1所述的应用于电力领域的智能语音调控方法,其特征在于,所述S2包括:
S21,计算环境噪声波形中多个幅值的方差;
S22,如果方差高于预设值,获取最大的五个幅值的出现频率,按得到的出现频率在环境噪声波形中对最大的五个幅值对应的波形进行均匀分布处理,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
S23,统计强化后环境噪声波形的相位以及对应每个相位的幅值,构建用于消噪的环境噪声波形;
S24,将S23得到的消噪的环境噪声波形与关键语音波形进行叠加降噪,得到降噪后的关键语音波形。
3.根据权利要求2所述的应用于电力领域的智能语音调控方法,其特征在于,所述S2包括:
S25,如果方差低于或等于预设值,将环境噪声波形的持续时长进行调整,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
继续执行步骤S23至步骤S24的处理过程。
4.根据权利要求1所述的应用于电力领域的智能语音调控方法,其特征在于,所述S4包括:
S41,播放每条指令语句波形,结合设备操作专有名词库确定对应每条指令语句波形的指令文本;
S42,获取设备调控指令语句结构,根据设备调控指令语句结构对每个指令文本进行筛选,得到包含操作设备对象、操作参数详情在内的关键要素;
S43,对得到的关键要素进行指令完整性复核;
S44,将通过复核后的关键要素按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令。
5.根据权利要求4所述的应用于电力领域的智能语音调控方法,其特征在于,所述S43包括:
S431,接收关键要素并记录接收时刻;
S432,判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻;
S433,根据接收时刻判断指令发出时刻对应的关键要素是否处于有效期内;
S434,如果在有效期内则判定通过指令完整性复核。
6.根据权利要求4所述的应用于电力领域的智能语音调控方法,其特征在于,所述S42中包括通过TF-IDF算法提取关键字的操作。
CN202110430321.5A 2021-04-21 2021-04-21 应用于电力领域的智能语音调控方法 Active CN112992144B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110430321.5A CN112992144B (zh) 2021-04-21 2021-04-21 应用于电力领域的智能语音调控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110430321.5A CN112992144B (zh) 2021-04-21 2021-04-21 应用于电力领域的智能语音调控方法

Publications (2)

Publication Number Publication Date
CN112992144A CN112992144A (zh) 2021-06-18
CN112992144B true CN112992144B (zh) 2021-07-27

Family

ID=76341420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110430321.5A Active CN112992144B (zh) 2021-04-21 2021-04-21 应用于电力领域的智能语音调控方法

Country Status (1)

Country Link
CN (1) CN112992144B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113825082B (zh) * 2021-09-19 2024-06-11 武汉左点科技有限公司 一种用于缓解助听延迟的方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548781A (zh) * 2015-09-21 2017-03-29 上海日趋信息技术有限公司 一种用于语音识别系统消除背景噪音的方法
CN105657150A (zh) * 2015-09-29 2016-06-08 宇龙计算机通信科技(深圳)有限公司 一种噪音消除方法、装置及电子设备
CN106373598B (zh) * 2016-08-23 2018-11-13 珠海市魅族科技有限公司 音频重播的控制方法和装置
CN110767232B (zh) * 2019-09-29 2022-03-29 深圳数联天下智能科技有限公司 语音识别控制方法及装置、计算机设备和计算机存储介质
CN110853622B (zh) * 2019-10-22 2024-01-12 深圳市本牛科技有限责任公司 语音断句方法及系统
CN110827828A (zh) * 2019-11-27 2020-02-21 云南电网有限责任公司电力科学研究院 一种电力设备用语音交互系统
CN111667831B (zh) * 2020-06-08 2022-04-26 中国民航大学 基于管制员指令语义识别的飞机地面引导系统及方法
CN112581964B (zh) * 2020-12-04 2023-03-24 浙江大有实业有限公司杭州科技发展分公司 一种面向多领域的智能语音交互方法

Also Published As

Publication number Publication date
CN112992144A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
WO2021000408A1 (zh) 面试评分方法、装置、设备及存储介质
Ganapathy et al. Robust feature extraction using modulation filtering of autoregressive models
US8543387B2 (en) Estimating pitch by modeling audio as a weighted mixture of tone models for harmonic structures
CN109740053A (zh) 基于nlp技术的敏感词屏蔽方法和装置
CN113436643B (zh) 语音增强模型的训练及应用方法、装置、设备及存储介质
CN112992144B (zh) 应用于电力领域的智能语音调控方法
Abe et al. Sinusoidal model based on instantaneous frequency attractors
Fitz et al. A unified theory of time-frequency reassignment
CN102117618A (zh) 一种消除音乐噪声的方法、装置及系统
Zhang et al. Multiple vowels repair based on pitch extraction and line spectrum pair feature for voice disorder
CN105679321A (zh) 语音识别方法、装置及终端
US7805308B2 (en) Hidden trajectory modeling with differential cepstra for speech recognition
CN110379438B (zh) 一种语音信号基频检测与提取方法及系统
Dasgupta et al. Epoch detection using Hilbert envelope for glottal excitation enhancement and maximum-sum subarray for epoch marking
CN114254628A (zh) 一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质
TWI409802B (zh) 音頻特徵處理方法及其裝置
CN104282300A (zh) 一种非周期成分音节模型建立、及语音合成的方法和设备
Tong et al. Tokenizing fundamental frequency variation for Mandarin tone error detection
CN111862931A (zh) 一种语音生成方法及装置
CN110223679A (zh) 一种语音识别输入装置
Yuan-yuan et al. Speech synthesis based on PSOLA algorithm and modified pitch parameters
Yu et al. Research on singing breath correction system based on improved deep learning
CN102968988A (zh) 训练数据匮乏下的鲁棒性语音转换方法
CN118016050A (zh) 一种歌曲智能识别方法、系统、介质及设备
Gao et al. Improvement of speech preprocessing model based on linear prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant