CN112992144A - 应用于电力领域的智能语音调控方法 - Google Patents
应用于电力领域的智能语音调控方法 Download PDFInfo
- Publication number
- CN112992144A CN112992144A CN202110430321.5A CN202110430321A CN112992144A CN 112992144 A CN112992144 A CN 112992144A CN 202110430321 A CN202110430321 A CN 202110430321A CN 112992144 A CN112992144 A CN 112992144A
- Authority
- CN
- China
- Prior art keywords
- waveform
- instruction
- voice
- key
- regulation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000007613 environmental effect Effects 0.000 claims abstract description 41
- 230000009467 reduction Effects 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 9
- 238000010183 spectrum analysis Methods 0.000 claims description 4
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本申请实施例提出的应用于电力领域的智能语音调控方法,包括从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形;基于环境噪声波形对关键语音波形进行叠加降噪;根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理,得到针对设备操作的指令语句波形;结合设备操作专有名词库确定对应每条指令语句波形的指令文本,根据设备调控指令语句结构获取每个指令文本的关键要素构建标准化的设备调控指令。基于波峰持续时长对语音波形进行断句能够有效保证断句后的波形对应依据完整的指令,进而根据断句后的语音波形进行指令文本转换,得到较为准确的设备调控指令。进而提升设备调控的准确性。
Description
技术领域
本申请涉及语音处理领域,尤其涉及应用于电力领域的智能语音调控方法。
背景技术
保障电网的安全稳定运行,是电网电力供应等行业服务的基础重要环节。随着电网规模的不断扩大,随之而来调度相关方面的工作量也成倍增加,这将越来越多的占用调控人员的精力。目前语音识别技术正逐步的应用于电网调度工作中。但传统语音识别方法的理论假设与实际情况有很大不同,因此实际应用中很难达到预期的性能,而深度学习是大数据处理的重要机器学习理论,对语音识别具有重要的借鉴意义。
发明内容
本申请提出了应用于电力领域的智能语音调控方法,通过对语音信号波形进行叠加降噪的方式降低环境噪声的影响,进而借助波峰持续时长进行断句的处理方式能够尽可能保证单次完整指令的获取,从而有效提升语音指令识别的准确性。
本申请实施例提出的应用于电力领域的智能语音调控方法,包括:
S1,从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形;
S2,基于环境噪声波形对关键语音波形进行叠加降噪,得到降噪后的关键语音波形;
S3,根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理,得到针对设备操作的指令语句波形;
S4,结合设备操作专有名词库确定对应每条指令语句波形的指令文本,根据设备调控指令语句结构获取每个指令文本的关键要素,基于得到的关键要素构建标准化的设备调控指令;
S5,基于得到的设备调控指令完成电力设备调控。
可选的,所述S1包括:
S11,接收针对电力设备调控的通话文件,从通话文件中筛选出语音信号波形;
S12,对得到的语音信号波形进行频谱分析,筛选出对应设备调控指令的关键语音波形以及对应噪声的环境噪声波形。
可选的,所述S12包括:
S121,获取语音信号波形,提取语音信号波形中的幅值;
S122,对接收到的幅值进行聚类得到两个聚类中心,将其中的较大值作为关键语音中心幅值,将较小值作为环境噪声中心幅值;
S123,按预设宽容度从语音信号中筛选幅值接近关键语音幅值的语音信号波形存储为关键语音波形,筛选幅值接近环境噪声幅值的语音信号波形存储为环境噪声波形。
可选的,所述S2包括:
S21,计算环境噪声波形中多个幅值的方差;
S22,如果方差高于预设值,获取最大的五个幅值的出现频率,按得到的出现频率在环境噪声波形中对最大的五个幅值对应的波形进行均匀分布处理,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
S23,统计强化后环境噪声波形的相位以及对应每个相位的幅值,构建用于消噪的环境噪声波形;
S24,将S23得到的环境噪声与关键语音波形进行叠加降噪,得到降噪后的关键语音波形。
可选的,所述S2包括:
S25,如果方差低于或等于预设值,将环境噪声波形的持续时长进行调整,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
继续执行步骤S23至步骤S24的处理过程。
可选的,所述S3包括:
S31,获取降噪后的关键语音波形中的波峰;
S32,按预设的峰值宽容度对波峰的出现时刻进行拓展,将拓展后波峰的维持时长作为波峰持续时长;
S33,按得到的波峰持续时长对关键语音波形进行分割,将每一份保存为一条指令语句波形。
可选的,所述S32包括:
S321,计算减去宽容度后的波峰修正值;
S322,在波峰两侧筛选高于波峰修正值的目标峰值,得到包括多个目标峰值以及波峰在内的拓展区间,将拓展区间对应的维持时长作为波峰持续时长。
可选的,所述S4包括:
S41,播放每条指令语句波形,结合设备操作专有名词库确定对应每条指令语句波形的指令文本;
S42,获取设备调控指令语句结构,根据设备调控指令语句结构对每个指令文本进行筛选,得到包含操作设备对象、操作参数详情在内的关键要素;
S43,对得到的关键要素进行指令完整性复核;
S44,将通过复核后的关键要素按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令。
可选的,所述S43包括:
S431,接收关键要素并记录接收时刻;
S432,判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻;
S433,根据接收时刻判断指令发出时刻对应的关键要素是否处于有效期内;
S434,如果在有效期内则判定通过指令完整性复核。
可选的,所述S42中包括通过TF-IDF算法提取关键字的操作。
有益效果:
通过降噪处理提升操作指令的有效率,通过断句处理提升指令详情的准确性。
附图说明
图1是本申请实施例提出的应用于电力领域的智能语音调控方法的流程示意图。
具体实施方式
本申请实施例提出的应用于电力领域的智能语音调控方法,如图1所示,包括:
S1,从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形;
S2,基于环境噪声波形对关键语音波形进行叠加降噪,得到降噪后的关键语音波形;
S3,根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理,得到针对设备操作的指令语句波形;
S4,结合设备操作专有名词库确定对应每条指令语句波形的指令文本,根据设备调控指令语句结构获取每个指令文本的关键要素,基于得到的关键要素构建标准化的设备调控指令;
S5,基于得到的设备调控指令完成电力设备调控。
在实施中,为了解决现有技术中采用传统语音识别技术带来的识别精度低下的缺陷,本申请提出了一种新式的智能语音调控方法,基于对语音信号波形进行叠加降噪并基于降噪后语音波形中波峰持续时长的特性实现断句处理,由于在正常的语音调控指令中,针对一个设备的调控语句基本上会使用一句话进行描述,因此基于波峰持续时长对语音波形进行断句能够有效保证断句后的波形对应依据完整的指令,进而根据断句后的语音波形进行指令文本转换,可以得到较为准确的设备调控指令。
具体的,本申请提出的智能语音调控方法,主要包含两个特性,其一为叠加降噪,其二为波峰断句。以下分别就两个特征进行解释说明。
为了实现叠加降噪,首先需要执行S1,以便从接收到的语音信号波形中获取到关键语音波形以及环境噪声波形。
由于环境噪声一般表现为稳定的中低频噪声,因此在接收到的语音信号波形中幅度较低且表现为波动较小的波形代表环境噪声,相对于代表设备操控指令的关键语音波形则由于包含升降调的语音会表现为幅度较高且波动较为明显,因此基于上述两个指标依次执行步骤S11-S12以便获取降噪后的关键语音波形。
S11,接收针对电力设备调控的通话文件,从通话文件中筛选出语音信号波形;
S12,对得到的语音信号波形进行频谱分析,筛选出对应设备调控指令的关键语音波形以及对应噪声的环境噪声波形。
在实施中,步骤S11中的具体执行方式是从通话文件中直接筛选本地生成的语音文件即可,常用的文件扩展后缀为.wav、.mp3等。步骤S12提出的基于频谱分析的方案则是基于前文中提及到的波形幅值实现的,具体包括如下内容:
S121,获取语音信号波形,提取语音信号波形中的幅值;
S122,对接收到的幅值进行聚类得到两个聚类中心,将其中的较大值作为关键语音中心幅值,将较小值作为环境噪声中心幅值;
S123,按预设宽容度从语音信号中筛选幅值接近关键语音幅值的语音信号波形存储为关键语音波形,筛选幅值接近环境噪声幅值的语音信号波形存储为环境噪声波形。
具体的,在基于幅值进行关键语音波形与环境噪声波形的提取时,考虑到单纯依靠阈值进行二者的划分可能会损失部分细节,降低后续设备调控指令的转换质量,这里在步骤S122-S123中基于幅值进行聚类、并按聚类中心幅值大小分别确定关键语音幅值以及环境噪声幅值。考虑到聚类算法已是成熟使用的技术,此处就不在赘述。
值得注意的是,在执行步骤S123时引入了宽容度这一概念,目的是通过对语音信号波形的幅值以类似于滤波器的方式进行过滤,以便于尽可能降低突发噪声对后续方案的影响,如果最终S4得到的设备调控指令效果不佳,可以考虑对此处的宽容度数值进行调节,以便实现更好的效果。
在得到分离后的关键语音波形和环境噪声波形后,即可执行S2以便实现基于环境噪声波形对关键语音波形的降噪处理。具体包括如下内容:
S21,计算环境噪声波形中多个幅值的方差;
S22,如果方差高于预设值,获取最大的五个幅值的出现频率,按得到的出现频率在环境噪声波形中对最大的五个幅值对应的波形进行均匀分布处理,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
S23,统计强化后环境噪声波形的相位以及对应每个相位的幅值,构建用于消噪的环境噪声波形;
S24,将S23得到的环境噪声与关键语音波形进行叠加降噪,得到降噪后的关键语音波形;
S25,如果方差低于或等于预设值,将环境噪声波形的持续时长进行调整,得到持续时长与关键语音波形相同的强化后的环境噪声波形;继续执行步骤S23至步骤S24的处理过程。
在实施中,首先选取环境噪声波形中的多个幅值,进而计算幅值之间的方差。考虑到环境噪声波形的持续时长通常情况下会短于关键语音波形的持续时长,这样无法使用前者对后者进行叠加降噪,因此本步骤中提出了基于方差判断环境噪声的变化幅度是否剧烈。
如果变化剧烈则说明进行降噪的强度较高,此时需要对已有的环境噪声进行强化以及增大持续时长的处理。其中强化处理如步骤S22所示。具体为获取五个最大幅值出现的频率,例如在时长为10s的环境噪声波形中,分别于第1s、2.5s、3s、5s、8.5s出现了五个最大幅值,而关键语音波形的持续时长为30s,因此根据30/10的比例对出现最大幅值的时长进行等比例增长,从而根据增强后的环境噪声进行降噪,以凸显环境噪声对后续降噪过程的作用。
在获取到降噪后的关键语音波形后,对其进行断句处理,得到对应每条设备操作指令的指令语句波形,即S3的内容如下所示:
S31,获取降噪后的关键语音波形中的波峰;
S32,按预设的峰值宽容度对波峰的出现时刻进行拓展,将拓展后波峰的维持时长作为波峰持续时长;
S33,按得到的波峰持续时长对关键语音波形进行分割,将每一份保存为一条指令语句波形。
在实施中,由于在诵读设备操作指令时,由于讲出指令内容后的波形幅值肯定会高于未讲出时的波形幅值,因此执行步骤S31中获取波形中波峰的操作,以便确定具体指令出现的时刻。
进一步,考虑到在诵读设备操作指令时,波形幅值会较为稳定地持续一段时长,因此同样引入宽容度的概念对波峰出现的时刻进行适当拓展。选取拓展后的时长对应的关键语音波形进行分割,得到分割后的波形即为一条指令语句波形。
其中执行步骤S32进行拓展的具体内容包括:
S321,计算减去宽容度后的波峰修正值;
S322,在波峰两侧筛选高于波峰修正值的目标峰值,得到包括多个目标峰值以及波峰在内的拓展区间,将拓展区间对应的维持时长作为波峰持续时长。
这里将减去宽容度后的波峰修正值作为拓展基准的目的是考虑到实际环境噪声中不可避免的会引入部分设备高速运转等类似的高频环境噪声,而该类噪声又很难在降噪过程中被消除,因此考虑到后期指令划分的准确性,此处还需要根据常见的高频环境噪声设定波峰修正值,进而在波峰两侧筛选高于波峰修正值的目标峰值。
在得到指令语句波形后,可以将指令语句波形中的内容转化为指令文本,进而根据指令文本的关键要素构建标准化的设备调控指令。具体内容如下:
S41,播放每条指令语句波形,结合设备操作专有名词库确定对应每条指令语句波形的指令文本;
S42,获取设备调控指令语句结构,根据设备调控指令语句结构对每个指令文本进行筛选,得到包含操作设备对象、操作参数详情在内的关键要素;
S43,对得到的关键要素进行指令完整性复核;
S44,将通过复核后的关键要素按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令。
在实施中,初步得到指令文本的方式是播放得到的指令语句波形,结合已有的设备操作专有名词库确定对应每条指令语句波形的指令文本。
考虑到直接得到的指令文本中会存在语法错误、逻辑混乱的问题,还需执行步骤S42以便根据对应设备调控指令语句结构对得到的指令文本进行筛选,从而得到包含操作设备对象、操作参数详情在内的关键要素。例如“12号变压器”、“5点”、“断路检修”、“确保无故障运行1000小时”的字样。
具体的S42的执行内容包括通过TF-IDF算法提取关键字的操作。
在实施中,词频TF(Term Frequency)表示词语在文档d中出现的概率,计算公式如下:
得到的结果即为提取到的关键字。
在筛选得到关键指令后,为了保证最终生成的设备调控指令完整,需要再次执行步骤S43对的得到的、用于构建设备调控指令的关键要素进行指令完整性复核,验证是否已完全包括设备对象、操作参数详情等构成设备调控指令的全部必要元素。
其中,S43进行复核的具体内容包括:
S431,接收关键要素并记录接收时刻;
S432,判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻;
S433,根据接收时刻判断指令发出时刻对应的关键要素是否处于有效期内;
S434,如果在有效期内则判定通过指令完整性复核。
在实施中,为了提高最终得到指令的准确性,一方面需要判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻;另一方面还需要结合关键要素的接收时刻对关键要素是否处于有效期内进行判定,防止在指令有效期外进行指令合成并执行带来的严重后果。
在通过复核后执行步骤S44按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令即可,例如“5点”对“12号变压器”进行“断路检修”,目的实现“确保无故障运行1000小时”,其中双引号内的短语是已得到的关键要素,其余部分为通用模板中构建标准化的元素。
由于根据通用模板构建的标准化的设备调控指令中包含了构建设备操作指令所必须的全部要素,因此根据前述内容最终得到的设备调控指令能够较为准确地完成电力设备调控。
以上所述仅为本申请的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.应用于电力领域的智能语音调控方法,其特征在于,包括:
S1,从接收到的语音信号波形中提取包括设备调控指令的关键语音波形以及环境噪声波形;
S2,基于环境噪声波形对关键语音波形进行叠加降噪,得到降噪后的关键语音波形;
S3,根据降噪后的关键语音波形中的波峰持续时长进行指令断句处理,得到针对设备操作的指令语句波形;
S4,结合设备操作专有名词库确定对应每条指令语句波形的指令文本,根据设备调控指令语句结构获取每个指令文本的关键要素,基于得到的关键要素构建标准化的设备调控指令;
S5,基于得到的设备调控指令完成电力设备调控。
2.根据权利要求1所述的应用于电力领域的智能语音调控方法,其特征在于,所述S1包括:
S11,接收针对电力设备调控的通话文件,从通话文件中筛选出语音信号波形;
S12,对得到的语音信号波形进行频谱分析,筛选出对应设备调控指令的关键语音波形以及对应噪声的环境噪声波形。
3.根据权利要求2所述的应用于电力领域的智能语音调控方法,其特征在于,所述S12包括:
S121,获取语音信号波形,提取语音信号波形中的幅值;
S122,对接收到的幅值进行聚类得到两个聚类中心,将其中的较大值作为关键语音中心幅值,将较小值作为环境噪声中心幅值;
S123,按预设宽容度从语音信号中筛选幅值接近关键语音幅值的语音信号波形存储为关键语音波形,筛选幅值接近环境噪声幅值的语音信号波形存储为环境噪声波形。
4.根据权利要求2所述的应用于电力领域的智能语音调控方法,其特征在于,所述S2包括:
S21,计算环境噪声波形中多个幅值的方差;
S22,如果方差高于预设值,获取最大的五个幅值的出现频率,按得到的出现频率在环境噪声波形中对最大的五个幅值对应的波形进行均匀分布处理,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
S23,统计强化后环境噪声波形的相位以及对应每个相位的幅值,构建用于消噪的环境噪声波形;
S24,将S23得到的消噪的环境噪声波形与关键语音波形进行叠加降噪,得到降噪后的关键语音波形。
5.根据权利要求4所述的应用于电力领域的智能语音调控方法,其特征在于,所述S2包括:
S25,如果方差低于或等于预设值,将环境噪声波形的持续时长进行调整,得到持续时长与关键语音波形相同的强化后的环境噪声波形;
继续执行步骤S23至步骤S24的处理过程。
6.根据权利要求1所述的应用于电力领域的智能语音调控方法,其特征在于,所述S3包括:
S31,获取降噪后的关键语音波形中的波峰;
S32,按预设的峰值宽容度对波峰的出现时刻进行拓展,将拓展后波峰的维持时长作为波峰持续时长;
S33,按得到的波峰持续时长对关键语音波形进行分割,将每一份保存为一条指令语句波形。
7.根据权利要求6所述的应用于电力领域的智能语音调控方法,其特征在于,所述S32包括:
S321,计算减去宽容度后的波峰修正值;
S322,在波峰两侧筛选高于波峰修正值的目标峰值,得到包括多个目标峰值以及波峰在内的拓展区间,将拓展区间对应的维持时长作为波峰持续时长。
8.根据权利要求1所述的应用于电力领域的智能语音调控方法,其特征在于,所述S4包括:
S41,播放每条指令语句波形,结合设备操作专有名词库确定对应每条指令语句波形的指令文本;
S42,获取设备调控指令语句结构,根据设备调控指令语句结构对每个指令文本进行筛选,得到包含操作设备对象、操作参数详情在内的关键要素;
S43,对得到的关键要素进行指令完整性复核;
S44,将通过复核后的关键要素按通用模板构建标准化的包含待处理设备名称、调整参数在内的设备调控指令。
9.根据权利要求8所述的应用于电力领域的智能语音调控方法,其特征在于,所述S43包括:
S431,接收关键要素并记录接收时刻;
S432,判断关键要素中是否包含操作设备对象、操作参数详情以及指令发出时刻;
S433,根据接收时刻判断指令发出时刻对应的关键要素是否处于有效期内;
S434,如果在有效期内则判定通过指令完整性复核。
10.根据权利要求8所述的应用于电力领域的智能语音调控方法,其特征在于,所述S42中包括通过TF-IDF算法提取关键字的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110430321.5A CN112992144B (zh) | 2021-04-21 | 2021-04-21 | 应用于电力领域的智能语音调控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110430321.5A CN112992144B (zh) | 2021-04-21 | 2021-04-21 | 应用于电力领域的智能语音调控方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112992144A true CN112992144A (zh) | 2021-06-18 |
CN112992144B CN112992144B (zh) | 2021-07-27 |
Family
ID=76341420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110430321.5A Active CN112992144B (zh) | 2021-04-21 | 2021-04-21 | 应用于电力领域的智能语音调控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112992144B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113825082A (zh) * | 2021-09-19 | 2021-12-21 | 武汉左点科技有限公司 | 一种用于缓解助听延迟的方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105657150A (zh) * | 2015-09-29 | 2016-06-08 | 宇龙计算机通信科技(深圳)有限公司 | 一种噪音消除方法、装置及电子设备 |
CN106373598A (zh) * | 2016-08-23 | 2017-02-01 | 珠海市魅族科技有限公司 | 音频重播的控制方法和装置 |
CN106548781A (zh) * | 2015-09-21 | 2017-03-29 | 上海日趋信息技术有限公司 | 一种用于语音识别系统消除背景噪音的方法 |
CN110767232A (zh) * | 2019-09-29 | 2020-02-07 | 深圳和而泰家居在线网络科技有限公司 | 语音识别控制方法及装置、计算机设备和计算机存储介质 |
CN110827828A (zh) * | 2019-11-27 | 2020-02-21 | 云南电网有限责任公司电力科学研究院 | 一种电力设备用语音交互系统 |
CN110853622A (zh) * | 2019-10-22 | 2020-02-28 | 深圳市本牛科技有限责任公司 | 语音断句方法及系统 |
CN111667831A (zh) * | 2020-06-08 | 2020-09-15 | 中国民航大学 | 基于管制员指令语义识别的飞机地面引导系统及方法 |
CN112581964A (zh) * | 2020-12-04 | 2021-03-30 | 浙江大有实业有限公司杭州科技发展分公司 | 一种面向多领域的智能语音交互方法 |
-
2021
- 2021-04-21 CN CN202110430321.5A patent/CN112992144B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106548781A (zh) * | 2015-09-21 | 2017-03-29 | 上海日趋信息技术有限公司 | 一种用于语音识别系统消除背景噪音的方法 |
CN105657150A (zh) * | 2015-09-29 | 2016-06-08 | 宇龙计算机通信科技(深圳)有限公司 | 一种噪音消除方法、装置及电子设备 |
CN106373598A (zh) * | 2016-08-23 | 2017-02-01 | 珠海市魅族科技有限公司 | 音频重播的控制方法和装置 |
CN110767232A (zh) * | 2019-09-29 | 2020-02-07 | 深圳和而泰家居在线网络科技有限公司 | 语音识别控制方法及装置、计算机设备和计算机存储介质 |
CN110853622A (zh) * | 2019-10-22 | 2020-02-28 | 深圳市本牛科技有限责任公司 | 语音断句方法及系统 |
CN110827828A (zh) * | 2019-11-27 | 2020-02-21 | 云南电网有限责任公司电力科学研究院 | 一种电力设备用语音交互系统 |
CN111667831A (zh) * | 2020-06-08 | 2020-09-15 | 中国民航大学 | 基于管制员指令语义识别的飞机地面引导系统及方法 |
CN112581964A (zh) * | 2020-12-04 | 2021-03-30 | 浙江大有实业有限公司杭州科技发展分公司 | 一种面向多领域的智能语音交互方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113825082A (zh) * | 2021-09-19 | 2021-12-21 | 武汉左点科技有限公司 | 一种用于缓解助听延迟的方法及装置 |
CN113825082B (zh) * | 2021-09-19 | 2024-06-11 | 武汉左点科技有限公司 | 一种用于缓解助听延迟的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112992144B (zh) | 2021-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021000408A1 (zh) | 面试评分方法、装置、设备及存储介质 | |
Ganapathy et al. | Robust feature extraction using modulation filtering of autoregressive models | |
US8543387B2 (en) | Estimating pitch by modeling audio as a weighted mixture of tone models for harmonic structures | |
CN109740053A (zh) | 基于nlp技术的敏感词屏蔽方法和装置 | |
CN113436643B (zh) | 语音增强模型的训练及应用方法、装置、设备及存储介质 | |
CN112992144B (zh) | 应用于电力领域的智能语音调控方法 | |
Abe et al. | Sinusoidal model based on instantaneous frequency attractors | |
CN102117618A (zh) | 一种消除音乐噪声的方法、装置及系统 | |
CN103021407A (zh) | 一种黏着语语音识别方法及系统 | |
Zhang et al. | Multiple vowels repair based on pitch extraction and line spectrum pair feature for voice disorder | |
CN105679321A (zh) | 语音识别方法、装置及终端 | |
Yoneyama et al. | Unified source-filter GAN with harmonic-plus-noise source excitation generation | |
US7805308B2 (en) | Hidden trajectory modeling with differential cepstra for speech recognition | |
CN108831492B (zh) | 一种处理语音数据的方法、装置、设备及可读存储介质 | |
CN104810023B (zh) | 一种用于语音信号增强的谱减法 | |
CN110379438B (zh) | 一种语音信号基频检测与提取方法及系统 | |
Dasgupta et al. | Epoch detection using Hilbert envelope for glottal excitation enhancement and maximum-sum subarray for epoch marking | |
CN114254628A (zh) | 一种语音转写中结合用户文本的快速热词提取方法、装置、电子设备及存储介质 | |
TWI409802B (zh) | 音頻特徵處理方法及其裝置 | |
CN104282300A (zh) | 一种非周期成分音节模型建立、及语音合成的方法和设备 | |
CN102968988B (zh) | 训练数据匮乏下的鲁棒性语音转换方法 | |
CN111862931A (zh) | 一种语音生成方法及装置 | |
CN110223679A (zh) | 一种语音识别输入装置 | |
Yuan-yuan et al. | Speech synthesis based on PSOLA algorithm and modified pitch parameters | |
Yu et al. | Research on singing breath correction system based on improved deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |