CN112581939A - 一种应用于电力调度规范性评价的智能语音分析方法 - Google Patents

一种应用于电力调度规范性评价的智能语音分析方法 Download PDF

Info

Publication number
CN112581939A
CN112581939A CN202011419208.9A CN202011419208A CN112581939A CN 112581939 A CN112581939 A CN 112581939A CN 202011419208 A CN202011419208 A CN 202011419208A CN 112581939 A CN112581939 A CN 112581939A
Authority
CN
China
Prior art keywords
power
normative
analysis method
method applied
corpus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011419208.9A
Other languages
English (en)
Inventor
曾时博
胡飞飞
单政博
洪丹轲
黄昱
张思拓
梁寿愚
方文崇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Co Ltd
Original Assignee
China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Co Ltd filed Critical China Southern Power Grid Co Ltd
Priority to CN202011419208.9A priority Critical patent/CN112581939A/zh
Publication of CN112581939A publication Critical patent/CN112581939A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/16Hidden Markov models [HMM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及语音识别、文本分析技术领域,具体为一种应用于电力调度规范性评价的智能语音分析方法,其不同之处在于,包括以下步骤:步骤一:收集电力行业的语言材料;步骤二:对GMM‑HMM模型进行训练;步骤三:语音输入;步骤四:预加重;步骤五:加窗处理;步骤六:提取频域信号;步骤七:得到梅尔频谱;步骤八:输出FBANK特征;步骤九:去除频谱中的毛刺;步骤十:形成基础声学特征;步骤十一:提取动态特征;步骤十二:特征对比;步骤十三:记录说错词汇;步骤十四:特征对比;步骤十五:记录消极词汇;步骤十六:生成评价报告。本发明可以有效地提高电力调度的质量和效率。

Description

一种应用于电力调度规范性评价的智能语音分析方法
技术领域
本发明涉及语音识别、文本分析技术领域,具体为一种应用于电力调度规范性评价的智能语音分析方法。
背景技术
南方电网作为电力服务平台,拥有整体覆盖全网的智能语音引擎开放平台,满足在电力调度领域开展智能语音分析的智能化管理工作需要。在电力调度的沟通过程中,语音信号包含很多信息,比如调度员和现场操作人员的身份信息、性别、和语音内容等。但是,由于工作人员常常用简单的语句来表答一个复杂的问题,很多专业用语都用的不规范,导致双方的沟通不能有效的进行。比如说话人当时情感状态非常着急,普通话不够标准,电力专业词汇发音错误等。
鉴于此,为了克服现有技术缺点,提供一种应用于电力调度规范性评价的智能语音分析方法成为本领域亟待解决的问题。
发明内容
本发明目的在于克服现有技术的缺点,提供一种应用于电力调度规范性评价的智能语音分析方法,可以有效地提高电力调度的质量和效率。
为解决以上技术问题,本发明提供了一种应用于电力调度规范性评价的智能语音分析方法,其不同之处在于,包括以下步骤:
步骤一:收集电力行业的语言材料,明确语音语义匹配库需要的数据内容;
步骤二:通过收集的电力行业语料库、电力调度规范用语语料库和常用的情感语料库对GMM-HMM模型进行训练;
步骤三:语音输入,通过设备上的声卡读取麦克风中输入的语音信号,实现实时语音信号采集;
步骤四:对语音信号进行预加重,去除口唇辐射的影响,增加语音的高频分辨率;
步骤五:对步骤三得到的语音信号使用汉宁窗进行加窗处理;
步骤六:对加窗后的语音信号进行离散傅里叶变换,从每一段加窗后的音频中分别提取出频域信号;
步骤七:对步骤五输出的频谱通过三角梅尔滤波器组,得到梅尔频谱;
步骤八:对梅尔频谱取对数,增强特征的鲁棒性,输出FBANK特征;
步骤九:对FBANK特征进行离散余弦变换,把包络与谐波分开,去除频谱中的毛刺;
步骤十:在FBANK特征的基础上拼接Pitch特征,形成基础声学特征;
步骤十一:采用一阶导数提取动态特征;
步骤十二:基于GMM-HMM将基础声学特征和动态特征与电力行业语料库、电力调度规范用语语料库进行对比;
步骤十三:记录电力调度过程中说错的电力专业词汇,将进行记录;
步骤十四:基于GMM-HMM将基础声学特征和动态特征与情感语料库进行对比;
步骤十五:记录电力调度过程中的消极词汇进行记录;
步骤十六:对话结束后,生成电力调度规范性评价报告。
按以上技术方案,所述步骤二中,根据电力行业语料库、电力调度规范用语语料库和情感语料库的统计量和音素集通过聚类的方式生成决策树,基于决策树绑定状态,然后使用EM算法对模型做迭代训练,直到收敛。
按以上技术方案,所述步骤四中,对语音信号进行预加重的公式如下:
Figure BDA0002819299720000021
其中,x[t]表示音频数据的第t个数,a的取值范围为(0.95,0.99)。
按以上技术方案,所述步骤五中,对语音信号进行加窗的公式如下:
Figure BDA0002819299720000031
其中x[n]是所取窗口内的第n个数,w[n]是与之对应的权重。
按以上技术方案,所述步骤六中,提取频域信号的公式如下:
Figure BDA0002819299720000032
其中,X[k]为提取频域信号,exp为指数函数,N为频域抽样点数。
按以上技术方案,所述步骤七中,计算得到梅尔频谱的公式如下:
Figure BDA0002819299720000033
Figure BDA0002819299720000034
Figure BDA0002819299720000035
Figure BDA0002819299720000036
其中,wl(k)为对应滤波器的滤波系数,o(l)、c(l)、h(l)为实际频率坐标轴上对应滤波器的下限频率、中心频率和上限频率,fs为采样率,L为滤波器个数,F(l)即为滤波输出。
按以上技术方案,所述步骤八中,输出FBANK特征的计算公式如下:
Figure BDA0002819299720000037
其中,Q为FBANK参数的阶数,Si即为所得FBANK参数。
按以上技术方案,所述步骤九中,对FBANK特征进行离散余弦变换的公式如下:
Figure BDA0002819299720000041
其中,N为取log之后的特征维度,Ci是得到N维的特征向量,M是离散余弦变换之后的特征维度;离散余弦变换DCT的实质是去除各维信号之间的相关性,将信号映射到低维空间。
按以上技术方案,所述步骤十一中,提取动态特征的公式如下:
Figure BDA0002819299720000042
其中,c[t]是第t帧的FBANK+Pitch特征。
按以上技术方案,所述步骤十四中,依据步骤二训练好的GMM-HMM模型参数进行参数对齐,并对比识别结果。
与现有技术相比,本发明提供的应用于电力调度规范性评价的智能语音分析方法,用于构建应用于电力调度规范性评价的智能语音分析系统,可以大大地提高电力调度的质量和效率。
附图说明
图1为本发明实施例的整体流程示意图;
图2为本发明实施例的电力调度规范性评价报告生成流程示意图;
图3为本发明实施例的电力调度规范性评价报告结果举例1;
图4为本发明实施例的电力调度规范性评价报告结果举例2;
图5为本发明实施例的电力调度规范性评价报告结果举例3;
图6为本发明实施例的电力调度规范性评价报告结果举例4。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1至图6,本发明公开了一种应用于电力调度规范性评价的智能语音分析方法,其不同之处在于,包括以下步骤:
步骤一:收集电力行业的语言材料(电力行业语料、电力调度规范用语语料),明确语音语义匹配库需要的数据内容。可将电力行业的语言材料的数据分为电力行业语料库、电力调度规范用语语料库。
步骤二:通过收集的电力行业语料库、电力调度规范用语语料库和常用的情感语料库对GMM-HMM模型进行训练。
根据电力行业语料库、电力调度规范用语语料库和情感语料库的统计量和音素集通过聚类的方式生成决策树,基于决策树绑定状态,然后使用EM算法对模型做迭代训练,直到收敛。
步骤三:语音输入,通过设备上的声卡读取麦克风中输入的语音信号,实现实时语音信号采集。
步骤四:对语音信号进行进行预加重,去除口唇辐射的影响,增加语音的高频分辨率。
Figure BDA0002819299720000051
其中,x[t]表示音频数据的第t个数,a的取值范围为(0.95,0.99)。
步骤五:对步骤三得到的语音信号使用汉宁窗(Hanning Window)进行加窗。
Figure BDA0002819299720000052
其中x[n]是所取窗口内的第n个数,w[n]是与之对应的权重。
步骤六:对加窗后的语音信号进行离散傅里叶变换(DFT),从每一段加窗后的音频中分别提取出频域信号。
Figure BDA0002819299720000061
其中,X[k]为提取频域信号,exp为指数函数,N为频域抽样点数。
步骤七:对步骤五输出的频谱通过三角梅尔滤波器组,得到梅尔频谱。
Figure BDA0002819299720000062
Figure BDA0002819299720000063
Figure BDA0002819299720000064
Figure BDA0002819299720000065
其中,wl(k)为对应滤波器的滤波系数,o(l)、c(l)、h(l)为实际频率坐标轴上对应滤波器的下限频率、中心频率和上限频率,fs为采样率,L为滤波器个数,F(l)即为滤波输出。
步骤八:对梅尔频谱取对数,增强特征的鲁棒性,输出FBANK特征。
Figure BDA0002819299720000066
其中,Q为FBANK参数的阶数,Si即为所得FBANK参数。
步骤九:对FBANK特征进行离散余弦变换(DCT),把包络与谐波分开,去除频谱中的毛刺。
Figure BDA0002819299720000067
其中,N为取log之后的特征维度,Ci是得到N维的特征向量,M是离散余弦变换之后的特征维度;离散余弦变换DCT的实质是去除各维信号之间的相关性,将信号映射到低维空间。
步骤四到步骤九为特征参数提取。
步骤十:在FBANK特征的基础上拼接warped-NFCC、pitch-、delta-pitch-feature特征,形成基础声学特征。其中warped-NFCC特征是弯曲的互相关函数特征,pitch-feature是在原始基频特征基础上取对数后的特征,delta-pitch-feature是在pitch-feature上做差分后的特征。
步骤十一:采用一阶导数提取动态特征。
Figure BDA0002819299720000071
其中,c[t]是第t帧的FBANK+Pitch特征。
步骤十二:基于GMM-HMM将基础声学特征和动态特征与电力行业语料库、电力调度规范用语语料库进行对比。
依据步骤二训练好的GMM-HMM模型参数进行参数对齐,并对比识别结果。
步骤十三:如果电力专业词汇正确而且规范,则不作任何操作,如果有错误或者不规范的电力专业词汇,则记录电力调度过程中说错的电力专业词汇,将进行记录。
步骤十四:基于GMM-HMM将基础声学特征和动态特征与情感语料库进行对比。
依据步骤二训练好的GMM-HMM模型参数进行参数对齐,并对比识别结果。
步骤十五:如果电力调度过程中出现情感语料库中的消极词汇,则进行记录。
步骤十六:对话结束后,生成电力调度规范性评价报告。
举例:
实验所用电力语音语料是在高信噪比(>30dB)的实验室环境下录制的调度员和操作人员沟通语音。语音内容包含常用电力调度术语。电力领域客服问答语音文件的采样频率为16KHz,量化精度为16位,音频格式为wav格式,情感分析语料库为开源库SemEval-2016。
选取两名测试人员扮演调度员和工作人员,进行100次电力调度语音对话,每次对话5分钟,第1到25次对话中所涉及到的电力专业词汇均为规范的电力专业词汇,而且不出现情感分析语料库中的负面词汇。第26到50次对话中所涉及到的电力专业词汇均为规范的电力专业词汇,出现2次情感分析语料库中的负面词汇。第51到75次对话中出现5次不规范的电力专业词汇,出现2次情感分析语料库中的负面词汇。第76到100次对话中出现5次不规范的电力专业词汇,不出现情感分析语料库中的负面词汇。经过电力调度规范性评价的智能语音分析系统后生成相应的质量评价报告,如图3-图6,可以准确地记录不规范的电力专业词汇和负面词汇。
需要说明的是,在本文中,诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种应用于电力调度规范性评价的智能语音分析方法,其特征在于,包括以下步骤:
步骤一:收集电力行业的语言材料,明确语音语义匹配库需要的数据内容;
步骤二:通过收集的电力行业语料库、电力调度规范用语语料库和常用的情感语料库对GMM-HMM模型进行训练;
步骤三:语音输入,通过设备上的声卡读取麦克风中输入的语音信号,实现实时语音信号采集;
步骤四:对语音信号进行预加重,去除口唇辐射的影响,增加语音的高频分辨率;
步骤五:对步骤三得到的语音信号使用汉宁窗进行加窗处理;
步骤六:对加窗后的语音信号进行离散傅里叶变换,从每一段加窗后的音频中分别提取出频域信号;
步骤七:对步骤五输出的频谱通过三角梅尔滤波器组,得到梅尔频谱;
步骤八:对梅尔频谱取对数,增强特征的鲁棒性,输出FBANK特征;
步骤九:对FBANK特征进行离散余弦变换,把包络与谐波分开,去除频谱中的毛刺;
步骤十:在FBANK特征的基础上拼接Pitch特征,形成基础声学特征;
步骤十一:采用一阶导数提取动态特征;
步骤十二:基于GMM-HMM将基础声学特征和动态特征与电力行业语料库、电力调度规范用语语料库进行对比;
步骤十三:记录电力调度过程中说错的电力专业词汇,将进行记录;
步骤十四:基于GMM-HMM将基础声学特征和动态特征与情感语料库进行对比;
步骤十五:记录电力调度过程中的消极词汇进行记录;
步骤十六:对话结束后,生成电力调度规范性评价报告。
2.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤二中,根据电力行业语料库、电力调度规范用语语料库和情感语料库的统计量和音素集通过聚类的方式生成决策树,基于决策树绑定状态,然后使用EM算法对模型做迭代训练,直到收敛。
3.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤四中,对语音信号进行预加重的公式如下:
Figure FDA0002819299710000021
其中,x[t]表示音频数据的第t个数,a的取值范围为(0.95,0.99)。
4.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤五中,对语音信号进行加窗的公式如下:
Figure FDA0002819299710000022
其中,x[n]是所取窗口内的第n个数,w[n]是与之对应的权重。
5.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤六中,提取频域信号的公式如下:
Figure FDA0002819299710000023
其中,X[k]为提取频域信号,exp为指数函数,N为频域抽样点数。
6.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤七中,计算得到梅尔频谱的公式如下:
Figure FDA0002819299710000024
Figure FDA0002819299710000025
Figure FDA0002819299710000026
Figure FDA0002819299710000031
其中,wl(k)为对应滤波器的滤波系数,o(l)、c(l)、h(l)为实际频率坐标轴上对应滤波器的下限频率、中心频率和上限频率,fs为采样率,L为滤波器个数,F(l)即为滤波输出。
7.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤八中,输出FBANK特征的计算公式如下:
Figure FDA0002819299710000032
其中,Q为FBANK参数的阶数,Si即为所得FBANK参数。
8.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤九中,对FBANK特征进行离散余弦变换的公式如下:
Figure FDA0002819299710000033
其中,N为取log之后的特征维度,Ci是得到N维的特征向量,M是离散余弦变换之后的特征维度;离散余弦变换DCT的实质是去除各维信号之间的相关性,将信号映射到低维空间。
9.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤十一中,提取动态特征的公式如下:
Figure FDA0002819299710000034
其中,c[t]是第t帧的FBANK+Pitch特征。
10.根据权利要求1所述的应用于电力调度规范性评价的智能语音分析方法,其特征在于:所述步骤十四中,依据步骤二训练好的GMM-HMM模型参数进行参数对齐,并对比识别结果。
CN202011419208.9A 2020-12-06 2020-12-06 一种应用于电力调度规范性评价的智能语音分析方法 Pending CN112581939A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011419208.9A CN112581939A (zh) 2020-12-06 2020-12-06 一种应用于电力调度规范性评价的智能语音分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011419208.9A CN112581939A (zh) 2020-12-06 2020-12-06 一种应用于电力调度规范性评价的智能语音分析方法

Publications (1)

Publication Number Publication Date
CN112581939A true CN112581939A (zh) 2021-03-30

Family

ID=75127677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011419208.9A Pending CN112581939A (zh) 2020-12-06 2020-12-06 一种应用于电力调度规范性评价的智能语音分析方法

Country Status (1)

Country Link
CN (1) CN112581939A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807642A (zh) * 2021-06-25 2021-12-17 国网浙江省电力有限公司金华供电公司 基于程控电话的电力调度智能交互方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101650886A (zh) * 2008-12-26 2010-02-17 中国科学院声学研究所 一种自动检测语言学习者朗读错误的方法
CN102253976A (zh) * 2011-06-17 2011-11-23 苏州思必驰信息科技有限公司 一种用于口语学习的元数据处理方法和系统
CN206921140U (zh) * 2017-04-11 2018-01-23 西华大学 一种汽车4s店销售服务质量评价系统
CN109256152A (zh) * 2018-11-08 2019-01-22 上海起作业信息科技有限公司 语音评分方法及装置、电子设备、存储介质
CN109767756A (zh) * 2019-01-29 2019-05-17 大连海事大学 一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法
CN111081280A (zh) * 2019-12-30 2020-04-28 苏州思必驰信息科技有限公司 与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101650886A (zh) * 2008-12-26 2010-02-17 中国科学院声学研究所 一种自动检测语言学习者朗读错误的方法
CN102253976A (zh) * 2011-06-17 2011-11-23 苏州思必驰信息科技有限公司 一种用于口语学习的元数据处理方法和系统
CN206921140U (zh) * 2017-04-11 2018-01-23 西华大学 一种汽车4s店销售服务质量评价系统
CN109256152A (zh) * 2018-11-08 2019-01-22 上海起作业信息科技有限公司 语音评分方法及装置、电子设备、存储介质
CN109767756A (zh) * 2019-01-29 2019-05-17 大连海事大学 一种基于动态分割逆离散余弦变换倒谱系数的音声特征提取算法
JP2020140193A (ja) * 2019-01-29 2020-09-03 大連海事大学 逆離散コサイン変換のケプストラム係数の動的分割に基づく音声特徴抽出アルゴリズム
CN111081280A (zh) * 2019-12-30 2020-04-28 苏州思必驰信息科技有限公司 与文本无关的语音情感识别方法及装置、用于识别情感的算法模型的生成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807642A (zh) * 2021-06-25 2021-12-17 国网浙江省电力有限公司金华供电公司 基于程控电话的电力调度智能交互方法

Similar Documents

Publication Publication Date Title
CN108597496B (zh) 一种基于生成式对抗网络的语音生成方法及装置
Kumar et al. Spoken language identification using hybrid feature extraction methods
CN107154257A (zh) 基于客户语音情感的客服服务质量评价方法及系统
CN102543073A (zh) 一种沪语语音识别信息处理方法
Sathe-Pathak et al. Extraction of Pitch and Formants and its Analysis to identify 3 different emotional states of a person
CN105845143A (zh) 基于支持向量机的说话人确认方法及其系统
CN112581939A (zh) 一种应用于电力调度规范性评价的智能语音分析方法
WO2021152566A1 (en) System and method for shielding speaker voice print in audio signals
Krishna et al. Emotion recognition using dynamic time warping technique for isolated words
Kamble et al. Emotion recognition for instantaneous Marathi spoken words
Deiv et al. Automatic gender identification for hindi speech recognition
CN106228984A (zh) 语音识别信息获取方法
Kaminski et al. Automatic speaker recognition using a unique personal feature vector and Gaussian Mixture Models
Ayoub et al. An analysis and comparative evaluation of MFCC variants for speaker identification over VoIP networks
Upadhyay et al. Robust recognition of English speech in noisy environments using frequency warped signal processing
Roy et al. A hybrid VQ-GMM approach for identifying Indian languages
CN112331219B (zh) 语音处理方法和装置
Asakawa et al. Automatic recognition of connected vowels only using speaker-invariant representation of speech dynamics
Balpande et al. Speaker recognition based on mel-frequency cepstral coefficients and vector quantization
CN113409774A (zh) 语音识别方法、装置及电子设备
Jagtap et al. Speaker verification using Gaussian mixture model
Lingam Speaker based language independent isolated speech recognition system
Khanum et al. A novel speaker identification system using feed forward neural networks
Sharma et al. Speech analysis and feature extraction using SCILAB
Chaudhari et al. Effect of varying MFCC filters for speaker recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination