CN117219046A - 一种交互语音情感控制方法及系统 - Google Patents
一种交互语音情感控制方法及系统 Download PDFInfo
- Publication number
- CN117219046A CN117219046A CN202311383739.0A CN202311383739A CN117219046A CN 117219046 A CN117219046 A CN 117219046A CN 202311383739 A CN202311383739 A CN 202311383739A CN 117219046 A CN117219046 A CN 117219046A
- Authority
- CN
- China
- Prior art keywords
- voice
- emotion
- user
- module
- interactive voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 141
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000003058 natural language processing Methods 0.000 claims abstract description 25
- 238000005516 engineering process Methods 0.000 claims abstract description 20
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 47
- 230000015572 biosynthetic process Effects 0.000 claims description 31
- 238000003786 synthesis reaction Methods 0.000 claims description 31
- 238000011156 evaluation Methods 0.000 claims description 29
- 230000011218 segmentation Effects 0.000 claims description 15
- 230000009466 transformation Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种交互语音情感控制方法及系统,通过对用户语音进行识别,得到用户语音的情感信息和文本信息,依据文本信息,生成初始交互语音,基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向,依据情感倾向,生成语调语音,将初始交互语音和语调语音进行合成,得到最终的交互语音,能够根据不同的情境和语境生成相应的交互语音,从而让交互语音表达出更为丰富的情感,提高用户的交互体验。
Description
技术领域
本发明涉及交互语音控制技术领域,尤其涉及一种交互语音情感控制方法及系统。
背景技术
随着科技的发展,语音交互技术广泛应用在智能机器人、智能音箱、智能车载、智能电器等多种智能语音设备中,智能语音设备可以根据用户发出的交互语音,执行相应的操作,例如回答用户交互语音中的问题,启动或停止设备等,然而,现有的交互语音无法完全模拟真实世界的自然情感表达,可能导致生成的语音有些生硬或不自然,使得用户的交互体验感大大降低。
发明内容
有鉴于此,本发明提出一种交互语音情感控制方法及系统,可以解决现有技术所存在的生成的语音有些生硬或不自然的缺陷。
本发明的技术方案是这样实现的:
一种交互语音情感控制方法,具体包括:
获取用户语音;
对用户语音进行识别,得到用户语音的情感信息和文本信息;
依据文本信息,生成初始交互语音;
基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向;
依据情感倾向,生成语调语音;
将初始交互语音和语调语音进行合成,得到最终的交互语音。
作为所述交互语音情感控制方法的进一步可选方案,所述对用户语音进行识别,得到用户语音的情感信息和文本信息,具体包括:
对用户语音进行特征提取,得到用户语音的特征矢量;
将用户语音的特征矢量输入预设的语音识别模型中,得到相似度最高的特征矢量;
将相似度最高的特征矢量进行线性变换逆变换,得到用户语音的文本信息;
对用户语音的文本信息进行关键词提取,得到用户语音的情感信息。
作为所述交互语音情感控制方法的进一步可选方案,所述基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向,具体包括:
构建情感分析模型;
基于所述情感分析模型提取情感信息的特征;
依据自然语言处理技术对情感信息的特征进行分析,得到用户的情感倾向。
作为所述交互语音情感控制方法的进一步可选方案,所述构建情感分析模型,具体包括:
获取中文情感分析数据集;
获取中文预训练模型和分词器;
依据分词器对中文情感分析数据集进行预处理,得到训练数据;
定义中文预训练模型的优化器、损失函数、评价指标;
将训练数据输入定义好的中文预训练模型中进行训练,得到情感分析模型。
作为所述交互语音情感控制方法的进一步可选方案,所述将初始交互语音和语调语音进行合成,得到最终的交互语音,具体包括:
构建vits语音合成模型;
将初始交互语音和语调语音输入所述vits语音合成模型进行合成,得到最终的交互语音。
作为所述交互语音情感控制方法的进一步可选方案,所述方法还包括:
依据语音评估指标对最终的交互语音进行评估,得到评估结果;
依据评估结果对所述vits语音合成模型进行参数调节。
一种交互语音情感控制系统,包括:
第一获取模块,用于获取用户语音;
语音识别模块,用于对用户语音进行识别,得到用户语音的情感信息和文本信息;
第一生成模块,用于依据文本信息,生成初始交互语音;
自然语言处理模块,用于基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向;
第二生成模块,用于依据情感倾向,生成语调语音;
合成模块,用于将初始交互语音和语调语音进行合成,得到最终的交互语音。
作为所述交互语音情感控制系统的进一步可选方案,所述语音识别模块包括:
特征提取模块,用于对用户语音进行特征提取,得到用户语音的特征矢量;
输入模块,用于将用户语音的特征矢量输入预设的语音识别模型中,得到相似度最高的特征矢量;
逆变换模块,用于将相似度最高的特征矢量进行线性变换逆变换,得到用户语音的文本信息;
关键词提取模块,用于对用户语音的文本信息进行关键词提取,得到用户语音的情感信息。
作为所述交互语音情感控制系统的进一步可选方案,所述自然语言处理模块包括:
第一构建模块,用于构建情感分析模型;
提取模块,用于基于所述情感分析模型提取情感信息的特征;
分析模块,用于依据自然语言处理技术对情感信息的特征进行分析,得到用户的情感倾向;
所述合成模块包括:
第二构建模块,用于构建vits语音合成模型;
执行模块,用于将初始交互语音和语调语音输入所述vits语音合成模型进行合成,得到最终的交互语音;
其中,所述第一构建模块包括:
第二获取模块,用于获取中文情感分析数据集;
第三获取模块,用于获取中文预训练模型和分词器;
预处理模块,用于依据分词器对中文情感分析数据集进行预处理,得到训练数据;
定义模块,用于定义中文预训练模型的优化器、损失函数、评价指标;
训练模块,用于将训练数据输入定义好的中文预训练模型中进行训练,得到情感分析模型。
作为所述交互语音情感控制系统的进一步可选方案,所述系统还包括参数调节模块,所述参数调节模块包括:
评估模块,用于依据语音评估指标对最终的交互语音进行评估,得到评估结果;
调节模块,用于依据评估结果对所述vits语音合成模型进行参数调节。
本发明的有益效果是:通过对用户语音进行识别,得到用户语音的情感信息和文本信息,依据文本信息,生成初始交互语音,基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向,依据情感倾向,生成语调语音,将初始交互语音和语调语音进行合成,得到最终的交互语音,能够根据不同的情境和语境生成相应的交互语音,从而让交互语音表达出更为丰富的情感,提高用户的交互体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种交互语音情感控制方法的流程示意图;
图2为本发明一种交互语音情感控制系统的组成示意图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
参考图1-2,一种交互语音情感控制方法,具体包括:
获取用户语音;
对用户语音进行识别,得到用户语音的情感信息和文本信息;
依据文本信息,生成初始交互语音;
基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向;
依据情感倾向,生成语调语音;
将初始交互语音和语调语音进行合成,得到最终的交互语音。
在本实施例中,通过对用户语音进行识别,得到用户语音的情感信息和文本信息,依据文本信息,生成初始交互语音,基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向,依据情感倾向,生成语调语音,将初始交互语音和语调语音进行合成,得到最终的交互语音,能够根据不同的情境和语境生成相应的交互语音,从而让交互语音表达出更为丰富的情感,提高用户的交互体验。
优选的,所述对用户语音进行识别,得到用户语音的情感信息和文本信息,具体包括:
对用户语音进行特征提取,得到用户语音的特征矢量;
将用户语音的特征矢量输入预设的语音识别模型中,得到相似度最高的特征矢量;
将相似度最高的特征矢量进行线性变换逆变换,得到用户语音的文本信息;
对用户语音的文本信息进行关键词提取,得到用户语音的情感信息。
在本实施例中,通过对输入的用户语音进行预处理和特征提取,将其转换为数字信号,然后将其与训练模型中的参考模型进行相似性度量比较,最后将相似性最高的输入特征矢量作为识别结果输出。
优选的,所述基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向,具体包括:
构建情感分析模型;
基于所述情感分析模型提取情感信息的特征;
依据自然语言处理技术对情感信息的特征进行分析,得到用户的情感倾向。
在本实施例中,利用NLP技术对语音识别后的文本进行情感分析,可以使用词袋模型、词嵌入或深度学习模型等方法来提取文本中的特征,并对其情感倾向进行分析,可以将其分为积极、消极或中立等几个类别,或者使用更精细的分类,如高兴、悲伤、愤怒等。
优选的,所述构建情感分析模型,具体包括:
获取中文情感分析数据集;
获取中文预训练模型和分词器;
依据分词器对中文情感分析数据集进行预处理,得到训练数据;
定义中文预训练模型的优化器、损失函数、评价指标;
将训练数据输入定义好的中文预训练模型中进行训练,得到情感分析模型。
在本实施例中,构建情感分析模型训练步骤如下:
步骤1:加载中文情感分析数据集ChnSentiCorp,ChnSentiCorp是中文句子级情感分类数据集,包含酒店、笔记本电脑和书籍的网购评论;
步骤2:加载中文预训练模型和分词器,利用AutoModel,AutoTokenizer加载预训练模型和分词器,AutoModelForSequenceClassification句子级情感分析和目标级情感分析任务,通过预训练模型获取输入文本的表示,之后将文本表示进行分类;
步骤3:基于预训练模型的数据处理,Dataset中通常为原始数据,需要经过一定的数据处理并进行采样组batch,通过Dataset的map函数,使用分词器将数据集从原始文本处理成模型的输入,根据显存大小调整批大小batch_size和文本最大长度max_seq_length;
步骤4:数据训练和评估,定义训练所需的优化器、损失函数、评价指标等,开始进行预模型微调任务。
优选的,所述将初始交互语音和语调语音进行合成,得到最终的交互语音,具体包括:
构建vits语音合成模型;
将初始交互语音和语调语音输入所述vits语音合成模型进行合成,得到最终的交互语音。
在本实施例中,在vits语音合成模型中,语音合成中的声学模型和声码器并非简单的串联关系,而是通过隐变量进行连接,并在这些隐变量上进行随机建模和利用随机时长预测器,这种方式使得该模型能够合成不同声调和韵律的语音,极大地提高了合成语音的多样性。
优选的,所述方法还包括:
依据语音评估指标对最终的交互语音进行评估,得到评估结果;
依据评估结果对所述vits语音合成模型进行参数调节。
在本实施例中,在语音合成后,可以通过语音评估指标(如自然度、清晰度、可理解度等)对生成的语音进行评估,并根据用户的反馈进行相应的调整,以改进语音合成的质量。
一种交互语音情感控制系统,包括:
第一获取模块,用于获取用户语音;
语音识别模块,用于对用户语音进行识别,得到用户语音的情感信息和文本信息;
第一生成模块,用于依据文本信息,生成初始交互语音;
自然语言处理模块,用于基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向;
第二生成模块,用于依据情感倾向,生成语调语音;
合成模块,用于将初始交互语音和语调语音进行合成,得到最终的交互语音。
优选的,所述语音识别模块包括:
特征提取模块,用于对用户语音进行特征提取,得到用户语音的特征矢量;
输入模块,用于将用户语音的特征矢量输入预设的语音识别模型中,得到相似度最高的特征矢量;
逆变换模块,用于将相似度最高的特征矢量进行线性变换逆变换,得到用户语音的文本信息;
关键词提取模块,用于对用户语音的文本信息进行关键词提取,得到用户语音的情感信息。
优选的,所述自然语言处理模块包括:
第一构建模块,用于构建情感分析模型;
提取模块,用于基于所述情感分析模型提取情感信息的特征;
分析模块,用于依据自然语言处理技术对情感信息的特征进行分析,得到用户的情感倾向;
所述合成模块包括:
第二构建模块,用于构建vits语音合成模型;
执行模块,用于将初始交互语音和语调语音输入所述vits语音合成模型进行合成,得到最终的交互语音;
其中,所述第一构建模块包括:
第二获取模块,用于获取中文情感分析数据集;
第三获取模块,用于获取中文预训练模型和分词器;
预处理模块,用于依据分词器对中文情感分析数据集进行预处理,得到训练数据;
定义模块,用于定义中文预训练模型的优化器、损失函数、评价指标;
训练模块,用于将训练数据输入定义好的中文预训练模型中进行训练,得到情感分析模型。
优选的,所述系统还包括参数调节模块,所述参数调节模块包括:
评估模块,用于依据语音评估指标对最终的交互语音进行评估,得到评估结果;
调节模块,用于依据评估结果对所述vits语音合成模型进行参数调节。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种交互语音情感控制方法,其特征在于,具体包括:
获取用户语音;
对用户语音进行识别,得到用户语音的情感信息和文本信息;
依据文本信息,生成初始交互语音;
基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向;
依据情感倾向,生成语调语音;
将初始交互语音和语调语音进行合成,得到最终的交互语音。
2.根据权利要求1所述的一种交互语音情感控制方法,其特征在于,所述对用户语音进行识别,得到用户语音的情感信息和文本信息,具体包括:
对用户语音进行特征提取,得到用户语音的特征矢量;
将用户语音的特征矢量输入预设的语音识别模型中,得到相似度最高的特征矢量;
将相似度最高的特征矢量进行线性变换逆变换,得到用户语音的文本信息;
对用户语音的文本信息进行关键词提取,得到用户语音的情感信息。
3.根据权利要求2所述的一种交互语音情感控制方法,其特征在于,所述基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向,具体包括:
构建情感分析模型;
基于所述情感分析模型提取情感信息的特征;
依据自然语言处理技术对情感信息的特征进行分析,得到用户的情感倾向。
4.根据权利要求3所述的一种交互语音情感控制方法,其特征在于,所述构建情感分析模型,具体包括:
获取中文情感分析数据集;
获取中文预训练模型和分词器;
依据分词器对中文情感分析数据集进行预处理,得到训练数据;
定义中文预训练模型的优化器、损失函数、评价指标;
将训练数据输入定义好的中文预训练模型中进行训练,得到情感分析模型。
5.根据权利要求4所述的一种交互语音情感控制方法,其特征在于,所述将初始交互语音和语调语音进行合成,得到最终的交互语音,具体包括:
构建vits语音合成模型;
将初始交互语音和语调语音输入所述vits语音合成模型进行合成,得到最终的交互语音。
6.根据权利要求5所述的一种交互语音情感控制方法,其特征在于,所述方法还包括:
依据语音评估指标对最终的交互语音进行评估,得到评估结果;
依据评估结果对所述vits语音合成模型进行参数调节。
7.一种交互语音情感控制系统,其特征在于,包括:
第一获取模块,用于获取用户语音;
语音识别模块,用于对用户语音进行识别,得到用户语音的情感信息和文本信息;
第一生成模块,用于依据文本信息,生成初始交互语音;
自然语言处理模块,用于基于自然语言处理技术对所述情感信息进行分析,得到用户的情感倾向;
第二生成模块,用于依据情感倾向,生成语调语音;
合成模块,用于将初始交互语音和语调语音进行合成,得到最终的交互语音。
8.根据权利要求7所述的一种交互语音情感控制系统,其特征在于,所述语音识别模块包括:
特征提取模块,用于对用户语音进行特征提取,得到用户语音的特征矢量;
输入模块,用于将用户语音的特征矢量输入预设的语音识别模型中,得到相似度最高的特征矢量;
逆变换模块,用于将相似度最高的特征矢量进行线性变换逆变换,得到用户语音的文本信息;
关键词提取模块,用于对用户语音的文本信息进行关键词提取,得到用户语音的情感信息。
9.根据权利要求8所述的一种交互语音情感控制系统,其特征在于,所述自然语言处理模块包括:
第一构建模块,用于构建情感分析模型;
提取模块,用于基于所述情感分析模型提取情感信息的特征;
分析模块,用于依据自然语言处理技术对情感信息的特征进行分析,得到用户的情感倾向;
所述合成模块包括:
第二构建模块,用于构建vits语音合成模型;
执行模块,用于将初始交互语音和语调语音输入所述vits语音合成模型进行合成,得到最终的交互语音;
其中,所述第一构建模块包括:
第二获取模块,用于获取中文情感分析数据集;
第三获取模块,用于获取中文预训练模型和分词器;
预处理模块,用于依据分词器对中文情感分析数据集进行预处理,得到训练数据;
定义模块,用于定义中文预训练模型的优化器、损失函数、评价指标;
训练模块,用于将训练数据输入定义好的中文预训练模型中进行训练,得到情感分析模型。
10.根据权利要求9所述的一种交互语音情感控制系统,其特征在于,所述系统还包括参数调节模块,所述参数调节模块包括:
评估模块,用于依据语音评估指标对最终的交互语音进行评估,得到评估结果;
调节模块,用于依据评估结果对所述vits语音合成模型进行参数调节。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311383739.0A CN117219046A (zh) | 2023-10-24 | 2023-10-24 | 一种交互语音情感控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311383739.0A CN117219046A (zh) | 2023-10-24 | 2023-10-24 | 一种交互语音情感控制方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117219046A true CN117219046A (zh) | 2023-12-12 |
Family
ID=89044650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311383739.0A Pending CN117219046A (zh) | 2023-10-24 | 2023-10-24 | 一种交互语音情感控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117219046A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117935865A (zh) * | 2024-03-22 | 2024-04-26 | 江苏斑马软件技术有限公司 | 一种用于个性化营销的用户情感分析方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106710590A (zh) * | 2017-02-24 | 2017-05-24 | 广州幻境科技有限公司 | 基于虚拟现实环境的具有情感功能的语音交互系统及方法 |
CN108922535A (zh) * | 2018-08-23 | 2018-11-30 | 上海华测导航技术股份有限公司 | 用于接收机的语音交互系统及交互方法 |
CN112927782A (zh) * | 2021-03-29 | 2021-06-08 | 山东思正信息科技有限公司 | 一种基于文本情感分析的心身健康状态预警系统 |
CN114974310A (zh) * | 2022-05-30 | 2022-08-30 | 平安科技(深圳)有限公司 | 基于人工智能的情感识别方法、装置、计算机设备及介质 |
CN116665669A (zh) * | 2023-07-19 | 2023-08-29 | 上海海启科技有限公司 | 一种基于人工智能的语音交互方法及系统 |
CN116778921A (zh) * | 2023-07-24 | 2023-09-19 | 浙大宁波理工学院 | 语音交流的情感分析智能会话系统、方法、设备及介质 |
CN116911869A (zh) * | 2023-09-01 | 2023-10-20 | 长春市壹佰度网络科技有限公司 | 一种基于人工智能的智能客服系统及其方法 |
-
2023
- 2023-10-24 CN CN202311383739.0A patent/CN117219046A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106710590A (zh) * | 2017-02-24 | 2017-05-24 | 广州幻境科技有限公司 | 基于虚拟现实环境的具有情感功能的语音交互系统及方法 |
CN108922535A (zh) * | 2018-08-23 | 2018-11-30 | 上海华测导航技术股份有限公司 | 用于接收机的语音交互系统及交互方法 |
CN112927782A (zh) * | 2021-03-29 | 2021-06-08 | 山东思正信息科技有限公司 | 一种基于文本情感分析的心身健康状态预警系统 |
CN114974310A (zh) * | 2022-05-30 | 2022-08-30 | 平安科技(深圳)有限公司 | 基于人工智能的情感识别方法、装置、计算机设备及介质 |
CN116665669A (zh) * | 2023-07-19 | 2023-08-29 | 上海海启科技有限公司 | 一种基于人工智能的语音交互方法及系统 |
CN116778921A (zh) * | 2023-07-24 | 2023-09-19 | 浙大宁波理工学院 | 语音交流的情感分析智能会话系统、方法、设备及介质 |
CN116911869A (zh) * | 2023-09-01 | 2023-10-20 | 长春市壹佰度网络科技有限公司 | 一种基于人工智能的智能客服系统及其方法 |
Non-Patent Citations (1)
Title |
---|
何一鸣: "互联网社区投资者情绪关联性分析——基于东方财富股吧", 《中国优秀硕士学位论文全文数据库信息科技辑》, 15 January 2023 (2023-01-15), pages 8 - 24 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117935865A (zh) * | 2024-03-22 | 2024-04-26 | 江苏斑马软件技术有限公司 | 一种用于个性化营销的用户情感分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110211563B (zh) | 面向情景及情感的中文语音合成方法、装置及存储介质 | |
CN111048062B (zh) | 语音合成方法及设备 | |
Ghai et al. | Literature review on automatic speech recognition | |
CN111312245B (zh) | 一种语音应答方法、装置和存储介质 | |
KR20200105589A (ko) | 음성 감정 인식 방법 및 시스템 | |
CN117219046A (zh) | 一种交互语音情感控制方法及系统 | |
Gupta et al. | Speech feature extraction and recognition using genetic algorithm | |
JP2024505076A (ja) | 多様で自然なテキスト読み上げサンプルを生成する | |
CN116665669A (zh) | 一种基于人工智能的语音交互方法及系统 | |
KR20190088126A (ko) | 인공 지능 기반 외국어 음성 합성 방법 및 장치 | |
CN117150338A (zh) | 任务处理、自动问答以及多媒体数据识别模型训练方法 | |
CN112242134A (zh) | 语音合成方法及装置 | |
Daouad et al. | An automatic speech recognition system for isolated Amazigh word using 1D & 2D CNN-LSTM architecture | |
CN115359778A (zh) | 基于说话人情感语音合成模型的对抗与元学习方法 | |
CN114758664A (zh) | 语音数据筛选方法、装置、电子设备和可读存储介质 | |
Bhargav et al. | Voice-based intelligent virtual assistant for windows | |
CN113539239A (zh) | 语音转换方法、装置、存储介质及电子设备 | |
CN115700871A (zh) | 模型训练和语音合成方法、装置、设备及介质 | |
CN113257225A (zh) | 一种融合词汇及音素发音特征的情感语音合成方法及系统 | |
US20190019497A1 (en) | Expressive control of text-to-speech content | |
Kuzdeuov et al. | Speech Command Recognition: Text-to-Speech and Speech Corpus Scraping Are All You Need | |
Muthuvel et al. | Emotion Recognition in Speech Signals using MFCC and Mel-Spectrogram Analysis | |
CN113192483B (zh) | 一种文本转换为语音的方法、装置、存储介质和设备 | |
CN112420022B (zh) | 一种噪声提取方法、装置、设备和存储介质 | |
OUKAS et al. | ArabAlg: A new Dataset for Arabic Speech Commands Recognition for Machine Learning Purposes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |