CN110379421A - 一种方言语音ai控制方法、装置及终端 - Google Patents

一种方言语音ai控制方法、装置及终端 Download PDF

Info

Publication number
CN110379421A
CN110379421A CN201910625720.XA CN201910625720A CN110379421A CN 110379421 A CN110379421 A CN 110379421A CN 201910625720 A CN201910625720 A CN 201910625720A CN 110379421 A CN110379421 A CN 110379421A
Authority
CN
China
Prior art keywords
control
speech
intertranslation
module
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910625720.XA
Other languages
English (en)
Inventor
周超群
王龙江
王少峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shangke Decoration Technology Co Ltd
Original Assignee
Shenzhen Shangke Decoration Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shangke Decoration Technology Co Ltd filed Critical Shenzhen Shangke Decoration Technology Co Ltd
Publication of CN110379421A publication Critical patent/CN110379421A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及智能语音控制领域,一种方言语音AI控制方法、装置及终端。所述的方言语音AI控制方法包括:获取唤醒词和控制指令;根据控制指令进入到语言学习状态;通过多次获取的语音信息进行语言复制;将复制的语言信息进行分析并与主流语言互译;根据互译词条对智能产品进行控制。通过本发明所述的方法可以在无需联网的状态下实现方言的学习与对智能产品的控制。

Description

一种方言语音AI控制方法、装置及终端
技术领域
本发明涉及智能语音控制领域,具体涉及一种方言语音AI控制方法、装置及终端。
背景技术
AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
上述的语言识别能把语言和语声转换成可进行处理的信息的过程。目前世界上大约有6000~10000多种语言,方言大部分没有文字的语言,对这类语言进行完整记录比较困难。现有技术中有如下的缺陷:AI语音智能需要标准的普通话控制,普通话不标准则无法使用,容易定义为伪智能。对于一些语言识别的装置需要网络云端语音库大数据,不能掉网,否则无法使用。
为解决上述问题,本发明所述的一种方言语音AI控制方法、装置及终端,在无需联网的状态下实现方言的学习与对智能产品的控制。
发明内容
本发明解决的技术问题是,提供了一种方言语音AI控制方法、装置及终端。所述的一种方言语音AI控制方法、装置及终端在无需联网的状态下实现方言的学习与对智能产品的控制。
为了解决上述技术问题,本发明提供的技术方案为:
一种方言语音AI控制方法:
获取唤醒词和控制指令;
根据控制指令进入到语言学习状态;
通过多次获取的语音信息进行语言复制;
将复制的语言信息进行分析并与主流语言互译;
根据互译词条对智能产品进行控制。
优选地,所述的获取控制指令时,若规定时间内无正确指令输入,自动返回待唤醒状态。获取唤醒词后若未接收到控制指令,自动返回待唤醒状态。达到了节能的效果,同时实现智能化自动化。
优选地,所述的语言复制是通过智能语音技术对用户语言进行完整记录。语音技术是在计算机领域中的关键技术,有自动语音识别技术和语音合成技术,让计算机能听、能看、能说、能感觉。本发明所述的根据语音技术是系统通过麦克风获取语音后,将语音信息进行完整的记录。
优选地,所述的对用户语言进行记录后包括,对语音进行分析,具体为分析出语音结构、句法结构、连续语音的音变和连续变调。
优选地,所述的互译具体为根据语音分析结果、基本意义单位与主流语言的对应关系进行互译。对于基本意义单位以及分析结果进行互译的优点在于,互译的结果局不限于单个的句法表达,使得用户的控制指令在表述的过程中更具自由性,识别控制指令的识别效果也更好。
优选地,所述的互译完成后生成互译词条,互译词条用于与控制指令进行匹配,调用匹配的控制指令控制智能产品。互译词条是将语音与文本进行转换的过程,文本与控制指令进行匹配完成后,调用匹配的控制指令对智能产品进行控制。
优选地,所述的控制模式包含三种:卖场模式、家庭模式、厨房模式。所述的卖场模式获取复制语音信息后对稳态噪音以及动态噪音进行过滤。控制模式分为三种情况,考虑到了在不同环境下的,语音的获取的要求,对于卖场模式情况下,要求语音输入距离更近,同时对语音进行更复杂的噪声处理,包括:过滤掉绝大部分稳态噪音,比如电机、风机。过滤掉一些生活中的动态噪音,比如水声、关门声等。
此解决方案,满足在卖场环境下演示,过滤掉周围一些说话声、音乐声等使得获取的指令更精确。家庭模式下,考虑到较安静的情况下,获取的语音指令已经是较简单的噪声,从而进行简单的噪声处理,加快识别速度,同时要求的可控制范围更大。
一种方言语音AI控制装置:
指令获取模块:所述的指令获取模块用于获取唤醒词和控制指令;
选择模块:所述的选择模块用于根据控制指令进入到语言学习状态;
语言复制模块:所述的语言复制模块用于通过多次获取的语音信息进行语言复制;
互译模块:所述的互译模块用于将复制的语言信息进行分析并与主流语言互译;
控制模块:所述的控制模块用于根据互译词条对智能产品进行控制。
优选地,所述的指令获取模块用于获取唤醒词和控制指令;所述的唤醒词用于控制系统开启,控制词用于对系统进行控制指令的输入。
优选地,所述的选择模块用于根据控制指令进入到语言学习状态;进入该状态后可进行语言学习。
优选地,所述的语言复制模块用于通过多次获取的语音信息进行语言复制;所述的语言信息进行复制采用了智能语音技术实现语音的复制,对于语音的复制通常采用复制三次的情况。
优选地,所述的互译模块用于将复制的语言信息进行分析并与主流语言互译;所述的语音的分析过程为,所述的对用户语言进行记录后包括,对语音进行分析,具体为分析出语音结构、句法结构、连续语音的音变和连续变调。所述的互译具体为根据语音分析结果、基本意义单位与主流语言的对应关系进行互译。对于基本意义单位以及分析结果进行互译的优点在于,互译的结果局不限于单个的句法表达,使得用户的控制指令在表述的过程中更具自由性,识别控制指令的识别效果也更好。
优选地,所述的控制模块用于根据互译词条对智能产品进行控制。所述的互译词条是一种互译后生成的文本,通过该文本与控制指令的匹配,从而进行智能产品的控制。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序指令,该程序指令适于由处理器加载并执行上述方言语音AI控制方法。
本发明还提供一种移动终端,其包括处理器以及存储器,所述的处理器用于执行存储器中存储的程序,以实现上述方言语音AI控制方法。
与现有技术相比,本发明具有的有益效果为:本发明所述的一种方言语音AI控制方法无需联网的状态下实现方言的学习与对智能产品的控制。具体的,通过语言的复制、分析与主流语言的互译,实现语音方言学习,方言的学习无需网络即可实现方言控制电器及灯光。同时不需要预先录入语言,本地学习地方方言,即可操作控制。方言的控制解决不会说普通话的人使用,比方说当地老人及小孩。本申请所述的控制方法无需网络,无需APP,无需任何的终端及平台辅助工具,产品本地即可操作。同时产品模块化,减低对接任意产品AI语音开发生产成本。不需要网络做为平台,适用于单机运作。即学即用,无需等待,把智能做到人性化。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1是本发明所述的一种方言语音AI控制方法的流程示意图;
图2是本发明所述的一种方言语音AI控制装置的结构图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图,仅以示意方式说明本发明的基本流程图,因此其仅显示与本发明有关的流程。
实施例1
如图1所示,本发明是一种方言语音AI控制方法,所述的方法具体为:
S1.获取唤醒词和控制指令;
S2.根据控制指令进入到语言学习状态;
S3.通过多次获取的语音信息进行语言复制;
S4.将复制的语言信息进行分析并与主流语言互译;
S5.根据互译词条对智能产品进行控制。
步骤S1.获取唤醒词和控制指令,所述的控制语言大脑的指令共有三种:
第一种:唤醒词和控制指令,此方式称作One Shot,智能音响上通常都是此方式,可是语音控制的最方便的方式,例如:小可和把灯打开。
第二种:单独说控控制指令,例如:把灯关了,在系统唤醒后,可以只说控制住指令。
第三种:单独说唤醒指令,例如:小可小可,唤醒系统,一般作为唤醒方式。
步骤S2:根据控制指令进入到语言学习状态;进入语言学习状态后,包括如下的几点要求:
在方言学习时,周围环境保持安静状态;嘴巴离麦克风距离在1米左右最佳;获取的语速需要放慢,比正常语速稍微慢;说话发音清晰饱满;学习训练时,如果播放“学习的指令不规范,请重说第x遍xx的学习指令”时,表示录音训练质量不够好或者说话的内容少于三个字,训练的说话内容必须三个字以上或者三个字;学习训练结束后,如果识别效果不佳,需删除后,再重新学习训练一遍。
步骤S3:通过多次获取的语音信息进行语言复制;
优选地,所述的语言复制是通过智能语音技术对用户语言进行完整记录。语音技术是在计算机领域中的关键技术,有自动语音识别技术和语音合成技术,让计算机能听、能看、能说、能感觉。本发明所述的根据语音技术是系统通过麦克风获取语音后,将语音信息进行完整的记录。
步骤S4:将复制的语言信息进行分析并与主流语言互译;
所述的语音分的分析为:优选地,所述的对用户语言进行记录后包括,对语音进行分析,具体为分析出语音结构、句法结构、连续语音的音变和连续变调。所述的语音结构包括:音节语言的声母、韵母、声调等。
所述的互译具体为根据语音分析结果、基本意义单位与主流语言的对应关系进行互译。此方法的优点在于,对于基本意义单位以及分析结果进行互译的优点在于,互译的结果局不限于单个的句法表达,使得用户的控制指令在表述的过程中更具自由性,识别控制指令的识别效果也更好。
例如:用户发出小可关闭全部灯光/小可关掉全部灯光/小可灯光全部关掉/小可灯光全部关了/小可把灯光全部关掉/小可把灯光全部关了/小可灯光全关/小可灯全关了/小可灯全关啦/小可把灯全关了/小可灯全关掉/小可把灯全关掉/小可灯全部关了/小可把灯全部关了/小可灯全部关掉/小可把灯全部关掉/小可灯都关了/小可灯都关掉/小可把灯都关了/小可把灯都关掉关闭全部灯光/关掉全部灯光/灯光全部关掉/灯光全部关了/把灯光全部关掉/把灯光全部关了/灯光全关/灯全关了/灯全关啦/把灯全关了/灯全关掉/把灯全关掉/灯全部关了/把灯全部关了/灯全部关掉/把灯全部关掉/灯都关了/灯都关掉/把灯都关了/把灯都关掉,以上所有的表达方式都可识别为关闭全部灯光的指令。
步骤S5:根据互译词条对智能产品进行控制。
所述的互译完成后生成互译词条,互译词条用于与控制指令进行匹配,调用匹配的控制指令控制智能产品。互译词条是将语音与文本进行转换的过程,文本与控制指令进行匹配完成后,调用匹配的控制指令对智能产品进行控制。
实施例2
退出学习的过程为:
如果系统播放“请说第x遍xxx的学习指令”, 用户没有说话,30秒后,系统会播放“学习超时,系统重启生效中”,系统会自动退出学习模式。已学习成功的方言指令都会保留,仍然可以方言识别。
实施例3
系统装置技术参数:
系统装置采用5V USB口供电,插好麦克风和喇叭,上电后,8秒左右,喇叭播放“xxx准备就绪”。
控制模式包含三种:卖场模式、家庭模式、厨房模式。所述的卖场模式获取复制语音信息后对稳态噪音以及动态噪音进行过滤语音。控制模式设置为家庭模式时,环境噪音不超过60分贝,识别距离不超过5米,说话声音高于周围的噪音,均可有效识别,用户需正对麦克风,不可低头朝向其它方向。
控制模式设置为卖场模式时,识别距离不超过1米,说话的声音高于周围的噪音,均可有效识别。嘴巴最好正对麦克风,不可低头或者朝向其它方向。
如图2所示,本发明提供了一种方言语音AI控制装置:
指令获取模块1:所述的指令获取模块用于获取唤醒词和控制指令;
选择模块2:所述的选择模块用于根据控制指令进入到语言学习状态;
语言复制模块3:所述的语言复制模块用于通过多次获取的语音信息进行语言复制;
互译模块4:所述的互译模块用于将复制的语言信息进行分析并与主流语言互译;
控制模块5:所述的控制模块用于根据互译词条对智能产品进行控制。
所述的指令获取模块1:用于获取唤醒词和控制指令;所述的唤醒词用于控制系统开启,控制词用于对系统进行控制指令的输入。
所述的选择模块2:用于根据控制指令进入到语言学习状态;进入该状态后可进行语言学习。
所述的语言复制模块3:用于通过多次获取的语音信息进行语言复制;所述的语言信息进行复制采用了智能语音技术实现语音的复制,对于语音的复制通常采用复制三次的情况。
所述的互译模块4:用于将复制的语言信息进行分析并与主流语言互译;所述的语音的分析过程为,所述的对用户语言进行记录后包括,对语音进行分析,具体为分析出语音结构、句法结构、连续语音的音变和连续变调。所述的互译具体为根据分析结果、基本意义单位与主流语言的对应关系以及语言的任意文本或语音和主流语言之间进行互译。对于基本意义单位以及分析结果进行互译的优点在于,互译的结果局不限于单个的句法表达,使得用户的控制指令在表述的过程中更具自由性,识别控制指令的识别效果也更好。
所述的控制模块5:用于根据互译词条对智能产品进行控制。所述的互译词条是一种互译后生成的语言文本,通过该文本与控制指令的匹配,从而进行智能产品的控制。
上列详细说明是针对本发明可行实施例的具体说明,以上实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本案的专利范围中。

Claims (10)

1.一种方言语音AI控制方法,其特征在于,包括:
获取唤醒词和控制指令;
根据控制指令进入到语言学习状态;
通过多次获取的语音信息进行语言复制;
将复制的语言信息进行分析并与主流语言互译;
根据互译词条对智能产品进行控制。
2.根据权利要求1所述的一种方言语音AI控制方法,其特征在于,所述的获取控制指令时,若规定时间内无正确指令输入,自动返回待唤醒状态。
3.根据权利要求1所述的一种方言语音AI控制方法,其特征在于,所述的语言复制是通过智能语音技术对用户语音进行完整记录。
4.根据权利要求3所述的一种方言语音AI控制方法,其特征在于,所述的对用户语音进行记录后包括,对语音进行分析,具体为分析出语音结构、句法结构、连续语音的音变和连续变调,生成语音分析结果。
5.根据权利要求1所述的一种方言语音AI控制方法,其特征在于,所述的互译具体为根据语音分析结果、基本意义单位与主流语言的对应关系进行互译。
6.根据权利要求5所述的一种方言语音AI控制方法,其特征在于,所述的互译完成后生成互译词条,互译词条用于与控制指令进行匹配,调用匹配的控制指令控制智能产品。
7.根据权利要求1所述的一种方言语音AI控制方法,其特征在于,所述的控制模式包含三种:卖场模式、家庭模式、厨房模式;
所述的卖场模式获取复制语音信息后包括对稳态噪音以及动态噪音进行过滤。
8.一种方言语音AI控制装置,包括:
指令获取模块:所述的指令获取模块用于获取唤醒词和控制指令;
选择模块:所述的选择模块用于根据控制指令进入到语言学习状态;
语言复制模块:所述的语言复制模块用于通过多次获取的语音信息进行语言复制;
互译模块:所述的互译模块用于将复制的语言信息进行分析并与主流语言互译;
控制模块:所述的控制模块用于根据互译词条对智能产品进行控制。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序指令,该程序指令适于由处理器加载并执行权利要求1~8任一项所述的方法。
10.一种移动终端,其特征在于,包括处理器以及存储器,所述的处理器用于执行存储器中存储的程序,以实现权利要求1~8任一项所述的方法。
CN201910625720.XA 2019-04-03 2019-07-11 一种方言语音ai控制方法、装置及终端 Pending CN110379421A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910268128.9A CN109979455A (zh) 2019-04-03 2019-04-03 一种方言语音ai控制方法、装置及终端
CN2019102681289 2019-04-03

Publications (1)

Publication Number Publication Date
CN110379421A true CN110379421A (zh) 2019-10-25

Family

ID=67082943

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910268128.9A Pending CN109979455A (zh) 2019-04-03 2019-04-03 一种方言语音ai控制方法、装置及终端
CN201910625720.XA Pending CN110379421A (zh) 2019-04-03 2019-07-11 一种方言语音ai控制方法、装置及终端

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910268128.9A Pending CN109979455A (zh) 2019-04-03 2019-04-03 一种方言语音ai控制方法、装置及终端

Country Status (1)

Country Link
CN (2) CN109979455A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354360A (zh) * 2020-03-17 2020-06-30 北京百度网讯科技有限公司 语音交互处理方法、装置和电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1645363A (zh) * 2005-01-04 2005-07-27 华南理工大学 便携式即时方言互译装置及其方法
CN101269638A (zh) * 2008-04-10 2008-09-24 清华大学 基于命令词表的汽车电器语音控制方法
CN106847276A (zh) * 2015-12-30 2017-06-13 昶洧新能源汽车发展有限公司 一种带方言识别的话音控制系统
CN107657950A (zh) * 2017-08-22 2018-02-02 广州小鹏汽车科技有限公司 基于云端和多命令词的汽车语音控制方法、系统及装置
KR101836430B1 (ko) * 2017-08-07 2018-03-08 고현선 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버
CN108172223A (zh) * 2017-12-14 2018-06-15 深圳市欧瑞博科技有限公司 语音指令识别方法、装置及服务器和计算机可读存储介质
CN109360563A (zh) * 2018-12-10 2019-02-19 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及空调
CN109410936A (zh) * 2018-11-14 2019-03-01 广东美的制冷设备有限公司 基于场景的空调设备语音控制方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1645363A (zh) * 2005-01-04 2005-07-27 华南理工大学 便携式即时方言互译装置及其方法
CN101269638A (zh) * 2008-04-10 2008-09-24 清华大学 基于命令词表的汽车电器语音控制方法
CN106847276A (zh) * 2015-12-30 2017-06-13 昶洧新能源汽车发展有限公司 一种带方言识别的话音控制系统
KR101836430B1 (ko) * 2017-08-07 2018-03-08 고현선 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버
CN107657950A (zh) * 2017-08-22 2018-02-02 广州小鹏汽车科技有限公司 基于云端和多命令词的汽车语音控制方法、系统及装置
CN108172223A (zh) * 2017-12-14 2018-06-15 深圳市欧瑞博科技有限公司 语音指令识别方法、装置及服务器和计算机可读存储介质
CN109410936A (zh) * 2018-11-14 2019-03-01 广东美的制冷设备有限公司 基于场景的空调设备语音控制方法和装置
CN109360563A (zh) * 2018-12-10 2019-02-19 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及空调

Also Published As

Publication number Publication date
CN109979455A (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
US11854527B2 (en) Electronic device and method of controlling speech recognition by electronic device
TW586056B (en) Robot control device, robot control method, and recording medium
Kandali et al. Emotion recognition from Assamese speeches using MFCC features and GMM classifier
RU2653283C2 (ru) Способ диалога между машиной, такой как гуманоидный робот, и собеседником-человеком, компьютерный программный продукт и гуманоидный робот для осуществления такого способа
CN107972028B (zh) 人机交互方法、装置及电子设备
CN112837401B (zh) 一种信息处理方法、装置、计算机设备及存储介质
Michael Automated Speech Recognition in language learning: Potential models, benefits and impact
CN109036395A (zh) 个性化的音箱控制方法、系统、智能音箱及存储介质
CN101357269A (zh) 一种智能玩具及其使用方法
US7222076B2 (en) Speech output apparatus
WO2022057759A1 (zh) 一种语音转换的方法及相关设备
Catania et al. CORK: A COnversational agent framewoRK exploiting both rational and emotional intelligence
CN110379421A (zh) 一种方言语音ai控制方法、装置及终端
KR20020060975A (ko) 특정의 인간 음성을 템플릿하기 위한 시스템 및 방법
CN1494053A (zh) 说话人标准化方法及用该方法的语音识别装置
CN112965603A (zh) 一种人机交互的实现方法和系统
CN117219046A (zh) 一种交互语音情感控制方法及系统
Kuljic et al. Mobile robot controlled by voice
CN112242134A (zh) 语音合成方法及装置
US12112740B2 (en) Creative work systems and methods thereof
Cavalcante et al. Proof-of-concept evaluation of the mobile and personal speech assistant for the recognition of disordered speech
JP2001188788A (ja) 会話処理装置および方法、並びに記録媒体
JP2009500679A (ja) コミュニケーション方法及びコミュニケーション装置
CN115132204B (zh) 一种语音处理方法、设备、存储介质及计算机程序产品
Liu Fundamental frequency modelling: An articulatory perspective with target approximation and deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191025

RJ01 Rejection of invention patent application after publication