CN110379421A

CN110379421A - 一种方言语音ai控制方法、装置及终端

Info

Publication number: CN110379421A
Application number: CN201910625720.XA
Authority: CN
Inventors: 周超群; 王龙江; 王少峰
Original assignee: Shenzhen Shangke Decoration Technology Co Ltd
Current assignee: Shenzhen Shangke Decoration Technology Co Ltd
Priority date: 2019-04-03
Filing date: 2019-07-11
Publication date: 2019-10-25
Also published as: CN109979455A

Abstract

本发明涉及智能语音控制领域，一种方言语音AI控制方法、装置及终端。所述的方言语音AI控制方法包括：获取唤醒词和控制指令；根据控制指令进入到语言学习状态；通过多次获取的语音信息进行语言复制；将复制的语言信息进行分析并与主流语言互译；根据互译词条对智能产品进行控制。通过本发明所述的方法可以在无需联网的状态下实现方言的学习与对智能产品的控制。

Description

一种方言语音AI控制方法、装置及终端

技术领域

本发明涉及智能语音控制领域，具体涉及一种方言语音AI控制方法、装置及终端。

背景技术

AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

上述的语言识别能把语言和语声转换成可进行处理的信息的过程。目前世界上大约有6000~10000多种语言，方言大部分没有文字的语言，对这类语言进行完整记录比较困难。现有技术中有如下的缺陷：AI语音智能需要标准的普通话控制，普通话不标准则无法使用，容易定义为伪智能。对于一些语言识别的装置需要网络云端语音库大数据，不能掉网，否则无法使用。

为解决上述问题，本发明所述的一种方言语音AI控制方法、装置及终端，在无需联网的状态下实现方言的学习与对智能产品的控制。

发明内容

本发明解决的技术问题是，提供了一种方言语音AI控制方法、装置及终端。所述的一种方言语音AI控制方法、装置及终端在无需联网的状态下实现方言的学习与对智能产品的控制。

为了解决上述技术问题，本发明提供的技术方案为：

一种方言语音AI控制方法：

获取唤醒词和控制指令；

根据控制指令进入到语言学习状态；

通过多次获取的语音信息进行语言复制；

将复制的语言信息进行分析并与主流语言互译；

根据互译词条对智能产品进行控制。

优选地，所述的获取控制指令时，若规定时间内无正确指令输入，自动返回待唤醒状态。获取唤醒词后若未接收到控制指令，自动返回待唤醒状态。达到了节能的效果，同时实现智能化自动化。

优选地，所述的语言复制是通过智能语音技术对用户语言进行完整记录。语音技术是在计算机领域中的关键技术，有自动语音识别技术和语音合成技术，让计算机能听、能看、能说、能感觉。本发明所述的根据语音技术是系统通过麦克风获取语音后，将语音信息进行完整的记录。

优选地，所述的对用户语言进行记录后包括，对语音进行分析，具体为分析出语音结构、句法结构、连续语音的音变和连续变调。

优选地，所述的互译具体为根据语音分析结果、基本意义单位与主流语言的对应关系进行互译。对于基本意义单位以及分析结果进行互译的优点在于，互译的结果局不限于单个的句法表达，使得用户的控制指令在表述的过程中更具自由性，识别控制指令的识别效果也更好。

优选地，所述的互译完成后生成互译词条，互译词条用于与控制指令进行匹配，调用匹配的控制指令控制智能产品。互译词条是将语音与文本进行转换的过程，文本与控制指令进行匹配完成后，调用匹配的控制指令对智能产品进行控制。

优选地，所述的控制模式包含三种：卖场模式、家庭模式、厨房模式。所述的卖场模式获取复制语音信息后对稳态噪音以及动态噪音进行过滤。控制模式分为三种情况，考虑到了在不同环境下的，语音的获取的要求，对于卖场模式情况下，要求语音输入距离更近，同时对语音进行更复杂的噪声处理，包括：过滤掉绝大部分稳态噪音，比如电机、风机。过滤掉一些生活中的动态噪音，比如水声、关门声等。

此解决方案，满足在卖场环境下演示，过滤掉周围一些说话声、音乐声等使得获取的指令更精确。家庭模式下，考虑到较安静的情况下，获取的语音指令已经是较简单的噪声，从而进行简单的噪声处理，加快识别速度，同时要求的可控制范围更大。

一种方言语音AI控制装置：

指令获取模块：所述的指令获取模块用于获取唤醒词和控制指令；

选择模块：所述的选择模块用于根据控制指令进入到语言学习状态；

语言复制模块：所述的语言复制模块用于通过多次获取的语音信息进行语言复制；

互译模块：所述的互译模块用于将复制的语言信息进行分析并与主流语言互译；

控制模块：所述的控制模块用于根据互译词条对智能产品进行控制。

优选地，所述的指令获取模块用于获取唤醒词和控制指令；所述的唤醒词用于控制系统开启，控制词用于对系统进行控制指令的输入。

优选地，所述的选择模块用于根据控制指令进入到语言学习状态；进入该状态后可进行语言学习。

优选地，所述的语言复制模块用于通过多次获取的语音信息进行语言复制；所述的语言信息进行复制采用了智能语音技术实现语音的复制，对于语音的复制通常采用复制三次的情况。

优选地，所述的互译模块用于将复制的语言信息进行分析并与主流语言互译；所述的语音的分析过程为，所述的对用户语言进行记录后包括，对语音进行分析，具体为分析出语音结构、句法结构、连续语音的音变和连续变调。所述的互译具体为根据语音分析结果、基本意义单位与主流语言的对应关系进行互译。对于基本意义单位以及分析结果进行互译的优点在于，互译的结果局不限于单个的句法表达，使得用户的控制指令在表述的过程中更具自由性，识别控制指令的识别效果也更好。

优选地，所述的控制模块用于根据互译词条对智能产品进行控制。所述的互译词条是一种互译后生成的文本，通过该文本与控制指令的匹配，从而进行智能产品的控制。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序指令，该程序指令适于由处理器加载并执行上述方言语音AI控制方法。

本发明还提供一种移动终端，其包括处理器以及存储器，所述的处理器用于执行存储器中存储的程序，以实现上述方言语音AI控制方法。

与现有技术相比，本发明具有的有益效果为：本发明所述的一种方言语音AI控制方法无需联网的状态下实现方言的学习与对智能产品的控制。具体的，通过语言的复制、分析与主流语言的互译，实现语音方言学习，方言的学习无需网络即可实现方言控制电器及灯光。同时不需要预先录入语言，本地学习地方方言，即可操作控制。方言的控制解决不会说普通话的人使用，比方说当地老人及小孩。本申请所述的控制方法无需网络，无需APP，无需任何的终端及平台辅助工具，产品本地即可操作。同时产品模块化，减低对接任意产品AI语音开发生产成本。不需要网络做为平台，适用于单机运作。即学即用，无需等待，把智能做到人性化。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明所述的一种方言语音AI控制方法的流程示意图；

图2是本发明所述的一种方言语音AI控制装置的结构图。

具体实施方式

现在结合附图对本发明作进一步详细的说明。这些附图均为简化的示意图，仅以示意方式说明本发明的基本流程图，因此其仅显示与本发明有关的流程。

实施例1

如图1所示，本发明是一种方言语音AI控制方法，所述的方法具体为：

S1.获取唤醒词和控制指令；

S2.根据控制指令进入到语言学习状态；

S3.通过多次获取的语音信息进行语言复制；

S4.将复制的语言信息进行分析并与主流语言互译；

S5.根据互译词条对智能产品进行控制。

步骤S1.获取唤醒词和控制指令，所述的控制语言大脑的指令共有三种：

第一种：唤醒词和控制指令，此方式称作One Shot，智能音响上通常都是此方式，可是语音控制的最方便的方式，例如：小可和把灯打开。

第二种：单独说控控制指令，例如：把灯关了，在系统唤醒后，可以只说控制住指令。

第三种：单独说唤醒指令，例如：小可小可，唤醒系统，一般作为唤醒方式。

步骤S2：根据控制指令进入到语言学习状态；进入语言学习状态后，包括如下的几点要求：

在方言学习时，周围环境保持安静状态；嘴巴离麦克风距离在1米左右最佳；获取的语速需要放慢，比正常语速稍微慢；说话发音清晰饱满；学习训练时，如果播放“学习的指令不规范，请重说第x遍xx的学习指令”时，表示录音训练质量不够好或者说话的内容少于三个字,训练的说话内容必须三个字以上或者三个字；学习训练结束后，如果识别效果不佳，需删除后，再重新学习训练一遍。

步骤S3：通过多次获取的语音信息进行语言复制；

步骤S4：将复制的语言信息进行分析并与主流语言互译；

所述的语音分的分析为：优选地，所述的对用户语言进行记录后包括，对语音进行分析，具体为分析出语音结构、句法结构、连续语音的音变和连续变调。所述的语音结构包括：音节语言的声母、韵母、声调等。

所述的互译具体为根据语音分析结果、基本意义单位与主流语言的对应关系进行互译。此方法的优点在于，对于基本意义单位以及分析结果进行互译的优点在于，互译的结果局不限于单个的句法表达，使得用户的控制指令在表述的过程中更具自由性，识别控制指令的识别效果也更好。

例如：用户发出小可关闭全部灯光/小可关掉全部灯光/小可灯光全部关掉/小可灯光全部关了/小可把灯光全部关掉/小可把灯光全部关了/小可灯光全关/小可灯全关了/小可灯全关啦/小可把灯全关了/小可灯全关掉/小可把灯全关掉/小可灯全部关了/小可把灯全部关了/小可灯全部关掉/小可把灯全部关掉/小可灯都关了/小可灯都关掉/小可把灯都关了/小可把灯都关掉关闭全部灯光/关掉全部灯光/灯光全部关掉/灯光全部关了/把灯光全部关掉/把灯光全部关了/灯光全关/灯全关了/灯全关啦/把灯全关了/灯全关掉/把灯全关掉/灯全部关了/把灯全部关了/灯全部关掉/把灯全部关掉/灯都关了/灯都关掉/把灯都关了/把灯都关掉，以上所有的表达方式都可识别为关闭全部灯光的指令。

步骤S5：根据互译词条对智能产品进行控制。

所述的互译完成后生成互译词条，互译词条用于与控制指令进行匹配，调用匹配的控制指令控制智能产品。互译词条是将语音与文本进行转换的过程，文本与控制指令进行匹配完成后，调用匹配的控制指令对智能产品进行控制。

实施例2

退出学习的过程为：

如果系统播放“请说第x遍xxx的学习指令”，用户没有说话，30秒后，系统会播放“学习超时，系统重启生效中”，系统会自动退出学习模式。已学习成功的方言指令都会保留，仍然可以方言识别。

实施例3

系统装置技术参数：

系统装置采用5V USB口供电，插好麦克风和喇叭，上电后，8秒左右，喇叭播放“xxx准备就绪”。

控制模式包含三种：卖场模式、家庭模式、厨房模式。所述的卖场模式获取复制语音信息后对稳态噪音以及动态噪音进行过滤语音。控制模式设置为家庭模式时，环境噪音不超过60分贝，识别距离不超过5米，说话声音高于周围的噪音，均可有效识别，用户需正对麦克风，不可低头朝向其它方向。

控制模式设置为卖场模式时，识别距离不超过1米，说话的声音高于周围的噪音，均可有效识别。嘴巴最好正对麦克风，不可低头或者朝向其它方向。

如图2所示，本发明提供了一种方言语音AI控制装置：

指令获取模块1：所述的指令获取模块用于获取唤醒词和控制指令；

选择模块2：所述的选择模块用于根据控制指令进入到语言学习状态；

语言复制模块3：所述的语言复制模块用于通过多次获取的语音信息进行语言复制；

互译模块4：所述的互译模块用于将复制的语言信息进行分析并与主流语言互译；

控制模块5：所述的控制模块用于根据互译词条对智能产品进行控制。

所述的指令获取模块1：用于获取唤醒词和控制指令；所述的唤醒词用于控制系统开启，控制词用于对系统进行控制指令的输入。

所述的选择模块2：用于根据控制指令进入到语言学习状态；进入该状态后可进行语言学习。

所述的语言复制模块3：用于通过多次获取的语音信息进行语言复制；所述的语言信息进行复制采用了智能语音技术实现语音的复制，对于语音的复制通常采用复制三次的情况。

所述的互译模块4：用于将复制的语言信息进行分析并与主流语言互译；所述的语音的分析过程为，所述的对用户语言进行记录后包括，对语音进行分析，具体为分析出语音结构、句法结构、连续语音的音变和连续变调。所述的互译具体为根据分析结果、基本意义单位与主流语言的对应关系以及语言的任意文本或语音和主流语言之间进行互译。对于基本意义单位以及分析结果进行互译的优点在于，互译的结果局不限于单个的句法表达，使得用户的控制指令在表述的过程中更具自由性，识别控制指令的识别效果也更好。

所述的控制模块5：用于根据互译词条对智能产品进行控制。所述的互译词条是一种互译后生成的语言文本，通过该文本与控制指令的匹配，从而进行智能产品的控制。

上列详细说明是针对本发明可行实施例的具体说明，以上实施例并非用以限制本发明的专利范围，凡未脱离本发明所为的等效实施或变更，均应包含于本案的专利范围中。

Claims

1.一种方言语音AI控制方法，其特征在于，包括：

获取唤醒词和控制指令；

根据控制指令进入到语言学习状态；

通过多次获取的语音信息进行语言复制；

将复制的语言信息进行分析并与主流语言互译；

根据互译词条对智能产品进行控制。

2.根据权利要求1所述的一种方言语音AI控制方法，其特征在于，所述的获取控制指令时，若规定时间内无正确指令输入，自动返回待唤醒状态。

3.根据权利要求1所述的一种方言语音AI控制方法，其特征在于，所述的语言复制是通过智能语音技术对用户语音进行完整记录。

4.根据权利要求3所述的一种方言语音AI控制方法，其特征在于，所述的对用户语音进行记录后包括，对语音进行分析，具体为分析出语音结构、句法结构、连续语音的音变和连续变调，生成语音分析结果。

5.根据权利要求1所述的一种方言语音AI控制方法，其特征在于，所述的互译具体为根据语音分析结果、基本意义单位与主流语言的对应关系进行互译。

6.根据权利要求5所述的一种方言语音AI控制方法，其特征在于，所述的互译完成后生成互译词条，互译词条用于与控制指令进行匹配，调用匹配的控制指令控制智能产品。

7.根据权利要求1所述的一种方言语音AI控制方法，其特征在于，所述的控制模式包含三种：卖场模式、家庭模式、厨房模式；

所述的卖场模式获取复制语音信息后包括对稳态噪音以及动态噪音进行过滤。

8.一种方言语音AI控制装置，包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序指令，该程序指令适于由处理器加载并执行权利要求1~8任一项所述的方法。

10.一种移动终端，其特征在于，包括处理器以及存储器，所述的处理器用于执行存储器中存储的程序，以实现权利要求1~8任一项所述的方法。