CN115249473A

CN115249473A - 使用自然的、智能语音进行ai交互的方法及装置

Info

Publication number: CN115249473A
Application number: CN202110447811.6A
Authority: CN
Inventors: 张博; 赵子意; 李文杰
Original assignee: Guangdong Guangdong Hong Kong Macao Dawan District Hard Science And Technology Innovation Research Institute
Current assignee: Guangdong Guangdong Hong Kong Macao Dawan District Hard Science And Technology Innovation Research Institute
Priority date: 2021-04-25
Filing date: 2021-04-25
Publication date: 2022-10-28

Abstract

本发明涉及规划领域，具体涉及一种使用自然的、智能语音进行AI交互的方法及装置。该方法及装置使用唤醒词与智能语音AI系统通话进行唤醒连接，其中唤醒词为祈使句的祈使词，且不是智能语音AI系统的通用名字，来实现一种更简介自然的和智能语音AI交互。

Description

使用自然的、智能语音进行AI交互的方法及装置

技术领域

本发明涉及AI交互领域，具体而言，涉及一种使用自然的、智能语音进行AI交互的方法及装置。

背景技术

当前智能语音AI系统的唤醒词通常是AI的名字。例如hi，siri、小e小e、天猫精灵、小爱同学等。具体为：Hi，siri，开灯。Hi，siri，关灯。Hi，siri，打电话。在智能语音AI系统中，整个和智能AI交互的体验是一种很累的感觉，在音箱、电视、手机等与人有距离的产品上，还能差强人意，但在智能耳机这种贴身的智能产品上，就会觉得很别扭，使得体验人的体验感较差，不能满足其体验上的预期效果。

发明内容

本发明实施例提供了一种使用自然的、智能语音进行AI交互的方法及装置，以至少解决现有AI交互唤醒率低的技术问题。

根据本发明的一实施例，提供了一种使用自然的、智能语音进行AI交互的方法，包括以下步骤：

使用唤醒词与智能语音AI系统通话进行唤醒连接，其中唤醒词为祈使句的祈使词，且不是智能语音AI系统的通用名字。

进一步地，唤醒词包括帮我或帮助我。

进一步地，唤醒词支持One-shot，一次性成功，唤醒词和命令在一句话中连续说出。

进一步地，智能语音AI系统为耳机设备，方法包括：

当耳机设备通过入耳检测模块检测到被佩戴，开启MIC监听模块；

MIC监听模块开启后，耳机设备会循环采集音频并保存到音频缓冲中，同时会循环检测是否有帮我或者帮助我的唤醒词；

如果检测到用户说到该唤醒词，将包括该唤醒词的命令消息发送给声纹检测模块，声纹检测模块开始做声纹比对，此时MIC监听模块还在保持持续录音并保存到音频缓冲中，MIC检测模块此时会检测佩戴者是否停止说话；

当检测到停止说话信号后，表示用户一条语音控制指令基本完备，MIC检测模块此时会把音频缓冲中的整句话发送给语音识别及语意理解模块，开始执行相应任务，并开启与用户的对话流程。

进一步地，方法结合入耳检测、one-shot、声纹、全双工技术进一步提高该耳机设备被唤醒的准确性和实用性。

根据本发明的另一实施例，提供了一种使用自然的、智能语音进行AI交互的装置，包括：

唤醒模块，用于使用唤醒词与智能语音AI系统通话进行唤醒连接，其中唤醒词为祈使句的祈使词，且不是智能语音AI系统的通用名字。

进一步地，智能语音AI系统为耳机设备，其中：

一种存储介质，存储介质存储有能够实现上述任意一项使用自然的、智能语音进行AI交互的方法的程序文件。

一种处理器，处理器用于运行程序，其中，程序运行时执行上述任意一项的使用自然的、智能语音进行AI交互的方法。

本发明实施例中的使用自然的、智能语音进行AI交互的方法及装置，使用唤醒词与智能语音AI系统通话进行唤醒连接，其中唤醒词为祈使句的祈使词，且不是智能语音AI系统的通用名字，来实现一种更简介自然的和智能语音AI交互。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明使用自然的、智能语音进行AI交互的方法的流程图；

图2为本发明使用自然的、智能语音进行AI交互的装置的模块图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明一实施例，提供了一种使用自然的、智能语音进行AI交互的方法，参见图1，包括以下步骤：

S101:使用唤醒词与智能语音AI系统通话进行唤醒连接，其中唤醒词为祈使句的祈使词，且不是智能语音AI系统的通用名字。

本发明实施例中的使用自然的、智能语音进行AI交互的方法，使用唤醒词与智能语音AI系统通话进行唤醒连接，其中唤醒词为祈使句的祈使词，且不是智能语音AI系统的通用名字，来实现一种更简介自然的和智能语音AI交互。

进一步地，唤醒词包括帮我或帮助我。

进一步地，智能语音AI系统为耳机设备，方法包括：

下面以具体实施例，对本发明的使用自然的、智能语音进行AI交互的方法进行详细说明：

本发明目的在于提出一种使用自然的、智能语音进行AI交互的方法，选择听起来自然但不经常会说到的词语作为唤醒词，例如祈使句的祈使词帮助我等。使用祈使句的祈使词作为唤醒词，而非名字。通常为帮助类、请求类。例如：帮助我、请帮我。帮助我通常在人说话的时候会说帮我而不是帮助我，这样在实际日常生活中，在语法层面就降低了误唤醒率。

本发明的技术方案中，除了原有的AI名唤醒智能助理的方式外，增加一个更加高性能的唤醒词“帮助我”，并支持One-shot，一次性成功，既唤醒词和命令在一句话中连续说出，如“帮助我开下灯”，来实现一种更简介自然的和智能语音AI交互。

在需要发出“帮助我”是命令中的一部分的短指令时，减少了对智能助理发出指令时的语音长度。另外通常在日常对话中会说成“帮我”而不是“帮助我”,故这个唤醒词又并没有增加日常生活场景中智能语音助理的误唤醒率。在智能耳机设备中结合入耳检测、one-shot、声纹、全双工技术，可以进一步提高本发明技术方案的准确性和实用性。

针对耳机产品，当耳机设备通过入耳检测模块检测到被佩戴，即开启MIC监听模块，MIC监听模块开启后，耳机设备会循环采集音频并保存到音频缓冲中，同时会循环检测是否为“帮助我”，如果检测到用户说到这个唤醒词，那么会将包括该唤醒词的命令消息发送给声纹检测模块，该声纹检测模块可能不在耳机设备上，而在耳机设备的充电仓上，声纹检测模块开始做声纹比对，此时MIC监听模块还在保持持续录音并保存到音频缓冲中，MIC检测模块此时会检测佩戴者是否停止说话，当检测到停止说话信号后，即表示用户一条语音控制指令基本完备，此时会把音频缓冲中的整句话发送给语音识别及语意理解模块，开始执行相应任务，并开启与用户的对话流程。

本发明的技术方案中，在和智能助理交流时，和已有产品方案、技术方案相比，通过“帮助我xxxx”来实现短指令下达，会让人觉得更轻松舒适，唤醒率更高，误唤醒率大大降低。本发明的技术方案已在智能耳机产品样机中完成原型实现。

实施例2

根据本发明的另一实施例，提供了一种使用自然的、智能语音进行AI交互的装置，参见图2，包括：

唤醒模块201，用于使用唤醒词与智能语音AI系统通话进行唤醒连接，其中唤醒词为祈使句的祈使词，且不是智能语音AI系统的通用名字。

本发明实施例中的使用自然的、智能语音进行AI交互的装置，使用唤醒词与智能语音AI系统通话进行唤醒连接，其中唤醒词为祈使句的祈使词，且不是智能语音AI系统的通用名字，来实现一种更简介自然的和智能语音AI交互。

进一步地，智能语音AI系统为耳机设备，其中：

下面以具体实施例，对本发明的使用自然的、智能语音进行AI交互的装置进行详细说明：

本发明目的在于提出一种使用自然的、智能语音进行AI交互的装置，选择听起来自然但不经常会说到的词语作为唤醒词，例如祈使句的祈使词帮助我等。使用祈使句的祈使词作为唤醒词，而非名字。通常为帮助类、请求类。例如：帮助我、请帮我。帮助我通常在人说话的时候会说帮我而不是帮助我，这样在实际日常生活中，在语法层面就降低了误唤醒率。

实施例3

实施例4

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的系统实施例仅仅是示意性的，例如单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种使用自然的、智能语音进行AI交互的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的使用自然的、智能语音进行AI交互的方法，其特征在于，所述唤醒词包括帮我或帮助我。

3.根据权利要求1所述的使用自然的、智能语音进行AI交互的方法，其特征在于，所述唤醒词支持One-shot，一次性成功，所述唤醒词和命令在一句话中连续说出。

4.根据权利要求1所述的使用自然的、智能语音进行AI交互的方法，其特征在于，所述智能语音AI系统为耳机设备，所述方法包括：

5.根据权利要求4所述的使用自然的、智能语音进行AI交互的方法，其特征在于，所述方法结合入耳检测、one-shot、声纹、全双工技术进一步提高该耳机设备被唤醒的准确性和实用性。

6.一种使用自然的、智能语音进行AI交互的装置，其特征在于，包括：

7.根据权利要求6所述的使用自然的、智能语音进行AI交互的装置，其特征在于，所述智能语音AI系统为耳机设备，其中：

8.一种存储介质，其特征在于，所述存储介质存储有能够实现权利要求1至6中任意一项所述使用自然的、智能语音进行AI交互的方法的程序文件。

9.一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至7中任意一项所述的使用自然的、智能语音进行AI交互的方法。