CN112562679B

CN112562679B - 一种离线语音交互方法、装置及介质

Info

Publication number: CN112562679B
Application number: CN202011355139.XA
Authority: CN
Inventors: 胡焱; 王睿; 牛鹏
Original assignee: Inspur Financial Information Technology Co Ltd
Current assignee: Inspur Financial Information Technology Co Ltd
Priority date: 2020-11-26
Filing date: 2020-11-26
Publication date: 2024-06-14
Anticipated expiration: 2040-11-26
Also published as: CN112562679A

Abstract

本发明公开了一种离线语音交互方法，包括：构建本地语法库，定义语法规则文件的框架语法，获取本地数据，根据本地数据创建语法规则，将语法规则进行分组、序列及封装，得到语法规则文件，将语法规则文件存入本地语法库；获取输入语音，从输入语音中剥离出有效语音；对有效语音进行语法识别，与本地语法库进行算法对比，获取识别信息，并输出识别信息。通过上述方式，本发明能够在没有网络的情况下就能实现语音交互服务。

Description

一种离线语音交互方法、装置及介质

技术领域

本发明涉及智能终端技术领域，特别是涉及一种离线语音交互方法、装置及介质。

背景技术

随着经济的发展与科技水平的提升，人们对于服务的体验越来越重视，这就促使各行各业开始在服务体验与服务质量上加大了投入，而语音识别与合成技术就是各领域中使用较为广泛的一种AI能力，但由于行业环境或基础硬件等原因，网络的使用可能会受到一定限制，网络的质量直接影响语音交互的服务，进而对服务体验产生影响。

发明内容

本发明主要解决的技术问题是提供一种离线语音交互方法、装置及介质，能够在没有网络的情况下就能实现语音交互服务。

为解决上述技术问题，本发明采用的一个技术方案是：提供一种离线语音交互方法，包括：

构建本地语法库，定义语法规则文件的框架语法，获取本地数据，根据本地数据创建语法规则，将语法规则进行分组、序列及封装，得到语法规则文件，将语法规则文件存入本地语法库；

获取输入语音，从输入语音中剥离出有效语音；

对有效语音进行语法识别，与本地语法库通过识别算法对比，获取识别信息，并输出识别信息。

进一步，所述本地数据中包含语义交互内容，创建语法规则时首先对语义交互内容进行去重处理，然后根据去重处理后的语义交互内容创建语法规则。

进一步，语法规则创建完成后，需对本地语法库中的语法规则进行查重，相同则不操作，不同则进行下一步操作。

进一步，所述识别算法设有设定阈值，通过识别算法得到匹配阈值，当匹配阈值小于设定阈值时不做处理，重新获取输入语音；当匹配阈值大于设定阈值时，通过接口形式输出识别信息。

进一步，所述本地语法库设有更新机制，通过外部接口获取更新语义交互内容，通过更新语义交互内容创新更新语法规则。

进一步，所述框架语法包括语法名称、编码格式和常用语法规则。

一种离线语音交互装置，包括：本地语法库、语音获取及识别模块、语义判断模块、信息输出模块和更新模块；

所述本地语法库提供语法规则；

所述语音获取及识别模块用于获取语音并从语音中剥离出有效语音；

所述语义判断模块用于将有效语音与本地语法库通过识别算法对比，得出识别信息；

所述信息输出模块用于输出识别信息；

所述更新模块用于更新本地语法库中的语法规则。

一种离线语音交互介质，用于储存为上述离线语音交互方法所用的计算机软件指令，其包含用于执行上述为离线语音交互方法所设计的程序。

本发明的有益效果是：本发明能够在没有网络的情况下提供语音交互服务，并且可以根据行业的不同对交互内容进行差异化定制。

附图说明

图1是本发明一种离线语音交互方法一较佳实施例的流程图；

图2是所示一种离线语音交互装置的结构图。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

请参阅图1，本发明实施例包括：

一种离线语音交互方法，为了适应不同的定制交互需求，做到数据实时更新，同时也能被语音识别技术所兼容，故而使用动态创建BNF语法文件的技术来对原始数据进行处理，进而为服务所用；

定义BNF文件中的框架语法，包括语法名称、编码格式、常用语法规则；

读取原始数据，对数据进行去重处理，创建语法规则，创建时保证语法规则的唯一性；

将语法规则进行序列与封装，得到语法规则数据；

按照BNF语法规范，将语法规则数据输出到本地语法库。

见图1，离线语音交互方法实现过程如下：

S1、启动该服务，同时初始化语音识别与合成的AI能力；

S2、读取本地存储中的语义交互内容，同时可做分组处理；

S3、通过BNF语法，对获取的语义进行二次处理；

S4、通过语音识别引擎在本地构建语法库；

S5、开始语音获取，通过硬件返回有效语音；

S6、通过语音识别的AI能力对获取的语音进行语法识别；

S7、与本地语法库进行算法对比，获取有效的识别信息，通过其中的匹配阈值进行判断，当小于阈值时不做逻辑处理，重新执行步骤S5；

S8、当匹配阈值大于设定阈值时，通过接口形式输出识别信息；

S9、外部其他服务可按需进行处理；

S10、可通过暴露的接口对语义交互内容进行更新，之后服务会停止当前流程，从步骤S2开始执行。

基于与前述实施例中实现方法同样的发明构思，见图2，本说明书实施例还提供一种离线语音交互装置，包括：本地语法库、语音获取及识别模块、语义判断模块、信息输出模块和更新模块；

所述本地语法库提供语法规则；

所述信息输出模块用于输出识别信息；

所述更新模块用于更新本地语法库中的语法规则。

基于与前述实施例中实现方法同样的发明构思，本说明书实施例还提供一种离线语音交互介质，用于储存为上述离线语音交互方法所用的计算机软件指令，其包含用于执行上述为离线语音交互方法所设计的程序。

本申请基于语音识别与合成技术，在没有网络的情况下就能进行语音交互的服务，并且可以根据行业的不同对交互内容进行差异化定制。主要应用在安卓智能终端设备上，安卓设备可进行软件集成，按规定接口进行服务调用。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种离线语音交互方法，其特征在于，包括：

获取输入语音，从输入语音中剥离出有效语音；

对有效语音进行语法识别，与本地语法库通过识别算法对比，获取识别信息，并输出识别信息；

离线语音交互方法实现过程如下：

S1、启动服务，同时初始化语音识别与合成的AI能力；

S2、读取本地存储中的语义交互内容，同时做分组处理；

S3、通过BNF语法，对获取的语义进行二次处理；

S4、通过语音识别引擎在本地构建语法库；

S5、开始语音获取，通过硬件返回有效语音；

S6、通过语音识别的AI能力对获取的语音进行语法识别；

S9、外部服务按需进行处理；

S10、通过暴露的接口对语义交互内容进行更新，之后服务会停止当前流程，从步骤S2开始执行。

2.根据权利要求1所述的一种离线语音交互方法，其特征在于：所述本地数据中包含语义交互内容，创建语法规则时首先对语义交互内容进行去重处理，然后根据去重处理后的语义交互内容创建语法规则。

3.根据权利要求2所述的一种离线语音交互方法，其特征在于：语法规则创建完成后，需对本地语法库中的语法规则进行查重，相同则不操作，不同则进行下一步操作。

4.根据权利要求1所述的一种离线语音交互方法，其特征在于：所述识别算法设有设定阈值，通过识别算法得到匹配阈值，当匹配阈值小于设定阈值时不做处理，重新获取输入语音；当匹配阈值大于设定阈值时，通过接口形式输出识别信息。

5.根据权利要求2所述的一种离线语音交互方法，其特征在于：所述本地语法库设有更新机制，通过外部接口获取更新语义交互内容，通过更新语义交互内容更新语法规则。

6.根据权利要求1所述的一种离线语音交互方法，其特征在于：所述框架语法包括语法名称、编码格式和常用语法规则。

7.一种离线语音交互装置，采用权利要求1所述的一种离线语音交互方法，其特征在于，离线语音交互装置包括：本地语法库、语音获取及识别模块、语义判断模块、信息输出模块和更新模块；

所述本地语法库提供语法规则；

所述信息输出模块用于输出识别信息；

所述更新模块用于更新本地语法库中的语法规则。

8.一种离线语音交互介质，其特征在于，用于储存为上述权利要求1-6中任一项所述离线语音交互方法所用的计算机软件指令，其包含用于执行为上述离线语音交互方法所设计的程序。