CN115440225B

CN115440225B - 一种智能语音处理方法及系统

Info

Publication number: CN115440225B
Application number: CN202211311084.1A
Authority: CN
Inventors: 陈鹏福; 胡天宝; 覃伟
Original assignee: Imitation Brain Technology Shenzhen Co ltd
Current assignee: Imitation Brain Technology Shenzhen Co ltd
Priority date: 2022-10-25
Filing date: 2022-10-25
Publication date: 2023-01-24
Anticipated expiration: 2042-10-25
Also published as: CN115440225A

Abstract

本发明涉及一种智能语音处理方法及系统，通过对语音处理转换成文本字符串，将文本字符串中字符进行遍历组合，确定词组位置和属性编码以及单字符位置和属性编码；利用文本字符串中不同属性的词组和单字符的位置关系及其关联性确定句型特征结构，并根据句型特征结构将词组和单字符的属性编码代入预设句型运算公式进行运算，运算使设备可以对上下文或前后字词的语义属性进行逻辑关联，通过字符属性、词组属性、句型特征以及语序的不同可以使设备在不同场景获得更精准的语义理解和响应结果，提高了人与设备之间的信息交互质量。

Description

一种智能语音处理方法及系统

技术领域

本发明涉及智能语音处理技术领域，更具体地说，涉及一种智能语音处理方法及系统。

背景技术

随着人工智能技术的发展，智能语音技术正逐步应用于各个领域，人们只需通过语音指令即可实现人与物之间的信息交互，解放双手的同时，也推动智能语音设备无接触控制的进步。目前，虽语音识别技术日趋成熟，但由于传统语音识别技术大多依靠语音信号处理、发音数据库比对或语音模型等技术来实现语音对应文字内容的识别或通过声学模型训练算法来实现对语音识别的处理,大多数现有语音识别技术在没有足够数据支持的情况下，设备很难根据上下文或前后字词进行自主语义联系理解，无法真正理解用户的真正意图，用户时常因口头说错或误说一句话导致设备语音识别错误或做出错误的响应，容易出现唤醒效果差、误报率高、语音识别不准确等问题，用户只能选择重新说一遍语音指令或反复进行语音唤醒，极大影响用户体验；而传统语音识别技术因大多依靠定势语音数据或被训练过的声学数据，在缺乏足够数据支持下，设备难以根据不同场景进行准确的场景语义理解，无法自主进行语言分析、语序分辨及文字词语属性理解，影响了设备智能化响应，且传统语义解析的门槛高，需要投入大量人力物力。那么，能否研发一种能更准确理解用户的逻辑意图、适应不同场景进行自主语义理解、智能化提高人机交互质量的语音处理方法,这也成为智能技术领域急需解决的问题。

发明内容

本发明要解决的技术问题在于，针对现有技术的上述缺陷，提供一种智能语音处理方法及系统。

本发明解决其技术问题所采用的技术方案是：

一种智能语音处理方法，包括如下步骤：

获取目标语音信号，对所述目标语音信号识别处理并转换为文本字符串；

将所述文本字符串以字符为单位转换为字符识别编码，所述字符识别编码包含字首编码、字身编码、部首编码和字型结构编码；

通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合，得到组合编码；在预设字典数据库中搜索并校验所述组合编码是否为词组编码，若校验结果为词组编码，则通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码，缓存所述词组属性编码并在所述文本字符串中对应位置做词组位置标记，若校验结果为非词组编码，则释放所述组合编码，提取当前文本字符的所述部首编码和所述字型结构编码，通过所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得单字符属性编码，缓存所述单字符属性编码并在所述文本字符串中对应位置做单字符位置标记；

根据所述词组位置提取所述词组属性编码特征以及所述单字符位置提取所述单字符属性编码特征在预设句型数据库中匹配确定句型特征结构；

利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式；

根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运算获得运算结果参数；

在所述预设句型数据库中匹配所述句型特征结构获得对应的响应结果转换规则，将所述运算结果参数根据所述响应结果转换规则转换为响应结果，对设备执行并输出所述响应结果，所述响应结果转换规则包括实现对所述设备识别和控制的响应编码。

进一步地，还包括如下步骤：所述句型特征结构区分有主语特征和谓语特征，所述词组属性编码和所述单字符属性编码可根据所述主语特征和所述谓语特征与上下文所述句型特征结构的所述主语特征和所述谓语特征进行二次组合，利用所述二次组合结果在所述预设句型数据库中匹配确定所述句型特征结构，利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式并进行运算，获得所述运算结果参数。

进一步地，所述句型特征结构包括单句结构和复句结构，所述单句结构包括主谓句结构、非主谓句结构和特殊单句结构，所述复句结构包括并列复句结构、承接复句结构、递进复句结构和选择复句结构；所述句型运算公式为可对编码进行运算的函数式程序。

进一步地，所述通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合步骤，具体组合步骤包括：所述文本字符串中包含若干字符，取若干字符每个字符的所述字首编码加所述文本字符串中末尾字符的所述字身编码进行遍历组合。

进一步地，所述通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码步骤具体包括：若所述词组编码在所述预设字典数据库中匹配获得多个词组属性编码，则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述词组属性编码；若所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得多个单字符属性编码，则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述单字符属性编码。

进一步地，还包括如下步骤：预先将所述设备的控制指令转换为具有属性的所述响应编码，所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码，实现对所述设备的识别和控制。

进一步地，所述字符识别编码可为基于仓颉码编码策略生成的识别编码。

本实施例还公开了一种智能语音处理系统，包括：

语音信号文本转换模块：用于获取目标语音信号，对所述目标语音信号识别处理并转换为文本字符串；

字符识别编码模块：用于将所述语音信号文本转换模块转换的所述文本字符串以字符为单位转换为字符识别编码，所述字符识别编码包含字首编码、字身编码、部首编码和字型结构编码；

预设字典数据库：用于存储预设词组及其属性编码、关联部首编码和字型结构编码组合的单字符及其属性编码；

编码组合定位模块：用于对所述文本字符串中相邻字符基于所述字符识别编码模块转换的所述字首编码和/或所述字身编码进行逐一遍历组合，在所述预设字典数据库中校验相邻字符组合是否可为词组，并定位词组及单字符位置；

编码缓存模块：用于缓存所述编码组合定位模块校验得到的所述词组属性编码及词组位置标记和缓存所述单字符属性编码及单字符位置标记；

预设句型数据库：用于存储预设句型特征结构及其对应的句型运算公式、响应结果转换规则；

句型匹配运算模块：用于根据所述编码缓存模块的所述词组属性编码及词组位置和所述单字符属性编码及单字符位置在所述预设句型数据库中匹配确定句型特征结构，利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式，根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运算获得运算结果参数；

执行输出响应结果模块：用于将所述运算结果参数根据所述响应结果转换规则转换为响应结果，执行并输出所述响应结果。

进一步地，还包括，指令编码模块：用于预先将设备的控制指令转换为具有属性的响应编码，所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码，实现对所述设备的识别和控制。

进一步地，还包括，发送模块：用于所述指令编码模块向目标设备发送控制指令。

本发明的有益效果在于：通过对语音处理转换成文本字符串，将文本字符串中字符进行遍历组合，确定词组位置和属性编码以及单字符位置和属性编码；利用文本字符串中不同属性的词组和单字符的位置关系及其关联性确定句型特征结构，并根据句型特征结构将词组和单字符的属性编码代入预设句型运算公式进行运算，运算使设备可以对上下文或前后字词的语义属性进行逻辑关联，通过字符属性、词组属性、句型特征以及语序的不同可以使设备在不同场景获得更精准的语义理解和响应结果，提高了人与设备之间的信息交互质量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将结合附图及实施例对本发明作进一步说明，下面描述中的附图仅仅是本发明的部分实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获取其他附图：

图1是本发明实施例的一种智能语音处理方法的流程示意图；

图2是本发明实施例的一种智能语音处理系统的系统结构框图；

图3是本发明实施例的一种智能语音处理系统的属性编码分类结构参考图。

具体实施方式

为了使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明的部分实施例，而不是全部实施例。基于本发明的实施例，本领域普通技术人员在没有付出创造性劳动的前提下所获取的所有其他实施例，都属于本发明的保护范围。

如图1至2所示，一种智能语音处理方法，包括如下步骤：

获取目标语音信号，对所述目标语音信号进行音频识别处理并转换为文字文本字符串，创建语音信号识别函数，分配语音推送开发包并获取语音信号例如“老虎会咬人吗

”语音，创建音频文件，创建音频数阵缓冲区并缓存音频数据，利用音频配置开发包对音频数据进行识别转换，获得转换结果并输出文本字符串 “老虎会咬人吗

”，将所述文本字符串以字符为单位转换为字符识别编码，获得所述文本字符串 “老虎会咬人吗

”后，将所述文本字符串 “老虎会咬人吗

” 以字符为单位拆解为“老”、“虎”、“会”、“咬”、“人”、“吗”、“

”，根据拆解后的字符匹配预设字符识别编码数据分别获得对应的所述字符识别编码，如 “老”对应为C6808080、“虎”对应为E684AA80、“会”对应为BEF38280、“咬”对应为CB91D680、 “人”对应为9E80C090、“吗”对应为CA8CC80、“

”对应为8080A0BF，所述字符识别编码可以为自定义的字符识别编码，所述字符识别编码也可为基于仓颉码编码策略生成的识别编码。所述字符识别编码包含字首编码、字身编码、部首编码和字型结构编码, 所述字首编码、字身编码、部首编码和字型结构编码均通过所述预设字符识别编码数据编码记录，所述字首编码为字符的第一笔划编码，所述字身编码可为字符的末笔划编码，所述部首编码为定义的偏旁部首编码，所述字型结构编码为根据汉字14种结构定义的结构编码，如1、左右结构；2、上下结构；3、左中右结构；4、上中下结构；5、右上包孕结构；6、左上包孕结构；7、左下包孕结构；8、右下包孕结构；9、上三包孕结构；10、下三包孕结构；11、左三包孕结构；12、全包围结构；13、单体结构；14、特殊结构。转换参考示例为

通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合，得到组合编码，例如“老”和“虎”进行组合获得组合编码5A090000、“虎”和“会”进行组合，结果“虎会”无法获得组合编码，而又因“虎”在前已经和别人字符成功组合编码，则对“会”与后面字符“咬”进行组合，结果“会咬”同样无法获得组合编码，因此，“会”无法与相邻字符组合，则单独对“会”重新编码，获得编码0A000000，同样以此遍历对后面“咬”、“人”、 “吗”、“

”进行逐字相邻字符组合编码校验；在预设字典数据库中搜索并校验所述组合编码是否为词组编码，若校验结果为词组编码，则通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码，例如“老虎”的组合可以在所述预设字典数据库中匹配获得词组属性编码“5A090000”，缓存所述词组属性编码并在所述文本字符串中对应位置做词组位置标记，若校验结果为非词组编码，例如“虎会”的组合可以在所述预设字典数据库中无法匹配获得词组属性,则释放所述组合编码，提取当前文本字符的所述部首编码和所述字型结构编码，通过所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得单字符属性编码，“会”的所述单字符属性编码为“0A000000”，缓存所述单字符属性编码并在所述文本字符串中对应位置做单字符位置标记；组合参考示例为

根据所述词组位置提取所述词组属性编码特征以及所述单字符位置提取所述单字符属性编码特征在预设句型数据库中匹配确定句型特征结构，根据参考示例可以确定句型特征结构为主谓结构的问句，所述句型特征结构包括单句结构和复句结构，所述单句结构包括主谓句结构、非主谓句结构和特殊单句结构，所述复句结构包括并列复句结构、承接复句结构、递进复句结构和选择复句结构；所述句型运算公式为可对编码进行运算的函数式程序。

利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式，参考示意的句型运算公式为

CAN

；

根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运算获得运算结果参数，将主语老虎的所述词组属性编码“5A09”代入

，将咬的属性编码 “C002”代入

，进行运算为

；

在所述预设句型数据库中匹配所述句型特征结构获得对应的响应结果转换规则，将所述运算结果参数根据所述响应结果转换规则转换为响应结果，对设备执行并输出所述响应结果，所述响应结果转换规则包括实现对所述设备识别和控制的响应编码，将≠0这个运算结果参数根据所述响应结果转换规则转换为响应结果为“老虎会咬人的”，则输出结果。

还包括如下步骤：所述句型特征结构区分有主语特征和谓语特征，所述词组属性编码和所述单字符属性编码可根据所述主语特征和所述谓语特征与上下文所述句型特征结构的所述主语特征和所述谓语特征进行二次组合，利用所述二次组合结果在所述预设句型数据库中匹配确定所述句型特征结构，利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式并进行运算，获得所述运算结果参数。

所述通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合步骤，具体组合步骤包括：所述文本字符串中包含若干字符，取若干字符每个字符的所述字首编码加所述文本字符串中末尾字符的所述字身编码进行遍历组合。

所述通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码步骤具体包括：若所述词组编码在所述预设字典数据库中匹配获得多个词组属性编码，则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述词组属性编码；若所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得多个单字符属性编码，则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述单字符属性编码。

还包括如下步骤：预先将所述设备的控制指令转换为具有属性的所述响应编码，所述响应编码的属性编码方式参考附图3的属性编码分类结构参考图，根据属性编码分类结构参考图可对不同类型的控制指令实现排序和分类，所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码，实现对所述设备的识别和控制，有序的分类使所述设备匹配更快速更准确，具有属性的所述响应编码也使设备能理解语义更精准执行语音控制。

由于对语音进行了编码化处理，使句子拆分成多个带有属性的字符编码、组合编码和位置标记，这样可以方便通过不同部分进行上下文或前后字词的语义属性进行逻辑关联，使机器能否判断，上下文是否有属性联系和是否符合句型特征；而所述设备的控制指令被转换为具有属性的所述响应编码后，所述控制指令就具有分辨为是静态还是动态、是客观还是主观、是抽象还是具象等等层级的排序分类，这样的分类更有利于准确定位识别到设备和执行准确的控制指令，例如发出“我要听歌”和“我要开门”，被编码后的“听歌”和“开门”属于不同的属性分类，一个是“感知”，一个是“能力”，因此，让机器有了有序分类能更理解语义，而不因语言多说一句或误说而导致错误控制；还可以将设备的名称或属性进行预先属性识别编码存储，这样当语音信号转换为字符编码或组合编码，如果编码能直接匹对上所述设备的所述预先属性识别编码即可直接识别对应所述设备，而无需像传统语音识别设备需要识别语音中所带的词语是否为设备名称才能激活响应，可以提高人与设备之间的信息交互质量，也有利于快速精准匹配控制设备；

本实施例还公开了一种智能语音处理系统，包括：

还包括，指令编码模块：用于预先将设备的控制指令转换为具有属性的响应编码，所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码，实现对所述设备的识别和控制。

还包括，发送模块：用于所述指令编码模块向目标设备发送控制指令。

应当理解的是，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims

1.一种智能语音处理方法，其特征在于，包括如下步骤：

2.如权利要求1所述的一种智能语音处理方法，其特征在于，还包括如下步骤：所述句型特征结构区分有主语特征和谓语特征，所述词组属性编码和所述单字符属性编码可根据所述主语特征和所述谓语特征与上下文所述句型特征结构的所述主语特征和所述谓语特征进行二次组合，利用所述二次组合结果在所述预设句型数据库中匹配确定所述句型特征结构，利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式并进行运算，获得所述运算结果参数。

3.如权利要求1所述的一种智能语音处理方法，其特征在于，所述句型特征结构包括单句结构和复句结构，所述单句结构包括主谓句结构、非主谓句结构和特殊单句结构，所述复句结构包括并列复句结构、承接复句结构、递进复句结构和选择复句结构；所述句型运算公式为可对编码进行运算的函数式程序。

4.如权利要求1所述的一种智能语音处理方法，其特征在于，所述通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合步骤，具体组合步骤包括：所述文本字符串中包含若干字符，取若干字符每个字符的所述字首编码加所述文本字符串中末尾字符的所述字身编码进行遍历组合。

5.如权利要求2所述的一种智能语音处理方法，其特征在于，所述通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码步骤具体包括：若所述词组编码在所述预设字典数据库中匹配获得多个词组属性编码，则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述词组属性编码；若所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得多个单字符属性编码，则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述单字符属性编码。

6.如权利要求1所述的一种智能语音处理方法，其特征在于，还包括如下步骤：预先将所述设备的控制指令转换为具有属性的所述响应编码，执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码，实现对所述设备的识别和控制。

7.如权利要求1至6任意一项所述的一种智能语音处理方法，其特征在于，所述字符识别编码可为基于仓颉码编码策略生成的识别编码。

8.一种智能语音处理系统，其特征在于，包括：

9.如权利要求8所述的一种智能语音处理系统，其特征在于，还包括，指令编码模块：用于预先将设备的控制指令转换为具有属性的响应编码，所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码，实现对所述设备的识别和控制。

10.如权利要求9所述的一种智能语音处理系统，其特征在于，还包括，发送模块：用于所述指令编码模块向目标设备发送控制指令。