CN115440225B - 一种智能语音处理方法及系统 - Google Patents

一种智能语音处理方法及系统 Download PDF

Info

Publication number
CN115440225B
CN115440225B CN202211311084.1A CN202211311084A CN115440225B CN 115440225 B CN115440225 B CN 115440225B CN 202211311084 A CN202211311084 A CN 202211311084A CN 115440225 B CN115440225 B CN 115440225B
Authority
CN
China
Prior art keywords
code
codes
sentence pattern
attribute
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211311084.1A
Other languages
English (en)
Other versions
CN115440225A (zh
Inventor
陈鹏福
胡天宝
覃伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Imitation Brain Technology Shenzhen Co ltd
Original Assignee
Imitation Brain Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Imitation Brain Technology Shenzhen Co ltd filed Critical Imitation Brain Technology Shenzhen Co ltd
Priority to CN202211311084.1A priority Critical patent/CN115440225B/zh
Publication of CN115440225A publication Critical patent/CN115440225A/zh
Application granted granted Critical
Publication of CN115440225B publication Critical patent/CN115440225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • G06F40/157Transformation using dictionaries or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种智能语音处理方法及系统,通过对语音处理转换成文本字符串,将文本字符串中字符进行遍历组合,确定词组位置和属性编码以及单字符位置和属性编码;利用文本字符串中不同属性的词组和单字符的位置关系及其关联性确定句型特征结构,并根据句型特征结构将词组和单字符的属性编码代入预设句型运算公式进行运算,运算使设备可以对上下文或前后字词的语义属性进行逻辑关联,通过字符属性、词组属性、句型特征以及语序的不同可以使设备在不同场景获得更精准的语义理解和响应结果,提高了人与设备之间的信息交互质量。

Description

一种智能语音处理方法及系统
技术领域
本发明涉及智能语音处理技术领域,更具体地说,涉及一种智能语音处理方法及系统。
背景技术
随着人工智能技术的发展,智能语音技术正逐步应用于各个领域,人们只需通过语音指令即可实现人与物之间的信息交互,解放双手的同时,也推动智能语音设备无接触控制的进步。目前,虽语音识别技术日趋成熟,但由于传统语音识别技术大多依靠语音信号处理、发音数据库比对或语音模型等技术来实现语音对应文字内容的识别或通过声学模型训练算法来实现对语音识别的处理,大多数现有语音识别技术在没有足够数据支持的情况下,设备很难根据上下文或前后字词进行自主语义联系理解,无法真正理解用户的真正意图,用户时常因口头说错或误说一句话导致设备语音识别错误或做出错误的响应,容易出现唤醒效果差、误报率高、语音识别不准确等问题,用户只能选择重新说一遍语音指令或反复进行语音唤醒,极大影响用户体验;而传统语音识别技术因大多依靠定势语音数据或被训练过的声学数据,在缺乏足够数据支持下,设备难以根据不同场景进行准确的场景语义理解,无法自主进行语言分析、语序分辨及文字词语属性理解,影响了设备智能化响应,且传统语义解析的门槛高,需要投入大量人力物力。那么,能否研发一种能更准确理解用户的逻辑意图、适应不同场景进行自主语义理解、智能化提高人机交互质量的语音处理方法,这也成为智能技术领域急需解决的问题。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种智能语音处理方法及系统。
本发明解决其技术问题所采用的技术方案是:
一种智能语音处理方法,包括如下步骤:
获取目标语音信号,对所述目标语音信号识别处理并转换为文本字符串;
将所述文本字符串以字符为单位转换为字符识别编码,所述字符识别编码包含字首编码、字身编码、部首编码和字型结构编码;
通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合,得到组合编码;在预设字典数据库中搜索并校验所述组合编码是否为词组编码,若校验结果为词组编码,则通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码,缓存所述词组属性编码并在所述文本字符串中对应位置做词组位置标记,若校验结果为非词组编码,则释放所述组合编码,提取当前文本字符的所述部首编码和所述字型结构编码,通过所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得单字符属性编码,缓存所述单字符属性编码并在所述文本字符串中对应位置做单字符位置标记;
根据所述词组位置提取所述词组属性编码特征以及所述单字符位置提取所述单字符属性编码特征在预设句型数据库中匹配确定句型特征结构;
利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式;
根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运算获得运算结果参数;
在所述预设句型数据库中匹配所述句型特征结构获得对应的响应结果转换规则,将所述运算结果参数根据所述响应结果转换规则转换为响应结果,对设备执行并输出所述响应结果,所述响应结果转换规则包括实现对所述设备识别和控制的响应编码。
进一步地,还包括如下步骤:所述句型特征结构区分有主语特征和谓语特征,所述词组属性编码和所述单字符属性编码可根据所述主语特征和所述谓语特征与上下文所述句型特征结构的所述主语特征和所述谓语特征进行二次组合,利用所述二次组合结果在所述预设句型数据库中匹配确定所述句型特征结构,利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式并进行运算,获得所述运算结果参数。
进一步地,所述句型特征结构包括单句结构和复句结构,所述单句结构包括主谓句结构、非主谓句结构和特殊单句结构,所述复句结构包括并列复句结构、承接复句结构、递进复句结构和选择复句结构;所述句型运算公式为可对编码进行运算的函数式程序。
进一步地,所述通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合步骤,具体组合步骤包括:所述文本字符串中包含若干字符,取若干字符每个字符的所述字首编码加所述文本字符串中末尾字符的所述字身编码进行遍历组合。
进一步地,所述通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码步骤具体包括:若所述词组编码在所述预设字典数据库中匹配获得多个词组属性编码,则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述词组属性编码;若所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得多个单字符属性编码,则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述单字符属性编码。
进一步地,还包括如下步骤:预先将所述设备的控制指令转换为具有属性的所述响应编码,所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码,实现对所述设备的识别和控制。
进一步地,所述字符识别编码可为基于仓颉码编码策略生成的识别编码。
本实施例还公开了一种智能语音处理系统,包括:
语音信号文本转换模块:用于获取目标语音信号,对所述目标语音信号识别处理并转换为文本字符串;
字符识别编码模块:用于将所述语音信号文本转换模块转换的所述文本字符串以字符为单位转换为字符识别编码,所述字符识别编码包含字首编码、字身编码、部首编码和字型结构编码;
预设字典数据库:用于存储预设词组及其属性编码、关联部首编码和字型结构编码组合的单字符及其属性编码;
编码组合定位模块:用于对所述文本字符串中相邻字符基于所述字符识别编码模块转换的所述字首编码和/或所述字身编码进行逐一遍历组合,在所述预设字典数据库中校验相邻字符组合是否可为词组,并定位词组及单字符位置;
编码缓存模块:用于缓存所述编码组合定位模块校验得到的所述词组属性编码及词组位置标记和缓存所述单字符属性编码及单字符位置标记;
预设句型数据库:用于存储预设句型特征结构及其对应的句型运算公式、响应结果转换规则;
句型匹配运算模块:用于根据所述编码缓存模块的所述词组属性编码及词组位置和所述单字符属性编码及单字符位置在所述预设句型数据库中匹配确定句型特征结构,利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式,根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运算获得运算结果参数;
执行输出响应结果模块:用于将所述运算结果参数根据所述响应结果转换规则转换为响应结果,执行并输出所述响应结果。
进一步地,还包括,指令编码模块:用于预先将设备的控制指令转换为具有属性的响应编码,所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码,实现对所述设备的识别和控制。
进一步地,还包括,发送模块:用于所述指令编码模块向目标设备发送控制指令。
本发明的有益效果在于:通过对语音处理转换成文本字符串,将文本字符串中字符进行遍历组合,确定词组位置和属性编码以及单字符位置和属性编码;利用文本字符串中不同属性的词组和单字符的位置关系及其关联性确定句型特征结构,并根据句型特征结构将词组和单字符的属性编码代入预设句型运算公式进行运算,运算使设备可以对上下文或前后字词的语义属性进行逻辑关联,通过字符属性、词组属性、句型特征以及语序的不同可以使设备在不同场景获得更精准的语义理解和响应结果,提高了人与设备之间的信息交互质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图及实施例对本发明作进一步说明,下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他附图:
图1是本发明实施例的一种智能语音处理方法的流程示意图;
图2是本发明实施例的一种智能语音处理系统的系统结构框图;
图3是本发明实施例的一种智能语音处理系统的属性编码分类结构参考图。
具体实施方式
为了使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有付出创造性劳动的前提下所获取的所有其他实施例,都属于本发明的保护范围。
如图1至2所示,一种智能语音处理方法,包括如下步骤:
获取目标语音信号,对所述目标语音信号进行音频识别处理并转换为文字文本字 符串,创建语音信号识别函数,分配语音推送开发包并获取语音信号例如“老虎会咬人吗
Figure DEST_PATH_IMAGE001
”语音,创建音频文件,创建音频数阵缓冲区并缓存音频数据,利用音频配置开发包对音频 数据进行识别转换,获得转换结果并输出文本字符串 “老虎会咬人吗
Figure 184842DEST_PATH_IMAGE001
”,将所述文本字符 串以字符为单位转换为字符识别编码,获得所述文本字符串 “老虎会咬人吗
Figure 322562DEST_PATH_IMAGE001
”后,将所述 文本字符串 “老虎会咬人吗
Figure 237297DEST_PATH_IMAGE001
” 以字符为单位拆解为“老”、“虎”、“会”、“咬”、“人”、“吗”、“
Figure 726047DEST_PATH_IMAGE001
”,根据拆解后的字符匹配预设字符识别编码数据分别获得对应的所述字符识别编码,如 “老”对应为C6808080、“虎”对应为E684AA80、“会”对应为BEF38280、“咬”对应为CB91D680、 “人”对应为9E80C090、“吗”对应为CA8CC80、“
Figure 931901DEST_PATH_IMAGE001
”对应为8080A0BF,所述字符识别编码可以 为自定义的字符识别编码,所述字符识别编码也可为基于仓颉码编码策略生成的识别编 码。所述字符识别编码包含字首编码、字身编码、部首编码和字型结构编码, 所述字首编 码、字身编码、部首编码和字型结构编码均通过所述预设字符识别编码数据编码记录,所述 字首编码为字符的第一笔划编码,所述字身编码可为字符的末笔划编码,所述部首编码为 定义的偏旁部首编码,所述字型结构编码为根据汉字14种结构定义的结构编码,如1、左右 结构;2、上下结构;3、左中右结构;4、上中下结构;5、右上包孕结构;6、左上包孕结构;7、左 下包孕结构;8、右下包孕结构;9、上三包孕结构;10、下三包孕结构;11、左三包孕结构;12、 全包围结构;13、单体结构;14、特殊结构。转换参考示例为
Figure 376657DEST_PATH_IMAGE002
通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一 遍历组合,得到组合编码,例如“老”和“虎”进行组合获得组合编码5A090000、“虎”和“会”进 行组合,结果“虎会”无法获得组合编码,而又因“虎”在前已经和别人字符成功组合编码,则 对“会”与后面字符“咬”进行组合,结果“会咬”同样无法获得组合编码,因此,“会”无法与相 邻字符组合,则单独对“会”重新编码,获得编码0A000000,同样以此遍历对后面“咬”、“人”、 “吗”、“
Figure 540923DEST_PATH_IMAGE003
”进行逐字相邻字符组合编码校验;在预设字典数据库中搜索并校验所述组合编 码是否为词组编码,若校验结果为词组编码,则通过所述词组编码在所述预设字典数据库 中匹配获得词组属性编码,例如“老虎”的组合可以在所述预设字典数据库中匹配获得词组 属性编码“5A090000”,缓存所述词组属性编码并在所述文本字符串中对应位置做词组位置 标记,若校验结果为非词组编码,例如“虎会”的组合可以在所述预设字典数据库中无法匹 配获得词组属性,则释放所述组合编码,提取当前文本字符的所述部首编码和所述字型结 构编码,通过所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得 单字符属性编码,“会”的所述单字符属性编码为“0A000000”,缓存所述单字符属性编码并 在所述文本字符串中对应位置做单字符位置标记;组合参考示例为
Figure 251390DEST_PATH_IMAGE004
根据所述词组位置提取所述词组属性编码特征以及所述单字符位置提取所述单字符属性编码特征在预设句型数据库中匹配确定句型特征结构,根据参考示例可以确定句型特征结构为主谓结构的问句,所述句型特征结构包括单句结构和复句结构,所述单句结构包括主谓句结构、非主谓句结构和特殊单句结构,所述复句结构包括并列复句结构、承接复句结构、递进复句结构和选择复句结构;所述句型运算公式为可对编码进行运算的函数式程序。
利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式, 参考示意的句型运算公式为
Figure 447885DEST_PATH_IMAGE005
CAN
Figure 560197DEST_PATH_IMAGE006
根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运 算获得运算结果参数,将主语老虎的所述词组属性编码“5A09”代入
Figure 629784DEST_PATH_IMAGE005
,将咬的属性编码 “C002”代入
Figure 291796DEST_PATH_IMAGE006
,进行运算为
Figure 105031DEST_PATH_IMAGE007
在所述预设句型数据库中匹配所述句型特征结构获得对应的响应结果转换规则,将所述运算结果参数根据所述响应结果转换规则转换为响应结果,对设备执行并输出所述响应结果,所述响应结果转换规则包括实现对所述设备识别和控制的响应编码,将≠0这个运算结果参数根据所述响应结果转换规则转换为响应结果为“老虎会咬人的”,则输出结果。
还包括如下步骤:所述句型特征结构区分有主语特征和谓语特征,所述词组属性编码和所述单字符属性编码可根据所述主语特征和所述谓语特征与上下文所述句型特征结构的所述主语特征和所述谓语特征进行二次组合,利用所述二次组合结果在所述预设句型数据库中匹配确定所述句型特征结构,利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式并进行运算,获得所述运算结果参数。
所述通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合步骤,具体组合步骤包括:所述文本字符串中包含若干字符,取若干字符每个字符的所述字首编码加所述文本字符串中末尾字符的所述字身编码进行遍历组合。
所述通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码步骤具体包括:若所述词组编码在所述预设字典数据库中匹配获得多个词组属性编码,则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述词组属性编码;若所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得多个单字符属性编码,则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述单字符属性编码。
还包括如下步骤:预先将所述设备的控制指令转换为具有属性的所述响应编码,所述响应编码的属性编码方式参考附图3的属性编码分类结构参考图,根据属性编码分类结构参考图可对不同类型的控制指令实现排序和分类,所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码,实现对所述设备的识别和控制,有序的分类使所述设备匹配更快速更准确,具有属性的所述响应编码也使设备能理解语义更精准执行语音控制。
由于对语音进行了编码化处理,使句子拆分成多个带有属性的字符编码、组合编码和位置标记,这样可以方便通过不同部分进行上下文或前后字词的语义属性进行逻辑关联,使机器能否判断,上下文是否有属性联系和是否符合句型特征;而所述设备的控制指令被转换为具有属性的所述响应编码后,所述控制指令就具有分辨为是静态还是动态、是客观还是主观、是抽象还是具象等等层级的排序分类,这样的分类更有利于准确定位识别到设备和执行准确的控制指令,例如发出“我要听歌”和“我要开门”,被编码后的“听歌”和“开门”属于不同的属性分类,一个是“感知”,一个是“能力”,因此,让机器有了有序分类能更理解语义,而不因语言多说一句或误说而导致错误控制;还可以将设备的名称或属性进行预先属性识别编码存储,这样当语音信号转换为字符编码或组合编码,如果编码能直接匹对上所述设备的所述预先属性识别编码即可直接识别对应所述设备,而无需像传统语音识别设备需要识别语音中所带的词语是否为设备名称才能激活响应,可以提高人与设备之间的信息交互质量,也有利于快速精准匹配控制设备;
本实施例还公开了一种智能语音处理系统,包括:
语音信号文本转换模块:用于获取目标语音信号,对所述目标语音信号识别处理并转换为文本字符串;
字符识别编码模块:用于将所述语音信号文本转换模块转换的所述文本字符串以字符为单位转换为字符识别编码,所述字符识别编码包含字首编码、字身编码、部首编码和字型结构编码;
预设字典数据库:用于存储预设词组及其属性编码、关联部首编码和字型结构编码组合的单字符及其属性编码;
编码组合定位模块:用于对所述文本字符串中相邻字符基于所述字符识别编码模块转换的所述字首编码和/或所述字身编码进行逐一遍历组合,在所述预设字典数据库中校验相邻字符组合是否可为词组,并定位词组及单字符位置;
编码缓存模块:用于缓存所述编码组合定位模块校验得到的所述词组属性编码及词组位置标记和缓存所述单字符属性编码及单字符位置标记;
预设句型数据库:用于存储预设句型特征结构及其对应的句型运算公式、响应结果转换规则;
句型匹配运算模块:用于根据所述编码缓存模块的所述词组属性编码及词组位置和所述单字符属性编码及单字符位置在所述预设句型数据库中匹配确定句型特征结构,利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式,根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运算获得运算结果参数;
执行输出响应结果模块:用于将所述运算结果参数根据所述响应结果转换规则转换为响应结果,执行并输出所述响应结果。
还包括,指令编码模块:用于预先将设备的控制指令转换为具有属性的响应编码,所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码,实现对所述设备的识别和控制。
还包括,发送模块:用于所述指令编码模块向目标设备发送控制指令。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种智能语音处理方法,其特征在于,包括如下步骤:
获取目标语音信号,对所述目标语音信号识别处理并转换为文本字符串;
将所述文本字符串以字符为单位转换为字符识别编码,所述字符识别编码包含字首编码、字身编码、部首编码和字型结构编码;
通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合,得到组合编码;在预设字典数据库中搜索并校验所述组合编码是否为词组编码,若校验结果为词组编码,则通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码,缓存所述词组属性编码并在所述文本字符串中对应位置做词组位置标记,若校验结果为非词组编码,则释放所述组合编码,提取当前文本字符的所述部首编码和所述字型结构编码,通过所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得单字符属性编码,缓存所述单字符属性编码并在所述文本字符串中对应位置做单字符位置标记;
根据所述词组位置提取所述词组属性编码特征以及所述单字符位置提取所述单字符属性编码特征在预设句型数据库中匹配确定句型特征结构;
利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式;
根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运算获得运算结果参数;
在所述预设句型数据库中匹配所述句型特征结构获得对应的响应结果转换规则,将所述运算结果参数根据所述响应结果转换规则转换为响应结果,对设备执行并输出所述响应结果,所述响应结果转换规则包括实现对所述设备识别和控制的响应编码。
2.如权利要求1所述的一种智能语音处理方法,其特征在于,还包括如下步骤:所述句型特征结构区分有主语特征和谓语特征,所述词组属性编码和所述单字符属性编码可根据所述主语特征和所述谓语特征与上下文所述句型特征结构的所述主语特征和所述谓语特征进行二次组合,利用所述二次组合结果在所述预设句型数据库中匹配确定所述句型特征结构,利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式并进行运算,获得所述运算结果参数。
3.如权利要求1所述的一种智能语音处理方法,其特征在于,所述句型特征结构包括单句结构和复句结构,所述单句结构包括主谓句结构、非主谓句结构和特殊单句结构,所述复句结构包括并列复句结构、承接复句结构、递进复句结构和选择复句结构;所述句型运算公式为可对编码进行运算的函数式程序。
4.如权利要求1所述的一种智能语音处理方法,其特征在于,所述通过对所述文本字符串中相邻字符的所述字首编码和/或所述字身编码进行逐一遍历组合步骤,具体组合步骤包括:所述文本字符串中包含若干字符,取若干字符每个字符的所述字首编码加所述文本字符串中末尾字符的所述字身编码进行遍历组合。
5.如权利要求2所述的一种智能语音处理方法,其特征在于,所述通过所述词组编码在所述预设字典数据库中匹配获得词组属性编码步骤具体包括:若所述词组编码在所述预设字典数据库中匹配获得多个词组属性编码,则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述词组属性编码;若所述部首编码和所述字型结构编码的组合在所述预设字典数据库中匹配获得多个单字符属性编码,则通过与所述文本字符串中相邻字符的所述单字符属性编码组合或根据所述句型特征结构中所述主语特征和所述谓语特征来确定匹配的所述单字符属性编码。
6.如权利要求1所述的一种智能语音处理方法,其特征在于,还包括如下步骤:预先将所述设备的控制指令转换为具有属性的所述响应编码,执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码,实现对所述设备的识别和控制。
7.如权利要求1至6任意一项所述的一种智能语音处理方法,其特征在于,所述字符识别编码可为基于仓颉码编码策略生成的识别编码。
8.一种智能语音处理系统,其特征在于,包括:
语音信号文本转换模块:用于获取目标语音信号,对所述目标语音信号识别处理并转换为文本字符串;
字符识别编码模块:用于将所述语音信号文本转换模块转换的所述文本字符串以字符为单位转换为字符识别编码,所述字符识别编码包含字首编码、字身编码、部首编码和字型结构编码;
预设字典数据库:用于存储预设词组及其属性编码、关联部首编码和字型结构编码组合的单字符及其属性编码;
编码组合定位模块:用于对所述文本字符串中相邻字符基于所述字符识别编码模块转换的所述字首编码和/或所述字身编码进行逐一遍历组合,在所述预设字典数据库中校验相邻字符组合是否可为词组,并定位词组及单字符位置;
编码缓存模块:用于缓存所述编码组合定位模块校验得到的所述词组属性编码及词组位置标记和缓存所述单字符属性编码及单字符位置标记;
预设句型数据库:用于存储预设句型特征结构及其对应的句型运算公式、响应结果转换规则;
句型匹配运算模块:用于根据所述编码缓存模块的所述词组属性编码及词组位置和所述单字符属性编码及单字符位置在所述预设句型数据库中匹配确定句型特征结构,利用所述句型特征结构在所述预设句型数据库中匹配获得对应的句型运算公式,根据所述句型运算公式代入所述词组属性编码和/或所述单字符属性编码进行运算获得运算结果参数;
执行输出响应结果模块:用于将所述运算结果参数根据所述响应结果转换规则转换为响应结果,执行并输出所述响应结果。
9.如权利要求8所述的一种智能语音处理系统,其特征在于,还包括,指令编码模块:用于预先将设备的控制指令转换为具有属性的响应编码,所述执行输出响应结果模块利用所述响应结果转换规则调用所述响应编码,实现对所述设备的识别和控制。
10.如权利要求9所述的一种智能语音处理系统,其特征在于,还包括,发送模块:用于所述指令编码模块向目标设备发送控制指令。
CN202211311084.1A 2022-10-25 2022-10-25 一种智能语音处理方法及系统 Active CN115440225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211311084.1A CN115440225B (zh) 2022-10-25 2022-10-25 一种智能语音处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211311084.1A CN115440225B (zh) 2022-10-25 2022-10-25 一种智能语音处理方法及系统

Publications (2)

Publication Number Publication Date
CN115440225A CN115440225A (zh) 2022-12-06
CN115440225B true CN115440225B (zh) 2023-01-24

Family

ID=84252579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211311084.1A Active CN115440225B (zh) 2022-10-25 2022-10-25 一种智能语音处理方法及系统

Country Status (1)

Country Link
CN (1) CN115440225B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003303187A (ja) * 2002-04-11 2003-10-24 P To Pa:Kk 会話制御システム、会話制御装置、会話制御方法、プログラム及びプログラムを記録した記録媒体
US8306356B1 (en) * 2007-09-28 2012-11-06 Language Technologies, Inc. System, plug-in, and method for improving text composition by modifying character prominence according to assigned character information measures
CN108090584A (zh) * 2016-11-20 2018-05-29 青海沃爱思智能科技有限公司 实现汉语语音现场智能出行订票系统的方法
CN111916063A (zh) * 2020-06-01 2020-11-10 华南理工大学 基于bpe编码的序列化方法、训练方法、系统及存储介质
CN112652295A (zh) * 2020-12-22 2021-04-13 平安国际智慧城市科技股份有限公司 语言模型训练、视频字幕校验方法、装置、设备及介质
CN113192497A (zh) * 2021-04-28 2021-07-30 平安科技(深圳)有限公司 基于自然语言处理的语音识别方法、装置、设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003303187A (ja) * 2002-04-11 2003-10-24 P To Pa:Kk 会話制御システム、会話制御装置、会話制御方法、プログラム及びプログラムを記録した記録媒体
US8306356B1 (en) * 2007-09-28 2012-11-06 Language Technologies, Inc. System, plug-in, and method for improving text composition by modifying character prominence according to assigned character information measures
CN108090584A (zh) * 2016-11-20 2018-05-29 青海沃爱思智能科技有限公司 实现汉语语音现场智能出行订票系统的方法
CN111916063A (zh) * 2020-06-01 2020-11-10 华南理工大学 基于bpe编码的序列化方法、训练方法、系统及存储介质
CN112652295A (zh) * 2020-12-22 2021-04-13 平安国际智慧城市科技股份有限公司 语言模型训练、视频字幕校验方法、装置、设备及介质
CN113192497A (zh) * 2021-04-28 2021-07-30 平安科技(深圳)有限公司 基于自然语言处理的语音识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN115440225A (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
CN110717031B (zh) 一种智能会议纪要生成方法和系统
CN108304372B (zh) 实体提取方法和装置、计算机设备和存储介质
WO2019085779A1 (zh) 机器处理及文本纠错方法和装置、计算设备以及存储介质
CN109255113B (zh) 智能校对系统
CN111933127B (zh) 一种具备自学习能力的意图识别方法及意图识别系统
CN110147451B (zh) 一种基于知识图谱的对话命令理解方法
CN112151015B (zh) 关键词检测方法、装置、电子设备以及存储介质
CN111339750B (zh) 去除停用语并预测句子边界的口语文本处理方法
CN109243460A (zh) 一种自动生成基于地方方言的讯或询问笔录的方法
CN113066499B (zh) 一种陆空通话说话人身份识别方法及装置
CN110210036A (zh) 一种意图识别方法及装置
CN111026884A (zh) 一种提升人机交互对话语料质量与多样性的对话语料库生成方法
CN109948144B (zh) 一种基于课堂教学情境的教师话语智能处理的方法
CN111984780A (zh) 多意图识别模型训练方法和多意图识别方法及相关装置
Xu et al. Text-to-audio grounding: Building correspondence between captions and sound events
Moritz et al. All-in-one transformer: Unifying speech recognition, audio tagging, and event detection.
CN112417132A (zh) 一种利用谓宾信息筛选负样本的新意图识别方法
CN113221542A (zh) 一种基于多粒度融合与Bert筛选的中文文本自动校对方法
CN112257775A (zh) 一种基于卷积神经网络和无监督语言模型的由图成诗方法
CN114722822A (zh) 命名实体识别方法、装置、设备和计算机可读存储介质
CN107562907B (zh) 一种智能律师专家案件应答装置
CN115440225B (zh) 一种智能语音处理方法及系统
CN115376547B (zh) 发音评测方法、装置、计算机设备和存储介质
CN116978367A (zh) 语音识别方法、装置、电子设备和存储介质
CN107609096B (zh) 一种智能律师专家应答方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant