CN109918676A - 一种检测意图正则表达式的方法及装置、终端设备 - Google Patents
一种检测意图正则表达式的方法及装置、终端设备 Download PDFInfo
- Publication number
- CN109918676A CN109918676A CN201910205539.3A CN201910205539A CN109918676A CN 109918676 A CN109918676 A CN 109918676A CN 201910205539 A CN201910205539 A CN 201910205539A CN 109918676 A CN109918676 A CN 109918676A
- Authority
- CN
- China
- Prior art keywords
- clause
- regular expression
- list
- detected
- intended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 206
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000001514 detection method Methods 0.000 claims abstract description 56
- 238000004458 analytical method Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 24
- 241000283153 Cetacea Species 0.000 description 22
- 239000007921 spray Substances 0.000 description 20
- 230000006870 function Effects 0.000 description 12
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 10
- 244000020518 Carthamus tinctorius Species 0.000 description 10
- 241000196324 Embryophyta Species 0.000 description 10
- 241001465754 Metazoa Species 0.000 description 8
- 235000013399 edible fruits Nutrition 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 230000005484 gravity Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000005507 spraying Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 241000406668 Loxodonta cyclotis Species 0.000 description 2
- 241000282376 Panthera tigris Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种检测意图正则表达式的方法及装置、终端设备,包括:向正则表达式列表中的各正则表达式添加词槽,构建待检测句式列表;对构建的所述待检测句式列表进行语义解析,并解析出所述待检测句式列表中各句式对应意图;将解析出的所述待检测句式列表中各句式对应的意图与所述表达式列表中的正则表达式的意图进行对比;根据比对的结果检测所述正则表达式合理性。通过正则表达式添加词槽的形式,构建真实句式,分析构建的真实句式的意图与构建好的正则表达式的意图是否够一致,从而实现对正则表达式的检测,使其解析结果的冲突和误命中降低。
Description
技术领域
本发明涉及语义解析领域,尤其涉及一种检测意图正则表达式的方法及 装置、终端设备。
背景技术
语义解析是语音交互中必不可少的一个环节,主要通过分析用户输入的意 图,提取能够表达该意图的知识,并转换成机器能够理解的结构化数据格式。
目前,在人工智能的语义解析领域,对用户的语料,主要使用预设的规则 串与语音转换后的文本串进行字符串匹配的方法来对语义进行解析。具体地, 可将关键词组合编译成正则表达式,将提取出的功能参数表示成通配符,并将 该正则表达式与相应的服务建立映射关系,从而实现语义的解析;解析的优先 级使用置信度进行评判,当句式出现置信度低于原有语料意图时,会出现冲突 和误命中的情况。
基于以上,本发明提供了解决以上技术问题的技术方案。
发明内容
本发明的目的是提供一种检测意图正则表达式的方法及装置、终端设备, 通过正则表达式添加词槽的形式,构建真实句式,分析构建的真实句式的 意图与构建好的正则表达式的意图是否够一致,从而实现对正则表达式的 检测,使其解析结果的冲突和误命中降低。
本发明提供的技术方案如下:
一种检测意图正则表达式的方法,包括:
步骤S200向正则表达式列表中的各正则表达式添加词槽,构建待检测句 式列表;步骤S300对构建的所述待检测句式列表进行语义解析,并解析出所 述待检测句式列表中各句式对应意图;步骤S400将解析出的所述待检测句式 列表中各句式对应的意图与所述表达式列表中的正则表达式的意图进行对比; 步骤S500根据比对的结果检测所述正则表达式合理性。
具体的,本申请中的检测意图正则表达式的方法是应用于语义解析领 域,在进行语义解析过程中,现有技术中是根据构建好的正则表达式进行 语义解析,而本申请是通过正则表达式添加词槽的形式,构建真实句式, 分析构建的真实句式的意图与构建好的正则表达式的意图是否够一致,从 而实现对正则表达式的检测。
进一步优选的,在所述步骤S200之前还包括:步骤100获取所述正则表 达式以及所述正则表达式对应的预设正则语法规则。
进一步优选的,步所述骤S400包括:步骤S410根据所述预设正则语法规 则提取出所述待检测句式列表中各句式的关键词;步骤S420将提取出的关键 词与所述正则表达式列表中各句式结构对应的词槽进行一一对比。
在上述方案中,实现了将生成真实句式的意图与现有数据库中的正则 表达式的意图进行对比,用来检测新生成句式的可信度,本申请的技术方 案是一种逆向思维实现对家教机语音识别系统的中设置的算法,也即检测 意图表达式进行合理性验证,使识别出来用意图更能靠近用户的真实意 图,提高终端设备(例如:家教学习机)的智能化,从而提高用户的使用 体验,以此降低在进行语义解析时发生冲突的情况。
进一步优选的,所述步骤S500包括:步骤S510根据所述步骤S420比对 的结果获取所述待检测句式列表中各句式的置信度,步骤S520将获取的所述 待检测句式列表中各句式的置信度与预设置信度阈值进行对比;步骤S530将 所述待检测句式列表中低于所述预设置信度阈值的待检测句式进行筛选,并进 行重新解析。
在上述技术方案中,通过语义解析数据库中整理出所有语义正则表达式的 列表和规则以及对应的词槽,对词槽和对应的正则表达式进行依次反向填充, 利用正则规则加词槽生成的真实句式,将生成后的句式通过语义的解析规则整 体进行解析,获取在所有规则下的解析结果,对比正则表达式对应意图和生成 句式的解析结果,判定正则编写的合理性,设定置信度区间,对置信度小于阈 值的,通过模型等其他方式进行解析,降低误命中率。
进一步优选的,在所述步骤S200中包括:通过所述正则语法规则对所述 待检测句式进行解析。
一种检测意图正则表达式的装置,包括:构建模块,用于向正则表达式列 表中各正则表达式添加词槽,构建待检测句式列表;解析模块,用于对所述待 检测句式构建模块构建的所述待检测句式列表进行语义解析,并解析出所述待 检测句式列表中各句式对应意图;比对模块,用于将所述待检测句式解析模块 解析出的所述待检测句式列表中各句式的对应意图与所述表达式列表中的正 则表达式的意图进行对比;检测模块,用于根据所述比对模块比对的结果检测 所述正则表达式合理性。
本申请中的检测意图正则表达式的方法是应用于语义解析领域,在进 行语义解析过程中,现有技术中是根据构建好的正则表达式进行语义解 析,而本申请是通过正则表达式添加词槽的形式,构建真实句式,分析构 建的真实句式的意图与构建好的正则表达式的意图是否够一致,从而实现 对正则表达式的检测。
进一步优选的,还包括:获取模块,用于获取所述正则表达式、所述正则 表达式对应的预设正则语法规则,以及词槽。
进一步优选的,所述比对模块包括:信息提取子模块,用于根据所述预设 正则语法规则提取出所述待检测句式列表中各句式的关键词;
信息比对子模块,将提取出的关键词与所述正则表达式列表中各句式结构 对应的词槽进行一一对比。
在上述方案中,实现了将生成真实句式的意图与现有数据库中的正则 表达式的意图进行对比,用来检测新生成句式的可信度,本申请的技术方 案是一种逆向思维实现对家教机语音识别系统的中设置的算法,也即检测 意图表达式进行合理性验证,使识别出来用意图更能靠近用户的真实意 图,提高终端设备(例如:家教学习机)的智能化,从而提高用户的使用 体验,以此降低在进行语义解析时发生冲突的情况。
进一步优选的,所述检测模块包括:置信度获取子模块,根据信息比对子 模块比对的结果获取所述待检测句式列表中各句式的置信度,置信度比对子模 块,用于将获取的所述待检测句式列表中各句式的置信度与预设置信度阈值进 行一一对比;异常句式处理子模块,用于将所述待检测句式列表中低于所述预 设置信度阈值的待检测句式进行筛选,并进行重新解析。
一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在 所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算 机程序时实现上述所述检测意图正则表达式的方法步骤。
本发明提供的一种检测意图正则表达式的方法及装置、终端设备,至少包 括以下一种益效果:
本发明中,通过语义解析数据库中整理出所有语义正则表达式的列表和规 则以及对应的词槽,对词槽和对应的正则表达式进行依次反向填充,利用正则 规则加词槽生成的真实句式,将生成后的句式通过语义的解析规则整体进行解 析,获取在所有规则下的解析结果,对比正则表达式对应意图和生成句式的解 析结果,判定正则编写的合理性,设定置信度区间,对置信度小于阈值的,通 过模型等其他方式进行解析,降低误命中率。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种检测意图 正则表达式的方法及装置、终端设备的上述特性、技术特征、优点及其实现方 式予以进一步说明。
图1是本发明一种检测意图正则表达式的方法一实施例的流程图;
图2是本发明一种检测意图正则表达式的方法另一实施例的流程图;
图3是本发明一种检测意图正则表达式的装置一实施例的示意图;
图4是本发明终端设备一个实施例的结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附 图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中的只示意性地表示出了与本发明相关的部分,它们 并不代表其作为产品的实际结构。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、 技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术 人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本发明。 在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明, 以免不必要的细节妨碍本发明的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括” 指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不 排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的 存在或添加。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它 们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有 些图中具有相同结构或功能的部件,仅示意性地绘出了其中的一个,或仅 标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以 表示“多于一个”的情形。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语 “和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能 组合,并且包括这些组合。在人工智能的语义解析领域,对用户的语料, 通过会通过编写正式表达式进行转换的方式进行语义解析,解析的优先级 使用置信度进行评判,当句式出现置信度低于原有时,会出现冲突和误命 中的情况。本申请中的检测意图表达式的方法可以应用于终端设备,基于 终端设备。
具体实现中,本发明实施例中描述的终端设备包括但不限于诸如具有 触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型 计算机、家教学习机或平板计算机之类的其他便携式设备。还应当理解的 是,在某些实施例中,所述终端设备并非便携式通信设备,而是具有触摸 敏感表面(例如:触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端设备。 然而,应当理解的是,终端设备可以包括诸如物理键盘、鼠标和/或控制 杆的一个或多个其他物理用户接口设备。
终端设备支持各种应用程序,例如以下中的一个或多个:绘图应用程 序、演示应用程序、网络创建应用程序、文字处理应用程序、盘刻录应用 程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用 程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、 照片管理应用程序、数码相机应用程序、数字摄像机应用程序、Web浏览 应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端设备上执行的各种应用程序可以使用诸如触摸敏感表面 的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用 程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的 相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持 具有对用户而言直观且透明的用户界面的各种应用程序。
另外,在本发明的描述中,术语“第一”、“第二”等仅用于区分描 述,而不能理解为指示或暗示相对重要性。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对 照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅 是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性 劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施 方式。
参考图1所示为本发明一种检测意图正则表达式的方法实现的流程 图,在本申请中,通过对正则表达式的意图检测能够更加准备的对语料信 息的识别;因此针对语料信息的获取,在本申请中是通过终端设备实现的, 同时本申请的方法也应用于终端设备上,(例如:家教学习机,本实施例 中为方便理解,都以家教学习机作为主语解释,但本领域的技术人员均明 白该检测意图正则表达式的方法也可应用于其他终端设备,只要能实现相 应功能即可),检测意图正则表达式的方法包括以下步骤:
步骤S200向正则表达式列表中的各正则表达式添加词槽,构建待检测句 式列表;
具体的,在本申请还涉及到语料即语言材料,通俗理解就是用户所说 的话。例如:用户对他的终端设备说“鲸鱼为什么会喷水”这一句话,这 句话的内容就是用户的语料。
终端设备上都会配备有麦克风,可以内置,也可以外置,根据实际的 产品设计和实际使用情况决定。通过麦克风获取用户的语料,供终端设备 进行后续的语义解析、意图选择。
例如,生成正则为##名词库一##[为什么][会]##动词库二##,在本申 请中正则表达式在终端设备的后台数据库中是已经存在的,在这里词槽也 即是分别为词库一和词库二中的词,也即为名词和动词;通过词库中词槽 来反向的填充至正则表达式中;而得到一个真实的句子,例如根据正则表 达式以及词库中的词槽,“大象为什么会喷水”或“老虎为什么会跑”, 分别从名词库和动词库中提取对应名词和动词,构成了真实的语句。
在本申请中借助于家教学习机获取语料,针对获取的语料在进行语义 解析过程中,通过正则表达式进行解析,正则表达式的意图正确性对于语 料的解析起到关键性的作用;在用于语义解析的数据库中构建了多种在先 的正则表达式,也可以成为预设正则表达式,并将预设正则表达式建立列 表,从词库中提取对应的动词或者名词词槽,进行填充,形成对应的语句, 在本申请中称为真实语句。
步骤S300对构建的所述待检测句式列表进行语义解析,并解析出所述待 检测句式列表中各句式对应意图;
具体的,当正则表达式为:##名词库一##[是什么]##;
添加后的语句为:“鸟儿是什么”、“花儿是什么”、“苹果是什么”; 针对添加后的语句进行解析;相当于对用户的语料进行中心思想的概括, 方便后续进行意图的匹配。
如果在原正则表达式的意图是“高兴是什么”;
将根据正则表达式的意图与生成句式的意图进行对比分析;
步骤S400将解析出的所述待检测句式列表中各句式对应的意图与所述表 达式列表中的正则表达式的意图进行对比;
具体的,意图的对比为,提取关键字,可采用现有的分词算法完成,例 如:基于字符串匹配的分词方法,基于理解的分词方法和基于统计的分词 方法,具体的实现过程请参见现有分词算法的要求;或者根据句式结构进 行提取等;在此不再详细描述。
原表达式的意图是::##名词库##[是什么]##,解出的意图是高兴是什 么?而高兴本身表示人物心里状态的词;而添加后的真实句式为“鸟儿 是什么”、“花儿是什么”、“苹果是什么”;分别添加的为动物名字,植 物名字,以及水果名词;由此可知,意图相差很大;而“开心是什么”这种与 正则表达式的意图比较接近。
步骤S500根据比对的结果检测所述正则表达式合理性。
具体的,根据上述的分析,添加后的真实句式为“鸟儿是什么”、“花 儿是什么”、“苹果是什么”;分别添加的为动物名字,植物名字,以及水果 名词;而预设正则表达式的意图是“表示人物心理状态的词”+是什么?根据 以上的这种分析,判断出每个正则表达式的合理性;合理性判断从意图方面讲: “开心是什么”相对要合理。
本申请中的检测意图正则表达式的方法是应用于语义解析领域,在进 行语义解析过程中,现有技术中是根据构建好的正则表达式进行语义解 析,而本申请是通过正则表达式添加词槽的形式,构建真实句式,分析构 建的真实句式的意图与构建好的正则表达式的意图是否够一致,从而实现 对正则表达式的检测。
进一步的,还包括步骤100获取所述正则表达式以及所述正则表达式对 应的预设正则语法规则。
具体的,语法规则根据不同的使用场景,不同年龄阶段的孩子,以及 不同的用户进行相应的设置,还包括模糊意图的判断等。
如图2所示是本发明一种检测意图正则表达式的方法另一个实施例示 意图;检测意图正则表达式的方法包括以下步骤:
步骤100获取所述正则表达式以及所述正则表达式对应的预设正则语法规 则;
步骤S200向正则表达式列表中的各正则表达式添加词槽,构建待检测句 式列表;
步骤S300对构建的所述待检测句式列表进行语义解析,并解析出所述待 检测句式列表中各句式对应意图;
步骤S410根据所述预设正则语法规则提取出所述待检测句式列表中各句 式的关键词;
具体的,在进行解析的时候抽取语料中的主体结构时,不需要语料进行语 义理解,抽取根据分词和对应的词性、句法进行;
例如,添加后的真实句式为“鲸鱼为什么会喷水”;“苹果为什么会是绿 色”,以及“红花为什么会放开”;
词库:鲸鱼--名词;为什么--代词;会--动词;喷水--动词;
句法结构为:鲸鱼喷水主谓
为什么喷水状中会喷水状中
抽取主体:主谓关系中的名词名词范围鲸鱼
添加后的真实句式进行提炼分析后“鲸鱼喷水”是主要的意图;
步骤S420将提取出的关键词与所述正则表达式列表中各句式结构对应的 词槽进行一一对比;
具体的,对待检测句式的关键词全部提取是根据句子的结构进行对应提 取;
句法结构为:鲸鱼喷水主谓
为什么喷水 状中 会喷水 状中
抽取主体:主谓关系中的名词 名词范围 鲸鱼
根据对待检测句式构建的正则表达式为:##名词库##[为什么][会]##动词库 ##;
而原正则表达式的意图为:花儿为什么会放开?
结构关键词的提取
句法结构为 花儿开放 主谓
为什么放开 状中 会开放 状中
抽取主体 主谓关系中的名词 名词范围 花儿
根据对应的词槽中添加的词进行一一对比;原正则的词库应该是植物名词 “花儿”;而“鲸鱼”是动物名字不能匹配;“苹果”是水果不能匹配;“红 花”和“花儿”的匹配度相对比较大,根据该方式完成对应词槽的对比;当然 在同一个正则表达式中,可以包括多个需要添加的词库,名词库,动词库等; 其一一对比方式是一致的。
步骤S500根据比对的结果检测所述正则表达式合理性。
在上述方案中,实现了将生成真实句式的意图与现有数据库中的正则 表达式的意图进行对比,用来检测新生成句式的可信度,本申请的技术方 案是一种逆向思维实现对家教机语音识别系统的中设置的算法,也即检测 意图表达式进行合理性验证,使识别出来用意图更能靠近用户的真实意 图,提高终端设备(例如:家教学习机)的智能化,从而提高用户的使用 体验,以此降低在进行语义解析时发生冲突的情况。
参考图2所示是本发明一种检测意图正则表达式的方法另一实施例流 程图;本实施例用于实现对于正则表达合理性的判断,具体的包括以下步骤:
步骤100获取所述正则表达式以及所述正则表达式对应的预设正则语法规 则;
步骤S200向正则表达式列表中的各正则表达式添加词槽,构建待检测句 式列表;
步骤S300对构建的所述待检测句式列表进行语义解析,并解析出所述待 检测句式列表中各句式对应意图;
步骤S410根据所述预设正则语法规则提取出所述待检测句式列表中各句 式的关键词;
步骤S420将提取出的关键词与所述正则表达式列表中各句式结构对应的 词槽进行一一对比;
步骤S510根据所述步骤S420比对的结果获取所述待检测句式列表中各句 式的置信度,
步骤S520将获取的所述待检测句式列表中各句式的置信度与预设置信度 阈值进行对比;
步骤S530将所述待检测句式列表中低于所述预设置信度阈值的待检测句 式进行筛选,并进行重新解析。
具体的,置信度就是用用户真实输入的句式对比命中的正则生成的数值; 在计算置信度时,例如名词词槽占有0.5比重,动词占有0.5的比重;进一步 的根据名词的属性进行分类;例如,动物名词,植物名词,代名词等;在进行 意图进行比对时,根据对应的句式结构进行比对,例如:原正则的意图为:花 儿为什么会放开?
而根据正则表达式以及词槽填充后的真实句子为:“鲸鱼为什么会喷水”;
“苹果为什么会是绿色”,以及“红花为什么会放开”;将对应生成真实 的句式的意图与正则的意图进行词槽一一比对;原正则的词库应该是植物名词 “花儿”;而“鲸鱼”是动物名字不能匹配;“苹果”是水果不能匹配;“红 花”和“花儿”的匹配度相对比较大,这样在名词的词槽中,添加的“红花” 在0.5的比重中,相对于要高,假设为0.4;其他相差甚远,这种可以按照设定 的相关规则进行打分;同样的对比方式计算动词库置信度的比重。
根据上述的计算方法,预设的置信度为0.6;而通过正则表达式生成真实 语句进行意图比对后,如果置信度低于0.6,通过正则表达式添加词槽后,其 意图变化表较大,那么则根据置信度值,将正则表达式列表中置信度低于0.6 的正则表达式进行记录,并对低于置信度0.6的正则表达式进行重新检测,还 对生成的真实句式进行重新解析,检测解析规则是够存在问题,或者检测正则 表达式等;使其减小发生错误的机率。
在上述技术方案中,通过语义解析数据库中整理出所有语义正则表达式的 列表和规则以及对应的词槽,对词槽和对应的正则表达式进行依次反向填充, 利用正则规则加词槽生成的真实句式,将生成后的句式通过语义的解析规则整 体进行解析,获取在所有规则下的解析结果,对比正则表达式对应意图和生成 句式的解析结果,判定正则编写的合理性,设定置信度区间,对置信度小于阈 值的,通过模型等其他方式进行解析,降低误命中率。
本申请中,还包括一种解析冲突的问题,例如语料为:“请用“好”字造 句”或者请用“请用“字”字造句”;这种在解析的过程中,在一个语料中出 现了两个“字”,提取关键字时,可能会发生冲突,针对这种情况,系统很难 分辨,这样就造成解析冲突,本申请就会重新进行解析,通过对正则表达式的 模型学习,以及修正,使其语义解析更加精准。
本申请只是举例进行说明,在实际的应用过程中其正在表达式更加复杂。
优选的,在所述步骤S200中包括:通过所述正则语法规则对所述待检测 句式进行解析。
具体的,根据对家教机使用环境,用户的年龄,学历,以及接触程度不同, 可对解析规则不同的设定。
如图3所示是本申请提供了一种检测意图正则表达式的装置一个实例的示 意图;本申请的检测意图正则表达式的装置可以是内置于终端设备内的软件 单元、硬件单元或者软硬结合的单元,也可以作为独立的挂件集成到终端 设备中。
检测意图正则表达式的装置包括:
构建模块200,用于向正则表达式列表中各正则表达式添加词槽,构建待 检测句式列表;
具体的,在本申请还涉及到语料即语言材料,通俗理解就是用户所说 的话。例如:用户对他的终端设备说“鲸鱼为什么会喷水”这一句话,这 句话的内容就是用户的语料。
终端设备上都会配备有麦克风,可以内置,也可以外置,根据实际的 产品设计和实际使用情况决定。通过麦克风获取用户的语料,供终端设备 进行后续的语义解析、意图选择。
例如,生成正则为##名词库一##[为什么][会]##动词库二##,在本申 请中正则表达式在终端设备的后台数据库中是已经存在的,在这里词槽也 即是分别为词库一和词库二中的词,也即为名词和动词;通过词库中词槽 来反向的填充至正则表达式中;而得到一个真实的句子,例如根据正则表 达式以及词库中的词槽,“大象为什么会喷水”或“老虎为什么会跑”, 分别从名词库和动词库中提取对应名词和动词。
在本申请中借助于家教学习机获取语料,针对获取的语料进行语义解 析过程中,通过正则表达式进行解析,正则表达式的意图正确性对于语料 的解析起到关键性的作用;在用于语义解析的数据库中构建了多种在先的 正则表达式,也可以成为预设正则表达式,并将预设正则表达式建立列表, 从词库中提取对应的动词或者名词词槽,进行填充,形成对应的语句,在 本申请中称为真实语句。
解析模块300,用于对所述待检测句式构建模块构建的所述待检测句式列 表进行语义解析,并解析出所述待检测句式列表中各句式对应意图;
具体的,当正则表达式为:##名词库一##[是什么]##;
添加后的语句为:“鸟儿是什么”、“花儿是什么”、“苹果是什么”; 针对添加后的语句进行解析;相当于对用户的语料进行中心思想的概括, 方便后续进行意图的匹配。
如果在原正则表达式的意图是“高兴是什么”;
将根据正则表达式的意图与生成句式的意图进行对比分析;
比对模块400,用于将所述待检测句式解析模块解析出的所述待检测句式 列表中各句式的对应意图与所述表达式列表中的正则表达式的意图进行对比;
具体的,意图的对比为,提取关键字,可采用现有的分词算法完成,例 如:基于字符串匹配的分词方法,基于理解的分词方法和基于统计的分词 方法,具体的实现过程请参见现有分词算法的要求;或者根据句式结构进 行提取等;在此不再详细描述。
原表达式的意图是::##名词库##[是什么]##,解出的意图是高兴是什 么?而高兴本身表示人物心里状态的词;而添加后的真实句式为“鸟儿 是什么”、“花儿是什么”、“苹果是什么”;分别添加的为动物名字,植 物名字,以及水果名词;由此可知,意图相差很大;
如果“开心是什么”这种与正则表达式的意图比较接近。
检测模块500,用于根据所述比对模块比对的结果检测所述正则表达式合 理性。
具体的,根据上述的分析,添加后的真实句式为“鸟儿是什么”、“花 儿是什么”、“苹果是什么”;分别添加的为动物名字,植物名字,以及水果 名词;而预设正则表达式的意图是“表示人物心理状态的词”+是什么?根据 以上的这种分析,判断出每个正则表达式的合理性;合理性判断从意图方面讲: “开心是什么”相对要合理。
本申请中的检测意图正则表达式的方法是应用于语义解析领域,在进 行语义解析过程中,现有技术中是根据构建好的正则表达式进行语义解 析,而本申请是通过正则表达式添加词槽的形式,构建真实句式,分析构 建的真实句式的意图与构建好的正则表达式的意图是否够一致,从而实现 对正则表达式的检测。
如图3所示是本申请检测意图正则表达式的装置另一实施例示意图;该 检测意图正则表达式的装置可以是内置于终端设备内的软件单元、硬件单 元或者软硬结合的单元,也可以作为独立的挂件集成到终端设备中。
检测意图正则表达式的装置包括:
获取模块100,用于获取所述正则表达式、所述正则表达式对应的预设正 则语法规则,以及词槽;
构建模块200,用于向正则表达式列表中各正则表达式添加词槽,构建待 检测句式列表;
解析模块300,用于对所述待检测句式构建模块构建的所述待检测句式列 表进行语义解析,并解析出所述待检测句式列表中各句式对应意图;
信息提取子模块410,用于根据所述预设正则语法规则提取出所述待检测 句式列表中各句式的关键词;
具体的,在进行解析的时候抽取语料中的主体结构时,不需要语料进行语 义理解,抽取根据分词和对应的词性、句法进行;
例如,添加后的真实句式为“鲸鱼为什么会喷水”;“苹果为什么会是绿 色”,以及“红花为什么会放开”;
鲸鱼--名词;为什么--代词;会--动词;喷水--动词;
句法结构为:鲸鱼喷水 主谓
为什么喷水 状中 会喷水 状中
抽取主体:主谓关系中的名词 名词范围 鲸鱼
添加后的真实句式进行提炼分析后“鲸鱼喷水”是主要的意图;
信息比对子模块420,将提取出的关键词与所述正则表达式列表中各句式 结构对应的词槽进行一一对比。
步骤S420将提取出的关键词与所述正则表达式列表中各句式结构对应的 词槽进行一一对比;
具体的,对待检测句式的关键词全部提取是根据句子的结构进行对应提 取;
句法结构为:鲸鱼喷水主谓
为什么喷水 状中 会喷水 状中
抽取主体:主谓关系中的名词名词范围鲸鱼
根据对待检测句式构建的正则表达式为:##名词库##[为什么][会]##动词库 ##;
而原正则表达式的意图为:花儿为什么会放开?
结构关键词的提取
句法结构为 花儿开放 主谓
为什么放开 状中 会开放 状中
抽取主体 主谓关系中的名词 名词范围 花儿
根据对应的词槽中添加的词进行一一对比;原正则的词库应该是植物名词 “花儿”;而“鲸鱼”是动物名字不能匹配;“苹果”是水果不能匹配;“红 花”和“花儿”的匹配度相对比较大,根据该方式完成对应词槽的对比;当然 在同一个正则表达式中,可以包括多个需要添加的词库,名词库,动词库等; 其一一对比方式是一致的。
检测模块500,用于根据所述比对模块比对的结果检测所述正则表达式合 理性。
在上述方案中,实现了将生成真实句式的意图与现有数据库中的正则 表达式的意图进行对比,用来检测新生成句式的可信度,本申请的技术方 案是一种逆向思维实现对家教机语音识别系统的中设置的算法,也即检测 意图表达式进行合理性验证,使识别出来用意图更能靠近用户的真实意 图,提高终端设备(例如:家教学习机)的智能化,从而提高用户的使用 体验,以此降低在进行语义解析时发生冲突的情况。
如图3所示是本发明检测意图正则表达式的装置的示意图;检测意图正 则表达式的装置包括:获取模块100,用于获取所述正则表达式、所述正则表 达式对应的预设正则语法规则,以及词槽;构建模块200,用于向正则表达式 列表中各正则表达式添加词槽,构建待检测句式列表;解析模块300,用于对 所述待检测句式构建模块构建的所述待检测句式列表进行语义解析,并解析出 所述待检测句式列表中各句式对应意图;信息提取子模块410,用于根据所述 预设正则语法规则提取出所述待检测句式列表中各句式的关键词;信息比对子 模块420,将提取出的关键词与所述正则表达式列表中各句式结构对应的词槽进行一一对比;置信度获取子模块510,根据信息比对子模块比对的结果获取 所述待检测句式列表中各句式的置信度,置信度比对子模块520,用于将获取 的所述待检测句式列表中各句式的置信度与预设置信度阈值进行一一对比;异 常句式处理子模块530,用于将所述待检测句式列表中低于所述预设置信度阈 值的待检测句式进行筛选,并进行重新解析。
具体的,置信度就是用用户真实输入的句式对比命中的正则生成的数值; 在计算置信度时,例如名词词槽占有0.5比重,动词占有0.5的比重;进一步 的根据名词的属性进行分类;例如,动物名词,植物名词,代名词等;在进行 意图进行比对时,根据对应的句式结构进行比对,例如:原正则的意图为:花 儿为什么会放开?
而根据正则表达式以及词槽填充后的真实句子为:“鲸鱼为什么会喷水”;
“苹果为什么会是绿色”,以及“红花为什么会放开”;将对应生成真实 的句式的意图与正则的意图进行词槽一一比对;原正则的词库应该是植物名词 “花儿”;而“鲸鱼”是动物名字不能匹配;“苹果”是水果不能匹配;“红 花”和“花儿”的匹配度相对比较大,这样在名词的词槽中,添加的“红花” 在0.5的比重中,相对于要高,假设为0.4;其他相差甚远,这种可以按照设定 的相关规则进行打分;同样的对比方式计算动词库置信度的比重。
根据上述的计算方法,预设的置信度为0.6;而通过正则表达式生成真实 语句进行意图比对后,如果置信度低于0.6,通过正则表达式添加词槽后,其 意图变化表较大,那么则根据置信度值,将正则表达式列表中置信度低于0.6 的正则表达式进行记录,并对低于置信度0.6的正则表达式进行重新检测,还 对生成的真实句式进行重新解析,检测解析规则是够存在问题,或者检测正则 表达式等;使其减小发生错误的机率。
在上述技术方案中,通过语义解析数据库中整理出所有语义正则表达式的 列表和规则以及对应的词槽,对词槽和对应的正则表达式进行依次反向填充, 利用正则规则加词槽生成的真实句式,将生成后的句式通过语义的解析规则整 体进行解析,获取在所有规则下的解析结果,对比正则表达式对应意图和生成 句式的解析结果,判定正则编写的合理性,设定置信度区间,对置信度小于阈 值的,通过模型等其他方式进行解析,降低误命中率。
本申请中,解析后置信度低还包括一种解析冲突的问题,例如语料为:“请 用“好”字造句”或者请用“请用“字”字造句”;这种在解析的过程中,在 一个语料中出现了两个“字”,提取关键字时,可能会发生冲突,针对这种情 况,系统很难分辨,这样就造成解析冲突,本申请就会重新进行解析,通过对 正则表达式的模型学习,以及修正,使其语义解析更加精准。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅 以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将 上述功能分配由不同的程序模块完成,即将所述装置的内部结构划分成不 同的程序单元或模块,以完成以上描述的全部或者部分功能。实施例中的 各程序模块可以集成在一个处理单元中,也可是各个单元单独物理存在, 也可以两个或两个以上单元集成在一个处理单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序单元的形式实现。另外,各 程序模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保 护范围。
图4是本发明一个实施例中提供的终端设备的结构图。如图4所示; 本实施例的终端设备5包括:处理器53、存储器51以及存储在所述存储 器51中并可在所述处理器53上运行的计算机程序52,例如:多意图的 识别程序。所述处理器53执行所述计算机程序52时实现上述各个多意图 的识别方法实施例中的步骤,或者,所述处理器53执行所述计算机程序52时实现上述各多意图的识别装置实施例中各模块的功能。
所述终端设备5可以为桌上型计算机、笔记本、掌上电脑、平板型计 算机、手机、家教学习机等设备。所述终端设备5可包括,但不仅限于, 处理器53、存储器51。本领域技术人员可以理解,图4仅仅是终端设备的 示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件, 或者组合某些部件,或者不同的部件,例如:终端设备还可以包括输入输 出设备、显示设备、网络接入设备、总线等。
所述处理器53可以是中央处理单元(Central Processing Unit,CPU), 还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,
DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、 现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编 程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器 可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51可以是所述终端设备5的内部存储单元,例如:终端设 备的硬盘或内存。所述存储器也可以是所述终端设备的外部存储设备,例 如:所述终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进 一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包 括外部存储设备。所述存储器51用于存储所述计算机程序52以及所述终端 设备5所需要的其他程序和数据。所述存储器还可以用于暂时地存储已经 输出或者将要输出的数据。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没 有详细描述或记载的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的 各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件 的结合来实现。这些功能究竟以硬件还是软件来执行,取决于技术方案的 特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不 同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备 和方法,可以通过其他的方式实现。例如,以上所描述的装置/终端设备 实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑 功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可 以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另 一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过 一些接口,装置或单元的间接耦合或通讯连接,可以是电性、机械或其他 的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的, 作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地 方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的 部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可能集成在一个处理单元 中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在 一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软 件功能单元的形式实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的 各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件 的结合来实现。这些功能究竟以硬件还是软件来执行,取决于技术方案的 特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不 同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备 和方法,可以通过其他的方式实现。例如,以上所描述的装置/终端设备 实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑 功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可 以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另 一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过 一些接口,装置或单元的间接耦合或通讯连接,可以是电性、机械或其他 的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的, 作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地 方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的 部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可能集成在一个处理单元 中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在 一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软 件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的 产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的 理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算 机程序发送指令给相关的硬件完成,所述的计算机程序可存储于一计算机 可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法 实施例的步骤。其中,所述计算机程序包括:计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形 式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码 的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存 储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM, Random Access Memory)、电载波信号、电信信号以及软件分发介质等。 需要说明的是,所述计算机可读存储介质包含的内容可以根据司法管辖区 内立法和专利实践的要求进行适当的增减,例如:在某些司法管辖区,根 据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
应当说明的是,上述实施例均可根据需要自由组合。以上仅是本发明的优 选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发 明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发 明的保护范围。
Claims (10)
1.一种检测意图正则表达式的方法,其特征在于,包括:
步骤S200向正则表达式列表中的各正则表达式添加词槽,构建待检测句式列表;
步骤S300对构建的所述待检测句式列表进行语义解析,并解析出所述待检测句式列表中各句式对应意图;
步骤S400将解析出的所述待检测句式列表中各句式对应的意图与所述表达式列表中的正则表达式的意图进行对比;
步骤S500根据比对的结果检测所述正则表达式合理性。
2.根据权利要求1所述的检测意图正则表达式的方法,其特征在于,在所述步骤S200之前还包括:
步骤100获取所述正则表达式以及所述正则表达式对应的预设正则语法规则。
3.根据权利要求2所述的检测意图正则表达式的方法,其特征在于,步所述骤S400包括:
步骤S410根据所述预设正则语法规则提取出所述待检测句式列表中各句式的关键词;
步骤S420将提取出的关键词与所述正则表达式列表中各句式结构对应的词槽进行一一对比。
4.根据权利要求3所述的检测意图正则表达式的方法,其特征在于,所述步骤S500包括:
步骤S510根据所述步骤S420比对的结果获取所述待检测句式列表中各句式的置信度,
步骤S520将获取的所述待检测句式列表中各句式的置信度与预设置信度阈值进行对比;
步骤S530将所述待检测句式列表中低于所述预设置信度阈值的待检测句式进行筛选,并进行重新解析。
5.根据权利要求2-4任一所述的检测意图正则表达式的方法,其特征在于,在所述步骤S200中包括:
通过所述正则语法规则对所述待检测句式进行解析。
6.一种检测意图正则表达式的装置,其特征在于,包括:
构建模块,用于向正则表达式列表中各正则表达式添加词槽,构建待检测句式列表;
解析模块,用于对所述待检测句式构建模块构建的所述待检测句式列表进行语义解析,并解析出所述待检测句式列表中各句式对应意图;
比对模块,用于将所述待检测句式解析模块解析出的所述待检测句式列表中各句式对应的意图与所述表达式列表中的正则表达式的意图进行对比;
检测模块,用于根据所述比对模块比对的结果检测所述正则表达式合理性。
7.根据权利要求6所述的检测意图正则表达式的装置,其特征在于,还包括:
获取模块,用于获取所述正则表达式、所述正则表达式对应的预设正则语法规则,以及词槽。
8.根据权利要求7所述的检测意图正则表达式的装置,其特征在于,步所述比对模块包括:
信息提取子模块,用于根据所述预设正则语法规则提取出所述待检测句式列表中各句式的关键词;
信息比对子模块,将提取出的关键词与所述正则表达式列表中各句式结构对应的词槽进行一一对比。
9.根据权利要求8所述的检测意图正则表达式的装置,其特征在于,所述检测模块包括:
置信度获取子模块,根据信息比对子模块比对的结果获取所述待检测句式列表中各句式的置信度,
置信度比对子模块,用于将获取的所述待检测句式列表中各句式的置信度与预设置信度阈值进行一一对比;
异常句式处理子模块,用于将所述待检测句式列表中低于所述预设置信度阈值的待检测句式进行筛选,并进行重新解析。
10.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时实现如权利要求1-5中任一项所述检测意图正则表达式的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910205539.3A CN109918676B (zh) | 2019-03-18 | 2019-03-18 | 一种检测意图正则表达式的方法及装置、终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910205539.3A CN109918676B (zh) | 2019-03-18 | 2019-03-18 | 一种检测意图正则表达式的方法及装置、终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109918676A true CN109918676A (zh) | 2019-06-21 |
CN109918676B CN109918676B (zh) | 2023-06-27 |
Family
ID=66965431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910205539.3A Active CN109918676B (zh) | 2019-03-18 | 2019-03-18 | 一种检测意图正则表达式的方法及装置、终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109918676B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909160A (zh) * | 2019-10-11 | 2020-03-24 | 平安科技(深圳)有限公司 | 正则表达式生成方法、服务器及计算机可读存储介质 |
CN110928793A (zh) * | 2019-11-28 | 2020-03-27 | Oppo广东移动通信有限公司 | 一种正则表达式检测方法、装置及计算机可读存储介质 |
CN111145724A (zh) * | 2019-12-31 | 2020-05-12 | 出门问问信息科技有限公司 | 一种多音字标注方法、装置以及计算机可读存储介质 |
CN111339768A (zh) * | 2020-02-27 | 2020-06-26 | 携程旅游网络技术(上海)有限公司 | 敏感文本检测方法、系统、电子设备及介质 |
CN112149429A (zh) * | 2020-10-21 | 2020-12-29 | 成都小美伴旅信息技术有限公司 | 一种基于词槽序模型的高准确度语义理解识别方法 |
CN112528627A (zh) * | 2020-12-16 | 2021-03-19 | 中国南方电网有限责任公司 | 一种基于自然语言处理的检修意见识别方法 |
WO2021063089A1 (zh) * | 2019-09-30 | 2021-04-08 | 华为技术有限公司 | 规则匹配方法、规则匹配装置、存储介质及电子设备 |
CN113343715A (zh) * | 2021-06-29 | 2021-09-03 | 深圳前海微众银行股份有限公司 | 自动生成正则表达式的方法、装置、设备及存储介质 |
CN113672503A (zh) * | 2021-08-03 | 2021-11-19 | 中移(杭州)信息技术有限公司 | 测试用例的生成方法、系统、终端设备以及存储介质 |
CN113704576A (zh) * | 2021-09-03 | 2021-11-26 | 上海森亿医疗科技有限公司 | 基于可视化正则表达式规则的匹配方法、系统及终端 |
CN114510922A (zh) * | 2022-04-15 | 2022-05-17 | 北京沃丰时代数据科技有限公司 | 一种文本匹配方法及装置 |
WO2022183547A1 (zh) * | 2021-03-03 | 2022-09-09 | 平安科技(深圳)有限公司 | 语料意图识别方法、装置、存储介质及计算机设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101727441A (zh) * | 2009-12-25 | 2010-06-09 | 北京工业大学 | 一种面向中文人名识别系统的评测方法及评测系统 |
CN101859273A (zh) * | 2009-04-07 | 2010-10-13 | 西门子(中国)有限公司 | 一种产生测试用例的方法及装置 |
US20140200703A1 (en) * | 2013-01-15 | 2014-07-17 | Kabushiki Kaisha Yaskawa Denki | Recognition program evaluation device and method for evaluating recognition program |
US20170177715A1 (en) * | 2015-12-21 | 2017-06-22 | Adobe Systems Incorporated | Natural Language System Question Classifier, Semantic Representations, and Logical Form Templates |
JP2018025956A (ja) * | 2016-08-09 | 2018-02-15 | 日本電信電話株式会社 | モデル作成装置、推定装置、方法、及びプログラム |
CN108304372A (zh) * | 2017-09-29 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 实体提取方法和装置、计算机设备和存储介质 |
CN109033075A (zh) * | 2018-06-29 | 2018-12-18 | 北京百度网讯科技有限公司 | 意图匹配的方法、装置、存储介质和终端设备 |
CN109388700A (zh) * | 2018-10-26 | 2019-02-26 | 广东小天才科技有限公司 | 一种意图识别方法及系统 |
-
2019
- 2019-03-18 CN CN201910205539.3A patent/CN109918676B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101859273A (zh) * | 2009-04-07 | 2010-10-13 | 西门子(中国)有限公司 | 一种产生测试用例的方法及装置 |
CN101727441A (zh) * | 2009-12-25 | 2010-06-09 | 北京工业大学 | 一种面向中文人名识别系统的评测方法及评测系统 |
US20140200703A1 (en) * | 2013-01-15 | 2014-07-17 | Kabushiki Kaisha Yaskawa Denki | Recognition program evaluation device and method for evaluating recognition program |
US20170177715A1 (en) * | 2015-12-21 | 2017-06-22 | Adobe Systems Incorporated | Natural Language System Question Classifier, Semantic Representations, and Logical Form Templates |
JP2018025956A (ja) * | 2016-08-09 | 2018-02-15 | 日本電信電話株式会社 | モデル作成装置、推定装置、方法、及びプログラム |
CN108304372A (zh) * | 2017-09-29 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 实体提取方法和装置、计算机设备和存储介质 |
CN109033075A (zh) * | 2018-06-29 | 2018-12-18 | 北京百度网讯科技有限公司 | 意图匹配的方法、装置、存储介质和终端设备 |
CN109388700A (zh) * | 2018-10-26 | 2019-02-26 | 广东小天才科技有限公司 | 一种意图识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
芦兵 等: "《基于正则表达式融合语义的农产品自动识别方法》", 《江苏大学学报(自然科学版)》 * |
芦兵 等: "《基于正则表达式融合语义的农产品自动识别方法》", 《江苏大学学报(自然科学版)》, vol. 39, no. 4, 10 July 2018 (2018-07-10), pages 415 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021063089A1 (zh) * | 2019-09-30 | 2021-04-08 | 华为技术有限公司 | 规则匹配方法、规则匹配装置、存储介质及电子设备 |
CN110909160A (zh) * | 2019-10-11 | 2020-03-24 | 平安科技(深圳)有限公司 | 正则表达式生成方法、服务器及计算机可读存储介质 |
CN110928793A (zh) * | 2019-11-28 | 2020-03-27 | Oppo广东移动通信有限公司 | 一种正则表达式检测方法、装置及计算机可读存储介质 |
CN110928793B (zh) * | 2019-11-28 | 2023-07-28 | Oppo广东移动通信有限公司 | 一种正则表达式检测方法、装置及计算机可读存储介质 |
CN111145724B (zh) * | 2019-12-31 | 2022-08-19 | 出门问问信息科技有限公司 | 一种多音字标注方法、装置以及计算机可读存储介质 |
CN111145724A (zh) * | 2019-12-31 | 2020-05-12 | 出门问问信息科技有限公司 | 一种多音字标注方法、装置以及计算机可读存储介质 |
CN111339768A (zh) * | 2020-02-27 | 2020-06-26 | 携程旅游网络技术(上海)有限公司 | 敏感文本检测方法、系统、电子设备及介质 |
CN111339768B (zh) * | 2020-02-27 | 2024-03-05 | 携程旅游网络技术(上海)有限公司 | 敏感文本检测方法、系统、电子设备及介质 |
CN112149429A (zh) * | 2020-10-21 | 2020-12-29 | 成都小美伴旅信息技术有限公司 | 一种基于词槽序模型的高准确度语义理解识别方法 |
CN112528627A (zh) * | 2020-12-16 | 2021-03-19 | 中国南方电网有限责任公司 | 一种基于自然语言处理的检修意见识别方法 |
WO2022183547A1 (zh) * | 2021-03-03 | 2022-09-09 | 平安科技(深圳)有限公司 | 语料意图识别方法、装置、存储介质及计算机设备 |
CN113343715A (zh) * | 2021-06-29 | 2021-09-03 | 深圳前海微众银行股份有限公司 | 自动生成正则表达式的方法、装置、设备及存储介质 |
CN113672503A (zh) * | 2021-08-03 | 2021-11-19 | 中移(杭州)信息技术有限公司 | 测试用例的生成方法、系统、终端设备以及存储介质 |
CN113704576A (zh) * | 2021-09-03 | 2021-11-26 | 上海森亿医疗科技有限公司 | 基于可视化正则表达式规则的匹配方法、系统及终端 |
CN113704576B (zh) * | 2021-09-03 | 2024-02-20 | 上海森亿医疗科技有限公司 | 基于可视化正则表达式规则的匹配方法、系统及终端 |
CN114510922A (zh) * | 2022-04-15 | 2022-05-17 | 北京沃丰时代数据科技有限公司 | 一种文本匹配方法及装置 |
CN114510922B (zh) * | 2022-04-15 | 2022-07-05 | 北京沃丰时代数据科技有限公司 | 一种文本匹配方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109918676B (zh) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109918676A (zh) | 一种检测意图正则表达式的方法及装置、终端设备 | |
JP7178995B2 (ja) | コンピュータ学習および理解のためのアーキテクチャおよびプロセス | |
US9652719B2 (en) | Authoring system for bayesian networks automatically extracted from text | |
US10496756B2 (en) | Sentence creation system | |
CN110263177A (zh) | 用于事件预测的知识图构建方法与事件预测方法 | |
Ellis | Frequency-based grammar and the acquisition of tense and aspect in L2 learning | |
Rodrigues et al. | Advanced applications of natural language processing for performing information extraction | |
CN112149427A (zh) | 动词短语蕴含图谱的构建方法及相关设备 | |
Chen | Computational generation of Chinese noun phrases | |
CN111046168B (zh) | 用于生成专利概述信息的方法、装置、电子设备和介质 | |
Kwong | New perspectives on computational and cognitive strategies for word sense disambiguation | |
CN114970516A (zh) | 数据增强方法及装置、存储介质、电子设备 | |
Gunasiri | Automated cricket news generation in Sri Lankan style using natural language generation | |
CN113468875A (zh) | 一种面向SCADA系统自然语言交互接口语义分析的MNet方法 | |
CN110046346A (zh) | 一种语料意图监控的方法和装置、终端设备 | |
Panesar | An evaluation of a linguistically motivated conversational software agent framework | |
Dornescu | Semantic QA for encyclopaedic questions: EQUAL in GikiCLEF | |
Speer | Learning common sense knowledge from user interaction and principal component analysis | |
Neustein | SpringerBriefs in Electrical and Computer Engineering | |
Muszynska | Semantic chunking | |
CN115600608A (zh) | 语义信息提取方法、装置、设备及存储介质 | |
Smets | A U-DOP approach to modeling language acquisition | |
Van Beusekom et al. | Textual similarity | |
Materna | Probabilistic Semantic Frames | |
Wilkens | A study of the use of Natural Language Processing for Conversational Agents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |