CN109635091A - 一种语义识别方法、装置、终端设备和存储介质 - Google Patents

一种语义识别方法、装置、终端设备和存储介质 Download PDF

Info

Publication number
CN109635091A
CN109635091A CN201811533269.0A CN201811533269A CN109635091A CN 109635091 A CN109635091 A CN 109635091A CN 201811533269 A CN201811533269 A CN 201811533269A CN 109635091 A CN109635091 A CN 109635091A
Authority
CN
China
Prior art keywords
information
phrases
words
default
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811533269.0A
Other languages
English (en)
Inventor
潘晶
高再荣
沈满
崔瑶
陈彦品
董超
薛长城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Titanium Robot Technology Co Ltd
Original Assignee
Shanghai Titanium Robot Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Titanium Robot Technology Co Ltd filed Critical Shanghai Titanium Robot Technology Co Ltd
Priority to CN201811533269.0A priority Critical patent/CN109635091A/zh
Publication of CN109635091A publication Critical patent/CN109635091A/zh
Pending legal-status Critical Current

Links

Abstract

本申请实施例公开了一种语义识别方法、装置、终端设备和存储介质,该方法包括:获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。本申请实施例可以对用户输入的文本进行自动识别,确定对应的反馈信息,用户可以通过反馈信息了解到想要知道的信息。

Description

一种语义识别方法、装置、终端设备和存储介质
技术领域
本申请实施例涉及语义识别技术,尤其涉及一种语义识别方法、装置、终端设备和存储介质。
背景技术
病人去医院看病时,有时候需要咨询一些与医疗相关的问题,但是医院往往有很多病人,如果医护人员需要一一解答病人的咨询问题,会给医护人员增加很多工作量,降低医护人员的工作效率。
发明内容
本申请实施例提供一种语义识别方法、装置、终端设备和存储介质,可以自动识别用户的咨询问题并提供对应的信息。
第一方面,本申请实施例提供了一种语义识别方法,包括:
获取待处理文本信息;
对所述待处理文本信息进行分词处理,以确定分词信息;
将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;
将所述目标词句信息对应的预设信息确定为反馈信息。
进一步地,对所述待处理文本信息进行分词处理,以确定分词信息包括:
对所述待处理文本信息进行分词处理以得到分解词语,并确定每个分解词语的权重值;
将所述分解词语和对应的权重值确定为分词信息。
进一步地,所述将所述分解词语和对应的权重值确定为分词信息之前,还包括:
依据预设的频用词列表调整每个分解词语的权重值,以使属于频用词列表的分解词语的权重降低。
进一步地,所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,包括:
将所述分解词语与预设知识库中的预设词句信息进行匹配,并根据每个分解词语的权重值确定所述分词信息与所述预设词句信息的匹配值;
确定所述分词信息与所有预设词句信息的匹配值,将匹配值最高的预设词句信息确定为目标词句信息。
进一步地,所述对所述待处理文本信息进行分词处理以得到分解词语包括:
依据预设的关键词列表对所述待处理文本信息进行分词处理;
如果所述待处理文本信息中所包括的连续词语属于所述关键词列表,则确定所述连续词语为一个分解词语。
进一步地,所述将所述分词信息与预设知识库中的预设词句信息进行匹配之前,还包括:
依据所述连续词语从预设知识库中确定对应的预设词句信息,并确定为待匹配词句信息;
所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,包括:
将所述分词信息与所述待匹配词句信息进行匹配,以从所述待匹配词句信息中确定目标词句信息。
进一步地,所述获取待处理文本信息之前,还包括:
获取用户输入的语音信息,对所述语音信息进行文本识别以获取待处理文本。
第二方面,本申请实施例还提供了一种语义识别装置,包括:
信息获取模块,用于获取待处理文本信息;
分词模块,用于对所述待处理文本信息进行分词处理,以确定分词信息;
匹配模块,用于将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;
反馈模块,用于将所述目标词句信息对应的预设信息确定为反馈信息。
第三方面,本申请实施例还提供了一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请任意实施例所述的语义识别方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任意实施例所述的语义识别方法。
本申请实施例公开了一种语义识别方案,通过获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。本申请实施例可以对用户输入的文本进行自动识别,确定对应的反馈信息,用户可以通过反馈信息了解到想要知道的信息。
附图说明
图1是本申请实施例一提供的语义识别方法的流程图;
图2是本申请实施例二提供的语义识别方法的流程图;
图3是本申请实施例三提供的语义识别方法的流程图;
图4是本申请实施例四中的语义识别装置的结构示意图;
图5是本申请实施例六中的一种终端设备的硬件结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
实施例一
图1为本申请实施例一提供的语义识别方法的流程图,该方法可以由语义识别装置来执行,其中,该装置可以由软件和/或硬件实现,一般可以集成在硬件平台上,具体包括如下步骤:
S110、获取待处理文本信息。
所述待处理文本信息可以是用户通过输入端所输入的文本信息。示例性地,本申请实施例的语义识别方法可以应用在医护机器人上,医护机器人上设置有键盘或触摸屏,用户可以通过键盘或触摸屏输入待处理文本信息。所述待处理文本信息一般是用户所提出的问题,可以根据本申请实施例的具体应用场景来确定所述待处理文本信息的类型。如果所述语音识别方法应用在医护机器人上,所述待处理文本信息为用户输入的关于医疗相关的问题。
可选地,还可以是获取用户输入的语音信息,对所述语音信息进行文本识别以获取待处理文本。
所述用户可以通过说话来输入语音信息,采集到用户的语音信息之后进行文本识别就可以得到对应的待处理文本。示例性地,如果本申请实施例应用在医护机器人上,医护机器人上设置有麦克风和语音处理模块,通过麦克风采集用户输入的语音信息,然后通过语音处理模块将麦克风采集的语音信息进行文本识别,以得到对应的待处理文本。
S111、对所述待处理文本信息进行分词处理,以确定分词信息。
所述待处理文本信息包括至少一个句子,可以对句子进行分词处理。所述分词处理用于将一个句子依据预设分词规则划分为若干个分解词语。
示例性地,可以根据正则表达式将待处理文本信息分成至少一个句子,进而根据预设的前缀词典对该句子进行扫描,并确定若干个切分的方案;对于每个切分方案构建有向无环图(DAG,Directed Acyclic Graph),并根据动态规则算法,计算得到最大概率路径,以确定最终的切分方案,并依据最终的切分方案将该句子划分为若干个分解词语。所述分词信息包括对所述待处理文本进行分词处理所得到的若干个分解词语。
S112、将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息。
其中,所述预设知识库中包括预设词句信息以及对应的预设信息。预设词句信息为与待处理文本同一个类型的句子,所述预设信息为与预设词句信息相对应的信息。示例性地,如果待处理文本为用户输入的提问,相应地预设词句信息也是提问信息,而预设信息是与提问信息相对应的解答信息。
所述预设知识库中包括多个预设词句信息以及分别对应的预设信息,预设知识库中一般是包括针对一个领域的预设词句信息。示例性地,如果本申请实施例是应用在医护机器人上,则所述预设知识库中可以是包括与医疗相关的提问信息和对应的解答信息。
其中,可以将所述分词信息与预设知识库中的所有的预设词句信息进行匹配,并从中选择一个匹配度最高的确定为目标词句信息。相应地,预设知识库的预设词句信息包括预设的句子和对应的预设分词信息,可以将所述分词信息和预设词句信息中的预设分词信息进行匹配。
示例性地,如果用户输入的待处理文本信息包括:“甲状腺是什么”的提问,对该待处理文本信息进行分词后的分词信息包括“甲状腺”、“是”和“什么”;而预设知识库中包括的两个预设词句信息分别是“什么是甲状腺”和“甲状腺的症状有什么”,前一个预设词句信息对应的预设分词信息包括“什么”、“是”和“甲状腺”,后一个预设词句信息对应的预设分词信息包括“甲状腺”、“的”、“症状”、“有”和“什么”;将分词信息分别和两个预设分词信息进行匹配,前者的匹配度更高,后者的匹配度更低,所以可以确定前一个预设词句信息为目标词句信息。
S113、将所述目标词句信息对应的预设信息确定为反馈信息。
其中,每个预设词句信息都有对应的预设信息,将目标词句信息对应的预设信息确定为反馈信息。所述反馈信息为用于回复待处理文本信息的信息,示例性地,如果所述待处理文本信息为用户输入的提问信息,则反馈信息就是用于回复用户的提问信息,即将和提问信息对应的解答信息反馈给用户。如果所述待处理文本信息为用户输入的功能咨询信息,则反馈信息就是用于回复用户的指引信息,即将指引信息反馈给用户。
相应地,在将所述目标词句信息对应的预设信息确定为反馈信息后,还包括将所述反馈信息发送至用户。示例性地,如果用户是通过医护机器人输入的待处理文本信息,可以通过医护机器人的显示模块显示所述反馈信息,或者通过医护机器人的扬声器播放所述反馈信息,以使用户接收到反馈信息。
本申请实施例公开了一种语义识别方法,包括获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。本申请实施例可以对用户输入的文本进行自动识别,确定对应的反馈信息,用户可以通过反馈信息了解到想要知道的信息。
实施例二
图2为本申请实施例二提供的语义识别方法的流程图,该方法可以由语义识别装置来执行,其中,该装置可以由软件和/或硬件实现,一般可以集成在硬件平台上,在上述实施例的基础上,该方法包括如下步骤:
S120、获取待处理文本信息。
具体实施方式可以参考上文的相关描述,在此不再赘述。
S121、对所述待处理文本信息进行分词处理以得到分解词语,并确定每个分解词语的权重值。
对所述待处理文本信息进行分词处理以得到分解词语的具体实施方式可以参考上文的相关描述,在此不再赘述。
所述分解词语的权重值,可以是该分解词语在整个待处理文本信息的句子中的影响程度。可以依据预设的分词权重表来对分解词语赋予权重,所述分词权重表可以依据不同的应用领域来进行确定,示例性地,如果本申请实施例应用在医护机器人上,则所述分词权重表中主要是包括针对医疗相关的词语,以及对应的权重。一般来说,属于分词权重表中的分解词语所获得的权重会比其他不属于分词权重表中的分解词语的权重要高。
可选地,所述对所述待处理文本信息进行分词处理以得到分解词语可以通过下述方式实施:
依据预设的关键词列表对所述待处理文本信息进行分词处理;如果所述待处理文本信息中所包括的连续词语属于所述关键词列表,则确定所述连续词语为一个分解词语。
其中,所述预设关键词列表中预存了所应用的专业领域相关的词语,在对待处理文本信息进行分词处理时,可以直接依据预设关键词列表中的预设关键词,将待处理文本信息中与预设关键词相匹配的连续词语确定为一个分解词语,而无需对该词语判断是否分词。所述连续词语为:处理文本信息中至少一个连续的字所组成的词语。
因为,不同词语的长短有所不同,所以如果依据预设分词规则来进行分词处理时,需要对一个句子进行一一扫描并判断;而如果直接将一个句子中的一个连续词语确定为了分解词语,则无需再对该词语进行判断。如此,可以降低依据预设分词规则进行分词处理的工作量。
可选地,所述将所述分解词语和对应的权重值确定为分词信息之前,还包括:
依据预设的频用词列表调整每个分解词语的权重值,以使属于频用词列表的分解词语的权重降低。
其中,所述频用词列表中包括了常用的但是在待处理文本信息中的影响程度较低的词语。示例性地,“的”“了”或“啊”等词语,在一句话中可能会出现多个,但是这些词并没有实际含义,在进行匹配时的影响程度较低。所以依据预设的频用词列表,来调整每个分解词语的权重值,来降低属于频用词列表中的分解词语的权重,从而可以提高将分词信息与预设词句信息进行匹配的准确度。
S122、将所述分解词语和对应的权重值确定为分词信息。
所述分词信息包括了待处理文本信息所拆分的分解词语,以及每个分解词语对应的权重值,进而可以依据分解词语和对应的权重值去进行匹配。
S123、将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息。
相应地,所述知识库中包括的预设词句信息的预设分词信息也包括预设分解词语,将分解词语和预设知识库中的预设分解词语进行匹配的具体实施方式可以参考上文的相关描述。
可选地,所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息可以通过下述方式实施:
将所述分解词语与预设知识库中的预设词句信息进行匹配,并根据每个分解词语的权重值确定所述分词信息与所述预设词句信息的匹配值;
确定所述分词信息与所有预设词句信息的匹配值,将匹配值最高的预设词句信息确定为目标词句信息。
其中,对于每个分解词语和每个预设分解词语的匹配可以是:将与分解词语匹配度最高的预设分解词所对应的匹配值,确定为该分解词语的匹配值。示例性地,如果一个分解词语是“甲状腺”,一个预设分解词语是“甲状腺”;另一个预设分解词语是“状况”。该分解词语与前一个预设分解词语完全匹配,匹配值较高,而分解词语与后一个预设分解词语的权重相差较大,所以其匹配值相对较低,可以选择匹配值高的作为该分解词语的匹配值。
进而可以确定一个分词信息中的所有的分解词语和一个预设词句信息中的预设分解词语的匹配值,并将每个分解词语的匹配值乘以每个分解词语对应的权重,并将所有分解词语的匹配值和权重的乘机相加,确定为该分词信息与该预设词句信息的匹配值。
最终再根据所述分词信息与所有预设词句信息的匹配值,从中选择匹配值最高的预设词句信息确定为目标词句信息。
可选地,将匹配值最高以及匹配值高于预设匹配值的预设词句信息确定为目标词句信息,在没有匹配到合适的预设词句信息时不反馈信息,避免给用户错误的反馈信息。
S124、将所述目标词句信息对应的预设信息确定为反馈信息。
具体实施方式可以参考上文的相关描述,在此不再赘述。
本申请实施例通过对所述待处理文本信息进行分词处理以得到分解词语,并确定每个分解词语的权重值,将所述分解词语和对应的权重值确定为分词信息,并将所述分词信息与预设知识库中的预设词句信息进行匹配,增加了对每个分解词语设置权重来确定该分解词语对整个句子的影响程度,可以提高匹配的准确性。
实施例三
图3为本申请实施例三提供的语义识别方法的流程图,该方法可以由语义识别装置来执行,其中,该装置可以由软件和/或硬件实现,一般可以集成在硬件平台上,具体包括如下步骤:
S130、获取待处理文本信息。
S131、依据预设的关键词列表对所述待处理文本信息进行分词处理;如果所述待处理文本信息中所包括的连续词语属于所述关键词列表,则确定所述连续词语为一个分解词语。
S132、确定每个分解词语的权重值。
上述操作的具体实施方式可以参考上文的相关描述,在此不再赘述。
S133、依据所述连续词语从预设知识库中确定对应的预设词句信息,并确定为待匹配词句信息;其中,所述预设知识库中包括预设词句信息以及对应的预设信息。
S134、将所述分词信息与所述待匹配词句信息进行匹配,以从所述待匹配词句信息中确定目标词句信息。
所述预设关键词列表中预存了所应用的专业领域相关的词语,如果连续词语属于关键词列表,则表示所述连续词语属于应用的专业领域相关的词语,预设知识库中有与连续词语相应类型的预设词句信息。
可以从预设知识库中选出与该连续词语相关的预设词句信息确定为待匹配词句信息,并将所述分词信息与挑选出来的待匹配词句信息进行匹配来确定目标词句信息。所述分词信息可以无需与知识库中的所有预设词句信息进行匹配,可以提高匹配的速度。
相应地,可以将所述分解词语与待匹配词句信息进行匹配,并根据每个分解词语的权重值确定所述分词信息与待匹配词句信息的匹配值;确定所述分词信息与所有待匹配词句信息的匹配值,将匹配值最高的待匹配词句信息确定为目标词句信息。
具体实施方式可以参考上文的相关描述,在此不再赘述。
S135、将所述目标词句信息对应的预设信息确定为反馈信息。
上述操作的具体实施方式可以参考上文的相关描述,在此不再赘述。
本申请实施例通过依据所述连续词语从预设知识库中确定对应的预设词句信息,并确定为待匹配词句信息,将所述分词信息与所述待匹配词句信息进行匹配,以从所述待匹配词句信息中确定目标词句信息,可以提高匹配的速度。
实施例四
图4为本申请实施例四提供的语义识别装置的结构示意图,该装置可以由软件和/或硬件实现,一般可以集成在硬件平台上。如图4所示,所述语义识别装置包括:
信息获取模块201,用于获取待处理文本信息;
分词模块202,用于对所述待处理文本信息进行分词处理,以确定分词信息;
匹配模块203,用于将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;
反馈模块204,用于将所述目标词句信息对应的预设信息确定为反馈信息。
本申请实施例公开了一种语义识别装置,通过获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。本申请实施例可以对用户输入的文本进行自动识别,确定对应的反馈信息,用户可以通过反馈信息了解到想要知道的信息。
可选地,分词模块具体包括:
分词权重模块,用于对所述待处理文本信息进行分词处理以得到分解词语,并确定每个分解词语的权重值;
分词确定模块,用于将所述分解词语和对应的权重值确定为分词信息。
可选地,还包括:
权重调整模块,用于在所述将所述分解词语和对应的权重值确定为分词信息之前,依据预设的频用词列表调整每个分解词语的权重值,以使属于频用词列表的分解词语的权重降低。
可选地,匹配模块具体用于:
将所述分解词语与预设知识库中的预设词句信息进行匹配,并根据每个分解词语的权重值确定所述分词信息与所述预设词句信息的匹配值;
确定所述分词信息与所有预设词句信息的匹配值,将匹配值最高的预设词句信息确定为目标词句信息。
可选地,分词权重模块具体用于:
依据预设的关键词列表对所述待处理文本信息进行分词处理;
如果所述待处理文本信息中所包括的连续词语属于所述关键词列表,则确定所述连续词语为一个分解词语。
可选地,还包括:
待匹配选择模块,用于在所述将所述分词信息与预设知识库中的预设词句信息进行匹配之前,依据所述连续词语从预设知识库中确定对应的预设词句信息,并确定为待匹配词句信息;
匹配模块具体用于:
将所述分词信息与所述待匹配词句信息进行匹配,以从所述待匹配词句信息中确定目标词句信息。
可选地,还包括:
语音获取模块,用于在所述获取待处理文本信息之前,获取用户输入的语音信息,对所述语音信息进行文本识别以获取待处理文本。
实施例五
本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行语义识别方法,该方法包括:
获取待处理文本信息;
对所述待处理文本信息进行分词处理,以确定分词信息;
将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;
将所述目标词句信息对应的预设信息确定为反馈信息。
可选的,该计算机可执行指令在由计算机处理器执行时还可以用于执行本申请任意实施例所提供的语义识别方法。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器 (Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例六
如图5所示,为本申请实施例六提供的一种终端设备的硬件结构示意图,如图5所示,该终端设备包括:
一个或多个处理器410,图5中以一个处理器410为例;
存储器420;
所述终端设备还可以包括:输入装置430和输出装置440。
所述终端设备中的处理器410、存储器420、输入装置430和输出装置440 可以通过总线或者其他方式连接,图5中以通过总线连接为例。
存储器420作为一种非暂态计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请实施例中的一种语义识别方法对应的程序指令/模块(例如,图4所示的信息获取模块201、分词模块202、匹配模块 203和反馈模块204)。处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行终端设备的各种功能应用以及数据处理,即实现上述方法实施例的一种语义识别方法。
存储器420可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非暂态性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中,存储器420可选包括相对于处理器410 远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的数字或字符信息,以及产生与终端设备的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏等显示设备。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (10)

1.一种语义识别方法,其特征在于,包括:
获取待处理文本信息;
对所述待处理文本信息进行分词处理,以确定分词信息;
将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;
将所述目标词句信息对应的预设信息确定为反馈信息。
2.根据权利要求1所述的方法,其特征在于,对所述待处理文本信息进行分词处理,以确定分词信息包括:
对所述待处理文本信息进行分词处理以得到分解词语,并确定每个分解词语的权重值;
将所述分解词语和对应的权重值确定为分词信息。
3.根据权利要求2所述的方法,其特征在于,所述将所述分解词语和对应的权重值确定为分词信息之前,还包括:
依据预设的频用词列表调整每个分解词语的权重值,以使属于频用词列表的分解词语的权重降低。
4.根据权利要求2所述的方法,其特征在于,所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,包括:
将所述分解词语与预设知识库中的预设词句信息进行匹配,并根据每个分解词语的权重值确定所述分词信息与所述预设词句信息的匹配值;
确定所述分词信息与所有预设词句信息的匹配值,将匹配值最高的预设词句信息确定为目标词句信息。
5.根据权利要求2所述的方法,其特征在于,所述对所述待处理文本信息进行分词处理以得到分解词语包括:
依据预设的关键词列表对所述待处理文本信息进行分词处理;
如果所述待处理文本信息中所包括的连续词语属于所述关键词列表,则确定所述连续词语为一个分解词语。
6.根据权利要求5所述的方法,其特征在于,所述将所述分词信息与预设知识库中的预设词句信息进行匹配之前,还包括:
依据所述连续词语从预设知识库中确定对应的预设词句信息,并确定为待匹配词句信息;
所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,包括:
将所述分词信息与所述待匹配词句信息进行匹配,以从所述待匹配词句信息中确定目标词句信息。
7.根据权利要求1所述的方法,其特征在于,所述获取待处理文本信息之前,还包括:
获取用户输入的语音信息,对所述语音信息进行文本识别以获取待处理文本。
8.一种语义识别装置,其特征在于,包括:
信息获取模块,用于获取待处理文本信息;
分词模块,用于对所述待处理文本信息进行分词处理,以确定分词信息;
匹配模块,用于将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;
反馈模块,用于将所述目标词句信息对应的预设信息确定为反馈信息。
9.一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7所述的语义识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7所述的语义识别方法。
CN201811533269.0A 2018-12-14 2018-12-14 一种语义识别方法、装置、终端设备和存储介质 Pending CN109635091A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811533269.0A CN109635091A (zh) 2018-12-14 2018-12-14 一种语义识别方法、装置、终端设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811533269.0A CN109635091A (zh) 2018-12-14 2018-12-14 一种语义识别方法、装置、终端设备和存储介质

Publications (1)

Publication Number Publication Date
CN109635091A true CN109635091A (zh) 2019-04-16

Family

ID=66074190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811533269.0A Pending CN109635091A (zh) 2018-12-14 2018-12-14 一种语义识别方法、装置、终端设备和存储介质

Country Status (1)

Country Link
CN (1) CN109635091A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502752A (zh) * 2019-08-21 2019-11-26 北京一链数云科技有限公司 一种文本处理方法、装置、设备及计算机存储介质
CN110851579A (zh) * 2019-11-06 2020-02-28 杨鑫蛟 用户意图识别方法、系统、移动终端及存储介质
CN111597324A (zh) * 2020-05-20 2020-08-28 北京搜狗科技发展有限公司 一种文本查询方法及装置
CN112331211A (zh) * 2021-01-06 2021-02-05 北京世纪好未来教育科技有限公司 学情信息获取方法、装置、设备和存储介质
CN112559699A (zh) * 2020-11-09 2021-03-26 联想(北京)有限公司 一种信息交互方法、装置及设备
CN112786041A (zh) * 2020-12-23 2021-05-11 平安普惠企业管理有限公司 语音处理方法及相关设备
CN113468886A (zh) * 2021-07-28 2021-10-01 拉扎斯网络科技(上海)有限公司 工单处理方法、装置及计算机设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679910A (zh) * 2015-03-25 2015-06-03 北京智齿博创科技有限公司 智能应答方法及系统
CN107368572A (zh) * 2017-07-13 2017-11-21 张勇 多功能智能人机交互方法及系统
CN107451119A (zh) * 2017-07-26 2017-12-08 上海智臻智能网络科技股份有限公司 基于语音交互的语义识别方法及装置、存储介质、计算机设备
CN107609101A (zh) * 2017-09-11 2018-01-19 远光软件股份有限公司 智能交互方法、设备及存储介质
CN107818781A (zh) * 2017-09-11 2018-03-20 远光软件股份有限公司 智能交互方法、设备及存储介质
CN107832286A (zh) * 2017-09-11 2018-03-23 远光软件股份有限公司 智能交互方法、设备及存储介质
CN108922634A (zh) * 2018-06-13 2018-11-30 平安医疗科技有限公司 基于在线问诊的问题答复处理方法、装置和计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679910A (zh) * 2015-03-25 2015-06-03 北京智齿博创科技有限公司 智能应答方法及系统
CN107368572A (zh) * 2017-07-13 2017-11-21 张勇 多功能智能人机交互方法及系统
CN107451119A (zh) * 2017-07-26 2017-12-08 上海智臻智能网络科技股份有限公司 基于语音交互的语义识别方法及装置、存储介质、计算机设备
CN107609101A (zh) * 2017-09-11 2018-01-19 远光软件股份有限公司 智能交互方法、设备及存储介质
CN107818781A (zh) * 2017-09-11 2018-03-20 远光软件股份有限公司 智能交互方法、设备及存储介质
CN107832286A (zh) * 2017-09-11 2018-03-23 远光软件股份有限公司 智能交互方法、设备及存储介质
CN108922634A (zh) * 2018-06-13 2018-11-30 平安医疗科技有限公司 基于在线问诊的问题答复处理方法、装置和计算机设备

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110502752A (zh) * 2019-08-21 2019-11-26 北京一链数云科技有限公司 一种文本处理方法、装置、设备及计算机存储介质
CN110851579A (zh) * 2019-11-06 2020-02-28 杨鑫蛟 用户意图识别方法、系统、移动终端及存储介质
CN110851579B (zh) * 2019-11-06 2023-03-10 杨鑫蛟 用户意图识别方法、系统、移动终端及存储介质
CN111597324A (zh) * 2020-05-20 2020-08-28 北京搜狗科技发展有限公司 一种文本查询方法及装置
CN111597324B (zh) * 2020-05-20 2023-10-03 北京搜狗科技发展有限公司 一种文本查询方法及装置
CN112559699A (zh) * 2020-11-09 2021-03-26 联想(北京)有限公司 一种信息交互方法、装置及设备
CN112786041A (zh) * 2020-12-23 2021-05-11 平安普惠企业管理有限公司 语音处理方法及相关设备
CN112786041B (zh) * 2020-12-23 2023-11-24 光禹莱特数字科技(上海)有限公司 语音处理方法及相关设备
CN112331211A (zh) * 2021-01-06 2021-02-05 北京世纪好未来教育科技有限公司 学情信息获取方法、装置、设备和存储介质
CN113468886A (zh) * 2021-07-28 2021-10-01 拉扎斯网络科技(上海)有限公司 工单处理方法、装置及计算机设备

Similar Documents

Publication Publication Date Title
CN109635091A (zh) 一种语义识别方法、装置、终端设备和存储介质
JP6751122B2 (ja) ページ制御方法および装置
US10963499B2 (en) Generating command-specific language model discourses for digital assistant interpretation
US10963495B2 (en) Automated discourse phrase discovery for generating an improved language model of a digital assistant
US10929613B2 (en) Automated document cluster merging for topic-based digital assistant interpretation
CN111428010B (zh) 人机智能问答的方法和装置
KR20190016653A (ko) 지능형 상담 서비스 제공 방법 및 시스템
JP6019604B2 (ja) 音声認識装置、音声認識方法、及びプログラム
JP6624539B1 (ja) クラス分類と回帰分類を組み合わせたaiチャットボットの構築方法
CN112287085B (zh) 语义匹配方法、系统、设备及存储介质
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
CN111694941A (zh) 一种回复信息确定方法、装置、存储介质及电子设备
CN113901837A (zh) 一种意图理解方法、装置、设备及存储介质
CN110931002B (zh) 人机交互方法、装置、计算机设备和存储介质
CN110390085B (zh) 文本相似度的分析方法、分析装置、存储介质和电子设备
KR20190074508A (ko) 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법
US20190279623A1 (en) Method for speech recognition dictation and correction by spelling input, system and storage medium
CN114490967B (zh) 对话模型的训练方法、对话机器人的对话方法、装置和电子设备
KR102534086B1 (ko) 복수의 멀티미디어 컨텐츠들을 참조하여 사용자 단말기와 통신하는 네트워크 서버 및 방법
CN111324710B (zh) 一种基于虚拟人的在线调研方法、装置和终端设备
CN113781998A (zh) 基于方言纠正模型的语音识别方法、装置、设备及介质
CN113643706A (zh) 语音识别方法、装置、电子设备及存储介质
US11775774B2 (en) Open input empathy interaction
JP6985311B2 (ja) 相槌判定によって応答発話生成を制御する対話実施プログラム、装置及び方法
CN110334344B (zh) 一种语义意图识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190416

RJ01 Rejection of invention patent application after publication