WO2023029513A1

WO2023029513A1 - 基于人工智能的搜索意图识别方法、装置、设备及介质

Info

Publication number: WO2023029513A1
Application number: PCT/CN2022/087820
Authority: WO
Inventors: 张华�
Original assignee: 康键信息技术（深圳）有限公司
Priority date: 2021-08-30
Filing date: 2022-04-20
Publication date: 2023-03-09
Also published as: CN113707300A; CN113707300B

Abstract

本申请涉及人工智能及智慧医疗技术领域，提供了一种基于人工智能的搜索意图识别方法、装置、设备及存储介质。所述方法包括：通过规则集与查询语句进行匹配，若规则集中未匹配到查询语句的意图时对查询语句执行分词，确定分词操作后的查询语句关键词，并提取各关键词的实体类型，将各关键词的实体类型与标签词典树进行匹配，得到各实体类型对应的标签意图，基于各实体类型的标签意图得到查询语句的目标意图，当各关键词的实体类型与标签词典树均未匹配出标签意图时，将查询语句输入意图识别模型得到查询语句的目标意图。本申请更准确地识别医疗领域中查询语句的搜索意图。本申请还涉及区块链技术领域，上述实体类型可以存储于一区块链的节点中。

Description

基于人工智能的搜索意图识别方法、装置、设备及介质

本申请要求于2021年08月30日提交中国专利局、申请号为202111002384.7，发明名称为“基于人工智能的搜索意图识别方法、装置、设备及介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种基于人工智能的搜索意图识别方法、装置、设备及存储介质。

背景技术

搜索意图识别是指对用户的搜索词条进行分析，获得用户意图与需求，从而向用户推荐用户最需要的产品或内容。因此提高搜索识别意图能够提高产品或内容推荐的准确率。

发明人意识到，目前的搜索意图识别方案大多是采用词向量对搜索词条进行语义表示，词向量基于上下文的含义得到，而在智能医疗领域，用户输入的搜索语句具有不规范且长度不一的情况，获得的词向量表示能力较差，导致搜索意图识别准确率低。

技术解决方案

本申请提供一种基于人工智能的搜索意图识别方法，该方法包括：

将用户输入的查询语句与预设的规则集进行匹配，判断在所述规则集中是否匹配到所述查询语句的目标意图；

当判断在所述规则集中未匹配到所述查询语句的目标意图时，对所述查询语句执行分词操作，确定分词操作后的查询语句的至少一个关键词，并提取各关键词的实体类型；

将各关键词的实体类型与预先建立的标签词典树进行匹配，判断在所述标签词典树中是否匹配到实体类型的标签意图，当判断在所述标签词典树中匹配到实体类型的标签意图时，获取匹配成功的实体类型的标签意图，基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图；

当判断在所述标签词典树中未匹配到实体类型的标签意图时，将所述查询语句输入预先建立的意图识别模型，得到所述查询语句的目标意图。

本申请还提供一种基于人工智能的搜索意图识别装置，该基于人工智能的搜索意图识别装置包括：

第一匹配模块：用于将用户输入的查询语句与预设的规则集进行匹配，判断在所述规则集中是否匹配到所述查询语句的目标意图；

提取模块：用于当判断在所述规则集中未匹配到所述查询语句的目标意图时，对所述查询语句执行分词操作，确定分词操作后的查询语句的至少一个关键词，并提取各关键词的实体类型；

第二匹配模块：用于将各关键词的实体类型与预先建立的标签词典树进行匹配，判断在所述标签词典树中是否匹配到实体类型的标签意图，当判断在所述标签词典树中匹配到实体类型的标签意图时，获取匹配成功的实体类型的标签意图，基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图；

识别模块：用于当判断在所述标签词典树中未匹配到实体类型的标签意图时，将所述查询语句输入预先建立的意图识别模型，得到所述查询语句的目标意图。

本申请还提供一种电子设备，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的程序，所述程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行如下所述的基于人工智能的搜索意图识别方法：

本申请还提供一种计算机可读存储介质，所述计算机可读存储介质存储有基于人工智能的搜索意图识别程序，所述基于人工智能的搜索意图识别程序被处理器执行时，实现如下所述基于人工智能的搜索意图识别方法：

附图说明

图1为本申请基于人工智能的搜索意图识别方法较佳实施例的流程图示意图；

图2为本申请基于人工智能的搜索意图识别装置较佳实施例的模块示意图；

图3为本申请电子设备较佳实施例的示意图；

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

本发明的实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能（ArtificialIntelligence，AI）是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请提供一种基于人工智能的搜索意图识别方法。参照图1所示，为本申请基于人工智能的搜索意图识别方法的实施例的方法流程示意图。该方法可以由一个电子设备执行，该电子设备可以由软件和/或硬件实现。基于人工智能的搜索意图识别方法包括：

步骤S10：将用户输入的查询语句与预设的规则集进行匹配，判断在所述规则集中是否匹配到所述查询语句的目标意图。

本方案的应用场景可以是用户在使用具有搜索功能的APP（例如，智能医疗领域的APP）时，对用户的搜索意图进行识别，以反馈用户最想要的搜索结果，例如，识别出用户是想“购药”、“挂号”或者“问诊”的意图，以反馈相关的信息给用户。本方案以智能医疗APP为例对本方案进行说明，需要说明的是，本方案的实际应用场景并不仅限于上述APP，还可以是社交类APP、电商类APP。

在本实施例中，当侦测到用户在安装有智能医疗APP的终端输入查询语句并发起搜索请求时，获取用户在交互界面中输入的查询语句，可以理解的是，用户输入的内容可以是查询语句，也可以是查询词，例如，某种药品的名称、医院的名称或者某种疾病的名称等。之后，将用户输入的查询语句与预设的规则集进行匹配，判断是否匹配到查询语句的目标意图，其中，规则集包括多种常用的规则语句，规则集可以包括“药品规则集”、“医院规则集”等，“药品规则集”可以是指的各种药品的全称，其对应的意图可以是用户想搜索该药品的购买链接或了解药品详细信息、“医院规则集”可以是指医院的全称，其对应的意图可以是用户想在该医院就诊或了解该医院的科室等信息。

在一个实施例中，所述判断在预设的规则集中是否匹配到所述查询语句的目标意图，包括：

当所述查询语句与所述规则集中任一规则语句匹配成功时，将匹配成功的规则语句作为所述查询语句的目标意图；

当所述查询语句与所述规则集中所有规则语句均匹配失败时，判断在所述规则集中未匹配到所述查询语句的目标意图。

当查询语句与规则集中任一规则语句匹配成功时，即查询语句与规则集中的规则语句完成相同，将该规则语句对应的意图作为该查询语句的目标意图，根据该意图向用户反馈相关的搜索结果。若查询语句与规则集中所有规则语句均匹配失败时，则判断在规则集中未匹配到查询语句的目标意图。

例如，用户输入的查询语句是“腹可安片”，且规则集中收录了该药品规则语句，则识别其意图是想购买该药品或了解该药品的详细信息，将该药品的购买链接及该药品的详细信息反馈至用户。

步骤S20：当判断在所述规则集中未匹配到所述查询语句的目标意图时，对所述查询语句执行分词操作，确定分词操作后的查询语句的至少一个关键词，并提取各关键词的实体类型。

在本实施例中，由于收录的规则集不可能覆盖用户所有可能输入的查询语句，因此当利用规则集不能匹配出用户输入的查询语句的目标意图时，可以根据查询语句的关键词来识别该查询语句的目标意图。具体地，当判断在规则集未匹配到查询语句的目标意图时，对查询语句执行分词操作，例如，可以利用正向匹配拆分、逆向匹配拆分或最少切分算法对查询语句进行分词。确定分词操作后的查询语句的至少一个关键词，并根据命名实体识别算法提取各关键词的实体类型。

命名实体识别（NER）是在自然语言处理中的一个经典问题，其应用也较广泛，例如从一句话中识别出人名、地名，从搜索中识别出产品的名字，识别药物名称等等。本方案的实体提取算法可以是条件随机场模型，它是一种判别式概率模型，常用于标注或分析序列资料，如自然语言文字。

在一个实施例中，所述确定分词操作后的查询语句的至少一个关键词，包括：

遍历预先构建的关键词词典树各节点对应的关键词，将所述查询语句执行分词操作后得到的各个分词，分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配，当所述各个分词与所述关键词词典树任一节点对应的关键词匹配成功时，则将匹配成功的分词作为所述查询语句的关键词。

查询语句的关键词也可以称为主体词，在医疗健康领域内，业务主体是一个有限集合，主要包括疾病、症状、疗效、治疗方式、器官部位、品牌、商品类目、商品属性、科室、医院名称等一系列名词集合。可以建立词典树来匹配查询语句中出现的关键词，将查询语句的各个分词分别与词典树各节点对应的关键词进行匹配，若分词与关键词词典树的任一节点的关键词匹配成功，则将该分词作为查询语句的关键词。

进一步地，所述分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配，包括：

当所述各个分词与所述关键词词典树所有节点对应的关键词均匹配失败时，将所述各个分词转换为拼音并与预先构建的拼音字典树进行匹配，当任一分词的拼音与所述拼音词典树任一节点对应的关键词匹配成功时，将匹配成功的节点对应的关键词作为所述查询语句的关键词；

当所述各个分词的拼音与所述拼音词典树所有节点对应的关键词均匹配失败时，基于编辑距离计算所述各个分词与所述拼音词典树所有节点对应的关键词的差异值，选取差异值最小的关键词作为所述查询语句的关键词。

由于用户输入的查询语句可能包括错别字导致意图识别有误，因此，当分词与关键词词典树节点对应的关键词均匹配失败时，可以对查询语句的分词进行纠错处理，纠错以拼音为优先，因为音同字不同的错误情况较多，并且没有歧义。在建立关键词词典树的同时，还建立对应的关键词拼音词典树，会将匹配不到关键词的分词转换成拼音，在拼音词典树中再匹配一遍，若匹配成功，则将匹配成功的拼音词典树中的关键词作为查询语句的关键词。例如，若分词为“啊莫西淋”，会匹配到“阿莫西林”。

如果拼音词典树中仍未匹配到查询语句分词对应的关键词，则使用编辑距离计算分词与拼音词典树中关键词的差异值，选取差异值最小的关键词作为查询语句的关键词。医疗领域会有很多药品化学名的搜索场景，由于化学名很多是生僻字，用户会用形同音不同的方式去搜索。例如，“二甲双胍胶囊”，大多数用户会输入“二甲双瓜胶囊”，可以通过编辑距离进行纠错。编辑距离是指对二个字符串的差异程度的量化量测，量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。

在一个实施例中，确定分词操作后的查询语句的至少一个关键词，还包括：

计算各个分词在所述查询语句中的词频，基于所述词频计算出各个分词的IDF值及TF值，将各分词的IDF值与各个分词对应的TF值相乘得到各个分词的TF-IDF值，基于各个分词的TF-IDF值选取预设数量的预设词性的词所述查询语句的关键词。

由于一些口语化的疾病名称可能不在词典树中，因此还可以用TF-IDF算法来抽取一些口语化的关键词，例如：拉肚子（腹泻）。计算出IDF（逆文档频率值），然后再计算出问诊文本中每个词的TF（词频）值。其中，TF=（词语在文本中出现次数）/（各词语在文本中出现次数的总和），将IDF值与TF值相乘，得到该词的TF-IDF值，TF-IDF值可以评估字词对于文本中的重要程度，TF-IDF值越大表示作为关键词的优先级越高，若TF-IDF值越大，该词对语句的重要性越高。

在一个实施例中，也可以利用双向匹配算法对查询语句执行分词操作，具体分词步骤包括：

根据正向最大匹配法将读取到的分词与预设词库进行匹配，得到第一匹配结果，所述第一匹配结果中包含有第一数量的第一词组和第二数量的单字；

根据逆向最大匹配法将读取到的分词与预设词库进行匹配，得到第二匹配结果，所述第二匹配结果中包含有第三数量的第二词组和第四数量的单字；

若所述第一数量与所述第三数量相等且所述第二数量小于或者等于所述第四数量，或者，若所述第一数量小于所述第三数量，则将所述第一匹配结果作为该查询语句的分词结果；若所述第一数量与所述第二数量相等且所述第三数量大于所述第四数量，或者，若所述第一数量大于所述第三数量，则将所述第二匹配结果作为该查询语句的分词结果。

通过该分词方法来分析切分文本内容中前后组合内容的粘性，由于通常情况下词组能代表核心观点信息的概率更大，即通过词组更能表达出核心观点信息，因此，通过正反向同时进行分词匹配找出单字数量更少，词组数量更多的分词匹配结果，以作为切分的语句的分词结果，可提高分词的准确性。

步骤S30：将各关键词的实体类型与预先建立的标签词典树进行匹配，判断在所述标签词典树中是否匹配到实体类型的标签意图，当判断在所述标签词典树中匹配到实体类型的标签意图时，获取匹配成功的实体类型的标签意图，基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图。

在本实施例中，利用命名实体识别算法提取出查询语句中各关键词的实体类型之后，将各关键词的实体类型与预先建立的标签词典树进行匹配，标签词典树建立了医疗领域中常用词汇对应的标签意图，每个实体类型有对应的标签意图，例如，实体类型为“品牌”，则对应的标签意图是“购买”的意图。将查询语句关键词的实体类型与标签词典树进行匹配，可以得到各实体类型对应的标签意图，可以选取各实体类型中标签意图数最多的标签作为查询语句的目标意图。

例如，查询语句“汤臣倍健青少年液体钙软胶囊”，“汤臣倍健”的实体类型为“品牌”、“青少年”的实体类型为“人群”、“液体钙”的实体类型为“品类”、“软胶囊”实体类型为“药品名”，与标签词典树匹配的购买商品意图的有“品牌”、“液体钙”、“软件囊”3个词，匹配的问诊意图的有“人群”1个词，由此判断用户输入的查询语句是“购买”的意图。

词典树又称前缀树，是一种有序树，用于保存关联数组，其中的键通常是字符串，键不是直接保存在节点中，而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀，也就是这个节点对应的字符串，而根节点对应空字符串。一般情况下，不是所有的节点都有对应的值，只有叶子节点和部分内部节点所对应的键才有相关的值。

在一个实施例中，所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图，包括：

当所述用户为第一类型用户时，从各实体类型对应的标签意图中选取数量最大的标签意图作为所述查询语句的目标意图；

当所述用户为第二类型用户时，基于该用户的历史搜索对应的反馈信息，从各实体类型对应的标签意图中选取出所述查询语句的目标意图。

第一类型的用户是指新用户，可以将标签意图数量最多的标签作为查询语句的目标意图，第二类型用户是指老用户，可以根据该用户对历史搜索的反馈信息（即用户历史搜索的点击情况），从各实体类型中标签意图数选取出意图，例如，用户的历史搜索中，点击购买链接的次数是最多的，可以将购买作为该查询语句的目标意图。根据优先级规则，确定不同类型用户查询语句中各实体类型的标签意图的优先级顺序，可以更准确识别出用户输入的查询语句的目标意图。

判断所述各关键词的实体类型中是否存在预设类型的实体类型，当判断存在预设类型的实体类型时，将所述预设类型的实体类型对应的标签意图作为所述查询语句的目标意图。

预设类型的实体类型可以是指“医生姓名”，例如，当关键词存在某个医生的真实姓名，该关键词的实体类型为“医生姓名”，则将“医生姓名”对应的标签意图“问诊”作为查询语句的目标意图，即判断用户是想指定医生问诊，直接返回该医生的搜索结果。可以快速确定用户是否是搜索医生问诊的意图，根据历史的用户点击数据分析，在搜索人名的情况下，90%的用户是点击该名字的医生进行问诊。

步骤S40：当判断在所述标签词典树中未匹配到实体类型的标签意图时，将所述查询语句输入预先建立的意图识别模型，得到所述查询语句的目标意图。

在本实施例中，若查询语句关键词的实体类型与标签词典树均未匹配出标签意图时，说明用户输入的查询语句可能偏口语化或者偏方言化，标签词典树未能匹配出意图，因此，可以将查询语句输入预先建立的意图识别模型，得到查询语句的目标意图。其中，意图识别模型可以是根据doc2vec模型进行训练得到的，可以利用历史在线问诊的患者主诉和对应的拟诊结果生成样本集训练doc2vec模型得到意图识别模型。

例如，用户输入的查询语句为“小朋友拉粑粑像蛋花汤一样怎么办”之类的，词典树无法匹配出对应的标签意图，将该查询语句输入意图识别模型，输出的结果为“小儿腹泻”。

在一个实施例中，所述方法还包括：

计算所述查询语句与预设存储路径中各历史查询语句的相似度值，若存在相似度值大于预设阈值的目标历史查询语句，且所述目标历史查询语句的意图与所述意图识别模型识别所述查询语句得到的目标意图相同时，将所述目标历史查询语句的意图作为所述查询语句的目标意图。

将用户输入的查询语句与线上的历史查询语句进行相似度计算，根据相似度值来验证该查询语句的目标意图，若两者的相似度值大于预设阈值（例如，90%），且该历史查询语句的意图与意图识别模型识别查询语句得到的目标意图相同时，将该历史查询语句的意图作为查询语句的目标意图，可以利用历史查询语句的意图对用户输入的查询语句的意图进行验证；

若存在相似度值大于预设阈值的历史查询语句，但该历史查询语句的意图与意图识别模型识别查询语句得到的目标意图不相同，则将意图识别模型识别出的意图作为查询语句的目标意图。

参照图2所示，为本申请基于人工智能的搜索意图识别装置100的功能模块示意图。

本申请所述基于人工智能的搜索意图识别装置100可以安装于电子设备中。根据实现的功能，所述基于人工智能的搜索意图识别装置100可以包括第一匹配模块110、提取模块120、第二匹配模块130及识别模块140。本发所述模块也可以称之为单元，是指一种能够被电子设备处理器所执行，并且能够完成固定功能的一系列计算机程序段，其存储在电子设备的存储器中。

在本实施例中，关于各模块/单元的功能如下：

第一匹配模块110：用于将用户输入的查询语句与预设的规则集进行匹配，判断在所述规则集中是否匹配到所述查询语句的目标意图。

提取模块120，用于当判断在所述规则集中未匹配到所述查询语句的目标意图时，对所述查询语句执行分词操作，确定分词操作后的查询语句的至少一个关键词，并提取各关键词的实体类型。

第二匹配模块130，用于将各关键词的实体类型与预先建立的标签词典树进行匹配，判断在所述标签词典树中是否匹配到实体类型的标签意图，当判断在所述标签词典树中匹配到实体类型的标签意图时，获取匹配成功的实体类型的标签意图，基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图。

识别模块140，用于当判断在所述标签词典树中未匹配到实体类型的标签意图时，将所述查询语句输入预先建立的意图识别模型，得到所述查询语句的目标意图。

在一个实施例中，所述分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配，包括：

在一个实施例中，所述识别模块140还用于：

参照图3所示，为本申请电子设备1较佳实施例的示意图。

该电子设备1包括但不限于：存储器11、处理器12、显示器13及网络接口14。所述电子设备1通过网络接口14连接网络，获取原始数据。其中，所述网络可以是企业内部网（Intranet）、互联网（Internet）、全球移动通讯系统（GlobalSystemofMobilecommunication，GSM）、宽带码分多址（WidebandCodeDivisionMultipleAccess，WCDMA）、4G网络、5G网络、蓝牙（Bluetooth）、Wi-Fi、通话网络等无线或有线网络。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器（例如，SD或DX存储器等）、随机访问存储器（RAM）、静态随机访问存储器（SRAM）、只读存储器（ROM）、电可擦除可编程只读存储器（EEPROM）、可编程只读存储器（PROM）、磁性存储器、磁盘、光盘等，所述计算机可读存储介质可以是非易失性的，也可以是易失性的。在一些实施例中，所述存储器11可以是所述电子设备1的内部存储单元，例如该电子设备1的硬盘或内存。在另一些实施例中，所述存储器11也可以是所述电子设备1的外部存储设备，例如该电子设备1配备的插接式硬盘，智能存储卡（SmartMediaCard, SMC），安全数字（SecureDigital, SD）卡，闪存卡（FlashCard）等。当然，所述存储器11还可以既包括所述电子设备1的内部存储单元也包括其外部存储设备。本实施例中，存储器11通常用于存储安装于所述电子设备1的操作系统和各类应用软件，例如基于人工智能的搜索意图识别程序10的程序代码等。此外，存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器12在一些实施例中可以是中央处理器（CentralProcessingUnit，CPU）、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作，例如执行数据交互或者通信相关的控制和处理等。本实施例中，所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据，例如运行基于人工智能的搜索意图识别程序10的程序代码等。

显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管（OrganicLight-EmittingDiode，OLED）触摸器等。显示器13用于显示在电子设备1中处理的信息以及用于显示可视化的工作界面，例如显示数据统计的结果。

网络接口14可选地可以包括标准的有线接口、无线接口（如WI-FI接口），该网络接口14通常用于在所述电子设备1与其它电子设备之间建立通信连接。

图3仅示出了具有组件11-14以及基于人工智能的搜索意图识别程序10的电子设备1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选地，所述电子设备1还可以包括用户接口，用户接口可以包括显示器（Display）、输入单元比如键盘（Keyboard），可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管（OrganicLight-EmittingDiode，OLED）触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

该电子设备1还可以包括射频（RadioFrequency，RF）电路、传感器和音频电路等等，在此不再赘述。

在上述实施例中，处理器12执行存储器11中存储的基于人工智能的搜索意图识别程序10时可以实现如下步骤：

所述存储设备可以为电子设备1的存储器11，也可以为与电子设备1通讯连接的其它存储设备。

关于上述步骤的详细介绍，请参照上述图2关于基于人工智能的搜索意图识别装置100实施例的功能模块图以及图1关于基于人工智能的搜索意图识别方法实施例的流程图的说明。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质可以是非易失性的，也可以是易失性的。该计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器（ROM）、可擦除可编程只读存储器（EPROM）、便携式紧致盘只读存储器（CD-ROM）、USB存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括存储数据区和存储程序区，存储数据区存储根据区块链节点的使用所创建的数据，存储程序区存储有基于人工智能的搜索意图识别程序10，所述基于人工智能的搜索意图识别程序10被处理器执行时实现如下操作：

本申请之计算机可读存储介质的具体实施方式与上述基于人工智能的搜索意图识别方法的具体实施方式大致相同，在此不再赘述。

在另一个实施例中，本申请所提供的基于人工智能的搜索意图识别方法，为进一步保证上述所有出现的数据的私密和安全性，上述所有数据还可以存储于一区块链的节点中。例如实体类型及查询语句等，这些数据均可存储在区块链节点中。

需要说明的是，本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

需要说明的是，上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质（如ROM/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端设备（可以是手机，计算机，电子装置，或者网络设备等）执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种基于人工智能的搜索意图识别方法，应用于电子设备，其中，所述方法包括：

将用户输入的查询语句与预设的规则集进行匹配，判断在所述规则集中是否匹配到所述查询语句的目标意图；

当判断在所述规则集中未匹配到所述查询语句的目标意图时，对所述查询语句执行分词操作，确定分词操作后的查询语句的至少一个关键词，并提取各关键词的实体类型；

将各关键词的实体类型与预先建立的标签词典树进行匹配，判断在所述标签词典树中是否匹配到实体类型的标签意图，当判断在所述标签词典树中匹配到实体类型的标签意图时，获取匹配成功的实体类型的标签意图，基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图；

当判断在所述标签词典树中未匹配到实体类型的标签意图时，将所述查询语句输入预先建立的意图识别模型，得到所述查询语句的目标意图。
如权利要求1所述的基于人工智能的搜索意图识别方法，其中，所述确定分词操作后的查询语句的至少一个关键词，包括：

遍历预先构建的关键词词典树各节点对应的关键词，将所述查询语句执行分词操作后得到的各个分词，分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配，当所述各个分词与所述关键词词典树任一节点对应的关键词匹配成功时，则将匹配成功的分词作为所述查询语句的关键词。
如权利要求2所述的基于人工智能的搜索意图识别方法，其中，所述分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配，包括：

当所述各个分词与所述关键词词典树所有节点对应的关键词均匹配失败时，将所述各个分词转换为拼音并与预先构建的拼音字典树进行匹配，当任一分词的拼音与所述拼音词典树任一节点对应的关键词匹配成功时，将匹配成功的节点对应的关键词作为所述查询语句的关键词；

当所述各个分词的拼音与所述拼音词典树所有节点对应的关键词均匹配失败时，基于编辑距离计算所述各个分词与所述拼音词典树所有节点对应的关键词的差异值，选取差异值最小的关键词作为所述查询语句的关键词。
如权利要求1所述的基于人工智能的搜索意图识别方法，其中，所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图，包括：

当所述用户为第一类型用户时，从各实体类型对应的标签意图中选取数量最大的标签意图作为所述查询语句的目标意图；

当所述用户为第二类型用户时，基于该用户的历史搜索对应的反馈信息，从各实体类型对应的标签意图中选取出所述查询语句的目标意图。
如权利要求1所述的基于人工智能的搜索意图识别方法，其中，所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图，包括：

判断所述各关键词的实体类型中是否存在预设类型的实体类型，当判断存在预设类型的实体类型时，将所述预设类型的实体类型对应的标签意图作为所述查询语句的目标意图。
如权利要求1所述的基于人工智能的搜索意图识别方法，其中，所述判断在预设的规则集中是否匹配到所述查询语句的目标意图，包括：

当所述查询语句与所述规则集中任一规则语句匹配成功时，将匹配成功的规则语句作为所述查询语句的目标意图；

当所述查询语句与所述规则集中所有规则语句均匹配失败时，判断在所述规则集中未匹配到所述查询语句的目标意图。
如权利要求1至6中任意一项所述的基于人工智能的搜索意图识别方法，其中，在将所述查询语句输入预先建立的意图识别模型，得到所述查询语句的目标意图之后，所述方法还包括：

计算所述查询语句与预设存储路径中各历史查询语句的相似度值，若存在相似度值大于预设阈值的目标历史查询语句，且所述目标历史查询语句的意图与所述意图识别模型识别所述查询语句得到的目标意图相同时，将所述目标历史查询语句的意图作为所述查询语句的目标意图。
一种基于人工智能的搜索意图识别装置，其中，所述装置包括：

第一匹配模块：用于将用户输入的查询语句与预设的规则集进行匹配，判断在所述规则集中是否匹配到所述查询语句的目标意图；

提取模块：用于当判断在所述规则集中未匹配到所述查询语句的目标意图时，对所述查询语句执行分词操作，确定分词操作后的查询语句的至少一个关键词，并提取各关键词的实体类型；

第二匹配模块：用于将各关键词的实体类型与预先建立的标签词典树进行匹配，判断在所述标签词典树中是否匹配到实体类型的标签意图，当判断在所述标签词典树中匹配到实体类型的标签意图时，获取匹配成功的实体类型的标签意图，基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图；

识别模块：用于当判断在所述标签词典树中未匹配到实体类型的标签意图时，将所述查询语句输入预先建立的意图识别模型，得到所述查询语句的目标意图。
一种电子设备，其中，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的程序，所述程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行如下所述的基于人工智能的搜索意图识别方法：

将用户输入的查询语句与预设的规则集进行匹配，判断在所述规则集中是否匹配到所述查询语句的目标意图；

当判断在所述规则集中未匹配到所述查询语句的目标意图时，对所述查询语句执行分词操作，确定分词操作后的查询语句的至少一个关键词，并提取各关键词的实体类型；

将各关键词的实体类型与预先建立的标签词典树进行匹配，判断在所述标签词典树中是否匹配到实体类型的标签意图，当判断在所述标签词典树中匹配到实体类型的标签意图时，获取匹配成功的实体类型的标签意图，基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图；

当判断在所述标签词典树中未匹配到实体类型的标签意图时，将所述查询语句输入预先建立的意图识别模型，得到所述查询语句的目标意图。
如权利要求9所述的电子设备，其中，所述确定分词操作后的查询语句的至少一个关键词，包括：

遍历预先构建的关键词词典树各节点对应的关键词，将所述查询语句执行分词操作后得到的各个分词，分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配，当所述各个分词与所述关键词词典树任一节点对应的关键词匹配成功时，则将匹配成功的分词作为所述查询语句的关键词。
如权利要求10所述的电子设备，其中，所述分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配，包括：

当所述各个分词与所述关键词词典树所有节点对应的关键词均匹配失败时，将所述各个分词转换为拼音并与预先构建的拼音字典树进行匹配，当任一分词的拼音与所述拼音词典树任一节点对应的关键词匹配成功时，将匹配成功的节点对应的关键词作为所述查询语句的关键词；

当所述各个分词的拼音与所述拼音词典树所有节点对应的关键词均匹配失败时，基于编辑距离计算所述各个分词与所述拼音词典树所有节点对应的关键词的差异值，选取差异值最小的关键词作为所述查询语句的关键词。
如权利要求9所述的电子设备，其中，所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图，包括：

当所述用户为第一类型用户时，从各实体类型对应的标签意图中选取数量最大的标签意图作为所述查询语句的目标意图；

当所述用户为第二类型用户时，基于该用户的历史搜索对应的反馈信息，从各实体类型对应的标签意图中选取出所述查询语句的目标意图。
如权利要求9所述的电子设备，其中，所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图，包括：

判断所述各关键词的实体类型中是否存在预设类型的实体类型，当判断存在预设类型的实体类型时，将所述预设类型的实体类型对应的标签意图作为所述查询语句的目标意图。
如权利要求9所述的电子设备，其中，所述判断在预设的规则集中是否匹配到所述查询语句的目标意图，包括：

当所述查询语句与所述规则集中任一规则语句匹配成功时，将匹配成功的规则语句作为所述查询语句的目标意图；

当所述查询语句与所述规则集中所有规则语句均匹配失败时，判断在所述规则集中未匹配到所述查询语句的目标意图。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有基于人工智能的搜索意图识别程序，所述基于人工智能的搜索意图识别程序被处理器执行时，实现如下所述基于人工智能的搜索意图识别方法的步骤：

将用户输入的查询语句与预设的规则集进行匹配，判断在所述规则集中是否匹配到所述查询语句的目标意图；

当判断在所述规则集中未匹配到所述查询语句的目标意图时，对所述查询语句执行分词操作，确定分词操作后的查询语句的至少一个关键词，并提取各关键词的实体类型；

将各关键词的实体类型与预先建立的标签词典树进行匹配，判断在所述标签词典树中是否匹配到实体类型的标签意图，当判断在所述标签词典树中匹配到实体类型的标签意图时，获取匹配成功的实体类型的标签意图，基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图；

当判断在所述标签词典树中未匹配到实体类型的标签意图时，将所述查询语句输入预先建立的意图识别模型，得到所述查询语句的目标意图。
如权利要求15所述的计算机可读存储介质，其中，所述确定分词操作后的查询语句的至少一个关键词，包括：

遍历预先构建的关键词词典树各节点对应的关键词，将所述查询语句执行分词操作后得到的各个分词，分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配，当所述各个分词与所述关键词词典树任一节点对应的关键词匹配成功时，则将匹配成功的分词作为所述查询语句的关键词。
如权利要求16所述的计算机可读存储介质，其中，所述分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配，包括：

当所述各个分词与所述关键词词典树所有节点对应的关键词均匹配失败时，将所述各个分词转换为拼音并与预先构建的拼音字典树进行匹配，当任一分词的拼音与所述拼音词典树任一节点对应的关键词匹配成功时，将匹配成功的节点对应的关键词作为所述查询语句的关键词；

当所述各个分词的拼音与所述拼音词典树所有节点对应的关键词均匹配失败时，基于编辑距离计算所述各个分词与所述拼音词典树所有节点对应的关键词的差异值，选取差异值最小的关键词作为所述查询语句的关键词。
如权利要求15所述的计算机可读存储介质，其中，所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图，包括：

当所述用户为第一类型用户时，从各实体类型对应的标签意图中选取数量最大的标签意图作为所述查询语句的目标意图；

当所述用户为第二类型用户时，基于该用户的历史搜索对应的反馈信息，从各实体类型对应的标签意图中选取出所述查询语句的目标意图。
如权利要求15所述的计算机可读存储介质，其中，所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图，包括：

判断所述各关键词的实体类型中是否存在预设类型的实体类型，当判断存在预设类型的实体类型时，将所述预设类型的实体类型对应的标签意图作为所述查询语句的目标意图。
如权利要求15所述的计算机可读存储介质，其中，所述判断在预设的规则集中是否匹配到所述查询语句的目标意图，包括：

当所述查询语句与所述规则集中任一规则语句匹配成功时，将匹配成功的规则语句作为所述查询语句的目标意图；

当所述查询语句与所述规则集中所有规则语句均匹配失败时，判断在所述规则集中未匹配到所述查询语句的目标意图。