CN113707300A - 基于人工智能的搜索意图识别方法、装置、设备及介质 - Google Patents
基于人工智能的搜索意图识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN113707300A CN113707300A CN202111002384.7A CN202111002384A CN113707300A CN 113707300 A CN113707300 A CN 113707300A CN 202111002384 A CN202111002384 A CN 202111002384A CN 113707300 A CN113707300 A CN 113707300A
- Authority
- CN
- China
- Prior art keywords
- intention
- query statement
- label
- matched
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 45
- 230000011218 segmentation Effects 0.000 claims abstract description 39
- 230000015654 memory Effects 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 4
- 239000003814 drug Substances 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 3
- 229910052791 calcium Inorganic materials 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 235000014347 soups Nutrition 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 206010012735 Diarrhoea Diseases 0.000 description 2
- LSQZJLSUYDQPKJ-NJBDSQKTSA-N amoxicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=C(O)C=C1 LSQZJLSUYDQPKJ-NJBDSQKTSA-N 0.000 description 2
- 229960003022 amoxicillin Drugs 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- XZWYZXLIPXDOLR-UHFFFAOYSA-N metformin Chemical compound CN(C)C(=N)NC(N)=N XZWYZXLIPXDOLR-UHFFFAOYSA-N 0.000 description 2
- 229960003105 metformin Drugs 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- LSQZJLSUYDQPKJ-UHFFFAOYSA-N p-Hydroxyampicillin Natural products O=C1N2C(C(O)=O)C(C)(C)SC2C1NC(=O)C(N)C1=CC=C(O)C=C1 LSQZJLSUYDQPKJ-UHFFFAOYSA-N 0.000 description 2
- 239000007901 soft capsule Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 208000019637 Infantile Diarrhea Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Human Computer Interaction (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能及智慧医疗技术领域,提供了一种基于人工智能的搜索意图识别方法、装置、设备及存储介质。所述方法包括:通过规则集与查询语句进行匹配,若规则集中未匹配到查询语句的意图时对查询语句执行分词,确定分词操作后的查询语句关键词,并提取各关键词的实体类型,将各关键词的实体类型与标签词典树进行匹配,得到各实体类型对应的标签意图,基于各实体类型的标签意图得到查询语句的目标意图,当各关键词的实体类型与标签词典树均未匹配出标签意图时,将查询语句输入意图识别模型得到查询语句的目标意图。本发明更准确地识别医疗领域中查询语句的搜索意图。本发明还涉及区块链技术领域,上述实体类型可以存储于一区块链的节点中。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于人工智能的搜索意图识别方法、装置、设备及存储介质。
背景技术
搜索意图识别是指对用户的搜索词条进行分析,获得用户意图与需求,从而向用户推荐用户最需要的产品或内容。因此提高搜索识别意图能够提高产品或内容推荐的准确率。
目前的搜索意图识别方案大多是采用词向量对搜索词条进行语义表示,词向量基于上下文的含义得到,而在智能医疗领域,用户输入的搜索语句具有不规范且长度不一的情况,获得的词向量表示能力较差,导致搜索意图识别准确率低。
发明内容
鉴于以上内容,本发明提供一种基于人工智能的搜索意图识别方法、装置、设备及存储介质,其目的在于解决现有技术中智能医疗领域搜索意图识别准确率低的技术问题。
为实现上述目的,本发明提供一种基于人工智能的搜索意图识别方法,该方法包括:
将用户输入的查询语句与预设的规则集进行匹配,判断在所述规则集中是否匹配到所述查询语句的目标意图;
当判断在所述规则集中未匹配到所述查询语句的目标意图时,对所述查询语句执行分词操作,确定分词操作后的查询语句的至少一个关键词,并提取各关键词的实体类型;
将各关键词的实体类型与预先建立的标签词典树进行匹配,判断在所述标签词典树中是否匹配到实体类型的标签意图,当判断在所述标签词典树中匹配到实体类型的标签意图时,获取匹配成功的实体类型的标签意图,基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图;
当判断在所述标签词典树中未匹配到实体类型的标签意图时,将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图。
优选的,所述确定分词操作后的查询语句的至少一个关键词,包括:
遍历预先构建的关键词词典树各节点对应的关键词,将所述查询语句执行分词操作后得到的各个分词,分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配,当所述各个分词与所述关键词词典树任一节点对应的关键词匹配成功时,则将匹配成功的分词作为所述查询语句的关键词。
优选的,所述分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配,包括:
当所述各个分词与所述关键词词典树所有节点对应的关键词均匹配失败时,将所述各个分词转换为拼音并与预先构建的拼音字典树进行匹配,当任一分词的拼音与所述拼音词典树任一节点对应的关键词匹配成功时,将匹配成功的节点对应的关键词作为所述查询语句的关键词;
当所述各个分词的拼音与所述拼音词典树所有节点对应的关键词均匹配失败时,基于编辑距离计算所述各个分词与所述拼音词典树所有节点对应的关键词的差异值,选取差异值最小的关键词作为所述查询语句的关键词。
优选的,所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图,包括:
当所述用户为第一类型用户时,从各实体类型对应的标签意图中选取数量最大的标签意图作为所述查询语句的目标意图;
当所述用户为第二类型用户时,基于该用户的历史搜索对应的反馈信息,从各实体类型对应的标签意图中选取出所述查询语句的目标意图。
优选的,所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图,包括:
判断所述各关键词的实体类型中是否存在预设类型的实体类型,当判断存在预设类型的实体类型时,将所述预设类型的实体类型对应的标签意图作为所述查询语句的目标意图。
优选的,所述判断在预设的规则集中是否匹配到所述查询语句的目标意图,包括:
当所述查询语句与所述规则集中任一规则语句匹配成功时,将匹配成功的规则语句作为所述查询语句的目标意图;
当所述查询语句与所述规则集中所有规则语句均匹配失败时,判断在所述规则集中未匹配到所述查询语句的目标意图。
优选的,在将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图之后,所述方法还包括:
计算所述查询语句与预设存储路径中各历史查询语句的相似度值,若存在相似度值大于预设阈值的目标历史查询语句,且所述目标历史查询语句的意图与所述意图识别模型识别所述查询语句得到的目标意图相同时,将所述目标历史查询语句的意图作为所述查询语句的目标意图。
为实现上述目的,本发明还提供一种基于人工智能的搜索意图识别装置,该基于人工智能的搜索意图识别装置包括:
第一匹配模块:用于将用户输入的查询语句与预设的规则集进行匹配,判断在所述规则集中是否匹配到所述查询语句的目标意图;
提取模块:用于当判断在所述规则集中未匹配到所述查询语句的目标意图时,对所述查询语句执行分词操作,确定分词操作后的查询语句的至少一个关键词,并提取各关键词的实体类型;
第二匹配模块:用于将各关键词的实体类型与预先建立的标签词典树进行匹配,判断在所述标签词典树中是否匹配到实体类型的标签意图,当判断在所述标签词典树中匹配到实体类型的标签意图时,获取匹配成功的实体类型的标签意图,基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图;
识别模块:用于当判断在所述标签词典树中未匹配到实体类型的标签意图时,将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图。
为实现上述目的,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的基于人工智能的搜索意图识别方法的任意步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有基于人工智能的搜索意图识别程序,所述基于人工智能的搜索意图识别程序被处理器执行时,实现如上所述基于人工智能的搜索意图识别方法的任意步骤。
本发明提出的基于人工智能的搜索意图识别方法、装置、设备及存储介质,通过规则集与查询语句进行匹配,若规则集中未匹配到查询语句的意图时对查询语句执行分词,确定分词操作后的查询语句关键词,并提取各关键词的实体类型,将各关键词的实体类型与标签词典树进行匹配,得到各实体类型对应的标签意图,基于各实体类型的标签意图得到查询语句的目标意图,当各关键词的实体类型与标签词典树均未匹配出标签意图时,将查询语句输入意图识别模型得到查询语句的目标意图。结合规则集、词典树及意图识别模型对查询语句进行匹配或识别,可以更快且更准确地识别医疗领域中用户查询语句的搜索意图。
附图说明
图1为本发明基于人工智能的搜索意图识别方法较佳实施例的流程图示意图;
图2为本发明基于人工智能的搜索意图识别装置较佳实施例的模块示意图;
图3为本发明电子设备较佳实施例的示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本发明提供一种基于人工智能的搜索意图识别方法。参照图1所示,为本发明基于人工智能的搜索意图识别方法的实施例的方法流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。基于人工智能的搜索意图识别方法包括:
步骤S10:将用户输入的查询语句与预设的规则集进行匹配,判断在所述规则集中是否匹配到所述查询语句的目标意图。
本方案的应用场景可以是用户在使用具有搜索功能的APP(例如,智能医疗领域的APP)时,对用户的搜索意图进行识别,以反馈用户最想要的搜索结果,例如,识别出用户是想“购药”、“挂号”或者“问诊”的意图,以反馈相关的信息给用户。本方案以智能医疗APP为例对本方案进行说明,需要说明的是,本方案的实际应用场景并不仅限于上述APP,还可以是社交类APP、电商类APP。
在本实施例中,当侦测到用户在安装有智能医疗APP的终端输入查询语句并发起搜索请求时,获取用户在交互界面中输入的查询语句,可以理解的是,用户输入的内容可以是查询语句,也可以是查询词,例如,某种药品的名称、医院的名称或者某种疾病的名称等。之后,将用户输入的查询语句与预设的规则集进行匹配,判断是否匹配到查询语句的目标意图,其中,规则集包括多种常用的规则语句,规则集可以包括“药品规则集”、“医院规则集”等,“药品规则集”可以是指的各种药品的全称,其对应的意图可以是用户想搜索该药品的购买链接或了解药品详细信息、“医院规则集”可以是指医院的全称,其对应的意图可以是用户想在该医院就诊或了解该医院的科室等信息。
在一个实施例中,所述判断在预设的规则集中是否匹配到所述查询语句的目标意图,包括:
当所述查询语句与所述规则集中任一规则语句匹配成功时,将匹配成功的规则语句作为所述查询语句的目标意图;
当所述查询语句与所述规则集中所有规则语句均匹配失败时,判断在所述规则集中未匹配到所述查询语句的目标意图。
当查询语句与规则集中任一规则语句匹配成功时,即查询语句与规则集中的规则语句完成相同,将该规则语句对应的意图作为该查询语句的目标意图,根据该意图向用户反馈相关的搜索结果。若查询语句与规则集中所有规则语句均匹配失败时,则判断在规则集中未匹配到查询语句的目标意图。
例如,用户输入的查询语句是“腹可安片”,且规则集中收录了该药品规则语句,则识别其意图是想购买该药品或了解该药品的详细信息,将该药品的购买链接及该药品的详细信息反馈至用户。
步骤S20:当判断在所述规则集中未匹配到所述查询语句的目标意图时,对所述查询语句执行分词操作,确定分词操作后的查询语句的至少一个关键词,并提取各关键词的实体类型。
在本实施例中,由于收录的规则集不可能覆盖用户所有可能输入的查询语句,因此当利用规则集不能匹配出用户输入的查询语句的目标意图时,可以根据查询语句的关键词来识别该查询语句的目标意图。具体地,当判断在规则集未匹配到查询语句的目标意图时,对查询语句执行分词操作,例如,可以利用正向匹配拆分、逆向匹配拆分或最少切分算法对查询语句进行分词。确定分词操作后的查询语句的至少一个关键词,并根据命名实体识别算法提取各关键词的实体类型。
命名实体识别(NER)是在自然语言处理中的一个经典问题,其应用也较广泛,例如从一句话中识别出人名、地名,从搜索中识别出产品的名字,识别药物名称等等。本方案的实体提取算法可以是条件随机场模型,它是一种判别式概率模型,常用于标注或分析序列资料,如自然语言文字。
在一个实施例中,所述确定分词操作后的查询语句的至少一个关键词,包括:
遍历预先构建的关键词词典树各节点对应的关键词,将所述查询语句执行分词操作后得到的各个分词,分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配,当所述各个分词与所述关键词词典树任一节点对应的关键词匹配成功时,则将匹配成功的分词作为所述查询语句的关键词。
查询语句的关键词也可以称为主体词,在医疗健康领域内,业务主体是一个有限集合,主要包括疾病、症状、疗效、治疗方式、器官部位、品牌、商品类目、商品属性、科室、医院名称等一系列名词集合。可以建立词典树来匹配查询语句中出现的关键词,将查询语句的各个分词分别与词典树各节点对应的关键词进行匹配,若分词与关键词词典树的任一节点的关键词匹配成功,则将该分词作为查询语句的关键词。
进一步地,所述分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配,包括:
当所述各个分词与所述关键词词典树所有节点对应的关键词均匹配失败时,将所述各个分词转换为拼音并与预先构建的拼音字典树进行匹配,当任一分词的拼音与所述拼音词典树任一节点对应的关键词匹配成功时,将匹配成功的节点对应的关键词作为所述查询语句的关键词;
当所述各个分词的拼音与所述拼音词典树所有节点对应的关键词均匹配失败时,基于编辑距离计算所述各个分词与所述拼音词典树所有节点对应的关键词的差异值,选取差异值最小的关键词作为所述查询语句的关键词。
由于用户输入的查询语句可能包括错别字导致意图识别有误,因此,当分词与关键词词典树节点对应的关键词均匹配失败时,可以对查询语句的分词进行纠错处理,纠错以拼音为优先,因为音同字不同的错误情况较多,并且没有歧义。在建立关键词词典树的同时,还建立对应的关键词拼音词典树,会将匹配不到关键词的分词转换成拼音,在拼音词典树中再匹配一遍,若匹配成功,则将匹配成功的拼音词典树中的关键词作为查询语句的关键词。例如,若分词为“啊莫西淋”,会匹配到“阿莫西林”。
如果拼音词典树中仍未匹配到查询语句分词对应的关键词,则使用编辑距离计算分词与拼音词典树中关键词的差异值,选取差异值最小的关键词作为查询语句的关键词。医疗领域会有很多药品化学名的搜索场景,由于化学名很多是生僻字,用户会用形同音不同的方式去搜索。例如,“二甲双胍胶囊”,大多数用户会输入“二甲双瓜胶囊”,可以通过编辑距离进行纠错。编辑距离是指对二个字符串的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。
在一个实施例中,确定分词操作后的查询语句的至少一个关键词,还包括:
计算各个分词在所述查询语句中的词频,基于所述词频计算出各个分词的IDF值及TF值,将各分词的IDF值与各个分词对应的TF值相乘得到各个分词的TF-IDF值,基于各个分词的TF-IDF值选取预设数量的预设词性的词所述查询语句的关键词。
由于一些口语化的疾病名称可能不在词典树中,因此还可以用TF-IDF算法来抽取一些口语化的关键词,例如:拉肚子(腹泻)。计算出IDF(逆文档频率值),然后再计算出问诊文本中每个词的TF(词频)值。其中,TF=(词语在文本中出现次数)/(各词语在文本中出现次数的总和),将IDF值与TF值相乘,得到该词的TF-IDF值,TF-IDF值可以评估字词对于文本中的重要程度,TF-IDF值越大表示作为关键词的优先级越高,若TF-IDF值越大,该词对语句的重要性越高。
在一个实施例中,也可以利用双向匹配算法对查询语句执行分词操作,具体分词步骤包括:
根据正向最大匹配法将读取到的分词与预设词库进行匹配,得到第一匹配结果,所述第一匹配结果中包含有第一数量的第一词组和第二数量的单字;
根据逆向最大匹配法将读取到的分词与预设词库进行匹配,得到第二匹配结果,所述第二匹配结果中包含有第三数量的第二词组和第四数量的单字;
若所述第一数量与所述第三数量相等且所述第二数量小于或者等于所述第四数量,或者,若所述第一数量小于所述第三数量,则将所述第一匹配结果作为该查询语句的分词结果;若所述第一数量与所述第二数量相等且所述第三数量大于所述第四数量,或者,若所述第一数量大于所述第三数量,则将所述第二匹配结果作为该查询语句的分词结果。
通过该分词方法来分析切分文本内容中前后组合内容的粘性,由于通常情况下词组能代表核心观点信息的概率更大,即通过词组更能表达出核心观点信息,因此,通过正反向同时进行分词匹配找出单字数量更少,词组数量更多的分词匹配结果,以作为切分的语句的分词结果,可提高分词的准确性。
步骤S30:将各关键词的实体类型与预先建立的标签词典树进行匹配,判断在所述标签词典树中是否匹配到实体类型的标签意图,当判断在所述标签词典树中匹配到实体类型的标签意图时,获取匹配成功的实体类型的标签意图,基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图。
在本实施例中,利用命名实体识别算法提取出查询语句中各关键词的实体类型之后,将各关键词的实体类型与预先建立的标签词典树进行匹配,标签词典树建立了医疗领域中常用词汇对应的标签意图,每个实体类型有对应的标签意图,例如,实体类型为“品牌”,则对应的标签意图是“购买”的意图。将查询语句关键词的实体类型与标签词典树进行匹配,可以得到各实体类型对应的标签意图,可以选取各实体类型中标签意图数最多的标签作为查询语句的目标意图。
例如,查询语句“汤臣倍健青少年液体钙软胶囊”,“汤臣倍健”的实体类型为“品牌”、“青少年”的实体类型为“人群”、“液体钙”的实体类型为“品类”、“软胶囊”实体类型为“药品名”,与标签词典树匹配的购买商品意图的有“品牌”、“液体钙”、“软件囊”3个词,匹配的问诊意图的有“人群”1个词,由此判断用户输入的查询语句是“购买”的意图。
词典树又称前缀树,是一种有序树,用于保存关联数组,其中的键通常是字符串,键不是直接保存在节点中,而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串。一般情况下,不是所有的节点都有对应的值,只有叶子节点和部分内部节点所对应的键才有相关的值。
在一个实施例中,所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图,包括:
当所述用户为第一类型用户时,从各实体类型对应的标签意图中选取数量最大的标签意图作为所述查询语句的目标意图;
当所述用户为第二类型用户时,基于该用户的历史搜索对应的反馈信息,从各实体类型对应的标签意图中选取出所述查询语句的目标意图。
第一类型的用户是指新用户,可以将标签意图数量最多的标签作为查询语句的目标意图,第二类型用户是指老用户,可以根据该用户对历史搜索的反馈信息(即用户历史搜索的点击情况),从各实体类型中标签意图数选取出意图,例如,用户的历史搜索中,点击购买链接的次数是最多的,可以将购买作为该查询语句的目标意图。根据优先级规则,确定不同类型用户查询语句中各实体类型的标签意图的优先级顺序,可以更准确识别出用户输入的查询语句的目标意图。
在一个实施例中,所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图,包括:
判断所述各关键词的实体类型中是否存在预设类型的实体类型,当判断存在预设类型的实体类型时,将所述预设类型的实体类型对应的标签意图作为所述查询语句的目标意图。
预设类型的实体类型可以是指“医生姓名”,例如,当关键词存在某个医生的真实姓名,该关键词的实体类型为“医生姓名”,则将“医生姓名”对应的标签意图“问诊”作为查询语句的目标意图,即判断用户是想指定医生问诊,直接返回该医生的搜索结果。可以快速确定用户是否是搜索医生问诊的意图,根据历史的用户点击数据分析,在搜索人名的情况下,90%的用户是点击该名字的医生进行问诊。
步骤S40:当判断在所述标签词典树中未匹配到实体类型的标签意图时,将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图。
在本实施例中,若查询语句关键词的实体类型与标签词典树均未匹配出标签意图时,说明用户输入的查询语句可能偏口语化或者偏方言化,标签词典树未能匹配出意图,因此,可以将查询语句输入预先建立的意图识别模型,得到查询语句的目标意图。其中,意图识别模型可以是根据doc2vec模型进行训练得到的,可以利用历史在线问诊的患者主诉和对应的拟诊结果生成样本集训练doc2vec模型得到意图识别模型。
例如,用户输入的查询语句为“小朋友拉粑粑像蛋花汤一样怎么办”之类的,词典树无法匹配出对应的标签意图,将该查询语句输入意图识别模型,输出的结果为“小儿腹泻”。
在一个实施例中,所述方法还包括:
计算所述查询语句与预设存储路径中各历史查询语句的相似度值,若存在相似度值大于预设阈值的目标历史查询语句,且所述目标历史查询语句的意图与所述意图识别模型识别所述查询语句得到的目标意图相同时,将所述目标历史查询语句的意图作为所述查询语句的目标意图。
将用户输入的查询语句与线上的历史查询语句进行相似度计算,根据相似度值来验证该查询语句的目标意图,若两者的相似度值大于预设阈值(例如,90%),且该历史查询语句的意图与意图识别模型识别查询语句得到的目标意图相同时,将该历史查询语句的意图作为查询语句的目标意图,可以利用历史查询语句的意图对用户输入的查询语句的意图进行验证;
若存在相似度值大于预设阈值的历史查询语句,但该历史查询语句的意图与意图识别模型识别查询语句得到的目标意图不相同,则将意图识别模型识别出的意图作为查询语句的目标意图。
参照图2所示,为本发明基于人工智能的搜索意图识别装置100的功能模块示意图。
本发明所述基于人工智能的搜索意图识别装置100可以安装于电子设备中。根据实现的功能,所述基于人工智能的搜索意图识别装置100可以包括第一匹配模块110、提取模块120、第二匹配模块130及识别模块140。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
第一匹配模块110:用于将用户输入的查询语句与预设的规则集进行匹配,判断在所述规则集中是否匹配到所述查询语句的目标意图。
提取模块120,用于当判断在所述规则集中未匹配到所述查询语句的目标意图时,对所述查询语句执行分词操作,确定分词操作后的查询语句的至少一个关键词,并提取各关键词的实体类型。
第二匹配模块130,用于将各关键词的实体类型与预先建立的标签词典树进行匹配,判断在所述标签词典树中是否匹配到实体类型的标签意图,当判断在所述标签词典树中匹配到实体类型的标签意图时,获取匹配成功的实体类型的标签意图,基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图。
识别模块140,用于当判断在所述标签词典树中未匹配到实体类型的标签意图时,将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图。
在一个实施例中,所述确定分词操作后的查询语句的至少一个关键词,包括:
遍历预先构建的关键词词典树各节点对应的关键词,将所述查询语句执行分词操作后得到的各个分词,分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配,当所述各个分词与所述关键词词典树任一节点对应的关键词匹配成功时,则将匹配成功的分词作为所述查询语句的关键词。
在一个实施例中,所述分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配,包括:
当所述各个分词与所述关键词词典树所有节点对应的关键词均匹配失败时,将所述各个分词转换为拼音并与预先构建的拼音字典树进行匹配,当任一分词的拼音与所述拼音词典树任一节点对应的关键词匹配成功时,将匹配成功的节点对应的关键词作为所述查询语句的关键词;
当所述各个分词的拼音与所述拼音词典树所有节点对应的关键词均匹配失败时,基于编辑距离计算所述各个分词与所述拼音词典树所有节点对应的关键词的差异值,选取差异值最小的关键词作为所述查询语句的关键词。
在一个实施例中,所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图,包括:
当所述用户为第一类型用户时,从各实体类型对应的标签意图中选取数量最大的标签意图作为所述查询语句的目标意图;
当所述用户为第二类型用户时,基于该用户的历史搜索对应的反馈信息,从各实体类型对应的标签意图中选取出所述查询语句的目标意图。
在一个实施例中,所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图,包括:
判断所述各关键词的实体类型中是否存在预设类型的实体类型,当判断存在预设类型的实体类型时,将所述预设类型的实体类型对应的标签意图作为所述查询语句的目标意图。
在一个实施例中,所述判断在预设的规则集中是否匹配到所述查询语句的目标意图,包括:
当所述查询语句与所述规则集中任一规则语句匹配成功时,将匹配成功的规则语句作为所述查询语句的目标意图;
当所述查询语句与所述规则集中所有规则语句均匹配失败时,判断在所述规则集中未匹配到所述查询语句的目标意图。
在一个实施例中,所述识别模块140还用于:
计算所述查询语句与预设存储路径中各历史查询语句的相似度值,若存在相似度值大于预设阈值的目标历史查询语句,且所述目标历史查询语句的意图与所述意图识别模型识别所述查询语句得到的目标意图相同时,将所述目标历史查询语句的意图作为所述查询语句的目标意图。
参照图3所示,为本发明电子设备1较佳实施例的示意图。
该电子设备1包括但不限于:存储器11、处理器12、显示器13及网络接口14。所述电子设备1通过网络接口14连接网络,获取原始数据。其中,所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobilecommunication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi、通话网络等无线或有线网络。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述电子设备1的内部存储单元,例如该电子设备1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述电子设备1的外部存储设备,例如该电子设备1配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器11还可以既包括所述电子设备1的内部存储单元也包括其外部存储设备。本实施例中,存储器11通常用于存储安装于所述电子设备1的操作系统和各类应用软件,例如基于人工智能的搜索意图识别程序10的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行基于人工智能的搜索意图识别程序10的程序代码等。
显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-EmittingDiode,OLED)触摸器等。显示器13用于显示在电子设备1中处理的信息以及用于显示可视化的工作界面,例如显示数据统计的结果。
网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口),该网络接口14通常用于在所述电子设备1与其它电子设备之间建立通信连接。
图3仅示出了具有组件11-14以及基于人工智能的搜索意图识别程序10的电子设备1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,所述电子设备1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
该电子设备1还可以包括射频(Radio Frequency,RF)电路、传感器和音频电路等等,在此不再赘述。
在上述实施例中,处理器12执行存储器11中存储的基于人工智能的搜索意图识别程序10时可以实现如下步骤:
将用户输入的查询语句与预设的规则集进行匹配,判断在所述规则集中是否匹配到所述查询语句的目标意图;
当判断在所述规则集中未匹配到所述查询语句的目标意图时,对所述查询语句执行分词操作,确定分词操作后的查询语句的至少一个关键词,并提取各关键词的实体类型;
将各关键词的实体类型与预先建立的标签词典树进行匹配,判断在所述标签词典树中是否匹配到实体类型的标签意图,当判断在所述标签词典树中匹配到实体类型的标签意图时,获取匹配成功的实体类型的标签意图,基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图;
当判断在所述标签词典树中未匹配到实体类型的标签意图时,将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图。
所述存储设备可以为电子设备1的存储器11,也可以为与电子设备1通讯连接的其它存储设备。
关于上述步骤的详细介绍,请参照上述图2关于基于人工智能的搜索意图识别装置100实施例的功能模块图以及图1关于基于人工智能的搜索意图识别方法实施例的流程图的说明。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质可以是非易失性的,也可以是易失性的。该计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括存储数据区和存储程序区,存储数据区存储根据区块链节点的使用所创建的数据,存储程序区存储有基于人工智能的搜索意图识别程序10,所述基于人工智能的搜索意图识别程序10被处理器执行时实现如下操作:
将用户输入的查询语句与预设的规则集进行匹配,判断在所述规则集中是否匹配到所述查询语句的目标意图;
当判断在所述规则集中未匹配到所述查询语句的目标意图时,对所述查询语句执行分词操作,确定分词操作后的查询语句的至少一个关键词,并提取各关键词的实体类型;
将各关键词的实体类型与预先建立的标签词典树进行匹配,判断在所述标签词典树中是否匹配到实体类型的标签意图,当判断在所述标签词典树中匹配到实体类型的标签意图时,获取匹配成功的实体类型的标签意图,基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图;
当判断在所述标签词典树中未匹配到实体类型的标签意图时,将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图。
本发明之计算机可读存储介质的具体实施方式与上述基于人工智能的搜索意图识别方法的具体实施方式大致相同,在此不再赘述。
在另一个实施例中,本发明所提供的基于人工智能的搜索意图识别方法,为进一步保证上述所有出现的数据的私密和安全性,上述所有数据还可以存储于一区块链的节点中。例如实体类型及查询语句等,这些数据均可存储在区块链节点中。
需要说明的是,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,电子装置,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于人工智能的搜索意图识别方法,应用于电子设备,其特征在于,所述方法包括:
将用户输入的查询语句与预设的规则集进行匹配,判断在所述规则集中是否匹配到所述查询语句的目标意图;
当判断在所述规则集中未匹配到所述查询语句的目标意图时,对所述查询语句执行分词操作,确定分词操作后的查询语句的至少一个关键词,并提取各关键词的实体类型;
将各关键词的实体类型与预先建立的标签词典树进行匹配,判断在所述标签词典树中是否匹配到实体类型的标签意图,当判断在所述标签词典树中匹配到实体类型的标签意图时,获取匹配成功的实体类型的标签意图,基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图;
当判断在所述标签词典树中未匹配到实体类型的标签意图时,将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图。
2.如权利要求1所述的基于人工智能的搜索意图识别方法,其特征在于,所述确定分词操作后的查询语句的至少一个关键词,包括:
遍历预先构建的关键词词典树各节点对应的关键词,将所述查询语句执行分词操作后得到的各个分词,分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配,当所述各个分词与所述关键词词典树任一节点对应的关键词匹配成功时,则将匹配成功的分词作为所述查询语句的关键词。
3.如权利要求2所述的基于人工智能的搜索意图识别方法,其特征在于,所述分别将所述各个分词与所述关键词词典树各节点对应的关键词进行匹配,包括:
当所述各个分词与所述关键词词典树所有节点对应的关键词均匹配失败时,将所述各个分词转换为拼音并与预先构建的拼音字典树进行匹配,当任一分词的拼音与所述拼音词典树任一节点对应的关键词匹配成功时,将匹配成功的节点对应的关键词作为所述查询语句的关键词;
当所述各个分词的拼音与所述拼音词典树所有节点对应的关键词均匹配失败时,基于编辑距离计算所述各个分词与所述拼音词典树所有节点对应的关键词的差异值,选取差异值最小的关键词作为所述查询语句的关键词。
4.如权利要求1所述的基于人工智能的搜索意图识别方法,其特征在于,所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图,包括:
当所述用户为第一类型用户时,从各实体类型对应的标签意图中选取数量最大的标签意图作为所述查询语句的目标意图;
当所述用户为第二类型用户时,基于该用户的历史搜索对应的反馈信息,从各实体类型对应的标签意图中选取出所述查询语句的目标意图。
5.如权利要求1所述的基于人工智能的搜索意图识别方法,其特征在于,所述基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图,包括:
判断所述各关键词的实体类型中是否存在预设类型的实体类型,当判断存在预设类型的实体类型时,将所述预设类型的实体类型对应的标签意图作为所述查询语句的目标意图。
6.如权利要求1所述的基于人工智能的搜索意图识别方法,其特征在于,所述判断在预设的规则集中是否匹配到所述查询语句的目标意图,包括:
当所述查询语句与所述规则集中任一规则语句匹配成功时,将匹配成功的规则语句作为所述查询语句的目标意图;
当所述查询语句与所述规则集中所有规则语句均匹配失败时,判断在所述规则集中未匹配到所述查询语句的目标意图。
7.如权利要求1至6中任意一项所述的基于人工智能的搜索意图识别方法,其特征在于,在将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图之后,所述方法还包括:
计算所述查询语句与预设存储路径中各历史查询语句的相似度值,若存在相似度值大于预设阈值的目标历史查询语句,且所述目标历史查询语句的意图与所述意图识别模型识别所述查询语句得到的目标意图相同时,将所述目标历史查询语句的意图作为所述查询语句的目标意图。
8.一种基于人工智能的搜索意图识别装置,其特征在于,所述装置包括:
第一匹配模块:用于将用户输入的查询语句与预设的规则集进行匹配,判断在所述规则集中是否匹配到所述查询语句的目标意图;
提取模块:用于当判断在所述规则集中未匹配到所述查询语句的目标意图时,对所述查询语句执行分词操作,确定分词操作后的查询语句的至少一个关键词,并提取各关键词的实体类型;
第二匹配模块:用于将各关键词的实体类型与预先建立的标签词典树进行匹配,判断在所述标签词典树中是否匹配到实体类型的标签意图,当判断在所述标签词典树中匹配到实体类型的标签意图时,获取匹配成功的实体类型的标签意图,基于匹配成功的实体类型的标签意图得到所述查询语句的目标意图;
识别模块:用于当判断在所述标签词典树中未匹配到实体类型的标签意图时,将所述查询语句输入预先建立的意图识别模型,得到所述查询语句的目标意图。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的基于人工智能的搜索意图识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有基于人工智能的搜索意图识别程序,所述基于人工智能的搜索意图识别程序被处理器执行时,实现如权利要求1至7中任一项所述基于人工智能的搜索意图识别方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111002384.7A CN113707300B (zh) | 2021-08-30 | 2021-08-30 | 基于人工智能的搜索意图识别方法、装置、设备及介质 |
PCT/CN2022/087820 WO2023029513A1 (zh) | 2021-08-30 | 2022-04-20 | 基于人工智能的搜索意图识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111002384.7A CN113707300B (zh) | 2021-08-30 | 2021-08-30 | 基于人工智能的搜索意图识别方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113707300A true CN113707300A (zh) | 2021-11-26 |
CN113707300B CN113707300B (zh) | 2024-06-25 |
Family
ID=78656595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111002384.7A Active CN113707300B (zh) | 2021-08-30 | 2021-08-30 | 基于人工智能的搜索意图识别方法、装置、设备及介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113707300B (zh) |
WO (1) | WO2023029513A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114595696A (zh) * | 2022-03-03 | 2022-06-07 | Oppo广东移动通信有限公司 | 实体消歧方法、实体消歧装置、存储介质与电子设备 |
CN114610842A (zh) * | 2022-01-24 | 2022-06-10 | 企知道网络技术有限公司 | 一种基于意图识别的关联搜索方法及系统 |
WO2023029513A1 (zh) * | 2021-08-30 | 2023-03-09 | 康键信息技术(深圳)有限公司 | 基于人工智能的搜索意图识别方法、装置、设备及介质 |
CN115982423A (zh) * | 2023-03-18 | 2023-04-18 | 北京新发地农产品网络配送中心有限责任公司 | 商品搜索匹配方法、装置、设备及计算机可读存储介质 |
CN117573896A (zh) * | 2023-12-05 | 2024-02-20 | 苏州中格软件有限公司 | 基于意图识别的事项筛查方法、平台、设备及存储介质 |
CN117725185A (zh) * | 2024-02-06 | 2024-03-19 | 河北神玥软件科技股份有限公司 | 智能对话生成方法及系统 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115954108B (zh) * | 2023-03-10 | 2023-05-16 | 成都数之联科技股份有限公司 | 一种数据分析异步处理方法及系统及装置及介质 |
CN116340523B (zh) * | 2023-05-30 | 2023-09-26 | 北京中关村科金技术有限公司 | 会话意图识别方法及装置、计算机设备、存储介质、软件 |
CN116628129B (zh) * | 2023-07-21 | 2024-02-27 | 南京爱福路汽车科技有限公司 | 一种汽车配件搜索方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150052115A1 (en) * | 2013-08-15 | 2015-02-19 | Google Inc. | Query response using media consumption history |
CN105095187A (zh) * | 2015-08-07 | 2015-11-25 | 广州神马移动信息科技有限公司 | 一种搜索意图识别方法及装置 |
CN105677725A (zh) * | 2015-12-30 | 2016-06-15 | 南京途牛科技有限公司 | 一种用于旅游垂直搜索引擎的前置解析方法 |
CN109815492A (zh) * | 2019-01-04 | 2019-05-28 | 平安科技(深圳)有限公司 | 一种基于识别模型的意图识别方法、识别设备及介质 |
CN110647987A (zh) * | 2019-08-22 | 2020-01-03 | 腾讯科技(深圳)有限公司 | 一种应用程序中数据的处理方法、装置、电子设备及存储介质 |
CN111209374A (zh) * | 2020-01-07 | 2020-05-29 | 平安科技(深圳)有限公司 | 数据查询展示方法、装置、计算机系统及可读存储介质 |
CN111368049A (zh) * | 2020-02-26 | 2020-07-03 | 京东方科技集团股份有限公司 | 信息获取方法、装置、电子设备及计算机可读存储介质 |
CN111428027A (zh) * | 2020-02-26 | 2020-07-17 | 中国平安财产保险股份有限公司 | 查询意图确定方法及相关装置 |
CN112463944A (zh) * | 2020-12-22 | 2021-03-09 | 安徽商信政通信息技术股份有限公司 | 一种基于多模型融合的检索式智能问答方法及装置 |
WO2021068329A1 (zh) * | 2019-10-10 | 2021-04-15 | 平安科技(深圳)有限公司 | 中文命名实体识别方法、装置及计算机可读存储介质 |
CN113157890A (zh) * | 2021-04-25 | 2021-07-23 | 深圳壹账通智能科技有限公司 | 智能问答方法、装置、电子设备及可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376847A (zh) * | 2018-08-31 | 2019-02-22 | 深圳壹账通智能科技有限公司 | 用户意图识别方法、装置、终端及计算机可读存储介质 |
CN109815314B (zh) * | 2019-01-04 | 2023-08-08 | 平安科技(深圳)有限公司 | 一种意图识别方法、识别设备及计算机可读存储介质 |
CN110543633B (zh) * | 2019-08-29 | 2021-06-29 | 腾讯科技(深圳)有限公司 | 语句意图识别方法、装置 |
CN113707300B (zh) * | 2021-08-30 | 2024-06-25 | 康键信息技术(深圳)有限公司 | 基于人工智能的搜索意图识别方法、装置、设备及介质 |
-
2021
- 2021-08-30 CN CN202111002384.7A patent/CN113707300B/zh active Active
-
2022
- 2022-04-20 WO PCT/CN2022/087820 patent/WO2023029513A1/zh unknown
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150052115A1 (en) * | 2013-08-15 | 2015-02-19 | Google Inc. | Query response using media consumption history |
CN105095187A (zh) * | 2015-08-07 | 2015-11-25 | 广州神马移动信息科技有限公司 | 一种搜索意图识别方法及装置 |
CN105677725A (zh) * | 2015-12-30 | 2016-06-15 | 南京途牛科技有限公司 | 一种用于旅游垂直搜索引擎的前置解析方法 |
CN109815492A (zh) * | 2019-01-04 | 2019-05-28 | 平安科技(深圳)有限公司 | 一种基于识别模型的意图识别方法、识别设备及介质 |
CN110647987A (zh) * | 2019-08-22 | 2020-01-03 | 腾讯科技(深圳)有限公司 | 一种应用程序中数据的处理方法、装置、电子设备及存储介质 |
WO2021068329A1 (zh) * | 2019-10-10 | 2021-04-15 | 平安科技(深圳)有限公司 | 中文命名实体识别方法、装置及计算机可读存储介质 |
CN111209374A (zh) * | 2020-01-07 | 2020-05-29 | 平安科技(深圳)有限公司 | 数据查询展示方法、装置、计算机系统及可读存储介质 |
CN111368049A (zh) * | 2020-02-26 | 2020-07-03 | 京东方科技集团股份有限公司 | 信息获取方法、装置、电子设备及计算机可读存储介质 |
CN111428027A (zh) * | 2020-02-26 | 2020-07-17 | 中国平安财产保险股份有限公司 | 查询意图确定方法及相关装置 |
CN112463944A (zh) * | 2020-12-22 | 2021-03-09 | 安徽商信政通信息技术股份有限公司 | 一种基于多模型融合的检索式智能问答方法及装置 |
CN113157890A (zh) * | 2021-04-25 | 2021-07-23 | 深圳壹账通智能科技有限公司 | 智能问答方法、装置、电子设备及可读存储介质 |
Non-Patent Citations (1)
Title |
---|
张华等: "Java课程智能问答系统设计与实现", 《计算机时代》, vol. 12, 15 December 2018 (2018-12-15), pages 12 - 15 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023029513A1 (zh) * | 2021-08-30 | 2023-03-09 | 康键信息技术(深圳)有限公司 | 基于人工智能的搜索意图识别方法、装置、设备及介质 |
CN114610842A (zh) * | 2022-01-24 | 2022-06-10 | 企知道网络技术有限公司 | 一种基于意图识别的关联搜索方法及系统 |
CN114595696A (zh) * | 2022-03-03 | 2022-06-07 | Oppo广东移动通信有限公司 | 实体消歧方法、实体消歧装置、存储介质与电子设备 |
CN115982423A (zh) * | 2023-03-18 | 2023-04-18 | 北京新发地农产品网络配送中心有限责任公司 | 商品搜索匹配方法、装置、设备及计算机可读存储介质 |
CN117573896A (zh) * | 2023-12-05 | 2024-02-20 | 苏州中格软件有限公司 | 基于意图识别的事项筛查方法、平台、设备及存储介质 |
CN117725185A (zh) * | 2024-02-06 | 2024-03-19 | 河北神玥软件科技股份有限公司 | 智能对话生成方法及系统 |
CN117725185B (zh) * | 2024-02-06 | 2024-05-07 | 河北神玥软件科技股份有限公司 | 智能对话生成方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2023029513A1 (zh) | 2023-03-09 |
CN113707300B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113707300B (zh) | 基于人工智能的搜索意图识别方法、装置、设备及介质 | |
CN111695439B (zh) | 图像结构化数据提取方法、电子装置及存储介质 | |
CN110502608B (zh) | 基于知识图谱的人机对话方法及人机对话装置 | |
WO2022105122A1 (zh) | 基于人工智能的答案生成方法、装置、计算机设备及介质 | |
CA3087534C (en) | System and method for information extraction with character level features | |
CN112417096B (zh) | 问答对匹配方法、装置、电子设备及存储介质 | |
WO2019169756A1 (zh) | 产品推荐方法、装置及存储介质 | |
US9767144B2 (en) | Search system with query refinement | |
WO2021135469A1 (zh) | 基于机器学习的信息抽取方法、装置、计算机设备及介质 | |
CN112509682A (zh) | 基于文本识别的问诊方法、装置、设备及存储介质 | |
CN112447300B (zh) | 基于图神经网络的医疗查询方法、装置、计算机设备及存储介质 | |
CN111694826A (zh) | 基于人工智能的数据增强方法、装置、电子设备及介质 | |
CN111783471B (zh) | 自然语言的语义识别方法、装置、设备及存储介质 | |
CN112287069B (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
CN112651236B (zh) | 提取文本信息的方法、装置、计算机设备和存储介质 | |
CN111797217B (zh) | 基于faq匹配模型的信息查询方法、及其相关设备 | |
CN112380240A (zh) | 基于语义识别的数据查询方法、装置、设备及存储介质 | |
CN113837113B (zh) | 基于人工智能的文档校验方法、装置、设备及介质 | |
CN109033427B (zh) | 股票的筛选方法及装置、计算机设备及可读存储介质 | |
CN112035757A (zh) | 医疗瀑布流推送方法、装置、设备及存储介质 | |
WO2023029510A1 (zh) | 基于人工智能的远程问诊方法、装置、设备及介质 | |
CN114860887A (zh) | 基于智能联想的疾病内容推送方法、装置、设备及介质 | |
CN113868419A (zh) | 基于人工智能的文本分类方法、装置、设备及介质 | |
CN113724830A (zh) | 基于人工智能的用药风险检测方法及相关设备 | |
CN112214997A (zh) | 语音信息录入方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |