CN113641833A - 服务需求匹配方法及装置 - Google Patents
服务需求匹配方法及装置 Download PDFInfo
- Publication number
- CN113641833A CN113641833A CN202110944310.9A CN202110944310A CN113641833A CN 113641833 A CN113641833 A CN 113641833A CN 202110944310 A CN202110944310 A CN 202110944310A CN 113641833 A CN113641833 A CN 113641833A
- Authority
- CN
- China
- Prior art keywords
- service
- matching
- relationship
- determining
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000003062 neural network model Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 20
- 230000011218 segmentation Effects 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims abstract description 19
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims abstract description 8
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 8
- 230000001419 dependent effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 5
- 238000007726 management method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种服务需求匹配方法及装置,包括以下步骤:基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定文字在预设词库中对应的近义词;基于预设的源数据文档,应用分词工具进行分词处理,确定源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;基于服务名、服务关键词以及各服务名之间的关系,构建知识图谱;基于近义词、服务关键词以及知识图谱,应用预设的匹配规则,确定文字对应的服务需求。本发明的服务需求匹配方法及装置能够真正将用户描述中的语义信息用于服务匹配;同时应用知识图谱的方式保证服务间的强关联能力,保证了匹配的高查准率和查全率。
Description
技术领域
本发明涉及服务匹配领域,特别是涉及一种服务需求匹配方法及装置。
背景技术
随着技术的快速发展,各行业系统中的服务也随之增多,快速准确地获取需要的服务愈发困难。
现有技术中的服务需求匹配方法主要分为三类:基于本体、描述逻辑以及语义理解,基于本体的匹配方法具体为在服务系统中基于本体之间的层次关系构建服务分类树进行服务匹配;基于描述逻辑的匹配方法以描述逻辑语言的形式表示服务和请求,再通过逻辑推理方式进行服务匹配;基于语义理解的匹配方法是建立在一定的实例结构上,通过将相应的语义概念映射到服务上,实现语义服务匹配;这三类方法一般仅针对描述中的关键词进行匹配,没有真正将用户描述中的语义信息用于服务匹配,无法进行模糊匹配,导致匹配的查准率不高;并且,现有技术的服务需求匹配方法中的数据存储结构对于服务的关联能力较差,影响匹配的查全率。
因此,如何保证服务需求匹配的查准率和查全率是一个亟待解决的问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种服务需求匹配方法及装置,用于解决现有技术中未能保证服务需求匹配的查准率和查全率的问题。
为实现上述目的及其他相关目的,本发明提供一种服务需求匹配方法及装置,包括以下步骤:基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
于本发明的一实施例中,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。
于本发明的一实施例中,所述基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求,包括:将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
于本发明的一实施例中,所述第一服务名即确定为所述文字对应的服务需求之后,还包括:基于已确定为所述文字对应的服务需求的第一服务名、所述知识图谱,判断与所述第一服务名连接的服务名的关系边中有无依赖或从属关系;当与所述第一服务名连接的服务名的关系边中存在依赖或从属关系时,将该依赖关系边或从属关系边连接的服务名也确定为所述文字对应的服务需求。
于本发明的一实施例中,在应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系之前,还包括:基于所述源数据文档,应用所述双向循环神经网络模型,确定各服务名的向量表示;基于所述各服务名的向量表示、所述各服务名之间的关系,应用预设的向量匹配法,确定所述各服务名中两两服务名之间的关系;基于所述两两服务名之间的关系、所述各服务名,训练所述图神经网络模型,确定所述图神经网络模型的模型参数。
对应地,本发明提供一种服务需求匹配装置,包括:第一处理模块,用于基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;第一确定模块,用于基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;第二处理模块,用于基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;第二确定模块,用于基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
于本发明的一实施例中,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。
于本发明的一实施例中,所述第二确定模块,具体用于:将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
本发明提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的服务需求匹配方法。
本发明提供一种服务需求匹配平台,包括存储器,用于存储计算机程序;处理器,用于运行所述计算机程序以实现上述的服务需求匹配方法。
如上所述,本发明的服务需求匹配方法及装置,具有以下有益效果:
(1)能够真正将用户描述中的语义信息用于服务匹配,并进行模糊匹配,保证匹配的高查准率。
(2)应用知识图谱的方式保证服务间的强关联能力,进而确保匹配的查全率。
(3)提高服务需求匹配的效率,节省用户的时间和资源。
附图说明
图1显示为本发明的服务需求匹配方法于一实施例中的流程图。
图2显示为本发明的服务需求匹配方法于一实施例中的关系抽取示例图。
图3显示为本发明的服务需求匹配方法于一实施例中的知识图谱示例图。
图4显示为本发明的服务需求匹配方法于一实施例中的第一匹配结果、第二匹配结果连接服务名示例图。
图5显示为本发明的服务需求匹配方法于一实施例中的执行过程图。
图6显示为本发明的服务需求匹配装置于一实施例中的结构示意图。
图7显示为本发明的服务需求匹配装置于一实施例中的服务需求匹配平台。
元件标号说明
61 第一处理模块
62 第一确定模块
63 第二处理模块
64 第二确定模块
71 处理器
72 存储器
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明的服务需求匹配方法及装置能够真正将用户描述中的语义信息用于服务匹配,并进行模糊匹配,保证匹配的高查准率;同时应用知识图谱的方式保证服务间的强关联能力,进而确保匹配的查全率;此外,提高了服务需求匹配的效率,节省用户的时间和资源。
如图1所示,于一实施例中,本发明的服务需求匹配方法包括以下步骤:
步骤S1、基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词。
具体地,获取用户输入的文字,由于用户输入的文字通常包含不规范的信息,可对这些文字先进行预处理,之后再应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词。举例来说,预设的词库为搜狗语料及维基百科语料训练的词库,文字在预设词库中对应的近义词设定为最相似的15个词汇。
进一步具体地,预处理操作包括去噪、分词以及去除停用词。由于用户输入的文字中可能包含与服务需求匹配无关的字符等无用信息,因此,可使用正则匹配方式去除例如乱码字符、符号串及标点符号等进行去噪处理;其次,这里用户输入的文字是以中文的形式作为研究对象,由于中文没有空格作为特殊的分隔符,所以需要使用分词技术将连续的语句切分成独立的词以为后续处理工作做准备。再次,中文中会有一些不包含实际语义信息且出现频率极高的词汇,这类词汇统称为停用词,停用词对服务的匹配没有帮助,且一定情况下还会对匹配结果产生干扰,因此需要去除停用词。经过预处理后可得到待处理的信息,
举例来说,用户输入的文字为“我想浏览和该案有关系的案子”,经预处理后得到的信息为{‘浏览’、‘该案’、‘关系’、‘案子’};这些信息在预设词库中对应的近义词如表一所示。
表一
步骤S2、基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系。
具体地,这里预设的源数据文档比如为检察业务相关文档,属于非结构化数据,先应用分词器进行数据分词处理,将所有服务名加入到自定义词库中;并从服务名中提取服务关键词,服务关键词包括服务主体和服务类型。举例来说,提取出的部分服务关键词包括:查询、管理、删除、全景、确认、认证、关联、收集、案件、用印、打印、文书转版、专项活动、文号、专项以及权限。再比如,源数据文档包括的文字有“用印打印管理包含用印管理和打印管理,其中用印管理又分为用印审核和直接用印”,分词处理后的信息为{‘用印打印管理’、‘包含’、‘用印管理’、‘和’、‘打印管理’、‘其中’、‘用印管理’、‘又’、‘分为’、‘用印审核’、‘和’、‘直接用印’}。之后应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系,其中,各服务名之间的关系包括并列、依赖、从属以及无关联。
进一步具体地,在应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系之前,基于所述源数据文档,应用所述双向循环神经网络模型,确定各服务名的向量表示以使向量表示中包含上下文信息,举例来说,上述源数据文档中的“用印管理”的向量(50维)为:[0.0064060083 -0.0002635554-0.001307604 0.0065669220.00068106665 0.00055372075 -0.007237267 0.0047458424 0.009389413 -0.006161179 -0.0058978954 -0.0006887198 -0.008856009 0.005439292 4.653199e-05-0.0020565384 0.0036302982 0.0075353975 -0.0056421547 0.0077341595-0.009826432 0.0030446295 0.0006284367 0.0036743693 -0.0031032993 0.0087837290.0038865665 -0.003992699 0.0021637736 -0.005291772 -0.0070210835 0.007030940.004571359 -0.0054982184 0.008961867 -0.00911793 0.00927406 0.0086257930.004599933 0.00012453737 0.0016010791 -0.005844998 0.0060333684 0.008363327-0.004076119 -0.006362876 0.0055212453 -0.009707253 -0.0055170674 -0.00473385]。基于所述各服务名的向量表示、所述各服务名之间的关系,应用预设的向量匹配法,确定所述各服务名中两两服务名之间的关系;基于所述两两服务名之间的关系、所述各服务名,训练所述图神经网络模型,确定所述图神经网络模型的模型参数。其中,在训练图神经网络模型时,是以各服务名为节点,两两服务名之间的关系为关系边的连接图的模式为输入基础进行的服务间的关系抽取,如图2所示,于本实施例中的服务间的关系抽取示例图。举例来说,经训练确定出的图神经网络模型的模型参数量为0.12M,在实际应用时,当对图神经网络模型输入[service1“案件查询”,rel:?,service2:“用户登录”],模型输出的结果为:dep;结果表示为依赖关系。
步骤S3、基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱。
具体地,所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。如图3所示,于本实施例中的知识图谱示例图,图中,不同颜色表示不同种类的节点,蓝色为服务节点,红色为服务主体节点,黄色为服务类型节点。并且知识图谱中的服务是以三元组的格式存储,比如,服务名为案件查询,存储形式如下:(案件查询)-[subject_is]-(案件);(案件查询)-[category_is]-(查询);(案件查询)-[dep]-(用户登录)。
步骤S4、基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
具体地,将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
举例来说,将上述表一和提取出的部分服务关键词进行匹配对比,确定出的匹配结果为模糊匹配结果:查询、案件以及关联;若匹配结果中包含关键词及其词性,格式如下:{'查询':['category'],'案件':['subject'],'关联':['category']}。将这些匹配结果按照服务主体和服务类型进行分类记录,得到的第一匹配结果为案件;第二匹配结果为查询和关联;如图4所示,于本实施例中的第一匹配结果、第二匹配结果连接服务名示例图,将第一匹配结果‘案件’和知识图谱进行匹配对比,确定出的第一服务名包括:案件查询、案件管理、案件全景、案件关联以及案件删除;将第二匹配结果‘查询’、‘关联’分别和知识图谱进行匹配对比,确定出与‘查询’连接的第二服务名包括:案件查询、历史打印查询、历史用印查询、历史文号查询、专项活动查询;与‘关联’连接的第二服务名包括:案件关联;比对第一服务名和第二服务名,其中的‘案件查询’、‘案件关联’相同,即将‘案件查询’、‘案件关联’确定为文字对应的服务需求。
进一步具体地,基于已确定为所述文字对应的服务需求的第一服务名、所述知识图谱,判断与所述第一服务名连接的服务名的关系边中有无依赖或从属关系;当与所述第一服务名连接的服务名的关系边中存在依赖或从属关系时,将该依赖关系边或从属关系边连接的服务名也确定为所述文字对应的服务需求。
举例来说,已确定为文字对应的服务需求的第一服务名包括:案件查询和案件关联;将‘案件查询’和‘案件关联’分别和知识图谱进行匹配对比,与‘案件查询’有依赖关系的服务名包括:用户登录和权限核对;与‘案件关联’有依赖或从属关系的服务名无;因此,将服务名‘用户登录’和‘权限核对’也确定为文字对应的服务需求。
通过上述步骤S1-S4的处理,本发明以语义描述向量化的方式将语义信息融入关键词模糊匹配过程中,并构建系统服务知识图谱,基于模糊匹配的关键词和知识图谱良好的信息关联能力进行服务需求的匹配查询,提高服务匹配的查全率和查准率。如图5所示,于本实施例中的执行过程图。
进一步具体地,在确定出文字对应的服务需求后,对服务需求匹配结果进行评估,这里采用准确率和召回率作为匹配结果的评估标准,分别验证匹配方法的查准率和查全率。
准确率的公式表达式为:
其中,a表示匹配结果中符合用户服务需求的服务数量;b表示匹配结果中不符合用户服务需求的服务数量;准确率反映了匹配结果中与用户服务需求相关的服务数占匹配结果的总服务数量的比例。
召回率的公式表达式为:
其中,a表示匹配结果中符合用户服务需求的服务数量,c表示属于用户服务需求但匹配结果中不存在的服务数量;召回率反映了匹配结果中与用户服务需求相关的服务数占用户服务需求的所有服务的比例。实验模拟100组用户输入及对应匹配的服务输出,部分模拟测试实验数据如表二所示;根据实验得出本服务需求匹配方法的准确率为0.86,召回率为0.84。
表二
用户输入 | 服务需求匹配结果 |
我想浏览和该案有关系的案子 | 案件查询、案件关联 |
我想查看之前的打印记录和用印记录 | 历史打印查询、历史用印查询 |
整理活动的文件,并查阅一些案件 | 专项活动管理,案件查询 |
如图6所示,于一实施例中,本发明的服务需求匹配装置包括:
第一处理模块61,用于基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;
第一确定模块62,用于基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;
第二处理模块63,用于基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;
第二确定模块64,用于基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
其中,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。
所述第二确定模块64,具体用于:
将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;
将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;
当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
本实施例的服务需求匹配装置具体实现的技术特征与实施例1中服务需求匹配方法中的各步骤的原理基本相同,方法和装置之间可以通用的技术内容不作重复赘述。
如图7所示,于一实施例中,本发明的服务需求匹配平台包括:处理器71及存储器72。
所述存储器72用于存储计算机程序。
所述存储器72包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
所述处理器71与所述存储器72相连,用于执行所述存储器72存储的计算机程序,以使所述服务需求匹配平台执行上述的服务需求匹配方法。
优选地,上述的处理器71可以是通用处理器,包括中央处理器(CentralProcessing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明的服务需求匹配方法及装置能够真正将用户描述中的语义信息用于服务匹配,并进行模糊匹配,保证匹配的高查准率;同时应用知识图谱的方式保证服务间的强关联能力,进而确保匹配的查全率;此外,提高了服务需求匹配的效率,节省用户的时间和资源。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (10)
1.一种服务需求匹配方法,其特征在于,所述服务需求匹配方法包括以下步骤:
基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;
基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;
基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;
基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
2.根据权利要求1所述的方法,其特征在于,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;
所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。
3.根据权利要求2所述的方法,其特征在于,所述基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求,包括:
将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;
将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;
当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
4.根据权利要求3所述的方法,其特征在于,所述第一服务名即确定为所述文字对应的服务需求之后,还包括:
基于已确定为所述文字对应的服务需求的第一服务名、所述知识图谱,判断与所述第一服务名连接的服务名的关系边中有无依赖或从属关系;
当与所述第一服务名连接的服务名的关系边中存在依赖或从属关系时,将该依赖关系边或从属关系边连接的服务名也确定为所述文字对应的服务需求。
5.根据权利要求2所述的方法,其特征在于,在应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系之前,还包括:
基于所述源数据文档,应用所述双向循环神经网络模型,确定各服务名的向量表示;
基于所述各服务名的向量表示、所述各服务名之间的关系,应用预设的向量匹配法,确定所述各服务名中两两服务名之间的关系;
基于所述两两服务名之间的关系、所述各服务名,训练所述图神经网络模型,确定所述图神经网络模型的模型参数。
6.一种服务需求匹配装置,其特征在于,包括:
第一处理模块,用于基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;
第一确定模块,用于基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;
第二处理模块,用于基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;
第二确定模块,用于基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
7.根据权利要求6所述的装置,其特征在于,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。
8.根据权利要求7所述的装置,其特征在于,所述第二确定模块,具体用于:
将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;
将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;
当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
9.一种存储介质,存储有程序指令,其中,所述程序指令被执行时实现如权利要求1至权利要求5任一项所述的服务需求匹配方法的步骤。
10.一种服务需求匹配平台,其特征在于:包括存储器,用于存储计算机程序;处理器,用于运行所述计算机程序以实现如权利要求1至权利要求5任一权利要求所述的服务需求匹配方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110944310.9A CN113641833B (zh) | 2021-08-17 | 2021-08-17 | 服务需求匹配方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110944310.9A CN113641833B (zh) | 2021-08-17 | 2021-08-17 | 服务需求匹配方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113641833A true CN113641833A (zh) | 2021-11-12 |
CN113641833B CN113641833B (zh) | 2024-04-09 |
Family
ID=78422438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110944310.9A Active CN113641833B (zh) | 2021-08-17 | 2021-08-17 | 服务需求匹配方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113641833B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115100670A (zh) * | 2022-07-21 | 2022-09-23 | 中国平安人寿保险股份有限公司 | 保单信息处理方法及其系统、电子设备、存储介质 |
CN115880120A (zh) * | 2023-02-24 | 2023-03-31 | 江西微博科技有限公司 | 一种在线政务服务系统及服务方法 |
CN116433799A (zh) * | 2023-06-14 | 2023-07-14 | 安徽思高智能科技有限公司 | 一种基于语义相似度和子图匹配的流程图生成方法和装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106919660A (zh) * | 2017-02-09 | 2017-07-04 | 厦门快商通科技股份有限公司 | 基于知识图谱技术的服装客服智能服务方法和系统 |
CN109614476A (zh) * | 2018-12-11 | 2019-04-12 | 平安科技(深圳)有限公司 | 客服系统问答方法、装置、计算机设备及存储介质 |
CN111597308A (zh) * | 2020-05-19 | 2020-08-28 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的语音问答系统及其应用方法 |
WO2020228416A1 (zh) * | 2019-05-14 | 2020-11-19 | 京东数字科技控股有限公司 | 一种应答方法和装置 |
CN112463926A (zh) * | 2020-12-07 | 2021-03-09 | 广东电网有限责任公司佛山供电局 | 一种数据检索/智能问答方法、装置、存储介质 |
US20210117509A1 (en) * | 2019-10-17 | 2021-04-22 | Adobe Inc. | Creating a knowledge graph based on text-based knowledge corpora |
CN112732883A (zh) * | 2020-12-31 | 2021-04-30 | 平安科技(深圳)有限公司 | 基于知识图谱的模糊匹配方法、装置和计算机设备 |
WO2021107449A1 (ko) * | 2019-11-25 | 2021-06-03 | 주식회사 데이터마케팅코리아 | 음역 전환 신조어를 이용한 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치 |
WO2021107445A1 (ko) * | 2019-11-25 | 2021-06-03 | 주식회사 데이터마케팅코리아 | 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치 |
WO2021139283A1 (zh) * | 2020-06-16 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
CN113220996A (zh) * | 2021-05-10 | 2021-08-06 | 北京大学 | 基于知识图谱的科技服务推荐方法、装置、设备及存储介质 |
-
2021
- 2021-08-17 CN CN202110944310.9A patent/CN113641833B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106919660A (zh) * | 2017-02-09 | 2017-07-04 | 厦门快商通科技股份有限公司 | 基于知识图谱技术的服装客服智能服务方法和系统 |
CN109614476A (zh) * | 2018-12-11 | 2019-04-12 | 平安科技(深圳)有限公司 | 客服系统问答方法、装置、计算机设备及存储介质 |
WO2020228416A1 (zh) * | 2019-05-14 | 2020-11-19 | 京东数字科技控股有限公司 | 一种应答方法和装置 |
US20210117509A1 (en) * | 2019-10-17 | 2021-04-22 | Adobe Inc. | Creating a knowledge graph based on text-based knowledge corpora |
WO2021107449A1 (ko) * | 2019-11-25 | 2021-06-03 | 주식회사 데이터마케팅코리아 | 음역 전환 신조어를 이용한 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치 |
WO2021107445A1 (ko) * | 2019-11-25 | 2021-06-03 | 주식회사 데이터마케팅코리아 | 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치 |
CN111597308A (zh) * | 2020-05-19 | 2020-08-28 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的语音问答系统及其应用方法 |
WO2021139283A1 (zh) * | 2020-06-16 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于深度学习技术的知识图谱问答方法、装置及设备 |
CN112463926A (zh) * | 2020-12-07 | 2021-03-09 | 广东电网有限责任公司佛山供电局 | 一种数据检索/智能问答方法、装置、存储介质 |
CN112732883A (zh) * | 2020-12-31 | 2021-04-30 | 平安科技(深圳)有限公司 | 基于知识图谱的模糊匹配方法、装置和计算机设备 |
CN113220996A (zh) * | 2021-05-10 | 2021-08-06 | 北京大学 | 基于知识图谱的科技服务推荐方法、装置、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
王道平;刘涛;: "基于本体的敏捷供应链知识服务检索模型研究", 情报杂志, no. 12 * |
葛文;成毅;孙亚飞;: "基于简单语义的地理信息服务发现方法研究", 地理信息世界, no. 03 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115100670A (zh) * | 2022-07-21 | 2022-09-23 | 中国平安人寿保险股份有限公司 | 保单信息处理方法及其系统、电子设备、存储介质 |
CN115880120A (zh) * | 2023-02-24 | 2023-03-31 | 江西微博科技有限公司 | 一种在线政务服务系统及服务方法 |
CN116433799A (zh) * | 2023-06-14 | 2023-07-14 | 安徽思高智能科技有限公司 | 一种基于语义相似度和子图匹配的流程图生成方法和装置 |
CN116433799B (zh) * | 2023-06-14 | 2023-08-25 | 安徽思高智能科技有限公司 | 一种基于语义相似度和子图匹配的流程图生成方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113641833B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11227118B2 (en) | Methods, devices, and systems for constructing intelligent knowledge base | |
CN107122413B (zh) | 一种基于图模型的关键词提取方法及装置 | |
WO2021174783A1 (zh) | 近义词推送方法、装置、电子设备及介质 | |
CN111291161A (zh) | 法律案件知识图谱查询方法、装置、设备及存储介质 | |
US8868405B2 (en) | System and method for comparative analysis of textual documents | |
JP5936698B2 (ja) | 単語意味関係抽出装置 | |
CN111325029B (zh) | 一种基于深度学习集成模型的文本相似度计算方法 | |
CN113641833B (zh) | 服务需求匹配方法及装置 | |
CN107844533A (zh) | 一种智能问答系统及分析方法 | |
Sleeman et al. | Entity type recognition for heterogeneous semantic graphs | |
CN107679075B (zh) | 网络监控方法和设备 | |
CN111325030A (zh) | 文本标签构建方法、装置、计算机设备和存储介质 | |
Han et al. | Text Summarization Using FrameNet‐Based Semantic Graph Model | |
CN113626704A (zh) | 基于word2vec模型的推荐信息方法、装置及设备 | |
CN115114420A (zh) | 一种知识图谱问答方法、终端设备及存储介质 | |
CN113157887B (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
CN113591476A (zh) | 一种基于机器学习的数据标签推荐方法 | |
CN111783425A (zh) | 基于句法分析模型的意图识别方法及相关装置 | |
CN110688559A (zh) | 一种检索方法及装置 | |
CN112579774B (zh) | 模型训练方法、模型训练装置及终端设备 | |
CN113590792A (zh) | 用户问题的处理方法、装置和服务器 | |
CN115129864A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
CN113434649A (zh) | 基于政策faq数据库的问题匹配方法、装置、设备及介质 | |
CN110930189A (zh) | 基于用户行为的个性化营销方法 | |
CN113807429B (zh) | 企业的分类方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |