CN113641833B - 服务需求匹配方法及装置 - Google Patents

服务需求匹配方法及装置 Download PDF

Info

Publication number
CN113641833B
CN113641833B CN202110944310.9A CN202110944310A CN113641833B CN 113641833 B CN113641833 B CN 113641833B CN 202110944310 A CN202110944310 A CN 202110944310A CN 113641833 B CN113641833 B CN 113641833B
Authority
CN
China
Prior art keywords
service
matching
names
relation
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110944310.9A
Other languages
English (en)
Other versions
CN113641833A (zh
Inventor
蒋昌俊
闫春钢
丁志军
王俊丽
张亚英
张超波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202110944310.9A priority Critical patent/CN113641833B/zh
Publication of CN113641833A publication Critical patent/CN113641833A/zh
Application granted granted Critical
Publication of CN113641833B publication Critical patent/CN113641833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种服务需求匹配方法及装置,包括以下步骤:基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定文字在预设词库中对应的近义词;基于预设的源数据文档,应用分词工具进行分词处理,确定源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;基于服务名、服务关键词以及各服务名之间的关系,构建知识图谱;基于近义词、服务关键词以及知识图谱,应用预设的匹配规则,确定文字对应的服务需求。本发明的服务需求匹配方法及装置能够真正将用户描述中的语义信息用于服务匹配;同时应用知识图谱的方式保证服务间的强关联能力,保证了匹配的高查准率和查全率。

Description

服务需求匹配方法及装置
技术领域
本发明涉及服务匹配领域,特别是涉及一种服务需求匹配方法及装置。
背景技术
随着技术的快速发展,各行业系统中的服务也随之增多,快速准确地获取需要的服务愈发困难。
现有技术中的服务需求匹配方法主要分为三类:基于本体、描述逻辑以及语义理解,基于本体的匹配方法具体为在服务系统中基于本体之间的层次关系构建服务分类树进行服务匹配;基于描述逻辑的匹配方法以描述逻辑语言的形式表示服务和请求,再通过逻辑推理方式进行服务匹配;基于语义理解的匹配方法是建立在一定的实例结构上,通过将相应的语义概念映射到服务上,实现语义服务匹配;这三类方法一般仅针对描述中的关键词进行匹配,没有真正将用户描述中的语义信息用于服务匹配,无法进行模糊匹配,导致匹配的查准率不高;并且,现有技术的服务需求匹配方法中的数据存储结构对于服务的关联能力较差,影响匹配的查全率。
因此,如何保证服务需求匹配的查准率和查全率是一个亟待解决的问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种服务需求匹配方法及装置,用于解决现有技术中未能保证服务需求匹配的查准率和查全率的问题。
为实现上述目的及其他相关目的,本发明提供一种服务需求匹配方法及装置,包括以下步骤:基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
于本发明的一实施例中,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。
于本发明的一实施例中,所述基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求,包括:将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
于本发明的一实施例中,所述第一服务名即确定为所述文字对应的服务需求之后,还包括:基于已确定为所述文字对应的服务需求的第一服务名、所述知识图谱,判断与所述第一服务名连接的服务名的关系边中有无依赖或从属关系;当与所述第一服务名连接的服务名的关系边中存在依赖或从属关系时,将该依赖关系边或从属关系边连接的服务名也确定为所述文字对应的服务需求。
于本发明的一实施例中,在应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系之前,还包括:基于所述源数据文档,应用所述双向循环神经网络模型,确定各服务名的向量表示;基于所述各服务名的向量表示、所述各服务名之间的关系,应用预设的向量匹配法,确定所述各服务名中两两服务名之间的关系;基于所述两两服务名之间的关系、所述各服务名,训练所述图神经网络模型,确定所述图神经网络模型的模型参数。
对应地,本发明提供一种服务需求匹配装置,包括:第一处理模块,用于基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;第一确定模块,用于基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;第二处理模块,用于基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;第二确定模块,用于基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
于本发明的一实施例中,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。
于本发明的一实施例中,所述第二确定模块,具体用于:将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
本发明提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的服务需求匹配方法。
本发明提供一种服务需求匹配平台,包括存储器,用于存储计算机程序;处理器,用于运行所述计算机程序以实现上述的服务需求匹配方法。
如上所述,本发明的服务需求匹配方法及装置,具有以下有益效果:
(1)能够真正将用户描述中的语义信息用于服务匹配,并进行模糊匹配,保证匹配的高查准率。
(2)应用知识图谱的方式保证服务间的强关联能力,进而确保匹配的查全率。
(3)提高服务需求匹配的效率,节省用户的时间和资源。
附图说明
图1显示为本发明的服务需求匹配方法于一实施例中的流程图。
图2显示为本发明的服务需求匹配方法于一实施例中的关系抽取示例图。
图3显示为本发明的服务需求匹配方法于一实施例中的知识图谱示例图。
图4显示为本发明的服务需求匹配方法于一实施例中的第一匹配结果、第二匹配结果连接服务名示例图。
图5显示为本发明的服务需求匹配方法于一实施例中的执行过程图。
图6显示为本发明的服务需求匹配装置于一实施例中的结构示意图。
图7显示为本发明的服务需求匹配装置于一实施例中的服务需求匹配平台。
元件标号说明
61 第一处理模块
62 第一确定模块
63 第二处理模块
64 第二确定模块
71 处理器
72 存储器
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明的服务需求匹配方法及装置能够真正将用户描述中的语义信息用于服务匹配,并进行模糊匹配,保证匹配的高查准率;同时应用知识图谱的方式保证服务间的强关联能力,进而确保匹配的查全率;此外,提高了服务需求匹配的效率,节省用户的时间和资源。
如图1所示,于一实施例中,本发明的服务需求匹配方法包括以下步骤:
步骤S1、基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词。
具体地,获取用户输入的文字,由于用户输入的文字通常包含不规范的信息,可对这些文字先进行预处理,之后再应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词。举例来说,预设的词库为搜狗语料及维基百科语料训练的词库,文字在预设词库中对应的近义词设定为最相似的15个词汇。
进一步具体地,预处理操作包括去噪、分词以及去除停用词。由于用户输入的文字中可能包含与服务需求匹配无关的字符等无用信息,因此,可使用正则匹配方式去除例如乱码字符、符号串及标点符号等进行去噪处理;其次,这里用户输入的文字是以中文的形式作为研究对象,由于中文没有空格作为特殊的分隔符,所以需要使用分词技术将连续的语句切分成独立的词以为后续处理工作做准备。再次,中文中会有一些不包含实际语义信息且出现频率极高的词汇,这类词汇统称为停用词,停用词对服务的匹配没有帮助,且一定情况下还会对匹配结果产生干扰,因此需要去除停用词。经过预处理后可得到待处理的信息,
举例来说,用户输入的文字为“我想浏览和该案有关系的案子”,经预处理后得到的信息为{‘浏览’、‘该案’、‘关系’、‘案子’};这些信息在预设词库中对应的近义词如表一所示。
表一
步骤S2、基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系。
具体地,这里预设的源数据文档比如为检察业务相关文档,属于非结构化数据,先应用分词器进行数据分词处理,将所有服务名加入到自定义词库中;并从服务名中提取服务关键词,服务关键词包括服务主体和服务类型。举例来说,提取出的部分服务关键词包括:查询、管理、删除、全景、确认、认证、关联、收集、案件、用印、打印、文书转版、专项活动、文号、专项以及权限。再比如,源数据文档包括的文字有“用印打印管理包含用印管理和打印管理,其中用印管理又分为用印审核和直接用印”,分词处理后的信息为{‘用印打印管理’、‘包含’、‘用印管理’、‘和’、‘打印管理’、‘其中’、‘用印管理’、‘又’、‘分为’、‘用印审核’、‘和’、‘直接用印’}。之后应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系,其中,各服务名之间的关系包括并列、依赖、从属以及无关联。
进一步具体地,在应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系之前,基于所述源数据文档,应用所述双向循环神经网络模型,确定各服务名的向量表示以使向量表示中包含上下文信息,举例来说,上述源数据文档中的“用印管理”的向量(50维)为:[0.0064060083 -0.0002635554-0.001307604 0.0065669220.00068106665 0.00055372075 -0.007237267 0.0047458424 0.009389413 -0.006161179 -0.0058978954 -0.0006887198 -0.008856009 0.005439292 4.653199e-05-0.0020565384 0.0036302982 0.0075353975 -0.0056421547 0.0077341595-0.009826432 0.0030446295 0.0006284367 0.0036743693 -0.0031032993 0.0087837290.0038865665 -0.003992699 0.0021637736 -0.005291772 -0.0070210835 0.007030940.004571359 -0.0054982184 0.008961867 -0.00911793 0.00927406 0.0086257930.004599933 0.00012453737 0.0016010791 -0.005844998 0.0060333684 0.008363327-0.004076119 -0.006362876 0.0055212453 -0.009707253 -0.0055170674 -0.00473385]。基于所述各服务名的向量表示、所述各服务名之间的关系,应用预设的向量匹配法,确定所述各服务名中两两服务名之间的关系;基于所述两两服务名之间的关系、所述各服务名,训练所述图神经网络模型,确定所述图神经网络模型的模型参数。其中,在训练图神经网络模型时,是以各服务名为节点,两两服务名之间的关系为关系边的连接图的模式为输入基础进行的服务间的关系抽取,如图2所示,于本实施例中的服务间的关系抽取示例图。举例来说,经训练确定出的图神经网络模型的模型参数量为0.12M,在实际应用时,当对图神经网络模型输入[service1“案件查询”,rel:?,service2:“用户登录”],模型输出的结果为:dep;结果表示为依赖关系。
步骤S3、基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱。
具体地,所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。如图3所示,于本实施例中的知识图谱示例图,图中,不同颜色表示不同种类的节点,蓝色为服务节点,红色为服务主体节点,黄色为服务类型节点。并且知识图谱中的服务是以三元组的格式存储,比如,服务名为案件查询,存储形式如下:(案件查询)-[subject_is]-(案件);(案件查询)-[category_is]-(查询);(案件查询)-[dep]-(用户登录)。
步骤S4、基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
具体地,将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
举例来说,将上述表一和提取出的部分服务关键词进行匹配对比,确定出的匹配结果为模糊匹配结果:查询、案件以及关联;若匹配结果中包含关键词及其词性,格式如下:{'查询':['category'],'案件':['subject'],'关联':['category']}。将这些匹配结果按照服务主体和服务类型进行分类记录,得到的第一匹配结果为案件;第二匹配结果为查询和关联;如图4所示,于本实施例中的第一匹配结果、第二匹配结果连接服务名示例图,将第一匹配结果‘案件’和知识图谱进行匹配对比,确定出的第一服务名包括:案件查询、案件管理、案件全景、案件关联以及案件删除;将第二匹配结果‘查询’、‘关联’分别和知识图谱进行匹配对比,确定出与‘查询’连接的第二服务名包括:案件查询、历史打印查询、历史用印查询、历史文号查询、专项活动查询;与‘关联’连接的第二服务名包括:案件关联;比对第一服务名和第二服务名,其中的‘案件查询’、‘案件关联’相同,即将‘案件查询’、‘案件关联’确定为文字对应的服务需求。
进一步具体地,基于已确定为所述文字对应的服务需求的第一服务名、所述知识图谱,判断与所述第一服务名连接的服务名的关系边中有无依赖或从属关系;当与所述第一服务名连接的服务名的关系边中存在依赖或从属关系时,将该依赖关系边或从属关系边连接的服务名也确定为所述文字对应的服务需求。
举例来说,已确定为文字对应的服务需求的第一服务名包括:案件查询和案件关联;将‘案件查询’和‘案件关联’分别和知识图谱进行匹配对比,与‘案件查询’有依赖关系的服务名包括:用户登录和权限核对;与‘案件关联’有依赖或从属关系的服务名无;因此,将服务名‘用户登录’和‘权限核对’也确定为文字对应的服务需求。
通过上述步骤S1-S4的处理,本发明以语义描述向量化的方式将语义信息融入关键词模糊匹配过程中,并构建系统服务知识图谱,基于模糊匹配的关键词和知识图谱良好的信息关联能力进行服务需求的匹配查询,提高服务匹配的查全率和查准率。如图5所示,于本实施例中的执行过程图。
进一步具体地,在确定出文字对应的服务需求后,对服务需求匹配结果进行评估,这里采用准确率和召回率作为匹配结果的评估标准,分别验证匹配方法的查准率和查全率。
准确率的公式表达式为:
其中,a表示匹配结果中符合用户服务需求的服务数量;b表示匹配结果中不符合用户服务需求的服务数量;准确率反映了匹配结果中与用户服务需求相关的服务数占匹配结果的总服务数量的比例。
召回率的公式表达式为:
其中,a表示匹配结果中符合用户服务需求的服务数量,c表示属于用户服务需求但匹配结果中不存在的服务数量;召回率反映了匹配结果中与用户服务需求相关的服务数占用户服务需求的所有服务的比例。实验模拟100组用户输入及对应匹配的服务输出,部分模拟测试实验数据如表二所示;根据实验得出本服务需求匹配方法的准确率为0.86,召回率为0.84。
表二
用户输入 服务需求匹配结果
我想浏览和该案有关系的案子 案件查询、案件关联
我想查看之前的打印记录和用印记录 历史打印查询、历史用印查询
整理活动的文件,并查阅一些案件 专项活动管理,案件查询
如图6所示,于一实施例中,本发明的服务需求匹配装置包括:
第一处理模块61,用于基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;
第一确定模块62,用于基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;
第二处理模块63,用于基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;
第二确定模块64,用于基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求。
其中,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接。
所述第二确定模块64,具体用于:
将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;
将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;
当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
本实施例的服务需求匹配装置具体实现的技术特征与实施例1中服务需求匹配方法中的各步骤的原理基本相同,方法和装置之间可以通用的技术内容不作重复赘述。
如图7所示,于一实施例中,本发明的服务需求匹配平台包括:处理器71及存储器72。
所述存储器72用于存储计算机程序。
所述存储器72包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
所述处理器71与所述存储器72相连,用于执行所述存储器72存储的计算机程序,以使所述服务需求匹配平台执行上述的服务需求匹配方法。
优选地,上述的处理器71可以是通用处理器,包括中央处理器(CentralProcessing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明的服务需求匹配方法及装置能够真正将用户描述中的语义信息用于服务匹配,并进行模糊匹配,保证匹配的高查准率;同时应用知识图谱的方式保证服务间的强关联能力,进而确保匹配的查全率;此外,提高了服务需求匹配的效率,节省用户的时间和资源。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (5)

1.一种服务需求匹配方法,其特征在于,所述服务需求匹配方法包括以下步骤:
基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;
基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;
基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;
基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求;
其中,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接;
基于所述源数据文档,应用所述双向循环神经网络模型,确定各服务名的向量表示;
基于所述各服务名的向量表示、所述各服务名之间的关系,应用预设的向量匹配法,确定所述各服务名中两两服务名之间的关系;
基于所述两两服务名之间的关系、所述各服务名,训练所述图神经网络模型,确定所述图神经网络模型的模型参数;
应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系;
所述基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求,包括:
将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;
将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;
当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
2.根据权利要求1所述的方法,其特征在于,所述第一服务名即确定为所述文字对应的服务需求之后,还包括:
基于已确定为所述文字对应的服务需求的第一服务名、所述知识图谱,判断与所述第一服务名连接的服务名的关系边中有无依赖或从属关系;
当与所述第一服务名连接的服务名的关系边中存在依赖或从属关系时,将与所述第一服务名有依赖或从属关系的服务名也确定为所述文字对应的服务需求。
3.一种服务需求匹配装置,其特征在于,包括:
第一处理模块,用于基于用户输入的文字,应用自然语言向量化模型和词向量间余弦距离计算法,确定所述文字在预设词库中对应的近义词;
第一确定模块,用于基于预设的源数据文档,应用分词工具进行分词处理,确定所述源数据文档中的服务名和服务关键词;并应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系,其中,所述服务关键词包括服务主体和服务类型;所述各服务名之间的关系包括并列、依赖、从属以及无关联中的一种或多种;所述知识图谱包括节点和关系边;所述节点包括:所述服务名、所述服务主体以及所述服务类型;所述关系边包括所属关系边和服务关联关系边,其中,所述所属关系边根据所述服务主体和所述服务类型连接;所述服务关联关系边根据所述各服务名之间的关系连接;应用双向循环神经网络模型和图神经网络模型,确定各服务名之间的关系具体表现为:
基于所述源数据文档,应用所述双向循环神经网络模型,确定各服务名的向量表示;
基于所述各服务名的向量表示、所述各服务名之间的关系,应用预设的向量匹配法,确定所述各服务名中两两服务名之间的关系;
基于所述两两服务名之间的关系、所述各服务名,训练所述图神经网络模型,确定所述图神经网络模型的模型参数;
第二处理模块,用于基于所述服务名、所述服务关键词以及所述各服务名之间的关系,构建知识图谱;
第二确定模块,用于基于所述近义词、所述服务关键词以及所述知识图谱,应用预设的匹配规则,确定所述文字对应的服务需求,具体表现为:
将所述近义词和所述服务关键词进行匹配对比,确定两者的交集为匹配结果;并将所述匹配结果按照所述服务主体和所述服务类型进行分类记录,对应标记为第一匹配结果和第二匹配结果;
将所述第一匹配结果、所述第二匹配结果和所述知识图谱进行匹配对比,确定与所述第一匹配结果连接的第一服务名、以及与所述第二匹配结果连接的第二服务名;
当所述第一服务名和所述第二服务名相同时,所述第一服务名即确定为所述文字对应的服务需求。
4.一种存储介质,存储有程序指令,其中,所述程序指令被执行时实现如权利要求1至权利要求2任一项所述的服务需求匹配方法的步骤。
5.一种服务需求匹配平台,其特征在于:包括存储器,用于存储计算机程序;处理器,用于运行所述计算机程序以实现如权利要求1至权利要求2任一权利要求所述的服务需求匹配方法的步骤。
CN202110944310.9A 2021-08-17 2021-08-17 服务需求匹配方法及装置 Active CN113641833B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110944310.9A CN113641833B (zh) 2021-08-17 2021-08-17 服务需求匹配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110944310.9A CN113641833B (zh) 2021-08-17 2021-08-17 服务需求匹配方法及装置

Publications (2)

Publication Number Publication Date
CN113641833A CN113641833A (zh) 2021-11-12
CN113641833B true CN113641833B (zh) 2024-04-09

Family

ID=78422438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110944310.9A Active CN113641833B (zh) 2021-08-17 2021-08-17 服务需求匹配方法及装置

Country Status (1)

Country Link
CN (1) CN113641833B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115100670A (zh) * 2022-07-21 2022-09-23 中国平安人寿保险股份有限公司 保单信息处理方法及其系统、电子设备、存储介质
CN115880120B (zh) * 2023-02-24 2023-05-16 江西微博科技有限公司 一种在线政务服务系统及服务方法
CN116433799B (zh) * 2023-06-14 2023-08-25 安徽思高智能科技有限公司 一种基于语义相似度和子图匹配的流程图生成方法和装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919660A (zh) * 2017-02-09 2017-07-04 厦门快商通科技股份有限公司 基于知识图谱技术的服装客服智能服务方法和系统
CN109614476A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 客服系统问答方法、装置、计算机设备及存储介质
CN111597308A (zh) * 2020-05-19 2020-08-28 中国电子科技集团公司第二十八研究所 一种基于知识图谱的语音问答系统及其应用方法
WO2020228416A1 (zh) * 2019-05-14 2020-11-19 京东数字科技控股有限公司 一种应答方法和装置
CN112463926A (zh) * 2020-12-07 2021-03-09 广东电网有限责任公司佛山供电局 一种数据检索/智能问答方法、装置、存储介质
CN112732883A (zh) * 2020-12-31 2021-04-30 平安科技(深圳)有限公司 基于知识图谱的模糊匹配方法、装置和计算机设备
WO2021107445A1 (ko) * 2019-11-25 2021-06-03 주식회사 데이터마케팅코리아 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치
WO2021107449A1 (ko) * 2019-11-25 2021-06-03 주식회사 데이터마케팅코리아 음역 전환 신조어를 이용한 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
WO2021139283A1 (zh) * 2020-06-16 2021-07-15 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN113220996A (zh) * 2021-05-10 2021-08-06 北京大学 基于知识图谱的科技服务推荐方法、装置、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11531817B2 (en) * 2019-10-17 2022-12-20 Adobe Inc. Creating a knowledge graph based on text-based knowledge corpora

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919660A (zh) * 2017-02-09 2017-07-04 厦门快商通科技股份有限公司 基于知识图谱技术的服装客服智能服务方法和系统
CN109614476A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 客服系统问答方法、装置、计算机设备及存储介质
WO2020228416A1 (zh) * 2019-05-14 2020-11-19 京东数字科技控股有限公司 一种应答方法和装置
WO2021107445A1 (ko) * 2019-11-25 2021-06-03 주식회사 데이터마케팅코리아 지식 그래프 및 국가별 음역 전환 기반 신조어 정보 서비스 제공 방법 및 그 장치
WO2021107449A1 (ko) * 2019-11-25 2021-06-03 주식회사 데이터마케팅코리아 음역 전환 신조어를 이용한 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
CN111597308A (zh) * 2020-05-19 2020-08-28 中国电子科技集团公司第二十八研究所 一种基于知识图谱的语音问答系统及其应用方法
WO2021139283A1 (zh) * 2020-06-16 2021-07-15 平安科技(深圳)有限公司 基于深度学习技术的知识图谱问答方法、装置及设备
CN112463926A (zh) * 2020-12-07 2021-03-09 广东电网有限责任公司佛山供电局 一种数据检索/智能问答方法、装置、存储介质
CN112732883A (zh) * 2020-12-31 2021-04-30 平安科技(深圳)有限公司 基于知识图谱的模糊匹配方法、装置和计算机设备
CN113220996A (zh) * 2021-05-10 2021-08-06 北京大学 基于知识图谱的科技服务推荐方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于本体的敏捷供应链知识服务检索模型研究;王道平;刘涛;;情报杂志(12);全文 *
基于简单语义的地理信息服务发现方法研究;葛文;成毅;孙亚飞;;地理信息世界(03);全文 *

Also Published As

Publication number Publication date
CN113641833A (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
CN113641833B (zh) 服务需求匹配方法及装置
US8630989B2 (en) Systems and methods for information extraction using contextual pattern discovery
CN111325029B (zh) 一种基于深度学习集成模型的文本相似度计算方法
CN111291161A (zh) 法律案件知识图谱查询方法、装置、设备及存储介质
CN111339751A (zh) 一种文本关键词处理方法、装置及设备
RU2704531C1 (ru) Способ и устройство для анализа семантической информации
JPWO2014033799A1 (ja) 単語意味関係抽出装置
CN107844533A (zh) 一种智能问答系统及分析方法
CN107679075B (zh) 网络监控方法和设备
Sleeman et al. Entity type recognition for heterogeneous semantic graphs
Han et al. Text Summarization Using FrameNet‐Based Semantic Graph Model
KR20220074576A (ko) 마케팅 지식 그래프 구축을 위한 딥러닝 기반 신조어 추출 방법 및 그 장치
Nawaz et al. A segregational approach for determining aspect sentiments in social media analysis
CN113468890B (zh) 基于nlp信息萃取与词性规则的沉积学文献挖掘方法
Saleiro et al. TexRep: A text mining framework for online reputation monitoring
Gupta et al. Research and implementation of event extraction from twitter using LDA and scoring function
CN111783425B (zh) 基于句法分析模型的意图识别方法及相关装置
CN115952770A (zh) 一种数据标准化的处理方法、装置、电子设备及存储介质
Ma et al. Api prober–a tool for analyzing web api features and clustering web apis
Lei et al. Incorporating task-oriented representation in text classification
KR20220074572A (ko) 딥러닝 기반 신조어 추출 방법 및 그 장치
Wu et al. Design of a Computer‐Based Legal Information Retrieval System
Santosh et al. Automatic machine recognition of features and sentiments from online reviews
CN113807429B (zh) 企业的分类方法、装置、计算机设备和存储介质
Sisodia et al. Agglomerative similarity measure based automated clustering of scholarly articles

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant