CN113392212A - 一种服务知识图谱构建方法、装置、电子设备及存储介质 - Google Patents

一种服务知识图谱构建方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113392212A
CN113392212A CN202110047756.1A CN202110047756A CN113392212A CN 113392212 A CN113392212 A CN 113392212A CN 202110047756 A CN202110047756 A CN 202110047756A CN 113392212 A CN113392212 A CN 113392212A
Authority
CN
China
Prior art keywords
service
information
text
text message
target service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110047756.1A
Other languages
English (en)
Inventor
毛铁峥
赵子元
颜强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Guangzhou Tencent Technology Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202110047756.1A priority Critical patent/CN113392212A/zh
Publication of CN113392212A publication Critical patent/CN113392212A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种服务知识图谱构建方法、装置、电子设备及存储介质,涉及人工智能技术领域。本申请实施例针对搜索服务场景,获取各个目标服务文本信息;分别根据各个目标服务文本信息的第一文本特征,确定各个目标服务文本信息各自关联的至少一个衍生服务文本信息;根据各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱;由于本申请实施例提供的服务知识图谱构建方案,并不局限于获取到的目标服务文本信息,根据目标服务文本信息可以得到关联的衍生服务文本信息,从而使得构建得到的服务知识图谱包含更为丰富的信息。

Description

一种服务知识图谱构建方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种服务知识图谱构建方法、装置、电子设备及存储介质。
背景技术
知识图谱(knowledge graph)是指以实体、概念作为节点,以节点之间关系作为边的树状拓扑网络。知识图谱使得知识获取更直接,从而实现数据搜索的便捷化、智能化和人性化。
在进行信息搜索时,可以根据预先构建的知识图谱,搜索与用户输入的搜索关键词有关联关系的信息。目前在构建知识图谱时是采用人工构建方式,人工获取大量的关键词,将获取到的关键词作为知识图谱的节点;以及人工设置的两个节点之间的关系,将具有关联关系的两个节点进行连线作为知识图谱的边;在生成节点和边之后完成知识图谱的构建。但是,采用人工构建的方式得到的知识图谱包含的信息数量和类型都有很大的局限性,构建得到的知识图谱过于单一。
发明内容
本申请提供一种服务知识图谱构建方法、装置、电子设备及存储介质,用以灵活构建信息丰富的服务知识图谱。
第一方面,本申请提供了一种服务知识图谱构建方法,包括:
针对搜索服务场景,获取各个目标服务文本信息;
分别根据所述各个目标服务文本信息的第一文本特征,确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息;
根据所述各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱。
第二方面,本申请提供了一种服务知识图谱构建装置,包括:
获取单元,用于针对搜索服务场景,获取各个目标服务文本信息;
确定单元,用于分别根据所述各个目标服务文本信息的第一文本特征,确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息;
处理单元,用于根据所述各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱。
可选的,所述处理单元具体用于:
针对所述各个目标服务文本信息分别执行以下操作:
根据所述各个服务文本信息中的一个目标服务文本信息与关联的至少一个衍生服务文本信息,分别生成包含目标服务文本信息、关联类型、衍生服务文本信息的三元组信息;其中,所述三元组信息的个数与所述一个目标服务文本信息关联的衍生服务文本信息的个数相同,所述关联类型为所述三元组信息包含的所述目标服务文本信息与所述衍生服务文本信息之间关联关系的类型。
可选的,所述确定单元还用于:
分别根据所述各个目标服务文本信息的第二文本特征,确定所述各个目标服务文本信息各自所属的服务类型;以及分别根据获得的各个衍生服务文本信息的第三文本特征,确定所述各个衍生服务文本信息各自所属的服务类型;
所述处理单元还用于:
在所述构建相应的服务知识图谱之后,响应展示所述服务知识图谱的指令,根据生成的各个三元组信息中包含的目标服务文本信息、衍生服务文本信息生成分别生成相应的节点,并基于所述各个目标服务文本信息各自对应的服务类型、以及所述各个衍生服务文本信息各自对应的服务类型,对生成的相应的节点进行分类展示;以及,根据生成的所述各个三元组信息中包含的关联类型,生成各个节点之间的边;根据生成的节点以及节点之间的边,展示构建的所述服务知识图谱。
可选的,所述衍生服务文本信息包括与所述目标服务文本信息为同义关联关系的同义文本信息;
所述确定单元还用于:
在所述确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息之前,分别确定所述各个目标服务文本信息各自对应的文本内容信息;将所述各个服务文本信息各自对应的文本内容信息的信息内容,分别进行融合处理,得到相应目标服务文本信息的第一文本特征;以及,确定预设的候选文本信息集合中各个候选文本信息各自对应文本内容信息;将所述各个候选文本信息各自对应的文本内容信息的信息内容,分别进行融合处理,得到相应候选文本信息的第三文本特征;其中,所述文本内容信息包含编辑距离、语义距离、共现信息、属性信息中的任意一种或组合;
所述确定单元具体用于:
针对各个目标服务文本信息分别执行以下操作:基于已训练的文本相关性模型,根据所述各个目标服务文本信息中的一个目标服务文本信息的第一文本特征,以及所述预设的候选文本信息集合中各个候选文本信息的第三文本特征,确定所述一个目标服务文本信息与所述预设的候选文本信息集合中各个候选文本信息之间的相似度;根据确定出的各个相似度,从所述预设的候选文本信息集合中筛选出与所述一个目标服务文本信息为同义关联关系的至少一个同义文本信息。
可选的,所述衍生服务文本信息包括所述目标服务文本信息的上位文本信息;
所述处理单元具体用于:
根据各个目标服务文本信息的第一文本特征以及预设的匹配规则,从预设的候选文本信息集合中筛选出各个目标服务文本信息各自关联的至少一个上位文本信息。
可选的,所述获取单元具体用于:
获取多个对象在搜索客户端中历史输入的各个服务文本信息,将获取到所述各个服务文本信息作为针对所述搜索服务场景的目标服务文本信息;或
从至少一个数据库中获取各个服务文本信息,作为针对所述搜索服务场景的目标服务文本信息。
可选的,所述处理单元还用于:
响应目标对象触发的搜索指令,获取所述搜索指令中包含的搜索服务文本信息;根据构建的所述服务知识图谱,从所述服务知识图谱中确定出所述搜索服务文本信息、以及与所述搜索服务文本信息有关联关系的至少一个服务文本信息;并将所述搜索服务文本信息、以及与所述搜索服务文本信息有关联关系的至少一个服务文本信息作为待推荐服务文本信息;将确定出的所述待推荐服务文本信息对应的页面展示信息推荐给所述目标对象。
第三方面,本申请实施例提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请提供的服务知识图谱构建方法。
第四方面,本申请实施例提供一种计算机可读介质,存储有计算机可执行指令,所述计算机可执行指令用于执行本申请提供的服务知识图谱构建方法。
本申请有益效果:
本申请实施例提供的构建服务知识图谱方案,在构建服务知识图谱时,首先获取多个目标服务文本信息,然后根据目标服务文本信息的文本特征确定每个目标服务文本信息关联的至少一个衍生服务文本信息,因此,可以根据一个目标服务文本信息得到关联的至少一个衍生服务文本,从而能够丰富服务文本信息。另外,在得到每个目标服务文本信息关联的至少一个衍生服务文本信息,根据各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱。因此,本申请实施例提供的服务知识图谱构建方案,并不局限于获取到的目标服务文本信息,根据目标服务文本信息可以得到关联的衍生服务文本信息,从而使得构建得到的服务知识图谱包含更为丰富的信息。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,并不构成对本申请的不当限定。
图1为本申请实施例提供的一种服务知识图谱构建方法的应用场景示意图;
图2为本申请实施例提供的一种服务知识图谱构建方法的流程图;
图3为本申请实施例提供的一种确定衍生服务文本信息示意图;
图4为本申请实施例提供的另一种确定衍生服务文本信息示意图;
图5为本申请实施例提供的一种服务知识图谱示意图;
图6为本申请实施例提供的一种服务知识图谱的应用场景示意图;
图7为本申请实施例提供的一种基于服务知识图谱的搜索方法流程示意图;
图8为本申请实施例提供的一种服务知识图谱构建装置的结构示意图;
图9为本申请实施例提供的一种电子设备的结构示意图;
图10为本申请实施例提供的一种计算装置的结构示意图。
具体实施方式
为了使本领域技术人员更好地理解本申请的技术方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整的描述。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
以下,对本申请实施例中的部分用语进行解释说明,以便于本领域技术人员理解。
1、垂直搜索:垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。例如公众号搜索、小程序搜索等。
2、服务搜索:用户可以通过搜索引擎进行服务搜索,用户输入搜索关键词(query),网页或客户端可以将满足用户搜索关键词的服务直接展示给用户。例如,用户搜索保姆时,服务搜索可以直接提供雇佣保姆的服务菜单。服务搜索是垂直搜索的一种。
3、知识图谱:是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。通过对错综复杂的文档的数据进行有效的加工、处理和整合,转化为简单和清晰的“实体-关系-实体”的三元组,聚合大量知识的拓扑图。
4、自然语言处理(NLP):是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。
5、语义:语言所蕴含的信息就是语义。符号是语言的载体,符号本身没有意义,只有被赋予含义的符号才能够被使用,这时候语言被转化为信息,而语言的含义就是语义(Semantic)。
6、终端:又称为用户设备(User Equipment,UE)、移动台(Mobile Station,MS)、移动终端(Mobile Terminal,MT)等,是一种向用户提供语音和/或数据连通性的设备,例如,具有无线连接功能的手持式设备、车载设备等。目前,一些终端的举例为:手机(mobilephone)、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(Mobile Internet Device,MID)。
7、客户端:既可以指软件类的应用程序(Application,APP),也可以指终端设备。它具有可视的显示界面,能与用户进行交互;是与服务器相对应,为客户提供本地服务。针对软件类的应用程序,除了一些只在本地运行的应用程序之外,一般安装在普通的客户终端上,需要与服务端互相配合运行。因特网发展以后,较常用的应用程序包括了如收寄电子邮件时的电子邮件客户端,以及即时通讯的客户端等。对于这一类应用程序,需要网络中有相应的服务器和服务程序来提供相应的服务,如数据库服务,配置参数服务等,这样在客户终端和服务器端,需要建立特定的通信连接,来保证应用程序的正常运行。
8、服务器:可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
下面对本申请实施例的设计思想进行简要介绍:
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
随着搜素引擎和各种客户端的不断普及,越来越多的场景下用户可以使用搜索功能,用户在搜索引擎或客户端中输入搜索关键词,搜索引擎或客户端可以基于预先构建的知识图谱搜索与用户输入搜索关键词相关的信息展示给用户。目前在构建知识图谱时是采用人工构建方式,人工获取大量的关键词,将获取到的关键词作为知识图谱的节点;以及人工设置的两个节点之间的关系,将具有关联关系的两个节点进行连线作为知识图谱的边;在生成节点和边之后完成知识图谱的构建。但是,采用人工构建的方式得到的知识图谱包含的信息数量和类型都有很大的局限性。并且,目前构建的知识图谱均是针对物品或商品搜索场景,基于构建的知识图谱,向用户推荐的也是与用户搜索物品或商品相似的其它物品或商品;例如,用户输入的搜索关键词为“空调”,则会向用户推荐各种品牌各项功能的空调。目前并没有针对服务场景构建服务知识图谱。
因此,本申请实施例提供一种服务知识图谱的构建方法,针对搜索服务场景,获取各个目标服务文本信息;分别根据各个目标服务文本信息的第一文本特征,确定各个目标服务文本信息各自关联的至少一个衍生服务文本信息;根据各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱。本申请实施例提供的构建服务知识图谱方案,在构建服务知识图谱时,首先获取多个目标服务文本信息,然后根据目标服务文本信息的文本特征确定每个目标服务文本信息关联的至少一个衍生服务文本信息,因此,可以根据一个目标服务文本信息得到关联的至少一个衍生服务文本,从而能够丰富服务文本信息。另外,在得到每个目标服务文本信息关联的至少一个衍生服务文本信息,根据各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱。因此,本申请实施例提供的服务知识图谱构建方案,并不局限于获取到的目标服务文本信息,根据目标服务文本信息可以得到关联的衍生服务文本信息,从而使得构建得到的服务知识图谱包含更为丰富的信息。
在介绍完本申请实施例的设计思想之后,下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
如图1所示,为本申请实施例示例性的一种应用场景的示意图,包括用户10、终端11、服务器12;
一种可选的应用场景为,用户10通过终端11的显示界面,触发服务知识图谱的构建指令,终端11将用户10触发的构建指令发送给服务器12;服务器12在接收到构建指令后,获取针对搜索服务场景的各个目标服务文本信息;分别根据各个目标服务文本信息的第一文本特征,确定各个目标服务文本信息各自关联的至少一个衍生服务文本信息;根据各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱;服务器12在构建得到服务知识图谱后,将构建得到的服务知识图谱进行存储。
其中,本申请实施例的服务器可以为一个独立服务器,或者可以是由多个服务器组成的服务器集群。终端11与服务器12之间通过网络进行通信连接,该网络可以为局域网、广域网等。
下面结合上述描述的应用场景,参考图2-图5来描述本申请示例性实施方式提供的服务知识图谱构建方法。需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。相反,本申请的实施方式可以应用于适用的任何场景。
如图2所示,为本申请实施例提供的一种服务知识图谱构建方法流程示意图,该方法可以包括以下步骤:
步骤S201、针对搜索服务场景,获取各个目标服务文本信息;
步骤S202、分别根据各个目标服务文本信息的第一文本特征,确定各个目标服务文本信息各自关联的至少一个衍生服务文本信息;
步骤S203、根据各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱。
本申请实施例的目标服务文本信息可以为具有服务搜索意图的关键词;
本申请实施例目标服务文本信息的获取方式可以包括但不限于下列方式:
方式1、获取多个对象在搜索客户端中历史输入的各个服务文本信息,将获取到各个服务文本信息作为针对搜索服务场景的目标服务文本信息;
在该种方式下,可以搜集大量用户在搜索客户端中历史输入的服务文本信息;由于用户在搜索客户端中历史输入的服务文本信息一般均为具有服务搜索意图的关键词,因此,可以将大量用户在搜索客户端中历史输入的服务文本信息作为针对搜索服务场景的目标服务文本信息。
例如,用户在搜索客户端中历史输入的服务文本信息可以为“修理空调”、“维修洗衣机”、“干洗”、“找保姆”、“找工作”等文本信息。
方式2、从至少一个数据库中获取各个服务文本信息,作为针对搜索服务场景的目标服务文本信息;
在该种方式下,本申请实施例在构建服务知识图谱时,可以从一个或多个数据库中获取服务文本信息,从一个或多个数据库中获取的服务文本信息可以为具有服务搜索意图的文本信息。
本申请实施例在构建服务知识图谱时,需要根据节点所属的类目体系对服务知识图谱中的节点进行分类;在获取到各个目标服务文本信息之后,确定每个目标服务文本信息所属的服务类型;
需要说明的是,目标服务文本信息所属的服务类型为目标服务文本信息在服务知识图谱中所属的类目体系。
在一些实施例中,根据下列方式确定各个目标服务文本信息所属的服务类型:
基于已训练的文本分类模型,确定各个目标服务文本信息所属的服务类型;
实施中,可以将各个目标服务文本信息分别输入已训练的文本分类模型,并将已训练的文本分类模型的输出作为各个目标服务文本信息所属的服务类型。
其中,已训练的文本分类模型包括特征提取网络和分类网络;
已训练的文本分类模型的特征提取网络是通过embedding的方式对目标服务文本信息进行随机初始化;
已训练的文本分类模型的分类网络对随机初始化得到的embedding向量进行分类,得到各个目标服务文本信息所属的服务类型。
下面针对基于已训练的文本分类模型得到各个目标服务文本信息所属的服务类型的方式进行详细说明:
基于已训练的文本分类模型的特征提取网络,针对各个目标服务文本信息分别执行以下操作:
从各个目标服务文本信息中提取一个目标服务文本信息对应的字向量、词向量以及表示一个目标服务文本信息中各字符之间相对位置关系位置向量;将提取出的字向量、词向量以及位置向量进行融合处理得到一个目标服务文本信息的第二文本特征。
在基于已训练的文本分类模型的特征提取网络,得到目标服务文本信息第二文本特征之后,基于已训练的文本分类模型的分类网络,确定每个目标服务文本信息所属的服务类型;
基于已训练的文本分类模型的分类网络,针对各个目标服务文本信息分别执行以下操作:
将各个目标服务文本信息中的一个目标服务文本信息的第二文本特征进行均值化处理,得到用于表示一个目标服务文本信息分别属于各个预设服务类型的概率的分类结果;根据所述分类结果,确定一个目标服务文本信息所属的服务类型。
需要说明的是,本发明实施例的文本分类模型可以为Fasttext模型。
本申请实施例在获取到各个目标服务文本信息之后,还可以确定每个目标服务文本信息的属性信息;
在确定每个目标服务文本信息的属性信息时,本申请实施例获取每个目标服务文本信息对应的属性特征;
其中,目标服务文本信息对应的属性特征包括但不限于词性特征、embedding特征、词频特征;
针对词性特征,可以采用结巴分词得到各个目标服务文本信息的词性特征;例如,词性特征可以为名词、动词、动名词等;
针对embedding特征,可以采用已训练的word2vec模型,得到各个目标服务文本信息的embedding特征;
针对词频特征,可以采用已训练的TF IDF模型,得到各个目标服务文本信息的词频特征。
在得到目标服务文本信息对应的属性特征之后,将各个目标服务文本信息对应的属性特征输入已训练的Xgboost分类模型,得到各个目标服务文本信息的属性信息。
本申请实施例在获取到各个目标服务文本信息之后,根据各个目标服务文本信息的第一文本特征,确定各个目标服务文本信息各自关联的至少一个衍生服务文本信息;
需要说明的是,本申请实施例中每个目标服务文本信息可以确定出至少一个衍生服务文本信息。
其中,衍生服务文本信息包括与目标服务文本信息为同义关联关系的同义文本信息、目标服务文本信息的上位文本信息;
下面针对这两种类型的衍生服务文本信息的确定方式分别进行说明:
1、衍生服务文本信息与目标服务文本信息为同义关联关系的同义文本信息;
例如,在目标服务文本信息为实体词时,衍生服务文本信息为实体词的同义词或扩展词。
在确定目标服务文本信息的同义文本信息时,可以基于已训练的文本相关性模型,确定各个目标服务文本信息的同义文本信息;
基于已训练的文本相关性模型,提取各个目标服务文本信息的第一文本特征;
实施中,针对各个目标服务文本信息,可以根据下列方式得到每个目标服务文本信息的第一文本特征:
分别确定各个目标服务文本信息各自对应的文本内容信息;将各个服务文本信息各自对应的文本内容信息的信息内容,分别进行融合处理,得到相应目标服务文本信息的第一文本特征。
另外,本申请实施例在基于已训练的文本相关性模型确定各个目标服务文本信息的同义文本信息时,是根据各个目标服务文本信息的第一文本特征,以及预设的候选文本信息集合中各个候选文本信息对应的第三文本特征,从预设的候选文本信息集合中筛选出与目标服务文本信息为同义关联关系的至少一个同义文本信息;
实施中,针对预设的候选文本信息集合中各个候选文本信息,可以根据下列方式得到每个候选文本信息的第三文本特征:
确定预设的候选文本信息集合中各个候选文本信息各自对应文本内容信息;将各个候选文本信息各自对应的文本内容信息的信息内容,分别进行融合处理,得到相应候选文本信息的第三文本特征。
需要说明的是,文本内容信息包含编辑距离、语义距离、共现信息、属性信息中的任意一种或组合;
其中,编辑距离为文本信息中两个字符串的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。编辑距离可以用在NLP中;语义距离为在语义空间中的距离;共现信息为文本信息描述的信息共同出现的现象。
属性信息的确定方式可以参见上文描述;例如,在目标服务文本信息包括服务词时,属性信息包括服务实体词、服务行为词、服务状态词、服务复合词等。
在得到各个目标服务文本信息的第一文本特征,以及预设的候选文本信息集合中各个候选文本信息的第三文本特征之后,基于已训练的文本相关性模型,得到各个目标服务文本信息各自关联的至少一个衍生服务文本信息;
例如,本申请实施例的文本相关性模型可以为线性LR模型。
实施中,针对各个目标服务文本信息分别执行以下操作:
基于已训练的文本相关性模型,根据各个目标服务文本信息中的一个目标服务文本信息的第一文本特征,以及预设的候选文本信息集合中各个候选文本信息的第三文本特征,确定一个目标服务文本信息与预设的候选文本信息集合中各个候选文本信息之间的相似度;根据确定出的各个相似度,从预设的候选文本信息集合中筛选出与一个目标服务文本信息为同义关联关系的至少一个同义文本信息。
需要说明的是,在确定目标文本信息关联的同义文本信息时,可以根据目标文本信息的属性信息以及候选文本信息的属性信息,可以得到不同属性的同义文本信息。
例如,在目标文本信息为“空调”时,对应的同义文本信息包括同义词和扩展词;其中,得到的与“空调”对应的同义词可以为“制冷空调”,得到的与“空调”对应的扩展词可以为汽车空调、中央空调、空调设备、空调机、空调车、空调网、空气、变频空调等。
2、衍生服务文本信息与目标服务文本信息为目标服务文本信息的上位文本信息;
例如,在目标服务文本信息为实体词时,衍生服务文本信息为实体词的上位词。
在一些实施例中,根据下列方式得到各个目标服务文本信息各自关联的至少一个上位文本信息:
根据各个目标服务文本信息的第一文本特征以及预设的匹配规则,从预设的候选文本信息集合中筛选出各个目标服务文本信息各自关联的至少一个上位文本信息。
需要说明的是,本申请实施例在根据目标服务文本信息得到关联的上位文本信息时,可以基于人工pattern挖掘的方式,得到目标服务文本信息关联的上位文本信息集合。例如,pattern挖掘确定A属于B,则B为A的上位文本信息。
通过上文描述的方式,针对各个目标服务文本信息,可以得到目标服务文本信息所属的服务类型、目标服务文本信息的属性信息、目服务文本信息关联的同义文本信息以及目标服务文本信息的上位文本信息。
例如,如图3所示,在本申请实施例的目标服务文本信息包括空调:确定“空调”所属的服务类型为家政;确定“空调”的属性信息为服务实体词;确定“空调”的扩展词包括汽车空调、中央空调、空调设备、空调机、空调车、空调网、空气、变频空调;确定“空调”的同义词为制冷空调;确定“空调”的上位词包括家用电器、家居电器、家电、电器、消费电子产品。
如图4所示,在本申请实施例的目标服务文本信息包括快速:确定“快速”所属的服务类型为家政或交通;在家政类型下,确定“快速”的属性信息为服务状态词,确定“快速”的扩展词包括快、速度;在交通类型下,确定“快速”的属性信息为服务状态词,确定“快速”的扩展词包括快速道路、速度、高速。
本申请实施例在确定各个目标服务文本信息各自关联的至少一个衍生服务文本信息之后,根据各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱;
在一些实施例中,可以根据下列方式构建服务知识图谱:
根据各个服务文本信息中的一个目标服务文本信息与关联的至少一个衍生服务文本信息,分别生成包含目标服务文本信息、关联类型、衍生服务文本信息的三元组信息;其中,三元组信息的个数与一个目标服务文本信息关联的衍生服务文本信息的个数相同,关联类型为所述三元组信息包含的目标服务文本信息与所述衍生服务文本信息之间关联关系的类型。
需要说明的是,本申请实施例构建的服务知识图谱在存储时可以以三元组信息的方式进行存储,每一个三元组信息表示形式为<实体-关系-实体>;其中实体可以为目标服务文本信息或衍生服务文本信息,关系为两个实体之间的关联关系;
其中,本申请实施例两个实体之间的关联关系包括但不限于:属于、作用于、行为是、同义、位于、品牌是、主要服务是、服务地域、服务人群、发生。
例如,目标服务文本信息为“洗衣机维修”,确定上位文本信息包括家电维修,确定同义文本信息包括洗衣机、维修;目标服务文本信息为“马桶修理”,确定上位文本信息包括房屋维修、厨卫维修,确定同义文本信息包括马桶、修理;目标服务文本信息为“厨卫维修”,确定上位文本信息包括房屋维修,确定同义文本信息包括厨卫用具、维修、修理;
则生成的三元组信息包括:
<洗衣机维修-属于-家电维修>、<洗衣机维修-同义-洗衣机>、<洗衣机维修-同义-维修>、<马桶修理-属于-房屋维修>、<马桶修理-属于-厨卫维修>、<马桶修理-同义-马桶>、<马桶修理-同义-修理>、<厨卫维修-属于-房屋维修>、<厨卫维修-同义-厨卫用具>、<厨卫维修-同义-维修>、<厨卫维修-同义-修理>。
另外,本申请实施例还需要确定每个目标服务文本信息和衍生服务文本信息的服务类型,其中,目标服务文本信息所属的服务类型的确定方式可以参见上文描述,衍生服务文本信息所属的服务类型的确定方式与目标服务类型所属的服务类型的确定方式相似,在此不再详细赘述。
在展示构建的服务知识图谱时,服务知识图谱可以以树状拓扑结构的方式进行展示;一种可选的实施方式为,在展示构建的服务知识图谱时,是根据不同服务类型进行分类展示;
实施中,分别确定各个目标服务文本信息各自所属的服务类型;以及分别确定各个衍生服务文本信息各自所属的服务类型;
响应展示服务知识图谱的指令,根据生成的各个三元组信息中包含的目标服务文本信息、衍生服务文本信息生成分别生成相应的节点,并基于各个目标服务文本信息各自对应的服务类型、以及各个衍生服务文本信息各自对应的服务类型,对生成的相应的节点进行分类展示;以及根据生成的各个三元组信息中包含的关联类型,生成各个节点之间的边;根据生成的节点以及节点之间的边,展示构建的服务知识图谱。
例如,家政服务类型下包括的服务类目体系有家电维修和房屋维修;其中,家电维修服务类目体系下包括的三元组信息如下:
<洗衣机维修-同义-洗衣机>、<洗衣机维修-上位-维修>、<洗衣机-上位-家电>、<家电-同义-家庭用品>;
房屋维修服务类目体系下包括的三元组信息如下:
<马桶修理-同义-马桶>、<马桶修理-上位-厨卫维修>、<马桶修理-上位-修理>、<马桶-上位-厨卫用具>、<厨卫维修-上位-厨卫用具>、<厨卫维修-同义-维修>、<厨卫维修-同义-修理>、<厨卫用具-上位-家庭用品>、<维修-同义-修理>、<维修-同义-清洗>、<修理-同义-清洗>。
政务服务类型下包括的服务类目体系有交管服务和户政服务;其中,交管服务类目体系下包括的三元组信息如下:
<交通违章-同义-交通违章查询>、<交通违章查询-上位-交通违章>、<交通违章查询-上位-查询>、<交通违章-上位-交通>、<交通违章-同义-违章>;
户政服务类目体系下包括的三元组信息如下:
<身份证-同义-身份证挂失>、<身份证-同义-查询>、<身份证挂失-上位-身份证>、<身份证挂失-上位-挂失>。
则基于上述三元组信息,生成的服务知识图谱如图5所示。
本申请实施例在构建服务知识图谱之后,构建的服务知识图谱可以应用于搜索场景;一种可选的服务知识图谱的应用场景示意图如图6所示,包括用户60、终端61和服务器62;其中,终端61上安装有客户端;
用户60通过终端61上安装的客户端触发搜索指令,客户端获取搜索指令中包含的搜索服务文本信息;并将搜索服务文本信息发送给服务器62,服务器62根据构建的服务知识图谱,从服务知识图谱中确定出搜索服务文本信息、以及与搜索服务文本信息有关联关系的至少一个服务文本信息;并将搜索服务文本信息、以及与搜索服务文本信息有关联关系的至少一个服务文本信息作为待推荐服务文本信息;将确定出的待推荐服务文本信息对应的页面展示信息返回给客户端,客户端在显示界面中向目标对象展示待推荐服务文本信息对应的页面展示信息。
如图7所示,为本申请实施例提供的一种基于服务知识图谱的搜索方法流程示意图,该方法可以包括以下步骤:
步骤S701、客户端响应目标对象触发的搜索指令,获取搜索指令中包含的搜索服务文本信息;
步骤S702、客户端将搜索服务文本信息发送给服务器;
步骤S703、服务器根据构建的服务知识图谱,从服务知识图谱中确定出搜索服务文本信息、以及与搜索服务文本信息有关联关系的至少一个服务文本信息;
步骤S704、服务器将搜索服务文本信息、以及与搜索服务文本信息有关联关系的至少一个服务文本信息作为待推荐服务文本信息;
步骤S705、服务器将确定出的待推荐服务文本信息对应的页面参数返回给客户端;
步骤S706、客户端将待推荐服务文本信息对应的页面展示信息推荐给目标对象。
基于同一发明构思,本申请实施例中还提供了一种标题文本处理装置,由于该装置解决问题的原理与上述标题文本处理方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
如图8所示,为本申请实施例提供的一种服务知识图谱构建装置的结构示意图,包括:
获取单元801,用于针对搜索服务场景,获取各个目标服务文本信息;
确定单元802,用于分别根据所述各个目标服务文本信息的第一文本特征,确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息;
处理单元803,用于根据所述各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱。
可选的,所述处理单元803具体用于:
针对所述各个目标服务文本信息分别执行以下操作:
根据所述各个服务文本信息中的一个目标服务文本信息与关联的至少一个衍生服务文本信息,分别生成包含目标服务文本信息、关联类型、衍生服务文本信息的三元组信息;其中,所述三元组信息的个数与所述一个目标服务文本信息关联的衍生服务文本信息的个数相同,所述关联类型为所述三元组信息包含的所述目标服务文本信息与所述衍生服务文本信息之间关联关系的类型。
可选的,所述确定单元802还用于:
分别根据所述各个目标服务文本信息的第二文本特征,确定所述各个目标服务文本信息各自所属的服务类型;以及分别根据获得的各个衍生服务文本信息的第三文本特征,确定所述各个衍生服务文本信息各自所属的服务类型;
所述处理单元803还用于:
在所述构建相应的服务知识图谱之后,响应展示所述服务知识图谱的指令,根据生成的各个三元组信息中包含的目标服务文本信息、衍生服务文本信息生成分别生成相应的节点,并基于所述各个目标服务文本信息各自对应的服务类型、以及所述各个衍生服务文本信息各自对应的服务类型,对生成的相应的节点进行分类展示;以及,根据生成的所述各个三元组信息中包含的关联类型,生成各个节点之间的边;根据生成的节点以及节点之间的边,展示构建的所述服务知识图谱。
可选的,所述衍生服务文本信息包括与所述目标服务文本信息为同义关联关系的同义文本信息;
所述确定单元802还用于:
在所述确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息之前,分别确定所述各个目标服务文本信息各自对应的文本内容信息;将所述各个服务文本信息各自对应的文本内容信息的信息内容,分别进行融合处理,得到相应目标服务文本信息的第一文本特征;以及,确定预设的候选文本信息集合中各个候选文本信息各自对应文本内容信息;将所述各个候选文本信息各自对应的文本内容信息的信息内容,分别进行融合处理,得到相应候选文本信息的第三文本特征;其中,所述文本内容信息包含编辑距离、语义距离、共现信息、属性信息中的任意一种或组合;
所述确定单元802具体用于:
针对各个目标服务文本信息分别执行以下操作:基于已训练的文本相关性模型,根据所述各个目标服务文本信息中的一个目标服务文本信息的第一文本特征,以及所述预设的候选文本信息集合中各个候选文本信息的第三文本特征,确定所述一个目标服务文本信息与所述预设的候选文本信息集合中各个候选文本信息之间的相似度;根据确定出的各个相似度,从所述预设的候选文本信息集合中筛选出与所述一个目标服务文本信息为同义关联关系的至少一个同义文本信息。
可选的,所述衍生服务文本信息包括所述目标服务文本信息的上位文本信息;
所述确定单元802具体用于:
根据各个目标服务文本信息的第一文本特征以及预设的匹配规则,从预设的候选文本信息集合中筛选出各个目标服务文本信息各自关联的至少一个上位文本信息。
可选的,所述获取单元801具体用于:
获取多个对象在搜索客户端中历史输入的各个服务文本信息,将获取到所述各个服务文本信息作为针对所述搜索服务场景的目标服务文本信息;或
从至少一个数据库中获取各个服务文本信息,作为针对所述搜索服务场景的目标服务文本信息。
可选的,所述处理单元803还用于:
响应目标对象触发的搜索指令,获取所述搜索指令中包含的搜索服务文本信息;根据构建的所述服务知识图谱,从所述服务知识图谱中确定出所述搜索服务文本信息、以及与所述搜索服务文本信息有关联关系的至少一个服务文本信息;并将所述搜索服务文本信息、以及与所述搜索服务文本信息有关联关系的至少一个服务文本信息作为待推荐服务文本信息;将确定出的所述待推荐服务文本信息对应的页面展示信息推荐给所述目标对象。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
所属技术领域的技术人员能够理解,本申请的每个方面可以实现为系统、方法或程序产品。因此,本申请的每个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,本申请实施例还提供一种电子设备,参阅图9所示,电子设备900可以至少包括至少一个处理器901、以及至少一个存储器902。其中,存储器902存储有程序代码,当程序代码被处理器901执行时,使得处理器901执行本说明书上述描述的根据本申请各种示例性实施方式的服务知识图谱构建方法中的步骤,例如,处理器901可以执行如图2或如图7所示的步骤。
在一些可能的实施方式中,本申请实施例还提供一种计算装置,可以至少包括至少一个处理单元、以及至少一个存储单元。其中,存储单元存储有程序代码,当程序代码被处理单元执行时,使得处理单元执行本说明书上述描述的根据本申请各种示例性实施方式的服务知识图谱构建方法中的步骤,例如,处理器901可以执行如图2或如图7中所示的步骤。
下面参照图10来描述根据本申请的这种实施方式的计算装置1000。图10的计算装置1000仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图10,计算装置1000以通用计算装置的形式表现。计算装置1000的组件可以包括但不限于:上述至少一个处理单元1001、上述至少一个存储单元1002、连接不同系统组件(包括存储单元1002和处理单元1001)的总线1003。
总线1003表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元1002可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1021或高速缓存存储器1022,还可以进一步包括只读存储器(ROM)1023。
存储单元1002还可以包括具有一组(至少一个)程序模块1024的程序/实用工具1025,这样的程序模块1024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置1000也可以与一个或多个外部设备1004(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算装置1000交互的设备通信,或与使得该计算装置1000能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1005进行。并且,计算装置1000还可以通过网络适配器1006与一个或者多个网络(例如局域网(LAN),广域网(WAN)或公共网络,例如因特网)通信。如图所示,网络适配器1006通过总线1003与用于计算装置1000的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置1000使用其它硬件或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本申请提供的服务知识图谱构建方法的每个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的服务知识图谱构建方法中的步骤,例如,计算机设备可以执行如图2或如图7中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种服务知识图谱构建方法,其特征在于,所述方法包括:
针对搜索服务场景,获取各个目标服务文本信息;
分别根据所述各个目标服务文本信息的第一文本特征,确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息;
根据所述各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱。
2.如权利要求1所述的方法,其特征在于,所述根据所述各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱,包括:
针对所述各个目标服务文本信息分别执行以下操作:
根据所述各个服务文本信息中的一个目标服务文本信息与关联的至少一个衍生服务文本信息,分别生成包含目标服务文本信息、关联类型、衍生服务文本信息的三元组信息;其中,所述三元组信息的个数与所述一个目标服务文本信息关联的衍生服务文本信息的个数相同,所述关联类型为所述三元组信息包含的所述目标服务文本信息与所述衍生服务文本信息之间关联关系的类型。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
分别根据所述各个目标服务文本信息的第二文本特征,确定所述各个目标服务文本信息各自所属的服务类型;以及分别根据获得的各个衍生服务文本信息的第三文本特征,确定所述各个衍生服务文本信息各自所属的服务类型;
在所述构建相应的服务知识图谱之后,还包括:
响应展示所述服务知识图谱的指令,根据生成的各个三元组信息中包含的目标服务文本信息、衍生服务文本信息生成分别生成相应的节点,并基于所述各个目标服务文本信息各自对应的服务类型、以及所述各个衍生服务文本信息各自对应的服务类型,对生成的相应的节点进行分类展示;以及
根据生成的所述各个三元组信息中包含的关联类型,生成各个节点之间的边;
根据生成的节点以及节点之间的边,展示构建的所述服务知识图谱。
4.如权利要求1所述的方法,其特征在于,所述衍生服务文本信息包括与所述目标服务文本信息为同义关联关系的同义文本信息;
在所述确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息之前,还包括:
分别确定所述各个目标服务文本信息各自对应的文本内容信息;将所述各个服务文本信息各自对应的文本内容信息的信息内容,分别进行融合处理,得到相应目标服务文本信息的第一文本特征;以及
确定预设的候选文本信息集合中各个候选文本信息各自对应文本内容信息;将所述各个候选文本信息各自对应的文本内容信息的信息内容,分别进行融合处理,得到相应候选文本信息的第三文本特征;其中,所述文本内容信息包含编辑距离、语义距离、共现信息、属性信息中的任意一种或组合;
所述分别根据所述各个目标服务文本信息的第一文本特征,确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息,包括:
针对各个目标服务文本信息分别执行以下操作:基于已训练的文本相关性模型,根据所述各个目标服务文本信息中的一个目标服务文本信息的第一文本特征,以及所述预设的候选文本信息集合中各个候选文本信息的第三文本特征,确定所述一个目标服务文本信息与所述预设的候选文本信息集合中各个候选文本信息之间的相似度;根据确定出的各个相似度,从所述预设的候选文本信息集合中筛选出与所述一个目标服务文本信息为同义关联关系的至少一个同义文本信息。
5.如权利要求1所述的方法,其特征在于,所述衍生服务文本信息包括所述目标服务文本信息的上位文本信息;
所述分别根据所述各个目标服务文本信息的第一文本特征,确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息,包括:
根据各个目标服务文本信息的第一文本特征以及预设的匹配规则,从预设的候选文本信息集合中筛选出各个目标服务文本信息各自关联的至少一个上位文本信息。
6.如权利要求1~5任一项所述的方法,其特征在于,针对搜索服务场景,获取各个目标服务文本信息,包括:
获取多个对象在搜索客户端中历史输入的各个服务文本信息,将获取到所述各个服务文本信息作为针对所述搜索服务场景的目标服务文本信息;或
从至少一个数据库中获取各个服务文本信息,作为针对所述搜索服务场景的目标服务文本信息。
7.如权利要求1~5任一项所述的方法,其特征在于,该方法还包括:
响应目标对象触发的搜索指令,获取所述搜索指令中包含的搜索服务文本信息;
根据构建的所述服务知识图谱,从所述服务知识图谱中确定出所述搜索服务文本信息、以及与所述搜索服务文本信息有关联关系的至少一个服务文本信息;并将所述搜索服务文本信息、以及与所述搜索服务文本信息有关联关系的至少一个服务文本信息作为待推荐服务文本信息;
将确定出的所述待推荐服务文本信息对应的页面展示信息推荐给所述目标对象。
8.一种服务知识图谱构建装置,其特征在于,包括:
获取单元,用于针对搜索服务场景,获取各个目标服务文本信息;
确定单元,用于分别根据所述各个目标服务文本信息的第一文本特征,确定所述各个目标服务文本信息各自关联的至少一个衍生服务文本信息;
处理单元,用于根据所述各个目标服务文本信息与各自关联的至少一个衍生服务文本信息之间的关联关系,构建相应的服务知识图谱。
9.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行权利要求1~7中任一所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,其包括程序代码,当所述程序代码在电子设备上运行时,所述程序代码用于使所述电子设备执行权利要求1~7中任一所述方法的步骤。
CN202110047756.1A 2021-01-14 2021-01-14 一种服务知识图谱构建方法、装置、电子设备及存储介质 Pending CN113392212A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110047756.1A CN113392212A (zh) 2021-01-14 2021-01-14 一种服务知识图谱构建方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110047756.1A CN113392212A (zh) 2021-01-14 2021-01-14 一种服务知识图谱构建方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113392212A true CN113392212A (zh) 2021-09-14

Family

ID=77616709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110047756.1A Pending CN113392212A (zh) 2021-01-14 2021-01-14 一种服务知识图谱构建方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113392212A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114239496A (zh) * 2021-11-12 2022-03-25 北京卓思天成数据咨询股份有限公司 服务状态生成方法、装置、设备及计算机可读存储介质
CN117151429A (zh) * 2023-10-27 2023-12-01 中电科大数据研究院有限公司 一种基于知识图谱的政务服务流程编排方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114239496A (zh) * 2021-11-12 2022-03-25 北京卓思天成数据咨询股份有限公司 服务状态生成方法、装置、设备及计算机可读存储介质
CN114239496B (zh) * 2021-11-12 2023-10-24 北京卓思天成数据咨询股份有限公司 服务状态生成方法、装置、设备及计算机可读存储介质
CN117151429A (zh) * 2023-10-27 2023-12-01 中电科大数据研究院有限公司 一种基于知识图谱的政务服务流程编排方法及装置
CN117151429B (zh) * 2023-10-27 2024-01-26 中电科大数据研究院有限公司 一种基于知识图谱的政务服务流程编排方法及装置

Similar Documents

Publication Publication Date Title
CN107220352B (zh) 基于人工智能构建评论图谱的方法和装置
US10725836B2 (en) Intent-based organisation of APIs
CN106960030B (zh) 基于人工智能的推送信息方法及装置
CN112749266B (zh) 一种工业问答方法、装置、系统、设备及存储介质
CN104978332B (zh) 用户生成内容标签数据生成方法、装置及相关方法和装置
CN103577549A (zh) 一种基于微博标签的人群画像系统和方法
CN104008203A (zh) 一种融入本体情境的用户兴趣挖掘方法
US10262041B2 (en) Scoring mechanism for discovery of extremist content
CN102722709A (zh) 一种垃圾图片识别方法和装置
CN111522886B (zh) 一种信息推荐方法、终端及存储介质
CN113392212A (zh) 一种服务知识图谱构建方法、装置、电子设备及存储介质
CN111680498B (zh) 实体消歧方法、装置、存储介质及计算机设备
CN112084413A (zh) 一种信息推荐的方法、装置及存储介质
CN112559717A (zh) 搜索匹配方法、装置、电子设备以及存储介质
CN104636386A (zh) 信息监控方法及装置
CN107402999A (zh) 景点数据库建立方法及装置
CN110765276A (zh) 知识图谱中的实体对齐方法及装置
KR20220068462A (ko) 지식 그래프 생성 방법 및 장치
CN105095385B (zh) 一种检索结果的输出方法及装置
CN114491232B (zh) 信息查询方法、装置、电子设备和存储介质
CN105608183A (zh) 一种提供聚合类型回答的方法和装置
CN117272056A (zh) 对象特征构建方法、装置和计算机可读存储介质
CN114385776A (zh) 信息定位方法、存储介质及装置
ElGindy et al. Enriching user profiles using geo-social place semantics in geo-folksonomies
CN103106239A (zh) 一种图像中对象的识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40052253

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230407

Address after: 510310 No. 1, brand area, No. 397, Xingang Middle Road, Haizhu District, Guangzhou City, Guangdong Province

Applicant after: GUANGZHOU TENCENT TECHNOLOGY Co.,Ltd.

Applicant after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Address before: 35th floor, Tencent building, Keji Zhongyi Road, high tech Zone, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.