CN110489496A - 一种数据处理方法、装置、电子设备及存储介质 - Google Patents

一种数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110489496A
CN110489496A CN201910662730.0A CN201910662730A CN110489496A CN 110489496 A CN110489496 A CN 110489496A CN 201910662730 A CN201910662730 A CN 201910662730A CN 110489496 A CN110489496 A CN 110489496A
Authority
CN
China
Prior art keywords
entity
relationship
confirmation
relative
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910662730.0A
Other languages
English (en)
Inventor
高波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910662730.0A priority Critical patent/CN110489496A/zh
Publication of CN110489496A publication Critical patent/CN110489496A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种数据处理方法、装置、电子设备及存储介质,该方法包括:获取实体确认请求,该实体确认请求携带有待上线应用的实体关系数据,基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体和目标关系词;实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词;基于目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复。由于本申请实施例可以根据目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复,而不是仅仅根据实体确定实体确认回复,如此可以提高实体确认回复的正确率。

Description

一种数据处理方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
当今,各个领域的数据正处于飞速增长中,由此导致数据处理技术领域的发展越来越迅速。一般的,数据处理的过程为:设备根据接收到的数据,对该数据中的实体进行识别,并对识别结果进行处理,以确定该数据对应的输出。这种数据处理的方式可以被应用在语言识别,人机交互等各种领域。
上述的描述中,实体是指具有具体而真实的形态或者结构的事物,能够为人们所感知与亲手接触。从数据处理的角度看,现实世界中的客观事物称为实体,它是现实世界中任何可区分,可识别的事物。然而,实体只是数据中的一部分,设备仅仅根据实体确定的输出与该数据实际对应的输出可能相差很大,从而导致设备输出的正确率降低。
本申请实施例提供一种数据处理方法,用于提高设备根据输入数据确定的实体确认回复的正确率。
发明内容
本申请实施例提供了一种数据处理方法、装置、电子设备和存储介质,可以提高设备根据输入数据确定的实体确认回复的正确率。
一方面,本申请实施例提供了一种数据处理方法,该方法包括:
获取实体确认请求,该实体确认请求携带有待上线应用的实体关系数据;
基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体和目标关系词,实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词;
基于目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复。
另一方面提供了一种数据处理装置,该装置包括:
获取模块,用于获取实体确认请求,该实体确认请求携带有待上线应用的实体关系数据;
识别模块,用于基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体和目标关系词;实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词;
确定模块,用于基于目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复。
另一方面提供了一种电子设备,该电子设备包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或该指令集由处理器加载并执行以实现如上述的数据处理方法。
另一方面提供了一种计算机可读存储介质,存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或该指令集由处理器加载并执行以实现如上述的数据处理方法。
本申请实施例提供的数据处理方法、装置、电子设备及存储介质,具有如下技术效果:
获取实体确认请求,该实体确认请求携带有待上线应用的实体关系数据,基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体和目标关系词;实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词;基于目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复。由于本申请实施例可以根据目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复,而不是仅仅根据实体确定数据的实体确认回复,如此可以提高实体确认回复的正确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本申请实施例提供的一种应用环境的示意图;
图2是本申请实施例提供的一种数据处理方法的流程示意图;
图3是本申请实施例提供的一种参考实体集合的知识图谱结构示意图;
图4是本申请实施例提供的一种实体集合的知识图谱结构示意图;
图5是本申请实施例提供的一种数据处理方法的流程示意图;
图6是本申请实施例提供的一种数据处理装置的结构示意图;
图7是本申请实施例提供的一种数据处理方法的服务器的硬件结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参阅图1,图1是本申请实施例提供的一种应用环境的示意图,包括终端设备101和服务器102,其中,服务器102是为终端设备101上一些应用提供数据处理服务的。
一种可选的实施方式中,终端设备101上的应用被用户启动后,接收用户输入的实体关系数据,并将实体确认请求发送至服务器102,该实体确认请求携带有待上线应用的实体关系数据,对应的,服务器102根据接收到的实体确认请求读取实体关系数据,并基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体和目标关系词,该实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词。服务器102基于目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复,并将该实体确认回复发送至终端设备101。
一种可选的实施方式中,终端设备可以是手机,台式电脑,平板电脑,笔记本电脑,可穿戴设备等等。
可选的,终端设备101和服务器102之间的实体关系数据可以通过有线链路传输,也可以通过无线链路传输。通信链路类型的选择可以根据实际的应用情况和应用环境而定。服务器102可以为多台终端设备提供数据处理服务,具体的,该服务器102连接的终端设备101的数量可以视实际情况而定。
以下介绍本申请一种数据处理方法的具体实施例,图2是本申请实施例提供的一种数据处理方法的流程示意图,本说明书提供了如实施例或流程图的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示,该方法可以包括:
S201:获取实体确认请求,该实体确认请求携带有待上线应用的实体关系数据。
本申请实施例中,待上线应用是指终端设备上的应用,该待上线应用可以包括多种类型的应用,比如,游戏类应用,音乐类应用,社交类应用、新闻类应用,生活服务类应用等。
一种可选的实施方式中,待上线应用可以是还没有上线的应用,也就是还不可以被公众下载使用,只能被开发该应用的公司的测试人员测试使用的应用。基于这种情况,服务器接收测试人员输入的实体确认请求,该实体确认请求携带有实体关系数据。该服务器可以是为该待上线应用提供数据处理服务的服务器。
另一种可选的实施方式中,待上线应用上线后,也就是该待上线应用已经被投入市场,可以被在终端设备上下载该待上线应用的用户使用。用户启动终端设备上的该应用,可以在应用的界面上触发实体关系数据的接收模块,如此,终端设备可以接收用户输入的实体关系数据,并将该实体关系数据携带于实体确认请求中,并将该实体确认请求发送至服务器。可选的,该接收模块可以是文字接收模块,用以接收用户输入的文字数据。可选的,该接收模块可以是语音接收模块,用以接收输入的语音数据。本申请实施例中,上述的文字数据和语音数据都被视为实体关系数据。
S203:基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体和目标关系词,该实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词。
一种可选的获取待上线应用的实体集合的实施方式中,服务器获取该待上线应用中的所有实体,并根据该所有实体以及实体之间的预设关系确定有关系的两个实体组成的关系对和该关系对对应的关系词,随后将所有关系对和关系对对应的关系词组成一个集合,即待上线应用的实体集合。
可选的,一个关系对对应的关系词可以包括一个关系词,比如,实体1和实体2之间的关系为从属关系,则对应的关系词可以是“从属”。可选的,一个关系对对应的关系词可以包括两个关系词,比如,实体1和实体2之间的关系为从属关系,则对应的关系词可以是“包括”和“属于”,其中,“包括”可以表示实体1至实体2的关系,即实体1包括实体2。“属于”可以表示实体2至实体1的关系,即实体2属于实体1。
本申请实施例中,相较于用一个关系词描述两个关系词之间关系,用两个关系词描述同样两个实体之间关系可以更清晰地表达两个实体的关系。
举个例子,假设该待上线应用是一个音乐类应用,音乐类应用的实体可以包括:歌手,专辑,歌曲等等。用来描述歌手和专辑关系的关系词可以是“专辑包括”,关系词“专辑包括”表示:某歌手的专辑包括专辑1,专辑2和专辑3。用来描述歌手和专辑关系的关系词可以是“属于”,关系词“属于”表示:专辑1,专辑2,专辑3属于某歌手。
同理,用来描述专辑和歌曲关系的关系词可以是“歌曲包括”,关系词“歌曲包括”表示:专辑1的歌曲包括歌曲1,歌曲2和歌曲3。用来描述专辑和歌曲关系的关系词可以是“属于”,关系词“属于”表示:歌曲1,歌曲2和歌曲3属于专辑1。
本申请实施例中,服务器可以基于该音乐类应用中的不同的歌手,专辑和歌曲按照上文描述的方法确定一个个实体对以及实体对对应的关系词,由此确定该音乐类应用的实体集合。
另一种可选的获取待上线应用的实体集合的实施方式中,服务器确定与该待上线应用的类型对应的已上线应用,确定已上线应用的参考实体集合。其中,参考实体集合包括多个参考实体对和用于描述每个参考实体对中两个参考实体关系的参考关系词,服务器基于待上线应用的实体和关系词更新参考实体集合,得到待上线应用的实体集合。
下面通过一个例子说明基于与待上线应用同类型的已上线应用的参考实体集合获取待上线应用的实体集合的实施方法。可选的,已上线应用可以是已经被投入市场的应用,还可以是已经被开发出来但未被投入市场的应用。
假设该待上线应用是一个枪战类游戏应用,在确定该枪战类游戏应用的实体集合之前,服务器确定同属枪战类游戏应用的一个或者多个已上线应用,获取已上线应用中的参考实体,比如,已上线应用中的参考实体包括:枪械,步枪,手枪,狙击枪,P29,P1911,M14,AKM,SCAR,M24,AWM,弹匣容量15,子弹直径556,射程200米,射速X米每秒,购买界面……,同时,服务器可以获取参考实体之间的预设关系,比如,枪械包括手枪,步枪和狙击枪;手枪包括P29和P1911;步枪包括M14,AKM和SCAR;狙击枪包括M24和AWM;M14的特征包括弹匣容量15,购买界面,子弹直径556,射程200米和射速X……
本申请实施例中,服务器基于上述的参考实体和参考实体之间的预设关系确定待上线应用的参考实体对和用来描述参考实体对的参考关系词。比如,“枪械—手枪,种类包括、属于”;“步枪—M14,种类包括、属于”;“M14—射程200米,属性包括、属性”……其中,“枪械—手枪,种类包括、属于”标识枪械和手枪是一个参考实体对,“种类包括”和“属于”是描述参考实体对的参考关系词。“种类包括”表示枪械的种类包括手枪,“属于”表示手枪属于枪械。
可选的,服务器将所有参考实体对和参考实体对对应的参考关系词组成参考参考实体集合。本申请实施例中,该参考实体集合的集合形式可以用实体表描述,表1是一种描述参考实体集合的实体表,实体表的同一行表示一个参考实体对中的两个参考实体以及该参考实体对对应的参考关系词,具体的,第三行中参考实体1为枪械,参考实体2为步枪,参考关系词1种类包括是枪械至步枪的关系,参考关系词2属于是步枪至枪械的关系。
表1:参考实体集合的关系表
如此,服务器可以通过实体表描述已上线应用的参考实体集合,将该实体表作为待上线应用的实体集合的更新参考。此外,服务器还可以将该实体表保存至特定的存储区域,为以后同一个类型的应用的实体集合的更新和开发打下基础。
本申请实施例中,该参考实体集合的集合形式可以通过知识图谱结构表示。图3是本申请实施例提供的一种参考实体集合的知识图谱结构示意图,该示意图中包括了已上线应用的参考实体组成的参考实体对和参考实体对对应的参考关系词。如图3所示,每个圆表示一个参考实体,比如,最上面的圆表示枪械这个实体。中间存在箭头的两个圆表示一个参考实体对,比如,枪械—步枪是一个参考实体对。其中,不同的箭头表示不同的参考关系词,第一箭头301表示的参考关系词包括:沿着第一箭头301的方向表示参考关系词“种类包括”,逆着第一箭头301的方向表示参考关系词“属于”。第二箭头302表示的参考关系词包括:沿着第二箭头302的方向表示参考关系词“属性包括”,逆着第二箭头302的方向表示参考关系词“属性”。如此,服务器可以通过知识图谱描述已上线应用的参考实体集合,进一步的,相较于上文的实体表,知识图谱的可视性更强,能更具体清晰地表达参考实体对以及参考实体对对应的参考关系词。
本申请实施例中,假设待上线应用的实体中没有狙击枪这类型的枪,增加了冲锋枪,冲锋枪包括UZI和MP5,MI4的特征包括射程300米。服务器根据待上线应用中的实体和关系词确定要更改的实体对和实体对对应的关系词,基于上述的内容,确定要删除的参考实体对和参考实体对对应的参考关系词为:“枪械—狙击枪,种类包括、属于”,“狙击枪—M24,种类包括、属于”,“狙击枪—AWM,种类包括、属于”。要增加的实体对和实体对对应的关系词为:“枪械—冲锋枪,种类包括、属于”,“冲锋枪—UZI,种类包括、属于”,“冲锋枪—MP5,种类包括、属于”。将参考实体对和参考实体对对应的参考关系词“MI4—射程200米,属性包括、属性”更改为“MI4—射程300米,属性包括、属性”,以更新参考实体集合,得到待上线应用的实体集合。
可选的,更新得到的待上线应用的实体集合可以用实体表描述,表2是一种描述实体集合的实体表,实体表的同一行表示一个实体对中的两个实体以及该实体对对应的关系词。
表2:实体集合的关系表
本申请实施例中,该实体集合的集合形式可以通过知识图谱结构表示。图4是本申请实施例提供的一种实体集合的知识图谱结构示意图,该示意图中包括了待上线应用的实体组成的实体对和实体对对应的关系词。其中,每个圆表示一个实体,比如,最上面的圆表示枪械。中间存在箭头的两个圆表示一个实体对,比如,枪械—步枪是一个实体对。其中,不同的箭头表示不同的关系词,第一箭头401表示的关系词包括:沿着第三箭头401的方向表示关系词“种类包括”,逆着第三箭头401的方向表示关系词“属于”。第四箭头402表示的关系词包括:沿着第四箭头402的方向表示关系词“属性包括”,逆着第四箭头402的方向表示关系词“属性”。
如此,服务器可以上述两种可选的实施方式获取待上线应用的实体集合,为后续对接收的实体关系数据的识别做准备。
本申请实施例中,待上线应用的实体集合还包括多个实体对中实体的实体名称文件,实体名称文件包括实体的不同名称。举个例子,M14的实体名称文件中包括的多个名称可以是M14,m14,M146,m146,速度最快的步枪等等,步枪的实体明后才能文件包括步枪和来复枪。如此,通过增加实体的内容使得服务器后续在基于实体集合处理实体关系数据的时候,可以更快的定位到目标实体,进行后续的数据处理。
一种可选的实施方式中,服务器可以基于参考实体对中参考实体的参考实体名称文件确定多个实体对中实体的实体名称文件,其中,参考实体名称文件包括参考实体的不同名称。比如,M14的参考实体名称文件中包括的多个名称可以是M14,m14,M146,m146,更新后的实体名称文件中新增了速度最快的步枪的名称。
另一种可选的实施例中,服务器可以根据接收的同一个实体的不同名称确定该实体的实体名称文件。
本申请实施例中,待上线应用的实体集合还包括关系词的关系名称文件,关系名称文件包括同一个意思的关系词的不同表达形式。举个例子,关系词“种类包括”的关系名称文件包括“包括”,“中包括”,“中的”等。关系词“属于”的关系名称文件包括“是……的一种”,“包含在”“包含在……里”等。如此,通过增加关系词的内容使得服务器后续在基于实体集合处理实体关系数据的时候,可以更快的定位到目标关系词,进行后续的数据处理。
一种可选的实施方式中,服务器可以基于已上线应用的参考实体集合中的参考关系词的参考关系名称文件确定待上线应用的实体集合中关系词的关系名称文件,其中,参考关系名称文件包括参考关系词的不同名称。另一种可选的实施例中,服务器可以根据接收的同一个关系词的不同名称确定该关系词的关系名称文件。
本申请实施例中,一种可选的实施方式中,目标实体和目标关系词可以是该实体关系数据中的实体或者关系词。举个例子,实体关系数据为“步枪种类包括M14吗”,由于实体关系数据中的实体为“步枪”和“M14”,关系词为“种类包括”,和待上线应用的实体集合中的实体名称一致。服务器基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到的目标实体为“步枪”和“M14”,得到的目标关系词为“种类包括”。
另一种可选的实施方式中,目标实体与该实体关系数据中的实体对应,目标关系词与该实体关系数据中的关系词对应。举个例子,实体关系数据为“M14是来复枪的一种吗”,服务器基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到的目标实体为“步枪”和“M14”,目标关系词为“属于”。其中,目标实体“步枪”与实体关系数据中的“来复枪”对应,目标关系词“属于”与实体关系数据中的“是……的一种”对应。这是因为“来复枪”是实体步枪的实体名称文件中包括的,“是……的一种”是关系词的关系名称文件中包括的,由此,服务器可以通过实体集合中实体的实体名称文件、关系词的关系名称文件和实体关系识别模型从实体关系数据中确定除目标实体和目标关系词。
本申请实施例中,一种获取实体关系识别模型的方法为,获取训练实体关系数据,对训练实体关系数据进行实体和关系词的标注,基于训练实体关系数据和待上线应用的实体集合对预设深度学习模型进行实体和关系的识别训练,得到实体关系识别模型。其中,该预设深度学习模型可以为卷积神经网络模型。
S205:基于目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复。
本申请实施例中,实体对和关系词是指待上线应用的实体集合中的实体对和关系词。
本申请实施例中,服务器可以从实体对中确定与目标实体关联的实体对,并从关系词中确定与目标关系词关联的关系词,根据关联的实体对和关联的关系词确定实体确认回复。本申请实施例中,实体确认回复的形式有很多种,本申请将详细介绍可选的3种确定实体确认回复的实施方式。
一种可选的实施方式中,实体确认回复可以包括第一显示指令和关联的实体对中与所述目标实体不相同的实体,该第一显示指令用于指示接收实体确认回复的终端设备显示与所述目标实体不相同的实体。
举个例子,假设实体关系数据为“步枪中的射程300米的枪”,服务器基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别后,得到的目标实体为“步枪”和“射程300米”,得到的目标关系词“中的”。可选的,服务器基于实体集合判断“步枪”和“射程300米”并不是一对实体对,因此服务器从实体对中确定与目标实体关联的实体对为“步枪—M14”,“步枪—AKM”,“步枪—SCAR”和“M14—射程300米”,服务器从关系词中确定的与目标关系词“中的”关联的关系词为“种类包括”和/或“属性包括”。
针对该例子,服务器根据关联的实体对和关联的关系词确定实体确认回复的具体步骤为,关系词“种类包括”为实体对“步枪—M14”,“步枪—AKM”,“步枪—SCAR”对应的关系词,关系词“属性包括”为实体对“M14—射程300米”对应的关系词,由此,可以将不同关系词对应的实体对中存在的交集实体作为关联的实体对中与目标实体不相同的实体,也就是“步枪—M14”和“M14—射程300米”的交集实体M14。服务器确定M14后,向终端设备发送实体确认回复,该实体确认回复包括第一显示指令和M14。终端设备接收到该实体确认回复,解析出第一显示指令和M14,并根据第一显示指令将该M14显示于待上线应用的回复界面上。可选的,显示的M14可以是文字,还可以是M14对应的图片加文字。
另一种可选的实施方式中,实体确认回复还可以包括第二显示指令和关联的实体对中两个实体以及该两个实体对应的关系词组成的语句,第二显示指令用于指示接收实体确认回复的终端设备显示该语句。
基于上文中的实体关系数据“步枪种类包括M14吗”阐述服务器基于该实体确认请求确定的实体确认回复。服务器基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别后,得到的目标实体为“步枪”和“M14”,得到的目标关系词为“种类包括”。可选的,服务器基于实体集合判断“步枪”和“M14”是一对实体对,因此服务器从实体对中确定与目标实体关联的实体对为“步枪—M14”。服务器从关系词中确定的与目标关系词“种类包括”关联的关系词为“种类包括”,且确定“种类包括”是实体对“步枪—M14”对应的关系词。如此,服务器可以确定关联的实体对中两个实体以及两个实体对应的关系词组成的语句,也就是“步枪的种类包括M14”。服务器将包含第二显示指令和该语句的实体确认回复发送给终端设备。对应的,终端设备接收到该实体确认回复,解析出第二显示指令和该语句,并根据第二显示指令将该语句显示于待上线应用的回复界面上。
另一种可选的确定实体确认请求对应的实体确认回复的实施方式中,待上线应用的实体集合还包括动词,动词作用于实体对中的实体,服务器基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体、目标关系词和目标动词。举个例子,假设实体关系数据为“打开M14的购买界面”,服务器基于基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到的目标实体为“M14”和“购买界面”,得到的目标关系词为“的”,得到的目标动词为“打开”。
本申请实施例中,服务器基于实体集合判断“M14”和“购买界面”是一对实体对,因此服务器从实体对中确定与目标实体关联的实体对为“M14—购买界面”,服务器从关系词中确定与目标关系词“的”关联的关系词为“种类包括”和“属性包括”,且确定“属性包括”是实体对“M14—购买界面”对应的关系词,则服务器可以确定与目标关系词关联的关系词为“属性包括”。
本申请实施例中,待上线应用的实体集合中可被动词作用的实体可以被服务器打上作用标识。
在该例子中,M14的购买界面是实体对中携带作用标识的实体。如此,服务器确定要作用的实体为购买界面后,可以确定实体确认回复,该实体确认回复包括启动指令和购买界面的标识,并将该实体确认回复发送至终端设备。对应的,终端设备接收到该实体确认回复,解析出启动指令和该购买界面的标识,根据该购买界面的标识确定该购买界面,并根据启动指令启动该购买界面,便于用户在该界面上购买M14。
本申请实施例中,一种更新参考实体集合得到实体集合的方式中,服务器可以将已上线应用的参考实体集合的知识图谱结构显示显示在一个显示屏幕上,服务器可以根据输入指令、删除指令和替换指令更新参考实体集合。其中,输入指令中包括要输入的实体和关系词,删除指令中包括要删除的实体和关系词,替换指令中包括要替换的实体和关系词。更新得到的实体集合可以立刻显示在该显示屏幕上。
本申请实施例中,实体的实体名称文件中还可以包括该实体在同一个等级实体中的优先级,该优先级可以是服务器基于参考实体集合中的实体的优先级确定的。该优先级还可以是服务器通过技术爬取网络关键词的手段获取的。比如,步枪中的“M14”的优先级为高,“SCAR”的优先级为中,“AKM”的优先级为低。如此,当实体关系数据涉及步枪优先级的时候,服务器可以基于实体名称文件中的优先级确定实体确认回复的实体。如此,可以增加本申请技术方案的灵活多样性。
图5是本申请实施例提供的一种数据处理方法的流程示意图,具体的如图5所示,该方法可以包括:
S501:服务器确定与待上线应用的类型对应的已上线应用。
S503:服务器确定已上线应用的参考实体集合,该参考实体集合包括多个参考实体对和用于描述每个参考实体对中两个参考实体关系的参考关系词。
S505:服务器基于待上线应用的实体和关系词更新参考实体集合,得到待上线应用的实体集合,该实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词。
S507:终端设备获取待上线应用的实体关系数据。
S509:服务器接收终端设备发送的实体确认请求,该实体确认请求携带有实体关系数据。
S511:服务器基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体和目标关系词。
S513:服务器从实体对中确定与目标实体关联的实体对。
S515:服务器从关系词中确定与目标关系词关联的关系词。
S517:服务器根据关联的实体对和关联的关系词确定实体确认回复。
S519:服务器将该实体确认回复发送至终端设备。
S521:终端设备根据实体确认回复确定在待上线应用的界面上显示的对象。
本申请实施例中,若实体确认回复包括第一显示指令和实体或者实体确认回复包括第二显示指令两个实体对应的关系词组成的语句,终端设备在待上线应用的界面上显示的对象为实体或者两个实体对应的关系词组成的语句。若实体确认回复为启动指令和实体标识,则终端设备基于启动指令在待上线应用的界面上显示是实体标识对应的实体的界面。
一种可选的实施方式中,在上述服务器确定实体确认请求对应的实体确认回复的实施方式进行的同时,还可以通过另一种可选的实施方式确定实体确认请求对应的实体确认回复。该种实施方式为:服务器根据实体集合中的实体对、实体对对应的关系词以及实体对中实体的实体名称文件生成预设实体关系数据,并确定该预设实体确认请求对应的实体确认回复。比如,服务器根据“狙击枪—M24,种类包括、属于”,狙击枪的实体名称文件包括的大狙24可以生成实体数据关系“狙击枪包括M24吗?”,“M24是狙击枪的一种吗?”,“狙击枪的种类包括M24吗?”,“狙击枪中有M24吗?”,“大狙24属于狙击枪吗?”……本申请实施例中年,服务器根据上述的预设实体确认请求确定的实体确认回复可以包括显示指令和“狙击枪包括M24”。若服务器接收到实体关系数据,与预设实体关系数据进行匹配,并根据匹配后的结果确定实体确认回复。本申请实施例中,通过这两种确定实体确认回复的实施方式,不仅可以保证实体关系识别模型还未训练到满足识别条件时的稳定工作,还可以通过上述两种方式确保实体确认回复的准确性。
本申请实施例中,服务器基于待上线应用中所有实体得到的实体集合的好处是:第一确保了待上线应用所有实体之间完整的逻辑关系,第二搭建的实体集合是比较完整的结构,可视性较强,便于后续实体集合的调整和更新。第三,相较于通过实体词确定的实体确认回复,通过实体集合确定的实体确认回复由于实体集合本身携带更多信息,可以更多的基于细节确定实体确认回复,保证实体确认回复的正确性。
本申请实施例还提供了一种数据处理装置,图6是本申请实施例提供的一种数据处理装置的结构示意图,如图6所示,该装置包括:
获取模块601用于获取实体确认请求,实体确认请求携带有待上线应用的实体关系数据;
识别模块602用于基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体和目标关系词;实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词;
确定模块603用于基于目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复。
在一种可选的实施方式中,该装置还包括:
确定模块603用于从实体对中确定与目标实体关联的实体对;从关系词中确定与目标关系词关联的关系词;根据关联的实体对和关联的关系词确定实体确认回复。
在一种可选的实施方式中,该装置还包括:
实体集合还包括动词,动词作用于实体对中的实体;
识别模块602用于基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体、目标关系词和目标动词;
确定模块603用于从实体对中确定与目标实体关联的实体对;从关系词中确定与目标关系词关联的关系词;根据目标动词、关联的实体对和关联的关系词确定关联的实体对中携带作用标识的实体;确定实体确认回复,实体确认回复包括启动指令和实体标识;其中,实体标识用于标识携带作用标识的实体,启动指令用于指示接收实体确认回复的终端设备启动基于实体标识确认的实体对应的界面。
在一种可选的实施方式中,该装置还包括:
识别模块602用于获取训练实体关系数据;对训练实体关系数据进行实体和关系词的标注;基于训练实体关系数据和待上线应用的实体集合对预设深度学习模型进行实体和关系的识别训练,得到实体关系识别模型。
在一种可选的实施方式中,该装置还包括:
获取模块601用于确定与待上线应用的类型对应的已上线应用;确定已上线应用的参考实体集合;参考实体集合包括多个参考实体对和用于描述每个参考实体对中两个参考实体关系的参考关系词;基于待上线应用的实体和关系词更新参考实体集合,得到待上线应用的实体集合。
在一种可选的实施方式中,该装置还包括:
获取模块601用于基于参考实体对中参考实体的参考实体名称文件确定多个实体对中实体的实体名称文件;参考实体名称文件包括参考实体的不同名称,实体名称文件包括实体的不同名称。
本申请实施例中的装置与方法实施例基于同样地申请构思。
本申请实施例所提供的方法实施例可以在计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图7是本申请实施例提供的一种数据处理方法的服务器的硬件结构框图。如图7所示,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)710(处理器710可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器730,一个或一个以上存储应用程序723或数据722的存储介质720(例如一个或一个以上海量存储设备)。其中,存储器730和存储介质720可以是短暂存储或持久存储。存储在存储介质720的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器710可以设置为与存储介质720通信,在服务器700上执行存储介质720中的一系列指令操作。服务器700还可以包括一个或一个以上电源760,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口740,和/或,一个或一个以上操作系统721,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
输入输出接口740可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器700的通信供应商提供的无线网络。在一个实例中,输入输出接口740包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,输入输出接口740可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图7所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器700还可包括比图7中所示更多或者更少的组件,或者具有与图7所示不同的配置。
本申请的实施例还提供了一种存储介质,所述存储介质可设置于服务器之中以保存用于实现方法实施例中一种数据处理方法相关的至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现上述数据处理方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
由上述本申请提供的数据处理方法、设备或存储介质的实施例可见,本申请中获取实体确认请求,实体确认请求携带有待上线应用的实体关系数据,基于待上线应用的实体集合和实体关系识别模型对实体关系数据进行实体和关系的识别,得到目标实体和目标关系词;实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词;基于目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复。由于本申请实施例可以根据目标实体、目标关系词、实体对和关系词确定实体确认请求对应的实体确认回复,而不是仅仅根据实体确定实体确认回复,如此可以提高实体确认回复的正确率。
需要说明的是:上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (11)

1.一种数据处理方法,其特征在于,所述方法包括:
获取实体确认请求,所述实体确认请求携带有待上线应用的实体关系数据;
基于所述待上线应用的实体集合和实体关系识别模型对所述实体关系数据进行实体和关系的识别,得到目标实体和目标关系词;所述实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词;
基于所述目标实体、所述目标关系词、所述实体对和所述关系词确定所述实体确认请求对应的实体确认回复。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标实体、所述目标关系词、所述实体对和所述关系词确定所述实体确认请求对应的实体确认回复,包括:
从所述实体对中确定与所述目标实体关联的实体对;
从所述关系词中确定与所述目标关系词关联的关系词;
根据所述关联的实体对和所述关联的关系词确定所述实体确认回复。
3.根据权利要求1-2所述的方法,其特征在于,所述实体确认回复包括:
第一显示指令和所述关联的实体对中与所述目标实体不相同的实体;所述第一显示指令用于指示接收所述实体确认回复的终端设备显示所述与所述目标实体不相同的实体;
或者;
第二显示指令和所述关联的实体对中两个实体以及所述两个实体对应的关系词组成的语句;所述第二显示指令用于指示接收所述实体确认回复的终端设备显示所述语句。
4.根据权利要求1所述的方法,其特征在于,所述实体集合还包括动词,所述动词作用于所述实体对中的实体;
所述基于所述待上线应用的实体集合和实体关系识别模型对所述实体关系数据进行实体和关系的识别,得到目标实体和目标关系词,包括:
基于所述待上线应用的实体集合和实体关系识别模型对所述实体关系数据进行实体和关系的识别,得到目标实体、目标关系词和目标动词;
所述基于所述目标实体、所述目标关系词、所述实体对和所述关系词确定所述实体确认请求对应的实体确认回复,包括:
从所述实体对中确定与所述目标实体关联的实体对;
从所述关系词中确定与所述目标关系词关联的关系词;
根据所述目标动词、所述关联的实体对和所述关联的关系词确定所述关联的实体对中携带作用标识的实体;
确定所述实体确认回复,所述实体确认回复包括启动指令和实体标识;其中,所述实体标识用于标识所述携带作用标识的实体,所述启动指令用于指示接收所述实体确认回复的终端设备启动基于所述实体标识确认的实体对应的界面。
5.根据权利要求1所述的方法,其特征在于,
获取训练实体关系数据;
对所述训练实体关系数据进行实体和关系词的标注;
基于所述训练实体关系数据和所述待上线应用的实体集合对预设深度学习模型进行实体和关系的识别训练,得到所述实体关系识别模型。
6.根据权利要求1所述的方法,其特征在于,所述获取待上线应用的实体关系数据之前,还包括:
确定与所述待上线应用的类型对应的已上线应用;
确定所述已上线应用的参考实体集合;所述参考实体集合包括多个参考实体对和用于描述每个参考实体对中两个参考实体关系的参考关系词;
基于所述待上线应用的所述实体和所述关系词更新所述参考实体集合,得到所述待上线应用的实体集合。
7.根据权利要求6所述的方法,所述待上线应用的实体集合还包括所述多个实体对中实体的实体名称文件,所述实体名称文件包括所述实体的不同名称;
所述方法还包括:
基于所述参考实体对中参考实体的参考实体名称文件确定所述多个实体对中实体的实体名称文件;所述参考实体名称文件包括所述参考实体的不同名称。
8.根据权利要求6所述的方法,其特征在于,所述待上线应用的实体集合至少包括知识图谱或实体表中任一种集合形式;
所述参考实体集合至少包括知识图谱或实体表中任一种集合形式。
9.一种数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取实体确认请求,所述实体确认请求携带有待上线应用的实体关系数据;
识别模块,用于基于所述待上线应用的实体集合和实体关系识别模型对所述实体关系数据进行实体和关系的识别,得到目标实体和目标关系词;所述实体集合包括多个实体对和用于描述每个实体对中两个实体关系的关系词;
确定模块,用于基于所述目标实体、所述目标关系词、所述实体对和所述关系词确定所述实体确认请求对应的实体确认回复。
10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-8任一所述的数据处理方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1-8任一所述的数据处理方法。
CN201910662730.0A 2019-07-22 2019-07-22 一种数据处理方法、装置、电子设备及存储介质 Pending CN110489496A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910662730.0A CN110489496A (zh) 2019-07-22 2019-07-22 一种数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910662730.0A CN110489496A (zh) 2019-07-22 2019-07-22 一种数据处理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN110489496A true CN110489496A (zh) 2019-11-22

Family

ID=68547878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910662730.0A Pending CN110489496A (zh) 2019-07-22 2019-07-22 一种数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110489496A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021143299A1 (zh) * 2020-01-17 2021-07-22 华为技术有限公司 语义纠错方法、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021143299A1 (zh) * 2020-01-17 2021-07-22 华为技术有限公司 语义纠错方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
EP3819835A1 (en) Risk identification model training method and apparatus, and server
CN108763570A (zh) 一种识别相同房源的方法及装置
US20110184876A1 (en) Virtual bidding platform for lead allocation in real estate applications
US10580091B2 (en) Systems and methods for dynamically identifying and presenting matching user profiles to a user
CN109543007A (zh) 提问数据生成方法、装置、计算机设备和存储介质
CN109981910A (zh) 业务推荐方法及设备
US20110093457A1 (en) Method for calculating resource points of resource information and distributing points
CN107291939B (zh) 酒店信息的聚类匹配方法及系统
CN109062914A (zh) 用户推荐方法和装置,存储介质和服务器
CN105677882B (zh) 一种展示评论信息的方法和装置
CN110489496A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN112632409A (zh) 同一用户识别方法、装置、计算机设备和存储介质
CN115902643A (zh) 一种电池阻抗谱分数阶等效电路模型参数的分步辨识方法
US20210358044A1 (en) Analysis and visual presentation of dataset components
CN110489744A (zh) 一种语料的处理方法、装置、电子设备和存储介质
CN109214634A (zh) 一种信息处理方法、装置及信息处理可读介质
CN109446417A (zh) 一种智能化检索方法和装置
CN111708929B (zh) 信息搜索方法、装置、电子设备及存储介质
CN110196950B (zh) 传播帐号的处理方法和装置
CN106997340A (zh) 词库的生成以及利用词库的文档分类方法及装置
CN110197196B (zh) 问题处理方法、装置、电子设备以及存储介质
CN105022821B (zh) 一种内容过滤方法及终端
CN103856535B (zh) 一种获取用户数据的方法和装置
US11321375B2 (en) Text object management system
CN114971240A (zh) 一种阅读行为风险评估处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination