CN111930722A - 异质信息网络处理方法、装置、服务器和可读存储介质 - Google Patents
异质信息网络处理方法、装置、服务器和可读存储介质 Download PDFInfo
- Publication number
- CN111930722A CN111930722A CN202010997509.3A CN202010997509A CN111930722A CN 111930722 A CN111930722 A CN 111930722A CN 202010997509 A CN202010997509 A CN 202010997509A CN 111930722 A CN111930722 A CN 111930722A
- Authority
- CN
- China
- Prior art keywords
- entity
- information network
- heterogeneous information
- event data
- heterogeneous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明的实施例提供了一种异质信息网络处理方法、装置、服务器和可读存储介质,涉及数据处理技术领域。本发明实施例提供的异质信息网络处理方法、装置、服务器和可读存储介质,通过实时获取数据源发送的事件数据,对事件数据进行流式处理,得到事件数据对应的第一实体以及第一实体的关联信息,然后根据事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新,进而,通过实时对数据进行处理,达到了对异质信息网络实时更新的目的,大大提高了异质信息网络的准确性。
Description
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种异质信息网络处理方法、装置、服务器和可读存储介质。
背景技术
异质信息网络是一种信息网络,包含丰富的语义信息,它可以融合更多类型的对象及其复杂交互关系,即在异质信息网络中,不同类型的对象和关系共存。而目前,对于异质信息网络,大多采用离线数据进行构建,但这种方式,无法对数据及时进行处理,导致构建得到的异质信息网络误差较大。
发明内容
基于上述研究,本发明提供了一种异质信息网络处理方法、装置、服务器和可读存储介质,以改善上述问题。
本发明的实施例可以这样实现:
第一方面,本发明实施例提供一种异质信息网络处理方法,应用于服务器,所述方法包括:
实时获取数据源发送的事件数据,对所述事件数据进行流式处理,得到所述事件数据对应的第一实体以及所述第一实体的关联信息;
根据所述事件数据对应的第一实体以及所述第一实体的关联信息,对预先构建得到的异质信息网络进行更新。
在可选的实施方式中,所述关联信息包括所述第一实体在事件数据中关联的关联实体;所述根据所述事件数据对应的第一实体以及所述第一实体的关联信息,对预先构建得到的异质信息网络进行更新的步骤包括:
判断所述异质信息网络中是否存在与所述关联信息所包括的关联实体相同的目标实体;
若存在所述目标实体,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系;
若未存在所述目标实体,将所述第一实体以及与所述第一实体关联的关联实体添加至所述异质信息网络中。
在可选的实施方式中,所述关联信息还包括所述第一实体的标识信息以及所述关联实体的标识信息,所述判断所述异质信息网络中是否存在与所述关联信息所包括的关联实体相同的目标实体的步骤包括:
根据所述关联实体的标识信息,查找所述异质信息网络中是否存在标识信息与所述关联实体的标识信息相同的实体;
若存在,则判定查找到的实体为目标实体,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系;
若不存在,则判定所述异质信息网络中未存在目标实体,将所述第一实体以及与所述第一实体关联的关联实体添加至所述异质信息网络中,并保存所述第一实体的标识信息和所述关联实体的标识信息。
在可选的实施方式中,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系的步骤包括:
判断所述第一实体和目标实体是否已在所述异质信息网络中建立关联;
若已建立关联,在所述异质信息网络中更新所述目标实体与所述第一实体的关联次数;
若未建立关联,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系。
在可选的实施方式中,在对所述异质信息网络进行更新后,所述方法还包括:
将所述第一实体的事件数据以及事件数据的发生时间进行存储。
在可选的实施方式中,所述异质信息网络还存储有每个实体的事件数据的发生时间,所述方法还包括:
接收终端发送的数据请求;
根据所述异质信息网络中每个实体的事件数据的发生时间以及所述数据请求中的请求时间段和请求实体,从所述异质信息网络中读取与所述请求实体和请求时间段对应的实体的事件数据;
将读取到的实体的事件数据发送到所述终端。
在可选的实施方式中,所述对所述事件数据进行流式处理,得到所述事件数据对应的第一实体以及所述第一实体的关联信息的步骤包括:
采用Flink框架,基于设定的时间窗口,判断所述事件数据的发生时间是否在所述时间窗口内;
若所述事件数据的发生时间在所述时间窗口内,提取所述事件数据的第一实体以及所述第一实体的关联实体,得到所述事件数据对应的第一实体以及所述第一实体的关联信息。
在可选的实施方式中,所述方法还包括构建初始异质信息网络的步骤,所述步骤包括:
确定所要构建的初始异质信息网络所需要的实体类型,以及各所述实体类型之间的关联关系;
获取每个所述实体类型的事件数据,并对各所述实体类型的事件数据进行流式处理,根据流式处理后的事件数据以及各所述实体类型之间的关联关系构建所述初始异质信息网络;
所述预先构建得到的异质信息网络为所述初始异质信息网络或对所述初始异质信息网络进行更新后的异质信息网络。
第二方面,本发明实施例提供一种异质信息网络处理装置,应用于服务器,所述装置包括数据处理模块以及网络更新模块;
所述数据处理模块用于实时获取数据源发送的事件数据,对所述事件数据进行流式处理,得到所述事件数据对应的第一实体以及所述第一实体的关联信息;
所述网络更新模块用于根据所述事件数据对应的第一实体以及所述第一实体的关联信息,对预先构建得到的异质信息网络进行更新。
在可选的实施方式中,所述关联信息包括所述第一实体在事件数据中关联的关联实体,所述网络更新模块用于:
判断所述异质信息网络中是否存在与所述关联信息所包括的关联实体相同的目标实体;
若存在所述目标实体,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系;
若未存在所述目标实体,将所述第一实体以及与所述第一实体关联的关联实体添加至所述异质信息网络中。
在可选的实施方式中,所述关联信息还包括所述第一实体的标识信息以及所述关联实体的标识信息,所述网络更新模块用于:
根据所述关联实体的标识信息,查找所述异质信息网络中是否存在标识信息与所述关联实体的标识信息相同的实体;
若存在,则判定查找到的实体为目标实体,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系;
若不存在,则判定所述异质信息网络中未存在目标实体,将所述第一实体以及与所述第一实体关联的关联实体添加至所述异质信息网络中,并保存所述第一实体的标识信息和所述关联实体的标识信息。
在可选的实施方式中,所述网络更新模块用于:
判断所述第一实体和目标实体是否已在所述异质信息网络中建立关联;
若已建立关联,在所述异质信息网络中更新所述目标实体与所述第一实体的关联次数;
若未建立关联,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系。
在可选的实施方式中,所述装置包括数据存储模块;
所述数据存储模块用于将所述第一实体的事件数据以及事件数据的发生时间进行存储。
在可选的实施方式中,所述异质信息网络还存储有每个实体的事件数据的发生时间,所述装置还包括数据交互模块;所述数据交互模块用于:
接收终端发送的数据请求;
根据所述异质信息网络中每个实体的事件数据的发生时间以及所述数据请求中的请求时间段和请求实体,从所述异质信息网络中读取与所述请求实体和请求时间段对应的实体的事件数据;
将读取到的实体的事件数据发送到所述终端。
在可选的实施方式中,所述数据处理模块用于:
采用Flink框架,基于设定的时间窗口,判断所述事件数据的发生时间是否在所述时间窗口内;
若所述事件数据的发生时间在所述时间窗口内,提取所述事件数据的第一实体以及所述第一实体的关联实体,得到所述事件数据对应的第一实体以及所述第一实体的关联信息。
在可选的实施方式中,所述装置还包括网络构建模块,所述网络构建模块用于确定所要构建的初始异质信息网络所需要的实体类型,以及各所述实体类型之间的关联关系;获取每个所述实体类型的事件数据,并对各所述实体类型的事件数据进行流式处理,根据流式处理后的事件数据以及各所述实体类型之间的关联关系构建所述初始异质信息网络;
所述预先构建得到的异质信息网络为所述初始异质信息网络或对所述初始异质信息网络进行更新后的异质信息网络。
第三方面,本发明实施例提供一种服务器,包括处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当服务器运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如前述实施方式任一所述的异质信息网络处理方法。
第四方面,本发明实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执时如前述实施方式任一所述的异质信息网络处理方法的步骤。
本发明实施例提供的异质信息网络处理方法、装置、服务器和可读存储介质,通过实时获取数据源发送的事件数据,对事件数据进行流式处理,得到事件数据对应的第一实体以及第一实体的关联信息,然后根据事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新,进而,可通过实时对数据进行处理,达到对异质信息网络实时更新的目的,实现异质信息网络的动态构建,大大提高了异质信息网络的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例所提供的服务器的一种方框示意图。
图2为本发明实施例所提供的异质信息网络处理方法的一种流程示意图。
图3为本发明实施例所提供的初始异质信息网络的一种结构示意图。
图4为本发明实施例所提供的异质信息网络处理方法的另一种流程示意图。
图5为本发明实施例所提供的异质信息网络处理方法的又一种流程示意图。
图6为本发明实施例所提供的异质信息网络处理装置的一种方框示意图。
图标:100-服务器;110-网络端口;120-处理器;130-通信总线;140-存储介质;150-输入/输出接口;160-异质信息网络处理装置;161-数据处理模块;162-网络更新模块;163-数据存储模块;164-数据交互模块;165-网络构建模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。
近年来,大量涌现的社会媒体网站包含许多不同类型的对象和对象之间复杂的交互,将这些相互作用的对象建模为同质网络是很困难的,然而将这些相互作用的对象建模成异质信息网络却是很自然的方式。作为半结构化的表示方法,异质信息网络可以有效建模和处理复杂多样的数据,其次,与同质网络相比,异质信息网络也可以融合更多类型的对象及其复杂交互关系,也可以融合多个社交网络平台的信息。并且在异质信息网络中,不同类型的对象和关系共存,它们具有不同的语义含义。
而目前,对于异质信息网络,大多采用离线数据进行构建,但由于数据处理不及时,导致数据的数据源混乱且生成的对象过多,进而使得构建得到的异质信息网络存在较大误差、脏数据较多。考虑到语义信息将导致更细微的知识发现,因此异质信息网络的有效动态构建是十分必要的。
基于上述研究,本发明实施例提供一种异质信息网络处理方法,通过实时获取事件数据,对事件数据进行流式处理,得到事件数据对应的第一实体以及第一实体的关联信息,根据事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新,从而实现了异质信息网络的有效动态构建,并且避免了数据源混乱、对象过多的问题,大大提高了异质信息网络的准确性。
请参阅图1,图1中示出了根据本发明的一些实施例的可以实现本发明思想的服务器100的示例性硬件和软件组件的示意图。
在本发明实施例中,服务器100可以是单个服务器,也可以是服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器100可以是分布式系统)。在一些实施例中,服务器100也可以在云平台上实现,仅作为示例,云平台可以包括私有云、公有云、混合云、社区云(community cloud)、分布式云、跨云(inter-cloud)、多云(multi-cloud)等,或者它们的任意组合。
服务器100可以包括连接到网络的网络端口110、用于执行程序指令的一个或多个处理器120、通信总线130和不同形式的存储介质140,例如,磁盘、ROM、或RAM,或其任意组合。示例性地,服务器100还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质或其任意组合中的程序指令。根据这些程序指令可以实现本发明的方法。服务器100还可以包括与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output,I/O)接口150。
在一些实施例中,处理器120可以处理与服务请求有关的信息和/或数据,以执行本发明中描述的一个或多个功能。在一些实施例中,处理器120可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(S))。仅作为举例,处理器120可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、专用指令集处理器(Application Specific Instruction-setProcessor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing,RISC)或微处理器等,或其任意组合。
为了便于说明,在服务器100中仅描述了一个处理器。然而,应当注意,本发明中的服务器100还可以包括多个处理器,因此本发明中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若服务器100的处理器执行步骤A和步骤B,则应该理解,步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一处理器和第二处理器共同执行步骤A和B。
网络可以用于信息和/或数据的交换。在一些实施例中,服务器100中的一个或多个组件可以向其他组件发送信息和/或数据。例如,服务器100可以经由网络从用户手持设备如手机获取服务请求。在一些实施例中,网络可以是任何类型的有线或者无线网络,或者是他们的结合。仅作为示例,网络可以包括有线网络、无线网络、光纤网络、远程通信网络、内联网、因特网、局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网(Wireless Local Area Networks,WLAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、公共电话交换网(Public Switched TelephoneNetwork,PSTN)、蓝牙网络、ZigBee网络、或近场通信(Near Field Communication,NFC)网络等,或其任意组合。
在一些实施例中,网络可以包括一个或多个网络接入点。例如,网络可以包括有线或无线网络接入点,例如基站和/或网络交换节点,服务器100的一个或多个组件可以通过该接入点连接到网络以交换数据和/或信息。
服务器100中可以包括数据库,数据库可以存储数据和/或指令。在一些实施例中,数据库可以存储从服务请求方终端如用户手持设备获得的数据。在一些实施例中,数据库可以存储在本发明中描述的示例性方法的数据和/或指令。在一些实施例中,数据库可以包括大容量存储器、可移动存储器、易失性读写存储器、或只读存储器(Read-Only Memory,ROM)等,或其任意组合。作为举例,大容量存储器可以包括磁盘、光盘、固态驱动器等;可移动存储器可包括闪存驱动器、软盘、光盘、存储卡、zip磁盘、磁带等;易失性读写存储器可以包括随机存取存储器(Random Access Memory,RAM);RAM可以包括动态RAM(DynamicRandom Access Memory,DRAM),双倍数据速率同步动态RAM(Double Date-RateSynchronous RAM,DDR SDRAM);静态RAM(Static Random-Access Memory,SRAM),晶闸管RAM(Thyristor-Based Random Access Memory,T-RAM)和零电容器RAM(Zero-RAM)等。作为举例,ROM可以包括掩模ROM(Mask Read-Only Memory,MROM)、可编程ROM(ProgrammableRead-Only Memory,PROM)、可擦除可编程ROM(Programmable Erasable Read-onlyMemory,PEROM)、电可擦除可编程ROM(Electrically Erasable Programmable read onlymemory,EEPROM)、光盘ROM(CD-ROM)、以及数字通用磁盘ROM等。
在一些实施例中,数据库可以在云平台上实现。仅作为示例,云平台可以包括私有云、公有云、混合云、社区云、分布式云、跨云、多云、弹性云或者其它类似的等,或其任意组合。
在一些实施例中,数据库可以连接到网络以与服务器100中的一个或多个组件通信。服务器100中的一个或多个组件可以经由网络访问存储在数据库中的数据或指令。在一些实施例中,数据库可以直接连接到服务器100中的一个或多个组件。或者,在一些实施例中,数据库也可以是服务器100的一部分。
在一些实施例中,服务器100中的一个或多个组件可以具有访问数据库的权限。在一些实施例中,当满足一定条件时,服务器100中的一个或多个组件可以读取和/或修改与服务请求方或公众、或其任意组合有关的信息。例如,服务器100可以在接收服务请求之后读取和/或修改数据库中的一个或多个信息。
可以理解地,图1所示的结构仅为示意,所述服务器100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
基于图1的实现架构,图2示出了本发明实施例所提供的异质信息网络处理方法的流程图之一。该方法应用于图1所示的服务器100,由图1所示的服务器100执行。应当理解,在其它实施例中,本实施例所述的异质信息网络处理方法中的部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。下面对图2所示的异质信息网络处理方法的流程进行详细描述。
步骤S10:实时获取数据源发送的事件数据,对事件数据进行流式处理,得到事件数据对应的第一实体以及第一实体的关联信息。
步骤S20:根据事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新。
其中,数据源可以是Kafka分布式消息系统、消息队列(Message Queue,MQ)、二进制日志(Binlog)、日志等任一数据源或者任意数据源的组合,具体地可根据实际需求而设置,本发明实施例不做限定。例如,对于打车场景来说,订单数据可以来自Kafka分布式消息系统,冒泡数据,即用户打开乘车软件未下单的数据可以来自MQ数据源等等。
本发明实施例所提供的异质信息网络处理方法,通过实时获取数据源发送的事件数据,对事件数据进行流式处理,避免了数据源混乱,生成的对象过多的问题;通过事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新,达到了对异质信息网络实时动态构建的目的,大大提高了异质信息网络的实时性、准确性,保证了异质信息网络中的语义信息无法丢失。
需要说明的是,在本发明实施例中,预先构建得到的异质信息网络可以为初始异质信息网络,也可以为对初始异质信息网络进行更新后的异质信息网络,即上一次更新后的异质信息网络。
作为一种可选的实施方式,本发明实施例可通过以下步骤构建得到初始异质信息网络:
首先,确定所要构建的初始异质信息网络所需要的实体类型,以及各实体类型之间的关联关系。
然后,获取每个实体类型的事件数据,并对各实体类型的事件数据进行流式处理,根据流式处理后的事件数据以及各实体类型之间的关联关系构建初始异质信息网络。
其中,在获取每个实体类型中的事件数据时,为了避免数据源混乱导致构建得到异质信息网络误差较大,可选的,在本实施例中,可先找到各实体类型的数据源,然后从数据源获取对应的事件数据,以构建初始异质信息网络。
例如,在打车场景下,构建一异质信息网络,需要乘客、订单和司机这三种类型的实体,其中,乘客可作为订单发起方,司机可作为订单接收方,因此,乘客类型的实体和司机类型的实体可通过订单类型的实体建立关联关系。
若通过查找各实体类型的数据源,得到订单数据、乘客数据以及司机数据均来自数据源a,其中乘客数据和司机数据包含于订单数据中,则可直接从数据源a中获取各类型的实体的事件数据。
若通过查找各实体类型的数据源,得到订单数据来自数据源a,司机数据来自数据源b,乘客数据包含于订单数据中,则可从数据源a中获取订单类型的实体的事件数据、乘客类型的实体的事件数据、数据源b中获取司机类型的实体的事件数据。
在获取得到每个实体类型的事件数据后,即可对各实体类型的事件数据以流式计算的方式进行处理,然后根据流式处理后的事件数据以及各实体类型之间的关联关系构建初始异质信息网络。
其中,对各实体类型的事件数据以流式计算的方式进行处理包括以流式计算的方式,对事件数据进行实体信息的提取。
通过对各事件数据进行实体信息的提取,可得到各事件数据对应的实体,然后根据各实体类型之间的关联关系,可确定得到提取得到的各事件数据对应的实体之间的关联关系。而在得到各事件数据对应的实体之间的关联关系后,即可根据各事件数据对应的实体之间的关联关系构建初始异质信息网络,即根据各实体之间的关联关系构建初始异质信息网络的结构。
例如,以打车场景为例,对订单类型的事件数据进行实体信息提取,如对订单事件数据1进行实体信息提取,得到的实体有乘客a1、司机c1,由于乘客类型的实体和司机类型的实体可通过订单类型的实体建立关联关系,因此,司机c1和乘客a1通过订单事件数据1建立关联关系。对订单事件数据2进行实体信息提取,得到的实体有乘客a2、司机c2,则司机c2和乘客a2通过订单事件数据2建立关联关系。对订单事件数据3进行实体信息提取,得到的实体有乘客a3、司机c1,则司机c1和乘客a3通过订单事件数据3建立关联关系。
需要说明的是,若对事件数据进行实体提取,提取得到的实体为单独实体,则直接在异质信息网络中将单个实体作为节点进行保存。例如,对司机事件数据进行实体信息提取,得到的实体有司机c2、司机c3,其中,司机c2和乘客a2已通过订单事件数据2建立关联关系,司机c3作为单独实体,则直接对单独实体司机c3进行保存。
根据以上所举例子中的实体以及实体之间的关联关系构建得到的初始异质信息网络可以如图3所示,其中,构建得到的初始异质信息网络中包括的实体有乘客a1、乘客a2、乘客a3、司机c1、司机c2、司机c3,包括的关联关系则有司机c1-乘客a1-订单1,司机c2-乘客a2-订单2,司机c1-乘客a3-订单3。
作为一种可选的实施方式,在本发明实施例中,在构建初始异质信息网络后,还可以对每个实体对应的事件数据进行保存,同时,也可以对各实体的事件数据的发生时间、各实体的标识信息进行保存。
可选的,在本发明实施例中,以流式计算的方式对事件数据进行处理,还可以包括对事件数据进行数据转换以及计算等等。
在构建得到初始异质信息网络后,在后续有新的事件数据产生时,只需要对新的事件数据进行流式处理,得到新的事件数据对应的第一实体以及第一实体的关联信息,然后根据新的事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络(初始异质信息网络)进行更新即可,从而达到了对异质信息网络的实时动态构建的目的,也避免了处理不及时导致的异质信息网络误差较大、脏数据较多的问题。
在可选的实施方式中,对事件数据进行流式处理,得到事件数据对应的第一实体以及第一实体的关联信息的步骤包括:
采用Flink框架,基于设定的时间窗口,判断事件数据的发生时间是否在时间窗口内。
若事件数据的发生时间在时间窗口内,提取事件数据的第一实体以及第一实体的关联实体,得到事件数据对应的第一实体以及第一实体的关联信息。
作为一种可选的实施方式,本发明实施例设定的时间窗口可以是滑动时间窗口、滚动时间窗口、会话时间窗口等等,具体的,可根据实际需求而设定。
本发明实施例在数据源获取事件数据后,每个事件数据都带有对应的发生时间,进而可根据事件数据的发生时间,判断事件数据的发生时间是否在设定的时间窗口内,若在,则提取事件数据的第一实体以及事件数据中与第一实体关联实体,从而得到事件数据对应的第一实体以及第一实体的关联信息。
例如,设定的时间窗口是5分钟,当前时间为11:00,假设某事件数据的发生时间为11:01,处于11:00至11:05的时间窗口内,因此,对该事件数据进行实体提取。
作为一种可选的实施方式,对于未处于时间窗口的内的事件数据,可先将事件数据进行存储,然后按设定的时间周期对存储的事件数据进行处理,然后再基于处理后的事件数据更新异质信息网络。
本发明实施例采用Flink框架,通过设定的时间窗口对事件数据进行流式处理,能够更好的支持无序事件。通过采用Flink框架,具有良好的容错处理能力,即可保证高吞吐率,又能保证exactly-once的一致性,即保证在发生故障后得到的计数结果与正确值一致,同时,本发明实施例还可采用savepoint机制,可以保证升级应用时不丢数据。
除此之外,本发明实施例采用Flink框架,对于不同数据源的事件数据,可以多线程并行处理,如此可提高事件数据的处理效率,并且,由于Flink运行在大规模的Hadoop集群之上,可以做到几乎无延迟的对数据进行处理及写入,如此,避免了构建异质信息网络时,由于数据处理不及时、数据源混乱、生成的实体对象过多导致的误差较大、脏数据较多的问题。
在提取得到事件数据的第一实体以及第一实体的关联信息后,即可根据第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新。
在可选的实施方式中,请结合参阅图4,根据每个事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新的步骤包括步骤S21至步骤S23。
步骤S21:判断异质信息网络中是否存在与关联信息所包括的关联实体相同的目标实体。
若存在目标实体,执行步骤S22。若未存在目标实体,执行步骤S23。
步骤S22:在异质信息网络中建立目标实体与第一实体的关联关系,更新异质信息网络。
步骤S23:将第一实体以及与第一实体关联的关联实体添加至异质信息网络中,更新异质信息网络。
其中,关联信息包括第一实体在事件数据中关联的关联实体,因此,在得到第一实体以及第一实体的关联信息后,查找异质信息网络中是否存在与关联信息所包括的关联实体相同的目标实体,如果异质信息网络中存在与关联实体相同的目标实体,则在异质信息网络中建立目标实体和第一实体的关联关系,以对异质信息网络进行更新。如果异质信息网络中未存在与关联实体相同的目标实体,则判定异质信息网络中未保存第一实体与关联实体的关联关系,进而将第一实体与关联实体添加至异质信息网络中,即在异质信息网络中添加第一实体与关联实体的关联关系,从而实现异质信息网络的更新。
例如,假设某事件数据为订单数据,对该事件数据进行处理,得到的第一实体为乘客A,与乘客A关联的关联实体为司机a,然后在异质信息网络中进行查找是否存在司机a的目标实体,若存在,在异质信息网络中将司机a和乘客A建立关联关系,即通过订单建立司机a和乘客A的关联关系。如果在异质信息网络中未查找到司机a的目标实体,则将司机a和乘客A添加到异质信息网络中,然后通过订单将司机a和乘客A进行关联。
需要说明的是,在对事件数据进行实体提取时,可任意选一个实体作为第一实体,然后将其他实体作为关联实体。例如,对订单事件数据进行实体提取时,得到的实体有乘客、司机,其中,可将乘客作为第一实体,将司机作为关联实体,也可以将司机作为第一实体,将乘客作为关联实体。
可以理解地,本发明实施例所提供的异质信息网络处理方法可以应用于多种需要数据处理的场景,例如购物场景,建立卖家、商品和买家之间的关联关系,又例如,上述所例举的打车场景,建立司机、订单、乘客之间的关联关系。
本发明实施例所提供的异质信息网络处理方法,一方面,通过实时获取数据,对数据流式处理,根据流式处理后的事件数据更新异质信息网络,达到了异质信息网络的实时动态构建,保证了异质信息网络的语义准确性、异质信息网络的时效性,另一方面,通过实时对数据进行处理,避免因数据处理不及时、数据对象过多导致的异质信息网络误差较大、脏数据较多的问题。
为了便于查找异质信息网络中的目标实体,在可选的实施方式中,关联信息还包括第一实体的标识信息以及关联实体的标识信息,基于此,判断异质信息网络中是否存在与关联信息所包括的关联实体相同的目标实体的步骤还可以包括:
根据关联实体的标识信息,查找异质信息网络中是否存在标识信息与关联实体的标识信息相同的实体。
若存在,则判定查找到的实体为目标实体,在异质信息网络中建立目标实体与所述第一实体的关联关系。
若不存在,则判定异质信息网络中未存在目标实体,将第一实体以及与第一实体关联的关联实体添加至异质信息网络中,并保存第一实体的标识信息和关联实体的标识信息。
其中,对于每个实体,异质信息网络中均保存有该实体的标识信息,同时,每个实体的标识信息具有唯一性,例如,对于乘客实体和司机实体来说,其标识信息可以为手机号、身份证号或者设置的唯一编号等等。
基于此,在得到第一实体和与第一实体关联的关联实体之后,即可根据关联实体的标识信息,在异质信息网络中查找存在标识信息与关联实体的标识信息相同的实体,若异质信息网络中存在标识信息相同的实体,则判定标识信息相同的实体为目标实体,然后在异质信息网络中建立目标实体与第一实体的关联关系。若异质信息网络中未找到与标识信息相同的实体,则判定异质信息网络中未存在目标实体,然后将第一实体以及与第一实体关联的关联实体添加至异质信息网络中,建立第一实体与关联实体的关联关系,同时并对第一实体的标识信息和关联实体的标识信息进行保存,以便于后续可根据标识信息查找相应的实体,提高工作效率。
由于在实际应用中,异质信息网络中对于某些实体之间已经建立有关联关系,因此,在异质信息网络中建立目标实体与第一实体的关联关系时,还需要考虑目标实体与第一实体是否已建立关联关联。
可选的,在本发明实施例中,在异质信息网络中建立目标实体与第一实体的关联关系的步骤可以包括:
判断第一实体和目标实体是否已在异质信息网络中建立关联。
若已建立关联,则在异质信息网络中更新目标实体与第一实体的关联次数,若未建立关联,在异质信息网络中建立目标实体与第一实体的关联关系。
其中,若在异质信息网络中查询得到第一实体和目标实体已建立关联关系,则在异质信息网络中更新第一实体和目标实体的关联次数,即在异质信息网络中添加该次第一实体和目标实体的关联信息。
例如,在异质信息网络中查询得到第一实体和目标实体已建立有关联关系,且建立关联关系的次数为5次,则只需要在异质信息网络中更新第一实体和目标实体的关联次数,将第一实体和目标实体的关联次数更新为6次,并保存第6次的关联信息。
若在异质信息网络中查询得到第一实体和目标实体未建立关联关系,则在异质信息网络中新建第一实体和目标实体的关联关系,即将第一实体和目标实体的关联关系添加并存储于异质信息网络中。
本发明实施例通过异质信息网络进行实时更新,不仅便于异质信息网络中各实体关系的处理,而且提高了异质信息网络的准确性。
为了便于后续数据的应用,在本发明实施例中,在对异质信息网络进行更新后,所述方法还包括:
将第一实体的事件数据以及事件数据的发生时间进行存储。
作为一种可选的实施方式,本发明实施例可将异质信息网络存储于Redis数据库中,然后采用Redis数据库的Sorted Set数据类型对事件数据进行存储,采用score对事件数据的发生时间进行存储,如此,以便于后续数据读取时,提供时序上的选择。同时Redis数据库作为基于内存的数据存储,拥有读写速度快的优势,可以做到随写随用,非常适合实时生成异质信息网络,即实现对异质信息网络的实时更新。
通过将异质信息网络存储于Redis数据库中,在需要读取异质信息网络中的数据时,只需要从Redis数据库中进行读取即可,处理效率高。
在一种示例性的实施方式中,当终端需要从异质信息网络中读取数据时,即可向服务器发送数据请求,发送的数据请求中可以包括终端所请求的实体和请求时间段的数据。服务器在接收终端的数据请求后,即可根据终端发送的数据请求,从Redis数据库中的异质信息网络获取相应的数据,反馈至终端。
在可选的实施方式中,请结合参阅图5,服务器接收终端的数据请求,根据终端发送的数据请求,从异质信息网络中获取相应的数据,并反馈至终端的步骤可以包括:
步骤S1:接收终端发送的数据请求。
步骤S2:根据异质信息网络中每个实体的事件数据的发生时间以及数据请求中的请求时间段和请求实体,从异质信息网络中读取与请求实体和请求时间段对应的实体的事件数据。
步骤S3:将读取到的实体的事件数据发送到终端。
其中,服务器在接收到终端发送的数据请求后,则根据数据请求中所包括的请求实体和请求时间段,以及异质信息网络中每个事件数据的发生数据,从异质信息网络中获取相应实体的相应时间段的事件数据,并将获取得到的事件数据反馈至终端。
例如,终端需要读取实体m前一个月的事件数据,需要读取实体n前十天的事件数据,则终端向服务器发送数据请求,数据请求中包括的请求实体为实体m,实体n,请求时间段为实体m为前一个月,实体n为前十天。服务器在接收到终端发送的数据请求后,则在异质信息网络中找到实体m和实体n,然后根据实体m的事件数据的发生时间,查找前一个月的事件数据,根据实体n的事件的发生时间,查找前十天的时间数据,在查找到实体m前一个月的事件数据,实体n前十天的事件数据后,则将查找到的事件数据反馈至终端。
在本发明实施例中,终端可以是,但不限于,个人电脑(personal computer,PC)、平板电脑、移动上网设备(mobile Internet device,MID)等。
本发明实施例通过对异质信息网络进行实时更新,在实际应用时,只需根据所需的异质图结构,从Redis的异质信息网络中读取所需的数据生成异质图结果即可,大大提高了数据处理的效率。例如,训练模型时,只需要根据训练模型所需要的异质图结构,从Redis中读取所需的数据生成异质图结果,将异质图结果转换为序列化(Graph Embedding)的形式,输入到相应模型中即可,大大提高了模型的训练效果和效率。
本发明实施例提供的异质信息网络处理方法通过实时获取数据源发送的事件数据,对事件数据进行流式处理,得到事件数据对应的第一实体以及第一实体的关联信息,然后根据事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新,进而,可通过实时对数据进行处理,达到了对异质信息网络实时更新的目的,实现了异质信息网络动态构建的目的,大大提高了异质信息网络的准确性。
基于同一发明构思,请结合参阅图6,本发明实施例还提供一种异质信息网络处理装置160,应用于服务器,异质信息网络处理装置包括数据处理模块161以及网络更新模块162。
数据处理模块161用于实时获取数据源发送的事件数据,对事件数据进行流式处理,得到事件数据对应的第一实体以及所述第一实体的关联信息。
网络更新模块162用于根据事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新。
在可选的实施方式中,关联信息包括所述第一实体在事件数据中关联的关联实体,网络更新模块162用于:
判断异质信息网络中是否存在与关联信息所包括的关联实体相同的目标实体。
若存在目标实体,在异质信息网络中建立目标实体与所述第一实体的关联关系,更新异质信息网络。
若未存在目标实体,将第一实体以及与第一实体关联的关联实体添加至异质信息网络中,更新异质信息网络。
在可选的实施方式中,关联信息还包括第一实体的标识信息以及关联实体的标识信息,网络更新模块162用于:
根据关联实体的标识信息,查找异质信息网络中是否存在标识信息与关联实体的标识信息相同的实体。
若存在,则判定查找到的实体为目标实体,在异质信息网络中建立目标实体与第一实体的关联关系。
若不存在,则判定异质信息网络中未存在目标实体,将第一实体以及与第一实体关联的关联实体添加至异质信息网络中,并保存第一实体的标识信息和关联实体的标识信息。
在可选的实施方式中,网络更新模块162用于:
判断第一实体和目标实体是否已在异质信息网络中建立关联。
若已建立关联,在异质信息网络中更新目标实体与第一实体的关联次数。
若未建立关联,在异质信息网络中建立目标实体与第一实体的关联关系。
在可选的实施方式中,异质信息网络处理装置160包括数据存储模块163。
数据存储模块163用于将第一实体的事件数据以及事件数据的发生时间进行存储。
在可选的实施方式中,异质信息网络处理装置160还包括数据交互模块164;数据交互模块164用于:
接收终端发送的数据请求。
根据异质信息网络中每个实体的事件数据的发生时间以及数据请求中的请求时间段和请求实体,从异质信息网络中读取与请求实体和请求时间段对应的实体的事件数据。
将读取到的实体的事件数据发送到终端。
在可选的实施方式中,数据处理模块161用于:
采用Flink框架,基于设定的时间窗口,判断事件数据的发生时间是否在所述时间窗口内。
若事件数据的发生时间在时间窗口内,提取事件数据的第一实体以及所述第一实体的关联实体,得到事件数据对应的第一实体以及第一实体的关联信息。
在可选的实施方式中,异质信息网络处理装置160还包括网络构建模块165,网络构建模块165用于确定所要构建的初始异质信息网络所需要的实体类型,以及各实体类型之间的关联关系;获取每个实体类型的事件数据,并对各实体类型的事件数据进行流式处理,根据流式处理后的事件数据以及各实体类型之间的关联关系构建初始异质信息网络;其中,预先构建得到的异质信息网络为初始异质信息网络或对初始异质信息网络进行更新后的异质信息网络。
由于本发明实施例中的异质信息网络处理装置160解决问题的原理与本发明实施例上述异质信息网络处理方法相似,因此异质信息网络处理装置160的实施可以参见方法的实施,重复之处不再赘述。
异质信息网络处理装置160中的上述模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。
在上述基础上,本发明实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执时如前述实施方式任一所述的异质信息网络处理方法的步骤。
可选的,该可读存储介质能够为通用的存储介质,如移动磁盘、硬盘等。
本发明实施例所提供的异质信息网络处理方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中所述的异质信息网络处理方法的步骤,具体可参见上述方法实施例,在此不再赘述。
综上,本发明实施例提供的异质信息网络处理方法、装置、服务器和可读存储介质,通过实时获取数据源发送的事件数据,对事件数据进行流式处理,得到事件数据对应的第一实体以及第一实体的关联信息,然后根据事件数据对应的第一实体以及第一实体的关联信息,对预先构建得到的异质信息网络进行更新,进而,可通过实时对数据进行处理,达到了对异质信息网络实时更新的目的,大大提高了异质信息网络的准确性,避免了因数据处理不及时导致的异质信息网络误差较大、脏数据较多的问题。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种异质信息网络处理方法,其特征在于,应用于服务器,所述方法包括:
实时获取数据源发送的事件数据,对所述事件数据进行流式处理,得到所述事件数据对应的第一实体以及所述第一实体的关联信息;
根据所述事件数据对应的第一实体以及所述第一实体的关联信息,对预先构建得到的异质信息网络进行更新。
2.根据权利要求1所述的异质信息网络处理方法,其特征在于,所述关联信息包括所述第一实体在事件数据中关联的关联实体;所述根据所述事件数据对应的第一实体以及所述第一实体的关联信息,对预先构建得到的异质信息网络进行更新的步骤包括:
判断所述异质信息网络中是否存在与所述关联信息所包括的关联实体相同的目标实体;
若存在所述目标实体,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系;
若未存在所述目标实体,将所述第一实体以及与所述第一实体关联的关联实体添加至所述异质信息网络中。
3.根据权利要求2所述的异质信息网络处理方法,其特征在于,所述关联信息还包括所述第一实体的标识信息以及所述关联实体的标识信息,所述判断所述异质信息网络中是否存在与所述关联信息所包括的关联实体相同的目标实体的步骤包括:
根据所述关联实体的标识信息,查找所述异质信息网络中是否存在标识信息与所述关联实体的标识信息相同的实体;
若存在,则判定查找到的实体为目标实体,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系;
若不存在,则判定所述异质信息网络中未存在目标实体,将所述第一实体以及与所述第一实体关联的关联实体添加至所述异质信息网络中,并保存所述第一实体的标识信息和所述关联实体的标识信息。
4.根据权利要求3所述的异质信息网络处理方法,其特征在于,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系的步骤包括:
判断所述第一实体和目标实体是否已在所述异质信息网络中建立关联;
若已建立关联,在所述异质信息网络中更新所述目标实体与所述第一实体的关联次数;
若未建立关联,在所述异质信息网络中建立所述目标实体与所述第一实体的关联关系。
5.根据权利要求1所述的异质信息网络处理方法,其特征在于,所述异质信息网络还存储有每个实体的事件数据的发生时间,所述方法还包括:
接收终端发送的数据请求;
根据所述异质信息网络中每个实体的事件数据的发生时间以及所述数据请求中的请求时间段和请求实体,从所述异质信息网络中读取与所述请求实体和请求时间段对应的实体的事件数据;
将读取到的实体的事件数据发送到所述终端。
6.根据权利要求1所述的异质信息网络处理方法,其特征在于,所述对所述事件数据进行流式处理,得到所述事件数据对应的第一实体以及所述第一实体的关联信息的步骤包括:
采用Flink框架,基于设定的时间窗口,判断所述事件数据的发生时间是否在所述时间窗口内;
若所述事件数据的发生时间在所述时间窗口内,提取所述事件数据的第一实体以及所述第一实体的关联实体,得到所述事件数据对应的第一实体以及所述第一实体的关联信息。
7.根据权利要求1所述的异质信息网络处理方法,其特征在于,所述方法还包括构建初始异质信息网络的步骤,所述步骤包括:
确定所要构建的初始异质信息网络所需要的实体类型,以及各所述实体类型之间的关联关系;
获取每个所述实体类型的事件数据,并对各所述实体类型的事件数据进行流式处理,根据流式处理后的事件数据以及各所述实体类型之间的关联关系构建所述初始异质信息网络;
所述预先构建得到的异质信息网络为所述初始异质信息网络或对所述初始异质信息网络进行更新后的异质信息网络。
8.一种异质信息网络处理装置,其特征在于,应用于服务器,所述装置包括数据处理模块以及网络更新模块;
所述数据处理模块用于实时获取数据源发送的事件数据,对所述事件数据进行流式处理,得到所述事件数据对应的第一实体以及所述第一实体的关联信息;
所述网络更新模块用于根据所述事件数据对应的第一实体以及所述第一实体的关联信息,对预先构建得到的异质信息网络进行更新。
9.一种服务器,其特征在于,包括处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当服务器运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至7任一所述的异质信息网络处理方法。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执时如权利要求1至7任一所述的异质信息网络处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010997509.3A CN111930722A (zh) | 2020-09-21 | 2020-09-21 | 异质信息网络处理方法、装置、服务器和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010997509.3A CN111930722A (zh) | 2020-09-21 | 2020-09-21 | 异质信息网络处理方法、装置、服务器和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111930722A true CN111930722A (zh) | 2020-11-13 |
Family
ID=73335302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010997509.3A Pending CN111930722A (zh) | 2020-09-21 | 2020-09-21 | 异质信息网络处理方法、装置、服务器和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111930722A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679160A (zh) * | 2017-09-28 | 2018-02-09 | 深圳市华傲数据技术有限公司 | 基于图数据库的数据处理方法及装置 |
CN109344170A (zh) * | 2018-09-04 | 2019-02-15 | 阿里巴巴集团控股有限公司 | 流数据处理方法、系统、电子设备及可读存储介质 |
CN109918669A (zh) * | 2019-03-08 | 2019-06-21 | 腾讯科技(深圳)有限公司 | 实体确定方法、装置及存储介质 |
CN110933101A (zh) * | 2019-12-10 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 安全事件日志处理方法、装置及存储介质 |
CN111191081A (zh) * | 2019-12-17 | 2020-05-22 | 安徽大学 | 一种基于异质信息网络的开发者推荐方法及装置 |
-
2020
- 2020-09-21 CN CN202010997509.3A patent/CN111930722A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679160A (zh) * | 2017-09-28 | 2018-02-09 | 深圳市华傲数据技术有限公司 | 基于图数据库的数据处理方法及装置 |
CN109344170A (zh) * | 2018-09-04 | 2019-02-15 | 阿里巴巴集团控股有限公司 | 流数据处理方法、系统、电子设备及可读存储介质 |
CN109918669A (zh) * | 2019-03-08 | 2019-06-21 | 腾讯科技(深圳)有限公司 | 实体确定方法、装置及存储介质 |
CN110933101A (zh) * | 2019-12-10 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 安全事件日志处理方法、装置及存储介质 |
CN111191081A (zh) * | 2019-12-17 | 2020-05-22 | 安徽大学 | 一种基于异质信息网络的开发者推荐方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108572970B (zh) | 一种结构化数据的处理方法和分布式处理系统 | |
US20140297727A1 (en) | Method, system, server and client device for message sychronizing | |
CN112236760B (zh) | 一种图数据的更新方法、系统、计算机可读存储介质及设备 | |
CN106815254B (zh) | 一种数据处理方法和装置 | |
CN108696594A (zh) | 一种市场监管区块链的大数据传输负载均衡方法及装置 | |
CN110781180B (zh) | 一种数据筛选方法和数据筛选装置 | |
CN110601978B (zh) | 流量分发控制方法和装置 | |
CN111464352A (zh) | 调用链路数据处理方法及装置 | |
CN111831713A (zh) | 一种数据处理方法、装置及设备 | |
EP2980701B1 (en) | Stream processing with context data affinity | |
CN113722055A (zh) | 数据处理方法、装置、电子设备和计算机可读介质 | |
CN108920281A (zh) | 大规模图片处理方法及系统 | |
CN113760488A (zh) | 调度任务的方法、装置、设备和计算机可读介质 | |
CN111259066A (zh) | 服务器集群数据同步方法及装置 | |
CN112860412B (zh) | 业务数据处理方法、装置、电子设备及存储介质 | |
CN114297278A (zh) | 批量数据快速写入方法、系统和装置 | |
CN114153986A (zh) | 一种知识图谱构建方法、装置、电子设备及存储介质 | |
US11470167B2 (en) | Method and apparatus for generating information | |
CN110909072B (zh) | 一种数据表建立方法、装置及设备 | |
CN111930722A (zh) | 异质信息网络处理方法、装置、服务器和可读存储介质 | |
CN113157695B (zh) | 数据处理方法、装置、可读介质及电子设备 | |
US20240078387A1 (en) | Text chain generation method and apparatus, device, and medium | |
WO2019091101A1 (zh) | 薪资计算方法、应用服务器及计算机可读存储介质 | |
CN115525717A (zh) | 一种数据同步处理方法及装置 | |
CN114996246A (zh) | 一种基于NiFi组件的表多个字段校验的数据清洗方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201113 |
|
RJ01 | Rejection of invention patent application after publication |