CN107943935B - 数据的处理方法、装置和计算机可读存储介质 - Google Patents

数据的处理方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN107943935B
CN107943935B CN201711177876.3A CN201711177876A CN107943935B CN 107943935 B CN107943935 B CN 107943935B CN 201711177876 A CN201711177876 A CN 201711177876A CN 107943935 B CN107943935 B CN 107943935B
Authority
CN
China
Prior art keywords
entity
indirect
direct
closeness
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711177876.3A
Other languages
English (en)
Other versions
CN107943935A (zh
Inventor
束博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tianguang Huitong Science & Technology Co ltd
Original Assignee
Beijing Tianguang Huitong Science & Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tianguang Huitong Science & Technology Co ltd filed Critical Beijing Tianguang Huitong Science & Technology Co ltd
Priority to CN201711177876.3A priority Critical patent/CN107943935B/zh
Publication of CN107943935A publication Critical patent/CN107943935A/zh
Application granted granted Critical
Publication of CN107943935B publication Critical patent/CN107943935B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据的处理方法、装置和计算机可读存储介质,涉及大数据分析领域。该方法包括:根据第一实体和第二实体之间的各直接关系及其对应的关联因子确定第一实体和第二实体之间的直接紧密度;根据与第一实体和第二实体相关联的同一事件建立第一实体和第二实体之间的间接关系;根据第一实体和第二实体之间的各间接关系及其对应的关联因子确定第一实体和第二实体之间的间接紧密度;根据直接紧密度和/或间接紧密度计算第一实体和第二实体之间的综合紧密度。该方法和装置能够准确、全面地反映实体之间关联。

Description

数据的处理方法、装置和计算机可读存储介质
技术领域
本发明涉及大数据分析领域,特别涉及一种数据的处理方法、数据的处理装置和计算机可读存储介质。
背景技术
随着通信技术、互联网和计算机技术的发展,人、机构和事件等实体之间的关系变得越来越复杂,传统的数据处理方法已经无法适应这种错综复杂的数据关联。
大数据分析技术可以从海量数据中挖掘出各种实体之间关联,从而组建实体之间的关系网络。
现有技术从结构化数据中提取实体和属性的相关信息,如实体名称、属性名称及其映射关联等,然后根据映射关联生成特定类型的实体之间的关系连接。
发明内容
本发明的发明人发现上述现有技术中存在如下问题:现有技术仅能判断实体之间是否存在关联,而且关联的类型相对单一,从而导致无法准确地、全面地反映实体之间复杂的关系。针对上述问题,本发明人提出了解决方案。
本发明的一个目的是提供一种能够准确地、全面地反映实体之间关系的数据处理技术方案。
根据本发明的一个实施例,提供了一种数据的处理方法,包括:根据第一实体和第二实体之间的各直接关系及其对应的关联因子确定所述第一实体和所述第二实体之间的直接紧密度;根据与所述第一实体和所述第二实体相关联的同一事件建立所述第一实体和所述第二实体之间的间接关系;根据所述第一实体和所述第二实体之间的各所述间接关系及其对应的关联因子确定所述第一实体和所述第二实体之间的间接紧密度;根据所述直接紧密度和/或所述间接紧密度计算所述第一实体和所述第二实体之间的综合紧密度。
可选地,所述直接关系的关联因子包括所述直接关系对应的权值和/或所述直接关系发生的次数;所述间接关系的关联因子包括所述间接关系对应的权值和/或所述间接关系发生的次数。
可选地,从结构化数据中提取所述第一实体、所述第二实体、所述直接关系、所述间接关系和所述事件,
所述结构化数据中包括对象和连接以及不同对象之间的连接,所述对象为实体或事件,所述连接具有所述权值,所述权值是可配置的,
所述直接关系对应所述第一实体和所述第二实体之间的连接,
所述间接关系包括所述第一实体与所述同一事件之间的连接以及所述第二实体与所述同一事件之间的连接。
可选地,将各所述直接关系对应的权值与所述直接关系发生的次数相乘后加权求和以确定所述直接紧密度。
可选地,将各所述间接关系中包括的连接的权值与所述连接发生的次数相乘后加权求和以确定所述间接紧密度。
可选地,对所述直接紧密度和所述间接紧密度加权求和获取所述综合紧密度。
可选地,所述事件包括会议或通话。
根据本发明的另一个实施例,提供一种数据的处理装置,包括:直接紧密度确定模块,用于根据第一实体和第二实体之间的各直接关系及其对应的关联因子确定所述第一实体和所述第二实体之间的直接紧密度;间接关系建立模块,用于根据与所述第一实体和所述第二实体相关联的同一事件建立所述第一实体和所述第二实体之间的间接关系,间接紧密度确定模块,用于根据所述第一实体和所述第二实体之间的各所述间接关系及其对应的关联因子确定所述第一实体和所述第二实体之间的间接紧密度;综合紧密度确定模块,用于根据所述直接紧密度和/或所述间接紧密度计算所述第一实体和所述第二实体之间的综合紧密度。
可选地,所述直接关系的关联因子包括所述直接关系对应的权值和/或所述直接关系发生的次数;所述间接关系的关联因子包括所述间接关系对应的权值和/或所述间接关系发生的次数。
可选地,该装置还包括:数据提取模块,用于从结构化数据中提取所述第一实体、所述第二实体、所述直接关系、所述间接关系和所述事件,所述结构化数据中包括对象和连接以及不同对象之间的连接,所述对象为实体或事件,所述连接具有所述权值,所述权值是可配置的,所述直接关系对应所述第一实体和所述第二实体之间的连接,所述间接关系包括所述第一实体与所述同一事件之间的连接以及所述第二实体与所述同一事件之间的连接。
可选地,所述直接紧密度确定模块将各所述直接关系对应的权值与所述直接关系发生的次数相乘后加权求和以确定所述直接紧密度。
可选地,所述间接紧密度确定模块将各所述间接关系中包括的连接的权值与所述连接发生的次数相乘后加权求和以确定所述间接紧密度。
可选地,所述综合紧密度确定模块对所述直接紧密度和所述间接紧密度加权求和获取所述综合紧密度。
根据本发明的又一个实施例,提供一种数据的处理装置,包括:存储器以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行上述任一个实施例中所述的数据的处理方法。
根据本发明的又一个实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中所述的数据的处理方法。
本发明的一个优点在于,通过建立实体之间的间接关系,计算间接关系的紧密度,并根据直接关系的紧密度和间接关系的紧密度获取实体之间综合紧密度。从而扩展了实体之间的关系网络,定量描述了实体之间的关系,能够准确、全面地反映实体之间关联。
附图说明
构成说明书的一部分的附图描述了本发明的实施例,并且连同说明书一起用于解释本发明的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
图1示出本发明的数据的处理方法的一个实施例的流程图。
图2示出了结构化数据的一个实施例的示意图。
图3示出本发明的数据的处理装置的一个实施例的结构图。
图4示出本发明的数据的处理装置的另一个实施例的结构图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1示出本发明的数据的处理方法的一个实施例的流程图。
如图1所示,在步骤110中,根据第一实体和第二实体之间的各直接关系及其对应的关联因子确定第一实体和第二实体之间的直接紧密度。
例如,实体可以是人、机构等对象;直接关系可以是同事关系、亲属关系、同学关系或隶属关系等;直接关系的关联因子可以是直接关系对应的权值或直接关系发生的次数中的至少一项。直接关系发生的次数可以例如是两个人在不同阶段(小学、中学、大学等)多次作为同学,或者在多个单位均是同事关系等;直接关系对应的权值可以基于关系的紧密程度根据实际情况配置,也可以基于大量数据通过机器学习的方式获得。
在步骤120中,根据与第一实体和第二实体相关联的同一事件建立第一实体和第二实体之间的间接关系。
例如,事件可以是通话、短信或者即时讯息,也可以是学术会议、演出、比赛等社会活动或团体活动。例如,两个人A和B均参加了同一次比赛,则可以通过事件:比赛建立实体A和B之间的间接关系。
在步骤130中,根据第一实体和第二实体之间的各间接关系及其对应的关联因子确定第一实体和第二实体之间的间接紧密度。
例如,间接关系的关联因子可以是间接关系对应的权值或间接关系发生的次数中的至少一项。间接关系发生的次数可以例如是实体A和B之间进行了多次通话等;间接关系对应的权值可以基于关系的紧密程度根据实际情况配置,也可以基于大量数据通过机器学习的方式获得。
在步骤140中,根据直接紧密度和/或间接紧密度计算第一实体和第二实体之间的综合紧密度。例如,对直接紧密度和间接紧密度加权求和获取综合紧密度。
通过步骤110-140可以获取综合紧密度,从而可以在处理海量复杂关系的数据时,快速估算实体对象之间关联的紧密程度,进而为随后的图聚类、路径发现、关系挖掘和分析提供可靠的数据基础。
在一个实施例中,可以从结构化数据中提取第一实体、第二实体、直接关系、间接关系和事件。结构化数据中包括对象和连接以及不同对象之间的连接,对象为实体或事件,连接具有权值,权值是可配置的。
图2示出了结构化数据的一个实施例的示意图。
如图2所示的结构化数据描述了这样一个事实:张三和李四既是同事又是亲属,张三给李四打过电话,他们参加过同一个学术会议,而且张三向该学术会议投过稿,李四是该学术会议的审稿人。
如图2所示的结构化数据中包括:两种实体对象,“张三”和“李四”,分别代表两个不同的人;两种事件对象,“通话”和“学术会议”;七种连接,“同事”、“亲属”、“主叫”、“被叫”、“参加”、“投稿”和“审稿”。
例如,可以根据连接代表的关系的紧密程度设定各连接对应的权值,关系越紧密权值可以越大。例如,上述各连接对应的权值可以配置为:“同事”的权值为30,“亲属”的权值为35,“主叫”的权值为3,“被叫”的权值为2,“参加”的权值为10,“投稿”的权值为7,“审稿”的权值为12。也可以基于大量数据通过机器学习的方式获得连接对应的权值。
在一个实施例中,直接关系可以对应第一实体和第二实体之间的连接;间接关系可以包括第一实体与同一事件之间的连接以及第二实体与同一事件之间的连接。
例如,如图2所示,“张三”和“李四”两个实体对象之间具有两个连接,“同事”和“亲属”。即,“张三”和“李四”具有两种直接关系,分别对应连接“同事”和“亲属”。
例如,如图2所示,实体对象“张三”和“李四”分别通过连接“主叫”和“被叫”与事件对象“通话”关联在一起;“张三”和“李四”还分别通过连接“参加”、“投稿”和“审稿”与事件对象“学术会议”关联在一起。即,“张三”和“李四”具有两种间接关系,分别包含连接“主叫”和“被叫”以及“参加”(张三、李四各一次)、“投稿”和“审稿”。这样可以通过事件将各实体联系起来,扩展实体之间的联系网络,从而全面地反映数据之间的关联。
在一个实施例中,可以将各直接关系对应的权值与直接关系发生的次数相乘后加权求和以确定直接紧密度。
例如,可以通过公式:
Figure BDA0001478577630000071
来计算实体A和B之间的直接紧密度wAB。L为实体A和B的之间连接类型的个数,wi为实体A和B之间第i种连接的权值,ni为第i种连接发生的次数。例如,根据图2所示的实施例,可以计算实体对象“张三”和“李四”之间的直接紧密度wAB=1×30+1×35=65。
在一个实施例中,将各间接关系中包括的连接的权值与连接发生的次数相乘后加权求和以确定间接紧密度。
例如,可以通过公式:
Figure BDA0001478577630000072
来计算实体A和B之间的间接紧密度w′AB。I为实体A和B的间接关系中包含的事件类型的数量,mi为i类型事件发生的次数,li是i类型事件的连接类型的数量,mAik是实体A和事件vij(第j次出现的i类型事件)之间的第k种连接出现的次数,wik是i类型事件的第k种连接的权值,nBik是实体B和事件vij的第k种连接出现的次数。
例如,事件对象“通话”具有的2种连接类型的权值可以设置如下:
主叫:w11=3
被叫:w12=2
事件对象“学术会议”具有的3种连接类型的权值可以设置如下:
投稿:w21=7
参加:w22=10
审稿:w23=12
基于上述权值,在图2所示的实施例中,实体A“张三”和实体B“李四”之间共通话3次,实体A“张三”共向学术会议投稿2篇,参加该会议1次,B担任审稿人1次,参加该会议2次,那么实体对象“张三”和“李四”之间的间接紧密度w′AB=3×(3+2)+(7×2+10+12+10×2)=15+(14+10+14+20)=71
在一个实施例中,可以根据实际情况对得到的wAB和w′AB进行加权后求和。例如,相对于直接紧密度而言,间接紧密度的重要性较弱,则可以将w′AB除以2作为最终的间接紧密度。例如,可以获得实体A和实体B之间的综合紧密度为65+71/2=100.5。这样就可以根据关系的紧密程度,将数据之间的关联进行量化,从而准确地反映数据之间的关系。
上述实施例中,通过建立实体之间的间接关系,计算间接关系的紧密度,并根据直接关系的紧密度和间接关系的紧密度获取实体之间综合紧密度。从而扩展了实体之间的关系网络,定量描述了实体之间的关系,能够准确、全面地反映实体之间关联。
图3示出本发明的数据的处理装置的一个实施例的结构图。
如图3所示,该装置包括:直接紧密度确定模块31、间接关系建立模块32、间接紧密度确定模块33和综合紧密度确定模块34。
直接紧密度确定模块31根据第一实体和第二实体之间的各直接关系及其对应的关联因子确定第一实体和第二实体之间的直接紧密度。例如,直接关系的关联因子包括直接关系对应的权值和/或直接关系发生的次数。
在一个实施例中,直接紧密度确定模块31将各直接关系对应的权值与直接关系发生的次数相乘后加权求和以确定直接紧密度。
间接关系建立模块32根据与第一实体和第二实体相关联的同一事件建立第一实体和第二实体之间的间接关系。
间接紧密度确定模块33根据第一实体和第二实体之间的各间接关系及其对应的关联因子确定第一实体和第二实体之间的间接紧密度。例如,间接关系的关联因子包括间接关系对应的权值和/或间接关系发生的次数。
在一个实施例中,间接紧密度确定模块将各间接关系中包括的连接的权值与连接发生的次数相乘后加权求和以确定间接紧密度。
在一个实施例中,该装置还包括数据提取模块35。数据提取模块35从结构化数据中提取第一实体、第二实体、直接关系、间接关系和事件。
例如,结构化数据中可以包括对象和连接以及不同对象之间的连接,对象为实体或事件,连接具有权值,权值是可配置的。直接关系对应第一实体和第二实体之间的连接。间接关系可以包括第一实体与同一事件之间的连接以及第二实体与同一事件之间的连接。
综合紧密度确定模块34根据直接紧密度和/或间接紧密度计算第一实体和第二实体之间的综合紧密度。例如,综合紧密度确定模块34对直接紧密度和间接紧密度加权求和获取综合紧密度。
上述实施例中,通过建立实体之间的间接关系,计算间接关系的紧密度,并根据直接关系的紧密度和间接关系的紧密度获取实体之间综合紧密度。从而扩展了实体之间的关系网络,定量描述了实体之间的关系,能够准确、全面地反映实体之间关联。
图4示出本发明的数据的处理装置的另一个实施例的结构图。
如图4所示,该实施例的装置40包括:存储器41以及耦接至该存储器41的处理器42,处理器42被配置为基于存储在存储器41中的指令,执行本发明中任意一个实施例中的数据的处理方法。
其中,存储器41例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。
本领域内的技术人员应当明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
至此,已经详细描述了根据本发明的数据的处理方法、装置和计算机可读存储介质。为了避免遮蔽本发明的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求限定。

Claims (15)

1.一种数据的处理方法,包括:
从结构化的自然语言数据中提取第一实体、第二实体、直接关系、间接关系和事件,所述自然语言数据为人物目标或机构目标的相关数据,所述第一实体和所述第二实体为不同的人物目标或机构目标,所述直接关系包括不同的人物目标或机构目标之间的亲属关系、隶属关系,所述事件包括通话事件、短信事件、即时讯息事件、团体事件;
根据所述第一实体和所述第二实体之间的各直接关系及其对应的关联因子确定所述第一实体和所述第二实体之间的直接紧密度;
根据与所述第一实体和所述第二实体相关联的同一事件建立所述第一实体和所述第二实体之间的间接关系;
根据所述第一实体和所述第二实体之间的各所述间接关系及其对应的关联因子确定所述第一实体和所述第二实体之间的间接紧密度;
根据所述直接紧密度和/或所述间接紧密度计算所述第一实体和所述第二实体之间的综合紧密度,以评估不同的人物目标或机构目标之间关联程度;
所述直接关系的关联因子包括根据大数据通过机器学习确定的所述直接关系对应的权值,所述间接关系的关联因子包括根据大数据通过机器学习确定的所述间接关系对应的权值。
2.根据权利要求1所述的处理方法,其中,
所述直接关系的关联因子包括所述直接关系发生的次数;
所述间接关系的关联因子包括所述间接关系发生的次数。
3.根据权利要求2所述的处理方法,还包括:
所述结构化数据中包括对象和连接以及不同对象之间的连接,所述对象为实体或事件,所述连接具有所述权值,所述权值是可配置的,
所述直接关系对应所述第一实体和所述第二实体之间的连接,
所述间接关系包括所述第一实体与所述同一事件之间的连接以及所述第二实体与所述同一事件之间的连接。
4.根据权利要求2或3所述的处理方法,其中,所述确定所述第一实体和所述第二实体之间的直接紧密度包括:
将各所述直接关系对应的权值与所述直接关系发生的次数相乘后加权求和以确定所述直接紧密度。
5.根据权利要求3所述的处理方法,其中,所述确定所述第一实体和所述第二实体之间的间接紧密度包括:
将各所述间接关系中包括的连接的权值与所述连接发生的次数相乘后加权求和以确定所述间接紧密度。
6.根据权利要求1-3任一项所述的处理方法,其中,所述计算所述第一实体和所述第二实体之间的综合紧密度包括:
对所述直接紧密度和所述间接紧密度加权求和获取所述综合紧密度。
7.根据权利要求1-3任一项所述的处理方法,其中,所述事件包括社会活动、团体活动、通话、短信或即时讯息。
8.一种数据的处理装置,包括:
数据提取模块,用于从结构化的自然语言数据中提取第一实体、第二实体、直接关系、间接关系和事件,所述自然语言数据为人物目标或机构目标的相关数据,所述第一实体和所述第二实体为不同的人物目标或机构目标,所述直接关系包括不同的人物目标或机构目标之间的亲属关系、隶属关系,所述事件包括通话事件、短信事件、即时讯息事件、团体事件;
直接紧密度确定模块,用于根据所述第一实体和所述第二实体之间的各直接关系及其对应的关联因子确定所述第一实体和所述第二实体之间的直接紧密度;
间接关系建立模块,用于根据与所述第一实体和所述第二实体相关联的同一事件建立所述第一实体和所述第二实体之间的间接关系;
间接紧密度确定模块,用于根据所述第一实体和所述第二实体之间的各所述间接关系及其对应的关联因子确定所述第一实体和所述第二实体之间的间接紧密度;
综合紧密度确定模块,用于根据所述直接紧密度和/或所述间接紧密度计算所述第一实体和所述第二实体之间的综合紧密度,以评估不同的人物目标或机构目标之间关联程度;
所述直接关系的关联因子包括根据大数据通过机器学习确定的所述直接关系对应的权值,所述间接关系的关联因子包括根据大数据通过机器学习确定的所述间接关系对应的权值。
9.根据权利要求8所述的处理装置,其中,
所述直接关系的关联因子包括所述直接关系发生的次数;
所述间接关系的关联因子包括所述间接关系发生的次数。
10.根据权利要求9所述的处理装置,还包括:
所述结构化数据中包括对象和连接以及不同对象之间的连接,所述对象为实体或事件,所述连接具有所述权值,所述权值是可配置的,
所述直接关系对应所述第一实体和所述第二实体之间的连接,
所述间接关系包括所述第一实体与所述同一事件之间的连接以及所述第二实体与所述同一事件之间的连接。
11.根据权利要求9或10任一项所述的处理装置,其中,
所述直接紧密度确定模块将各所述直接关系对应的权值与所述直接关系发生的次数相乘后加权求和以确定所述直接紧密度。
12.根据权利要求10所述的处理装置,其中,
所述间接紧密度确定模块将各所述间接关系中包括的连接的权值与所述连接发生的次数相乘后加权求和以确定所述间接紧密度。
13.根据权利要求8-10任一项所述的处理装置,其中,
所述综合紧密度确定模块对所述直接紧密度和所述间接紧密度加权求和获取所述综合紧密度。
14.一种数据的处理装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行如权利要求1-7中任一项所述的数据的处理方法。
15.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-7中任一项所述的数据的处理方法。
CN201711177876.3A 2017-11-23 2017-11-23 数据的处理方法、装置和计算机可读存储介质 Active CN107943935B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711177876.3A CN107943935B (zh) 2017-11-23 2017-11-23 数据的处理方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711177876.3A CN107943935B (zh) 2017-11-23 2017-11-23 数据的处理方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN107943935A CN107943935A (zh) 2018-04-20
CN107943935B true CN107943935B (zh) 2021-02-02

Family

ID=61929962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711177876.3A Active CN107943935B (zh) 2017-11-23 2017-11-23 数据的处理方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN107943935B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109560981A (zh) * 2018-07-04 2019-04-02 蔚来汽车有限公司 确定节点关联度的方法和设备、计算机存储介质
CN109753600A (zh) * 2018-12-20 2019-05-14 航天信息股份有限公司 处理咨询问题的方法、装置和存储介质
CN109885627A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种神经网络训练实体间关系的方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003017096A1 (en) * 2001-08-14 2003-02-27 Humana Inc Web-based security with controlled access to data and resources
CN101427219A (zh) * 2006-04-21 2009-05-06 微软公司 基于模型的事件处理
CN101453472A (zh) * 2005-11-09 2009-06-10 华为技术有限公司 关系信息的公开、获取方法及系统
CN101751574A (zh) * 2008-12-09 2010-06-23 索尼株式会社 图像处理设备、成像装置、成像处理方法和程序
CN102622363A (zh) * 2011-01-28 2012-08-01 鸿富锦精密工业(深圳)有限公司 关联词汇搜索系统及方法
CN102821261A (zh) * 2011-06-07 2012-12-12 索尼公司 显示设备、对象显示方法和程序
CN102880623A (zh) * 2011-07-13 2013-01-16 富士通株式会社 同名人物搜索方法及系统
CN104202319A (zh) * 2014-08-28 2014-12-10 北京淘友天下科技发展有限公司 一种社交关系推荐方法及装置
JP2015201073A (ja) * 2014-04-09 2015-11-12 日本電信電話株式会社 情報アクセス制御システム、情報共有サーバ、情報アクセス制御方法及びプログラム
CN105376223A (zh) * 2015-11-02 2016-03-02 北京锐安科技有限公司 网络身份关系的可靠度计算方法
CN106776535A (zh) * 2016-11-16 2017-05-31 金陵科技学院 基于二阶段句法剖析的科技文献细粒度关系挖掘方法
CN106844426A (zh) * 2016-12-09 2017-06-13 中电科华云信息技术有限公司 基于随机游走人员亲密度的计算系统及方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003017096A1 (en) * 2001-08-14 2003-02-27 Humana Inc Web-based security with controlled access to data and resources
CN101453472A (zh) * 2005-11-09 2009-06-10 华为技术有限公司 关系信息的公开、获取方法及系统
CN101427219A (zh) * 2006-04-21 2009-05-06 微软公司 基于模型的事件处理
CN101751574A (zh) * 2008-12-09 2010-06-23 索尼株式会社 图像处理设备、成像装置、成像处理方法和程序
CN102622363A (zh) * 2011-01-28 2012-08-01 鸿富锦精密工业(深圳)有限公司 关联词汇搜索系统及方法
CN102821261A (zh) * 2011-06-07 2012-12-12 索尼公司 显示设备、对象显示方法和程序
CN102880623A (zh) * 2011-07-13 2013-01-16 富士通株式会社 同名人物搜索方法及系统
JP2015201073A (ja) * 2014-04-09 2015-11-12 日本電信電話株式会社 情報アクセス制御システム、情報共有サーバ、情報アクセス制御方法及びプログラム
CN104202319A (zh) * 2014-08-28 2014-12-10 北京淘友天下科技发展有限公司 一种社交关系推荐方法及装置
CN105376223A (zh) * 2015-11-02 2016-03-02 北京锐安科技有限公司 网络身份关系的可靠度计算方法
CN106776535A (zh) * 2016-11-16 2017-05-31 金陵科技学院 基于二阶段句法剖析的科技文献细粒度关系挖掘方法
CN106844426A (zh) * 2016-12-09 2017-06-13 中电科华云信息技术有限公司 基于随机游走人员亲密度的计算系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"智慧搜索中的实体与关联关系建模与挖掘";王晓阳 等;《通信学报》;20151225;第36卷(第12期);第17-27页 *
"面向关联数据的联合式实体识别方法";孙琛琛 等;《计算机学报》;20150915;第38卷(第9期);第1739-1754页 *
"面向社会媒体搜索的实体关系建模研究综述";王大玲 等;《计算机学报》;20151026;第39卷(第4期);第657-674页 *

Also Published As

Publication number Publication date
CN107943935A (zh) 2018-04-20

Similar Documents

Publication Publication Date Title
CN110032641B (zh) 计算机执行的、利用神经网络进行事件抽取的方法及装置
CN109918454B (zh) 对关系网络图进行节点嵌入的方法及装置
CA2870202C (en) Creating social network groups
CN107943935B (zh) 数据的处理方法、装置和计算机可读存储介质
CN110147427B (zh) 项目案件推送方法以及装置
US11449766B2 (en) Invitation behavior prediction method and apparatus, and storage medium
US10673979B2 (en) User data sharing method and device
CN110599312A (zh) 基于信用的交互信用评估方法以及装置
Shen et al. How gullible are you? Predicting susceptibility to fake news
Joshi et al. Political issue extraction model: A novel hierarchical topic model that uses tweets by political and non-political authors
CN109614464A (zh) 用于业务问题识别的方法及装置
CN111105064A (zh) 确定欺诈事件的嫌疑信息的方法及装置
CN109615458A (zh) 客户管理方法、装置、终端设备及计算机可读存储介质
Thuzar Human security and development in Myanmar: Issues and implications
TWI522939B (zh) 事件整合方法及系統
Lee et al. Measuring user influence, susceptibility and cynicalness in sentiment diffusion
CN110232148A (zh) 项目推荐系统、方法以及装置
CN110046233A (zh) 问题派发方法及装置
CN113010664B (zh) 一种数据处理方法、装置及计算机设备
US11907269B2 (en) Detecting non-obvious relationships between entities from visual data sources
CN108062379B (zh) 数据处理方法、平台、装置和计算机可读存储介质
CN111242792A (zh) 任务处理方法以及装置
CN110956140A (zh) 图像信息提取方法以及装置
Dudas et al. Little data, big stories: Taking the pulse of large-scaled events on twitter
Fegan-Wyles Delivering as One: Could it help the 2030 SDG Agenda?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant