CN103150350B - 一种构建关系网络的方法和装置 - Google Patents

一种构建关系网络的方法和装置 Download PDF

Info

Publication number
CN103150350B
CN103150350B CN201310052203.0A CN201310052203A CN103150350B CN 103150350 B CN103150350 B CN 103150350B CN 201310052203 A CN201310052203 A CN 201310052203A CN 103150350 B CN103150350 B CN 103150350B
Authority
CN
China
Prior art keywords
degree
relationship
regions
closeness
areas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310052203.0A
Other languages
English (en)
Other versions
CN103150350A (zh
Inventor
李蕾
王骏
王明印
赵开明
吴晨生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Beijing University of Posts and Telecommunications
Original Assignee
BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE, Beijing University of Posts and Telecommunications filed Critical BEIJING SCIENCE AND TECHNOLOGY INFORMATION INSTITUTE
Priority to CN201310052203.0A priority Critical patent/CN103150350B/zh
Publication of CN103150350A publication Critical patent/CN103150350A/zh
Application granted granted Critical
Publication of CN103150350B publication Critical patent/CN103150350B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种构建关系网络的方法和装置,技术方案为:对所有样本文本进行分析,统计任意两个区域名称共同出现的样本文本数、该两个区域均未出现的样本文本数、以及该两个区域名称中仅一个区域名称出现的样本文本数,根据统计结果确定该两个区域之间的紧密程度和主从程度;从所有样本文本中提取包含所述任意两个区域名称的完整语句,对提取的每个完整语句进行句法分析,根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度;根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间的关系。本发明能够提高国际关系计算的准确性。

Description

一种构建关系网络的方法和装置
技术领域
本申请涉及信息检索技术领域,特别涉及一种构建关系网络的方法和装置。
背景技术
国际关系网络是随着当今网络时代兴起,用以研究分析国际关系以及国家实体之间行为互动的一种新方法。国际关系网络通过网络的形式来表现国家及国家之间的关系,将国际关系以一个清晰、直观的网络图形式展现给用户。在国际关系网络中,复杂的国际关系被抽象成由点和边构成的网络,其中,点代表国家,边代表国家之间的关系,例如贸易关系、外交关系等。
传统的国际关系网络主要采用诸如JUNG(JavaUniversalNetwork/Graph),prefuse等网络可视化软件,将得到的国家及国家关系高度抽象,抛弃实际的国家地理位置信息,构造出类似于图1所示的国际关系网络,在图1所示的国际关系网络中,点代表国家,点之间的连线表示连线连接的两个国家之间的贸易关系,不关注国家所处的实际地理位置以及国家之间的远近关系,点的绝对位置以及远近相对位置与国家的实际地理位置并无联系。
然而,国家地理位置以及国家之间的远近关系在国际关系中有着不可忽视的作用,以贸易网络为例,起到交通枢纽作用的一般都是地理位置居于东西方之间十字路口的国家。因此,在构建国际关系网络,特别是在将国际关系网络可视化时,应当考虑地理位置信息,将国际关系网络与地图地理信息结合起来,以便更加全面充分的展示网络信息,利用地图良好的空间认知和信息辅助能力,简化认知过程,提高用户对于国际关系的认知效率。
法新社已于2012年推出的e-diplomacy系统,该系统在一定程度上实现了基于地理位置的国际关系网络可视化。在该系统中,选择MAP界面,再选定单个或两个国家,就可以在世界地图底板上显示出与选定国家有关系的国家和国际组织,并通过深浅不同的连接线表示关系的强弱。该系统的缺点是不能显示出完整的国际关系网络。
另外,无论是传统的国际关系网络,还是法新社推出的e-diplomacy系统,均没有对国际关系进行分类,只是以紧密程度来进行区分。然而,紧密程度并不能确切的表示国家之间的关系,例如,有些国家因为相互敌对而具有较高的紧密程度,有些国家则因为相互友好而具有较高的紧密程度,如果不对这些敌对性质和友好性质进行区分,将难以通过国际关系网络准确的表示国家之间的关系。
发明内容
有鉴于此,本发明的目的在于提供一种构建关系网络的方法,该方法能够提高国际关系计算的准确性。
为实现上述目的,本发明提供的技术方案为:
一种构建关系网络的方法,该方法包括:
对所有样本文本进行分析,统计任意两个区域名称共同出现的样本文本数、该两个区域名称均未出现的样本文本数、该两个区域名称各自出现的样本文本数、以及该两个区域名称中仅一个区域名称出现的样本文本数,根据统计结果确定该两个区域之间的紧密程度和主从程度;
从所有样本文本中提取包含所述任意两个区域名称的完整语句,对提取的每个完整语句进行句法分析,根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度;
根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间的关系。
一种构建关系网络的装置,该装置包括:存储单元,统计单元、语句分析单元、关系确定单元;
所述存储单元,用于存储样本文本;用于存储预先设置的情感词典;
所述统计单元,用于对所有样本文本进行分析,统计任意两个区域名称共同出现的样本文本数、该两个区域名称均未出现的样本文本数、该两个区域名称各自出现的样本文本数、以及该两个区域名称中仅一个区域名称出现的样本文本数,根据统计结果确定该两个区域之间的紧密程度和主从程度;
所述语句分析单元,用于从所有样本文本中提取包含所述任意两个区域名称的完整语句,对提取的每个完整语句进行句法分析,根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度;
所述关系确定单元,用于根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间的关系。
综上所述,本发明中通过对样本文本进行分析,统计各区域名称在样本文本中的出现情况确定各区域与其它区域之间的紧密程度、主从关系,并根据预设情感词典对样本文本进行基于完整语句的句法分析,确定各区域与其它区域之间的友好程度,根据所述紧密程度、主从程度和友好程度确定各区域与其它区域之间的关系。当所述区域以国家为单位划分时,应用本发明,可以提高国际关系计算的准确性。
附图说明
图1是现有技术实现的国际关系网络示意;
图2是本发明实施例构建关系网络的方法流程图;
图3是本发明实施例句法分析结果示意图;
图4是本发明实施例实现关系网络可视化的系统架构图;
图5是本发明实施例构建关系网络的装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。
本发明实施例中,以国家为单位进行区域划分,区域之间的关系也即是国际关系。
将区域之间的关系分为五种:对立关系、中立关系、冲突关系、合作关系、主从关系。其中,
对立关系:表明两个区域之间联系不紧密,具有对立关系的两个区域的名称很少出现在同一网页或其它类型的文本中,例如美国和古巴这两个国家的名称就很少出现在同一文本中。
中立关系:表明两个区域之间联系不紧密也不冷淡,紧密程度稍大于具有对立关系的区域之间的紧密程度。
冲突关系:表明两个区域之间联系较为紧密,但是这种紧密关系却是因为争端存在而形成的,例如,美国攻打伊拉克,这两个国家的名称因为战争而经常出现在同一网页或其它类型的文本中。
合作关系:表明两个区域之间联系较为紧密,其紧密关系是因为在相互交往过程中的友好合作而经常出现在同一网页或其它类型的文本中,而且,这两个区域在相互交往中彼此地位平等。
主从关系:表明两个区域之间联系较为紧密,其紧密关系是因为在相互交往过程中的合作而经常出现在同一网页或其它类型的文本中,但是,这两个区域在相互交往中彼此地位不平等。
本发明实施例中,为了区分区域之间的友好和冲突关系,预先设置情感词典,基于上述各种区域关系的特点,通过对大量样本文本内容进行分析确定两个区域之间的紧密程度、主从程度、以及友好程度,根据分析结果确定两个区域之间的关系。
参见图2,图2是本发明实施例构建关系网络的方法流程图,主要包括以下步骤:
步骤201、对所有样本文本进行分析,统计任意两个区域名称共同出现的样本文本数、该两个区域名称均未出现的样本文本数、该两个区域名称各自出现的样本文本数、以及该两个区域名称中仅一个区域名称出现的样本文本数,根据统计结果确定该两个区域之间的紧密程度和主从程度。
为了分析两个区域之间的关系,需要预先获取大量用于分析两个区域之间的关系的样本文本,这些样本文本可以从互联网中获取,例如,以国家为单位划分区域,下载国际新闻相关的网页,将网页内容作为待分析样本文本。
本发明实施例中,根据两个区域名称共同出现的样本文本数、均未出现的样本文本数、该两个区域名称各自出现的样本文本数、以及仅其中一个区域名称出现的样本文本数确定该两个区域之间的紧密程度和主从程度,其中,
采用公式一计算两个区域之间的紧密程度:
Cdg = N c 1 ∩ c 2 × N c 1 ∪ c 2 ‾ - N c 1 - c 2 × N c 2 - c 1 ( N c 1 ∩ c 2 + N c 1 - c 2 ) × ( N c 2 - c 1 + N c 1 ∪ c 2 ‾ ) × ( N c 1 ∩ c 2 + N c 2 - c 1 ) × ( N c 1 - c 2 + N c 1 ∪ c 2 ‾ ) ; (公式一)
采用公式二计算两个区域之间的主从程度:
Mdg = N c 1 ∩ c 2 N c 1 - N c 1 ∩ c 2 N c 2 ; (公式二)
在上述公式一和公式二中,c1、c2分别表示该两个区域;
Cdg表示该两个区域的紧密程度;
Mdg表示该两个区域的主从程度;
Nc1表示区域c1的名称出现的样本文本数;
Nc2表示区域c2的名称出现的样本文本数;
Nc1-c2表示区域c1的名称出现且区域c2的名称未出现的样本文本数;
Nc2-c1表示区域c2的名称出现且区域c1的名称未出现的样本文本数;
Nc1∩c2表示该两个区域名称共同出现的样本文本数;
表示该两个区域名称均未出现的样本文本数。
步骤202、从所有样本文本中提取包含所述任意两个区域名称的完整语句,对提取的每个完整语句进行句法分析,根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度。
在实际应用中,如果两个区域名称同时出现在一个完整语句中,则可以通过对该完整语句进行句法分析,根据句法分析结果得到用于连接两个区域名称的词语,根据连接这两个区域名称的词语的情感色彩就可以推断两个区域之间的友好或冲突关系。例如,在“美国和英国两国联军出兵伊拉克。”,对于这一语句,可以通过句法分析得到如图3所示的句法分析结果示意图,从图3可以看出,(美国,英国)这一区域对,由“联军”一词连接,而(美国,伊拉克)和(英国,伊拉克)这两个区域对则均是由“出兵”一词连接,确定连接词的方法是从国家所在叶子节点向根节点回溯,两个分支的第一个交点就是连接两个国家的节点。“联军”在用于评判这两个区域之间的关系时具有积极情感,因此可以推断美国和英国是友好关系,而“出兵”在用于评判这两个区域之间的关系时具有消极情感,因此可以推断美国与伊拉克,以及英国与伊拉克均是冲突关系。实际上,在上述语句中,“美国和英国”作为主语、“出兵”作为谓语,“伊拉克”作为宾语,也说明了美国和英国属于友好关系,而根据“出兵”可以看出主语和宾语之间属于冲突关系。另外,还可以根据两个区域名称出现在情感词的同一侧或不同侧来确定两个区域是否友好,如果出现在同一侧,则说明两个区域是友好关系,如果出现在不同侧,则可根据位于两个区域中间的情感词的情感色彩确定是否友好,例如,若情感词具有积极情感,则说明两个区域友好,若情感词是消极情感,则说明两个区域不友好。
因此,本发明实施例中,对于出现在同一完整语句中的两个区域名称之间,可以通过句法分析,并基于预设的情感词典确定两个区域之间在该语句中表现出的友好程度,进而对该两个区域之间的友好程度进行加权计算。为此,在情感词典中,除了包括情感词外,还包括情感词对应的情感加权值,如果情感词表示的是积极情感,则相应的情感加权值是正值,如果情感词表示的是消极情感,则相应的情感加权值是负值。情感词典中的各情感词对应的情感加权值可以根据实际情况预先设定。
当一个完整语句中包含有某两个区域名称时,可以对该完整语句进行句法分析,根据句法分析结果确定该两个区域名称之间的连接词,根据预设情感词典确定该连接词的情感加权值,使用该连接词的情感加权值对该两个区域之间的友好程度进行加权计算。这样,对所有样本文本中包含某两个区域名称的完整语句进行句法分析并根据句法分析结果以及预设情感词典进行加权计算后,就确定该两个区域之间的友好程度。
需要说明的是,本实施例中提到的完整语句是通过句号或感叹号分割的语句,所述句法分析采用现有技术,例如,语言技术平台(LanguageTechnologyPlatform,LTP)。
步骤203、根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间的关系。
根据两个区域之间的紧密程度、主从程度、以及友好程度,可以确定该两个区域之间的关系,具体包括:
如果该两个区域之间的紧密程度小于第一预设紧密程度阈值,则确定该两个区域之间是对立关系;
如果该两个区域之间的紧密程度大于或等于第一预设紧密程度阈值且小于第二预设紧密程度阈值,则确定该两个区域之间是中立关系;
如果该两个区域之间的紧密程度大于或等于第二预设紧密程度,则若该两个区域之间的友好程度小于预设友好阈值,则确定该两个区域之间是冲突关系;若该两个区域之间的友好程度大于或等于预设友好阈值,则当该两个区域之间的主从程度的绝对值小于预设主从程度阈值时,确定该两个区域之间是合作关系,当该两个区域之间的主从程度的绝对值大于或等于预设主从程度阈值时,确定该两个区域之间是主从关系。
图2所示本发明实施例中,为了让用户更加清晰、直观的了解各个区域与其它区域间的关系,可以将区域关系网络可视化。
将区域关系网络可视化,首先要配置地图底板信息,并提供针对区域的查询服务,以及针对各类区域关系的查询服务。
当用户需要查看某个区域、多个区域、或所有区域的区域关系时,可以发送查询类型是区域查询的关系查询请求,服务设备接收到该关系查询请求后,可以在预先配置的地图底板上标注查询请求中的每个区域与其它区域间的关系。
当用户需要查看某一种区域关系、多种区域关系、或全部区域关系时,可以发送查询类型是关系查询的关系查询请求,服务设备接收到该关系查询请求后,针对查询请求中的任一关系,确定具有该关系的所有区域对,根据确定的区域对在预先配置地图底板上标注该关系。
可以使用不同颜色的连线标注不同的区域关系,例如,在两个区域之间使用红色连线表示该两个区域是合作关系,黑色连线表示冲突关系。
上述区域关系网络可视化的具体实现中,可以使用GoogleMapsAPI实现地图底板配置,GoogleMapsAPI是Google为程序开发人员提供的Maps编程API,允许开发者在不必建立自己的地图服务器的情况下,将GoogleMaps地图数据嵌入到网站之中,从而实现嵌入GoogleMaps的地图服务应用,并借助GoogleMaps的地图数据为用户提供位置服务。
在系统架构方面,可采用三层的B/S体系结构,以浏览器作为客户端运行平台,将应用程序的开发、维护和更新放在中间层的应用服务器上,而将数据库的管理和维护放在数据库服务器上,形成一个由客户层、中间应用层和数据层组成的三层体系结构。如图4所示,底层的数据层是数据库,存储区域之间的关系信息,采用MySQL实现;中间层即业务逻辑层,由Web服务层和GoogleMaps服务层组成,由IIS作为Web服务器;客户层即用户浏览器。服务器端在ASP.NET平台下开发,利用GoogleMapsAPI创建和配置WEBGIS应用程序和服务的框架。客户端采用AJAX技术,实现客户端的异步数据读取。
由于GoogleMapsAPI除了帮助开发者将GoogleMaps地图数据嵌入到Web应用中之外,还允许开发者利用JavaScript脚本进行应用开发拓展,给地图添加标注和折线及其他地图图层覆盖物和地图,或者响应用户的点击动作,并显示包含内容信息在内的气泡提示窗口,从而使得用户可以很容易地在地图底板上创建各种应用。
因此,在基于图4所示的系统架构并利用GoogleMapsAPI可实现关系网络的可视化,具体地,客户端通过GoogleMapsAPI向GoogleMaps服务器请求,将Google地图地板载入浏览器中。当用户发出查询类型是区域查询或关系查询的关系查询请求到web服务器时,Web服务器从已经连接的数据库里面读出相应的数据,传递到Web服务层的后台页面上,用隐藏标签的方法将读出的数据传递到前台页面,再通过GoogleMapsAPI向GoogleMaps服务器请求,然后将具有空间属性的信息显示到Google地图底板中,从而将用户请求的内容在地图底板上显示出来。
在实际应用中,一些区域会被广泛关注,例如美国,另一些区域得到的关注则相对较少。可以通过对所有样本文本进行分析,统计每个区域名称出现的样本文本数,根据该区域名称出现的样本文本数确定该区域的被关注程度。这样,当在预先配置的地图底板上标注关系查询请求中的每个区域与其它区域间的关系时,可以进一步标注该区域的被关注程度,从而使用户了解各个区域的被关注程度。
可以通过某区域在地图底板的相应位置上以数据的形式标注该区域的被关注程度,也可以通过在某区域在地图底板的相应位置上以大小不同的圈标注该区域的被关注程度。
以上对本发明实施例构建关系网络的方法进行了详细说明,本发明还提供了一种构建关系网络的装置,下面结合图5进行详细说明。
参见图5,图5是本发明实施例构建关系网络的装置的结构示意图,该装置包括:存储单元501,统计单元502、语句分析单元503、关系确定单元504;其中,
存储单元501,用于存储样本文本;用于存储预先设置的情感词典;
统计单元502,用于对所有样本文本进行分析,统计任意两个区域名称共同出现的样本文本数、该两个区域名称均未出现的样本文本数、以及该两个区域名称中仅一个区域名称出现的样本文本数,根据统计结果确定该两个区域之间的紧密程度和主从程度;
语句分析单元503,用于从所有样本文本中提取包含所述任意两个区域名称的完整语句,对提取的每个完整语句进行句法分析,根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度;
关系确定单元504,用于根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间的关系。
上述装置中,
所述统计单元502在根据统计结果确定该两个区域之间的紧密程度和主从程度时,用于:
采用以下公式计算该两个区域之间的紧密程度:
Cdg = N c 1 ∩ c 2 × N c 1 ∪ c 2 ‾ - N c 1 - c 2 × N c 2 - c 1 ( N c 1 ∩ c 2 + N c 1 - c 2 ) × ( N c 2 - c 1 + N c 1 ∪ c 2 ‾ ) × ( N c 1 ∩ c 2 + N c 2 - c 1 ) × ( N c 1 - c 2 + N c 1 ∪ c 2 ‾ ) ;
采用以下公式计算该两个区域之间的主从程度:
Mdg = N c 1 ∩ c 2 N c 1 - N c 1 ∩ c 2 N c 2 ;
其中,c1、c2分别表示该两个区域;Cdg表示该两个区域的紧密程度,Mdg表示该两个区域的主从程度;
Nc1表示区域c1的名称出现的样本文本数,Nc2表示区域c2的名称出现的样本文本数;Nc1-c2表示区域c1的名称出现且区域c2的名称未出现的样本文本数,Nc2-c1表示区域c2的名称出现且区域c1的名称未出现的样本文本数;Nc1∩c2表示该两个区域名称共同出现的样本文本数;表示该两个区域名称均未出现的样本文本数。
上述装置中,
所述情感词典中包括多个情感词,每个情感词具有情感加权值;
所述语句分析单元503在根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度时,用于:根据句法分析结果确定该两个区域之间的连接词,根据预设情感词典确定该连接词的情感加权值,使用该连接词的情感加权值对该两个区域之间的友好程度进行加权计算。
上述装置中,
所述关系包括:对立关系、中立关系、冲突关系、合作关系、主从关系;
所述关系确定单元504在根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间的关系时,用于:
如果该两个区域之间的紧密程度小于第一预设紧密程度阈值,则确定该两个区域之间是对立关系;
如果该两个区域之间的紧密程度大于或等于第一预设紧密程度阈值且小于第二预设紧密程度阈值,则确定该两个区域之间是中立关系;
如果该两个区域之间的紧密程度大于或等于第二预设紧密程度,则若该两个区域之间的友好程度小于预设友好阈值,则确定该两个区域之间是冲突关系;若该两个区域之间的友好程度大于或等于预设友好阈值,则当该两个区域之间的主从程度小于预设主从程度阈值时,确定该两个区域之间是合作关系,当该两个区域之间的主从程度大于或等于预设主从程度阈值时,确定该两个区域之间是主从关系。
该装置还包括配置单元505、结果展示单元506;
所述配置单元505,用于预先配置地图底板信息;
所述结果展示单元506,用于接收到关系查询请求,判断查询请求的查询类型,当查询类型是区域查询时,在预先配置的地图底板上标注查询请求中的每个区域与其它区域间的关系;当查询类型是关系查询时,针对查询请求中的任一关系,确定具有该关系的所有区域对,根据确定的区域对在预先配置地图底板上标注该关系。
上述装置中,
所述统计单元502,进一步用于对所有样本文本进行分析,统计每个区域名称出现的样本文本数,根据该区域名称出现的样本文本数确定该区域的被关注程度;
所述结果展示单元506在预先配置的地图底板上标注查询请求中的每个区域与其它区域间的关系时,进一步标注该区域的被关注程度。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种构建关系网络的方法,其特征在于,该方法包括:
对所有样本文本进行分析,统计任意两个区域名称共同出现的样本文本数、该两个区域名称均未出现的样本文本数、该两个区域名称各自出现的样本文本数、以及该两个区域名称中仅一个区域名称出现的样本文本数,根据统计结果确定该两个区域之间的紧密程度和主从程度;
从所有样本文本中提取包含所述任意两个区域名称的完整语句,对提取的每个完整语句进行句法分析,根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度;
根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间的关系;
所述根据统计结果确定该两个区域之间的紧密程度和主从程度的方法为:
采用以下公式计算该两个区域之间的紧密程度:
C d g = N c 1 ∩ c 2 × N c 1 ∪ c 2 ‾ - N c 1 - c 2 × N c 2 - c 1 ( N c 1 ∩ c 2 + N c 1 - c 2 ) × ( N c 2 - c 1 + N c 1 ∪ c 2 ‾ ) × ( N c 1 ∩ c 2 + N c 2 - c 1 ) × ( N c 1 - c 2 + N c 1 ∪ c 2 ‾ ) ;
采用以下公式计算该两个区域之间的主从程度:
M d g = N c 1 ∩ c 2 N c 1 - N c 1 ∩ c 2 N c 2 ;
其中,c1、c2分别表示该两个区域;Cdg表示该两个区域的紧密程度,Mdg表示该两个区域的主从程度;
Nc1表示区域c1的名称出现的样本文本数,Nc2表示区域c2的名称出现的样本文本数;Nc1-c2表示区域c1的名称出现且区域c2的名称未出现的样本文本数,Nc2-c1表示区域c2的名称出现且区域c1的名称未出现的样本文本数;Nc1∩c2表示该两个区域名称共同出现的样本文本数;表示该两个区域名称均未出现的样本文本数。
2.根据权利要求1所述的构建关系网络的方法,其特征在于,
所述情感词典中包括多个情感词,每个情感词具有情感加权值;
根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度的方法为:根据句法分析结果确定该两个区域名称之间的连接词,根据预设情感词典确定该连接词的情感加权值,使用该连接词的情感加权值对该两个区域之间的友好程度进行加权计算。
3.根据权利要求1或2所述的构建关系网络的方法,其特征在于,
所述关系包括:对立关系、中立关系、冲突关系、合作关系、主从关系;
根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间关系的方法为:
如果该两个区域之间的紧密程度小于第一预设紧密程度阈值,则确定该两个区域之间是对立关系;
如果该两个区域之间的紧密程度大于或等于第一预设紧密程度阈值且小于第二预设紧密程度阈值,则确定该两个区域之间是中立关系;
如果该两个区域之间的紧密程度大于或等于第二预设紧密程度,则若该两个区域之间的友好程度小于预设友好阈值,则确定该两个区域之间是冲突关系;若该两个区域之间的友好程度大于或等于预设友好阈值,则当该两个区域之间的主从程度小于预设主从程度阈值时,确定该两个区域之间是合作关系,当该两个区域之间的主从程度大于或等于预设主从程度阈值时,确定该两个区域之间是主从关系。
4.根据权利要求3所述的构建关系网络的方法,其特征在于,
预先配置地图底板信息;
接收到关系查询请求时,判断关系查询请求的查询类型,当查询类型是区域查询时,在预先配置的地图底板上标注查询请求中的每个区域与其它区域间的关系;当查询类型是关系查询时,针对查询请求中的任一关系,确定具有该关系的所有区域对,根据确定的区域对在预先配置地图底板上标注该关系。
5.根据权利要求4所述的构建关系网络的方法,其特征在于,
该方法进一步包括:对所有样本文本进行分析,统计每个区域名称出现的样本文本数,根据该区域名称出现的样本文本数确定该区域的被关注程度;
所述在预先配置的地图底板上标注关系查询请求中的每个区域与其它区域间的关系时,进一步标注该区域的被关注程度。
6.一种构建关系网络的装置,其特征在于,该装置包括:存储单元,统计单元、语句分析单元、关系确定单元;
所述存储单元,用于存储样本文本;用于存储预先设置的情感词典;
所述统计单元,用于对所有样本文本进行分析,统计任意两个区域名称共同出现的样本文本数、该两个区域名称均未出现的样本文本数、该两个区域名称各自出现的样本文本数、以及该两个区域名称中仅一个区域名称出现的样本文本数,根据统计结果确定该两个区域之间的紧密程度和主从程度;
所述语句分析单元,用于从所有样本文本中提取包含所述任意两个区域名称的完整语句,对提取的每个完整语句进行句法分析,根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度;
所述关系确定单元,用于根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间的关系;
所述统计单元在根据统计结果确定该两个区域之间的紧密程度和主从程度时,用于:
采用以下公式计算该两个区域之间的紧密程度:
C d g = N c 1 ∩ c 2 × N c 1 ∪ c 2 ‾ - N c 1 - c 2 × N c 2 - c 1 ( N c 1 ∩ c 2 + N c 1 - c 2 ) × ( N c 2 - c 1 + N c 1 ∪ c 2 ‾ ) × ( N c 1 ∩ c 2 + N c 2 - c 1 ) × ( N c 1 - c 2 + N c 1 ∪ c 2 ‾ ) ;
采用以下公式计算该两个区域之间的主从程度:
M d g = N c 1 ∩ c 2 N c 1 - N c 1 ∩ c 2 N c 2 ;
其中,Cdg表示该两个区域的紧密程度,Mdg表示该两个区域的主从程度;c1、c2分别表示该两个区域;
Nc1表示区域c1的名称出现的样本文本数,Nc2表示区域c2的名称出现的样本文本数;Nc1-c2表示区域c1的名称出现且区域c2的名称未出现的样本文本数,Nc2-c1表示区域c2的名称出现且区域c1的名称未出现的样本文本数;Nc1∩c2表示该两个区域名称共同出现的样本文本数;表示该两个区域名称均未出现的样本文本数。
7.根据权利要求6所述的构建关系网络的装置,其特征在于,
所述情感词典中包括多个情感词,每个情感词具有情感加权值;
所述语句分析单元在根据句法分析结果以及预设情感词典统计该两个区域之间的友好程度时,用于:根据句法分析结果确定该两个区域之间的连接词,根据预设情感词典确定该连接词的情感加权值,使用该连接词的情感加权值对该两个区域之间的友好程度进行加权计算。
8.根据权利要求6或7所述的构建关系网络的装置,其特征在于,
所述关系包括:对立关系、中立关系、冲突关系、合作关系、主从关系;
所述关系确定单元在根据所述任意两个区域之间的紧密程度、友好程度和主从程度确定该两个区域之间的关系时,用于:
如果该两个区域之间的紧密程度小于第一预设紧密程度阈值,则确定该两个区域之间是对立关系;
如果该两个区域之间的紧密程度大于或等于第一预设紧密程度阈值且小于第二预设紧密程度阈值,则确定该两个区域之间是中立关系;
如果该两个区域之间的紧密程度大于或等于第二预设紧密程度,则若该两个区域之间的友好程度小于预设友好阈值,则确定该两个区域之间是冲突关系;若该两个区域之间的友好程度大于或等于预设友好阈值,则当该两个区域之间的主从程度小于预设主从程度阈值时,确定该两个区域之间是合作关系,当该两个区域之间的主从程度大于或等于预设主从程度阈值时,确定该两个区域之间是主从关系。
9.根据权利要求8所述的构建关系网络的装置,其特征在于,该装置还包括配置单元、结果展示单元;
所述配置单元,用于预先配置地图底板信息;
所述结果展示单元,用于接收到关系查询请求,判断关系查询请求的查询类型,当查询类型是区域查询时,在预先配置的地图底板上标注查询请求中的每个区域与其它区域之间的关系;当查询类型是关系查询时,针对查询请求中的任一关系,确定具有该关系的所有区域对,根据确定的区域对在预先配置地图底板上标注该关系。
10.根据权利要求9所述的构建关系网络的装置,其特征在于,
所述统计单元,进一步用于对所有样本文本进行分析,统计每个区域名称出现的样本文本数,根据该区域名称出现的样本文本数确定该区域的被关注程度;
所述结果展示单元在预先配置的地图底板上标注关系查询请求中的每个区域与其它区域之间的关系时,进一步标注该区域的被关注程度。
CN201310052203.0A 2013-02-18 2013-02-18 一种构建关系网络的方法和装置 Expired - Fee Related CN103150350B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310052203.0A CN103150350B (zh) 2013-02-18 2013-02-18 一种构建关系网络的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310052203.0A CN103150350B (zh) 2013-02-18 2013-02-18 一种构建关系网络的方法和装置

Publications (2)

Publication Number Publication Date
CN103150350A CN103150350A (zh) 2013-06-12
CN103150350B true CN103150350B (zh) 2016-01-27

Family

ID=48548428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310052203.0A Expired - Fee Related CN103150350B (zh) 2013-02-18 2013-02-18 一种构建关系网络的方法和装置

Country Status (1)

Country Link
CN (1) CN103150350B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383748A (zh) * 2008-10-24 2009-03-11 北京航空航天大学 一种复杂网络中的社区划分方法
CN102194149A (zh) * 2010-03-01 2011-09-21 中国人民解放军国防科学技术大学 社区发现方法
CN102393843A (zh) * 2011-06-29 2012-03-28 广州市动景计算机科技有限公司 利用移动终端通讯信息建立用户关系的方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101366236B (zh) * 2005-07-06 2011-07-06 意大利电信股份公司 用于识别通信网络中的故障的方法和系统
KR101667415B1 (ko) * 2009-04-02 2016-10-18 삼성전자주식회사 휴대단말기의 인맥관리 서비스 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101383748A (zh) * 2008-10-24 2009-03-11 北京航空航天大学 一种复杂网络中的社区划分方法
CN102194149A (zh) * 2010-03-01 2011-09-21 中国人民解放军国防科学技术大学 社区发现方法
CN102393843A (zh) * 2011-06-29 2012-03-28 广州市动景计算机科技有限公司 利用移动终端通讯信息建立用户关系的方法及系统

Also Published As

Publication number Publication date
CN103150350A (zh) 2013-06-12

Similar Documents

Publication Publication Date Title
Mooney et al. The annotation process in OpenStreetMap
McKenzie et al. Assessing the effectiveness of different visualizations for judgments of positional uncertainty
Huck et al. Spraycan: A PPGIS for capturing imprecise notions of place
McMahon et al. The unseen uncertainties in climate change: reviewing comprehension of an IPCC scenario graph
Lonning et al. Development of theme‐based, interdisciplinary, integrated curriculum: A theoretical model
Heinzlef et al. A spatial decision support system for enhancing resilience to floods: Bridging resilience modelling and geovisualization techniques
Anderson et al. The crowd is the territory: Assessing quality in peer-produced spatial data during disasters
Ismail et al. Connect the dots: accessibility, readability and site ranking–an investigation with reference to top ranked websites of Government of India
Munson et al. Classic Maya bloodletting and the cultural evolution of religious rituals: quantifying patterns of variation in hieroglyphic texts
Zhang et al. Assessing OSM building completeness using population data
Eusébio et al. The State of Web Accessibility for tourists with disabilities: a comparative study between different tourism supply agents
Zhou et al. How does gender affect indoor wayfinding under time pressure?
CN106897400B (zh) 一种网络社交媒体中地震信息的可视化方法和系统
Idris et al. Colour coded traffic light labeling: A visual quality indicator to communicate credibility in map mash-up applications
CN115934955A (zh) 一种电力标准知识图谱构建方法、知识问答系统及装置
Fu et al. [Retracted] Mind Map Construction for English Grammar Teaching Based on Knowledge Map
Hizam et al. Web 3.0 adoption behavior: PLS-SEM and sentiment analysis
Dayal Quantitative economics with R
CN110457603B (zh) 用户关系抽取方法、装置、电子设备及可读存储介质
Siordia et al. Public use microdata area fragmentation: research and policy implications of polygon discontiguity
CN103150350B (zh) 一种构建关系网络的方法和装置
de Mendonça et al. Remote evaluation of the execution of spatial analysis tasks with interactive web maps: A functional and quantitative approach
Csizmadia et al. A global database for conducting systematic reviews and meta-analyses in innovation and quality management
Atzmueller et al. Exploratory subgroup analytics on ubiquitous data
Benites Alfaro et al. Peruvian public universities and the accessibility of their websites

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160127

CF01 Termination of patent right due to non-payment of annual fee