CN103425648B - 关系圈的处理方法和系统 - Google Patents

关系圈的处理方法和系统 Download PDF

Info

Publication number
CN103425648B
CN103425648B CN201210150076.3A CN201210150076A CN103425648B CN 103425648 B CN103425648 B CN 103425648B CN 201210150076 A CN201210150076 A CN 201210150076A CN 103425648 B CN103425648 B CN 103425648B
Authority
CN
China
Prior art keywords
packet attributes
recognition result
relation loop
attribute recognition
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210150076.3A
Other languages
English (en)
Other versions
CN103425648A (zh
Inventor
李玉煌
刘跃文
贺鹏
麦君明
陈川
陈伟华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201210150076.3A priority Critical patent/CN103425648B/zh
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to PCT/CN2013/073853 priority patent/WO2013170675A1/zh
Priority to RU2014150563A priority patent/RU2612608C2/ru
Priority to US14/400,405 priority patent/US20150149374A1/en
Priority to MYPI2014703407A priority patent/MY170770A/en
Priority to AP2014008112A priority patent/AP2014008112A0/xx
Priority to KR1020147035145A priority patent/KR101655948B1/ko
Publication of CN103425648A publication Critical patent/CN103425648A/zh
Application granted granted Critical
Publication of CN103425648B publication Critical patent/CN103425648B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/167Interprocessor communication using a common memory, e.g. mailbox
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/06Authentication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/02Access restriction performed under specific conditions

Abstract

本发明提供了一种关系圈的处理方法和系统。所述方法包括:获取关系圈中的分组;从所述分组抽取所述关系圈中成员之间的分组属性;判别所述关系圈中成员之间的分组属性得到属性识别结果,并将所述属性识别结果映射和到所述关系圈。所述系统包括:分组获取模块,用于获取关系圈中的分组;抽取模块,用于从分组抽取关系圈中成员之间的分组属性;映射模块,用于判别所述关系圈中成员之间的分组属性得到属性识别结果,并将所述属性识别结果映射到关系圈。采用本发明实现了关系圈的动态映射。

Description

关系圈的处理方法和系统
技术领域
本发明涉及互联网技术,特别是涉及一种关系圈的处理方法和系统。
背景技术
随着互联网应用的不断发展,即时通信工具和网络社交工具已经成为用户在日常生活以及工作中必不可少的工具,得到广泛的使用。越来越多的用户通过即时通信工具以及网络社交工具中形成的关系链进行消息的传递以及互动等交往,并发展成为多个用户构成的关系圈。
各种形态多样的关系圈中常常存在着多个具有同类属性的用户,例如该用户之间互为同学关系或者同事关系,每一关系圈均有相应的名称、资料标签等标记该关系圈的属性信息,因此用户常常根据关系圈中用户之间的同类属性一一标记关系圈的属性信息,并在属性信息发生变化时进行手动修改,造成关系圈不灵活的缺陷。
发明内容
基于此,有必要针对关系圈不灵活的问题,提供一种能对关系圈进行动态映射的关系圈的处理方法。
此外,还有必要提供一种能对关系圈进行动态映射的关系圈的处理系统。
一种关系圈的处理方法,包括如下步骤:获取关系圈中的分组;从所述分组抽取所述关系圈中成员之间的分组属性;判别所述关系圈中成员之间的分组属性得到属性识别结果,并将所述属性识别结果映射到所述关系圈。
一种关系圈的处理系统,包括:分组获取模块,用于获取关系圈中的分组;抽取模块,用于从分组抽取关系圈中成员之间的分组属性;映射模块,用于判别关系圈中成员之间的分组属性得到属性识别结果,并将所述属性识别结果映射到所述关系圈。
上述关系圈的处理方法和系统,在关系圈成员之间的多个分组中抽取成员之间的分组属性,进而对成员之间的分组属性进行判别得到属性识别结果,并将属性识别结果和关系圈进行映射,实现了关系圈的动态映射,使得关系圈能够适应于各种成员以及属性信息的变化,提高了灵活性。
附图说明
图1为一个实施例中关系圈的处理方法的流程图;
图2为一个实施例中判别关系圈成员之间的分组属性得到属性识别结果,并将属性识别结果映射到关系圈的方法流程图;
图3为图2中将分词得到的分组属性进行识别得到属性识别结果以及对应的匹配权值;
图4为另一个实施例中判别关系圈成员之间的分组属性得到属性识别结果,并将属性识别结果映射到关系圈的方法流程图;
图5为一个实施例中按照匹配权值提取属性识别结果,并将提取的属性识别结果映射到关系圈的方法流程图;
图6为一个实施例中关系圈的处理系统的结构示意图;
图7为一个实施例中映射模块的结构示意图;
图8为一个实施例中识别单元的结构示意图。
具体实施方式
如图1所示,在一个实施例中,一种关系圈的处理方法,包括如下步骤:
步骤S10,获取关系圈中的分组。
本实施例中,分组由一类用户构成,在优选的实施例中,分组可以是关系链的形式,例如,关系圈可以由一群存在同学关系的用户构成,也可以由一群存在同事关系的用户构成。关系圈中的成员之间存在着若干个关系链,例如,关系圈的多个成员中,成员A与成员B之间存在着好友关系,成员B与成员C之间存在着好友关系,则该关系圈中至少存在成员A与成员B之间的关系链以及成员B与成员C之间的关系链。关系圈中的关系链包括即时通信工具中存在的关系链,还包括了社交网络工具中存在的关系链。
步骤S30,从分组抽取关系圈中成员之间的分组属性。
本实施例中,在获取得到分组中进行分组属性的抽取,该分组属性包括了分组名称以及分组类型等信息。例如,在成员A与成员C之间的关系链中,成员A在成员C的即时通信工具中所属的分组属性为同学,而成员C在成员A的即时通信工具中所属的分组属性为大学同学;在成员B与成员C之间的关系链中,成员B在成员C的网络社交工具中所属的分组属性为大学同学,成员C在成员B的网络社交工具中所属的分组属性为大学;此时从关系链中抽取出的分组属性将有多个,分别为同学、大学同学以及大学。
在另一个实施例中,从关系圈中存在的分组中抽取得到的分组属性是多个的可能性很高,为进一步方便后续的处理,将分组属性与关系圈标识以及关系圈的用户标识进行关联,即从各种分组中抽取的多个分组属性与关系圈标识以及关系圈的用户标识之间存在着多对一的映射关系。关系圈的用户标识是关系圈的展示对象。
步骤S50,判别关系圈成员之间的分组属性得到属性识别结果,并将属性识别结果映射到关系圈。
本实施例中,关系圈中成员之间的分组属性表征了该成员之间所拥有的共同属性,根据分组属性可以分析得到关系圈的属性,进而将其映射到关系圈,建立属性识别结果和关系圈之间的映射关系,为关系圈添加相应的名称以及属性标签等,实现了关系圈的动态映射,进而使得关系圈的名称以及属性标签等信息适应成员的动态变化,更具灵活性。
如图2所示,在一个实施例中,上述步骤S50的具体过程为:
步骤S510,对分组属性进行分词处理。
本实施例中,通过各种分词运算对分组属性进行分词得到相应的关键字,例如,“大学同学”这一分组属性中包含了“大学”和“同学”这两个关键字。对分组属性进行分词处理有利于在后续的分组属性识别过程中提高识别的准确性。
步骤S530,将分词得到的分组属性进行识别得到属性识别结果以及对应的匹配权值。
本实施例中,分词得到的分组属性为多个关键字,对多个关键字进行筛选识别得到关系圈的属性识别结果以及对应的匹配权值。该匹配权值用于表征分组属性与得到的属性识别结果之间的匹配程度。
在一个实施例中,上述步骤S530的具体过程为:通过分类模型对分组属性进行识别得到属性识别结果以及分组属性与识别得到的属性识别结果之间的匹配权值。
本实施例中,预先构建分类模型作为分类器对分组属性进行识别得到与分类模型中与该分组属性相匹配的特征,进而根据该特征得到属性识别结果。该分类模型是根据各种先验信息构建得到的,该先验信息包括同学、同事以及家人等。根据各种先验信息设定相应的特征得到分类模型,分类模型拥有固定的输入变量和输出变量,其中,输入变量为分组属性以及该分组属性所对应的关系圈标识和用户标识,输出变量为属性识别结果和匹配权值以及对应的关系圈标识和用户标识。
如图3所示,在另一个实施例中,上述步骤S530的具体过程为:
步骤S531,计算分组属性对应的出现频度以及应用分组属性的成员数量。
本实施例中,除了通过基于先验信息的分类模型进行识别之外,由于分类模型所能够识别出的属性识别结果有限,还可通过聚集逻辑这一方式进行分组属性的识别,这两种识别方式可同时进行。此外,由于聚集逻辑所能够识别的分组属性较为广泛,也可直接通过聚集逻辑这一方式进行识别,而不使用分类模型。
具体的,逐一对多个分组属性进行出现频度以及使用了该分组属性的成员数量的计算。例如,提取得到的关系圈中的分组属性包括同事、TC、TX等,计算得到所有分组属性的出现频度为200次,应用所有分组属性的成员数量为关系圈中的30个成员,其中160次是同事,20个成员使用了同事这一分组属性;20次是TC,2个成员使用了TC这一分组属性;20次是TX,8个成员使用了TX这一分组属性。
步骤S533,根据出现频度以及成员数量进行加权聚集处理得到分组属性的加权聚集度。
本实施例中,通过关系圈中多个分组属性所对应的大量数据进行加权聚集处理,以分析得到关系圈所拥有的属性,该属性表征了关系圈成员之间的关系,即社会属性。
在加权聚集处理过程中,根据出现频度以及成员数量计算得到每一分组属性所对应的加权聚集度,该加权聚集度用于表示关系圈成员中与该加权聚集度对应的分组属性应用的频率高低。例如,对于同事这一分组属性而言,加权聚集度=a*(160/200)+b*(20/30),其中,a和b是通过回归分析得到的参数。
步骤S535,提取加权聚集度超过阈值的分组属性作为属性识别结果,提取的分组属性的加权聚集度为匹配权值。
本实施例中,在计算得到每一分组属性所对应的加权聚集度中提取加权聚集度超过预设的阈值的分组属性。
如图4所示,在另一个实施例中,上述步骤S530之前还包括如下步骤:
步骤S501,通过噪音词库逐一对分词得到的分组属性中的字符进行过滤。
本实施例中,从分组中抽取的分组属性存在着一定量的噪音,该噪音包括辱骂性质的词汇、纯符号构成的字符串以及无明确含义的单个汉字等。需要对分组属性进行噪音过滤,清除分组属性中的噪音得到纯净的分组属性。首先对分组属性进行精确过滤,以清除分组属性中单个汉字以及字符等。预先将无明确含义的单个汉字、单个字符以及辱骂性质的词汇等存储于噪音词库中,通过噪音词库进行对比得到分组属性中的噪音,并清除。
步骤S503,对过滤得到的分组属性进行模糊过滤。
本实施例中,预设在噪音词库中建立模糊匹配模型以对分组属性进行模糊过滤清除分组属性中无明确意义的字符串。精确过滤和模糊过滤可根据需要进行,也可仅进行精确过滤或模糊过滤。若进行精确过滤和模糊过滤则应当在精确过滤之后进入模糊过滤,以提高处理的效率。
步骤S550,按照匹配权值提取属性识别结果,并将提取的属性识别结果映射到关系圈。
本实施例中,根据匹配权值的大小进行属性识别结果的提取,进而按照提取的属性识别结果实现关系圈和属性识别结果之间的映射。
此外,还可获取分组中的行为信息,通过行为信息辅助属性识别结果的准确提取。该行为信息可以是活跃度以及活跃时间等。例如,属性识别结果中同事和同学这为匹配权值最大且相等的属性识别结果,获取到的活跃时间为上班时间,则应当提取“同事”这一属性识别结果,并映射到关系圈。
如图5所示,在一个实施例中,上述步骤S550的具体过程为:
步骤S551,提取匹配权值最大的属性识别结果。
步骤S553,将属性识别结果映射为关系圈的属性标签和/或名称。
本实施例中,为关系圈添加按照属性识别结果映射得到的属性标签和/或名称,并向用户展示,使得用户可准确获知该关系圈所对应的成员类型以及社会属性。
本发明还提供了一种存储了计算机可执行指令的计算机存储介质,该计算机可执行指令用于执行上述关系圈的处理方法,计算机存储介质中的计算机可执行指令执行关系圈的处理方法的具体步骤如上述方法描述,在此不再赘述。
如图6所示,在一个实施例中,一种关系圈的处理系统,包括分组获取模块10、抽取模块30以及映射模块50。
分组获取模块10,用于获取关系圈中的分组。
本实施例中,分组由一类用户构成,在优选的实施例中,分组可以是关系链的形式,例如,关系圈可以由一群存在同学关系的用户构成,也可以由一群存在同事关系的用户构成。关系圈中的成员之间存在着若干个关系链,例如,关系圈的多个成员中,成员A与成员B之间存在着好友关系,成员B与成员C之间存在着好友关系,则该关系圈中至少存在成员A与成员B之间的关系链以及成员B与成员C之间的关系链。关系圈中的关系链包括即时通信工具中存在的关系链,还包括了社交网络工具中存在的关系链。
抽取模块30,用于从分组抽取关系圈中成员之间的分组属性。
本实施例中,抽取模块30在获取得到分组中进行分组属性的抽取,该分组属性包括了分组名称以及分组类型等信息。例如,在成员A与成员C之间的关系链中,成员A在成员C的即时通信工具中所属的分组属性为同学,而成员C在成员A的即时通信工具中所属的分组属性为大学同学;在成员B与成员C之间的关系链中,成员B在成员C的网络社交工具中所属的分组属性为大学同学,成员C在成员B的网络社交工具中所属的分组属性为大学;此时抽取模块30从关系链中抽取出的分组属性将有多个,分别为同学、大学同学以及大学。
在另一个实施例中,抽取模块30从关系圈中存在的分组中抽取得到的分组属性是多个的可能性很高,为进一步方便后续的处理,将分组属性与关系圈标识以及关系圈的用户标识进行关联,即从各种分组中抽取的多个分组属性与关系圈标识以及关系圈的用户标识之间存在着多对一的映射关系。关系圈的用户标识是关系圈的展示对象。
映射模块50,用于判别关系圈成员之间的分组属性得到属性识别结果,并将属性识别结果映射到关系圈。
本实施例中,关系圈中成员之间的分组属性表征了该成员之间所拥有的共同属性,根据分组属性可以分析得到关系圈的属性,进而映射模块50将其映射到关系圈,建立属性识别结果和关系圈之间的映射关系,为关系圈添加相应的名称以及属性标签等,实现了关系圈的动态映射,进而使得关系圈的名称以及属性标签等信息适应成员的动态变化,更具灵活性。
如图7所示,在一个实施例中,上述映射模块50包括分词处理单元510、识别单元530以及结果映射单元550。
分词处理单元510,用于对分组属性进行分词处理。
本实施例中,分词处理单元510通过各种分词运算对分组属性进行分词得到相应的关键字,例如,“大学同学”这一分组属性中包含了“大学”和“同学”这两个关键字。对分组属性进行分词处理有利于在后续的分组属性识别过程中提高识别的准确性。
识别单元530,用于将分词得到的分组属性进行识别得到属性识别结果以及对应的匹配权值。
本实施例中,分词得到的分组属性为多个关键字,识别单元530对多个关键字进行筛选识别得到关系圈的属性识别结果以及对应的匹配权值。该匹配权值用于表征分组属性与得到的属性识别结果之间的匹配程度。
在一个实施例中,识别单元530还用于通过分类模型对分组属性进行识别得到属性识别结果以及分组属性与识别得到的属性识别结果之间的匹配权值。
本实施例中,识别单元530预先构建分类模型作为分类器对分组属性进行识别得到与分类模型中与该分组属性相匹配的特征,进而根据该特征得到属性识别结果。该分类模型是根据各种先验信息构建得到的,该先验信息包括同学、同事以及家人等。根据各种先验信息设定相应的特征得到分类模型,分类模型拥有固定的输入变量和输出变量,其中,输入变量为分组属以及该分组属性所对应的关系圈标识和用户标识,输出变量为属性识别结果和匹配权值以及对应的关系圈标识和用户标识。
如图8所示,在另一个实施例中,上述识别单元530包括运算单元531、加权聚集单元533以及提取单元535。
运算单元531,用于计算分组属性对应的出现频度以及应用分组属性的成员数量。
本实施例中,除了通过基于先验信息的分类模型进行识别之外,由于分类模型所能够识别出的属性识别结果有限,还可通过聚集逻辑这一方式进行分组属性的识别,这两种识别方式可同时进行。此外,由于聚集逻辑所能够识别的分组属性较为广泛,也可直接通过聚集逻辑这一方式进行识别,而不使用分类模型。
具体的,运算单元531逐一对多个分组属性进行出现频度以及使用了该分组属性的成员数量的计算。例如,提取得到的关系圈中的分组属性包括同事、TC、TX等,运算单元531计算得到所有分组属性的出现频度为200次,应用所有分组属性的成员数量为关系圈中的30个成员,其中160次是同事,20个成员使用了同事这一分组属性;20次是TC,2个成员使用了TC这一分组属性;20次是TX,8个成员使用了TX这一分组属性。
加权聚集单元533,用于根据出现频度以及成员数量进行加权聚集得到分组属性的加权聚集度。
本实施例中,加权聚集单元533通过关系圈中多个分组属性所对应的大量数据进行加权聚集处理,以分析得到关系圈所拥有的属性,该属性表征了关系圈成员之间的关系,即社会属性。
加权聚集单元533根据出现频度以及成员数量计算得到每一分组属性所对应的加权聚集度,该加权聚集度用于表示关系圈成员中与该加权聚集度对应的分组属性应用的频率高低。例如,对于同事这一分组属性而言,加权聚集度=a*(160/200)+b*(20/30),其中,a和b是通过回归分析得到的参数。
提取单元535,用于提取加权聚集度超过阈值的分组属性作为属性识别结果,提取的分组属性的加权聚集度为匹配权值。
本实施例中,提取单元535在计算得到每一分组属性所对应的加权聚集度中提取加权聚集度超过预设的阈值的分组属性。
在另一个实施例中,上述映射模块50还包括过滤器,该过滤器用于通过噪音词库逐一对分词得到的分组属性中的字符进行过滤,并对过滤得到的分组属性进行模糊过滤。
本实施例中,从分组中抽取的分组属性存在着一定量的噪音,该噪音包括辱骂性质的词汇、纯符号构成的字符串以及无明确含义的单个汉字等。需要对分组属性进行噪音过滤,清除分组属性中的噪音得到纯净的分组属性。过滤器首先对分组属性进行精确过滤,以清除分组属性中单个汉字以及字符等。预先将无明确含义的单个汉字、单个字符以及辱骂性质的词汇等存储于噪音词库中,通过噪音词库进行对比得到分组属性中的噪音,并清除。
预设在噪音词库中建立模糊匹配模型以对分组属性进行模糊过滤清除分组属性中无明确意义的字符串。精确过滤和模糊过滤可根据需要进行,也可仅进行精确过滤或模糊过滤。若进行精确过滤和模糊过滤则应当在精确过滤之后进入模糊过滤,以提高处理的效率。
结果映射单元550,用于按照匹配权值提取属性识别结果,并将提取的属性识别结果映射到关系圈。
本实施例中,结果映射单元550根据匹配权值的大小进行属性识别结果的提取,进而按照提取的属性识别结果实现关系圈和属性识别结果之间的映射。
在另一个实施例中,结果映射单元550还用于提取匹配权值最大的属性识别结果,将属性识别结果映射为关系圈的属性标签和/或名称。
本实施例中,结果映射单元550为关系圈添加按照属性识别结果映射得到的属性标签和/或名称,并向用户展示,使得用户可准确获知该关系圈所对应的成员类型以及社会属性。
上述关系圈的处理方法和系统,在关系圈成员之间的多个分组中抽取成员之间的分组属性,进而对成员之间的分组属性进行判别得到属性识别结果,并将属性识别结果和对关系圈进行映射,实现了关系圈的动态映射,使得关系圈能够适应于各种成员以及属性信息的变化,提高了灵活性。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种关系圈的处理方法,包括如下步骤:
获取关系圈中的分组;
从所述分组抽取所述关系圈中成员之间的分组属性;
对所述分组属性进行分词处理;
将分词得到的分组属性进行识别得到属性识别结果以及对应的匹配权值;
按照所述匹配权值提取属性识别结果,并将所述提取的属性识别结果映射到所述关系圈。
2.根据权利要求1所述的关系圈的处理方法,其特征在于,所述对所述分组属性进行分词处理的步骤之前还包括:
通过噪音词库逐一对分词得到的分组属性中的字符进行过滤;
对所述过滤得到的分组属性进行模糊过滤。
3.根据权利要求1所述的关系圈的处理方法,其特征在于,所述将分词得到的分组属性进行识别得到属性识别结果以及对应的匹配权值的步骤为:
通过分类模型对所述分组属性进行识别得到属性识别结果以及所述分组属性与所述识别得到的属性识别结果之间的匹配权值。
4.根据权利要求1或3所述的关系圈的处理方法,其特征在于,所述将分词得到的分组属性进行识别得到属性识别结果以及对应的匹配权值的步骤为:
计算所述分组属性对应的出现频度以及应用所述分组属性的成员数量;
根据所述出现频度以及成员数量进行加权聚集处理得到所述分组属性的加权聚集度;
提取所述加权聚集度超过阈值的分组属性作为属性识别结果,所述提取的分组属性的加权聚集度为匹配权值。
5.根据权利要求1所述的关系圈的处理方法,其特征在于,所述按照所述匹配权值提取属性识别结果,并将所述提取的属性识别结果映射到所述关系圈的步骤为:
提取所述匹配权值最大的属性识别结果;
将所述属性识别结果映射为所述关系圈的属性标签和/或名称。
6.一种关系圈的处理系统,其特征在于,包括:
分组获取模块,用于获取关系圈中的分组;
抽取模块,用于从所述分组抽取关系圈中成员之间的分组属性;
分词处理单元,用于对所述分组属性进行分词处理;
识别单元,用于将分词得到的分组属性进行识别得到属性识别结果以及对应的匹配权值;
结果映射单元,用于按照所述匹配权值提取属性识别结果,并将所述提取的属性识别结果映射到所述关系圈。
7.根据权利要求6所述的关系圈的处理系统,其特征在于,还包括:
过滤器,用于通过噪音词库逐一对分词得到的分组属性中的字符进行过滤,并对所述过滤得到的分组属性进行模糊过滤。
8.根据权利要求6所述的关系圈的处理系统,其特征在于,所述识别单元还用于通过分类模型对所述分组属性进行识别得到属性识别结果以及所述分组属性与所述识别得到的属性识别结果之间的匹配权值。
9.根据权利要求6或8所述的关系圈的处理系统,其特征在于,所述识别单元包括:
运算单元,用于计算所述分组属性对应的出现频度以及应用所述分组属性的成员数量;
加权聚集单元,用于根据出现频度以及成员数量进行加权聚集处理得到所述分组属性的加权聚集度;
提取单元,用于提取所述加权聚集度超过阈值的分组属性作为属性识别结果,所述提取的分组属性的加权聚集度为匹配权值。
10.根据权利要求6所述的关系圈的处理系统,其特征在于,所述结果映射单元还用于提取所述匹配权值最大的属性识别结果,将所述属性识别结果映射为所述关系圈的属性标签和/或名称。
CN201210150076.3A 2012-05-15 2012-05-15 关系圈的处理方法和系统 Active CN103425648B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201210150076.3A CN103425648B (zh) 2012-05-15 2012-05-15 关系圈的处理方法和系统
RU2014150563A RU2612608C2 (ru) 2012-05-15 2013-04-08 Система и способ формирования круга общения и компьютерный носитель информации
US14/400,405 US20150149374A1 (en) 2012-05-15 2013-04-08 Relationship circle processing method and system, and computer storage medium
MYPI2014703407A MY170770A (en) 2012-05-15 2013-04-08 Relationship circle processing method and system, and computer storage medium
PCT/CN2013/073853 WO2013170675A1 (zh) 2012-05-15 2013-04-08 关系圈的处理方法和系统、计算机存储介质
AP2014008112A AP2014008112A0 (en) 2012-05-15 2013-04-08 Relationship circle processing method and system, and computer storage medium
KR1020147035145A KR101655948B1 (ko) 2012-05-15 2013-04-08 관계 써클 프로세싱 방법 및 시스템, 그리고 컴퓨터 저장 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210150076.3A CN103425648B (zh) 2012-05-15 2012-05-15 关系圈的处理方法和系统

Publications (2)

Publication Number Publication Date
CN103425648A CN103425648A (zh) 2013-12-04
CN103425648B true CN103425648B (zh) 2016-04-13

Family

ID=49583096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210150076.3A Active CN103425648B (zh) 2012-05-15 2012-05-15 关系圈的处理方法和系统

Country Status (7)

Country Link
US (1) US20150149374A1 (zh)
KR (1) KR101655948B1 (zh)
CN (1) CN103425648B (zh)
AP (1) AP2014008112A0 (zh)
MY (1) MY170770A (zh)
RU (1) RU2612608C2 (zh)
WO (1) WO2013170675A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105824855B (zh) 2015-01-09 2019-12-13 阿里巴巴集团控股有限公司 一种对数据对象筛选分类的方法、装置以及电子设备
CN105988988A (zh) * 2015-02-13 2016-10-05 阿里巴巴集团控股有限公司 文本地址处理方法及装置
CN106408326A (zh) * 2016-08-30 2017-02-15 常州航加网络科技有限公司 信息智能管理平台及其管理方法
US10606866B1 (en) 2017-03-30 2020-03-31 Palantir Technologies Inc. Framework for exposing network activities
CN107451255B (zh) * 2017-07-31 2020-05-19 陕西识代运筹信息科技股份有限公司 一种基于关注关系的用户兴趣处理方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101119326A (zh) * 2006-08-04 2008-02-06 腾讯科技(深圳)有限公司 一种即时通信会话记录的管理方法及装置
CN101546247A (zh) * 2009-01-20 2009-09-30 宇龙计算机通信科技(深圳)有限公司 联系人信息显示方法、装置及移动终端
CN102436456A (zh) * 2010-09-29 2012-05-02 国际商业机器公司 用于对命名实体进行分类的方法和装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8037686B2 (en) * 2002-11-01 2011-10-18 George Lasker Uncoupled, thermal-compressor, gas-turbine engine
US7360174B2 (en) * 2002-12-19 2008-04-15 Microsoft Corporation Contact user interface
US7596597B2 (en) * 2006-08-31 2009-09-29 Microsoft Corporation Recommending contacts in a social network
US9536221B2 (en) * 2008-06-19 2017-01-03 Plentyoffish Media Ulc System and method for adaptive matching of user profiles based on viewing and contact activity for social relationship services
CN101510856A (zh) * 2009-03-12 2009-08-19 腾讯科技(深圳)有限公司 一种sns网络中成员关系圈的提取方法和装置
US8793319B2 (en) * 2009-07-13 2014-07-29 Microsoft Corporation Electronic message organization via social groups
US20110112995A1 (en) * 2009-10-28 2011-05-12 Industrial Technology Research Institute Systems and methods for organizing collective social intelligence information using an organic object data model
US20130166555A1 (en) * 2011-12-22 2013-06-27 Nokia Corporation Method and apparatus for managing contact data by utilizing social proximity information
US9338286B2 (en) * 2009-11-30 2016-05-10 Intel Corporation Methods and systems for real time display of caller location, profile, and trust relationship
US8468144B2 (en) * 2010-03-19 2013-06-18 Honeywell International Inc. Methods and apparatus for analyzing information to identify entities of significance
CN102411593A (zh) * 2010-09-26 2012-04-11 腾讯数码(天津)有限公司 展示好友动态的方法及系统
CN102255890B (zh) * 2011-05-30 2014-12-31 苏宁军 一种用户推荐与信息交互的系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101119326A (zh) * 2006-08-04 2008-02-06 腾讯科技(深圳)有限公司 一种即时通信会话记录的管理方法及装置
CN101546247A (zh) * 2009-01-20 2009-09-30 宇龙计算机通信科技(深圳)有限公司 联系人信息显示方法、装置及移动终端
CN102436456A (zh) * 2010-09-29 2012-05-02 国际商业机器公司 用于对命名实体进行分类的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于语义相似度的数据库自适应查询松弛方法;孟祥福等;《计算机学报》;20110531;812-824 *

Also Published As

Publication number Publication date
WO2013170675A1 (zh) 2013-11-21
KR20150008497A (ko) 2015-01-22
RU2612608C2 (ru) 2017-03-09
CN103425648A (zh) 2013-12-04
MY170770A (en) 2019-08-28
US20150149374A1 (en) 2015-05-28
KR101655948B1 (ko) 2016-09-22
AP2014008112A0 (en) 2014-12-31
RU2014150563A (ru) 2016-07-10

Similar Documents

Publication Publication Date Title
CN103425648B (zh) 关系圈的处理方法和系统
CN106874378B (zh) 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN104504150B (zh) 新闻舆情监测系统
CN103885937B (zh) 基于核心词相似度判断企业中文名称重复的方法
CN108985632A (zh) 一种基于孤立森林算法的用电数据异常检测模型
CN110189167B (zh) 一种基于异构图嵌入的移动广告欺诈检测方法
CN103559175B (zh) 一种基于聚类的垃圾邮件过滤系统及方法
CN110263166A (zh) 基于深度学习的舆情文本分类方法
CN106375345B (zh) 一种基于周期性检测的恶意软件域名检测方法及系统
CN106533742B (zh) 基于时间序列模式表征的加权有向复杂网络建网方法
CN104391881A (zh) 一种基于分词算法的日志解析方法及系统
CN109918452A (zh) 一种数据处理的方法、装置、计算机存储介质及终端
CN105868169B (zh) 一种数据采集装置、数据采集方法和系统
CN104866558A (zh) 一种社交网络账号映射模型训练方法及映射方法和系统
CN104935570A (zh) 基于网络流连接图的网络流连接行为特征分析方法
CN110648172B (zh) 一种融合多种移动设备的身份识别方法和系统
CN105677661A (zh) 一种检测社交媒体重复数据的方法
CN112261645B (zh) 一种基于分组分域的移动应用指纹自动化提取方法及系统
CN109408821A (zh) 一种语料生成方法、装置、计算设备及存储介质
CN110377659A (zh) 一种智能图表推荐系统及方法
CN106446124A (zh) 一种基于网络关系图的网站分类方法
CN108536664A (zh) 商品领域的知识融合方法
Gogoi et al. A rough set–based effective rule generation method for classification with an application in intrusion detection
CN108399238A (zh) 一种融合文本概念化和网络表示的观点检索系统及方法
CN105956158A (zh) 基于海量微博文本和用户信息的网络新词自动提取的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1187700

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1187700

Country of ref document: HK