CN111581522B - 一种基于用户身份辨别的社交分析方法 - Google Patents

一种基于用户身份辨别的社交分析方法 Download PDF

Info

Publication number
CN111581522B
CN111581522B CN202010361134.1A CN202010361134A CN111581522B CN 111581522 B CN111581522 B CN 111581522B CN 202010361134 A CN202010361134 A CN 202010361134A CN 111581522 B CN111581522 B CN 111581522B
Authority
CN
China
Prior art keywords
social
user
information
matrix
identity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010361134.1A
Other languages
English (en)
Other versions
CN111581522A (zh
Inventor
吕文艺
刘华峰
张海江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foresee Your Emotion Beijing Education Consulting Co ltd
Original Assignee
Foresee Your Emotion Beijing Education Consulting Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foresee Your Emotion Beijing Education Consulting Co ltd filed Critical Foresee Your Emotion Beijing Education Consulting Co ltd
Priority to CN202010361134.1A priority Critical patent/CN111581522B/zh
Publication of CN111581522A publication Critical patent/CN111581522A/zh
Application granted granted Critical
Publication of CN111581522B publication Critical patent/CN111581522B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本发明提供了一种基于用户身份辨别的社交分析方法,包括:基于社交平台爬取目标用户的第一身份信息;对爬取的目标用户的所有第一身份信息进行第一聚类处理,根据第一聚类处理结果,确定目标用户的每类身份信息的类身份属性;爬取目标用户的每个第一身份信息的第一社交信息,并获取每个第一社交信息的第一社交特征向量,并根据每类身份信息的类身份属性,构造对应的类社交矩阵;基于构造的所有类社交矩阵,确定目标用户的所有社交标识,进而根据所有社交标识,确定目标用户的社交特性,完成社交分析。通过从若干个社交平台上爬取第一身份信息和第一社交信息,构建类社交矩阵,进而确定用户的社交特性,提高社交可靠性,降低社交风险。

Description

一种基于用户身份辨别的社交分析方法
技术领域
本发明涉及网络社交技术领域,特别涉及一种基于用户身份辨别的社交分析方法。
背景技术
随着社交软件的广泛应用,在社交平台上交友、聊天等成为常见社交方式,且基于平台对用户进行社交分析,一般只是简单的根据用户的搜索词、用户选择的标签等内容进行信息或者是好友的推送,且在对用户进行分析时,基本上不考虑用户的身份,而是完全依赖于用户在该平台上的自主选择,而且平台与平台之间的身份信息、社交信息等是相互独立的,而且,在现有的情感交友等相关软件上,存在一些身份欺骗信息,因此,对用户身份进行辨别是非常重要的,进而设计了一种基于用户身份辨别的社交分析方法。
发明内容
本发明提供一种基于用户身份辨别的社交分析方法,用以通过从若干个社交平台上爬取第一身份信息和第一社交信息,构建类社交矩阵,进而确定用户的社交特性,提高社交可靠性,降低社交风险。
本发明实施例提供一种基于用户身份辨别的社交分析方法,包括:
基于社交平台爬取目标用户的第一身份信息;
对爬取的所述目标用户的所有第一身份信息进行第一聚类处理,根据第一聚类处理结果,确定所述目标用户的每类身份信息的类身份属性;
爬取所述目标用户的每个所述第一身份信息的第一社交信息,并获取每个所述第一社交信息的第一社交特征向量,并根据每类身份信息的类身份属性,构造对应的类社交矩阵;
基于构造的所有类社交矩阵,确定所述目标用户的所有社交标识,进而根据所述所有社交标识,确定所述目标用户的社交特性,完成社交分析。
在一种可能实现的方式中,获取每个所述第一社交信息的第一社交特征向量,并根据每类身份信息的类身份属性,构造对应的类社交矩阵的过程中,还包括:
选取所有类社交矩阵对应的社交特征值大于或等于预设特征值的第一社交矩阵对应的第一身份信息;
确定所述第一社交矩阵中的每个第一社交特征向量与对应的选取的第一身份属性的相似度;
保留所述第一社交矩阵中相似度大于预设度的第一社交特征向量,并基于保留的第一社交特征向量,重新构造新的第一社交矩阵。
在一种可能实现的方式中,在选取所述第一社交矩阵对应的第一身份信息时,还包括:
筛选所有类社交矩阵对应的社交特征值小于预设特征值的第二社交矩阵E;
将所有所述第一社交矩阵中相似度小于或等于预设度的第一社交特征向量,构造成一个补偿社交矩阵E1;
基于所述补偿社交矩阵E1对所有所述第二社交矩阵E进行补偿处理,获得第三社交矩阵E′;
Figure BDA0002475038870000021
其中,e表示自然常数;λE表示所述补偿矩阵E1的特征值;δE表示所述补偿矩阵E1的误差增益因子。
在一种可能实现的方式中,当完成社交分析之后,还包括:
构建所述目标用户的社交数据链,所述社交数据链中包括:所述目标用户的每类身份信息、每类身份信息对应的类身份属性、社交标识和社交特性;
基于社交服务器,对构建的所述社交数据链及其社交数据进行评级处理,获得预设数目个由高到低的等级数据,并将与所述等级数据一一对应的等级标识传输到所述目标用户的目标端进行标识列显示;
当存在交互用户进行用户搜索时,根据所述交互用户的搜索关键词,向所述交互用户的交互端推送与所述搜索关键词相匹配的匹配用户;
如果所述交互用户与所述匹配用户不是好友关系或者所述交互用户未注册,基于所述社交服务器,自动向所述交互用户的交互端推送与所述匹配用户相关的默认数据;
其中,所述默认数据是基于所述社交服务器,且根据预设规则,自动默认的与低等级标识相关的可查看数据;
如果所述交互用户与所述匹配用户是好友关系且所述交互用户已注册,此时,所述标识列供对应的所述匹配用户选择可被所述交互用户查看的待选择标识,所述交互用户通过选择所述待选择标识,查看与所述匹配用户相关的可查看数据;
如果所述交互用户与所述匹配用户是好友关系且所述交互用户已注册,所述目标用户未基于所述标识列执行任何操作,则基于所述社交服务器向所述交互用户的交互端推送所述默认数据;
其中,基于所述社交服务器还向所述交互用户的交互端推送其他用户对所述默认数据对应的匹配用户的用户评价。
在一种可能实现的方式中,当存在交互用户进行用户搜索时,根据所述交互用户的搜索关键词,向所述交互用户的交互端推送与所述搜索关键词相匹配的匹配用户的过程中包括:
根据所述搜索关键词,基于所述社交服务器进行第一用户集群的初次筛选,且所述初次筛选的过程中包括:
基于预先设定的聚类点,确定所述第一用户集群中的每个用户与所述聚类点的聚类距离,将所述聚类距离小于预设距离的用户删除,得到第二用户集群;
深度挖掘所述第二用户集群中每个用户的综合社交信息和与所述交互用户处于同一社交平台的独立社交信息;
基于所述同一社交平台的社交属性,且根据每个用户的综合社交信息和独立社交信息,基于所述社交服务器进行所述第二用户集群中的再次筛选,获得第三用户集群;
同时,对所述第三用户集群中的每个用户进行与所述搜索关键词的由高到低的相关性的排序,并输出到所述交互用户的交互端进行显示。
在一种可能实现的方式中,所述基于社交平台爬取目标用户的第一身份信息的步骤包括:
统计所述目标用户的目标端的社交平台;
判断所述目标用户基于每个所述社交平台的用户权限;
当所述用户权限为游客登录时,获取第一信息;
或,当所述用户权限为非游客且会员登录时,获取第二信息;
或,当所述用户权限仅为非游客登录时,获取第三信息;
根据获取的所述第一信息、第二信息或第三信息,得到所述目标用户基于所述社交网路的第一身份信息。
在一种可能实现的方式中,根据第一聚类处理结果,确定所述目标用户的每类身份信息的类身份属性的过程中,还包括:
基于与所述第一聚类处理的修理标准,对所述目标用户下载和/或浏览的每个社交平台的社交属性进行第二聚类处理,并根据第二聚类处理结果,确定每类社交平台的类社交属性;
确定所述类社交属性与类身份属性是否对应的分类一致;
若一致,继续执行后续操作;
若不一致,则统计分类不一致的所有不一致的第一身份信息和社交平台,并根据统计结果,所述不一致的n个第一身份信息和m个社交平台进行归一化处理;
Figure BDA0002475038870000051
其中,f1表示第一身份信息的归一化函数;f2表示社交平台的归一化函数;i表示n个第一身份信息中的第i个身份信息;j表示m个社交平台中的第i个社交平台;
Figure BDA0002475038870000053
表示第一身份信息的平均函数值;
Figure BDA0002475038870000054
表示社交平台的平均函数值;G表示归一化处理结果;
并将所述归一化处理结果G,作为确定所述类身份属性的身份属性修正参数。
在一种可能实现的方式中,基于构造的所有类社交矩阵,确定所述目标用户的所有社交标识的过程中,包括:
按照预设分裂规则,将所述类社交矩阵分裂为身份矩阵S1和社交矩阵S2,同时确定身份矩阵S1与社交矩阵S2的高斯分布;
确定所述身份矩阵S1与社交矩阵S2之间的信任概率p;
根据身份高斯分布q1、社交高斯分布q2以及信任概率p,同时基于贝叶斯公式,确定所述类社交矩阵的后验概率分布Γ;
基于所述后验概率分布Γ,确定所述类社交矩阵的最小损失函数L;
Figure BDA0002475038870000052
其中,X表示预先设定的所述类社交矩阵中的身份矩阵与社交矩阵的标准信任矩阵;
基于标识数据库,匹配与所述最小损失函数相关的社交标识,进而实现对所有类社交矩阵对应的社交标识的确定。
在一种可能实现的方式中,爬取所述目标用户的每个所述第一身份信息的第一社交信息,并获取每个所述第一社交信息的第一社交特征向量之后,还包括:
对每个所述第一社交信息中的图片社交、语音社交、动画社交、视频社交、文字社交进行社交分类;
确定每个社交分类对应的第一社交场景以及不同社交分类之间对应的第二社交场景,并根据所述第一社交场景和第二社交场景,获得所述第一社交信息的场景属性;
确定每个社交分类对应的第一分类关键点以及不同社交分类之间对应的第二分类关键点,并根据所述第一分类关键点和第二分类关键点,获得所述第一社交信息的关键属性;
根据所述场景属性和关键属性,分析识别所述目标用户的喜好信息;
根据所述喜好信息向所述目标用户的目标端推送相关的交互用户,同时,基于所述社交服务器向所述目标端推送提示信息;
基于所述社交服务器,还向所述交互用户推送同个社交平台同属性目标用户。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于用户身份辨别的社交分析方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供一种基于用户身份辨别的社交分析方法,如图1所示,包括:
步骤1:基于社交平台爬取目标用户的第一身份信息;
步骤2:对爬取的所述目标用户的所有第一身份信息进行第一聚类处理,根据第一聚类处理结果,确定所述目标用户的每类身份信息的类身份属性;
步骤3:爬取所述目标用户的每个所述第一身份信息的第一社交信息,并获取每个所述第一社交信息的第一社交特征向量,并根据每类身份信息的类身份属性,构造对应的类社交矩阵;
步骤4:基于构造的所有类社交矩阵,确定所述目标用户的所有社交标识,进而根据所述所有社交标识,确定所述目标用户的社交特性,完成社交分析。
上述社交平台可以是情感平台、交友平台等该系列的平台。
上述目标用户的第一身份信息,可以是,用户在不同的社交平台,以不同的身份进行注册,如果是在情感交友平台上,可以是以单身、离异等身份注册,或者是以某种爱好(运动)、某种交友需求(年龄)等身份进行注册的;
上述对所有第一身份信息进行聚类处理,例如存在若干个聚类点,且寻找与聚类点近的第一身份信息作为一个聚类集群,且形成的多个聚类集群即为最终形成的第一聚类处理结果,并确定不同聚类集群的类身份属性,其中,类身份属性可以以性别、爱好、态度等进行区分;
例如:当从C社交平台爬取到第一身份信息,并从该C社交平台爬取到第一社交信息,且第一身份信息与第一社交信息是一一对应的关系;
其中,社交平台,可以是通过对用户的目标端(手机端、电脑端等可以连接网络并进入社交平台的设备)进行监测,确定用户所使用过的、正在使用的所有的社交平台;
其中,用户在爬取第一社交信息时,还需要以用户该社交平台的使用时长、使用频率、使用时间等作为社交信息的基础,其次,记录用户在该社交平台上的执行操作、浏览记录、浏览不同界面的浏览时长以及与交互用户的聊天记录等信息,其上述信息都可以作为第一社交信息中的一部分,且第一社交特征向量,是基于第一社交信息的信息参数进行构建的。
如果社交信息的第一社交特征向量为M行1列的特征向量,且每类身份信息的类身份属性对应的类身份矩阵为N行G列,则构造的类社交矩阵为M行G列或者是N行G列,此行数与M和N的大小有关系,其中,M和N中较大的数作为矩阵行数,且通过使用该方式,可以有效的将社交信息和身份信息进行结合,为提高社交可靠性提高数据基础。
上述所有类社交矩阵的数量是要小于爬取的社交平台的数量的,且所有类社交矩阵的数量与所有社交标识的数量相等,且两者是一一对应的关系;
当根据类社交矩阵的特征值,或者是某些阵列值,来确定社交标识,如当特征值为1,对应的社交标识为一类型标识,且根据一类型标识,在标识映射表中寻找映射的社交特性,作为社交分析结果。
上述社交特征,可以是包括该目标用户的社交爱好、社交真实性等信息在内的,是衡量该目标用户的标准。
其中,在一个实施例,通过两方面的影响因素进行筛选,第一方面为与生俱来的,如时间对应性,每个人的出生时间是固定的;如空间对应性,包括原生家庭、工作环境、生活环境等;如身高胖瘦因素,身高胖瘦的和谐比例;如生肖因素,生肖与生俱来,代表出生年份木星与地球的关系;如肤色因素等,加上后天的职业、兴趣爱好、财富状况、健康状况、性格等构成总体的信息能量网,结合中国的五行八卦、天干地支的古老思维,如五行的相生相克、行业的五行属性,八字的相生相克、日干月支时支等、与计算机系统的运行筛选,匹配出正能量的情感筛选,助于正向交友及心态调整,助于日常情绪调整及行为调整。
上述技术方案的有益效果是:通过从若干个社交平台上爬取第一身份信息和第一社交信息,构建类社交矩阵,进而确定用户的社交特性,提高社交可靠性,降低社交风险。
本发明实施例提供一种基于用户身份辨别的社交分析方法,获取每个所述第一社交信息的第一社交特征向量,并根据每类身份信息的类身份属性,构造对应的类社交矩阵的过程中,还包括:
选取所有类社交矩阵对应的社交特征值大于或等于预设特征值的第一社交矩阵对应的第一身份信息;
确定所述第一社交矩阵中的每个第一社交特征向量与对应的选取的第一身份属性的相似度;
保留所述第一社交矩阵中相似度大于预设度的第一社交特征向量,并基于保留的第一社交特征向量,重新构造新的第一社交矩阵。
上述第一社交矩阵是所有类社交矩阵中的一部分,且每个第一社交矩阵即类社交矩阵都有其对应的第一社交特征向量,由于第一社交特征向量与第一身份属性是一一对应的关系,因此,确定,第一社交特征性向量与对应的第一身份属性所对应的身份属性矩阵的相似度;
其中,预设特征值、相似度都是预先设定的,且与用户身份相关联;
根据保留的第一社交特征向量与对应的身份属性矩阵进行相关处理,获得新的第一社交矩阵,其获取的新的第一社交矩阵实质上是将所有第一社交矩阵中的部分矩阵进行剔除。
上述技术方案的有益效果是:便于通过进行相似度判断和特征值判断,对类社交矩阵进行部分剔除,便于在进行社交分析的过程中,其类社交矩阵的数据集中处理,使得其数据具有有效性。
本发明实施例提供一种基于用户身份辨别的社交分析方法,在选取所述第一社交矩阵对应的第一身份信息时,还包括:
筛选所有类社交矩阵对应的社交特征值小于预设特征值的第二社交矩阵E;
将所有所述第一社交矩阵中相似度小于或等于预设度的第一社交特征向量,构造成一个补偿社交矩阵E1;
基于所述补偿社交矩阵E1对所有所述第二社交矩阵E进行补偿处理,获得第三社交矩阵E′;
Figure BDA0002475038870000101
其中,e表示自然常数;λE表示所述补偿矩阵E1的特征值;δE表示所述补偿矩阵E1的误差增益因子。
上述第二社交矩阵是所有类社交矩阵中的一部分,即为除去第一社交矩阵之后的剩余类社交矩阵;
首先获取的第二社交矩阵,是需要进行补偿的;
其次,将第一社交矩阵对应的相似度小于或等于预设度的第一社交特征向量进行构造成补偿社交矩阵,通过其补偿社交矩阵对分别对每个第二社交矩阵进行补偿,获得第三社交矩阵,其获得的所有第三社交矩阵,都可以将其第二社交矩阵进行分别替代,对所有类社交矩阵进行更新。
上述技术方案的有益效果是:通过对第二社交矩阵进行补偿处理,便于将获得的第三社交矩阵对其进行有效替换与更新,进一步保证社交可靠性,降低社交风险。
本发明实施例提供一种基于用户身份辨别的社交分析方法,当完成社交分析之后,还包括:
构建所述目标用户的社交数据链,所述社交数据链中包括:所述目标用户的每类身份信息、每类身份信息对应的类身份属性、社交标识和社交特性;
基于社交服务器,对构建的所述社交数据链及其社交数据进行评级处理,获得预设数目个由高到低的等级数据,并将与所述等级数据一一对应的等级标识传输到所述目标用户的目标端进行标识列显示;
当存在交互用户进行用户搜索时,根据所述交互用户的搜索关键词,向所述交互用户的交互端推送与所述搜索关键词相匹配的匹配用户;
如果所述交互用户与所述匹配用户不是好友关系或者所述交互用户未注册,基于所述社交服务器,自动向所述交互用户的交互端推送与所述匹配用户相关的默认数据;
其中,所述默认数据是基于所述社交服务器,且根据预设规则,自动默认的与低等级标识相关的可查看数据;
如果所述交互用户与所述匹配用户是好友关系且所述交互用户已注册,此时,所述标识列供对应的所述匹配用户选择可被所述交互用户查看的待选择标识,所述交互用户通过选择所述待选择标识,查看与所述匹配用户相关的可查看数据;
如果所述交互用户与所述匹配用户是好友关系且所述交互用户已注册,所述目标用户未基于所述标识列执行任何操作,则基于所述社交服务器向所述交互用户的交互端推送所述默认数据;
其中,基于所述社交服务器还向所述交互用户的交互端推送其他用户对所述默认数据对应的匹配用户的用户评价。
上述社交数据包括文本张贴、评论、回复、图片、声音和显示在社交站点的视频等数据;
上述对社交数据链及其社交数据进行评级处理,是为了对获取的目标用户的用户信息进行等级划分,即等级越高对应的保密性越强;
例如存在5个数据等级,第1等级对应的内容包括:昵称、社交号;第2等级对应的内容包括:爱好、婚姻状况;第3等级对应的内容包括:地址、联系方式;第4等级对应的内容包括:经济状况、工作能力;第5等级对应的内容包括:身份证等。
且不同等级显示不同的标识,并将其5中标识自动生成标识列进行显示。
上述默认设置为低等级对应的数据,是为了进一步对目标用户的隐私进行保护,提高其在社交中的安全性。
其中,通过对用户身份进行辨别,还有可以有效的将同类型的用户进行统一归类,如按照职业进行划分,当交互用户输入搜索关键词时,如医生,此时可以按照职业属性向用户推送匹配用户。
通过对交互用户的注册行为和好友行为进行分类分析,便于自动推送对应的数据,即默认数据或者是按照目标用户选择的待选择标识对应的数据;
只有当匹配用户与交互用户是好友关系时,才有可能显示除去默认数据之外的其他数据,便于保护匹配用户的隐私,提高社交安全性。
上述交互用户可通过查看评论,可以直观的选择是否需要与该匹配用户交互,进一步保护该交互用户。
上述技术方案的有益效果是:通过设置标识列,一是为了方便匹配用户进行选择可显示的等级,便于交互用户查看,二是为了保护匹配用户的隐私,提高社交安全,降低社交风险。
本发明实施例提供一种基于用户身份辨别的社交分析方法,当存在交互用户进行用户搜索时,根据所述交互用户的搜索关键词,向所述交互用户的交互端推送与所述搜索关键词相匹配的匹配用户的过程中包括:
根据所述搜索关键词,基于所述社交服务器进行第一用户集群的初次筛选,且所述初次筛选的过程中包括:
基于预先设定的聚类点,确定所述第一用户集群中的每个用户与所述聚类点的聚类距离,将所述聚类距离小于预设距离的用户删除,得到第二用户集群;
深度挖掘所述第二用户集群中每个用户的综合社交信息和与所述交互用户处于同一社交平台的独立社交信息;
基于所述同一社交平台的社交属性,且根据每个用户的综合社交信息和独立社交信息,基于所述社交服务器进行所述第二用户集群中的再次筛选,获得第三用户集群;
同时,对所述第三用户集群中的每个用户进行与所述搜索关键词的由高到低的相关性的排序,并输出到所述交互用户的交互端进行显示;
在向所述交互用户推送用户的过程中,还根据所述用户的选择属性进行推送。
上述聚类点是预先定好的,如可以是一个目标关键词等;
上述聚类距离,可以是搜索关键词与目标关键词之间的聚类值,或者是相关值,上述预设距离是根据社交安全标准进行设定的;
上述第一用户集群的数量大于第二用户集群的数量,第二用户集群的数量大于第三用户集群的数量;
上述深度挖掘综合社交信息,是挖掘的用户接触到的所有社交平台的所有第一社交信息;
当交互用户在C社交平台进行关键词搜索时,则获取相匹配的用户在C平台的社交信息,即为独立社交信息,是因为只包括同一个社交平台的数据在内的;
上述选择属性,是用户提前设定好的,如果该用户选择默认不被推送,则即是该用户与交互用户的相关性很高,也不推送该用户给交互用户,提高其信息的保密性。
上述技术方案的有益效果是:通过初次筛选,剔除无关用户,减少后续数据分析的时间,通过再次筛选,确保获得的第三用户集群的可靠性,通过按照相关性进行输出,是为了为交互用户提供更加贴合的可交互的用户,通过获取综合交互信息和单独交互信息不仅是为了获取更加贴合的可交互的用户,还是为了能够保证社交安全。
本发明实施例提供一种基于用户身份辨别的社交分析方法,所述基于社交平台爬取目标用户的第一身份信息的步骤包括:
统计所述目标用户的目标端的社交平台;
判断所述目标用户基于每个所述社交平台的用户权限;
当所述用户权限为游客登录时,获取第一信息;
或,当所述用户权限为非游客且会员登录时,获取第二信息;
或,当所述用户权限仅为非游客登录时,获取第三信息;
根据获取的所述第一信息、第二信息或第三信息,得到所述目标用户基于所述社交网路的第一身份信息。
上述第一信息,可以仅仅为在社交平台上的浏览记录,上述第二信息,可是在社交平台的浏览记录、浏览时长、VIP身份信息等,上述第三信息可以是在社交平台的浏览记录、浏览时长、普通身份信息。
上述技术方案的有益效果是:通过根据不同的用户权限获取不同的用户信息,进而通过若干个不同的社交平台进行获取,确保获取的第一身份信息的完整性。
本发明实施例提供一种基于用户身份辨别的社交分析方法,根据第一聚类处理结果,确定所述目标用户的每类身份信息的类身份属性的过程中,还包括:
基于与所述第一聚类处理的修理标准,对所述目标用户下载和/或浏览的每个社交平台的社交属性进行第二聚类处理,并根据第二聚类处理结果,确定每类社交平台的类社交属性;
确定所述类社交属性与类身份属性是否对应的分类一致;
若一致,继续执行后续操作;
若不一致,则统计分类不一致的所有不一致的第一身份信息和社交平台,并根据统计结果,所述不一致的n个第一身份信息和m个社交平台进行归一化处理;
Figure BDA0002475038870000151
其中,f1表示第一身份信息的归一化函数;f2表示社交平台的归一化函数;i表示n个第一身份信息中的第i个身份信息;j表示m个社交平台中的第i个社交平台;
Figure BDA0002475038870000152
表示第一身份信息的平均函数值;
Figure BDA0002475038870000153
表示社交平台的平均函数值;G表示归一化处理结果;
并将所述归一化处理结果G,作为确定所述类身份属性的身份属性修正参数。
上述技术方案的有益效果是:通过对社交平台进行归一化处理,便于作为对类身份属性进行修正的参数,提高其类身份属性的准确性,避免某些数据特性的丢失,进而为提高社交安全提供保障。
本发明实施例提供一种基于用户身份辨别的社交分析方法,基于构造的所有类社交矩阵,确定所述目标用户的所有社交标识的过程中,包括:
按照预设分裂规则,将所述类社交矩阵分裂为身份矩阵S1和社交矩阵S2,同时确定身份矩阵S1与社交矩阵S2的高斯分布;
确定所述身份矩阵S1与社交矩阵S2之间的信任概率p;
根据身份高斯分布q1、社交高斯分布q2以及信任概率p,同时基于贝叶斯公式,确定所述类社交矩阵的后验概率分布Γ;
基于所述后验概率分布Γ,确定所述类社交矩阵的最小损失函数L;
Figure BDA0002475038870000154
其中,X表示预先设定的所述类社交矩阵中的身份矩阵与社交矩阵的标准信任矩阵;
基于标识数据库,匹配与所述最小损失函数相关的社交标识,进而实现对所有类社交矩阵对应的社交标识的确定。
上述技术方案的有益效果是:通过对类社交矩阵进行分裂,并分别以身份矩阵和社交矩阵为基础,计算获得高斯分布、信任概率,并基于后验概率分布,确定最小损失函数,为保证其类社交矩阵的可靠性提高基础,通过匹配相关的社交标识,为确定社交特性提供便利,且通过一系列计算,也是为了提高社交安全性,降低社交风险。
本发明实施例提供一种基于用户身份辨别的社交分析方法,爬取所述目标用户的每个所述第一身份信息的第一社交信息,并获取每个所述第一社交信息的第一社交特征向量之后,还包括:
对每个所述第一社交信息中的图片社交、语音社交、动画社交、视频社交、文字社交进行社交分类;
确定每个社交分类对应的第一社交场景以及不同社交分类之间对应的第二社交场景,并根据所述第一社交场景和第二社交场景,获得所述第一社交信息的场景属性;
确定每个社交分类对应的第一分类关键点以及不同社交分类之间对应的第二分类关键点,并根据所述第一分类关键点和第二分类关键点,获得所述第一社交信息的关键属性;
根据所述场景属性和关键属性,分析识别所述目标用户的喜好信息;
根据所述喜好信息向所述目标用户的目标端推送相关的交互用户,同时,基于所述社交服务器向所述目标端推送提示信息;
基于所述社交服务器,还向所述交互用户推送同个社交平台同属性目标用户。
上述用户的喜好,例如可以是喜欢运动、喜欢美食等喜好,且用户的生活习性等喜好;
且交互用户可以通过其喜好,确定是否与该用户进行交互,且发送提示信息,一是提醒目标用户平台进行了推送,二是提醒用户是否需要执行一些操作,如是否可以被平台进行推送等操作。
上述同个社交平台同属性目标用户,例如是以用户的职业为属性进行推送的,便于进行有效交互。
上述不同社交分类可以是图片社交、语音社交、动画社交、视频社交、文字社交进行社交分类中至少两类进行分析;
例如图片社交对应的第一社交场景为运动圈交友场景,视频社交和文字社交对应的第二社交场景为美食圈交友场景等,对应的场景属性为,健身场所;
上述图片社交第一关键点为美食,图片社交与语音社交的第二关键点为运动,则获取的关键属性为减肥。
上述技术方案的有益效果是:通过对第一社交信息进行社交分类分析,且确定不同分类的社交场景和关键点,便于精准识别用户的喜好,通过推送提示信息,便于方便及时提醒目标用户是否可以被推送,便于保护目标用户的隐私,通过推送同属性的目标用户,便于进行有效交互。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种基于用户身份辨别的社交分析方法,其特征在于,包括:
基于社交平台爬取目标用户的第一身份信息;
对爬取的所述目标用户的所有第一身份信息进行第一聚类处理,根据第一聚类处理结果,确定所述目标用户的每类身份信息的类身份属性;
爬取所述目标用户的每个所述第一身份信息的第一社交信息,并获取每个所述第一社交信息的第一社交特征向量,并根据每类身份信息的类身份属性,构造对应的类社交矩阵;
基于构造的所有类社交矩阵,确定所述目标用户的所有社交标识,进而根据所述所有社交标识,确定所述目标用户的社交特性,完成社交分析;
获取每个所述第一社交信息的第一社交特征向量,并根据每类身份信息的类身份属性,构造对应的类社交矩阵的过程中,还包括:
选取所有类社交矩阵对应的社交特征值大于或等于预设特征值的第一社交矩阵对应的第一身份信息;
确定所述第一社交矩阵中的每个第一社交特征向量与对应的选取的第一身份属性的相似度;
保留所述第一社交矩阵中相似度大于预设度的第一社交特征向量,并基于保留的第一社交特征向量,重新构造新的第一社交矩阵。
2.如权利要求1所述的社交分析方法,其特征在于,在选取所述第一社交矩阵对应的第一身份信息时,还包括:
筛选所有类社交矩阵对应的社交特征值小于预设特征值的第二社交矩阵E;
将所有所述第一社交矩阵中相似度小于或等于预设度的第一社交特征向量,构造成一个补偿社交矩阵E1;
基于所述补偿社交矩阵E1对所有所述第二社交矩阵E进行补偿处理,获得第三社交矩阵E′;
Figure FDA0002873449290000021
其中,e表示自然常数;λE表示所述补偿社交矩阵E1的特征值;δE表示所述补偿社交矩阵E1的误差增益因子。
3.如权利要求1所述的社交分析方法,其特征在于,当完成社交分析之后,还包括:
构建所述目标用户的社交数据链,所述社交数据链中包括:所述目标用户的每类身份信息、每类身份信息对应的类身份属性、社交标识和社交特性;
基于社交服务器,对构建的所述社交数据链及其社交数据进行评级处理,获得预设数目个由高到低的等级数据,并将与所述等级数据一一对应的等级标识传输到所述目标用户的目标端进行标识列显示;
当存在交互用户进行用户搜索时,根据所述交互用户的搜索关键词,向所述交互用户的交互端推送与所述搜索关键词相匹配的匹配用户;
如果所述交互用户与所述匹配用户不是好友关系或者所述交互用户未注册,基于所述社交服务器,自动向所述交互用户的交互端推送与所述匹配用户相关的默认数据;
其中,所述默认数据是基于所述社交服务器,且根据预设规则,自动默认的与低等级标识相关的可查看数据;
如果所述交互用户与所述匹配用户是好友关系且所述交互用户已注册,此时,所述标识列供对应的所述匹配用户选择可被所述交互用户查看的待选择标识,所述交互用户通过选择所述待选择标识,查看与所述匹配用户相关的可查看数据;
如果所述交互用户与所述匹配用户是好友关系且所述交互用户已注册,所述目标用户未基于所述标识列执行任何操作,则基于所述社交服务器向所述交互用户的交互端推送所述默认数据;
其中,基于所述社交服务器还向所述交互用户的交互端推送其他用户对所述默认数据对应的匹配用户的用户评价。
4.如权利要求3所述的社交分析方法,其特征在于,当存在交互用户进行用户搜索时,根据所述交互用户的搜索关键词,向所述交互用户的交互端推送与所述搜索关键词相匹配的匹配用户的过程中包括:
根据所述搜索关键词,基于所述社交服务器进行第一用户集群的初次筛选,且所述初次筛选的过程中包括:
基于预先设定的聚类点,确定所述第一用户集群中的每个用户与所述聚类点的聚类距离,将所述聚类距离小于预设距离的用户删除,得到第二用户集群;
深度挖掘所述第二用户集群中每个用户的综合社交信息和与所述交互用户处于同一社交平台的独立社交信息;
基于所述同一社交平台的社交属性,且根据每个用户的综合社交信息和独立社交信息,基于所述社交服务器进行所述第二用户集群中的再次筛选,获得第三用户集群;
同时,对所述第三用户集群中的每个用户进行与所述搜索关键词的由高到低的相关性的排序,并输出到所述交互用户的交互端进行显示。
5.如权利要求1所述的社交分析方法,其特征在于,所述基于社交平台爬取目标用户的第一身份信息的步骤包括:
统计所述目标用户的目标端的社交平台;
判断所述目标用户基于每个所述社交平台的用户权限;
当所述用户权限为游客登录时,获取第一信息;
或,当所述用户权限为非游客且会员登录时,获取第二信息;
或,当所述用户权限仅为非游客登录时,获取第三信息;
根据获取的所述第一信息、第二信息或第三信息,得到所述目标用户基于所述社交平台的第一身份信息。
6.如权利要求1所述的社交分析方法,其特征在于,根据第一聚类处理结果,确定所述目标用户的每类身份信息的类身份属性的过程中,还包括:
基于与所述第一聚类处理的修理标准,对所述目标用户下载和/或浏览的每个社交平台的社交属性进行第二聚类处理,并根据第二聚类处理结果,确定每类社交平台的类社交属性;
确定所述类社交属性与类身份属性是否对应的分类一致;
若一致,继续执行后续操作;
若不一致,则统计分类不一致的所有不一致的第一身份信息和社交平台,并根据统计结果,所述不一致的n个第一身份信息和m个社交平台进行归一化处理;
Figure FDA0002873449290000041
其中,f1表示第一身份信息的归一化函数;f2表示社交平台的归一化函数;i表示n个第一身份信息中的第i个身份信息;j表示m个社交平台中的第i个社交平台;
Figure FDA0002873449290000042
表示第一身份信息的平均函数值;
Figure FDA0002873449290000043
表示社交平台的平均函数值;G表示归一化处理结果;
并将所述归一化处理结果G,作为确定所述类身份属性的身份属性修正参数。
7.如权利要求1所述的社交分析方法,其特征在于,基于构造的所有类社交矩阵,确定所述目标用户的所有社交标识的过程中,包括:
按照预设分裂规则,将所述类社交矩阵分裂为身份矩阵S1和社交矩阵S2,同时确定身份矩阵S1与社交矩阵S2的高斯分布;
确定所述身份矩阵S1与社交矩阵S2之间的信任概率p;
根据身份高斯分布q1、社交高斯分布q2以及信任概率p,同时基于贝叶斯公式,确定所述类社交矩阵的后验概率分布Γ;
基于所述后验概率分布Γ,确定所述类社交矩阵的最小损失函数L;
Figure FDA0002873449290000051
其中,X表示预先设定的所述类社交矩阵中的身份矩阵与社交矩阵的标准信任矩阵;
基于标识数据库,匹配与所述最小损失函数相关的社交标识,进而实现对所有类社交矩阵对应的社交标识的确定。
8.如权利要求1所述的社交分析方法,其特征在于,爬取所述目标用户的每个所述第一身份信息的第一社交信息,并获取每个所述第一社交信息的第一社交特征向量之后,还包括:
对每个所述第一社交信息中的图片社交、语音社交、动画社交、视频社交、文字社交进行社交分类;
确定每个社交分类对应的第一社交场景以及不同社交分类之间对应的第二社交场景,并根据所述第一社交场景和第二社交场景,获得所述第一社交信息的场景属性;
确定每个社交分类对应的第一分类关键点以及不同社交分类之间对应的第二分类关键点,并根据所述第一分类关键点和第二分类关键点,获得所述第一社交信息的关键属性;
根据所述场景属性和关键属性,分析识别所述目标用户的喜好信息;
根据所述喜好信息向所述目标用户的目标端推送相关的交互用户,同时,基于社交服务器向所述目标端推送提示信息;
基于所述社交服务器,还向所述交互用户推送同个社交平台同属性目标用户。
CN202010361134.1A 2020-06-05 2020-06-05 一种基于用户身份辨别的社交分析方法 Active CN111581522B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010361134.1A CN111581522B (zh) 2020-06-05 2020-06-05 一种基于用户身份辨别的社交分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010361134.1A CN111581522B (zh) 2020-06-05 2020-06-05 一种基于用户身份辨别的社交分析方法

Publications (2)

Publication Number Publication Date
CN111581522A CN111581522A (zh) 2020-08-25
CN111581522B true CN111581522B (zh) 2021-03-09

Family

ID=72112021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010361134.1A Active CN111581522B (zh) 2020-06-05 2020-06-05 一种基于用户身份辨别的社交分析方法

Country Status (1)

Country Link
CN (1) CN111581522B (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101420313B (zh) * 2007-10-22 2011-01-12 北京搜狗科技发展有限公司 一种针对客户端用户群进行聚类的方法和系统
CN102521248B (zh) * 2011-11-14 2015-01-07 北京亿赞普网络技术有限公司 一种网络用户分类方法及其装置
CN106055661B (zh) * 2016-06-02 2017-11-17 福州大学 基于多Markov链模型的多兴趣资源推荐方法
CN107330115B (zh) * 2017-07-12 2020-04-28 广东工业大学 一种信息推荐方法及装置
CN108363804B (zh) * 2018-03-01 2020-08-21 浙江工业大学 基于用户聚类的局部模型加权融合Top-N电影推荐方法
CN108549727B (zh) * 2018-05-02 2021-11-23 上海财经大学 基于网络爬虫以及大数据分析的用户获利信息推送方法
CN110544109A (zh) * 2019-07-25 2019-12-06 深圳壹账通智能科技有限公司 用户画像生成方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111581522A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
KR101009830B1 (ko) 사회망에서 사용자들의 일치성 점수화
US8812519B1 (en) Face photograph-based dating recommendation system
US20140095308A1 (en) Advertisement distribution apparatus and advertisement distribution method
US20140207699A1 (en) Recruiting service graphical user interface
CN108228745B (zh) 一种基于协同过滤优化的推荐算法和装置
US20180068028A1 (en) Methods and systems for identifying same users across multiple social networks
KR101450526B1 (ko) 친구 추천 장치 및 방법
Obradovich et al. Expanding the measurement of culture with a sample of two billion humans
CN109325115B (zh) 一种角色分析方法及分析系统
CN107688605A (zh) 跨平台数据匹配方法、装置、计算机设备和存储介质
CN105894028B (zh) 用户识别方法和装置
CN111143555B (zh) 基于大数据的客户画像生成方法、装置、设备及存储介质
KR101123697B1 (ko) 공통 관심 사용자 검색장치 및 방법
KR20170027576A (ko) 연구 이력 매칭 기반의 연구자 추천 장치 및 방법
CN113934941A (zh) 一种基于多维度信息的用户推荐系统及方法
CN110766489A (zh) 请求内容及提供内容的方法和相应设备
KR101577716B1 (ko) 배우자 지수 중요도 비율 기반 최적커플 만남 주선 방법
US9946736B2 (en) Constructing a database of verified individuals
CN111581522B (zh) 一种基于用户身份辨别的社交分析方法
JP6960838B2 (ja) 情報提供装置、情報提供方法、およびプログラム
CN110688516A (zh) 图像检索方法、装置、计算机设备和存储介质
KR20200036373A (ko) 맞춤형 페르소나 관리서버 및 그 관리 방법
EP3985591A2 (en) Preference evaluation method and system
CN114511085A (zh) 实体属性值的识别方法、装置、设备、介质及程序产品
JP3674430B2 (ja) 情報提供サーバ及び情報提供方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant