CN111506823A - 信息推荐方法、装置及计算机设备 - Google Patents

信息推荐方法、装置及计算机设备 Download PDF

Info

Publication number
CN111506823A
CN111506823A CN202010164391.6A CN202010164391A CN111506823A CN 111506823 A CN111506823 A CN 111506823A CN 202010164391 A CN202010164391 A CN 202010164391A CN 111506823 A CN111506823 A CN 111506823A
Authority
CN
China
Prior art keywords
information
user
users
complex network
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010164391.6A
Other languages
English (en)
Inventor
韩明超
方卫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010164391.6A priority Critical patent/CN111506823A/zh
Publication of CN111506823A publication Critical patent/CN111506823A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种信息推荐方法、装置及计算机设备,涉及计算机技术领域,可实现更为精准的信息推荐,做到更人性化的信息推荐,可实现有针对性地为有需要的用户提供合适的推荐信息。其中方法包括:采集用户之间具有关系信息的用户数据;根据采集到的所述用户数据,构建复杂网络关系图谱,其中,所述复杂网络关系图谱用于针对多维度特征确定用户之间是否具有关系信息,以及关系信息对应的程度信息;利用所述复杂网络关系图谱,获取待推荐用户所属的目标人群,所述目标人群中用户各自对应的复杂网络关系之间的相似度大于预设阈值;依据所述目标人群的信息获取记录,生成所述待推荐用户对应的推荐信息。本申请适用于信息推荐处理。

Description

信息推荐方法、装置及计算机设备
技术领域
本申请涉及计算机技术领域,尤其是涉及到一种信息推荐方法、装置及计算机设备。
背景技术
随着互联网的快速发展,为人们的生活带来了许多便利,同时也带来了海量的数据信息。在推荐场景中,推荐系统可以基于信息推荐模型来为用户提供感兴趣的内容,并将在线资源有针对性的推荐给这些可能感兴趣的用户。
目前,可利用用户获取信息的历史大数据,基于逻辑回归算法或其他机器学习算法训练得到预测模型,然后利用该预测模型预测未来出现较大概率能被用户接受的推荐信息,进而按照模型预测结果进行相应的信息推荐。
然而,这种信息推荐方式,不仅依赖于模型训练集的数据质量,还依赖于算法本身,可能训练得到的模型不是很适用于该推荐场景,造成信息推荐不够精准,无法实现有针对性地为有需要的用户提供合适的推荐信息。
发明内容
有鉴于此,本申请提供了一种信息推荐方法、装置及计算机设备,主要目的在于解决目前现有技术中会造成信息推荐不够精准,无法实现有针对性地为有需要的用户提供合适的推荐信息的技术问题。
根据本申请的一个方面,提供了一种信息推荐方法,该方法包括:
采集用户之间具有关系信息的用户数据;
根据采集到的所述用户数据,构建复杂网络关系图谱,其中,所述复杂网络关系图谱用于针对多维度特征确定用户之间是否具有关系信息,以及关系信息对应的程度信息;
利用所述复杂网络关系图谱,获取待推荐用户所属的目标人群,所述目标人群中用户各自对应的复杂网络关系之间的相似度大于预设阈值;
依据所述目标人群的信息获取记录,生成所述待推荐用户对应的推荐信息。
可选的,所述采集具有关系信息的用户数据,具体包括:
采集多个用户的用户特征数据,所述用户特征数据至少包括用户基础数据和用户行为数据;
对采集到的所述用户特征数据进行预处理;
将预处理后的用户特征数据,通过确定用户之间存在的共同特征进行关系型数据加工,得到用户之间具有关系信息的用户数据。
可选的,所述根据采集到的所述用户数据,构建复杂网络关系图谱,具体包括:
创建多维度的关系指标;
根据针对同一关系指标具有共同特征的所述用户数据,构建同一个社区网络;
依据构建的各个社区网络,构建复杂网络关系图谱,其中,所述复杂网络关系图谱由节点和边组成,所述节点代表用户,两个节点连接的边代表用户之间具有关系信息。
可选的,所述根据针对同一关系指标具有共同特征的所述用户数据,构建同一个社区网络,具体包括:
将所述用户数据各自对应用户所处的地域信息进行整合并划分蜂窝区间,使得同一蜂窝区间内的用户之间具有地域性的关系信息,以便基于同一蜂窝区间内用户各自对应的节点,构建同一个社区网络;和/或,
将所述用户数据按照共同特征进行层次聚类,使得所述用户数据各自对应用户的节点按照层次聚类结果进行聚集,构建同一个社区网络。
可选的,所述依据构建的各个社区网络,构建复杂网络关系图谱,具体包括:
将各个社区网络进行合并,得到所述复杂网络关系图谱;
对所述复杂网络关系图谱中未连边的两个节点,利用预测连边概率模型进行预测连边概率,其中,所述预测连边概率模型是利用已构建的目标图谱作为训练集训练得到的,所述目标图谱与所述复杂网络关系图谱之间的相似度大于预定阈值;
若所述连边概率大于预设阈值,则将所述未连边的两个节点进行连边处理。
可选的,所述利用所述复杂网络关系图谱,获取待推荐用户所属的目标人群,具体包括:
在所述复杂网络关系图谱中,获取与待推荐信息主题内容相关的、且连接边数大于预设边数阈值的目标节点;
根据与所述目标节点存在连边的节点划分人群;
依据所述待推荐用户的节点所在的人群,确定所述待推荐用户所属的目标人群。
可选的,所述对采集到的所述用户特征数据进行预处理,具体包括:
对所述用户特征数据进行数据清洗,去除重复数据和异常数据。
根据本申请的另一个方面,提供了一种信息推荐装置,该装置包括:
采集模块,用于采集用户之间具有关系信息的用户数据;
构建模块,用于根据采集到的所述用户数据,构建复杂网络关系图谱,其中,所述复杂网络关系图谱用于针对多维度特征确定用户之间是否具有关系信息,以及关系信息对应的程度信息;
获取模块,用于利用所述复杂网络关系图谱,获取待推荐用户所属的目标人群,所述目标人群中用户各自对应的复杂网络关系之间的相似度大于预设阈值;
生成模块,用于依据所述目标人群的信息获取记录,生成所述待推荐用户对应的推荐信息。
可选的,所述采集模块,具体用于采集多个用户的用户特征数据,所述用户特征数据至少包括用户基础数据和用户行为数据;对采集到的所述用户特征数据进行预处理;将预处理后的用户特征数据,通过确定用户之间存在的共同特征进行关系型数据加工,得到用户之间具有关系信息的用户数据。
可选的,所述构建模块,具体用于创建多维度的关系指标;根据针对同一关系指标具有共同特征的所述用户数据,构建同一个社区网络;依据构建的各个社区网络,构建复杂网络关系图谱,其中,所述复杂网络关系图谱由节点和边组成,所述节点代表用户,两个节点连接的边代表用户之间具有关系信息。
可选的,所述构建模块,具体还用于将所述用户数据各自对应用户所处的地域信息进行整合并划分蜂窝区间,使得同一蜂窝区间内的用户之间具有地域性的关系信息,以便基于同一蜂窝区间内用户各自对应的节点,构建同一个社区网络;和/或,将所述用户数据按照共同特征进行层次聚类,使得所述用户数据各自对应用户的节点按照层次聚类结果进行聚集,构建同一个社区网络。
可选的,所述构建模块,具体还用于将各个社区网络进行合并,得到所述复杂网络关系图谱;对所述复杂网络关系图谱中未连边的两个节点,利用预测连边概率模型进行预测连边概率,其中,所述预测连边概率模型是利用已构建的目标图谱作为训练集训练得到的,所述目标图谱与所述复杂网络关系图谱之间的相似度大于预定阈值;若所述连边概率大于预设阈值,则将所述未连边的两个节点进行连边处理。
可选的,所述获取模块,具体用于在所述复杂网络关系图谱中,获取与待推荐信息主题内容相关的、且连接边数大于预设边数阈值的目标节点;根据与所述目标节点存在连边的节点划分人群;获取所述待推荐用户所属的目标人群,并将所述目标人群中的用户确定为与待推荐用户具有相似行为的目标用户。
可选的,所述采集模块,具体还用于对所述用户特征数据进行数据清洗,去除重复数据和异常数据。
根据本申请的又一个方面,提供了一种非易失性可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述信息推荐方法。
根据本申请的再一个方面,提供了一种计算机设备,包括非易失性可读存储介质、处理器及存储在非易失性可读存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述信息推荐方法。
借由上述技术方案,本申请提供的一种信息推荐方法、装置及计算机设备。首先采集用户之间具有关系信息的用户数据,再根据采集到的用户数据,构建复杂网络关系图谱,该复杂网络关系图谱可用于针对多维度特征确定用户之间是否具有关系信息,以及关系信息对应的程度信息;然后利用复杂网络关系图谱,获取待推荐用户所属的目标人群,该目标人群中用户各自对应的复杂网络关系之间的相似度大于预设阈值,即获取与待推荐用户具有相似行为的目标用户,进而可依据目标用户的信息获取记录,生成待推荐用户对应的推荐信息。与目前通过预测模型预测推荐信息相比,本申请基于海量数据,利用较先进的复杂网络关系图谱技术,建立人与人关系场景以及关系程度,可精准定位人与人之间的关系,然后利用该复杂网络关系图谱,找到与待推荐用户具有相似行为的目标用户,进而通过目标用户的信息获取记录,向待推荐用户推荐相应的信息,可实现更为精准的信息推荐,做到更人性化的推荐,可实现有针对性地为有需要的用户提供合适的推荐信息。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本地申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种信息推荐方法的流程示意图;
图2示出了本申请实施例提供的另一种信息推荐方法的流程示意图;
图3示出了本申请实施例提供的一种复杂网络关系图谱实例示意图;
图4示出了本申请实施例提供的一种信息推荐装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合。
针对目前通过预测模型预测推荐信息,会造成信息推荐不够精准,无法实现有针对性地为有需要的用户提供合适的推荐信息的技术问题,本实施例提供了一种信息推荐方法,如图1所示,该方法包括:
101、采集用户之间具有关系信息的用户数据。
其中,用户数据可包括用户基础数据(如年龄、性别、职业、公司、居住地、户口所在地、上学经历、工作经历、家庭信息等)和用户行为数据(如活动范围轨迹,活动行为内容,信息获取记录等)等。用户之间具有关系信息的用户数据,可为关系型数据,即业务场景下数据与数据之间的关系,在本实施例中,主要采集用户之间具有关系信息的用户数据。例如,用户之间具有共同特征的用户数据等。
对于本实施例的执行主体可为信息推荐处理的装置或设备,可配置在客户端侧或者服务器侧。
102、根据采集到的用户数据,构建复杂网络关系图谱。
其中,复杂网络关系图谱用于针对多维度特征(如工作经历、上学经历、居住地、亲属好友、兴趣爱好等维度的特征)确定用户之间是否具有关系信息,以及关系信息对应的程度信息。复杂网络可以呈现出高度复杂性的网络。在本实施例中,复杂网络可由节点、边等元素组成,节点可代表用户(如身份号或手机号等所对应的用户),也可以根据实际需求代表一件事情,需要说明的是,本实施例主要以用户节点作为实例进行说明。而两个节点连接的边可代表用户之间具有关系(如针对某一维度特征用户之间具有共同特征),并且为了体现出该关系信息的程度信息,可执行共同特征维度计数。
例如,如果针对多个维度特征,两个节点的用户之间都具有共同特征,如工作经历、上学经历、居住地、亲属好友这四个维度都有共同特征,那么可计数为4(具体计数规则可根据实际需求而定,实际应用还可针对某一维度更具体的关系程度进行加权,如两个用户不仅是同一小学念书,而且还是同班同学,那么上学经历这一维度特征可得到1.5的计数加权),最终可通过共同特征维度计数,说明两个连边节点之间的关系程度,计数分数越高,说明两个节点用户之间的关系越密切。
当某个节点与众多节点都存在连边(即连边数大于一定阈值)时,可说明该节点对应的用户与众多用户之间都存在关系,相当于一个主要节点,影响着其他众多节点。根据实际业务场景需求,构建得到的复杂网络关系图谱中可有成千上百万的节点和边。
在本实施例中,可基于海量数据,利用较先进的复杂网络关系图谱技术,建立人与人关系场景以及关系程度,可精准定位人与人的关系,给出更精确的人与人关系的分析结果。
103、利用复杂网络关系图谱,获取待推荐用户所属的目标人群。
其中,目标人群中用户各自对应的复杂网络关系之间的相似度大于预设阈值,相当于这些用户具有相似的复杂网络关系,说明这些用户在一定程度上具有相似的行为。
例如,复杂网络关系图谱主要是由节点和边等元素组成,从该复杂网络关系图谱中获取与待推荐信息主题相关的目标节点,该目标节点可以是与众多用户节点都有连边(具有关系)的节点,相当于这些与该目标节点之间存在连边的节点可为与待推荐信息主题相关的一类人群。在实际业务场景当中,复杂网络关系图谱中与待推荐信息主题相关的目标节点可能存在多个,通过这些个目标节点可定义各个人群。在定义这些人群之后,可判断待推荐用户属于其中的哪个人群,进而可确定待推荐用户所属的目标人群,确定那些与待推荐用户具有相似行为的目标用户。
104、依据目标人群的信息获取记录,生成待推荐用户对应的推荐信息。
其中,信息获取记录中可包含目标人群用户对目标信息成功获取的历史记录,该目标信息可为与当前待推荐信息主题内容相同或相关的信息。对于本实施例,为了保证推荐精准性,可从这些历史记录中提取与当前推荐时间段临近的时间段(如当前推荐时间段对应的时间点与历史获取目标信息的时间点之间的时长小于一定阈值),即最近时间段内该目标用户对目标信息成功获取的历史记录。然后依据这些比较新的历史记录,生成待推荐用户对应的推荐信息,可提高信息推荐的精准性。
需要说明的是,本方案中的复杂网络关系图谱技术除了应用到信息推荐的场景以外,还可应用在金融风险控制、精准营销、精准推荐、关系预测等多种业务场景下,做到在某一场景下精准定位人与人的关系,以满足各种业务场景需求。
本实施例提供的一种信息推荐方法。首先采集用户之间具有关系信息的用户数据,再根据采集到的用户数据,构建复杂网络关系图谱,该复杂网络关系图谱可用于针对多维度特征确定用户之间是否具有关系信息,以及关系信息对应的程度信息;然后利用复杂网络关系图谱,获取待推荐用户所属的目标人群,该目标人群中用户各自对应的复杂网络关系之间的相似度大于预设阈值,即获取与待推荐用户具有相似行为的目标用户,进而可依据目标用户的信息获取记录,生成待推荐用户对应的推荐信息。与目前通过预测模型预测推荐信息相比,本实施例基于海量数据,利用较先进的复杂网络关系图谱技术,建立人与人关系场景以及关系程度,可精准定位人与人之间的关系,然后利用该复杂网络关系图谱,找到与待推荐用户具有相似行为的目标用户,进而通过目标用户的信息获取记录,向待推荐用户推荐相应的信息,可实现更为精准的信息推荐,做到更人性化的推荐,可实现有针对性地为有需要的用户提供合适的推荐信息,可提升该用户获取自身需要业务服务的几率,从而可提高业务服务的成功率。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例中的具体实施过程,提供了另一种信息推荐方法,如图2所示,该方法包括:
201、采集多个用户的用户特征数据。
其中,用户特征数据至少可包括用户基础数据和用户行为数据。
在本实施例中,可通过客户端侧记录这些用户特征数据,然后上传至系统后台,还可以通过其他平台或第三方中获取得到这些用户特征数据,最后汇总得到大量不同用户的用户特征数据。
202、对采集到的用户特征数据进行预处理。
作为一种可选方式,步骤202具体可包括:对采集到的用户特征数据进行数据清洗,去除重复数据和异常数据。例如,将采集到的重复数据删除,以及将一些异常的数据删除等。通过这种可选的预处理方式,可保证后续构建复杂网络关系图谱时,用到的都是有效的、非重复的数据,避免使用无效的、重复的数据,可提高构建复杂网络关系图谱的准确性和效率。
203、将预处理后的用户特征数据,通过确定用户之间存在的共同特征进行关系型数据加工,得到用户之间具有关系信息的用户数据。
将数据清洗后的用户数据进行关系型数据加工,具体可将单一数据通过关系指标(如共同特征)加工为关系型数据。
对于本实施例,可根据用户基础数据、用户行为数据等,找到具有共同特征的用户数据,作为具有关系型的用户数据。例如,同一居住区域(如居住地相同或相近)的用户数据、有过电话沟通记录的用户数据、在同一时间段都前往过目标地点的用户数据、上学期间都在同一所中学上学的用户数据、在同一时间段都在同一家单位任职的用户数据、家庭关系具有相同亲属的用户数据、都使用过同一个手机的用户数据等。
在采集到这些具有关系型的用户数据,可将采集到的具有关系型的用户数据进行存储。需要说明的是,与普通单一的存储数据方式相比,由于这些具有关系型的用户数据的存储是多维度数据的存储,所以存储数据的量级对于普通存储数据是多倍数增长。
204、创建多维度的关系指标。
例如,上学经历关系指标、电话号码使用关系指标、地域关系指标、任职经历关系指标、家庭关系指标等。
205、根据针对同一关系指标具有共同特征的用户数据,构建同一个社区网络。
统计不同的用户数据是否针对某一关系指标具有共同的特征数据。然后将针对某一关系指标具有共同特征的用户数据,组成一个社区网络。例如,针对上学经历的关系指标,至少两个用户在上学期间都在同一所中学上学,那么这些用户的节点可组成一个社区网络;针对任职经历的关系指标,至少两个用户在同一时间段都在同一家单位任职,那么这些用户的节点可组成一个社区网络;针对家庭关系指标,至少两个用户具有相同亲属,那么这些用户的节点可组成一个社区网络等。
为了说明步骤205的具体技术实现过程,作为一种可选方式,步骤205具体可包括:将用户数据各自对应用户所处的地域信息进行整合并划分蜂窝区间,使得同一蜂窝区间内的用户之间具有地域性的关系信息,以便基于同一蜂窝区间内用户各自对应的节点,构建同一个社区网络;和/或,将用户数据按照共同特征进行层次聚类,使得用户数据各自对应用户的节点按照层次聚类结果进行聚集,构建同一个社区网络。
对于本实施例,上述针对划分蜂窝区间的方式,相当于图分割方式,具体可采用Kernighan-Lin算法(思想是不断交换两个子图(初始划分的蜂窝区间)中的点,使得两个子图之间的边尽可能地少(调整蜂窝区间的尺寸大小,使得达到最优的分割结果)),或谱平分法(所谓“谱”,就是矩阵的特征值;所谓“平分”,就是将一个图分成大小相等的两个子图;谱平分法就是利用图的拉普拉斯矩阵的第二小特征向量来进行聚类的一种方法)等。按照用户与用户之间所处地域进行蜂窝式划分区间,然后基于同一蜂窝区间内的用户数据,得到具有地域关系型的用户数据,进而找到针对某一关系指标具有共同特征的用户数据,组成一个社区网络。这里在划分蜂窝式区间时,还需考虑结构平衡,即掌握好蜂窝尺寸划分的度,以便提高社区网络构建的精准度。
例如,可按照用户的量级、用户数据特征的量级、以及待划分整体区域的量级等,确定合适的蜂窝划分尺寸,如对于大城市而言,用户人口密度较大,且用户特征数据的量级较大,交集较多,那么可相应划分较小尺寸的蜂窝区间;而对于小城市而言,用户人口密度较小,且用户特征数据的量级较小,交集较少,那么可相应划分较大尺寸的蜂窝区间等。
同时在划分蜂窝区间时,还要考虑最大化的影响,找到影响相对较大化的目标用户,即与更多的用户都存在共同特征,然后将这些目标用户所在区域范围进行更细粒度的蜂窝划分,以保证蜂窝区间划分精度,提高社区网络构建的精准度,从而提高复杂网络关系图谱构建的精准度。
除了上述利用图分割方式构建社区网络以外,对于本实施例,还可基于层次聚类的方式进行社区网络构建。其思想是寻找社区网络中“最中心”的边,不断地把最相似的两个点聚到一起,从点聚到小社区网络,再聚成大社区网络)。例如,GN算法(首先给出介数(etweenness)的定义,一个边的介数(edge betweenness)是指通过该边的最短路的条数。直观上,社区网络之间的边有较高的betweenness,而社区网络内部的边betweenness相对较小,这样,通过逐个去掉这些高betweenness的边,社区网络结构就会逐步显现出来)、Newman快速算法(思想:不断地选择是模块度增长最大的两个社区网络进行合并)等,将不同用户的用户数据进行层次聚类,使得用户数据各自对应用户的节点按照层次聚类结果进行聚集,构建同一个社区网络。
例如,多个用户都是女性;都是在同一小学上过学的女性;都是在同一小学上过学、且在同一个公司工作过的女性;都是在同一小学上过学、且在同一个公司工作过的、且爱好相似的女性…,进而实现逐层聚类的过程,组成一个社区信息。
需要说明的是,上述图分割方式和层次聚类方式可进行综合使用,进而进一步提高社区网络构建的精准度,并且可满足更多复杂场景的需求。
进一步的,基于上述图分割方式和层次聚类方式,还可利用模块度优化的方法,对这两种可选方式进行进一步优化,如优化蜂窝分割方式(如按照四边形还是六边形分割等)、层级聚类划分方式(如具体按照哪种程度的类型进行层次聚类,是更上位一些还是更具体一些,还是偏适中一些)等,目的是为了提高上述两种可选方式的计算效率以及准确度。
206、依据构建的各个社区网络,构建复杂网络关系图谱。
其中,复杂网络关系图谱由节点和边组成,节点代表用户,两个节点连接的边代表用户之间具有关系信息。通过该复杂网络关系图谱,可精确定位人与人的关系,给出更精确的人与人关系的分析结果。
作为一种可选方式,步骤206具体可包括:首先将各个社区网络进行合并,得到复杂网络关系图谱;再对复杂网络关系图谱中未连边的两个节点,利用预测连边概率模型进行预测连边概率,其中,预测连边概率模型是利用已构建的目标图谱作为训练集训练得到的,目标图谱与复杂网络关系图谱之间的相似度大于预定阈值;若预测得到的连边概率大于预设阈值,则将未连边的两个节点进行连边处理。
由于构建得到的复杂网络关系图谱,是通过采集到的具有关系型用户数据构建得到的,因此可能存在一些遗漏情况,如一些用户之间实际是存在关系的,但是由于数据采集不够全面或者受到一定的限制,所以导致可能这些用户节点之间没有连边。因此,为了更好的优化复杂网络关系图谱,本实施例中可基于相似的已知构建得到的复杂网络关系图谱,作为训练集训练预测连边概率模型,进而通过已知相似的网络结构等信息,去预测当前复杂网络关系图谱中尚未产生连边的两个节点之间产生连边的可能性。预测那些已经存在但尚未被发现的连接。相当于是一种数据挖掘的过程,对于未来可能产生的连边进行很好的预测,因此,本实施例中的节点连边预测具有重大的实际应用价值。
例如,利用训练好的预测连边概率模型对新的连边进行预测包括:对于要预测的连边,获取该连边对应的点对,将输入到训练好的模型中,得到该点对之间存在连边的概率值P,若P≥0.5,则预测该连边存在,否则预测为不存在,如果存在连边,则在当前复杂网络关系图谱中将该连边进行相应补充上去,以便优化该复杂网络关系图谱。
207、利用复杂网络关系图谱,获取待推荐用户所属的目标人群。
作为一种可选方式,步骤207具体可包括:在复杂网络关系图谱中,获取与待推荐信息主题内容相关的、且连接边数大于预设边数阈值的目标节点;根据与目标节点存在连边的节点划分人群;依据待推荐用户的节点所在的人群,确定待推荐用户所属的目标人群。
其中,待推荐信息可根据实际信息推荐需求确定,即准备推荐哪个方面的信息给用户。预设边数阈值可根据实际业务需求预先设定。例如,在复杂网络关系图谱中找到按照某一维度(与待推荐信息主题内容相关)上非常相近的用户,然后将这些用户圈起来,得到人群。具体可确定节点连接的边数,边数越多代表与更多用户之间具有关系,找到与该待推荐信息主题内容相关的、且边数大于一定阈值的目标用户节点,然后将与目标用户节点存在连边的用户节点,连同目标用户节点画圈,如图3中每个虚线圈所示,图中每个节点可对应用户的标识(如身份证号,手机号等),节点的连边数越多可越突出展示,或者指定某个目标节点将其放大等,图中节点连边代表用户之间具有关系。通过这种方式可在复杂网络关系图谱中划分到各个人群,然后找到与待推荐用户所属的目标人群。通过这种方式可精确确定与待推荐用户具有相似行为的目标用户。
208、依据目标人群的信息获取记录,生成待推荐用户对应的推荐信息。
为了说明本实施例方法的具体应用过程,给出如下应用场景,但不限于此:
例如,用户在某网站预订收听某类新闻的业务,该网站还会在给用户推荐相似的新闻业务,具体可利用该用户的新闻预订记录并结合大数据,基于逻辑回归算法或其他机器学习算法训练得到预测模型,然后利用该预测模型预测未来出现较大概率能被该用户接受的新闻业务。这是现有的普通推荐算法,这种方式不仅依赖于模型训练集的数据质量,还依赖于算法本身,可能训练得到的模型不是很适用于该推荐场景,进而会造成对用户未来预订新闻业务的预测是不精准的。但复杂网络关系图谱会找到与该用户具有相似行为的目标用户,从而通过该目标用户在该网站中的新闻预订行为,向该待推荐用户推荐很可能需要预订的新闻业务,更人性化推荐,做到精准推荐。
通过本实施例提供的信息推荐方法,与目前通过预测模型预测业务推荐信息相比,本实施例基于海量数据,利用较先进的复杂网络关系图谱技术,建立人与人关系场景以及关系程度,可精准定位人与人的关系,给出更精确的人与人关系的分析结果,进而可精准找到与待推荐用户具有相似行为的目标用户。通过该目标用户的信息获取记录,向待推荐用户推荐相应的信息,可实现更为精准的信息推荐,做到更人性化的信息推荐,可实现有针对性地为有需要的用户提供合适的推荐信息。
进一步的,作为图1至图2所示方法的具体实现,本申请实施例提供了一种信息推荐装置,如图4所示,该装置包括:采集模块31、构建模块32、获取模块33、生成模块34。
采集模块31,可用于采集用户之间具有关系信息的用户数据;
构建模块32,可用于根据采集到的所述用户数据,构建复杂网络关系图谱,其中,所述复杂网络关系图谱用于针对多维度特征确定用户之间是否具有关系信息,以及关系信息对应的程度信息;
获取模块33,可用于利用所述复杂网络关系图谱,获取待推荐用户所属的目标人群,所述目标人群中用户各自对应的复杂网络关系之间的相似度大于预设阈值;
生成模块34,可用于依据所述目标人群的信息获取记录,生成所述待推荐用户对应的推荐信息。
在具体的应用场景中,所述采集模块31,具体可用于采集多个用户的用户特征数据,所述用户特征数据至少包括用户基础数据和用户行为数据;对采集到的所述用户特征数据进行预处理;将预处理后的用户特征数据,通过确定用户之间存在的共同特征进行关系型数据加工,得到用户之间具有关系信息的用户数据。
在具体的应用场景中,所述构建模块32,具体可用于创建多维度的关系指标;根据针对同一关系指标具有共同特征的所述用户数据,构建同一个社区网络;依据构建的各个社区网络,构建复杂网络关系图谱,其中,所述复杂网络关系图谱由节点和边组成,所述节点代表用户,两个节点连接的边代表用户之间具有关系信息。
在具体的应用场景中,所述构建模块32,具体还可用于将所述用户数据各自对应用户所处的地域信息进行整合并划分蜂窝区间,使得同一蜂窝区间内的用户之间具有地域性的关系信息,以便基于同一蜂窝区间内用户各自对应的节点,构建同一个社区网络;和/或,将所述用户数据按照共同特征进行层次聚类,使得所述用户数据各自对应用户的节点按照层次聚类结果进行聚集,构建同一个社区网络。
在具体的应用场景中,所述构建模块32,具体还可用于将各个社区网络进行合并,得到所述复杂网络关系图谱;对所述复杂网络关系图谱中未连边的两个节点,利用预测连边概率模型进行预测连边概率,其中,所述预测连边概率模型是利用已构建的目标图谱作为训练集训练得到的,所述目标图谱与所述复杂网络关系图谱之间的相似度大于预定阈值;若所述连边概率大于预设阈值,则将所述未连边的两个节点进行连边处理。
在具体的应用场景中,所述获取模块33,具体可用于在所述复杂网络关系图谱中,获取与待推荐信息主题内容相关的、且连接边数大于预设边数阈值的目标节点;根据与所述目标节点存在连边的节点划分人群;获取所述待推荐用户所属的目标人群,并将所述目标人群中的用户确定为与待推荐用户具有相似行为的目标用户。
在具体的应用场景中,所述采集模块31,具体还可用于对所述用户特征数据进行数据清洗,去除重复数据和异常数据。
需要说明的是,本实施例提供的一种信息推荐装置所涉及各功能单元的其它相应描述,可以参考图1至图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1和图2所示的信息推荐方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景的方法。
基于上述如图1、图2所示的方法,以及图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的信息推荐方法。
可选的,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本实施例的技术方案,与目前通过预测模型预测业务推荐信息相比,本实施例基于海量数据,利用较先进的复杂网络关系图谱技术,建立人与人关系场景以及关系程度,可精准定位人与人的关系,给出更精确的人与人关系的分析结果,进而可精准找到与待推荐用户具有相似行为的目标用户。通过该目标用户的信息获取记录,向待推荐用户推荐相应的信息,可实现更为精准的信息推荐,做到更人性化的信息推荐,可实现有针对性地为有需要的用户提供合适的推荐信息。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种信息推荐方法,其特征在于,包括:
采集用户之间具有关系信息的用户数据;
根据采集到的所述用户数据,构建复杂网络关系图谱,其中,所述复杂网络关系图谱用于针对多维度特征确定用户之间是否具有关系信息,以及关系信息对应的程度信息;
利用所述复杂网络关系图谱,获取待推荐用户所属的目标人群,所述目标人群中用户各自对应的复杂网络关系之间的相似度大于预设阈值;
依据所述目标人群的信息获取记录,生成所述待推荐用户对应的推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述采集具有关系信息的用户数据,具体包括:
采集多个用户的用户特征数据,所述用户特征数据至少包括用户基础数据和用户行为数据;
对采集到的所述用户特征数据进行预处理;
将预处理后的用户特征数据,通过确定用户之间存在的共同特征进行关系型数据加工,得到用户之间具有关系信息的用户数据。
3.根据权利要求2所述的方法,其特征在于,所述根据采集到的所述用户数据,构建复杂网络关系图谱,具体包括:
创建多维度的关系指标;
根据针对同一关系指标具有共同特征的所述用户数据,构建同一个社区网络;
依据构建的各个社区网络,构建复杂网络关系图谱,其中,所述复杂网络关系图谱由节点和边组成,所述节点代表用户,两个节点连接的边代表用户之间具有关系信息。
4.根据权利要求3所述的方法,其特征在于,所述根据针对同一关系指标具有共同特征的所述用户数据,构建同一个社区网络,具体包括:
将所述用户数据各自对应用户所处的地域信息进行整合并划分蜂窝区间,使得同一蜂窝区间内的用户之间具有地域性的关系信息,以便基于同一蜂窝区间内用户各自对应的节点,构建同一个社区网络;和/或,
将所述用户数据按照共同特征进行层次聚类,使得所述用户数据各自对应用户的节点按照层次聚类结果进行聚集,构建同一个社区网络。
5.根据权利要求4所述的方法,其特征在于,所述依据构建的各个社区网络,构建复杂网络关系图谱,具体包括:
将各个社区网络进行合并,得到所述复杂网络关系图谱;
对所述复杂网络关系图谱中未连边的两个节点,利用预测连边概率模型进行预测连边概率,其中,所述预测连边概率模型是利用已构建的目标图谱作为训练集训练得到的,所述目标图谱与所述复杂网络关系图谱之间的相似度大于预定阈值;
若所述连边概率大于预设阈值,则将所述未连边的两个节点进行连边处理。
6.根据权利要求5所述的方法,其特征在于,所述利用所述复杂网络关系图谱,获取待推荐用户所属的目标人群,具体包括:
在所述复杂网络关系图谱中,获取与待推荐信息主题内容相关的、且连接边数大于预设边数阈值的目标节点;
根据与所述目标节点存在连边的节点划分人群;
依据所述待推荐用户的节点所在的人群,确定所述待推荐用户所属的目标人群。
7.根据权利要求2所述的方法,其特征在于,所述对采集到的所述用户特征数据进行预处理,具体包括:
对所述用户特征数据进行数据清洗,去除重复数据和异常数据。
8.一种信息推荐装置,其特征在于,包括:
采集模块,用于采集用户之间具有关系信息的用户数据;
构建模块,用于根据采集到的所述用户数据,构建复杂网络关系图谱,其中,所述复杂网络关系图谱用于针对多维度特征确定用户之间是否具有关系信息,以及关系信息对应的程度信息;
获取模块,用于利用所述复杂网络关系图谱,获取待推荐用户所属的目标人群,所述目标人群中用户各自对应的复杂网络关系之间的相似度大于预设阈值;
生成模块,用于依据所述目标人群的信息获取记录,生成所述待推荐用户对应的推荐信息。
9.一种非易失性可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至7中任一项所述的信息推荐方法。
10.一种计算机设备,包括非易失性可读存储介质、处理器及存储在非易失性可读存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7中任一项所述的信息推荐方法。
CN202010164391.6A 2020-03-11 2020-03-11 信息推荐方法、装置及计算机设备 Pending CN111506823A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010164391.6A CN111506823A (zh) 2020-03-11 2020-03-11 信息推荐方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010164391.6A CN111506823A (zh) 2020-03-11 2020-03-11 信息推荐方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN111506823A true CN111506823A (zh) 2020-08-07

Family

ID=71874209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010164391.6A Pending CN111506823A (zh) 2020-03-11 2020-03-11 信息推荐方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN111506823A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818235A (zh) * 2021-02-03 2021-05-18 招联消费金融有限公司 基于关联特征的违规用户识别方法、装置和计算机设备
CN113157704A (zh) * 2021-05-06 2021-07-23 成都卫士通信息产业股份有限公司 层级关系分析方法、装置、设备及计算机可读存储介质
CN113342998A (zh) * 2021-08-05 2021-09-03 北京达佳互联信息技术有限公司 一种多媒体资源推荐方法、装置、电子设备及存储介质
CN114925289A (zh) * 2022-05-23 2022-08-19 中国平安财产保险股份有限公司 员工推荐方法、装置、设备及可读存储介质
CN115687721A (zh) * 2022-10-28 2023-02-03 盐城金堤科技有限公司 企业动态信息推荐方法、装置、计算设备及存储介质
CN116304303A (zh) * 2023-02-01 2023-06-23 北京三维天地科技股份有限公司 一种基于知识图谱的资产推荐方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915307A (zh) * 2011-08-02 2013-02-06 腾讯科技(深圳)有限公司 一种个性化信息推荐的方法、装置及信息处理系统
KR101259604B1 (ko) * 2011-11-15 2013-05-14 경기대학교 산학협력단 소셜 네트워크 기반의 컨텐츠 추천 시스템 및 컨텐츠 추천 방법
CN105373619A (zh) * 2015-12-03 2016-03-02 中国联合网络通信集团有限公司 一种基于用户大数据的用户群体分析方法和系统
CN106791964A (zh) * 2016-12-26 2017-05-31 中国传媒大学 广播电视节目推荐系统及方法
CN108154425A (zh) * 2018-01-19 2018-06-12 广州天源信息科技股份有限公司 一种结合社会网络和位置的线下商户推荐方法
CN108804516A (zh) * 2018-04-26 2018-11-13 平安科技(深圳)有限公司 相似用户查找装置、方法及计算机可读存储介质
CN110457573A (zh) * 2019-07-04 2019-11-15 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915307A (zh) * 2011-08-02 2013-02-06 腾讯科技(深圳)有限公司 一种个性化信息推荐的方法、装置及信息处理系统
KR101259604B1 (ko) * 2011-11-15 2013-05-14 경기대학교 산학협력단 소셜 네트워크 기반의 컨텐츠 추천 시스템 및 컨텐츠 추천 방법
CN105373619A (zh) * 2015-12-03 2016-03-02 中国联合网络通信集团有限公司 一种基于用户大数据的用户群体分析方法和系统
CN106791964A (zh) * 2016-12-26 2017-05-31 中国传媒大学 广播电视节目推荐系统及方法
CN108154425A (zh) * 2018-01-19 2018-06-12 广州天源信息科技股份有限公司 一种结合社会网络和位置的线下商户推荐方法
CN108804516A (zh) * 2018-04-26 2018-11-13 平安科技(深圳)有限公司 相似用户查找装置、方法及计算机可读存储介质
CN110457573A (zh) * 2019-07-04 2019-11-15 平安科技(深圳)有限公司 产品推荐方法、装置、计算机设备及存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818235A (zh) * 2021-02-03 2021-05-18 招联消费金融有限公司 基于关联特征的违规用户识别方法、装置和计算机设备
CN112818235B (zh) * 2021-02-03 2023-07-21 招联消费金融有限公司 基于关联特征的违规用户识别方法、装置和计算机设备
CN113157704A (zh) * 2021-05-06 2021-07-23 成都卫士通信息产业股份有限公司 层级关系分析方法、装置、设备及计算机可读存储介质
CN113342998A (zh) * 2021-08-05 2021-09-03 北京达佳互联信息技术有限公司 一种多媒体资源推荐方法、装置、电子设备及存储介质
CN114925289A (zh) * 2022-05-23 2022-08-19 中国平安财产保险股份有限公司 员工推荐方法、装置、设备及可读存储介质
CN114925289B (zh) * 2022-05-23 2024-04-30 中国平安财产保险股份有限公司 员工推荐方法、装置、设备及可读存储介质
CN115687721A (zh) * 2022-10-28 2023-02-03 盐城金堤科技有限公司 企业动态信息推荐方法、装置、计算设备及存储介质
CN116304303A (zh) * 2023-02-01 2023-06-23 北京三维天地科技股份有限公司 一种基于知识图谱的资产推荐方法及系统
CN116304303B (zh) * 2023-02-01 2023-09-08 北京三维天地科技股份有限公司 一种基于知识图谱的资产推荐方法及系统

Similar Documents

Publication Publication Date Title
CN111506823A (zh) 信息推荐方法、装置及计算机设备
US11593894B2 (en) Interest recommendation method, computer device, and storage medium
CN110162717B (zh) 一种推荐好友的方法和设备
Okawa et al. Deep mixture point processes: Spatio-temporal event prediction with rich contextual information
WO2016110121A1 (zh) 数据栅格化、用户行为分析的方法和装置
CN111177473B (zh) 人员关系分析方法、装置和可读存储介质
CN109471978B (zh) 一种电子资源推荐方法及装置
JP2010020490A (ja) 未訪問地の情報提供装置及び未訪問地の情報提供方法
KR20130075630A (ko) 사용자들간의 친밀도에 기초하여 친구의 친구를 추천하는 소셜 네트워크 서비스 시스템 및 방법
CN111339183A (zh) 数据处理方法、边缘节点、数据中心及存储介质
CN111405030A (zh) 一种消息推送方法、装置、电子设备和存储介质
CN116127190B (zh) 一种数字地球资源推荐系统及方法
Fränti et al. Averaging GPS segments competition 2019
Li et al. Dynamic community detection based on graph convolutional networks and contrastive learning
CN113742580A (zh) 目标类型数据的召回方法、装置、电子设备及存储介质
Obregon et al. InfoFlow: Mining information flow based on user community in social networking services
CN113569162A (zh) 数据处理方法、装置、设备及存储介质
Donchenko et al. Promoting urban projects through social networks using analysis of users influence in social graph
Chu et al. Traffic analysis as a service via a unified model
CN113312563B (zh) 信息推荐方法、装置、设备及存储介质
CN113411405A (zh) 针对云计算环境的信息安全处理方法及人工智能服务器
Aoude et al. Social-aware device-to-device offloading based on experimental mobility and content similarity models
Park et al. ActiveDBC: learning Knowledge-based Information propagation in mobile social networks
Xu An efficient clustering method for mobile users based on hybrid PSO and ABC
CN110704612A (zh) 一种社交群体发现方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination