CN113254833A - 一种基于产教融合的信息推送的方法及服务系统 - Google Patents
一种基于产教融合的信息推送的方法及服务系统 Download PDFInfo
- Publication number
- CN113254833A CN113254833A CN202110631348.0A CN202110631348A CN113254833A CN 113254833 A CN113254833 A CN 113254833A CN 202110631348 A CN202110631348 A CN 202110631348A CN 113254833 A CN113254833 A CN 113254833A
- Authority
- CN
- China
- Prior art keywords
- user
- group
- characteristic
- behavior
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000004927 fusion Effects 0.000 title claims abstract description 6
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 51
- 230000006399 behavior Effects 0.000 claims description 201
- 238000007621 cluster analysis Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 8
- 230000008030 elimination Effects 0.000 claims description 5
- 238000003379 elimination reaction Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000003542 behavioural effect Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- BUGBHKTXTAQXES-UHFFFAOYSA-N Selenium Chemical compound [Se] BUGBHKTXTAQXES-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052711 selenium Inorganic materials 0.000 description 1
- 239000011669 selenium Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明适用于数据处理技术领域,提供了一种基于产教融合的信息推送的方法及服务系统,包括:接收各个分布式数据节点上传用户群组内用户的用户信息,并基于用户信息分别生成各个分布式数据节点对应的群组特征参量;将目标对象的对象特征参量以及群组特征参量导入到各个用户推荐匹配算法,计算目标对象与用户群组之间的匹配度;将与目标对象之间的匹配度大于预设的推荐阈值的用户群组识别为目标对象的目标群组;从目标群组中选取与目标对象关联的目标用户信息,将目标用户信息推送给目标对象的设备。采用本发明在确保用户信息与目标对象关联的基础上,也能够考虑到用户信息之间的群组特征,能够提高用户信息推送的准确性,以及实现大批量的用户信息推送,提高了信息推送的效率。
Description
技术领域
本发明属于数据处理技术领域,尤其涉及一种基于产教融合的信息推送的方法及服务系统。
背景技术
随着信息技术的不断发展,互联网内的信息的种类以及数量以几何级的方式增长,目标信息的搜索难度越来越大,例如,对于用人单位、企业等对象需要获取合适的用户时,需要从大量的用户信息中搜索出合适用户,需要耗费大量的时间以及精力,此时,信息推送则能够减轻数据搜索的压力。因而,如何能够准确地为对象推送所需的信息,成为了亟需解决的问题。
现有的数据推送技术,一般是通过关键词搜索的方式,从大量的数据中筛选出目标数据并推送给目标对象,然而若目标需要大量存在关联关系的用户信息,则通过关键词搜索的方式,无法确定用户之间的关联性,从而大大降低了推送的准确性。
发明内容
有鉴于此,本发明实施例提供了一种基于产教融合的信息推送的方法及服务系统,以解决现有的信息推送的技术,通过关键词搜索的方式,无法确定用户之间的关联性,从而大大降低了推送的准确性的问题。
本发明实施例的第一方面提供了一种信息推送的方法,包括:
接收各个分布式数据节点上传用户群组内用户的用户信息,并基于所述用户信息分别生成各个所述分布式数据节点对应的群组特征参量;每个所述分布式数据节点对应一个用户群组;
基于所有已发布的标准文本,生成至少一个用户推荐匹配算法;
将目标对象的对象特征参量以及所述群组特征参量导入到各个所述用户推荐匹配算法,分别计算所述目标对象与各个所述用户群组之间的匹配度;
将与所述目标对象之间的所述匹配度大于预设的推荐阈值的所述用户群组识别为所述目标对象的目标群组;
向所述目标对象的终端推送所述目标群组内若干用户的所述用户信息。
本发明实施例的第二方面提供了一种信息推送的装置,包括:
群组特征参量获取单元,用于接收各个分布式数据节点上传用户群组内用户的用户信息,并基于所述用户信息分别生成各个所述分布式数据节点对应的群组特征参量;每个所述分布式数据节点对应一个用户群组;
用户推荐匹配算法确定单元,用于基于所有已发布的标准文本,生成至少一个用户推荐匹配算法;
匹配度计算单元,用于将目标对象的对象特征参量以及所述群组特征参量导入到各个所述用户推荐匹配算法,分别计算所述目标对象与各个所述用户群组之间的匹配度;
目标群组选取单元,用于将与所述目标对象之间的所述匹配度大于预设的推荐阈值的所述用户群组识别为所述目标对象的目标群组;
目标信息推送单元,用于从所述目标群组中的所述用户信息中,选取与所述目标对象关联的目标用户信息,将所述目标用户信息推送给所述目标对象的设备。
本发明实施例的第三方面提供了一种服务系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面的各个步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面的各个步骤。
实施本发明实施例提供的一种基于产教融合的信息推送的方法及服务系统具有以下有益效果:
本发明实施例通过为不同的用户群组配置对应的分布式数据节点,以通过分布式数据节点采集关联的用户群组的用户信息,从而能够在数据采集的层面上确定不同用户信息之间的群组关联性,并生成关于该用户群组对应的群组特征参量,继而通过对已有的标准文本进行解析,得到对应的用户推荐匹配算法,能够提高后续用户推荐的准确性;将群组特征参量与目标对象的对象特征参量导入到用户推荐匹配算法内,能够确定目标对象与用户群组是否匹配,并选取匹配的目标群组,从目标群组中确定目标用户信息并推送给目标对象的设备,实现了信息推送的目的。与现有的信息推送技术相比,本申请实施例在进行信息推送时,会生成群组特征参量,而该参量是基于该用户群组内的所有用户信息确定的,因此在确保用户信息与目标对象关联的基础上,也能够考虑到用户信息之间的群组特征,能够提高用户信息推送的准确性,以及实现大批量的用户信息推送,提高了信息推送的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例提供的一种信息推送的方法的实现流程图;
图2是本发明第二实施例提供的一种信息推送的方法S101具体实现流程图;
图3是本发明第三实施例提供的一种信息推送的方法S1013具体实现流程图;
图4是本发明第四实施例提供的一种信息推送的方法具体实现流程图;
图5是本发明第五实施例提供的一种信息推送的方法S103具体实现流程图;
图6是本发明第六实施例提供的一种信息推送的方法S102具体实现流程图;
图7是本发明第六实施例提供的一种信息推送的方法S105具体实现流程图;
图8是本发明一实施例提供的一种信息推送的装置的结构框图;
图9是本发明一实施例提供的一种服务系统的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例通过为不同的用户群组配置对应的分布式数据节点,以通过分布式数据节点采集关联的用户群组的用户信息,从而能够在数据采集的层面上确定不同用户信息之间的群组关联性,并生成关于该用户群组对应的群组特征参量,继而通过对已有的标准文本进行解析,得到对应的用户推荐匹配算法,能够提高后续用户推荐的准确性;将群组特征参量与目标对象的对象特征参量导入到用户推荐匹配算法内,能够确定目标对象与用户群组是否匹配,并选取匹配的目标群组,从目标群组中确定目标用户信息并推送给目标对象的设备,实现了信息推送的目的,解决了现有的信息推送的技术,通过关键词搜索的方式,无法确定用户之间的关联性,从而大大降低了推送的准确性的问题。
在本发明实施例中,流程的执行主体为服务系统,该服务系统包括但不限于:服务器、计算机、智能手机、笔记本电脑以及平板电脑等能够执行信息推送的设备。图1示出了本发明第一实施例提供的信息推送的方法的实现流程图,详述如下:
在S101中,接收各个分布式数据节点上传用户群组内用户的用户信息,并基于所述用户信息分别生成各个所述分布式数据节点对应的群组特征参量;每个所述分布式数据节点对应一个用户群组。
在本实施例中,不同的分布式数据节点具体用于获取一个对应的用户群组内各个用户的用户信息。上述用户信息包括但不限于:用户年龄、用户学历、用户身高体重等静态特征信息,也可以包括用户移动轨迹、动作轨迹等动态特征信息。举例性地,上述分布式数据节点可以部署于一学校内,则上述用户群组具体为该学校的学生构成的群组,则上述用户信息具体可以为该学校学生的信息。
在本实施例中,该服务系统具体可以一数据推送平台的服务器,各个分布式数据节点可以与该数据推送平台的服务器建立通信连接,并在满足预设的采集条件时,接收各个分布式数据节点上传用户群组内用户的用户信息。又或者,各个分布式数据节点在采集到新的用户信息时,可以将新采集的用户信息发送给该数据推送平台的服务器(即本申请提供的服务系统),以便服务系统根据新接收到的用户信息确定该用户群组对应的群组特征参量。
在一种可能的实现方式中,服务系统可以配置有对应的采集触发条件,在检测到满足预设的采集触发条件时,可以向分布式数据节点发送用户信息采集指令,在分布式数据节点接收到上述用户信息采集指令时,将本地存储的用户信息发送给服务系统。其中,该数据系统(包括有本申请实施例提供的服务系统、分布式数据节点以及所需推送信息的目标对象的设备)可以采用分布式的方式对数据进行存储。例如,采用深度神经网络(如多重卷积循环神经网络、长短期神经网络、tensorflow)作为大脑,即上述的数据推送平台的服务器安装上述的深度神经网络,并配置有多个数据分析终端与上述服务器相连,每个数据分析终端可以搭配有可分解式云计算cloud computing,进行数据分布式处理分析,服务器的底层系统支持有效用计算、负载均衡、并行计算、热备份冗杂和虚拟混合演算技术,提供可实时自我更新的基础算力。在大数据处理方面,服务器可以采用数据采集、存储、分析、计算,通过各个用户群组对应的分布式数据节点建立数据仓库使用离线技术引擎Hadoop、实时计算引擎Storm进行有效的用户信息的发掘,多级缓存到非关系数据存储器内,如采用mongodb技术构建的数据存储器中,在接收到新的用户信息时,可以基于新的用户信息对群组特征信息再次分析。分布式数据存储节点在进行用户信息的采集方面,可以使用selenium技术,获取互联网中有价值数据,据清理、变换聚类、计算机检查和回归等方法去除噪音来提高数据有效性。在确定所需推送的用户信息前进行决策树、k均值聚类算法k-means、向量机svm处理,同时采用监督学习、非监督学习进行用户与数据关联训练,必要时采用对抗神经网络系统进行自我强化更新,提高有效数据的出现概率,强化用户信息与目标对象间的有效连接。
在本实施例中,服务系统在获取得到分布式数据节点上传的所有用户信息后,可以对所有用户信息进行聚类分析,从而可以生成关于该分布式数据节点对应的用户群组的群组特征信息。
在一种可能的实现方式中,服务系统生成群组特征信息的方式可以为:基于所有用户信息提取得到用户共性信息以及用户个性信息,基于所有用户共性信息确定关于所述用户群组对应的共性特征信息,以及根据不同用户对应的用户个性信息,确定所述用户群组对应的离散特征信息,基于所述共性特征信息以及离散特征信息生成所述用户群组的群组特征。
在S102中,基于所有已发布的标准文本,生成至少一个用户推荐匹配算法。
在本实施例中,服务系统除了可以接收各个分布式数据节点上传用户群组内用户的用户信息外,还可以从互联网上获取各个已经发布的标准文本,从而能够根据已发布的标准文本,确定当前适用的用户推荐匹配算法,即基于标准文本确定推送何种类型的用户给目标对象的设备。其中,上述标准文本包括但不限于:当前已发布的法律文本、法律文本以及与用户推荐相关的政策文本等。
示例性地,以一种应用场景为例进行说明,用户群组为学校内的学生,目标对象为企业等用人单位,则上述的标准文本具体可以是人才引进、人才输送相关的法律文本、法规文本以及相关的政策信息等。
在本实施例中,S101以及S102两个步骤是相互独立的两个步骤,即服务系统在接收分布式数据节点上传的用户信息的同时,也可以获取已发布的标准文本,具体根据两个步骤的获取规则确定。例如,服务系统在到达预设的采集周期时,可以从分布式数据节点处获取用户信息,与此同时,服务系统若检测到互联网中发布了新的标准文本,则可以从互联网处下载对应的标准文本。
在一种可能的实现方式中,基于标准文本确定用户推荐匹配算法的方式具体可以为:服务系统可以提取该标准文本携带有的文本关键词,将所述文本关键词转换为对应的匹配规则,基于所有匹配规则得到对应的用户推荐匹配算法。举例性地,若某一标准文本内携带有的文本关键词为“本科”以及“互联网专业”,则可以分别为上述两个文本关键词配置对应的匹配规则,用于筛选与上述两个条件相关联的用户,并生成对应的用户推荐匹配算法。
需要说明的是,一个用户推荐匹配算法可以对应的标准文本的数量可以为一个,也可以为多个,具体根据实际情况确定。
在S103中,将目标对象的对象特征参量以及所述群组特征参量导入到各个所述用户推荐匹配算法,分别计算所述目标对象与各个所述用户群组之间的匹配度。
在本实施例中,需要进行用户信息推荐的目标对象可以将关联的对象信息发送给服务系统,服务系统可以根据目标对象的对象信息,生成与之对应的对象特征参量。
在一种可能的实现方式中,服务系统可以存储有一对象数据库,该对象数据库内存储有关于目标对象的所有对象信息,以及已推送给该目标对象的用户信息。服务系统可以根据目标对象关联的对象信息以及所有已经推荐的用户信息对应的推荐反馈信息,生成该对象特征参量。其中,用户信息对应的推荐反馈信息用于确定所推送的用户信息与目标对象之间的契合度,若用户信息与目标对象十分契合,则可以反馈匹配度高的反馈信息,可以根据推荐反馈信息来确定所需推荐的用户类型,从而构成的对象特征参量可以提高后续匹配度计算的准确性。
在本实施例中,需要进行用户推荐的目标对象可以向服务系统发送一个推送请求,服务系统可以将所有需要进行用户推送的目标对象生成对应的推送列表,推送列表中每个目标对象可以关联有一个对应的推送条件。若服务系统检测到满足任一目标对象的推送条件,则执行S103的操作。例如,该推送条件可以一时间触发条件,例如配置有对应的推送周期,定期向目标对象推送用户信息;该推送条件还可以为一事件条件,例如接收到目标对象的设备发送的推送指令,则向目标对象推送用户信息。
在本实施例中,服务系统可以将与目标对象相关的对象特征参量以及用户群组对应的群组特征参量导入到用户匹配算法中,从而能够计算得到目标对象与用户群组之间的匹配度,若目标对象与用户群组之间的匹配度小于或等于预设的推荐阈值,则表示两者的相关性较低,并将该用户群组与目标对象相关联,即该用户群组内的用户并非目标对象的所需推荐的用户;反之,若目标对象与用户群组之间的匹配度大于预设的推荐阈值,则执行S104的操作。
在一种可能的实现方式中,上述基于标准文本生成的用户推荐匹配算法的个数为多个,在该情况下,每个目标对象可以根据关联的标准文本,确定与目标对象对应的用户推荐匹配算法,并基于对应的用户推荐匹配算法计算该目标对象与各个用户群组之间的匹配度。
在S104中,将与所述目标对象之间的所述匹配度大于预设的推荐阈值的所述用户群组识别为所述目标对象的目标群组。
在本实施例中,服务系统在计算了目标对象与各个用户群组之间的匹配度后,可以将与其匹配度大于预设的推荐阈值的用户群组作为该目标对象的目标群组。其中,若匹配度大于预设的推荐阈值的用户群组的数量为多个,则可以将多个匹配度大于匹配阈值的用户群组均识别为目标对象的目标群组。
在本实施例中,由于群组特征参量是基于对应用户群组内的所有用户信息生成的,因此当群组特征参量与目标对象参量相匹配时,即表示该用户群组内的所有用户基本与该目标对象相匹配,从而能够实现匹配确定匹配用户的目的,减少了用户与目标对象之间的匹配计算,大大提高了用户信息推荐的目的。
在S105中,向所述目标对象的终端推送所述目标群组内若干用户的所述用户信息。
在本实施例中,服务系统在确定了目标对象关联的目标群组后,可以基于该目标群组内包含的用户信息,选取一个或多个作为目标对象关联的目标用户信息,并将目标用户信息发送给目标对象的设备,以实现信息推送的目的。其中,该目标对象的设备可以为一计算机电脑、智能手机、平板电脑等,也可以是该目标对象关联的数据库服务器,具体根据实际使用需求确定。
举例性地,以下以一种应用场景为例说明本申请实施例的实现过程。该实施例可以应用于产教融合的用户信息的推送系统。服务系统可以接收各个学校(即用户群组)上传的学生信息,并基于所有的学生信息生成关于该学校对应的群组特征参量。同样地,服务系统还可以接收各个企业、公司、用人单位等上传的对象信息,并构建对应的对象特征参量。政府可以发布多类型不同的法律法规以及相关的就业政策等,服务系统可以获取已发布且已生效的标准法律文本,从而构建对应的用户推荐匹配算法,并基于该用户推荐匹配算法确定各个用人单位、企业、公司所关联的学校,建立学校与用人单位之间的关联关系,以便该学校的学生可以定向输送给该用人单位,实现了大批量的用户信息推荐给目标对象的目的。
以上可以看出,本发明实施例提供的一种信息推送的方法通过为不同的用户群组配置对应的分布式数据节点,以通过分布式数据节点采集关联的用户群组的用户信息,从而能够在数据采集的层面上确定不同用户信息之间的群组关联性,并生成关于该用户群组对应的群组特征参量,继而通过对已有的标准文本进行解析,得到对应的用户推荐匹配算法,能够提高后续用户推荐的准确性;将群组特征参量与目标对象的对象特征参量导入到用户推荐匹配算法内,能够确定目标对象与用户群组是否匹配,并选取匹配的目标群组,从目标群组中确定目标用户信息并推送给目标对象的设备,实现了信息推送的目的。与现有的信息推送技术相比,本申请实施例在进行信息推送时,会生成群组特征参量,而该参量是基于该用户群组内的所有用户信息确定的,因此在确保用户信息与目标对象关联的基础上,也能够考虑到用户信息之间的群组特征,能够提高用户信息推送的准确性,以及实现大批量的用户信息推送,提高了信息推送的效率。
图2示出了本发明第二实施例提供的一种信息推送的方法S101的具体实现流程图。参见图2,相对于图1所述实施例,本实施例提供的一种信息推送的方法中S101包括:S1011~S1015,具体详述如下:
进一步地,所述用户信息包含用户行为记录;
对应地,所述接收各个分布式数据节点上传用户群组内用户的用户信息,并基于所述用户信息分别生成各个所述分布式数据节点对应的群组特征参量,包括:
在S1011中,根据所述用户信息中携带的用户标识,将所有所述用户信息划分为多个用户组;每个用户组内包含的用户信息携带的用户标识相同。
在本实施例中,由于分布式数据节点上传的用户信息是关于整个用户群组内所有用户的用户信息,因此,服务系统可以首先对所有用户信息进行分类,基于所属用户的不同,即基于用户信息携带的用户标识,划分为不同的用户组,同一个用户组内的所有用户信息对应同一个用户,因此所携带的用户标识相同。
在S1012中,根据所述用户组内所有所述用户信息的所述用户行为记录,生成用户的行为轨迹;所述行为轨迹内包含有多个行为节点;每个所述行为节点包含行为发生地点以及行为事件信息。
在本实施例中,用户信息具体为对应用户的行为记录,该行为记录可以包含有用户发生的行为事件以及该行为事件所发生的地点信息、持续事件、交互对象、关联用户等等与行为相关的信息。服务系统可以确定用户行为记录中携带有的位置信息以及时间信息,在预设的地图上标记出各个用户行为记录,并对各个标记后的用户行为记录进行聚类分析,从而可以将满足预设的条件的位置以及事件生成行为节点,例如将发生次数大于预设的有效次数阈值的位置区域以及事件类型,生成行为节点。每个行为节点对应有一个行为发生地点以及在该地点对应的行为事件信息。需要说明的是,该行为事件信息可以对应有一个行为类型,也可以对应有多个行为类型。
举例性地,该用户为一学生,服务系统基于该学生的多个用户行为记录生成对应的行为轨迹,该行为轨迹包含有3个节点,分别为宿舍、食堂以及课室,而宿舍对应的行为事件信息可以为日常作息;食堂对应的行为事件信息可以为吃饭;而课室对应的行为事件信息可以为学习,若进一步细化,则上述课室对应的行为事件信息具体可以包含学习的课程等。
在S1013中,基于所有用户对应的所述行为轨迹进行聚类分析,确定所述用户群组对应的特征行为地点以及特征行为事件。
在本实施例中,服务系统在确定了各个用户对应的行为轨迹后,可以对所有行为轨迹进行聚类分析,由于每个用户的行为轨迹对应的是个人的个性行为,在需要确定群组特征时,需要对所有不同的行为轨迹进行聚类分析,而该确定该用户群组的特性,通过对所有行为轨迹进行聚类分析后,可以得到关于该用户群组对应的特征行为地点以及特征行为事件,上述特征行为地点以及特征行为事件用于确定该用户群组对应的特征信息。
在一种可能的实现方式中,对所有用户的行为轨迹进行聚类分析的方式可以为:服务系统可以在预设的地图上标记处各个用户行为轨迹,并计算各个行为轨迹中行为发生地点与其他用户的行为轨迹中的行为发生地点之间的地点相似度,从而能够将相似度小于预设阈值的行为发生地点聚类成一个候选特性地点,继而再确定该候选特征地点对应的行为事件信息之间的行为关联度,从而将行为关联度大于预设关联阈值的候选特征地点识别为特征行为地点,并基于该特征行为地点对应的各个行为事件信息,得到特征行为事件。
在1014中,根据所述特征行为地点、所述特征行为事件以及所述用户群组对应的基准群组信息,确定多个预设特征维度的评分值。
在本实施例中,服务系统可以根据该用户群组对应的特征行为地点以及特征行为事件,来确定该用户群组内各个用户对应的行为特征,并且每个用户群组可以关联有对应的基准群组信息,以确定该用户群组的一些固有特征,基于上述三类型的信息在多个维度上对用户群组进行打分,得到上述每个预设特征维度的评分值。例如,根据某一特征行为地点与学习的相关程度,可以确定学习维度对应的地点得分,根据某一特征行为事件与学习的相关程度,可以确定学习维度对应的事件得分,并基于该基准群组信息确定加权值,例如在学习维度上,若该基准群组信息为研究生对应的权重值为1,本科生对应的权重值为0.8,从而能够基于上述参量计算得到学习维度对应的评分值。
在本实施例中,服务系统可以为不同的特征维度配置对应的评分转换模型,将上述三个参数导入到上述评分转换模型中,即可以计算得到该特征维度对应的评分值。
在S1015中,基于各个所述预设特征维度的评分值,构建所述用户群组对应的群组特征画像,将所述群组特征画像作为所述群组特征参量。
在本实施例中,服务系统可以根据各个预设的评分值,构建对应的群组特征画像,该群组特征画像具体可以基于多边形构成的画像,其中该多边形的边数与上述的预设特征维度的维度个数相关,服务系统可以将该群组特征画像作为该用户群组的群组特征参量。
在本申请实施例中,通过对各个用户行为记录进行聚类分析,从而生成能够表征用户群组特性的特征行为地点以及特征行为事件,从而得到在多个预设维度的评分值,生成群组特征画像,能够提高群组特征参量的准确性。
图3示出了本发明第三实施例提供的一种信息推送的方法S1013的具体实现流程图。参见图3,相对于图2所述实施例,本实施例提供的一种信息推送的方法S1013包括S301~S306,具体详述如下:
进一步地,所述基于所有用户对应的所述行为轨迹进行聚类分析,确定所述用户群组对应的特征行为地点以及特征行为事件,包括:
在S301中,基于所有所述行为轨迹,将所有所述用户的所述行为轨迹重合的所述行为发生地点作为共性特征地点,并基于所述共性特征地点对应的行为事件信息,确定共性特征行为。
在本实施例中,服务系统可以在预设的地图上标记出各个用户的行为轨迹,从而能够基于各个行为轨迹之间的重合程度,确定行为轨迹中重合度较高的行为发生地点作为共性特征地点,即该用户群组内的所有用户均会在该共性特征地点上执行相同的行为事件,即上述共性特征行为,该共性特征行为具体是基于该行为发生地点关联的行为事件确定的。
在S302中,分别对各个所述用户的所述行为轨迹进行分析,选取除所述共性特征地点外,发生次数大于预设的次数阈值的行为发生地点作为所述用户对应的个性发生地点。
在本实施例中,在确定了该用户群组内各个用户的共性特征外,还可以获取各个用户的个性特征。其中,服务系统可以分别对不同的用户行为轨迹进行分析,将行为轨迹中删除已识别得到的共性特性点对应的行为节点,然后再统计各个行为节点对应的发生次数,并将发生次数大于预设的次数阈值的行为发生地点作为该用户的个性发生地点。需要说明的是,每个个性发生地点均关联有对应的所属用户,一个用户可以包含有一个或多个个性发生地点。服务系统会分别确定不同用户的个性发生地点。
在S303中,计算所述个性发生地点相互之间的关联度,将所述关联度大于预设关联阈值的个性发生地点构成个性发生地点组。其中,计算任意两个所述个性发生地点之间的关联度的计算公式为:
在本实施例中,服务系统可以计算不同个性发生地点之间的关联度,从而能够确定该个性发生地点是否具有一定的代表性。其中,计算不同个性发生地点之间的关联度具体从三个维度进行计算,分别为距离维度、地点类型维度以及停留时长维度;其中,距离维度具体可以通过dist()函数计算对应的维度关联因子;而地点类型维度可以基于type()函数计算对应的维度关联因子;停留时长维度则可以根据对应的该个性发生地点对应的平均停留时长之间的差值计算得到。服务系统计算得到各个个性发生地点之间的关联度后,可以将大于预设的关联阈值的个性发生地点添加到一个组内,从而构成了一个个性发生地点组。
在S304中,若任一所述个性发生地点组对应的个性发生地点的个数大于预设的个数阈值,则生成关于所述个性发生地点组对应的个性特征地点,并基于所述个性发生地点组内各个个性发生地点对应的行为事件信息,确定所述个性特征地点关联的个性特征行为。
在本实施例中,服务系统将各个个性发生地点划分为多个不同的个性发生地点组后,可以统计该个性发生地点内包含的地点个数,将组内地点个数大于预设的个数阈值的个性发生地点组作为一个个性特征地点,并将该个性特征地点关联的行为事件信息,确定个性特征行为。由于某一个性发生地点组内的地点个数大于预设的个数阈值,则表示该个性发生地点并非偶发事件,是用户经常经过的地点,能够有效代表该用户的个性特征,能够提高个性特征行为以及个性特征地点识别的准确性。
在S305中,基于所述共性特征行为以及所述个性特征行为确定所述特征行为事件;以及基于所述共性特征地点以及所述个性特征地点确定所述特征行为地点。
在本实施例中,将识别得到的具有共性特征的地点以及具有个性特征的地点进行整合,得到该用户群组对应的特征行为地点,对应地,特征行为事件也包括了个性以及共性两个方面的特征行为。
在本申请实施例中,通过确定用户群组的个性特征以及共性特征,从而能够从不同方面确定该用户群组的特性,提高了后续得到的群组特征参量的准确性,以及特征识别的全面性。
图4示出了本发明第四实施例提供的一种信息推送的方法的具体实现流程图。参见图4,相对于图2所述实施例,本实施例提供的一种信息推送的方法在所述基于各个所述预设特征维度的评分值,构建所述用户群组对应的群组特征画像,将所述群组特征画像作为所述群组特征参量之后,还包括:S401~S404,具体详述如下:
进一步地,在所述基于各个所述预设特征维度的评分值,构建所述用户群组对应的群组特征画像,将所述群组特征画像作为所述群组特征参量之后,还包括:
在S401中,接收所述分布式数据节点上传的新增用户记录,则提取所述新增用户记录对应的新增发生地点。
在本实施例中,服务系统可以对已识别得到的特征行为地点以及特征行为事件进行更新迭代,以提高上述用户群组的群组特征参量的准确性。因此,分布式数据节点可以在生成用户群组的群组特征画像后,还可以继续接收分布式数据节点上传的新增用户记录。该新增用户记录与用户行为记录一样,包含有新增发生地点以及新增行为事件。
在S402中,若所述新增发生地点与任一所述特征行为地点相匹配,则调整所述特征行为地点关联的所述特征维度的评分值,并基于调整后的所述评分值更新所述群组特征画像。
在本实施例中,服务系统若检测到任一新增发生地点与已经识别得到特征行为地点相匹配,则表示该新增发生地点属于该用户群组已经识别得到的特征行为地点,此时无需增加新增行为地点,而是只需对该匹配的特征行为地点对应的评分值即可,例如可以增加该特征行为地点对应的权重值,并基于调整后的权重值重新计算各个预设特征维度的评分值,从而更新已生成的用户群组的群组特征画像。
在S403中,若所述新增发生地点与各个所述特征行为地点不匹配,则更新所述新增用户记录所属用户的行为轨迹,并增加更新触发计数器的计数值。
在本实施例中,服务系统若检测到新增发生地点与所有已经识别得到特征行为地点均不匹配,则表示该新增行为地点并非属于已识别的特征行为地点,但是否需要为新增的特征行为地点需要进一步确定,因此可以对该新增行为记录所属用户的行为轨迹进行更新,并增加更新触发计数器的计数值。通过上述的更新触发计数器,可以确定新增的特征信息是否累积到一定数量,以判断是否需要进行更新操作。若该计数值小于或等于预设的计数阈值,则表示当前新增的特征信息并未累积到一定数量,此时,可以继续采集用户信息,等待累积到一定数量后对群组特征参量进行更新。
在S404中,若检测到所述计数值大于预设的计数阈值,则基于所有更新后的行为轨迹,返回执行所述基于所有用户对应的所述行为轨迹进行聚类分析,确定所述用户群组对应的特征行为地点以及特征行为事件的步骤。
在本实施例中,服务系统若检测到该计数值大于预设的计数阈值,则表示新增特征已经累积到一定数量,当前的群组特征参量可能并不能很好地表示群组特征,此时,可以重新执行基于所有用户对应的所述行为轨迹进行聚类分析,确定所述用户群组对应的特征行为地点以及特征行为事件的步骤,以重新确定特征行为地点以及特征行为事件,具体确定的方式可以参见上述实施例的描述,在此不再赘述。
在本申请实施例中,可以通过更新迭代的方式对已经生成的群组特征参量进行更新,从而可以提高群组特征参量的准确性。
图5示出了本发明第五实施例提供的一种信息推送的方法S103的具体实现流程图。参见图5,相对于图2所述实施例,本实施例提供的一种信息推送的方法中S103包括:S1031~S1033,具体详述如下:
进一步地,所述目标对象特征参量为所述目标对象的对象特征画像;
所述将目标对象的对象特征参量以及所述群组特征参量导入到各个所述用户推荐匹配算法,分别计算所述目标对象与各个所述用户群组之间的匹配度,包括:
在S1031中,基于所述用户推荐匹配算法,从所有所述预设特征维度中选取出有效特征维度,并确定各个有效特征维度对应的加权权重。
在本实施例中,服务系统已经预先存储有目标对象的对象特征画像,在计算上述两者之间的匹配度时,可以通过计算两个画像之间的重合度,以确定目标对象与用户群组是否匹配。而两者是否匹配,除了与自身画像相关外,还与当前已发布的标准文本相关,因此,服务系统可以根据已经生成的用户推荐匹配算法,确定在多个预设特征维度中与该匹配算法关联的有效特征维度,以及各个有效特征维度对应的加权权重。
在S1032中,基于各个有效特征维度以及所述加权权重调整所述对象特征画像,得到优化对象画像;以及基于各个有效特征维度以及所述加权权重调整所述群组特征画像,得到优化群组画像。
在本实施例中,服务系统可以基于确定得到的各个有效特征维度以及对应的权重值,对已经生成的画像进行更新,得到与群组特征画像对应的优化群组画像,以及与对象特征画对应的优化对象画像。
在S1033中,计算所述优化对象画像以及所述优化群组画像之间的重合度,基于所述重合度得到所述匹配度。
在本实施例中,服务系统在计算得到上述两个画像后,即对画像的外形调整完成后,可以计算上述两个画像之间的重合度,若两者的重合度越高,则对应的匹配度越高;反之,若两者之间的重合度越低,则对应的匹配度越低。
在本申请实施例中,通过用户推荐匹配算法对各个画像进行调整,并计算调整后的优化群组画像与优化对象画像之间的重合度以确定两者之间的匹配度,能够提高匹配度计算的准确性,以使识别得到的目标群组符合已发布的标准文本的推荐要求。
图6示出了本发明第六实施例提供的一种信息推送的方法S102的具体实现流程图。参见图6,相对于图1-图5任一所述实施例,本实施例提供的一种信息推送的方法中S102包括:S1021~S1024,具体详述如下:
在S1021中,将所有所述标准文本划分为多个文本组,并基于同一文本组内各个所述标准文本的文本编号,确定该文本组对应的有效文本。
在本实施例中,由于随着时间的推移,相同的文本可以发布多个不同的版本,因此获取得到的标准文本中,属于相同类型的文本的数量可以为多个,为了能够确定当前有效的文本,可以属于相同类型的文本划分到同一个文本组内,并根据该文本组内各个标准文本的文本编号,确定出最新发布的标准文本,将最新发布的标准文本作为该文本组对应的有效文本。
在S1022中,对所述有效文本进行语义分析,定位所述有效文本中与推荐用户相关的推荐特征语段。
在S1023中,基于所述有效文本内所有所述推荐特征语段,得到多个预设推荐维度的推荐特征值。
在本实施例中,服务系统可以对有效文本进行语义分析,以确定与推荐用户相关的推荐特征语段,识别推荐特征语段可以基于各个语段内包含的关键词确定。基于该特征语段导入到预设的神经网络进行语义理解,从而能够得到多个预设的推荐维度关联的推荐特征值。例如该标准推荐语段内包含有“本科”,则可以将学历的推荐维度配置至与“本科”关联的数值。
在S1024中,根据所有所述推荐维度的所述推荐特征值,生成所述用户推荐匹配算法。
在本实施例中,服务系统在确定了多个预设的推荐维度关联的特征值后,可以生成多个不同的推荐条件,并基于各个推荐条件生成与之对应的用户推荐算法。
在本申请实施例中,通过确定出最新的有效文本,并提取对应的推荐特征语段,生成用户推荐算法,提高了用户推荐匹配算法的准确性。
图7示出了本发明第七实施例提供的一种信息推送的方法S105的具体实现流程图。参见图7,相对于图1-图5任一所述实施例,本实施例提供的一种信息推送的方法中S105包括:S1051~S1053,具体详述如下:
在S1051中,根据所述目标对象关联的目标用户个数以及淘汰比例系数,确定推荐用户个数。
在S1052中,根据所述目标群组中各个用户信息,确定各个用户的推荐次序。
在S1053中,基于所述推荐次序,向所述目标对象的设备推送与所述推荐用户个数匹配的多个用户的用户信息。
在本实施例中,目标对象在获取历史推荐过程中,可以确定推送得到的用户信息的淘汰比例,该淘汰比例与历史的推送的准确性相关。由于推送的过程是信息冗余推送的过程,即推送信息的数量往往会大于用户的需求数量,基于此,服务系统可以根据目标对象需求的目标用户个数,以及预设的淘汰比例系数,确定实际所需推荐的推荐用户个数。并根据各个用户信息确定每个用户对应的推荐次序,从用户群组中选取出对应数量的用户作为目标用户,并将目标用户的信息推送给目标对象的设备。
在本申请实施例中,通过确定预设的淘汰比例系数,能够为目标对象实现冗余信息的推送,能够为目标对象提供更多的可选用户,提高了推送操作的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图8示出了本发明一实施例提供的一种信息推送的装置的结构框图,该服务系统包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1与图1所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。
参见图8,所述信息推送的装置包括:
群组特征参量获取单元81,用于接收各个分布式数据节点上传用户群组内用户的用户信息,并基于所述用户信息分别生成各个所述分布式数据节点对应的群组特征参量;每个所述分布式数据节点对应一个用户群组;
用户推荐匹配算法确定单元82,用于基于所有已发布的标准文本,生成至少一个用户推荐匹配算法;
匹配度计算单元83,用于将目标对象的对象特征参量以及所述群组特征参量导入到各个所述用户推荐匹配算法,分别计算所述目标对象与各个所述用户群组之间的匹配度;
目标群组选取单元84,用于将与所述目标对象之间的所述匹配度大于预设的推荐阈值的所述用户群组识别为所述目标对象的目标群组;
目标信息推送单元85,用于从所述目标群组中的所述用户信息中,选取与所述目标对象关联的目标用户信息,将所述目标用户信息推送给所述目标对象的设备。
可选地,所述用户信息包含用户行为记录;
对应地,所述群组特征参量获取单元81包括:
用户组划分单元,用于根据所述用户信息中携带的用户标识,将所有所述用户信息划分为多个用户组;每个用户组内包含的用户信息携带的用户标识相同;
行为轨迹生成单元,用于根据所述用户组内所有所述用户信息的所述用户行为记录,生成用户的行为轨迹;所述行为轨迹内包含有多个行为节点;每个所述行为节点包含行为发生地点以及行为事件信息;
聚类分析单元,用于基于所有用户对应的所述行为轨迹进行聚类分析,确定所述用户群组对应的特征行为地点以及特征行为事件;
评分值确定单元,用于根据所述特征行为地点、所述特征行为事件以及所述用户群组对应的基准群组信息,确定多个预设特征维度的评分值;
群组特征画像生成单元,用于基于各个所述预设特征维度的评分值,构建所述用户群组对应的群组特征画像,将所述群组特征画像作为所述群组特征参量。
可选地,所述聚类分析单元包括:
共性特征识别单元,用于基于所有所述行为轨迹,将所有所述用户的所述行为轨迹重合的所述行为发生地点作为共性特征地点,并基于所述共性特征地点对应的行为事件信息,确定共性特征行为;
个性发生地点识别单元,用于分别对各个所述用户的所述行为轨迹进行分析,选取除所述共性特征地点外,发生次数大于预设的次数阈值的行为发生地点作为所述用户对应的个性发生地点;
关联度计算单元,用于计算所述个性发生地点相互之间的关联度,将所述关联度大于预设关联阈值的个性发生地点构成个性发生地点组;
个性特征识别单元,用于若任一所述个性发生地点组对应的个性发生地点的个数大于预设的个数阈值,则生成关于所述个性发生地点组对应的个性特征地点,并基于所述个性发生地点组内各个个性发生地点对应的行为事件信息,确定所述个性特征地点关联的个性特征行为;
特征信息识别单元,用于基于所述共性特征行为以及所述个性特征行为确定所述特征行为事件;以及基于所述共性特征地点以及所述个性特征地点确定所述特征行为地点;
其中,计算任意两个所述个性发生地点之间的关联度的计算公式为:
可选地,所述信息推送的装置还包括:
新增发生地点识别单元,用于接收所述分布式数据节点上传的新增用户记录,则提取所述新增用户记录对应的新增发生地点;
群组画像更新单元,用于若所述新增发生地点与任一所述特征行为地点相匹配,则调整所述特征行为地点关联的所述特征维度的评分值,并基于调整后的所述评分值更新所述群组特征画像;
行为轨迹更新单元,用于若所述新增发生地点与各个所述特征行为地点不匹配,则更新所述新增用户记录所属用户的行为轨迹,并增加更新触发计数器的计数值;
更新触发单元,用于若检测到所述计数值大于预设的计数阈值,则基于所有更新后的行为轨迹,返回执行所述基于所有用户对应的所述行为轨迹进行聚类分析,确定所述用户群组对应的特征行为地点以及特征行为事件的步骤。
可选地,所述目标对象特征参量为所述目标对象的对象特征画像;
所述匹配度计算单元83包括:
有效特征维度识别单元,用于基于所述用户推荐匹配算法,从所有所述预设特征维度中选取出有效特征维度,并确定各个有效特征维度对应的加权权重;
画像优化单元,用于基于各个有效特征维度以及所述加权权重调整所述对象特征画像,得到优化对象画像;以及基于各个有效特征维度以及所述加权权重调整所述群组特征画像,得到优化群组画像;
重合度计算单元,用于计算所述优化对象画像以及所述优化群组画像之间的重合度,基于所述重合度得到所述匹配度。
可选地,所述用户推荐匹配算法确定单元82包括:
有效文本确定单元,用于将所有所述标准文本划分为多个文本组,并基于同一文本组内各个所述标准文本的文本编号,确定该文本组对应的有效文本;
推荐特征语段识别单元,用于对所述有效文本进行语义分析,定位所述有效文本中与推荐用户相关的推荐特征语段;
推荐特征值计算单元,用于基于所述有效文本内所有所述推荐特征语段,得到多个预设推荐维度的推荐特征值;
推荐特征值整合单元,用于根据所有所述推荐维度的所述推荐特征值,生成所述用户推荐匹配算法。
可选地,所述目标信息推送单元85包括:
推荐用户个数确定单元,用于根据所述目标对象关联的目标用户个数以及淘汰比例系数,确定推荐用户个数;
用户排序单元,用于根据所述目标群组中各个用户信息,确定各个用户的推荐次序;
用户选取单元,用于基于所述推荐次序,向所述目标对象的设备推送与所述推荐用户个数匹配的多个用户的用户信息。
因此,本发明实施例提供的服务系统同样可以在进行信息推送时,会生成群组特征参量,而该参量是基于该用户群组内的所有用户信息确定的,因此在确保用户信息与目标对象关联的基础上,也能够考虑到用户信息之间的群组特征,能够提高用户信息推送的准确性,以及实现大批量的用户信息推送,提高了信息推送的效率。
图9是本发明另一实施例提供的一种服务系统的示意图。如图9所示,该实施例的服务系统9包括:处理器90、存储器91以及存储在所述存储器91中并可在所述处理器90上运行的计算机程序92,例如信息推送的程序。所述处理器90执行所述计算机程序92时实现上述各个信息推送的方法实施例中的步骤,例如图1所示的S101至S105。或者,所述处理器90执行所述计算机程序92时实现上述各装置实施例中各单元的功能,例如图8所示模块81至85功能。
示例性的,所述计算机程序92可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器91中,并由所述处理器90执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序92在所述服务系统9中的执行过程。例如,所述计算机程序92可以被分割成群组特征参量获取单元、用户推荐匹配算法确定单元、匹配度计算单元、目标群组选取单元以及目标信息推送单元,各单元具体功能如上所述。
所述服务系统可包括,但不仅限于,处理器90、存储器91。本领域技术人员可以理解,图9仅仅是服务系统9的示例,并不构成对服务系统9的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务系统还可以包括输入输出设备、网络接入设备、总线等。
所称处理器90可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器91可以是所述服务系统9的内部存储单元,例如服务系统9的硬盘或内存。所述存储器91也可以是所述服务系统9的外部存储设备,例如所述服务系统9上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器91还可以既包括所述服务系统9的内部存储单元也包括外部存储设备。所述存储器91用于存储所述计算机程序以及所述服务系统所需的其他程序和数据。所述存储器91还可以用于暂时地存储已经输出或者将要输出的数据。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于产教融合的信息推送的方法,其特征在于,包括:
接收各个分布式数据节点上传用户群组内用户的用户信息,并基于所述用户信息分别生成各个所述分布式数据节点对应的群组特征参量;每个所述分布式数据节点对应一个用户群组;所述群组特征参量用于表示所述用户群组的特征信息;
基于所有已发布的标准文本,生成至少一个用户推荐匹配算法;
将目标对象的对象特征参量以及所述群组特征参量导入到各个所述用户推荐匹配算法,分别计算所述目标对象与各个所述用户群组之间的匹配度;所述对象特征参量用于表示所述目标对象的特征信息;
将与所述目标对象之间的所述匹配度大于预设的推荐阈值的所述用户群组识别为所述目标对象的目标群组;
向所述目标对象的终端推送所述目标群组内若干用户的所述用户信息。
2.根据权利要求1所述的方法,其特征在于,所述用户信息包含用户行为记录;
对应地,所述接收各个分布式数据节点上传用户群组内用户的用户信息,并基于所述用户信息分别生成各个所述分布式数据节点对应的群组特征参量,包括:
根据所述用户信息中携带的用户标识,将所有所述用户信息划分为多个用户组;每个用户组内包含的用户信息携带的用户标识相同;
根据所述用户组内所有所述用户信息的所述用户行为记录,生成用户的行为轨迹;所述行为轨迹内包含有多个行为节点;每个所述行为节点包含行为发生地点以及行为事件信息;
基于所有用户对应的所述行为轨迹进行聚类分析,确定所述用户群组对应的特征行为地点以及特征行为事件;
根据所述特征行为地点、所述特征行为事件以及所述用户群组对应的基准群组信息,确定多个预设特征维度的评分值;
基于各个所述预设特征维度的评分值,构建所述用户群组对应的群组特征画像,将所述群组特征画像作为所述群组特征参量。
3.根据权利要求2所述的方法,其特征在于,所述基于所有用户对应的所述行为轨迹进行聚类分析,确定所述用户群组对应的特征行为地点以及特征行为事件,包括:
基于所有所述行为轨迹,将所有所述用户的所述行为轨迹重合的所述行为发生地点作为共性特征地点,并基于所述共性特征地点对应的行为事件信息,确定共性特征行为;
分别对各个所述用户的所述行为轨迹进行分析,选取除所述共性特征地点外,发生次数大于预设的次数阈值的行为发生地点作为所述用户对应的个性发生地点;
计算所述个性发生地点相互之间的关联度,将所述关联度大于预设关联阈值的个性发生地点构成个性发生地点组;
若任一所述个性发生地点组对应的个性发生地点的个数大于预设的个数阈值,则生成关于所述个性发生地点组对应的个性特征地点,并基于所述个性发生地点组内各个个性发生地点对应的行为事件信息,确定所述个性特征地点关联的个性特征行为;
基于所述共性特征行为以及所述个性特征行为确定所述特征行为事件;以及
基于所述共性特征地点以及所述个性特征地点确定所述特征行为地点;
其中,计算任意两个所述个性发生地点之间的关联度的计算公式为:
4.根据权利要求2所述的方法,其特征在于,在所述基于各个所述预设特征维度的评分值,构建所述用户群组对应的群组特征画像,将所述群组特征画像作为所述群组特征参量之后,还包括:
接收所述分布式数据节点上传的新增用户记录,则提取所述新增用户记录对应的新增发生地点;
若所述新增发生地点与任一所述特征行为地点相匹配,则调整所述特征行为地点关联的所述特征维度的评分值,并基于调整后的所述评分值更新所述群组特征画像;
若所述新增发生地点与各个所述特征行为地点不匹配,则更新所述新增用户记录所属用户的行为轨迹,并增加更新触发计数器的计数值;
若检测到所述计数值大于预设的计数阈值,则基于所有更新后的行为轨迹,返回执行所述基于所有用户对应的所述行为轨迹进行聚类分析,确定所述用户群组对应的特征行为地点以及特征行为事件的步骤。
5.根据权利要求2所述的方法,其特征在于,所述目标对象特征参量为所述目标对象的对象特征画像;
所述将目标对象的对象特征参量以及所述群组特征参量导入到各个所述用户推荐匹配算法,分别计算所述目标对象与各个所述用户群组之间的匹配度,包括:
基于所述用户推荐匹配算法,从所有所述预设特征维度中选取出有效特征维度,并确定各个有效特征维度对应的加权权重;
基于各个有效特征维度以及所述加权权重调整所述对象特征画像,得到优化对象画像;以及基于各个有效特征维度以及所述加权权重调整所述群组特征画像,得到优化群组画像;
计算所述优化对象画像以及所述优化群组画像之间的重合度,基于所述重合度得到所述匹配度。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所有已发布的标准文本,生成至少一个用户推荐匹配算法,包括:
将所有所述标准文本划分为多个文本组,并基于同一文本组内各个所述标准文本的文本编号,确定该文本组对应的有效文本;
对所述有效文本进行语义分析,定位所述有效文本中与推荐用户相关的推荐特征语段;
基于所述有效文本内所有所述推荐特征语段,得到多个预设推荐维度的推荐特征值;
根据所有所述推荐维度的所述推荐特征值,生成所述用户推荐匹配算法。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述向所述目标对象的终端推送所述目标群组内若干用户的所述用户信息,包括:
根据所述目标对象关联的目标用户个数以及淘汰比例系数,确定推荐用户个数;
根据所述目标群组中各个用户信息,确定各个用户的推荐次序;
基于所述推荐次序,向所述目标对象的设备推送与所述推荐用户个数匹配的多个用户的用户信息。
8.一种信息推送的装置,其特征在于,包括:
群组特征参量获取单元,用于接收各个分布式数据节点上传用户群组内用户的用户信息,并基于所述用户信息分别生成各个所述分布式数据节点对应的群组特征参量;每个所述分布式数据节点对应一个用户群组;所述群组特征参量用于表示所述用户群组的特征信息;
用户推荐匹配算法确定单元,用于基于所有已发布的标准文本,生成至少一个用户推荐匹配算法;
匹配度计算单元,用于将目标对象的对象特征参量以及所述群组特征参量导入到各个所述用户推荐匹配算法,分别计算所述目标对象与各个所述用户群组之间的匹配度;所述对象特征参量用于表示所述目标对象的特征信息;
目标群组选取单元,用于将与所述目标对象之间的所述匹配度大于预设的推荐阈值的所述用户群组识别为所述目标对象的目标群组;
目标信息推送单元,用于从所述目标群组中的所述用户信息中,选取与所述目标对象关联的目标用户信息,将所述目标用户信息推送给所述目标对象的设备。
9.一种服务系统,其特征在于,所述服务系统包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110631348.0A CN113254833B (zh) | 2021-06-07 | 2021-06-07 | 一种基于产教融合的信息推送的方法及服务系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110631348.0A CN113254833B (zh) | 2021-06-07 | 2021-06-07 | 一种基于产教融合的信息推送的方法及服务系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113254833A true CN113254833A (zh) | 2021-08-13 |
CN113254833B CN113254833B (zh) | 2021-10-29 |
Family
ID=77186844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110631348.0A Active CN113254833B (zh) | 2021-06-07 | 2021-06-07 | 一种基于产教融合的信息推送的方法及服务系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113254833B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113821407A (zh) * | 2021-09-15 | 2021-12-21 | 浙江网新恩普软件有限公司 | 一种Storm分布式实时计算方法及系统 |
CN115018673A (zh) * | 2021-12-07 | 2022-09-06 | 湖北工程职业学院 | 一种基于课、教、产、城融合的职业教育体系和方法 |
CN115098793A (zh) * | 2022-03-30 | 2022-09-23 | 陈应书 | 基于大数据的用户画像分析方法及系统 |
CN116433082A (zh) * | 2023-03-22 | 2023-07-14 | 北京游娱网络科技有限公司 | 一种评价报告的生成方法、装置、电子设备及存储介质 |
CN116452165A (zh) * | 2023-03-22 | 2023-07-18 | 北京游娱网络科技有限公司 | 一种人才信息推荐方法、服务系统及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004126975A (ja) * | 2002-10-03 | 2004-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 選好傾向類似ユーザ抽出方法及び装置、並びに選好傾向類似ユーザ抽出プログラム及びそれを記録した記録媒体 |
US20120047150A1 (en) * | 2005-03-30 | 2012-02-23 | Spiegel Joel R | Mining of user event data to identify users with common interests |
US20170109446A1 (en) * | 2015-09-09 | 2017-04-20 | Steven Wu | Computerized systems and methods for offline social recommendations |
CN106682013A (zh) * | 2015-11-09 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 用于数据推送的方法和设备 |
CN107507016A (zh) * | 2017-06-29 | 2017-12-22 | 北京三快在线科技有限公司 | 一种消息推送方法和系统 |
CN108665083A (zh) * | 2017-03-31 | 2018-10-16 | 江苏瑞丰信息技术股份有限公司 | 一种基于用户画像动态轨迹模型的广告推荐方法及系统 |
CN110162695A (zh) * | 2019-04-09 | 2019-08-23 | 中国科学院深圳先进技术研究院 | 一种信息推送的方法及设备 |
US20190332872A1 (en) * | 2018-04-28 | 2019-10-31 | Beijing Kuangshi Technology Co., Ltd. | Information push method, information push device and information push system |
CN111888769A (zh) * | 2020-08-11 | 2020-11-06 | 网易(杭州)网络有限公司 | 一种群组推荐方法、装置、电子设备及存储介质 |
-
2021
- 2021-06-07 CN CN202110631348.0A patent/CN113254833B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004126975A (ja) * | 2002-10-03 | 2004-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 選好傾向類似ユーザ抽出方法及び装置、並びに選好傾向類似ユーザ抽出プログラム及びそれを記録した記録媒体 |
US20120047150A1 (en) * | 2005-03-30 | 2012-02-23 | Spiegel Joel R | Mining of user event data to identify users with common interests |
US20170109446A1 (en) * | 2015-09-09 | 2017-04-20 | Steven Wu | Computerized systems and methods for offline social recommendations |
CN106682013A (zh) * | 2015-11-09 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 用于数据推送的方法和设备 |
CN108665083A (zh) * | 2017-03-31 | 2018-10-16 | 江苏瑞丰信息技术股份有限公司 | 一种基于用户画像动态轨迹模型的广告推荐方法及系统 |
CN107507016A (zh) * | 2017-06-29 | 2017-12-22 | 北京三快在线科技有限公司 | 一种消息推送方法和系统 |
US20190332872A1 (en) * | 2018-04-28 | 2019-10-31 | Beijing Kuangshi Technology Co., Ltd. | Information push method, information push device and information push system |
CN110162695A (zh) * | 2019-04-09 | 2019-08-23 | 中国科学院深圳先进技术研究院 | 一种信息推送的方法及设备 |
CN111888769A (zh) * | 2020-08-11 | 2020-11-06 | 网易(杭州)网络有限公司 | 一种群组推荐方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
兰冰: "基于群组用户画像的图书馆信息智能推送服务", 《图书馆学刊》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113821407A (zh) * | 2021-09-15 | 2021-12-21 | 浙江网新恩普软件有限公司 | 一种Storm分布式实时计算方法及系统 |
CN113821407B (zh) * | 2021-09-15 | 2023-08-01 | 浙江浙大网新软件产业集团有限公司 | 一种Storm分布式实时计算方法及系统 |
CN115018673A (zh) * | 2021-12-07 | 2022-09-06 | 湖北工程职业学院 | 一种基于课、教、产、城融合的职业教育体系和方法 |
CN115098793A (zh) * | 2022-03-30 | 2022-09-23 | 陈应书 | 基于大数据的用户画像分析方法及系统 |
CN116433082A (zh) * | 2023-03-22 | 2023-07-14 | 北京游娱网络科技有限公司 | 一种评价报告的生成方法、装置、电子设备及存储介质 |
CN116452165A (zh) * | 2023-03-22 | 2023-07-18 | 北京游娱网络科技有限公司 | 一种人才信息推荐方法、服务系统及存储介质 |
CN116433082B (zh) * | 2023-03-22 | 2023-12-26 | 北京游娱网络科技有限公司 | 一种评价报告的生成方法、装置、电子设备及存储介质 |
CN116452165B (zh) * | 2023-03-22 | 2024-05-24 | 北京游娱网络科技有限公司 | 一种人才信息推荐方法、服务系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113254833B (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113254833B (zh) | 一种基于产教融合的信息推送的方法及服务系统 | |
US11487941B2 (en) | Techniques for determining categorized text | |
CN110162695B (zh) | 一种信息推送的方法及设备 | |
CN109345399B (zh) | 理赔风险评估方法、装置、计算机设备及存储介质 | |
Hua et al. | Automatic targeted-domain spatiotemporal event detection in twitter | |
CN111506723B (zh) | 问答响应方法、装置、设备及存储介质 | |
CN107862022B (zh) | 文化资源推荐系统 | |
Wang et al. | Fixercache: Unsupervised caching active developers for diverse bug triage | |
CN113707297A (zh) | 医疗数据的处理方法、装置、设备及存储介质 | |
CN111723292B (zh) | 基于图神经网络的推荐方法、系统、电子设备及存储介质 | |
Sahu et al. | Modified K-NN algorithm for classification problems with improved accuracy | |
CN112380344A (zh) | 文本分类的方法、话题生成的方法、装置、设备及介质 | |
CN113449204B (zh) | 基于局部聚合图注意力网络的社会事件分类方法、装置 | |
Zhou et al. | A feature extraction method for multivariate time series classification using temporal patterns | |
US20240037375A1 (en) | Systems and Methods for Knowledge Distillation Using Artificial Intelligence | |
Hossny et al. | Enhancing keyword correlation for event detection in social networks using SVD and k-means: Twitter case study | |
CN113569118B (zh) | 自媒体推送方法、装置、计算机设备及存储介质 | |
CN114692978A (zh) | 一种基于大数据的社交媒体用户行为预测方法及系统 | |
Zhang et al. | A multi-level matching method with hybrid similarity for document retrieval | |
CN110019763B (zh) | 文本过滤方法、系统、设备及计算机可读存储介质 | |
Liu et al. | [Retracted] Deep Learning and Collaborative Filtering‐Based Methods for Students’ Performance Prediction and Course Recommendation | |
CN111325255B (zh) | 特定人群圈定方法、装置、电子设备及存储介质 | |
Sahoo | Study of parametric performance evaluation of machine learning and statistical classifiers | |
CN116958608A (zh) | 对象识别模型的更新方法、装置、设备、介质及程序产品 | |
CN113887115A (zh) | 运行状态的安全检测方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |