CN114154052A - 信息推荐方法、装置、计算机设备及存储介质 - Google Patents
信息推荐方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114154052A CN114154052A CN202111003971.8A CN202111003971A CN114154052A CN 114154052 A CN114154052 A CN 114154052A CN 202111003971 A CN202111003971 A CN 202111003971A CN 114154052 A CN114154052 A CN 114154052A
- Authority
- CN
- China
- Prior art keywords
- recommendation
- label
- user
- information
- weight
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术,公开了信息推荐方法、装置、计算机设备及存储介质,属于互联网技术领域。信息推荐方法能够根据用户的标识数据获取第一特征标签,根据第一特征标签和用户输入的第二特征标签构建与用户兴趣爱好及基础信息关联的用户‑标签权重矩阵;考虑到一个推荐信息可能对应多个推荐标签,为了提升推荐的精准性,从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐‑标签权重矩阵;根据用户‑标签权重矩阵和推荐‑标签权重矩阵构建用户标签与推荐标签关联的用户‑推荐关联矩阵,通过计算用户‑推荐关联矩阵中用户标签与推荐标签权重的相似度生成满足用户的兴趣爱好及基础信息的推荐列表,从而实现精准推荐的目的。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及信息推荐方法、装置、计算机设备及存储介质。
背景技术
智能算法推荐是指把合适的内容推送给合适的人,它存在显而易见的优势,如:投入产出比更高、覆盖面更广、个性化程度更高等。网站的智能推荐算法使用率越来越高,已经成为一种常态,目前应用较为广泛的推荐方式主要有两种:用于推荐热门信息的协同推荐方式;根据用户不同的兴趣爱好推荐与之匹配信息的内容推荐方式。
协同推荐方式对于资讯和公示内容的展现更强调抓住当前热点,推荐内容皆以热门程度和时效性为主,而忽略了用户/员工个性化的需求。内容推荐方式从每个推送的内容抽取对应的特征,用来代表此内容特征;利用用户对内容兴趣爱好的特征数据(如:浏览内容,浏览时长,点赞数等)生成用户偏好;根据内容特征和用户偏好,为用户推送其最有可能感兴趣的内容。然而,对于冗长且繁琐的内容,抽取的特征都只能代表该内容的一方面,而不是全部从而影响推送内容的准确性;只针对用户过去对某些内容的兴趣爱好推荐内容,无法针对用户潜在兴趣推荐内容;无法为新用户推荐适合的内容。
综上所述,现有的推荐方式无法根据用户情况(如:用户的潜在兴趣、没有获知用户爱好的新用户)精准的推荐内容。
发明内容
针对现有的推荐方式无法根据用户情况精准推荐的问题,现提供一种旨在可基于用户的特征数据精准推荐的信息推荐方法。
为实现上述目的,本发明提供一种信息推荐方法,包括:
采集用户的标识数据,根据所述标识数据获取所述用户的第一特征标签;
获取所述用户输入的第二特征标签;
根据所述第一特征标签和所述第二特征标签构建用户-标签权重矩阵;
从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐 -标签权重矩阵;
根据所述用户-标签权重矩阵和所述推荐-标签权重矩阵构建用户-推荐关联矩阵;
计算所述用户-推荐关联矩阵中用户标签与推荐标签权重的相似度,根据所述相似度生成推荐列表。
可选的,所述采集用户的标识数据,根据所述标识数据获取所述用户的第一特征标签,包括:
采集用户的标识数据,根据所述标识数据从人力系统获取所述用户的基础信息;
提取所述基础信息中的特征数据,将所述特征数据转换为第一特征标签;
所述第一特征标签包括部门标签、岗位标签、兴趣标签、生日标签、星座标签、地址标签、性别标签、年龄标签中的至少一种标签。
可选的,所述根据所述第一特征标签和所述第二特征标签构建用户-标签权重矩阵,包括:
采集当前信息,所述当前信息包括当前时间数据、当前地址数据、当前天气数据、当前温度数据中的至少一种数据;
将所述当前信息与所述第一特征标签进行匹配,获取匹配数据;
根据所述匹配数据和所述第二特征标签确定标签权重;
基于所述标签权重生成所述用户-标签权重矩阵。
可选的,所述推荐库包括携带预设标签的推荐信息和未携带预设标签的推荐信息;
所述从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵,包括:
分别对所述推荐库中各个推荐信息的标题进行分词,根据分词生成与推荐信息对应的推荐标签;
基于所述推荐信息的推荐标签占比以及所述推荐信息的所述预设标签占比,确定所述推荐标签的权重以及所述预设标签的权重;
当推荐信息携带预设标签时,依据推荐信息的推荐标签的权重和预设标签的权重生成推荐-标签权重矩阵;当推荐信息未携带预设标签时,依据推荐标签的权重生成推荐-标签权重矩阵。
可选的,所述根据所述用户-标签权重矩阵和所述推荐-标签权重矩阵构建用户-推荐关联矩阵,包括:
依据用户标签及推荐标签将所述用户-标签权重矩阵中的用户标签与所述推荐-标签权重矩阵中的推荐信息关联,组合生成所述用户-推荐关联矩阵。
可选的,所述计算所述用户-推荐关联矩阵中用户标签与推荐标签权重的相似度,根据所述相似度生成推荐列表,包括:
计算所述用户-推荐关联矩阵中各个推荐信息对应的推荐标签的价值评定量;
将所述价值评定量作为推荐标签权重的相似度;
依据所述相似度从大到小的顺序,对与所述推荐标签权重对应的推荐信息进行排序,生成所述推荐列表。
可选的,所述推荐列表采用整合推荐模式、多行并行推荐模式或流水线推荐模式。
为实现上述目的,本发明还提供一种信息推荐装置,包括:
获取单元,用于采集用户的标识数据,根据所述标识数据获取所述用户的第一特征标签;
接收单元,用于接收所述用户输入的第二特征标签;
第一构建单元,用于根据所述第一特征标签和所述第二特征标签构建用户-标签权重矩阵;
第二构建单元,用于从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵;
第三构建单元,用于根据所述用户-标签权重矩阵和所述推荐-标签权重矩阵构建用户-推荐关联矩阵;
生成单元,用于计算所述用户-推荐关联矩阵中用户标签与推荐标签权重的相似度,根据所述相似度生成推荐列表。
为实现上述目的,本发明还提供一种计算机设备,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明提供的信息推荐方法、装置、计算机设备及存储介质,能够根据用户的标识数据获取第一特征标签,根据第一特征标签和用户输入的第二特征标签构建与用户兴趣爱好及基础信息关联的用户-标签权重矩阵;考虑到一个推荐信息可能对应多个推荐标签,为了提升推荐的精准性,从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵;根据用户-标签权重矩阵和推荐-标签权重矩阵构建用户标签与推荐标签关联的用户-推荐关联矩阵,通过计算用户-推荐关联矩阵中用户标签与推荐标签权重的相似度生成满足用户的兴趣爱好及基础信息的推荐列表,从而实现精准推荐的目的。
附图说明
图1为本发明所述的信息推荐方法的一种实施例的方法流程图;
图2为本发明根据标识数据获取第一特征标签的一种实施例的流程图;
图3为本发明构建用户-标签权重矩阵的一种实施例的流程图;
图4为本发明生成推荐-标签权重矩阵的一种实施例的流程图;
图5为本发明根据相似度生成推荐列表的一种实施例的流程图;
图6为本发明所述的信息推荐装置的一种实施例的模块图;
图7为本发明所述第一构建单元的一种实施例的模块图;
图8为本发明所述第二构建单元的一种实施例的模块图;
图9为本发明计算机设备的一个实施例的硬件架构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明提供的信息推荐方法、装置、计算机设备及存储介质涉及人工智能技术,可应用于保险、金融、医疗、租赁等业务领域。本发明能够根据用户的标识数据获取第一特征标签,根据第一特征标签和用户输入的第二特征标签构建与用户兴趣爱好及基础信息关联的用户-标签权重矩阵;考虑到一个推荐信息可能对应多个推荐标签,为了提升推荐的精准性,从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵;根据用户-标签权重矩阵和推荐-标签权重矩阵构建用户标签与推荐标签关联的用户-推荐关联矩阵,通过计算用户-推荐关联矩阵中用户标签与推荐标签权重的相似度生成满足用户的兴趣爱好及基础信息的推荐列表,从而实现精准推荐的目的。
实施例一
请参阅图1,本实施例的一种信息推荐方法,包括以下步骤:
S1.采集用户的标识数据,根据所述标识数据获取所述用户的第一特征标签。
需要说明的是:所述第一特征标签可包括部门标签、岗位标签、兴趣标签、生日标签、星座标签、地址标签、性别标签、年龄标签中的至少一种标签。
在本实施例中,信息推荐方法主要用于对企业内部的员工进行信息推荐,用户主要是针对企业的员工。标识数据是指用于标识用户信息的数据,如:员工编号、身份证号等。
进一步,参阅图2所示步骤S1可包括以下步骤:
S11.采集用户的标识数据,根据所述标识数据从人力系统获取所述用户的基础信息。
本实施例中,基础信息可包括用户的简历信息、部门信息、职位信息等。人力系统存储用户的基础信息。根据标识数据查询企业的人力系统,以获取与标识数据关联的用户的基础信息。
S12.提取所述基础信息中的特征数据,将所述特征数据转换为第一特征标签。
本实施例中,可根据基础信息中的标签提取相应的特征数据,例如,根据简历信息中各个项目的标签提取相应的特征数据,以获取用户的年龄、生日、星座、住所地址、性别、专业、兴趣;还可直接从基础信息中获取用户的部门信息、职位信息等信息,将提取的特征数据与预设标签进行匹配,以确定与其匹配的第一特征标签,从而得到统一格式的第一特征标签。
S2.获取所述用户输入的第二特征标签。
需要说明的是,第二特征标签可以有多个,第二特征标签为用户输入的兴趣爱好标签(如:体育标签、娱乐标签、游戏标签、天文爱好标签、文艺标签或乐器标签等),也可以为空,若用户没有兴趣爱好可不输入数据,将第二特征标签设置为空。
S3.根据所述第一特征标签和所述第二特征标签构建用户-标签权重矩阵。
进一步地,参阅图3所示,步骤S3可包括以下步骤:
S31.采集当前信息。
在本实施例中,可通过用户的客户端获取当前信息。
作为举例而非限定,所述当前信息可包括当前时间数据、当前地址数据、当前天气数据、当前温度数据中的至少一种数据。
S32.将所述当前信息与所述第一特征标签进行匹配,获取匹配数据。
在本实施例中,通过将当前信息与第一特征标签进行匹配,以确定第一特征标签中是否有属于当前信息的数据,若有可针对性的突出相应第一特征标签,一般于在推荐信息中筛选出于该当前信息匹配的信息,提高推荐的实时性。例如:当前信息中的日期为用户的生日,即当前时间数据与用户的生日标签匹配(当天为用户的生日),提取生日标签,将生日标签作为优先级高的标签。
S33.根据所述匹配数据和所述第二特征标签确定标签权重。
在本实施例中,若存在匹配数据,根据预设规则调整第一特征标签中各个标签的权重,增大匹配的第一特征标签的权重,减小未匹配的第一特征标签的权重。预设规则可包括:当第一特征标签和第二特征标签中的特征标签涉及群体类的标签时,判断所述群体类标签的权重值是否权小于第三权重阈值,若是,将第三权重阈值作为群体类标签的权重值,若否,则保持群体类标签的权重值不变;当第一特征标签及第二特征标签中的特征标签涉及兴趣爱好类标签时,判断所述兴趣爱好类标签的权重值是否权小于第三权重阈值,若是,将第三权重阈值作为兴趣爱好类标签的权重值,若否,则保持兴趣爱好类标签的权重值。
作为举例而非限定,考虑到部分用户有着共同或相似的行为爱好(偏好),因此可将具有同一爱好的兴趣标签归属为群体类标签,判断群体类标签的权重值是否小于第三权重阈值,若是,则增大群体类标签的权重值,将第三权重阈值作为群体类标签的权重值。若用户的偏好类型广泛,且在群体用户数据中重复性较低,提取用户过去喜欢的推荐信息的类型即推荐标签,作为用户标签,并增大该用户标签的权重值;若用户提供个人信息/个性化设置(兴趣爱好,特长等标签),则可将这些标签作为最重要的评估数据,优先以用户提供的数据为准,增大该类标签的权重值。
进一步地,在步骤S33中当第二特征标签非空时,将第二特征标签与第一特征标签匹配,若不匹配,则根据用户特征标签的总数将第二特征标签的权重设置为第一权重阈值;若匹配,则增大第二特征标签的权重,将权重增大至第二权重阈值(第二权重阈值大于第一权重阈值)。
S34.基于所述标签权重生成所述用户-标签权重矩阵。
在本实施例中,根据各个第一特征标签的权重值、第二特征标签的权重值以及预设标签构建用户-标签权重矩阵。
其中,预设标签为预先提供的所有标签,其中包括第一特征标签和第二特征标签。
以预设10个标签(b0、b1、……、b9)为例:用户A共涉及了3个标签分别为:b2、b5和b8,其中,第一特征标签包括b2和b5,第二特征标签为b8,b2的权重值为0.5,b5的权重值为0.3,b8的权重值为0.2,用户A 的标签权重矩阵为:
S4.从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵。
其中,所述推荐库包括携带预设标签的推荐信息和未携带预设标签的推荐信息。
在本实施例中,推荐信息存储于推荐库中。每条推荐信息至少关联一个推荐标签。推荐信息可预先设置有标签,也可未设置标签。
进一步地,参阅图4所示,步骤S4可包括以下步骤:
S41.分别对所述推荐库中各个推荐信息的标题进行分词,根据分词生成与推荐信息对应的推荐标签。
在本实施例中,对推荐信息的标题进行分词,提取关键词,将关键词与预设标签进行匹配,将匹配的标签作为推荐标签。
S42.基于所述推荐信息的推荐标签占比以及所述推荐信息的所述预设标签占比,确定所述推荐标签的权重以及所述预设标签的权重。
进一步地,当该推荐信息携带预设标签时,获取推荐信息的内容中推荐标签的个数,以及该预设标签在内容中的个数,将预设标签与推荐标签匹配,若匹配,则提取匹配的推荐标签,统计该条推荐信息的各个推荐标签的占比,根据占比比例设置标签权重(如:标签的权重即为标签的占比值);若不匹配,则统计该条推荐信息的各个推荐标签及预设标签的占比,根据占比比例设置标签权重(如:提供占比值与标签权重关联表,每一标签权重值对应一占比区间,根据标签的占比比例选择相应的权重值)。当推荐信息未携带预设标签时(即:预设标签的占比为零),获取推荐信息的内容中推荐标签的个数,统计该条推荐信息的各个推荐标签的占比,根据占比比例设置相应的标签权重。
S43.当推荐信息携带预设标签时,依据推荐信息的推荐标签的权重和预设标签的权重生成推荐-标签权重矩阵;当推荐信息未携带预设标签时,依据推荐标签的权重生成推荐-标签权重矩阵。
在另一实施例中,步骤S43还可以为:
依据用户标签,从推荐库中提取与用户标签对应的推荐标签(包括预设标签)所关联的推荐信息,形成候选集合,根据该候选集合中各条推荐信息关联的推荐标签构建推荐-标签权重矩阵。
S5.根据所述用户-标签权重矩阵和所述推荐-标签权重矩阵构建用户- 推荐关联矩阵。
进一步地,步骤S5依据用户标签及推荐标签将所述用户-标签权重矩阵中的用户标签与所述推荐-标签权重矩阵中的推荐信息关联,组合生成所述用户-推荐关联矩阵。
以用户A的标签权重矩阵为:
推荐信息C的推荐-标签权重矩阵为:
其中,推荐信息有4条分别为:C1、C2、C3、C4和C5,
C1的权重矩阵为:
将用户A的标签权重矩阵与推荐信息C的推荐-标签权重矩阵组合得到的用户-推荐关联矩阵为:
S6.计算所述用户-推荐关联矩阵中用户标签与推荐标签权重的相似度,根据所述相似度生成推荐列表。
其中,所述推荐列表可采用整合推荐模式、多行并行推荐模式或流水线推荐模式。
在实际应用中,整合推荐模式可适用于网站推荐专栏推送,多行并行推荐模式主要适用于需要填写信息或回答问卷的邮件推送,流水线推荐模式可适用于公众号推送。
在本实施例中,计算各条推进信息的推荐标签与用户标签的相似度,依据相似度的大小顺序生成由推荐信息构成的推荐列表。
进一步地,参阅图5所示,步骤S6可包括:
S61.计算所述用户-推荐关联矩阵中各个推荐信息对应的推荐标签的价值评定量。
在本实施例中,以及推荐权重值计算各条推进信息的推荐标签与用户标签的价值评定量。
S62.将所述价值评定量作为推荐标签权重的相似度。
S63.依据所述相似度从大到小的顺序,对与所述推荐标签权重对应的推荐信息进行排序,生成所述推荐列表。
作为举例而非限定,以信息推荐方法应用于租赁门户网站对企业内部员工的‘箴言’推送为例,在门户网站的工作区内系统会为每个员工智能推送不同的箴言,箴言存储于推荐库,且每条箴言预设推荐标签。考虑到为每个员工推送的箴言都是相对独立的,采集员工的员工编号后,根据员工编号获取用户的基础信息,将基础信息中的特征数据转换为第一特征标签,根据第一特征标签构建用户-标签权重矩阵,根据用户-标签权重矩阵及推荐库的推荐-标签权重矩阵构建用户-推荐关联矩阵,计算各个员工的员工标签与推荐标签的相似度,将相似度最大的推荐标签对应的箴言推送给相应的员工。
信息推荐方法可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
在本实施例中,信息推荐方法能够根据用户的标识数据获取第一特征标签,根据第一特征标签和用户输入的第二特征标签构建与用户兴趣爱好及基础信息关联的用户-标签权重矩阵;考虑到一个推荐信息可能对应多个推荐标签,为了提升推荐的精准性,从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵;根据用户-标签权重矩阵和推荐- 标签权重矩阵构建用户标签与推荐标签关联的用户-推荐关联矩阵,通过计算用户-推荐关联矩阵中用户标签与推荐标签权重的相似度生成满足用户的兴趣爱好及基础信息的推荐列表,从而实现精准推荐的目的。信息推荐方法能够为推送信息提供多场景,多维度的技术支持,真正为门户网站实现各个场景下千人千面,可应用于租赁门户网站的广告栏、员工工作区、最新资讯栏等等场景中。
实施例二
请参阅图6,本实施例的一种信息推荐装置1,包括:获取单元11、接收单元12、第一构建单元13、第二构建单元14、第三构建单元15和生成单元16。
获取单元11,用于采集用户的标识数据,根据所述标识数据获取所述用户的第一特征标签。
需要说明的是:所述第一特征标签可包括部门标签、岗位标签、兴趣标签、生日标签、星座标签、地址标签、性别标签、年龄标签中的至少一种标签。
在本实施例中,信息推荐装置1主要用于对企业内部的员工进行信息推荐,用户主要是针对企业的员工。标识数据是指用于标识用户信息的数据,如:员工编号、身份证号等。信息推荐装置1可应用于服务器中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
进一步,获取单元11用于采集用户的标识数据,根据所述标识数据从人力系统获取所述用户的基础信息,提取所述基础信息中的特征数据,将所述特征数据转换为第一特征标签。
本实施例中,基础信息可包括用户的简历信息、部门信息、职位信息等。人力系统存储用户的基础信息。根据标识数据查询企业的人力系统,以获取与标识数据关联的用户的基础信息。获取单元11可根据基础信息中的标签提取相应的特征数据,例如,根据简历信息中各个项目的标签提取相应的特征数据,以获取用户的年龄、生日、星座、住所地址、性别、专业、兴趣;还可直接从基础信息中获取用户的部门信息、职位信息等信息,将提取的特征数据与预设标签进行匹配,以确定与其匹配的第一特征标签,从而得到统一格式的第一特征标签。
接收单元12,用于接收所述用户输入的第二特征标签。
需要说明的是,第二特征标签可以有多个,第二特征标签为用户输入的兴趣爱好标签,也可以为空,若用户没有爱好可不输入数据,将第二特征标签设置为空。
第一构建单元13,用于根据所述第一特征标签和所述第二特征标签构建用户-标签权重矩阵。
进一步地,参阅图7所示,第一构建单元13可包括:采集模块131、匹配模块132、确定模块133和生成模块134。
采集模块131,用于采集当前信息。
在本实施例中,可通过用户的客户端获取当前信息。
作为举例而非限定,所述当前信息可包括当前时间数据、当前地址数据、当前天气数据、当前温度数据中的至少一种数据。
匹配模块132,用于将所述当前信息与所述第一特征标签进行匹配,获取匹配数据。
在本实施例中,通过将当前信息与第一特征标签进行匹配,以确定第一特征标签中是否有属于当前信息的数据,若有可针对性的突出相应第一特征标签,一般于在推荐信息中筛选出于该当前信息匹配的信息,提高推荐的实时性。例如:当前信息中的日期为用户的生日,即当前时间数据与用户的生日标签匹配(当天为用户的生日),提取生日标签,将生日标签作为优先级高的标签。
确定模块133,用于根据所述匹配数据和所述第二特征标签确定标签权重。
在本实施例中,若存在匹配数据,根据预设规则调整第一特征标签中各个标签的权重,增大匹配的第一特征标签的权重,减小未匹配的第一特征标签的权重。预设规则可包括:当第一特征标签和第二特征标签中的特征标签涉及群体类的标签时,判断所述群体类标签的权重值是否权小于第三权重阈值,若是,将第三权重阈值作为群体类标签的权重值,若否,则保持群体类标签的权重值不变;当第一特征标签及第二特征标签中的特征标签涉及兴趣爱好类标签时,判断所述兴趣爱好类标签的权重值是否权小于第三权重阈值,若是,将第三权重阈值作为兴趣爱好类标签的权重值,若否,则保持兴趣爱好类标签的权重值。
作为举例而非限定,考虑到部分用户有着共同或相似的行为爱好(偏好),因此可将具有同一爱好的兴趣标签归属为群体类标签,判断群体类标签的权重值是否小于第三权重阈值,若是,则增大群体类标签的权重值,将第三权重阈值作为群体类标签的权重值。若用户的偏好类型广泛,且在群体用户数据中重复性较低,提取用户过去喜欢的推荐信息的类型即推荐标签,作为用户标签,并增大该用户标签的权重值;若用户提供个人信息/个性化设置(兴趣爱好,特长等标签),则可将这些标签作为最重要的评估数据,优先以用户提供的数据为准,增大该类标签的权重值。
进一步地,当第二特征标签非空时,确定模块133可将第二特征标签与第一特征标签匹配,若不匹配,则根据用户特征标签的总数将第二特征标签的权重设置为第一权重阈值;若匹配,则增大第二特征标签的权重,将权重增大至第二权重阈值(第二权重阈值大于第一权重阈值)。
生成模块134,用于基于所述标签权重生成所述用户-标签权重矩阵。
在本实施例中,根据各个第一特征标签的权重值、第二特征标签的权重值以及预设标签构建用户-标签权重矩阵。
其中,预设标签为预先提供的所有标签,其中包括第一特征标签和第二特征标签。
第二构建单元14,用于从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵。
其中,所述推荐库包括携带预设标签的推荐信息和未携带预设标签的推荐信息。
在本实施例中,推荐信息存储于推荐库中。每条推荐信息至少关联一个推荐标签。推荐信息可预先设置有标签,也可未设置标签。
进一步地,参阅图8所示,第二构建单元14可包括:分词模块141、分析模块142和处理模块143。
分词模块141,用于分别对所述推荐库中各个推荐信息的标题进行分词,根据分词生成与推荐信息对应的推荐标签。
在本实施例中,对推荐信息的标题进行分词,提取关键词,将关键词与预设标签进行匹配,将匹配的标签作为推荐标签。
分析模块142,用于基于所述推荐信息的推荐标签占比以及所述推荐信息的所述预设标签占比,确定所述推荐标签的权重以及所述预设标签的权重。
进一步地,当该推荐信息携带预设标签时,获取推荐信息的内容中推荐标签的个数,以及该预设标签在内容中的个数,将预设标签与推荐标签匹配,若匹配,则提取匹配的推荐标签,统计该条推荐信息的各个推荐标签的占比,根据占比比例设置标签权重(如:标签的权重即为标签的占比值);若不匹配,则统计该条推荐信息的各个推荐标签及预设标签的占比,根据占比比例设置标签权重(如:提供占比值与标签权重关联表,每一标签权重值对应一占比区间,根据标签的占比比例选择相应的权重值)。当推荐信息未携带预设标签时(即:预设标签的占比为零),获取推荐信息的内容中推荐标签的个数,统计该条推荐信息的各个推荐标签的占比,根据占比比例设置相应的标签权重。
处理模块143,用于当推荐信息携带预设标签时,依据推荐信息的推荐标签的权重和预设标签的权重生成推荐-标签权重矩阵;当推荐信息未携带预设标签时,依据推荐标签的权重生成推荐-标签权重矩阵。
在另一实施例中,处理模块143还可以依据用户标签,从推荐库中提取与用户标签对应的推荐标签(包括预设标签)所关联的推荐信息,形成候选集合,根据该候选集合中各条推荐信息关联的推荐标签构建推荐-标签权重矩阵。
第三构建单元15,用于根据所述用户-标签权重矩阵和所述推荐-标签权重矩阵构建用户-推荐关联矩阵。
进一步地,第三构建单元15可依据用户标签及推荐标签将所述用户-标签权重矩阵中的用户标签与所述推荐-标签权重矩阵中的推荐信息关联,组合生成所述用户-推荐关联矩阵。
生成单元16,用于计算所述用户-推荐关联矩阵中用户标签与推荐标签权重的相似度,根据所述相似度生成推荐列表。
其中,所述推荐列表可采用整合推荐模式、多行并行推荐模式或流水线推荐模式。
在实际应用中,整合推荐模式可适用于网站推荐专栏推送,多行并行推荐模式主要适用于需要填写信息或回答问卷的邮件推送,流水线推荐模式可适用于公众号推送。
在本实施例中,计算各条推进信息的推荐标签与用户标签的相似度,依据相似度的大小顺序生成由推荐信息构成的推荐列表。
进一步地,生成单元16用于计算所述用户-推荐关联矩阵中各个推荐信息对应的推荐标签的价值评定量;将所述价值评定量作为推荐标签权重的相似度;依据所述相似度从大到小的顺序,对与所述推荐标签权重对应的推荐信息进行排序,生成所述推荐列表。
作为举例而非限定,以信息推荐装置1应用于租赁门户网站对企业内部员工的‘箴言’推送为例,在门户网站的工作区内系统会为每个员工智能推送不同的箴言,箴言存储于推荐库,且每条箴言预设推荐标签。考虑到为每个员工推送的箴言都是相对独立的,采集员工的员工编号后,根据员工编号获取用户的基础信息,将基础信息中的特征数据转换为第一特征标签,根据第一特征标签构建用户-标签权重矩阵,根据用户-标签权重矩阵及推荐库的推荐-标签权重矩阵构建用户-推荐关联矩阵,计算各个员工的员工标签与推荐标签的相似度,将相似度最大的推荐标签对应的箴言推送给相应的员工。
信息推荐装置1可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络 PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
在本实施例中,信息推荐装置1的获取单元11能够根据用户的标识数据获取第一特征标签,通过第一构建单元13根据第一特征标签和用户输入的第二特征标签构建与用户兴趣爱好及基础信息关联的用户-标签权重矩阵;考虑到一个推荐信息可能对应多个推荐标签,为了提升推荐的精准性,采用第二构建单元14从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵;利用第三构建单元15根据用户-标签权重矩阵和推荐-标签权重矩阵构建用户标签与推荐标签关联的用户-推荐关联矩阵,通过生成单元16计算用户-推荐关联矩阵中用户标签与推荐标签权重的相似度生成满足用户的兴趣爱好及基础信息的推荐列表,从而实现精准推荐的目的。信息推荐装置1能够为推送信息提供多场景,多维度的技术支持,真正为门户网站实现各个场景下千人千面,可应用于租赁门户网站的广告栏、员工工作区、最新资讯栏等等场景中。
实施例三
为实现上述目的,本发明还提供一种计算机设备2,该计算机设备2包括多个计算机设备2,实施例二的信息推荐装置1的组成部分可分散于不同的计算机设备2中,计算机设备2可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备2至少包括但不限于:可通过系统总线相互通信连接的存储器21、处理器23、网络接口22以及信息推荐装置1(参考图9)。需要指出的是,图9仅示出了具有组件-的计算机设备2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,所述存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或 DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如实施例一的信息推荐方法的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器23在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器23通常用于控制计算机设备2的总体操作例如执行与所述计算机设备2 进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器23 用于运行所述存储器21中存储的程序代码或者处理数据,例如运行所述的信息推荐装置1等。
所述网络接口22可包括无线网络接口或有线网络接口,该网络接口22 通常用于在所述计算机设备2与其他计算机设备2之间建立通信连接。例如,所述网络接口22用于通过网络将所述计算机设备2与外部终端相连,在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图9仅示出了具有部件21-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的所述信息推荐装置1还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21 中,并由一个或多个处理器(本实施例为处理器23)所执行,以完成本发明。
实施例四
为实现上述目的,本发明还提供一种计算机可读存储介质,其包括多个存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器23执行时实现相应功能。本实施例的计算机可读存储介质用于存储信息推荐装置1,被处理器23执行时实现实施例一的信息推荐方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种信息推荐方法,其特征在于,包括:
采集用户的标识数据,根据所述标识数据获取所述用户的第一特征标签;
获取所述用户输入的第二特征标签;
根据所述第一特征标签和所述第二特征标签构建用户-标签权重矩阵;
从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵;
根据所述用户-标签权重矩阵和所述推荐-标签权重矩阵构建用户-推荐关联矩阵;
计算所述用户-推荐关联矩阵中用户标签与推荐标签权重的相似度,根据所述相似度生成推荐列表。
2.根据权利要求1所述的信息推荐方法,其特征在于,所述采集用户的标识数据,根据所述标识数据获取所述用户的第一特征标签,包括:
采集用户的标识数据,根据所述标识数据从人力系统获取所述用户的基础信息;
提取所述基础信息中的特征数据,将所述特征数据转换为第一特征标签;
所述第一特征标签包括部门标签、岗位标签、兴趣标签、生日标签、星座标签、地址标签、性别标签、年龄标签中的至少一种标签。
3.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所述第一特征标签和所述第二特征标签构建用户-标签权重矩阵,包括:
采集当前信息,所述当前信息包括当前时间数据、当前地址数据、当前天气数据、当前温度数据中的至少一种数据;
将所述当前信息与所述第一特征标签进行匹配,获取匹配数据;
根据所述匹配数据和所述第二特征标签确定标签权重;
基于所述标签权重生成所述用户-标签权重矩阵。
4.根据权利要求1所述的信息推荐方法,其特征在于,所述推荐库包括携带预设标签的推荐信息和未携带预设标签的推荐信息;
所述从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵,包括:
分别对所述推荐库中各个推荐信息的标题进行分词,根据分词生成与推荐信息对应的推荐标签;
基于所述推荐信息的推荐标签占比以及所述推荐信息的所述预设标签占比,确定所述推荐标签的权重以及所述预设标签的权重;
根据各个所述推荐信息的推荐标签的权重和预设标签的权重生成推荐-标签权重矩阵。
5.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所述用户-标签权重矩阵和所述推荐-标签权重矩阵构建用户-推荐关联矩阵,包括:
依据用户标签及推荐标签将所述用户-标签权重矩阵中的用户标签与所述推荐-标签权重矩阵中的推荐信息关联,组合生成所述用户-推荐关联矩阵。
6.根据权利要求1所述的信息推荐方法,其特征在于,所述计算所述用户-推荐关联矩阵中用户标签与推荐标签权重的相似度,根据所述相似度生成推荐列表,包括:
计算所述用户-推荐关联矩阵中各个推荐信息对应的推荐标签的价值评定量;
将所述价值评定量作为推荐标签权重的相似度;
依据所述相似度从大到小的顺序,对与所述推荐标签权重对应的推荐信息进行排序,生成所述推荐列表。
7.根据权利要求1或6所述的信息推荐方法,其特征在于,所述推荐列表采用整合推荐模式、多行并行推荐模式或流水线推荐模式。
8.一种信息推荐装置,其特征在于,包括:
获取单元,用于采集用户的标识数据,根据所述标识数据获取所述用户的第一特征标签;
接收单元,用于接收所述用户输入的第二特征标签;
第一构建单元,用于根据所述第一特征标签和所述第二特征标签构建用户-标签权重矩阵;
第二构建单元,用于从推荐库中获取各个推荐信息的推荐标签及相应的标签权重,生成推荐-标签权重矩阵;
第三构建单元,用于根据所述用户-标签权重矩阵和所述推荐-标签权重矩阵构建用户-推荐关联矩阵;
生成单元,用于计算所述用户-推荐关联矩阵中用户标签与推荐标签权重的相似度,根据所述相似度生成推荐列表。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111003971.8A CN114154052A (zh) | 2021-08-30 | 2021-08-30 | 信息推荐方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111003971.8A CN114154052A (zh) | 2021-08-30 | 2021-08-30 | 信息推荐方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114154052A true CN114154052A (zh) | 2022-03-08 |
Family
ID=80462427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111003971.8A Pending CN114154052A (zh) | 2021-08-30 | 2021-08-30 | 信息推荐方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114154052A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117194772A (zh) * | 2023-08-17 | 2023-12-08 | 广州兴趣岛信息科技有限公司 | 一种基于用户标签的内容推送方法及装置 |
-
2021
- 2021-08-30 CN CN202111003971.8A patent/CN114154052A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117194772A (zh) * | 2023-08-17 | 2023-12-08 | 广州兴趣岛信息科技有限公司 | 一种基于用户标签的内容推送方法及装置 |
CN117194772B (zh) * | 2023-08-17 | 2024-04-30 | 广州兴趣岛信息科技有限公司 | 一种基于用户标签的内容推送方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107862553B (zh) | 广告实时推荐方法、装置、终端设备及存储介质 | |
US9646096B2 (en) | System and methods for analyzing and improving online engagement | |
CN102053983B (zh) | 一种垂直搜索的查询方法、系统和装置 | |
US8224823B1 (en) | Browsing history restoration | |
US20140278939A1 (en) | Advertisement extraction device and advertisement extraction method | |
US9659103B2 (en) | Auto-aligning website elements by grouping elements based on a plurality of contextual indicators | |
US11455660B2 (en) | Extraction device, extraction method, and non-transitory computer readable storage medium | |
US20090076899A1 (en) | Method for analyzing, searching for, and trading targeted advertisement spaces | |
US20110029464A1 (en) | Supplementing a trained model using incremental data in making item recommendations | |
AU2016346497A1 (en) | Method and system for performing a probabilistic topic analysis of search queries for a customer support system | |
CN104850546B (zh) | 移动媒介信息的展示方法和系统 | |
JPWO2012118087A1 (ja) | レコメンダシステム、レコメンド方法、及びプログラム | |
US20150347578A1 (en) | System and methods for auto-generating video from website elements | |
CN110827112B (zh) | 深度学习的商品推荐方法、装置、计算机设备及存储介质 | |
US20140324578A1 (en) | Systems and methods for instant e-coupon distribution | |
CN113220734A (zh) | 课程推荐方法、装置、计算机设备及存储介质 | |
CN116821475B (zh) | 基于客户数据的视频推荐方法、装置及计算机设备 | |
CN112818111A (zh) | 文档推荐方法、装置、电子设备和介质 | |
CN113706249B (zh) | 数据推荐方法、装置、电子设备及存储介质 | |
CN114154052A (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN108959289B (zh) | 网站类别获取方法和装置 | |
US11062371B1 (en) | Determine product relevance | |
US20180165741A1 (en) | Information providing device, information providing method, information providing program, and computer-readable storage medium storing the program | |
CN113239177B (zh) | 知识点查询方法、装置、服务器、介质及产品 | |
CN113448983B (zh) | 知识点处理方法、装置、服务器、介质及产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |