CN113641901A - 资讯推荐方法、装置、计算机可读介质及电子设备 - Google Patents
资讯推荐方法、装置、计算机可读介质及电子设备 Download PDFInfo
- Publication number
- CN113641901A CN113641901A CN202110905568.8A CN202110905568A CN113641901A CN 113641901 A CN113641901 A CN 113641901A CN 202110905568 A CN202110905568 A CN 202110905568A CN 113641901 A CN113641901 A CN 113641901A
- Authority
- CN
- China
- Prior art keywords
- user
- information
- word vector
- evaluation
- target object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 239000013598 vector Substances 0.000 claims abstract description 541
- 238000011156 evaluation Methods 0.000 claims abstract description 296
- 238000012935 Averaging Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 12
- 238000013473 artificial intelligence Methods 0.000 abstract description 9
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000003058 natural language processing Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请属于计算机技术领域,具体涉及一种资讯推荐方法、装置、介质及电子设备。该方法包括:根据用户画像数据在各个评估维度中的分数与目标对象在各个评估维度中的分数,对用户画像数据与目标对象进行匹配,得到用户画像数据与目标对象在各个评估维度中的匹配结果;根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量;根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯。本申请实施例能够通过用户特征向量,准确地表示出与用户画像数据和与该用户画像数据匹配的目标对象均有较强关联的用户的特征,结合人工智能技术,能够实现资讯的精准推荐,可应用于车载场景。
Description
技术领域
本申请属于计算机技术领域,具体涉及一种资讯推荐方法、装置、计算机可读介质及电子设备。
背景技术
随着互联网的迅猛发展,网络资讯的数量不断增长。这给用户获取资讯带来了便利,同时也造成了信息过载的问题。如何在海量信息中快速有效地获取到需要的信息成为当前互联网发展中的突出问题,也是网络信息检索研究的热点。
相关技术中的资讯推荐对用户的分析不够精准,推送给用户的资讯内容无法和用户需求相贴合,其资讯推荐的灵活度较低,长此以往会导致用户阅读兴趣下降,用户量减少。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本申请的目的在于提供一种资讯推荐方法、装置、计算机可读介质及电子设备,至少在一定程度上克服相关技术中如何实现资讯对于用户的精准推荐技术问题。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供一种资讯推荐方法,所述资讯推荐方法包括:
获取用户的用户画像数据在一个或多个评估维度中对应的分数,并获取各个目标对象在一个或多个所述评估维度中对应的分数;
根据所述用户画像数据在各个评估维度中的分数与所述目标对象在所述各个评估维度中的分数,对所述用户画像数据与所述目标对象进行匹配,得到所述用户画像数据与所述目标对象在所述各个评估维度中的匹配结果;
根据所述匹配结果和预设的词向量表,计算与所述匹配结果对应的用户特征向量,所述词向量表用于表示词汇与词向量的对应关系;
根据所述用户特征向量以及与所述各个目标对象相关的资讯特征向量,向所述用户推送与所述用户特征向量匹配的资讯特征向量所对应的资讯。根据本申请实施例的一个方面,提供一种资讯推荐装置,所述资讯推荐装置包括:
评估分数获取模块,被配置为获取用户的用户画像数据在一个或多个评估维度中对应的分数,并获取各个目标对象在一个或多个所述评估维度中对应的分数;
评估分数匹配模块,被配置为根据所述用户画像数据在各个评估维度中的分数与所述目标对象在所述各个评估维度中的分数,对所述用户画像数据与所述目标对象进行匹配,得到所述用户画像数据与所述目标对象在所述各个评估维度中的匹配结果;
用户特征向量计算模块,被配置为根据所述匹配结果和预设的词向量表,计算与所述匹配结果对应的用户特征向量,所述词向量表用于表示词汇与词向量的对应关系;
资讯推送模块,被配置为根据所述用户特征向量以及与所述各个目标对象相关的资讯特征向量,向所述用户推送与所述用户特征向量匹配的资讯特征向量所对应的资讯。
在本申请的一些实施例中,基于以上技术方案,所述资讯推荐装置还包括:
用户画像词向量生成单元,被配置为根据所述词向量表和所述用户画像数据所包括的用户画像词汇,生成所述用户画像数据对应的用户画像词向量,所述用户画像词汇用于描述用户画像;
评估维度词向量生成单元,被配置为根据所述词向量表和各个所述评估维度对应的评估词汇,生成各个评估维度分别对应的评估维度词向量,所述评估词汇用于描述所述评估维度;
用户画像分数计算单元,被配置为计算所述用户画像词向量与所述评估维度词向量的相似度,并根据所述用户画像词向量与所述评估维度词向量的相似度确定所述用户画像数据在所述评估维度中对应的分数。
在本申请的一些实施例中,基于以上技术方案,所述用户画像词向量生成单元包括:
用户画像数据获取子单元,被配置为获取所述用户画像数据,所述用户画像数据包括多个所述用户画像词汇;
第一词向量确定子单元,被配置为根据所述词向量表和多个所述用户画像词汇,确定各个所述用户画像词汇对应的词向量;
用户画像词向量确定子单元,被配置为对各个所述用户画像词汇对应的词向量进行求平均处理得到所述用户画像词向量。
在本申请的一些实施例中,基于以上技术方案,所述匹配结果包括匹配结果词汇组,所述匹配结果词汇组包括用户在各个评估维度中匹配到的目标对象的对象名称;所述用户特征向量计算模块包括:
第一目标对象特征向量确定单元,被配置为根据所述词向量表和所述匹配结果词汇组中包含的各个对象名称,确定与各个所述对象名称分别对应的目标对象特征向量;
用户类别词向量确定单元,被配置为将所述用户画像数据中指定类别的用户画像词汇所对应的词向量作为用户类别词向量;
第一用户特征向量确定单元,被配置为对各个所述目标对象特征向量与各个所述用户类别词向量的进行求平均处理,得到所述用户特征向量。
在本申请的一些实施例中,基于以上技术方案,所述用户画像分数计算单元包括:
第一备选相似度计算子单元,被配置为计算所述用户画像词向量与各个所述评估维度词向量的相似度,得到多个第一备选相似度;
相似度计算子单元,被配置为将所述多个第一备选相似度中的最大值作为所述用户画像词向量与所述评估维度词向量的相似度。
在本申请的一些实施例中,基于以上技术方案,所述资讯推荐装置还包括:
历史用户画像分数获取单元,被配置为获取历史用户画像数据在所述评估维度中对应的分数,所述历史用户画像数据为历史用户的用户画像数据;
用户画像排名获取单元,被配置为根据所述用户画像数据在所述评估维度中对应的分数和所述历史用户画像数据在所述评估维度中对应的分数,获取所述用户画像数据在所述评估维度中对应的用户排名,并将所述用户排名作为所述用户画像数据在所述评估维度中对应的分数。
在本申请的一些实施例中,基于以上技术方案,所述评估分数获取模块包括:
目标对象排名获取单元,被配置为获取各个目标对象在一个或多个所述评估维度中对应的对象排名,并将所述对象排名作为所述目标对象在对应的所述评估维度中的分数。
在本申请的一些实施例中,基于以上技术方案,所述评估分数获取模块还包括:
目标对象词向量获取单元,被配置为根据各个目标对象的对象名称和所述词向量表,确定所述对象名称对应的目标对象词向量;
第二备选相似度获取单元,被配置为计算所述目标对象词向量与各个所述评估维度词向量的相似度,得到多个第二备选相似度;
相似度获取单元,被配置为将所述多个第二备选相似度中的最大值作为所述目标对象词向量与所述评估维度词向量的相似度;
目标对象分数计算单元,被配置为根据所述目标对象词向量与所述评估维度词向量的相似度,计算所述目标对象在对应的所述评估维度中的分数。
在本申请的一些实施例中,基于以上技术方案,所述匹配结果包括匹配结果词汇组,所述匹配结果词汇组包括用户在各个评估维度中匹配到的目标对象的对象名称;所述用户特征向量计算模块还包括:
第二目标对象特征向量确定单元,被配置为根据所述词向量表和所述匹配结果词汇组中包含的各个对象名称,确定与各个所述对象名称分别对应的目标对象特征向量;
第二用户特征向量确定单元,被配置为对各个所述目标对象特征向量进行求平均处理,得到所述用户特征向量。
在本申请的一些实施例中,基于以上技术方案,所述资讯推荐装置还包括:
资讯关键字获取单元,被配置为获取所述资讯的资讯标签,对所述资讯的内容进行关键字提取,得到资讯关键字;
词向量获取单元,被配置为根据所述资讯关键字、所述资讯标签与所述词向量表,确定与各个所述资讯关键字分别对应的资讯词向量,以及与各个所述资讯标签分别对应的标签词向量;
资讯特征向量获取单元,对各个所述资讯词向量与各个标签词向量进行求平均处理,得到所述资讯特征向量。
在本申请的一些实施例中,基于以上技术方案,所述资讯关键字获取单元包括:
资讯及备选关键字获取子单元,被配置为获取资讯的总条数,以及待处理资讯的内容中包括的多个备选关键字;
备选关键字资讯条数获取子单元,被配置为计算包括所述备选关键字的资讯条数;
逆向文件频率计算子单元,被配置为根据所述资讯的总条数和包括所述备选关键字的资讯条数,计算所述多个备选关键字分别对应的逆向文件频率:
资讯关键字确定子单元,被配置为在所述多个备选关键字中,将逆向文件频率大于预设频率的备选关键字确定为所述待处理资讯的资讯关键字;
在本申请的一些实施例中,基于以上技术方案,所述资讯推荐装置还包括:
相似度计算单元,被配置为计算所述用户特征向量与各个资讯特征向量的相似度;
资讯特征向量匹配单元,被配置为按照相似度由高到低的顺序,选择预设数量个资讯特征向量,并确定为与所述用户特征向量匹配的资讯特征向量。
在本申请的一些实施例中,基于以上技术方案,所述用户特征向量计算模块还包括:
资讯文本提取单元,被配置为提取各条待推荐资讯中的资讯文本;
文本分词单元,被配置为对所述资讯文本进行分词处理,得到按照所述资讯文本中的分词出现顺序排列的多个分词;
去除无意义词单元,被配置为去除多个所述分词中的无意义词,所述无意义词包括停用词、介词和语气词中的一种或多种;
词向量表构建单元,被配置为将按照所述资讯文本中的分词出现顺序排列的多个所述分词,输入到预训练的词向量模型中,得到多个所述分词分别对应的词向量,并根据多个所述分词分别对应的词向量构建所述词向量表。
根据本申请实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的资讯推荐方法。
根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器被配置为经由执行可执行指令来执行如以上技术方案中的资讯推荐方法。
根据本申请实施例的一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上技术方案中的资讯推荐方法。
在本申请实施例提供的技术方案中,通过在各个评估维度中,根据用户画像数据在各个评估维度中的分数与目标对象在各个评估维度中的分数,对用户画像数据与目标对象进行匹配,得到用户画像数据与目标对象在各个评估维度中的匹配结果,并根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量,由此,通过用户特征向量,准确地表示出与用户画像数据和与该用户画像数据匹配的目标对象均有较强关联的用户的特征,实现对用户特征的精准提取。再根据用户特征向量以及与各个目标对象相关的资讯特征向量,将与用户特征向量匹配的资讯特征向量对应的资讯,推送给用户,从而实现了资讯对于用户的精准推荐。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性地示出了应用本申请技术方案的示例性系统架构框图。
图2示意性地示出了本申请某些实施方式的资讯推荐方法的步骤流程图。
图3示意性地示出了本申请某实施例获取用户的用户画像数据在一个或多个评估维度中对应的分数之前的部分步骤流程图。
图4示意性地示出了本申请某实施例根据词向量表和用户画像数据所包括的用户画像词汇,生成用户画像数据对应的用户画像词向量的步骤流程图。
图5示意性地示出了本申请某实施例计算用户画像词向量与评估维度词向量的相似度的步骤流程图。
图6示意性地示出了本申请某实施例根据用户画像词向量与评估维度词向量的相似度确定用户画像数据在评估维度中对应的分数之后的部分步骤流程图。
图7示意性地示出了本申请某实施例获取各个目标对象在一个或多个评估维度中对应的分数的步骤流程图。
图8示意性地示出了本申请某实施例根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量之前的部分步骤流程图。
图9示意性地示出了本申请某实施例根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量的步骤流程图。
图10示意性地示出了本申请某实施例根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量的步骤流程图。
图11示意性地示出了本申请某实施例根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯之前的部分步骤流程图。
图12示意性地示出了本申请某实施例对资讯的内容进行关键字提取,得到资讯关键字的步骤流程图。
图13示意性地示出了本申请某实施例根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯之前的部分步骤流程图。
图14示意性地示出了本申请某实施例从触发资讯推荐服务到执行资讯推荐方法,并将资讯推送给用户的具体过程流程图。
图15示意性地示出了本申请实施例提供的资讯推荐装置的结构框图。
图16示意性地示出了用于实现本申请实施例的电子设备的计算机系统结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
图1示意性地示出了应用本申请技术方案的示例性系统架构框图。
如图1所示,系统架构100可以包括终端设备110、网络120和服务器130。终端设备110可以包括智能手机、平板电脑、笔记本电脑、台式电脑等各种电子设备。服务器130可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。网络120可以是能够在终端设备110和服务器130之间提供通信链路的各种连接类型的通信介质,例如可以是有线通信链路或者无线通信链路。
根据实现需要,本申请实施例中的系统架构可以具有任意数目的终端设备、网络和服务器。例如,服务器130可以是由多个服务器设备组成的服务器群组。另外,本申请实施例提供的技术方案可以应用于终端设备110,也可以应用于服务器130,或者可以由终端设备110和服务器130共同实施,本申请对此不做特殊限定。
举例而言,服务器130上可以搭载了本申请实施方式的资讯推荐方法,用户通过终端设备110上的客户端与服务器130连接时,服务器130可以实施本申请实施方式的资讯推荐方法,以实现资讯的精准推荐,具体地,通过在各个评估维度中,根据用户画像数据在各个评估维度中的分数与目标对象在各个评估维度中的分数,对用户画像数据与目标对象进行匹配,得到用户画像数据与目标对象在各个评估维度中的匹配结果,并根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量,由此,通过用户特征向量,准确地表示出与用户画像数据和与该用户画像数据匹配的目标对象均有较强关联的用户的特征,实现对用户特征的精准提取。再根据用户特征向量以及与各个目标对象相关的资讯特征向量,将与用户特征向量匹配的资讯特征向量对应的资讯,推送给用户,从而实现了资讯对于用户的精准推荐。
服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
下面结合具体实施方式对本申请提供的资讯推荐方法做出详细说明。
图2示意性地示出了本申请某些实施方式的资讯推荐方法的步骤流程图。该资讯推荐方法的执行主体可以是终端设备,也可以是服务器等,本申请对此不设限。如图2所示,该资讯推荐方法主要可以包括如下步骤S210~步骤S240。
S210.获取用户的用户画像数据在一个或多个评估维度中对应的分数,并获取各个目标对象在一个或多个评估维度中对应的分数。
具体地,用户使用的终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端等。例如,当用户使用的终端为车载终端时,本申请应用于车载资讯推荐的场景。用户画像数据用于表示与用户相关的信息、标签和数据。
对于目标对象,可以有多个评估维度,从而从不同的维度对目标对象的性能、特质等进行评估。例如,当目标对象是汽车中的各个品牌的不同车系A、B、C、D、E等时,评估维度可以是购车的各种评估维度。例如,购车的评估维度可以包括豪华、性价比、新能源、空间、越野、外观与智能维度等购车评估维度。购车维度评估维度可以用于描述汽车资讯和用户购车兴趣。与此对应的,后文所述的资讯可以为汽车行业的资讯新闻,词向量表为汽车领域的词向量表。
在一些实施方式中,目标对象也可以是手机中的各个品牌的不同款式的手机型号,评估维度则可以是购买手机的各种评估维度。例如,购买手机的评估维度可以包括豪华、性价比、外观、硬件规格、屏幕性能、拍摄性能等购机评估维度。购机评估维度可以用于描述手机资讯和用户购买手机的关注点。与此对应的,后文所述的资讯为手机资讯,词向量表为手机领域的词向量表。
在另一些实施方式中,目标对象也可以是穿戴设备、电子产品、日用工具、新闻资讯、视频内容等,资讯也随之更换为对应领域的资讯,词向量也随资讯更换为对应领域的词向量表,本申请对此不作限定。
在各个评估维度中,每个目标对象都可以生成对应的分数。例如,某款车型A在“豪华”的评估维度具有对应的分数s_A。在各个评估维度中,每个用户的用户画像数据也可以生成对应的分数。例如,用户a的用户画像数据在“豪华”的评估维度具有对应的分数s_a。
图3示意性地示出了本申请某实施例获取用户的用户画像数据在一个或多个评估维度中对应的分数之前的部分步骤流程图。如图3所示,在以上实施例的基础上,在步骤S210中的获取用户的用户画像数据在一个或多个评估维度中对应的分数之前,可以进一步包括以下步骤S310~步骤S330。
S310.根据词向量表和用户画像数据所包括的用户画像词汇,生成用户画像数据对应的用户画像词向量,用户画像词汇用于描述用户画像;
S320.根据词向量表和各个评估维度对应的评估词汇,生成各个评估维度分别对应的评估维度词向量,评估词汇用于描述评估维度;
S330.计算用户画像词向量与评估维度词向量的相似度,并根据用户画像词向量与评估维度词向量的相似度确定用户画像数据在评估维度中对应的分数。
具体地,词向量表可以是预设置的词向量表。词向量表用于表示词汇与词向量的对应关系。
根据词向量表和用户画像数据所包括的用户画像词汇,生成用户画像数据对应的用户画像词向量,用户画像词汇用于描述用户画像。具体地,用户画像数据可以包括多个用户画像词汇,各个用户画像词汇可以根据词向量表映射为各个用户画像词汇分别对应的词向量,再对各个用户画像词汇分别对应的词向量作求平均运算,可以得到用户画像数据对应的用户画像词向量。用户画像词汇用于描述用户画像,具体地,用户画像词汇可以包括:性别、年龄、地区、兴趣标签、活跃社区等类别。
各个评估维度可以对应包括有多个评估词汇,评估词汇用于描述评估维度。例如,“豪华”评估维度可以包括豪华、奢华、奢侈等评估词汇,评估词汇用于描述评估维度。同一评估维度的评估词汇的含义的相近。
根据词向量表和各个评估维度对应的评估词汇,可以得到各个评估词汇对应的词向量。对同一评估维度中的各个评估词汇对应的词向量作求平均处理,生成各个评估维度分别对应的评估维度词向量。
计算用户画像词向量与评估维度词向量的相似度,具体地,可以是计算用户画像词向量与评估维度词向量的余弦相似度。在一些实施方式中,也可以是计算用户画像词向量与评估维度词向量的其他类型的语义相似度等,本申请对此不作限制。
根据用户画像词向量与评估维度词向量的相似度确定用户画像数据在评估维度中对应的分数,具体地,当用户画像词向量与评估维度词向量的余弦距离越小,则用户画像词向量与评估维度词向量的余弦相似度越大,用户画像数据在评估维度中对应的分数越高。
图4示意性地示出了本申请某实施例根据词向量表和用户画像数据所包括的用户画像词汇,生成用户画像数据对应的用户画像词向量的步骤流程图。如图4所示,在以上实施例的基础上,在步骤S310中的根据词向量表和用户画像数据所包括的用户画像词汇,生成用户画像数据对应的用户画像词向量,可以进一步包括以下步骤S410~步骤S430。
S410.获取用户画像数据,用户画像数据包括多个用户画像词汇;
S420.根据词向量表和多个用户画像词汇,确定各个用户画像词汇对应的词向量;
S430.对各个用户画像词汇对应的词向量进行求平均处理得到用户画像词向量。
用户画像数据可以包括多个用户画像词汇。例如,用户画像数据可以包括:广东、女性、28岁等用户画像词汇。由此,确定各个用户画像词汇对应的词向量,对各个用户画像词汇对应的词向量进行求平均处理得到用户画像词向量。具体地,可以根据U=∑Ui/n对n个用户画像词汇对应的词向量U1~Un进行求平均处理得到用户画像词向量U。
图5示意性地示出了本申请某实施例计算用户画像词向量与评估维度词向量的相似度的步骤流程图。如图5所示,在以上实施例的基础上,在步骤S330中的计算用户画像词向量与评估维度词向量的相似度,可以进一步包括以下步骤S510~步骤S520。
S510.计算用户画像词向量与各个评估维度词向量的相似度,得到多个第一备选相似度;
S520.将多个第一备选相似度中的最大值作为用户画像词向量与评估维度词向量的相似度。
由此,计算用户画像词向量与各个评估维度词向量的相似度,得到多个第一备选相似度,并将多个第一备选相似度中的最大值作为用户画像词向量与评估维度词向量的相似度,可以准确地获取用户画像词向量与评估维度词向量的相似度,使得与评估维度词向量相似度较高的用户画像词向量对应的用户画像词汇,能够至少与一个评估词汇在语义上很贴近,从而能够明确地表示用户画像数据与评估维度的相似关系。
在另一些实施方式中,也可以在计算用户画像词向量与各个评估维度词向量的相似度,得到多个第一备选相似度后,对多个第一备选相似度进行求平均运算得到平均相似度,并将该平均相似度作为用户画像词向量与评估维度词向量的相似度。由此,可以准确地获取用户画像词向量与评估维度词向量的相似度,避免某个评估维度中的评估词汇出现语义偏离而造成相似度的计算偏离。
图6示意性地示出了本申请某实施例根据用户画像词向量与评估维度词向量的相似度确定用户画像数据在评估维度中对应的分数之后的部分步骤流程图。如图6所示,在以上实施例的基础上,在步骤S330中的根据用户画像词向量与评估维度词向量的相似度确定用户画像数据在评估维度中对应的分数之后,可以进一步包括以下步骤S610~步骤S620。
S610.获取历史用户画像数据在评估维度中对应的分数,历史用户画像数据为历史用户的用户画像数据;
S620.根据用户画像数据在评估维度中对应的分数和历史用户画像数据在评估维度中对应的分数,获取用户画像数据在评估维度中对应的用户排名,并将用户排名作为用户画像数据在评估维度中对应的分数;
并且,S210中的获取各个目标对象在一个或多个评估维度中对应的分数,可以进一步包括以下步骤S630:
S630.获取各个目标对象在一个或多个评估维度中对应的对象排名,并将对象排名作为目标对象在对应的评估维度中的分数。
具体地,可以根据用户画像数据在评估维度中对应的分数和历史用户画像数据在评估维度中对应的分数,获取用户画像数据在评估维度中对应的用户排名,用户排名可以采用前百分比的方式表示。例如用户a对应的用户画像数据在评估维度“豪华”中的用户排名为前5%,并将用户排名作为用户画像数据在评估维度中对应的分数。
取各个目标对象在一个或多个评估维度中对应的对象排名,并将对象排名作为目标对象在对应的评估维度中的分数。具体地,对象排名可以采用前百分比的方式表示。例如目标对象A在评估维度“豪华”中的对象排名为前5%,并将用户排名作为用户画像数据在评估维度中对应的分数。
由此,下文中的步骤S220的在各个评估维度中,根据所述用户画像数据在所述评估维度中的分数与所述目标对象在所述评估维度中的分数,对所述用户画像数据与所述目标对象进行匹配,得到所述用户画像数据在各个评估维度中与所述目标对象的匹配结果,则是:
在各个评估维度中,根据所述用户画像数据在所述评估维度中的排名与所述目标对象在所述评估维度中的排名,对所述用户画像数据与所述目标对象进行匹配,得到所述用户画像数据在各个评估维度中与所述目标对象的匹配结果。
例如,用户a对应的用户画像数据在评估维度“豪华”中的用户排名为前5%,目标对象A在评估维度“豪华”中的对象排名为前5%,则将用户a对应的用户画像数据与目标对象A进行匹配。用户a对应的用户画像数据在评估维度“豪华”中与所述目标对象的匹配结果为“A”。
图7示意性地示出了本申请某实施例获取各个目标对象在一个或多个评估维度中对应的分数的步骤流程图。如图7所示,在以上实施例的基础上,在步骤S210中的获取各个目标对象在一个或多个评估维度中对应的分数,可以进一步包括以下步骤S710~步骤S740。
S710.根据各个目标对象的对象名称和词向量表,确定对象名称对应的目标对象词向量;
S720.计算目标对象词向量与各个评估维度词向量的相似度,得到多个第二备选相似度;
S730.将多个第二备选相似度中的最大值,作为目标对象词向量与评估维度词向量的相似度;
S740.根据目标对象词向量与评估维度词向量的相似度,计算目标对象在对应的评估维度中的分数。
目标对象的对象名称也是一个词汇,可以根据词向量表获取目标对象的对象名称对应的词向量,作为目标对象词向量。
计算目标对象词向量与各个评估维度词向量的相似度,得到多个第二备选相似度,具体地,可以通过计算目标对象词向量与各个评估维度词向量的余弦距离得到目标对象词向量与各个评估维度词向量的余弦相似度,作为第二备选相似度。
将多个第二备选相似度中的最大值,作为目标对象词向量与评估维度词向量的相似度,可以准确地获取目标对象词向量与评估维度词向量的相似度,使得与评估维度词向量相似度较高的目标对象词向量对应的对象名称,能够至少与一个评估词汇在语义上很贴近,从而能够明确地表示目标对象与评估维度的相似关系。
由此,能够量化各个评估维度中各个目标对象之间的关系。例如,当评估维度为购车维度时,目标对象为各车品牌的车系,则可以具体量化出车系A和车系B在“豪华”维度的分数,从而体现出车系A和车系B在“豪华”维度下的具体差距,有利于后续根据用户画像数据实现相关车系的文章的精准推荐。
可以理解,不同文章对各个评估维度的描述词语不同,将多个第二备选相似度中的最大值,作为目标对象词向量与评估维度词向量的相似度能够更好地表示目标对象词向量与评估维度词向量的相似度。
相关技术中,需要非常多工作量标注各个车系在各个购车维度的评分,需要汽车领域专家来量化各个车品牌车系在各个购车维度的评分,有新车上市则需要手动更新该新车在各个购车维度的评分,而本申请无需对目标对象进行分数标注,而是如步骤S710~步骤S740所示,先计算目标对象词向量与评估维度词向量的相似度,再根据目标对象词向量与评估维度词向量的相似度,计算目标对象在对应的评估维度中的分数。由此,无需人工在各个评估维度中对目标对象的评分进行标注,即可通过由资讯训练得到的词向量,得到目标对象词向量与评估维度词向量,并得到目标对象词向量与评估维度词向量的相似度,从而计算目标对象在对应的评估维度中的分数,使得目标对象在对应的评估维度中的分数更为客观和合理,用于资讯推荐方法中能够使得资讯推荐更加精准合理。
在另一些实施方式中,也可以在计算目标对象词向量与各个评估维度词向量的相似度,得到多个第二备选相似度后,对多个第二备选相似度进行求平均运算得到平均相似度,并将该平均相似度作为目标对象词向量与评估维度词向量的相似度。由此,可以准确地获取目标对象词向量与评估维度词向量的相似度,避免某个评估维度中的评估词汇出现语义偏离而造成相似度的计算偏离。
S220.根据用户画像数据在各个评估维度中的分数与目标对象在各个评估维度中的分数,对用户画像数据与目标对象进行匹配,得到用户画像数据与目标对象在各个评估维度中的匹配结果。
具体地,根据用户画像数据在各个评估维度中的分数与目标对象在各个评估维度中的分数,对用户画像数据与目标对象进行匹配,可以是对在某个评估维度中与用户画像数据的分数最接近的一个目标对象,与该用户画像数据进行匹配,得到匹配结果。例如,用户画像数据在评估维度中的分数范围为0~100,目标对象在评估维度中的分数为0~100,当用户a的用户画像数据在评估维度“豪华”中的分数为83时,则将在评估维度“豪华”中的分数最接近83的目标对象A,与用户a的用户画像数据进行匹配,得到匹配结果“A”。也即,使得用户a的用户画像数据在评估维度“豪华”中与目标对象的匹配结果为“A”。
在一些实施例中,可以是对与用户画像数据在评估维度中的分数最接近的指定数量个目标对象,与该用户画像数据进行匹配,得到匹配结果。例如,用户画像数据在评估维度中的分数范围为0~100,目标对象在评估维度中的分数为0~100,当用户a的用户画像数据在评估维度“豪华”中的分数为83时,则将在评估维度“豪华”中的分数最接近83的三个目标对象A、B、C,与用户a的用户画像数据进行匹配,得到匹配结果“A、B、C”。也即,使得用户a的用户画像数据在评估维度“豪华”中与目标对象的匹配结果为“A、B、C”。
在一些实施例中,可以是对在用户画像数据在评估维度中的分数所在分数段的目标对象,与该用户画像数据进行匹配,得到匹配结果。例如,用户画像数据在评估维度中的分数范围为0~100,目标对象在评估维度中的分数为0~100,当用户a的用户画像数据在评估维度“豪华”中的分数为83时,由于分数83属于分数段81~85,对分数位于分数段81~85内的目标对象,与用户a的用户画像数据进行匹配,得到匹配结果“A、B、D”。
S230.根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量,词向量表用于表示词汇与词向量的对应关系;
图8示意性地示出了本申请某实施例根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量之前的部分步骤流程图。如图8所示,在以上实施例的基础上,在步骤S230的根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量之前,可以进一步包括以下步骤S810~步骤S840。
S810.提取各条待推荐资讯中的资讯文本;
S820.对资讯文本进行分词处理,得到按照资讯文本中的分词出现顺序排列的多个分词;
S830.去除多个分词中的无意义词,无意义词包括停用词、介词和语气词中的一种或多种;
S840.将按照资讯文本中的分词出现顺序排列的多个分词,输入到预训练的词向量模型中,得到多个分词分别对应的词向量,并根据多个分词分别对应的词向量构建词向量表。
具体地,预训练的词向量模型可以为预训练的Directional Skip-Gram(DSG)模型。DSG模型在生成词向量时,会考虑每个输入词汇的上下文,能够使得生成的词向量能更为准确地表达出词语的语义。
由此,得到了词向量表,方便后续根据词汇得到对应的词向量。并且,词向量表的来源是待推荐的资讯,先提取各条待推荐资讯中的资讯文本。再对资讯文本进行分词处理,得到按照资讯文本中的分词出现顺序排列的多个分词,去除多个分词中的无意义词将按照资讯文本中的分词出现顺序排列的多个分词,输入到预训练的词向量模型中,得到多个分词分别对应的词向量。无意义词包括停用词、介词和语气词中的一种或多种。具体地,当待推荐资讯为汽车相关资讯时,停用词为与汽车无关的词汇。从而,使得本申请实施方式的词向量表能够准确地表示出某个资讯领域的词汇对应的词向量,从而使得本申请实施方式的资讯推荐方法实现更为精准的推送。
在某些实施方式中,可以计算多个目标对象词向量与同一个评估维度词向量的相似度的方差,并根据该方差对预训练的词向量模型的参数进行调整,从而使得预训练的词向量模型针对多个目标对象输出的多个目标对象词向量,与同一个评估维度词向量的相似度的方差较大,从而能够使得词向量模型针对同一评估维度的不同目标对象,能够形成区分度明显的不同的词向量,能够使得不同的目标对象词向量能够准确体现出不同的目标对象之间的区别,从而能够提高形成的目标对象词向量的准确性。可以理解,本申请所述的资讯包括了各种目标对象相关的资讯,由此,在后续根据目标对象词向量生成用户特征向量,并根据用户特征向量推荐资讯时,能够提高资讯推荐的准确性。
本申请采用资讯中提取的资讯文本作为语料,通过预训练的词向量模型生成对应的词向量,能够在词向量空间中增大目标对象与购车维度之间的距离,从而使得本申请的资讯推荐方法具有更好的匹配推荐效果。
图9示意性地示出了本申请某实施例根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量的步骤流程图。如图9所示,在某些实施方式中,在以上实施例的基础上,匹配结果包括匹配结果词汇组,匹配结果词汇组包括用户在各个评估维度中匹配到的目标对象的对象名称,在步骤S230中的根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量,可以进一步包括以下步骤S910~步骤S930。
S910.根据词向量表和匹配结果词汇组中包含的各个对象名称,确定与各个对象名称分别对应的目标对象特征向量;
S920.将用户画像数据中指定类别的用户画像词汇所对应的词向量作为用户类别词向量;
S930.对各个目标对象特征向量与各个用户类别词向量的进行求平均处理,得到用户特征向量。
匹配结果包括匹配结果词汇组,匹配结果词汇组包括用户在各个评估维度中匹配的目标对象的对象名称。例如,购车的评估维度包括豪华、性价比、新能源三个维度。用户a的用户画像数据在评估维度“豪华”中与目标对象的匹配结果为“A、B、C”。用户a的用户画像数据在评估维度“性价比”中与目标对象的匹配结果为“B、E、F”。用户a的用户画像数据在评估维度“新能源”中与目标对象的匹配结果为“A、F、G”。则匹配结果词汇组包括“A、B、C、B、E、F、A、F、G”。其中,保留匹配结果词汇组中出现重复的目标对象的对象名称,不对目标对象及其对象名称进行去重处理。由此,能够使得在多个评估维度对应的匹配结果中均出现的目标对象,能够对用户特征向量造成较大的影响,从而使得用户特征向量与在多个评估维度对应的匹配结果中均出现的目标对象能够具有更好、更紧密的关联性。
将用户画像数据中指定类别的用户画像词汇所对应的词向量作为用户类别词向量,例如,指定类别可以为性别、年龄、地区。由此,通过指向基础、重要的类别的用户画像词汇,并将用户画像数据中指定类别的用户画像词汇所对应的词向量作为用户类别词向量,后续再对各个目标对象特征向量与各个用户类别词向量的进行求平均处理,得到用户特征向量,能够使得用户画像数据中较为基础、重要的类别的用户画像词汇能够对用户特征向量产生较大的影响,从而使得用户特征向量与用户画像数据中较为基础、重要的类别的用户画像词汇有更好的关联性。
图10示意性地示出了本申请某实施例根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量的步骤流程图。如图10所示,在另一些实施方式中,在以上实施例的基础上,匹配结果包括匹配结果词汇组,匹配结果词汇组包括用户在各个评估维度中匹配到的目标对象的对象名称,在步骤S230中的根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量,可以进一步包括以下步骤S1010~步骤S1020。
S1010.根据词向量表和匹配结果词汇组中包含的各个对象名称,确定与各个对象名称分别对应的目标对象特征向量;
S1020.对各个目标对象特征向量进行求平均处理,得到用户特征向量。
根据词向量表和匹配结果词汇组中包含的各个对象名称,确定与各个对象名称分别对应的目标对象特征向量,再对各个目标对象特征向量进行求平均处理,得到用户特征向量,从而能够得到一个用于描述用户特征的向量,并且该用户特征向量与用户画像数据匹配的目标对象具有较好的关联性,由此,采用该用户特征向量与资讯特征向量进行匹配,以将资讯推送给用户,能够使得资讯推送更加精准。
S240.根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯。
可以理解,资讯的数量级较大,可能为十万级、百万级或者千万级等。而根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯,能够在与各个目标对象相关的资讯数量较多的情况下,仍能实现资讯对于用户的精准推送。
图11示意性地示出了本申请某实施例根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯之前的部分步骤流程图。如图11所示,在以上实施例的基础上,在步骤S240的根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯之前,可以进一步包括以下步骤S1110~步骤S1130。
S1110.获取资讯的资讯标签,对资讯的内容进行关键字提取,得到资讯关键字;
S1120.根据资讯关键字、资讯标签与词向量表,确定与各个资讯关键字分别对应的资讯词向量,以及与各个资讯标签分别对应的标签词向量;
S1130.对各个资讯词向量与各个标签词向量进行求平均处理,得到资讯特征向量。
对资讯的内容进行关键字提取,得到资讯关键字,具体地,可以分别对资讯的标题和资讯的内容进行关键字提取,再将得到的关键字合并为资讯关键字。在合并的过程中,可以不对关键字进行去重处理,而是保留重复的关键字,由此,能够使得在资讯的标题和资讯的主体均出现的关键字,能够对资讯特征向量造成较大的影响,从而使得资讯特征向量与在资讯的标题和资讯的主体均出现的关键字能够具有更好、更紧密的关联性。
资讯标签可以为平台对资讯标记和分类的标签。具体地,资讯可以为文章、新闻、推广、视频等。
对各个资讯词向量与各个标签词向量进行的求平均处理,具体过程可以参考上文中对向量的求平均处理,此处不再展开说明。
图12示意性地示出了本申请某实施例对资讯的内容进行关键字提取,得到资讯关键字的步骤流程图。如图12所示,在另一些实施方式中,在以上实施例的基础上,在步骤S1110中的对资讯的内容进行关键字提取,得到资讯关键字,可以进一步包括以下步骤S1210~步骤S1240。
S1210.获取资讯的总条数,以及待处理资讯的内容中包括的多个备选关键字;
S1220.计算包括备选关键字的资讯条数;
S1230.根据资讯的总条数和包括备选关键字的资讯条数,计算多个备选关键字分别对应的逆向文件频率:
S1240.在多个备选关键字中,将逆向文件频率大于预设频率的备选关键字确定为待处理资讯的资讯关键字。
具体地,根据资讯的总条数和包括备选关键字的资讯条数,计算多个备选关键字分别对应的逆向文件频率,可以根据以下计算式计算:
其中,IDFk是第k个备选关键字的逆向文件频率,nk是包括第k个备选关键字的资讯的条数,Sum是资讯的总条数。
由此,在多个备选关键字中,将逆向文件频率大于预设频率的备选关键字确定为待处理资讯的资讯关键字,从而实现了对待处理资讯的资讯关键字的准确获取。
图13示意性地示出了本申请某实施例根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯之前的部分步骤流程图。如图13所示,在以上实施例的基础上,在步骤S240的根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯之前,可以进一步包括以下步骤S1310~步骤S1320。
S1310.计算用户特征向量与各个资讯特征向量的相似度;
S1320.按照相似度由高到低的顺序,选择预设数量个资讯特征向量,并确定为与用户特征向量匹配的资讯特征向量。
按照相似度由高到低的顺序,选择预设数量个资讯特征向量,并确定为与用户特征向量匹配的资讯特征向量,能够使得将与用户的特征相似度较高的资讯,推送到用户的终端上,实现了资讯的精准推送。
在一些实施方式中,也可以将与用户特征向量的相似度大于临界值的资讯特征向量,确定为与用户特征向量匹配的资讯特征向量,从而使得能够将与用户的特征相似度较高的资讯,推送到用户的终端上,实现了资讯的精准推送。
图14示意性地示出了本申请某实施例从触发资讯推荐服务到执行资讯推荐方法,并将资讯推送给用户的具体过程流程图。当收到触发资讯推荐服务的指令时,可以获取用户的用户画像数据。然后,根据用户画像数据的用户画像词汇的词向量和评估维度对应的评估词汇的词向量,计算各个评估维度下的用户画像数据对应的用户画像分数。再根据目标对象的对象名称的词向量和评估维度对应的评估词汇的词向量,计算各个评估维度下的目标对象对应的目标对象分数。进而,根据用户画像分数和目标对象分数,对用户画像数据与目标对象进行匹配,得到用户画像数据在各个评估维度中与目标对象的匹配结果。匹配结果包括用户在各个评估维度中匹配的目标对象的对象名称。根据匹配结果可以得到用户特征向量。根据200W条资讯,可以根据每个资讯形成对应的资讯特征向量,其中,每条资讯与一个或多个目标对象相关。然后,将与用户特征向量匹配的资讯特征向量对应的资讯,推送给用户。
在具体实施方式中,可以由用户的操作触发资讯推荐服务,也可以冷启动,在用户无动作的情况下,定时触发资讯推荐服务,或者在近期新增资讯较多时,触发资讯推荐服务,从而精准向用户推荐相关资讯。
例如,当目标对象为汽车,相关汽车产品刚上线了大量资讯,在还没有用户点击过资讯时,可以根据获取的用户画像数据对用户进行汽车资讯的冷启动精准推荐,使得推荐的资讯的相关产品符合用户的消费水平和兴趣倾向。
应当注意,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的资讯推荐方法。图15示意性地示出了本申请实施例提供的资讯推荐装置的结构框图。如图15所示,资讯推荐装置1500包括:
评估分数获取模块1510,被配置为获取用户的用户画像数据在一个或多个评估维度中对应的分数,并获取各个目标对象在一个或多个评估维度中对应的分数;
评估分数匹配模块1520,被配置为根据用户画像数据在各个评估维度中的分数与目标对象在各个评估维度中的分数,对用户画像数据与目标对象进行匹配,得到用户画像数据与目标对象在各个评估维度中的匹配结果;
用户特征向量计算模块1530,被配置为根据匹配结果和预设的词向量表,计算与匹配结果对应的用户特征向量,词向量表用于表示词汇与词向量的对应关系;
资讯推送模块1540,被配置为根据用户特征向量以及与各个目标对象相关的资讯特征向量,向用户推送与用户特征向量匹配的资讯特征向量所对应的资讯。
在本申请的一些实施例中,基于以上各实施例,资讯推荐装置还包括:
用户画像词向量生成单元,被配置为根据词向量表和用户画像数据所包括的用户画像词汇,生成用户画像数据对应的用户画像词向量,用户画像词汇用于描述用户画像;
评估维度词向量生成单元,被配置为根据词向量表和各个评估维度对应的评估词汇,生成各个评估维度分别对应的评估维度词向量,评估词汇用于描述评估维度;
用户画像分数计算单元,被配置为计算用户画像词向量与评估维度词向量的相似度,并根据用户画像词向量与评估维度词向量的相似度确定用户画像数据在评估维度中对应的分数。
在本申请的一些实施例中,基于以上各实施例,用户画像词向量生成单元包括:
用户画像数据获取子单元,被配置为获取用户画像数据,用户画像数据包括多个用户画像词汇;
第一词向量确定子单元,被配置为根据词向量表和多个用户画像词汇,确定各个用户画像词汇对应的词向量;
用户画像词向量确定子单元,被配置为对各个用户画像词汇对应的词向量进行求平均处理得到用户画像词向量。
在本申请的一些实施例中,基于以上各实施例,匹配结果包括匹配结果词汇组,匹配结果词汇组包括用户在各个评估维度中匹配到的目标对象的对象名称;用户特征向量计算模块包括:
第一目标对象特征向量确定单元,被配置为根据词向量表和匹配结果词汇组中包含的各个对象名称,确定与各个对象名称分别对应的目标对象特征向量;
用户类别词向量确定单元,被配置为将用户画像数据中指定类别的用户画像词汇所对应的词向量作为用户类别词向量;
第一用户特征向量确定单元,被配置为对各个目标对象特征向量与各个用户类别词向量的进行求平均处理,得到用户特征向量。
在本申请的一些实施例中,基于以上各实施例,用户画像分数计算单元包括:
第一备选相似度计算子单元,被配置为计算用户画像词向量与各个评估维度词向量的相似度,得到多个第一备选相似度;
相似度计算子单元,被配置为将多个第一备选相似度中的最大值作为用户画像词向量与评估维度词向量的相似度。
在本申请的一些实施例中,基于以上各实施例,资讯推荐装置还包括:
历史用户画像分数获取单元,被配置为获取历史用户画像数据在评估维度中对应的分数,历史用户画像数据为历史用户的用户画像数据;
用户画像排名获取单元,被配置为根据用户画像数据在评估维度中对应的分数和历史用户画像数据在评估维度中对应的分数,获取用户画像数据在评估维度中对应的用户排名,并将用户排名作为用户画像数据在评估维度中对应的分数。
在本申请的一些实施例中,基于以上各实施例,评估分数获取模块包括:
目标对象排名获取单元,被配置为获取各个目标对象在一个或多个评估维度中对应的对象排名,并将对象排名作为目标对象在对应的评估维度中的分数。
在本申请的一些实施例中,基于以上各实施例,评估分数获取模块还包括:
目标对象词向量获取单元,被配置为根据各个目标对象的对象名称和词向量表,确定对象名称对应的目标对象词向量;
第二备选相似度获取单元,被配置为计算目标对象词向量与各个评估维度词向量的相似度,得到多个第二备选相似度;
相似度获取单元,被配置为将多个第二备选相似度中的最大值作为目标对象词向量与评估维度词向量的相似度;
目标对象分数计算单元,被配置为根据目标对象词向量与评估维度词向量的相似度,计算目标对象在对应的评估维度中的分数。
在本申请的一些实施例中,基于以上各实施例,匹配结果包括匹配结果词汇组,匹配结果词汇组包括用户在各个评估维度中匹配到的目标对象的对象名称;用户特征向量计算模块还包括:
第二目标对象特征向量确定单元,被配置为根据词向量表和匹配结果词汇组中包含的各个对象名称,确定与各个对象名称分别对应的目标对象特征向量;
第二用户特征向量确定单元,被配置为对各个目标对象特征向量进行求平均处理,得到用户特征向量。
在本申请的一些实施例中,基于以上各实施例,资讯推荐装置还包括:
资讯关键字获取单元,被配置为获取资讯的资讯标签,对资讯的内容进行关键字提取,得到资讯关键字;
词向量获取单元,被配置为根据资讯关键字、资讯标签与词向量表,确定与各个资讯关键字分别对应的资讯词向量,以及与各个资讯标签分别对应的标签词向量;
资讯特征向量获取单元,对各个资讯词向量与各个标签词向量进行求平均处理,得到资讯特征向量。
在本申请的一些实施例中,基于以上各实施例,资讯关键字获取单元包括:
资讯及备选关键字获取子单元,被配置为获取资讯的总条数,以及待处理资讯的内容中包括的多个备选关键字;
备选关键字资讯条数获取子单元,被配置为计算包括备选关键字的资讯条数;
逆向文件频率计算子单元,被配置为根据资讯的总条数和包括备选关键字的资讯条数,计算多个备选关键字分别对应的逆向文件频率:
资讯关键字确定子单元,被配置为在多个备选关键字中,将逆向文件频率大于预设频率的备选关键字确定为待处理资讯的资讯关键字;
在本申请的一些实施例中,基于以上各实施例,资讯推荐装置还包括:
相似度计算单元,被配置为计算用户特征向量与各个资讯特征向量的相似度;
资讯特征向量匹配单元,被配置为按照相似度由高到低的顺序,选择预设数量个资讯特征向量,并确定为与用户特征向量匹配的资讯特征向量。
在本申请的一些实施例中,基于以上各实施例,用户特征向量计算模块还包括:
资讯文本提取单元,被配置为提取各条待推荐资讯中的资讯文本;
文本分词单元,被配置为对资讯文本进行分词处理,得到按照资讯文本中的分词出现顺序排列的多个分词;
去除无意义词单元,被配置为去除多个分词中的无意义词,无意义词包括停用词、介词和语气词中的一种或多种;
词向量表构建单元,被配置为将按照资讯文本中的分词出现顺序排列的多个分词,输入到预训练的词向量模型中,得到多个分词分别对应的词向量,并根据多个分词分别对应的词向量构建词向量表。
本申请各实施例中提供的资讯推荐装置的具体细节已经在对应的方法实施例中进行了详细的描述,此处不再赘述。
图16示意性地示出了用于实现本申请实施例的电子设备的计算机系统结构框图。
需要说明的是,图16示出的电子设备的计算机系统1600仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图16所示,计算机系统1600包括中央处理器1601(Central Processing Unit,CPU),其可以根据存储在只读存储器1602(Read-Only Memory,ROM)中的程序或者从存储部分1608加载到随机访问存储器1603(RandomAccess Memory,RAM)中的程序而执行各种适当的动作和处理。在随机访问存储器1603中,还存储有系统操作所需的各种程序和数据。中央处理器1601、在只读存储器1602以及随机访问存储器1603通过总线1604彼此相连。输入/输出接口1605(Input/Output接口,即I/O接口)也连接至总线1604。
以下部件连接至输入/输出接口1605:包括键盘、鼠标等的输入部分1606;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1607;包括硬盘等的存储部分1608;以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分1609。通信部分1609经由诸如因特网的网络执行通信处理。驱动器1610也根据需要连接至输入/输出接口1605。可拆卸介质1611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1610上,以便于从其上读出的计算机程序根据需要被安装入存储部分1608。
特别地,根据本申请的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1609从网络上被下载和安装,和/或从可拆卸介质1611被安装。在该计算机程序被中央处理器1601执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (15)
1.一种资讯推荐方法,其特征在于,所述方法包括:
获取用户的用户画像数据在一个或多个评估维度中对应的分数,并获取各个目标对象在一个或多个所述评估维度中对应的分数;
根据所述用户画像数据在各个评估维度中的分数与所述目标对象在所述各个评估维度中的分数,对所述用户画像数据与所述目标对象进行匹配,得到所述用户画像数据与所述目标对象在所述各个评估维度中的匹配结果;
根据所述匹配结果和预设的词向量表,计算与所述匹配结果对应的用户特征向量,所述词向量表用于表示词汇与词向量的对应关系;
根据所述用户特征向量以及与所述各个目标对象相关的资讯特征向量,向所述用户推送与所述用户特征向量匹配的资讯特征向量所对应的资讯。
2.根据权利要求1所述的资讯推荐方法,其特征在于,在所述获取用户的用户画像数据在一个或多个评估维度中对应的分数之前,所述方法还包括:
根据所述词向量表和所述用户画像数据所包括的用户画像词汇,生成所述用户画像数据对应的用户画像词向量,所述用户画像词汇用于描述用户画像;
根据所述词向量表和各个所述评估维度对应的评估词汇,生成各个评估维度分别对应的评估维度词向量,所述评估词汇用于描述所述评估维度;
计算所述用户画像词向量与所述评估维度词向量的相似度,并根据所述用户画像词向量与所述评估维度词向量的相似度确定所述用户画像数据在所述评估维度中对应的分数。
3.根据权利要求2所述的资讯推荐方法,其特征在于,所述根据所述词向量表和所述用户画像数据所包括的用户画像词汇,生成所述用户画像数据对应的用户画像词向量,包括:
获取所述用户画像数据,所述用户画像数据包括多个所述用户画像词汇;
根据所述词向量表和多个所述用户画像词汇,确定各个所述用户画像词汇对应的词向量;
对各个所述用户画像词汇对应的词向量进行求平均处理,得到所述用户画像词向量。
4.根据权利要求3所述的资讯推荐方法,其特征在于,所述匹配结果包括匹配结果词汇组,所述匹配结果词汇组包括用户在各个评估维度中匹配到的目标对象的对象名称;所述根据所述匹配结果和预设的词向量表,计算与所述匹配结果对应的用户特征向量,包括:
根据所述词向量表和所述匹配结果词汇组中包含的各个对象名称,确定与各个所述对象名称分别对应的目标对象特征向量;
将所述用户画像数据中指定类别的用户画像词汇所对应的词向量作为用户类别词向量;
对各个所述目标对象特征向量与各个所述用户类别词向量的进行求平均处理,得到所述用户特征向量。
5.根据权利要求2所述的资讯推荐方法,其特征在于,所述计算所述用户画像词向量与所述评估维度词向量的相似度,包括:
计算所述用户画像词向量与各个所述评估维度词向量的相似度,得到多个第一备选相似度;
将所述多个第一备选相似度中的最大值作为所述用户画像词向量与所述评估维度词向量的相似度。
6.根据权利要求2所述的资讯推荐方法,其特征在于,在所述根据所述用户画像词向量与所述评估维度词向量的相似度确定所述用户画像数据在所述评估维度中对应的分数后,所述方法还包括:
获取历史用户画像数据在所述评估维度中对应的分数,所述历史用户画像数据为历史用户的用户画像数据;
根据所述用户画像数据在所述评估维度中对应的分数和所述历史用户画像数据在所述评估维度中对应的分数,获取所述用户画像数据在所述评估维度中对应的用户排名,并将所述用户排名作为所述用户画像数据在所述评估维度中对应的分数;
所述获取各个目标对象在一个或多个所述评估维度中对应的分数,包括:获取各个目标对象在一个或多个所述评估维度中对应的对象排名,并将所述对象排名作为所述目标对象在对应的所述评估维度中的分数。
7.根据权利要求2所述的资讯推荐方法,其特征在于,所述获取各个目标对象在一个或多个所述评估维度中对应的分数,包括:
根据各个目标对象的对象名称和所述词向量表,确定所述对象名称对应的目标对象词向量;
计算所述目标对象词向量与各个所述评估维度词向量的相似度,得到多个第二备选相似度;
将所述多个第二备选相似度中的最大值作为所述目标对象词向量与所述评估维度词向量的相似度;
根据所述目标对象词向量与所述评估维度词向量的相似度,计算所述目标对象在对应的所述评估维度中的分数。
8.根据权利要求1所述的资讯推荐方法,其特征在于,所述匹配结果包括匹配结果词汇组,所述匹配结果词汇组包括用户在各个评估维度中匹配到的目标对象的对象名称;所述根据所述匹配结果和预设的词向量表,计算与所述匹配结果对应的用户特征向量,包括:
根据所述词向量表和所述匹配结果词汇组中包含的各个对象名称,确定与各个所述对象名称分别对应的目标对象特征向量;
对各个所述目标对象特征向量进行求平均处理,得到所述用户特征向量。
9.根据权利要求1所述的资讯推荐方法,其特征在于,在所述根据所述用户特征向量以及与所述各个目标对象相关的资讯特征向量,向所述用户推送与所述用户特征向量匹配的资讯特征向量所对应的资讯之前,所述方法还包括:
获取所述资讯的资讯标签,对所述资讯的内容进行关键字提取,得到资讯关键字;
根据所述资讯关键字、所述资讯标签与所述词向量表,确定与各个所述资讯关键字分别对应的资讯词向量,以及与各个所述资讯标签分别对应的标签词向量;
对各个所述资讯词向量与各个标签词向量进行求平均处理,得到所述资讯特征向量。
10.根据权利要求9所述的资讯推荐方法,其特征在于,所述对所述资讯的内容进行关键字提取,得到资讯关键字,包括:
获取资讯的总条数,以及待处理资讯的内容中包括的多个备选关键字;
计算包括所述备选关键字的资讯条数;
根据所述资讯的总条数和包括所述备选关键字的资讯条数,计算所述多个备选关键字分别对应的逆向文件频率:
在所述多个备选关键字中,将逆向文件频率大于预设频率的备选关键字确定为所述待处理资讯的资讯关键字。
11.根据权利要求1所述的资讯推荐方法,其特征在于,在向所述用户推送与所述用户特征向量匹配的资讯特征向量所对应的资讯之前,所述方法还包括:
计算所述用户特征向量与各个资讯特征向量的相似度;
按照相似度由高到低的顺序,选择预设数量个资讯特征向量,并确定为与所述用户特征向量匹配的资讯特征向量。
12.根据权利要求1-11任意一项所述的资讯推荐方法,其特征在于,在所述根据所述匹配结果和预设的词向量表,计算与所述匹配结果对应的用户特征向量之前,所述方法还包括:
提取各条待推荐资讯中的资讯文本;
对所述资讯文本进行分词处理,得到按照所述资讯文本中的分词出现顺序排列的多个分词;
去除多个所述分词中的无意义词,所述无意义词包括停用词、介词和语气词中的一种或多种;
将按照所述资讯文本中的分词出现顺序排列的多个所述分词,输入到预训练的词向量模型中,得到多个所述分词分别对应的词向量,并根据多个所述分词分别对应的词向量构建所述词向量表。
13.一种资讯推荐装置,其特征在于,包括:
评估分数获取模块,被配置为获取用户的用户画像数据在一个或多个评估维度中对应的分数,并获取各个目标对象在一个或多个所述评估维度中对应的分数;
评估分数匹配模块,被配置为根据所述用户画像数据在各个评估维度中的分数与所述目标对象在所述各个评估维度中的分数,对所述用户画像数据与所述目标对象进行匹配,得到所述用户画像数据与所述目标对象在所述各个评估维度中的匹配结果;
用户特征向量计算模块,被配置为根据所述匹配结果和预设的词向量表,计算与所述匹配结果对应的用户特征向量,所述词向量表用于表示词汇与词向量的对应关系;
资讯推送模块,被配置为根据所述用户特征向量以及与所述各个目标对象相关的资讯特征向量,向所述用户推送与所述用户特征向量匹配的资讯特征向量所对应的资讯。
14.一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1至12中任意一项所述的资讯推荐方法。
15.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至12中任意一项所述的资讯推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110905568.8A CN113641901B (zh) | 2021-08-05 | 2021-08-05 | 资讯推荐方法、装置、计算机可读介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110905568.8A CN113641901B (zh) | 2021-08-05 | 2021-08-05 | 资讯推荐方法、装置、计算机可读介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113641901A true CN113641901A (zh) | 2021-11-12 |
CN113641901B CN113641901B (zh) | 2024-02-02 |
Family
ID=78420063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110905568.8A Active CN113641901B (zh) | 2021-08-05 | 2021-08-05 | 资讯推荐方法、装置、计算机可读介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113641901B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145536A (zh) * | 2017-04-19 | 2017-09-08 | 畅捷通信息技术股份有限公司 | 用户画像构建方法与装置及推荐方法与装置 |
CN108846097A (zh) * | 2018-06-15 | 2018-11-20 | 北京搜狐新媒体信息技术有限公司 | 用户的兴趣标签表示方法、文章推荐方法、及装置、设备 |
CN111192025A (zh) * | 2019-12-31 | 2020-05-22 | 广东德诚科教有限公司 | 职业信息匹配方法、装置、计算机设备和存储介质 |
CN111368219A (zh) * | 2020-02-27 | 2020-07-03 | 广州腾讯科技有限公司 | 信息推荐方法、装置、计算机设备以及存储介质 |
CN112632385A (zh) * | 2020-12-29 | 2021-04-09 | 中国平安人寿保险股份有限公司 | 课程推荐方法、装置、计算机设备及介质 |
CN112669113A (zh) * | 2020-12-30 | 2021-04-16 | 微民保险代理有限公司 | 产品的推荐方法和装置、存储介质、电子装置 |
CN112784142A (zh) * | 2019-10-24 | 2021-05-11 | 北京搜狗科技发展有限公司 | 一种信息推荐方法及装置 |
-
2021
- 2021-08-05 CN CN202110905568.8A patent/CN113641901B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145536A (zh) * | 2017-04-19 | 2017-09-08 | 畅捷通信息技术股份有限公司 | 用户画像构建方法与装置及推荐方法与装置 |
CN108846097A (zh) * | 2018-06-15 | 2018-11-20 | 北京搜狐新媒体信息技术有限公司 | 用户的兴趣标签表示方法、文章推荐方法、及装置、设备 |
CN112784142A (zh) * | 2019-10-24 | 2021-05-11 | 北京搜狗科技发展有限公司 | 一种信息推荐方法及装置 |
CN111192025A (zh) * | 2019-12-31 | 2020-05-22 | 广东德诚科教有限公司 | 职业信息匹配方法、装置、计算机设备和存储介质 |
CN111368219A (zh) * | 2020-02-27 | 2020-07-03 | 广州腾讯科技有限公司 | 信息推荐方法、装置、计算机设备以及存储介质 |
CN112632385A (zh) * | 2020-12-29 | 2021-04-09 | 中国平安人寿保险股份有限公司 | 课程推荐方法、装置、计算机设备及介质 |
CN112669113A (zh) * | 2020-12-30 | 2021-04-16 | 微民保险代理有限公司 | 产品的推荐方法和装置、存储介质、电子装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113641901B (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107862027B (zh) | 检索意图识别方法、装置、电子设备及可读存储介质 | |
Kiela et al. | Improving multi-modal representations using image dispersion: Why less is sometimes more | |
CN111539197B (zh) | 文本匹配方法和装置以及计算机系统和可读存储介质 | |
CN112330455B (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
CN111460221B (zh) | 评论信息处理方法、装置及电子设备 | |
CN106095845B (zh) | 文本分类方法和装置 | |
CN103870973A (zh) | 基于电子信息的关键词提取的信息推送、搜索方法及装置 | |
CN110717038B (zh) | 对象分类方法及装置 | |
CN113392179A (zh) | 文本标注方法及装置、电子设备、存储介质 | |
CN113704623A (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
CN113032556A (zh) | 一种基于自然语言处理形成用户画像的方法 | |
CN114255067A (zh) | 数据定价方法和装置、电子设备、存储介质 | |
Soliman et al. | Utilizing support vector machines in mining online customer reviews | |
CN117609612A (zh) | 资源推荐方法、装置、存储介质及电子设备 | |
CN112926341A (zh) | 文本数据处理方法、装置 | |
CN110705308B (zh) | 语音信息的领域识别方法、装置、存储介质及电子设备 | |
CN103593427A (zh) | 新词搜索方法及系统 | |
CN111581378A (zh) | 基于交易数据建立用户消费标签体系的方法和装置 | |
Tian et al. | A multi-modal topic model for image annotation using text analysis | |
CN113641901B (zh) | 资讯推荐方法、装置、计算机可读介质及电子设备 | |
CN116127066A (zh) | 文本聚类方法、文本聚类装置、电子设备及存储介质 | |
CN114781348A (zh) | 一种基于词袋模型的文本相似度计算方法及系统 | |
CN113139056A (zh) | 网络数据的聚类方法、聚类装置、电子设备及介质 | |
CN113763084A (zh) | 产品推荐的处理方法、装置、设备及存储介质 | |
CN118227910B (zh) | 一种媒体资源聚合方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40055388 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |