CN116484085A - 一种信息投放方法、装置、设备及存储介质、程序产品 - Google Patents
一种信息投放方法、装置、设备及存储介质、程序产品 Download PDFInfo
- Publication number
- CN116484085A CN116484085A CN202210032292.1A CN202210032292A CN116484085A CN 116484085 A CN116484085 A CN 116484085A CN 202210032292 A CN202210032292 A CN 202210032292A CN 116484085 A CN116484085 A CN 116484085A
- Authority
- CN
- China
- Prior art keywords
- information
- feature
- features
- target
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002716 delivery method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 58
- 230000003993 interaction Effects 0.000 claims abstract description 53
- 238000005065 mining Methods 0.000 claims abstract description 34
- 238000012216 screening Methods 0.000 claims abstract description 30
- 238000000605 extraction Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 28
- 230000015654 memory Effects 0.000 claims description 23
- 238000013507 mapping Methods 0.000 claims description 17
- 230000004927 fusion Effects 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 7
- 230000009193 crawling Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 25
- 238000013473 artificial intelligence Methods 0.000 abstract description 19
- 239000013598 vector Substances 0.000 description 28
- 230000008569 process Effects 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 25
- 230000014509 gene expression Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- 230000010354 integration Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 9
- 230000006399 behavior Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000009434 installation Methods 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000005295 random walk Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种信息投放方法、装置、设备及存储介质、程序产品;本申请实施例可以应用于云技术、人工智能、智慧交通、车载等各种场景,涉及人工智能技术。该方法包括:对于待投放信息的投放信息特征和历史交互信息的历史信息特征进行相关性挖掘,得到候选对象针对投放信息特征的偏好信息,再基于挖掘出的偏好信息和所述投放信息特征,确定出候选对象对于待投放信息在信息粒度和特征粒度上的兴趣特征。最后依据兴趣特征,从候选对象中筛选出对待投放信息感兴趣的目标对象,以进行信息投放。通过本申请,能够提高信息投放的准确度。
Description
技术领域
本申请涉及人工智能技术,尤其涉及一种信息投放方法、装置、设备及存储介质、程序产品。
背景技术
信息投放是指针对待投放的信息寻找匹配的投放对象,将信息发送给这些投放对象,以提高信息的受关注程度。相关技术中,大多是借助于人工智能技术,对所有使用对象的历史行为进行分析,确定出信息所匹配的投放对象。然而,相关技术中,存在对使用对象的多样的个性化兴趣建模效果较差的问题,从而使得信息投放的准确度较低。
发明内容
本申请实施例提供一种信息投放方法、装置、设备及计算机可读存储介质、程序产品,能够提高信息投放的准确度。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种信息投放方法,包括:
获取待投放信息的投放信息特征,以及候选对象的历史交互信息所对应的历史信息特征;
通过对所述投放信息特征和所述历史信息特征进行相关性挖掘,确定出所述候选对象针对所述投放信息特征的偏好信息;
基于所述偏好信息和所述投放信息特征,构建出所述候选对象的兴趣特征;所述兴趣特征描述了所述候选对象对于所述待投放信息和所述投放信息特征的兴趣;
依据所述兴趣特征,从所述候选对象中筛选出目标对象,并将所述待投放信息发送给所述目标对象。
本申请实施例提供一种信息投放装置,包括:。
信息获取模块,用于获取待投放信息的投放信息特征,以及候选对象的历史交互信息所对应的历史信息特征;
信息挖掘模块,用于通过对所述投放信息特征和所述历史信息特征进行相关性挖掘,确定出所述候选对象针对所述投放信息特征的偏好信息;
特征构建模块,用于基于所述偏好信息和所述投放信息特征,构建出所述候选对象的兴趣特征;所述兴趣特征描述了所述候选对象对于所述待投放信息和所述投放信息特征的兴趣;
对象筛选模块,用于依据所述兴趣特征,从所述候选对象中筛选出目标对象;
信息发送模块,用于将所述待投放信息发送给所述目标对象。
在本申请的一些实施例中,所述信息挖掘模块,还用于针对所述投放信息特征和所述历史信息特征进行相关性挖掘,得到特征相关度;所述特征相关度表征了所述历史交互信息对于所述偏好信息的影响;基于所述特征相关度对所述历史信息特征进行融合,得到所述候选对象针对所述投放信息特征的所述偏好信息。
在本申请的一些实施例中,所述信息挖掘模块,还用于对所述投放信息特征与所述历史信息特征进行内积处理,得到特征内积结果;将所述特征内积结果进行归一化处理,得到所述特征相关度。
在本申请的一些实施例中,所述特征构建模块,还用于对所述偏好信息和所述投放信息特征进行相关性挖掘,得到所述偏好信息在所述投放信息特征上的影响权重;基于所述影响权重和所述投放信息特征,确定出所述候选对象的所述兴趣特征。
在本申请的一些实施例中,所述特征构建模块,还用于利用所述影响权重,对所述投放信息特征进行加权融合,得到所述偏好信息所对应的融合特征;针对所述偏好信息对应的融合特征进行平均处理,得到所述候选对象的所述兴趣特征。
在本申请的一些实施例中,所述对象筛选模块,还用于依据所述兴趣特征,预测出所述候选对象针对所述待投放信息的偏好值;利用所述偏好值,从所述候选对象中筛选出所述目标对象。
在本申请的一些实施例中,所述信息获取模块,还用于从预设知识图谱中查找出所述待投放信息的邻居节点;其中,所述邻居节点是所述待投放信息的辅助信息所对应的节点;从预设特征表中,筛选出所述待投放信息对应的特征、所述邻居节点所对应的特征,以及所述候选对象的所述历史交互信息所对应的历史信息特征;将所述待投放信息对应的特征,以及所述邻居节点对应的特征,确定为所述待投放信息的所述投放信息特征。
在本申请的一些实施例中,所述信息投放装置还包括:特征整合模块;所述特征整合模块,用于利用从信息库中所筛选出的目标信息,构建出预设知识图谱;所述目标信息至少包括所述信息库中转化次数大于次数阈值的信息;针对所述预设知识图谱中的每个实体节点,从所述预设知识图谱中采样出对应的节点序列;对所述节点序列进行特征编码,得到每个所述实体节点所对应的编码特征;利用每个所述实体节点所对应的编码特征,整合为所述预设特征表。
在本申请的一些实施例中,所述特征整合模块,还用于针对所述目标信息进行信息爬取,得到所述目标信息的描述信息;对所述描述信息进行文本处理,得到辅助信息;其中,所述文本处理至少包括过滤、分词和去重;针对所述辅助信息和所述目标信息进行关联情况的抽取,得到关联信息;将所述目标信息和所述辅助信息作为实体节点,并利用所述关联信息对所述实体节点进行连接,得到所述预设知识图谱。
在本申请的一些实施例中,所述特征整合模块,还用于将所述目标信息作为头实体节点,所述辅助信息作为头实体节点之外的其他实体节点,并利用所述关联信息对所述头实体节点和所述其他实体节点进行连接,得到所述预设知识图谱。
在本申请的一些实施例中,所述特征整合模块,还用于将所述节点序列进行特征映射,得到初始映射特征;对所述初始映射特征进行特征提取,得到每个所述实体节点的所述编码特征。
在本申请的一些实施例中,所述特征整合模块,还用于针对所述辅助信息和所述目标信息进行关联抽取,得到初步抽取结果;从多个搜索引擎中,筛选出现所述初步抽取结果的目标引擎;当所述目标引擎在多个所述搜索引擎的数量占比达到占比阈值时,将所述初步抽取结果确定为所述关联信息。
本申请实施例提供一种信息投放设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的信息投放方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本申请实施例提供的信息投放方法。
本申请实施例提供一种计算机程序产品,存储有可执行指令,所述计算机程序或指令被处理器执行时实现本申请实施例提供的信息投放方法。
本申请实施例具有以下有益效果:信息投放设备能够先基于对投放信息特征和历史信息特征进行相关性挖掘,确定出候选对象对于投放信息特征,即待投放信息的特征维度上的偏好情况,以在更细粒度上区分候选的使用对象的喜好,基于确定出的偏好情况和投放信息特征,实现在细粒度上对该使用对象的个性化兴趣的建模,得到更加准确的兴趣特征,最后基于兴趣特征,能够精准地从该使用对象中筛选出对待投放信息感兴趣的投放对象,最终提高了信息投放的准确度。
附图说明
图1是本申请实施例提供的信息投放系统的架构示意图;
图2是本申请实施例提供的图1中的服务器的结构示意图;
图3是本申请实施例提供的信息投放方法的流程示意图一;
图4是本申请实施例提供的信息投放方法的流程示意图二;
图5是本申请实施例提供的信息投放方法的流程示意图三;
图6是本申请实施例提供的一种待投放信息;
图7是本申请实施例提供的又一种待投放信息;
图8是本申请实施例提供的信息投放方法的流程示意图四;
图9是本申请实施例提供的元路径的示意图;
图10是本申请实施例提供的预设知识图谱的示意图;
图11是本申请实施例提供的广告投放流程框架图;
图12是本申请实施例提供的计算交互概率时特征的变化示意图;
图13是本申请实施例提供的知识图谱的构建过程示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,极有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
2)机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
3)知识图谱(Knowledge Graph,KG)一种揭示自然实体之间的关系的语义网络,通常由一些了(实体1、关系、实体2)这样的三元组指示组成。例如,三元组(《XX理论》、作者、张三)表示的知识是著作《XX理论》的作者是张三。
4)元路径,在异构图(即包含不同类型的节点的图)中,任意一个节点可能有多种类型的一阶邻域节点,元路径就是指定了游走规则的节点类型序列。按照元路径,能够从知识图谱中抽取出由一系列节点组成的节点序列,该节点序列能够表达不同类型节点之间的结构和语义关系。
5)知识图谱嵌入(Knowledge Graph Embedding,KGE),是指将知识图谱中的实体和关系嵌入到连续的向量空间,并通过机器学习方法将知识图谱的结构编码进隐向量中,使得隐空间中的每个相邻都具有语义信息。
6)协同过滤(Collaborative Filter,CF)是推荐领域的经典算法,其通过相似度计算(例如余弦相似度)找到与目标对象具有相似兴趣的使用对象,然后将该使用对象喜欢的物品推荐给目标对象,或者通过相似度计算找到与目标对象喜欢的物品相似的物品,将该物品推荐给目标对象。
7)注意力网络(Attention Neural Networks),是深度学习中的一种资源分配策略,通常由Query(查询)、键(Key)和值(Value)组成。通过计算Query和Key的匹配度给重要特征赋予更大的权重,从而使得重要特征在最后的特征组合过程中占据更大的比重。
8)稠密向量搜索匹配框架(FAISS)通过使用欧式距离、向量内积等度量方式,从向量库中查找到和目标向量最相似的向量。除了以上的暴力穷举的搜索方式,还提供查询聚类中心的近似搜索方式。
9)辅助信息(Side Information),对使用对象或物品做补充的特征,用来丰富使用对象和物品的表达,比如使用对象的年龄、性别等,物品的类别、标签等。
10)交叉熵损失函数(Cross Entropy Loss)是机器学习中常用的一种分类损失函数。当目标任务是二分类时,交叉熵损失函数的计算公式如式(1)所示:
其中,N为样本总数,yi表示样本i的标签,正类为1,负类为0,pi表示样本i预测为正类的概率。
11)跳词模型(Skip-Gram),通过设定中心词,查看其与上下文(在特定大小的滑动窗口)的出现情况,从而分析中心词和上下文关系的条件概率分布,以学习每个词的嵌入表示(embedding)。
12)点击率(Click-Through-Rate,CTR)是指某一内容被点击的次数与被显示次数的比值,反映了该内容的受关注程度。点击率的公式为实际点击次数/展示次数。
13)种子对象,即对某款物品、某个信息具有正向行为(比如点击、下载、支付)的使用对象,一般作为模型训练的正样本。
14)每行动成本(Cost Per Action),即信息投放方针对每个行动付出的成本。
15)曲线下面积(Area Under the Curve,AUC),是机器学习中用来评估分类任务的指标。AUC越接近1,表明分类效果越好,越接近0.5表明分类效果越差。
随着人工智能技术的研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服、车联网、智慧交通等。相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
信息投放是指针对待投放的信息寻找匹配的投放对象,将信息发送给这些投放对象,以提高信息的受关注程度。相关技术中,大多是借助于人工智能技术,对使用对象的历史行为进行分析,确定出信息所匹配的投放对象。
例如,通过词向量生成(Word2Vec)模型构建物品表达,然后再使用推荐算法(例如CF)、机器学习算法(例如极端梯度提升(eXtreme Gradient Boosting,XGBoost))确定匹配投放对象。第一步,先将将使用对象u的历史交互行为处理成序列形式Tu=[v1,v2,v3,…,vk],每个物品vi可以看成Tu这个“句子”中的一个“单词”。然后将每一个物品映射成为一个隐向量,在词袋模型的假设下,预测下一个“单词”,从而学习出“单词”与“单词”之间的联系。最终,所得到的隐向量表征物品和物品之间的关系。使用对象的表征可以利用历史交互物品的嵌入表达的平均值来表示,即/>在得到使用对象的表征和物品表征之后,通过内积预测使用对象的表征和物品表征之间产生交互的概率,或者使用神经网络、XGBoost将其交互与否作为一个分类任务进行识别(0代表不交互,1代表交互)。
又例如,利用双塔模型(应用在信息检索领域的通用语义匹配模型),包含查询文本(Query)和内容文本(Doc)两个“塔”,将Query和Doc侧各自的特征拼接成一个高维向量,然后使用深度神经网络(Deep Neural Networks,DNN)将Query和Doc降维浓缩到一个低维向量,然后使用向量点积(或者余弦相似度)计算Query和Doc的相似度,以基于Query和Doc的相似度来查找匹配投放对象。
再例如,通过深度兴趣网络(Deep Interest Network,DIN),将使用对象的表达由原先简单的历史交互物品的嵌入表达的均值,取代为注意力(Attention)加权求和的向量,从而获得使用对象个性化的表达,以基于使用对象个性化的表达查找匹配的投放对象。
还例如,通过KGE技术先训练得到物品的嵌入表征,然后将其作为物品的一种辅助信息,融合进CF框架进行训练,从而实现对物品的嵌入表达的增强,以便于利用增强后的嵌入表达查找出匹配的投放对象。
然而,基于词向量生成(Word2Vec)模型构建物品表达时,只是简单地将使用对象的表征表示成历史交互物品的嵌入表征的均值,使得使用对象的表征太过粗糙,损失了大量的信息,没有考虑到使用对象的个性化兴趣;基于双塔模型计算相似度时,Query和Doc已经高度浓缩,损失了大量的信息,使得Query和Doc无法与对侧进行信息交叉,并且,双塔模型无偏地使用了使用对象的历史点击行为,并未考虑使用对象的点击行为背后原因的多样性,从而忽视了使用对象的兴趣多样化;基于DIN模型确定使用对象的表达时,只考虑了候选物品与历史交互物品的相关性,无法建模多样化的使用对象的兴趣,并且该方案只是将物品的辅助信息处理成随机初始化的隐向量,未充分利用这些辅助信息;而通过KGE技术对物品的嵌入表达进行增强之后,后续的推荐模型并未充分利用增强的嵌入表达,无法对使用对象的兴趣进行建模,只是将其作为物品表征的一种扩充,且CF框架和增强后的嵌入表达是松耦合的,无法完全融合这些特征。
综上所述,相关技术中,信息投放时存在从使用对象的单一兴趣出发,对交互数据进行建模程度较浅,从而对使用对象多样的个性化兴趣建模效果较差的问题,从而使得信息投放的准确度较低。
除此之外,基于词向量生成(Word2Vec)模型构建物品表达时,需要周期性的在整个历史交互数据上训练模型,而每次对历史交互数据建模都会消耗大量的计算资源和时间成本,从而使得信息投放需要消耗的资源较多。
本申请实施例提供一种信息投放方法、装置、设备和计算机可读存储介质、程序产品,能够提高信息投放的准确度。下面说明本申请实施例提供的信息投放设备的示例性应用,本申请实施例提供的信息投放设备可以实施为笔记本电脑,平板电脑,台式计算机,机顶盒,移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备)等各种类型的终端,也可以实施为服务器,还可以实施为由终端和服务器所组成的设备集群。下面,将说明信息投放设备实施为服务器时的示例性应用。
参见图1,图1是本申请实施例提供的信息投放系统的架构示意图,为实现支撑一个信息投放应用,在信息投放系统100中,终端400(示例性示出了终端400-1和终端400-2)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。在信息投放系统100中,还设置有服务器500,服务器500可以独立于服务器200,也可以配置在服务器200中。图1示出的是服务器500独立于服务器200的情形。
服务器200用于获取待投放信息的投放信息特征,以及候选对象的历史交互信息所对应的历史信息特征;通过对投放信息特征和历史信息特征进行相关性挖掘,确定出候选对象针对投放信息特征的偏好信息;基于偏好信息和投放信息特征,构建出候选对象的兴趣特征;兴趣特征描述了候选对象对于待投放信息和所述投放信息特征的兴趣;依据兴趣特征,从候选对象中筛选出目标对象,并通过网络300将待投放信息发送给目标对象。
终端400是目标对象所使用的终端。终端400用于接收服务器200发送的待投放信息,并在图形界面410(示例性示出了图形界面410-1和图形界面410-2)中展示待投放信息。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能家电、车载设备等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本发明实施例中不做限制。
参见图2,图2是本申请实施例提供的图1中的服务器的结构示意图,图2所示的服务器200包括:至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。服务器200中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器250可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器250旨在包括任意适合类型的存储器。
在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(Wi-Fi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块253,用于经由一个或多个与用户接口230相关联的输出装置231(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块254,用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的装置可以采用软件方式实现,图2示出了存储在存储器250中的信息投放装置255,其可以是程序和插件等形式的软件,包括以下软件模块:信息获取模块2551、信息挖掘模块2552、特征构建模块2553、对象筛选模块2554、信息发送模块2555和特征整合模块2556,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在另一些实施例中,本申请实施例提供的信息投放装置可以采用硬件方式实现,作为示例,本申请实施例提供的信息投放装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的信息投放方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
在一些实施例中,信息投放设备可以通过运行计算机程序来实现本申请实施例提供的信息投放方法。举例来说,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序,如短信APP、社交APP等;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
本申请实施例可以应用于云技术、人工智能、智慧交通、车载等各种场景。下面,将结合本申请实施例提供的信息投放设备的示例性应用和实施,说明本申请实施例提供的信息投放方法。
参见图3,图3是本申请实施例提供的信息投放方法的流程示意图一,将结合图3示出的步骤进行说明。
S101、获取待投放信息的投放信息特征,以及候选对象的历史交互信息所对应的历史信息特征。
本申请实施例是在对使用对象进行信息投放的场景下实现的,即针对等待投放的信息筛选出合适的使用对象,再将信息发送给筛选出的使用对象的场景下所实现的。首先,信息投放设备会针对待投放信息,在数据库或其自身的存储空间中,查找出对应的投放信息特征,同时确定出候选对象,在数据库或其自身的存储空间中查找候选对象在历史时期所交互过的信息,即历史交互信息的特征,将该特征确定为历史信息特征。
可以理解的是,待投放信息可以是任意种类的等待投放的信息。待投放信息可以是由信息投放方提供的,例如,产品的推广视频、推广链接等。待投放信息也可以是由信息投放设备自动生成的,例如,信息投放设备针对某个事件所生成的通知,针对节日所生成的文案等等。进一步的,待投放信息可以是冷启动的信息,也可以是已经拥有一定热度的信息,本申请在此不作限定。
投放信息特征是对待投放信息的描述特征,其可以为对待投放信息本身的外观的描述特征,也可以为待投放信息的供应方、类别等的辅助信息的描述特征。进一步的,本申请中,待投放信息的投放信息特征可以仅有一个,也可以有多个。
候选对象是用于筛选最终进行信息投放的目标对象的对象集合。候选对象可以是线上的所有使用对象,也可以是所有注册过的使用对象,还可以是从所有注册过的使用对象中所筛选出的活跃度较高,或者与待投放信息的标签具有一定关联的使用对象,本申请实施例在此不作限定。
需要说明的是,历史交互信息可以是候选对象在某个特定的历史时间段操作过的信息,也可以是候选对象在当前时间点之前操作过的所有信息。上述操作可以是点击、双击,也可以是转发、评论,还可以是下单、收藏等,本申请在此不作限定。进一步的,候选对象可以仅有一个历史交互信息,也可以有多个历史交互信息。
历史信息特征可以是对历史交互信息本身的外观的描述特征,也可以是对历史交互信息的语义的描述特征,也可以是对历史交互信息的类别、供应商等辅助信息的描述特征。每个历史交互信息都有其对应的历史信息特征,从而,本申请实施例中,信息投放设备可以获取到一个或多个历史信息特征。
S102、通过对投放信息特征和历史信息特征进行相关性挖掘,确定出候选对象针对投放信息特征的偏好信息。
需要说明的是,从历史交互信息中,是能够挖掘出候选对象的兴趣偏好的,从而,信息投放设备针对投放信息特征和历史信息特征进行相关性的挖掘,能够明确候选对象针对投放信息特征感兴趣的程度,即明确候选对象针对投放信息特征的偏好情况,得到偏好信息。
也就是说,本申请实施例中,是基于投放信息特征和历史信息特征,挖掘出候选对象针对待投放信息的特征维度上的偏好情况,从而所挖掘出的偏好信息的粒度更细,达到了特征维度,进而针对候选对象的兴趣分析的粒度更细,以便于后续在更细的粒度上进行更加准确的兴趣特征建模。
在一些实施例中,信息投放设备可以通过计算投放信息特征和历史信息特征的相似度,实现相关性的挖掘,得到投放信息特征和历史信息特征之间的关联情况,然后将所得到的关联情况与历史信息特征进行融合,即利用关联情况对历史信息特征进行调整,然后利用调整后的历史信息特征来描述候选对象针对待投放信息的每个投放信息特征的兴趣偏好。
在另一些实施例中,信息投放设备还可以从将投放信息特征和历史信息特征进行逐元素的匹配,实现相关度的挖掘,将与历史信息特征匹配上的投放信息特征,生成表征正面影响的偏好权重,将与历史信息特征匹配不上的投放信息特征,生成表征负面影响的偏好权重,从而得到每个投放信息特征的偏好信息。
可以理解的是,投放信息特征的数量和偏好信息的数量是相同的,即当信息投放设备获取到多个投放信息特征时,相应的就会生成多个偏好信息;当信息投放设备仅获取到一个投放信息特征时,就会仅生成一个偏好信息。
S103、基于偏好信息和投放信息特征,构建出候选对象的兴趣特征。
信息投放设备对偏好信息和投放信息特征联合进行分析,以明确偏好信息在投放信息特征上的权重分布,即明确候选对象针对不同的投放信息特征的注意力,最后结合该注意力,构建出候选对象的兴趣特征。
需要说明的是,信息投放设备根据偏好信息,是能够明确候选对象针对投放信息特征的兴趣的,而候选对象针对投放信息特征的兴趣,实际上也能够代表候选对象针对待投放信息是否感兴趣,从而,基于偏好信息和投放信息特征所得到的兴趣特征,就能够同时表示候选对象针对待投放信息是否感兴趣,以及具体是针对待投放信息的各个投放信息特征是否感兴趣。也就是说,兴趣特征描述了候选对象对于待投放信息和投放信息特征的兴趣。
可以理解的是,由于偏好信息的粒度达到了特征维度,从而,基于偏好信息和投放信息特征所所构建出的兴趣特征的粒度也就更细,以便于后续基于更细粒度的兴趣特征更准确地筛选目标对象。
在一些实施例中,信息投放设备可以通过计算偏好信息与投放信息特征之间的相似度,明确偏好信息在投放信息特征上的注意力,然后基于计算出的注意力将投放信息特征进行融合,得到兴趣特征。
在另一些实施例中,信息投放设备还可以将偏好信息以投放信息特征进行逐元素的匹配(即对比偏好信息的各个分量和投放信息特征的各个分量是否相同),根据匹配上的元素的占比,针对投放信息特征分配不同的注意力,最后利用该注意力对投放信息特征进行更新,得到兴趣特征。
可以理解的是,信息投放设备针对一个候选对象,仅会得到一个兴趣特征。不同的候选对象的兴趣特征是不同的。
S104、依据兴趣特征,从候选对象中筛选出目标对象,并将待投放信息发送给目标对象。
信息投放设备在得到候选对象的兴趣特征之后,就会对兴趣特征进行分析,以明确候选对象中的哪些对象是对待投放信息有意向的,并将这些有意向的对象筛选出来作为目标对象。接着,信息投放设备会将待投放信息定时、或者是实时推送给筛选出的目标对象,以完成信息投放过程。
在一些实施例中,信息投放设备可以从兴趣特征中,分析出候选对象针对待投放信息的偏好值,然后依据偏好值从候选对象中筛选出目标对象。
在另一些实施例中,信息投放设备还可以针对候选对象的兴趣特征进行聚类,得到不同的类簇,然后利用待投放信息的标签所命中的类簇中确定为目标类簇,将目标类簇中的对象确定为目标对象。
可以理解的是,相比于相关技术中的基于词向量生成(Word2Vec)模型构建物品表达、基于双塔模型计算相似度以及基于DIN模型确定使用对象的表达以及通过KGE技术对物品的嵌入表达进行增强的方式,本申请实施例中,信息投放设备能够先基于对投放信息特征和历史信息特征进行相关性挖掘,确定出候选对象对于投放信息特征,即待投放信息的特征维度上的偏好情况,以在更细粒度上区分候选的使用对象的喜好,基于确定出的偏好情况和投放信息特征,实现在细粒度上对该使用对象的个性化兴趣的建模,得到更加准确的兴趣特征,最后基于兴趣特征,能够精准地从该使用对象中筛选出对待投放信息感兴趣的投放对象,最终提高了信息投放的准确度。
基于图3,参见图4,图4是本申请实施例提供的信息投放方法的流程示意图二。通过对投放信息特征和历史信息特征进行相关性挖掘,确定出候选对象针对投放信息特征的偏好信息,即S102的具体实现过程,可以包括:S1021-S1022,如下:
S1021、针对投放信息特征和历史信息特征进行相关性挖掘,得到特征相关度。
信息投放设备可以通过计算投放信息特征和历史信息特征在向量空间中的距离,得到特征相关度,也可以通过计算投放信息特征在历史信息特征上的投影,得到特征相似度,本申请在此不作限定。
需要说明的是,历史信息特征是历史交互信息所对应的特征,而历史交互信息是基于候选对象自身的喜好兴趣所生成的,针对历史信息特征和交互信息特征计算相关度,就能够明确交互信息特征中的哪个特征是候选对象所偏好的,以及偏好的程度。换句话说,特征相关度表征了历史交互信息对于偏好信息的影响。
S1022、基于特征相关度对历史信息特征进行融合,得到候选对象针对投放信息特征的偏好信息。
信息投放设备利用特征相关度对历史信息特征进行调整,得到权重调整后的历史信息特征,然后再将调整后的历史信息特征融合为一个特征,该特征代表了候选对象针对投放信息特征的偏好信息。
在一些实施例中,信息投放设备可以通过加权求和完成对调整后的历史信息特征的融合,在另一些实施例中,信息投放设备可以通过拼接完成对调整后的历史信息特征的融合。
示例性的,当信息投放设备得到的历史信息特征分别为得到的信息投放特征分别为/>时(即得到了k个历史信息特征,L个信息投放特征),本申请实施例提供了一种对调整后的历史信息特征进行融合的公式,参见式(2):
其中,αij是第i个投放信息特征与第j个历史信息特征的相似度,evj是第j个历史信息特征,k是历史信息特征的总数量,bi是候选对象针对第i个投放信息特征的偏好信息。
本申请实施例中,信息投放设备能够通过对历史信息特征和投放信息特征进行相关度性的挖掘,以明确历史交互信息对于偏好信息的影响,然后再基于该影响对历史信息特征进行融合处理,实现对候选对象在特征粒度上进行候选偏好的建模,以便于后续更加准确地筛选目标对象。
基于图4,参见图5,图5是本申请实施例提供的信息投放方法的流程示意图三。在本申请的一些实施例中,针对投放信息特征和历史信息特征进行相关性挖掘,得到特征相关度,即S1021的具体实现过程,可以包括:S1021a-S1021b,如下:
S1021a、对投放信息特征与历史信息特征进行内积处理,得到特征内积结果。
S1021b、将特征内积结果进行归一化处理,得到特征相关度。
当投放信息特征和历史信息特征的数量均为1时,信息投放设备会直接计算投放信息特征和历史信息特征的内积,并将所得到的特征内积结果利用预设的归一化参数进行归一化处理,从而得到特征相关度。
当投放信息特征和历史信息特征中的任意一个数量不为1时,信息投放设备会将每个投放信息特征分别和每个历史信息特征进行组对,得到多个信息特征对,再针对多个信息特征对分别进行内积计算,得到多个特征内积结果。最后,信息投放设备会将多个特征内积结果进行累加,并利用累加结果对每个特征内积结果进行归一化处理,所得到的归一化结果,就是每个投放信息特征与每个历史信息特征之间的特征相关度。
示例性的,本申请实施例提供了特征相关度的计算公式,参见式(3):
其中,是第j个历史信息特征,/>是第i个投放信息特征,e是自然底数,ci,j是第i个信息投放特征和第j个历史信息特征的特征相关度,/>表示内积。
本申请实施例中,信息投放设备可以通过对投放信息特征和历史信息特征进行内积计算,再对内积计算所得到的结果进行归一化,实现对投放信息特征和历史信息特征的相关度挖掘,以便于后续基于特征相关度对偏好信息进行建模。
继续参见图5,在本申请的一些实施例中,基于偏好信息和投放信息特征,构建出候选对象的兴趣特征,即S103的具体实现过程,可以包括:S1031-S1032,如下:
S1031、对偏好信息和投放信息特征进行相关性挖掘,得到偏好信息在投放信息特征上的影响权重。
在一些实施例中,信息投放设备可以将偏好信息和投放信息特征进行内积处理,实现将偏好信息投影到投放信息特征上,再对所得到的内积结果进行归一化处理(可以借助于所有内积结果的累加结果,或者最大的内积结果进行归一化),以确定出偏好信息对投放信息特征所造成的影响,从而得到影响权重。
示例性的,式(4)是本申请实施例提供的影响权重的计算公式,如下:
其中,bi是第i个信息投放特征的偏好信息,是第j个信息投放特征,/>是内积处理,ci,j是第i个偏好信息在第j个投放信息特征上的影响权重。
在另一些实施例中,信息投放设备还可以对投放信息特征进行转换,例如进行转置转换,缩放转换等,得到转换信息特征,然后再计算转换信息特征和偏好信息之间的特征距离,将特征距离进行归一化,得到偏好信息在投放信息特征上的影响权重。
S1032、基于影响权重和投放信息特征,确定出候选对象的兴趣特征。
在一些实施例中,信息投放设备可以通过影响权重,对投放信息特征进行调整,从而调整后的投放信息特征就会有带有候选对象的兴趣、偏好情况。接着,信息投放设备可以直接将调整后的投放信息特征确定为兴趣特征,或者是将不同的调整后的投放信息特征进行融合,得到兴趣特征。
在另一些实施例中,信息投放设备还可以将影响权重与权重阈值进行比较,将影响权重大于权重阈值的投放信息特征筛选出来,再对筛选出的投放信息特征进行取均值或者是融合,得到候选对象的兴趣特征。
本申请实施例中,信息投放设备会先分析偏好信息在投放信息特征上的影响权重,以通过影响权重来明确候选对象针对待投放信息的兴趣分布情况,然后再利用影响权重和投放信息特征,建模出候选对象的兴趣特征,如此,就能够实现在特征粒度对候选的使用对象的兴趣进行建模,以明确不同该使用对象的个性化兴趣。
在本申请的一些实施例中,基于影响权重和投放信息特征,确定出候选对象的兴趣特征,即S1032的具体实现过程,可以包括:S1032a-S1032b,如下:
S1032a、利用影响权重,对投放信息特征进行加权融合,得到偏好信息所对应的融合特征。
需要说明的是,同一个偏好信息,针对不同的投放信息特征会造成不同的影响,从而同一个偏好信息在不同的投放信息特征上的影响权重并不相同。此时,信息投放设备会同一个偏好信息下的不同影响权重,作为其所对应的投放信息特征的加权权重,然后将不同的的信息投放特征进行加权求和,得到该偏好信息所对应的融合特征。
S1032b、针对偏好信息对应的融合特征进行平均处理,得到候选对象的兴趣特征。
接着,信息投放设备将不同的偏好信息所对应的融合特征取平均,使得兴趣特征能够对不同的偏好信息都能够进行表达,从而实现对候选对象的兴趣偏好的完整建模。
示例性的,本申请实施例提供了确定候选对象的兴趣特征的公式,参见式(5):
其中,etj是第j个投放信息特征,cij是第i个偏好信息在第j个投放信息特征上的影响权重,∑jcijetj是第i个偏好信息所对应的融合特征,L是偏好信息的数量(与投放信息特征的数量相同),eu是候选对象的兴趣特征。
需要说明的是,在另一些实施例中,信息投放设备还可以在对融合特征进行平均处理之后,将处理后的特征结合时序权重,得到候选对象的兴趣特征。
本申请实施例中,信息投放设备会通过影响权重将投放信息特征融合在一起,然后再将不同的偏好信息对应的融合特征的均值,确定为兴趣特征,以使得兴趣特征能够表达候选对象在不同的特征维度上的兴趣情况,从而所得到的兴趣特征更加精准。
在本申请的一些实施例中,依据兴趣特征,从候选对象中筛选出目标对象,即S104的具体实现过程,可以包括:S1041-S1042,如下:
S1041、依据兴趣特征,预测出候选对象针对待投放信息的偏好值。
信息投放设备对兴趣特征进行偏好的分析预测,以从兴趣特征中确定出候选对象对于待投放信息是否感兴趣、感兴趣的程度等等,这样,信息投放设备就得到了偏好值。
S1042、利用偏好值,从候选对象中筛选出目标对象。
信息投放设备可以通过对候选对象的偏好值进行排序,将偏好值最大的k个候选对象筛选出来,确定为目标对象,或者是将偏好值与设置好的阈值进行比较,将偏好值大于阈值的候选对象筛选出来,作为目标对象。
需要说明的是,依据偏好值针对待投放信息所筛选出的目标对象,能够保证是对待投放信息的一个或多个特征感兴趣的使用对象。例如,针对图6(图6是本申请实施例提供一种的待投放信息)中的待投放信息6-1,信息投放设备所筛选出的目标对象是对于特征:烟花、拍摄商家中的任意一个或多个感兴趣的使用对象,而针对图7(图7是本申请实施例提供的又一种待投放信息)中待投放信息7-1,信息投放设备所筛选出的目标对象是对特征:网页游戏、限量发放ID中的一个或多个感兴趣的使用对象。这样,才能够保证待投放信息得到较好的投放效果。
本申请实施例中,信息投放设备能够利用兴趣特征,将候选对象中对待投放信息感兴趣的对象筛选出来,作为目标对象。如此,能够使得目标对象都是对待投放信息感兴趣的对象,提升信息投放的准确度,进而提升信息投放所带来的效益。
基于图5,参见图8,图8是本申请实施例提供的信息投放方法的流程示意图四。在本申请的一些实施例中,获取待投放信息的投放信息特征,以及候选对象的历史交互信息所对应的历史信息特征,即S101的具体实现过程,可以包括:S1011-S1013,如下:
S1011、从预设知识图谱中查找出待投放信息的邻居节点。
信息投放设备先从已经构建好的预设知识图谱中确定出待投放信息所对应的节点,然后再查找出节点的邻居节点。可以理解的是,邻居节点可以是待投放信息的一阶邻居节点,也可以是二阶邻居节点。
需要说明的是,邻居节点是待投放信息的辅助信息所对应的节点,从而,信息投放设备查找邻居节点,就是为了明确待投放信息的辅助信息。辅助信息可以是待投放信息的供应商信息,也可以是待投放信息的类别信息,本申请在此不作限定。
S1012、从预设特征表中,筛选出待投放信息对应的特征、邻居节点所对应的特征,以及候选对象的历史交互信息所对应的历史信息特征。
信息投放设备从构建好的预设特征表中,逐个查找待投放信息所对应的特征,邻居节点所对应的特征,以及历史投放信息的特征。需要说明的是,历史交互信息所对应的特征,就是历史信息特征,即历史信息特征中可以仅包括历史投放信息本身的特征,可以不包括历史交互信息的辅助信息所对应的特征。
S1013、将待投放信息对应的特征,以及邻居节点对应的特征,确定为待投放信息的投放信息特征。
信息投放设备将待投放信息对应的特征,以及邻居节点所对应的特征均确定为投放信息特征,这样,所得到的投放信息特征能够从各个角度对待投放信息进行描述。
本申请实施例中,预设知识图谱和预设特征表都是在离线确定好的,信息投放设备在线上预测时能够直接从预设知识图谱中查找出邻居节点,从预设特征表中查找到历史交互信息的历史投放特征,以及待投放信息的投放信息特征,从而,能够加快信息投放时的运算速度。
在本申请的一些实施例中,从预设知识图谱中查找出待投放信息的邻居节点之前,即在S1011之前,该方法还可以包括:S201-S204,如下:
S201、利用从信息库中所筛选出的目标信息,构建出预设知识图谱。
信息投放设备对信息库中的信息进行筛选,得到用于构建知识图谱的目标信息,然后利用目标信息构建出预设知识图谱。需要说明的是,目标信息至少包括信息库中转化次数大于次数阈值的信息,其中,次数阈值可以根据实际情况进行设置,本申请在此不作限定。
可以理解的是,待投放信息可以是目标信息中的任意一个。
S202、针对预设知识图谱中的每个实体节点,从预设知识图谱中采样出对应的节点序列。
信息投放设备可以将任意一个实体节点作为游走起始节点,并按照元路径在预设知识图谱中进行游走,直至游走结束时,将游走时所经过的所有节点连接起来,得到每个实体节点所对应的节点序列。
可以理解的是,元路径就是指定了游走规则的节点类型序列。元路径可以根据实际需求进行设置,本申请在此不作限定。
示例性的,图9是本申请实施例提供的元路径的示意图。当信息利用V表示、二级分类用C表示、一级分类用F表示、标签用T表示、供应商用S表示时,元路径可以为路径9-1(即VCFV)、路径9-2(即VCFCV)、路径9-3(即VCV)、路径9-4(即TVT)、路径9-5(即SVCVS)中的任意一个。
进一步的,在一些实施例中,信息投放设备还可以将每个实体节点的邻居节点进行分类,即在游走时仅在某个特定类型的邻居节点中选择下一个节点以构成节点序列,以保证不同类型的邻居节点所蕴含的不同语义信息都能够被充分利用。
S203、对节点序列进行特征编码,得到每个实体节点所对应的编码特征。
信息投放设备在得到节点序列之后,就会对节点序列进行编码学习,以针对每个实体节点都生成对应的编码特征,以便于后续基于编码特征生成预设特征表。
可以理解的是,信息投放设备可以利用独热(one-hot)编码对节点序列进行特征编码,直接得到编码特征,也可以在独热编码所得到的特征上进一步利用跳字模型(Skip-Gram)进行学习,得到编码特征。
S204、利用每个实体节点所对应的编码特征,整合为预设特征表。
信息投放设备将每个实体节点的编码特征整合到一张特征表中,这样,就得到了预设特征表,以便于后续进行特征查找。
本申请实施例中,信息投放设备可以至少针对信息库中转化次数较大的信息进行知识图谱和特征表的构建,以使得构建出的预设知识图谱中蕴含丰富的知识,以便于后续更加有效地对候选对象进行兴趣建模。
当然,在另一些实施例中,信息投放设备还能够基于图注意力网络对预设知识图谱上的每个节点进行学习,得到每个节点的编码特征。
在本申请的一些实施例中,利用从信息库中所筛选出的目标信息,构建出预设知识图谱,即S201的具体实现过程,可以包括:S2011-S2014,如下:
S2011、针对目标信息进行信息爬取,得到目标信息的描述信息。
信息投放设备以目标信息为线索,在数据库或者是在搜索引擎中进行信息爬取,并将爬取到的信息作为目标信息的描述信息。可以理解的是,描述信息可以是针对目标信息进行解释、归类等的文本段落,也可以是目标信息的类别、供应商的名称等短语,本申请在此不作限定。
S2012、对描述信息进行文本处理,得到辅助信息。
需要说明的是,文本处理至少包括过滤、分词和去重,即信息投放设备对描述文本进行精简和重点抽取,得到辅助信息,从而,辅助信息中可以包括对目标信息的类别、供应商等的精简描述。
S2013、针对辅助信息和目标信息进行关联情况的抽取,得到关联信息。
接着,信息投放设备会针对辅助信息和目标信息进行关联抽取,即明确辅助信息和目标信息之间的关联是什么,将所得到的信息确定为关联信息。当然,信息投放设备还可以针对不同的目标信息,以及不同的辅助信息进行关联抽取,所得到的信息同样可以作为关联信息。
S2014、目标信息和辅助信息作为实体节点,并利用关联信息对实体节点进行连接,得到预设知识图谱。
最后,信息投放设备将目标信息和辅助信息作为知识图谱中的实体节点,并针对关联信息生成相应的连接边,以对不同的实体节点连接起来,这样,就完成了知识图谱的构建,得到了预设知识图谱。
示例性的,图10是本申请实施例提供的预设知识图谱的示意图。参见图10,在预设知识图谱10-1中,信息投放设备针对物品10-1(待投放信息)确定出了标签10-3、二级类别10-4和供应商10-5,针对物品10-2(待投放信息)确定出了标签10-6、标签10-3、供应商10-5和二级类别10-7,而针对二级类别10-4和二级类别10-7确定出了一级类别10-8。接着,信息投放设备利用关联关系将不同的实体节点进行连接,就得到了预设知识图谱。
本申请实施例中,信息投放设备是基于对目标信息的描述信息进行处理,得到预设知识图谱的,而描述信息,特别是类别、供应商等信息,是在目标信息生成之后就很难改变的,从而,所得到的描述信息不会像使用对象与信息之间的交互那样多变,因此,所得到的预设知识图谱也是较为稳定的,通常在很长的时间之后才会需要更新,从而,信息投放设备不必频繁地进行知识图谱的构建,也就减少了信息投放的线下处理所需要的工作量,节省了计算资源。
在本申请的一些实施例中,将目标信息和辅助信息作为实体节点,并利用关联信息对实体节点进行连接,得到预设知识图谱,即S2014的具体实现过程,可以包括:S2014a,如下:
S2014a、将目标信息作为头实体节点,辅助信息作为头实体节点之外的其他实体节点,并利用关联信息对头实体节点和其他实体节点进行连接,得到预设知识图谱。
也就是说,本申请实施例中,信息投放设备所构建的预设知识图谱,是以目标信息为头实体节点的,这样,在针对目标信息进行节点序列采样时,能够取得更长的节点序列,以便于针对目标信息学习到更多的知识。
在本申请的一些实施例中,对节点序列进行特征编码,得到每个实体节点所对应的编码特征,即S203的具体实现过程,可以包括:S2031-S2032,如下:
S2031、将节点序列进行特征映射,得到初始映射特征。
S2032、对初始映射特征进行特征提取,得到每个实体节点的编码特征。
本申请实施例中,信息投放设备先将节点序列映射为初始映射特征,然后再对初始映射特征进一步进行特征抽取,所得到的就是编码特征。
可以理解的是,信息投放设备可以直接将初始映射特征输入到特征编码模型中,提取出编码特征。
进一步的,特征编码模型可以是Skip-Gram模型,该模型的中间层的输出即为编码特征。在训练时,信息投放设备则可以会将中间层所输出的编码特征继续进行概率预测,然后基于预测出的概率计算出损失值,并利用损失值调整该模型的参数。
示例性的,信息投放设备可以将训练数据v输入到Skip-Gram模型中,以利用Skip-Gram模型抽取出训练编码特征,并利用训练编码特征预测出v出现在其上下文ct的概率,计算过程如下:
其中,是上下文ct的特征,Xv是v的特征,θ是Skip-Gram模型的参数,p(ct|v;θ)是计算出的概率。
然后再利用式(7)计算出损失值,以进行反向传播,调整模型的参数。
其中,V是知识图谱中节点的集合,TV是知识图谱中节点类型的集合,是上下文的集合。
本申请实施例中,信息投放设备会针对节点序列进行特征编码,以从节点序列中抽取出目标信息编码特征,以便于后续进行生成预设特征表。
在本申请的一些实施例中,针对辅助信息和目标信息进行关联情况的抽取,得到关联信息,即S2013的具体实现过程,可以包括:S2013a-S2013c,如下:
S2013a、针对辅助信息和目标信息进行关联抽取,得到初步抽取结果,
S2013b、从多个搜索引擎中,筛选出现初步抽取结果的目标引擎。
信息投放设备在多个搜索引擎中,分别搜索辅助信息和目标信息的初步抽取结果,然后将统计出现了初步抽取结果的引擎,将其作为目标引擎。
可以理解的是,多个搜索引擎可以是爬取到描述信息的搜索引擎,也可以是任意的搜索引擎,本申请在此不作限定。
S2013c、当目标引擎在多个搜索引擎的数量占比达到占比阈值时,将初步抽取信息确定为关联信息。
信息投放设备统计出目标引擎的数量,以及多个搜索引擎的总数量,并利用目标引擎的数量比上总数量,计算出目标引擎在多个搜索引擎中的数量占比。然后将数量占比与占比阈值进行比较,当数量占比达到占比阈值时,说明初步抽取结果是可信的,就会将初步抽取结果直接确定为关联信息。
本申请实施例中,信息投放设备会针对从辅助信息和目标信息中所抽取出的关联,即初步抽取结果进行验证,在验证通过后才会将初步抽取结果作为关联信息,从而使得关联信息时可信的,保证基于关联信息所构建的预设知识图谱的准确度。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
本申请实施例是在通过短信投放广告的场景下实现的,即针对广告寻找有意向的人群,针对该人群通过短信发送广告。本申请实施例主要是从使用者(候选对象)安装的手机APP安装列表出发,构建一个轻量级的推荐模型,以对使用者进行多样化、个性化的兴趣进行建模,将特定的广告定期精准的投放给使用者。
图11是本申请实施例提供的广告投放流程框架图。参见图11,该过程主要由构建知识图谱嵌入(KGE)构建11-1和点击率(CTR)预估11-2两部分。其中,知识图谱嵌入构建11-1分为基于APP名称11-11构建知识图谱11-12(预设知识图谱)、筛选元路径模板(元路径)11-13、基于元路径模板随机游走11-14、初始化节点embedding11-15(初始映射特征)和Skip-Gram模型对元路径(节点序列)进行建模11-16。点击率预估11-2包括针对历史点击序列11-21(历史交互信息)和候选信息11-22(待投放信息)查找embedding表(预设特征表)11-23、物品级注意力计算11-24、特征级注意力计算11-25、全连接层计算11-26和分值(偏好值)预测11-27。
基于图11可知,服务器在构建知识图谱嵌入时,分成了以下几个步骤:
第1步:构建头实体(头实体节点)或者尾实体是APP的知识图谱,并筛选元路径模板。
第2步:基于元路径模板随机游走,以实现采样。针对知识图谱G=(V,E,T),其中,V表示顶点集合,E表示边集合,T表示顶点和边的类型集合。假设元路径模板为那么第i步概率转移的计算公式分为以下三种情况:
1)当vi+1和两节点之间有边,且vi+1节点的类型属于元路径定义的下一个类型Vt+1,则第i步概率转移的计算公式如式(8)所示:
其中,表示/>的邻居节点中属于Vt+1类型的节点集合,/>为元路径模板。
2)当vi+1和两节点之间有边,且节点vi+1的类型不属于元路径模板定义的下一个类型Vt+1时,则第i步概率转移的计算公式如式(9)所示:
3)当vi+1和两节点之间没有边时,则第i步概率转移的计算公式也如式(9)所示。
服务器基于该公式进行随机游走,就能够从知识图谱中采样到由节点v触发长度为l的元路径(节点序列)。
第3步:初始化节点embedding,得到一张初始化的embedding表X∈R|V|×D,将知识图谱上的所有节点映射成向量空间中的向量(初始映射特征),例如Xv∈RD,其中,D为向量的维度。
第4步:Skip-Gram模型对元路径进行建模。在训练时,归一化(例如Softmax)模型需要对不同的类型邻居节点的上下文ct进行归一化,即预测节点v出现在ct的概率,计算公式可如式(6)所示,然后再将计算出的概率输入至式(7),计算出损失值,再利用损失值反向传播调整Softmax模型和Skip-Gram模型的参数进行调整.
进一步的,考虑在异构图中,不同类型的邻居节点具有不同的语义,服务器会对不同类型的节点分开采样。因此,训练时也不需要对知识图谱的所有节点进行采样,只需要对中心节点v采样M个负样本,从而对于节点v,最终的损失函数如式(10)所示:
其中,Pt(ut)表示节点类型为t的负样本的预定义分布。
第5步:将建模到的所有节点的embedding保存为一张表(预设特征表),用于后续的投放任务。
点击率预估主要是基于使用者u的历史访问序列Tu=[v1,v2,v3,…,vk]和候选物品t,预测使用者u对候选物品t的交互概率图12是本申请实施例提供的计算交互概率时特征的变化示意图。结合图12可见,该过程主要包括以下几个步骤:
第1步:查找embedding表,即针对历史访问序列Tu=[v1,v2,v3,…,vk](包含了多个历史交互信息)分别查询出embedding,以及针对候选物品t(待投放信息)查询对应的embedding,从而分别得到(包含了多个历史信息特征)和/>(包含了多个投放信息特征)。其中,k为历史访问序列中的物品的数量,L为候选物品的特征的数量,d为embedding的维度。此处,为了充分利用候选物品的信息,将其在知识图谱中的所有一阶邻居节点(待投放信息的邻居节点)作为候选物品的辅助信息,即将一阶邻居节点的embedding和候选物品本身的embedding,共同得到
第2步:物品级注意力计算,即计算历史访问物品和候选物品的相关性,以便于在建模兴趣时分配权重。例如,当使用者的历史访问序列为[剑侠游戏、仙侠电视剧、XX浏览器和XX证券]时,那么古风手游会更符合使用者的兴趣,从而剑侠游戏和仙侠电视剧在建模使用者的兴趣时就应该有更大的权重。
物品级注意力计算的公式可以如式(11)所示:
其中,是/>的转置,/>是一张注意力得分表,其每一个行向量/>都代表使用者的历史访问物品在候选物品上的权重分布,单个的权重(特征相关度)的计算方式即为式(3)所示。
之后,服务器对每一个权重分布(偏好信息)和对应的历史访问序列的embedding进行加权求和,得到使用者关于候选物品的各个特征的偏好bi∈Rd。bi的计算公式可如式(2)所示。
第3步:特征级注意力计算,以实现对使用者的兴趣的建模。候选物品推荐给使用者时,不同的特征会占据不同的重要性。例如某个使用者对二次元类的游戏感兴趣时,其历史安装序列也大多为二次元的游戏,此时,向其推荐卡通元素的游戏,比推荐格斗类型的游戏更容易吸引使用者点击,因此,需要对利用权重分布来进一步计算使用者针对物品的注意力。计算过程如式(12)所示:
其中,由物品级的注意力计算得到,/>是一张注意力得分表,每一行对象的向量/>代表使用者的偏好在候选物品的第i个特征维度上的权重分布,单个权重(影响权重)可由式(4)进行计算。
最后,加权求和,得到使用者的兴趣的embedding(兴趣特征)。该过程可由式(5)来实现。
第4步:通过全连接层计算和分值预测筛选意向人群(目标对象),在得到一个能够代表使用者多样化、个性化的兴趣之后,服务器会使用分类器来计算得到使用者对候选物品的偏好值,偏好值的取值范围为[0,1],计算公式如式(13)所示:
其中,W和b均为sigmoid的参数,是偏好值。
接下来,针对知识图谱的构建过程进行说明。图13是本申请实施例提供的知识图谱的构建过程示意图,参见图13,该过程包括:
S301、过滤安装次数小于5次的APP(目标信息),即过滤出安装次数过低的APP。
S302、以APP名称为关键字爬取描述信息。服务器可以是在多个不同的搜索引擎上爬取描述信息,例如从搜索引擎1搜索到的中文描述,从搜索引擎2搜索到的中文描述,从知识图谱引擎搜索到的关系。
S303、中文处理(过滤、分词、去重)。进行中文处理是为了后续能够顺利进行关系抽取。
S304、关系抽取。此时,服务器会认定可信评分大于阈值的关系,以及出现在两个以上的(目标引擎在多个搜索引擎的数量展示达到占比阈值)关系是可靠的,这些关系主要包括:类别、标签、供应商等等。
S305、构建三元组表示的知识图谱。
在得到知识图谱之后,就可以确定元路径模板,基于元路径模板随机游走,采样得到具有特定关系的元路径,采样Skip-Gram算法对元路径进行建模,得到节点的embedding,将所有节点的embedding持久化存储为一张表,以供下游任务查表获得embedding向量。
本申请实施例中,点击率预估可由预估模型实现。在训练预估模型时,服务器会针对给定的种子样本,在所有使用者中按照1:3的比例采样得到负样本,从而构造完整的样本集,即其输入到需要训练的模型中,同时使用整体分布随机初始化模型参数,并使用交叉熵损失函数的有监督学习方式训练网络参数,并采用Adam算法更新参数,迭代多次直至模型收敛,保存最终的模型,以进行线下得应用阶段使用。
在应用阶段,首先将所有使用者(候选对象)的历史点击序列和候选物品输入进训练好的预估模型,以通过预估模型计算每个使用者和候选物品的得分,并从高向低排序。
接着,服务器可以按照经验判断和在线测试选取一个固定的分值,将大于等于该分值的使用者(目标对象)筛选出来,得到一个人群包进行投放;或者是将得分排序靠前,比如前500w的使用者(目标对象)筛选出来,生成一个人群包进行投放。
接下来,对本申请实施例提供的广告投放的效果进行说明。
示例性的,表1示出了本申请实施例提供广告投放方法和相关技术中的广告投放方法的AUC提升对比,其中,词向量生成模型为对比时的基线。
表1
方案名称 | AUC提升 |
词向量生成模型(Word2Vec) | - |
通过KGE对嵌入表达增强 | 0.13% |
深度兴趣网络(DIN) | 0.17% |
本申请实施例 | 0.25% |
可见,本申请实施例的广告投放方法的AUC提升幅度,均高于相关技术中的基于词向量生成模型、通过KGE对嵌入表示进行增强和深度兴趣网络进行广告投放时的AUC提升。从而,本申请实施例相比相关技术,广告投放的效果更好。
表2示出了本申请实施例提供广告投放方法和相关技术中的广告投放方法的CPA降低对比。其中,词向量生成模型为对比时的基线。
表2
方案名称 | CPA降低 |
词向量生成模型(Word2Vec) | - |
通过KGE对嵌入表达增强 | 2.51% |
深度兴趣网络(DIN) | 2.18% |
本申请实施例 | 3.89% |
可见,本申请实施例的广告投放方法的CPA降低的幅度,均大于相关技术中的基于词向量生成模型、通过KGE对嵌入表示进行增强和深度兴趣网络进行广告投放时的CPA降低的幅度。从而,本申请实施例与相关技术相比,更能节省投放成本。
可以理解的是,在本申请实施例中,涉及到使用者的历史点击序列、历史交互信息等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得使用者,即用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
下面继续说明本申请实施例提供的信息投放装置255的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器250的信息投放装置255中的软件模块可以包括:
信息获取模块2551,用于获取待投放信息的投放信息特征,以及候选对象的历史交互信息所对应的历史信息特征;
信息挖掘模块2552,用于通过对所述投放信息特征和所述历史信息特征进行相关性挖掘,确定出所述候选对象针对所述投放信息特征的偏好信息;
特征构建模块2553,用于基于所述偏好信息和所述投放信息特征,构建出所述候选对象的兴趣特征;所述兴趣特征描述了所述候选对象对于所述待投放信息和所述投放信息特征的兴趣;
对象筛选模块2554,用于依据所述兴趣特征,从所述候选对象中筛选出目标对象;
信息发送模块2555,用于将所述待投放信息发送给所述目标对象。
在本申请的一些实施例中,所述信息挖掘模块2552,还用于针对所述投放信息特征和所述历史信息特征进行相关性挖掘,得到特征相关度;所述特征相关度表征了所述历史交互信息对于所述偏好信息的影响;基于所述特征相关度对所述历史信息特征进行融合,得到所述候选对象针对所述投放信息特征的所述偏好信息。
在本申请的一些实施例中,所述信息挖掘模块2552,还用于对所述投放信息特征与所述历史信息特征进行内积处理,得到特征内积结果;将所述特征内积结果进行归一化处理,得到所述特征相关度。
在本申请的一些实施例中,所述特征构建模块2553,还用于对所述偏好信息和所述投放信息特征进行相关性挖掘,得到所述偏好信息在所述投放信息特征上的影响权重;基于所述影响权重和所述投放信息特征,确定出所述候选对象的所述兴趣特征。
在本申请的一些实施例中,所述特征构建模块2553,还用于利用所述影响权重,对所述投放信息特征进行加权融合,得到所述偏好信息所对应的融合特征;针对所述偏好信息对应的融合特征进行平均处理,得到所述候选对象的所述兴趣特征。
在本申请的一些实施例中,所述对象筛选模块2554,还用于依据所述兴趣特征,预测出所述候选对象针对所述待投放信息的偏好值;利用所述偏好值,从所述候选对象中筛选出所述目标对象。
在本申请的一些实施例中,所述信息获取模块2551,还用于从预设知识图谱中查找出所述待投放信息的邻居节点;其中,所述邻居节点是所述待投放信息的辅助信息所对应的节点;从预设特征表中,筛选出所述待投放信息对应的特征、所述邻居节点所对应的特征,以及所述候选对象的所述历史交互信息所对应的历史信息特征;将所述待投放信息对应的特征,以及所述邻居节点对应的特征,确定为所述待投放信息的所述投放信息特征。
在本申请的一些实施例中,所述信息投放装置255还包括:特征整合模块2556;所述特征整合模块2556,用于利用从信息库中所筛选出的目标信息,构建出预设知识图谱;所述目标信息至少包括所述信息库中转化次数大于次数阈值的信息;针对所述预设知识图谱中的每个实体节点,从所述预设知识图谱中采样出对应的节点序列;对所述节点序列进行特征编码,得到每个所述实体节点所对应的编码特征;利用每个所述实体节点所对应的编码特征,整合为所述预设特征表。
在本申请的一些实施例中,所述特征整合模块2556,还用于针对所述目标信息进行信息爬取,得到所述目标信息的描述信息;对所述描述信息进行文本处理,得到辅助信息;其中,所述文本处理至少包括过滤、分词和去重;针对所述辅助信息和所述目标信息进行关联情况的抽取,得到关联信息;将所述目标信息和所述辅助信息作为实体节点,并利用所述关联信息对所述实体节点进行连接,得到所述预设知识图谱。
在本申请的一些实施例中,所述特征整合模块2556,还用于将所述目标信息作为头实体节点,所述辅助信息作为头实体节点之外的其他实体节点,并利用所述关联信息对所述头实体节点和所述其他实体节点进行连接,得到所述预设知识图谱。
在本申请的一些实施例中,所述特征整合模块2556,还用于将所述节点序列进行特征映射,得到初始映射特征;对所述初始映射特征进行特征提取,得到每个所述实体节点的所述编码特征。
在本申请的一些实施例中,所述特征整合模块2556,还用于针对所述辅助信息和所述目标信息进行关联抽取,得到初步抽取结果;从多个搜索引擎中,筛选出现所述初步抽取结果的目标引擎;当所述目标引擎在多个所述搜索引擎的数量占比达到占比阈值时,将所述初步抽取结果确定为所述关联信息。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的信息投放方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的信息投放方法,例如,如图3示出的信息投放方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备(信息投放设备)上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
综上所述,通过本申请实施例,信息投放设备能够先基于对投放信息特征和历史信息特征进行相关性挖掘,确定出候选对象对于投放信息特征,即待投放信息的特征维度上的偏好情况,以在更细粒度上区分候选的使用对象的喜好,基于确定出的偏好情况和投放信息特征,实现在细粒度上对该使用对象的个性化兴趣的建模,得到更加准确的该使用对象兴趣特征,最后基于兴趣特征,能够精准地筛选出对待投放信息感兴趣的投放对象,最终提高了信息投放的准确度;所得到的预设知识图谱较为稳定的,通常在很长的时间之后才会需要更新,从而,信息投放设备不必频繁地进行知识图谱的构建,也就减少了信息投放的线下处理时所需要的工作量,劫争了计算资源。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (16)
1.一种信息投放方法,其特征在于,所述信息投放方法包括:
获取待投放信息的投放信息特征,以及候选对象的历史交互信息所对应的历史信息特征;
通过对所述投放信息特征和所述历史信息特征进行相关性挖掘,确定出所述候选对象针对所述投放信息特征的偏好信息;
基于所述偏好信息和所述投放信息特征,构建出所述候选对象的兴趣特征;所述兴趣特征描述了所述候选对象对于所述待投放信息和所述投放信息特征的兴趣;
依据所述兴趣特征,从所述候选对象中筛选出目标对象,并将所述待投放信息发送给所述目标对象。
2.根据权利要求1所述的方法,其特征在于,所述通过对所述投放信息特征和所述历史信息特征进行相关性挖掘,确定出所述候选对象针对所述投放信息特征的偏好信息,包括:
针对所述投放信息特征和所述历史信息特征进行相关性挖掘,得到特征相关度;所述特征相关度表征了所述历史交互信息对于所述偏好信息的影响;
基于所述特征相关度对所述历史信息特征进行融合,得到所述候选对象针对所述投放信息特征的所述偏好信息。
3.根据权利要求2所述的方法,其特征在于,所述针对所述投放信息特征和所述历史信息特征进行相关性挖掘,得到特征相关度,包括:
对所述投放信息特征与所述历史信息特征进行内积处理,得到特征内积结果;
将所述特征内积结果进行归一化处理,得到所述特征相关度。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述基于所述偏好信息和所述投放信息特征,构建出所述候选对象的兴趣特征,包括:
对所述偏好信息和所述投放信息特征进行相关性挖掘,得到所述偏好信息在所述投放信息特征上的影响权重;
基于所述影响权重和所述投放信息特征,确定出所述候选对象的所述兴趣特征。
5.根据权利要求4所述的方法,其特征在于,所述基于所述影响权重和所述投放信息特征,确定出所述候选对象的所述兴趣特征,包括:
利用所述影响权重,对所述投放信息特征进行加权融合,得到所述偏好信息所对应的融合特征;
针对所述偏好信息对应的融合特征进行平均处理,得到所述候选对象的所述兴趣特征。
6.根据权利要求1至3任一项所述的方法,其特征在于,所述依据所述兴趣特征,从所述候选对象中筛选出目标对象,包括:
依据所述兴趣特征,预测出所述候选对象针对所述待投放信息的偏好值;
利用所述偏好值,从所述候选对象中筛选出所述目标对象。
7.根据权利要求1至3任一项所述的方法,其特征在于,所述获取待投放信息的投放信息特征,以及候选对象的历史交互信息所对应的历史信息特征,包括:
从预设知识图谱中查找出所述待投放信息的邻居节点;其中,所述邻居节点是所述待投放信息的辅助信息所对应的节点;
从预设特征表中,筛选出所述待投放信息对应的特征、所述邻居节点所对应的特征,以及所述候选对象的所述历史交互信息所对应的历史信息特征;
将所述待投放信息对应的特征,以及所述邻居节点对应的特征,确定为所述待投放信息的所述投放信息特征。
8.根据权利要求7所述的方法,其特征在于,所述从预设知识图谱中查找出所述待投放信息的邻居节点之前,所述方法还包括:
利用从信息库中所筛选出的目标信息,构建出预设知识图谱;所述目标信息至少包括所述信息库中转化次数大于次数阈值的信息;
针对所述预设知识图谱中的每个实体节点,从所述预设知识图谱中采样出对应的节点序列;
对所述节点序列进行特征编码,得到每个所述实体节点所对应的编码特征;
利用每个所述实体节点所对应的编码特征,整合为所述预设特征表。
9.根据权利要求8所述的方法,其特征在于,所述利用从信息库中所筛选出的目标信息,构建出预设知识图谱,包括:
针对所述目标信息进行信息爬取,得到所述目标信息的描述信息;
对所述描述信息进行文本处理,得到辅助信息;其中,所述文本处理至少包括过滤、分词和去重;
针对所述辅助信息和所述目标信息进行关联情况的抽取,得到关联信息;
将所述目标信息和所述辅助信息作为实体节点,并利用所述关联信息对所述实体节点进行连接,得到所述预设知识图谱。
10.根据权利要求9所述的方法,其特征在于,所述将所述目标信息和所述辅助信息作为实体节点,并利用所述关联信息对所述实体节点进行连接,得到所述预设知识图谱,包括:
将所述目标信息作为头实体节点,所述辅助信息作为头实体节点之外的其他实体节点,并利用所述关联信息对所述头实体节点和所述其他实体节点进行连接,得到所述预设知识图谱。
11.根据权利要求8所述的方法,其特征在于,所述对所述节点序列进行特征编码,得到每个所述实体节点所对应的编码特征,包括:
将所述节点序列进行特征映射,得到初始映射特征;
对所述初始映射特征进行特征提取,得到每个所述实体节点的所述编码特征。
12.根据权利要求9所述的方法,其特征在于,所述针对所述辅助信息和所述目标信息进行关联情况的抽取,得到关联信息,包括:
针对所述辅助信息和所述目标信息进行关联抽取,得到初步抽取结果;
从多个搜索引擎中,筛选出现所述初步抽取结果的目标引擎;
当所述目标引擎在多个所述搜索引擎的数量占比达到占比阈值时,将所述初步抽取结果确定为所述关联信息。
13.一种信息投放装置,其特征在于,所述信息投放装置包括:
信息获取模块,用于获取待投放信息的投放信息特征,以及候选对象的历史交互信息所对应的历史信息特征;
信息挖掘模块,用于通过对所述投放信息特征和所述历史信息特征进行相关性挖掘,确定出所述候选对象针对所述投放信息特征的偏好信息;
特征构建模块,用于基于所述偏好信息和所述投放信息特征,构建出所述候选对象的兴趣特征;所述兴趣特征描述了所述候选对象对于所述待投放信息和所述投放信息特征的兴趣;
对象筛选模块,用于依据所述兴趣特征,从所述候选对象中筛选出目标对象;
信息发送模块,用于将所述待投放信息发送给所述目标对象。
14.一种信息投放设备,其特征在于,所述信息投放设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至12任一项所述的信息投放方法。
15.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至12任一项所述的信息投放方法。
16.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现权利要求1至12任一项所述的信息投放方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210032292.1A CN116484085A (zh) | 2022-01-12 | 2022-01-12 | 一种信息投放方法、装置、设备及存储介质、程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210032292.1A CN116484085A (zh) | 2022-01-12 | 2022-01-12 | 一种信息投放方法、装置、设备及存储介质、程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116484085A true CN116484085A (zh) | 2023-07-25 |
Family
ID=87221836
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210032292.1A Pending CN116484085A (zh) | 2022-01-12 | 2022-01-12 | 一种信息投放方法、装置、设备及存储介质、程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116484085A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116955835A (zh) * | 2023-09-21 | 2023-10-27 | 腾讯科技(深圳)有限公司 | 资源筛选方法、装置、计算机设备及存储介质 |
-
2022
- 2022-01-12 CN CN202210032292.1A patent/CN116484085A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116955835A (zh) * | 2023-09-21 | 2023-10-27 | 腾讯科技(深圳)有限公司 | 资源筛选方法、装置、计算机设备及存储介质 |
CN116955835B (zh) * | 2023-09-21 | 2023-12-22 | 腾讯科技(深圳)有限公司 | 资源筛选方法、装置、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111444428B (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
Kulkarni et al. | Context Aware Recommendation Systems: A review of the state of the art techniques | |
CN112632385B (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN111966914B (zh) | 基于人工智能的内容推荐方法、装置和计算机设备 | |
CN110032632A (zh) | 基于文本相似度的智能客服问答方法、装置及存储介质 | |
US20160170982A1 (en) | Method and System for Joint Representations of Related Concepts | |
CN112163165A (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
CN109471978B (zh) | 一种电子资源推荐方法及装置 | |
WO2021155691A1 (zh) | 用户画像生成方法、装置、存储介质及设备 | |
CN113254711B (zh) | 一种互动图像的显示方法、装置、计算机设备和存储介质 | |
CN111831924A (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
CN115222433A (zh) | 一种信息推荐方法、装置及存储介质 | |
CN115659008A (zh) | 大数据信息反馈的信息推送系统、方法、电子设备及介质 | |
Liu et al. | High-quality domain expert finding method in CQA based on multi-granularity semantic analysis and interest drift | |
CN116955591A (zh) | 用于内容推荐的推荐语生成方法、相关装置和介质 | |
CN116452263A (zh) | 一种信息推荐方法、装置、设备及存储介质、程序产品 | |
Wang et al. | Link prediction in heterogeneous collaboration networks | |
Tu et al. | Bidirectional sensing of user preferences and application changes for dynamic mobile app recommendations | |
Wei et al. | Online education recommendation model based on user behavior data analysis | |
Clarizia et al. | A sentiment analysis approach for evaluation of events in field of cultural heritage | |
CN116484085A (zh) | 一种信息投放方法、装置、设备及存储介质、程序产品 | |
CN114817692A (zh) | 确定推荐对象的方法、装置和设备及计算机存储介质 | |
CN112712056A (zh) | 视频语义分析方法、装置、存储介质及电子设备 | |
CN117132323A (zh) | 推荐内容的分析方法、装置、设备、介质及程序产品 | |
Li et al. | Recommender Systems: Frontiers and Practices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40090788 Country of ref document: HK |