CN111177569A - 基于人工智能的推荐处理方法、装置及设备 - Google Patents
基于人工智能的推荐处理方法、装置及设备 Download PDFInfo
- Publication number
- CN111177569A CN111177569A CN202010015140.1A CN202010015140A CN111177569A CN 111177569 A CN111177569 A CN 111177569A CN 202010015140 A CN202010015140 A CN 202010015140A CN 111177569 A CN111177569 A CN 111177569A
- Authority
- CN
- China
- Prior art keywords
- word
- recommended
- label
- words
- article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于人工智能的推荐处理方法、装置、设备及存储介质;方法包括:获取待推荐对象的对象特征,并获取对应所述待推荐对象的文章中的标签词的标签词特征;基于对应所述待推荐对象的对象特征和对应所述文章的标签词特征,确定所述标签词与所述待推荐对象的相关度;当所述相关度大于相关度阈值时,确定所述标签词与所述待推荐对象具有关联关系;将与所述待推荐对象具有关联关系的标签词,确定为与所述待推荐对象具有关联关系的用户账号的用户标签;基于所述用户账号的用户标签,执行对应所述用户账号的推荐操作,通过本发明,能够自动获得用户账号的用户标签,以进行针对性推荐。
Description
技术领域
本发明涉及人工智能技术,尤其涉及一种基于人工智能的推荐处理方法、装置、设备及存储介质。
背景技术
人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。
随着互联网技术的发展,为了实现准确的商家推送,需要对商家等待推荐对象进行打标签处理,以获得和商家相关性较强的标签,相关技术中主要通过人工特征设计来确定商家的标签,而基于人工特征设计得到的标签无法准确表示出商家的特征。
发明内容
本发明实施例提供一种基于人工智能的推荐处理方法、装置及存储介质,能够自动获得用户账号的用户标签,以进行针对性推荐。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种基于人工智能的推荐处理方法,包括:
获取待推荐对象的对象特征,并获取对应所述待推荐对象的文章中的标签词的标签词特征;
基于对应所述待推荐对象的对象特征和对应所述文章的标签词特征,确定所述标签词与所述待推荐对象的相关度;
当所述相关度大于相关度阈值时,确定所述标签词与所述待推荐对象具有关联关系;
将与所述待推荐对象具有关联关系的标签词,确定为与所述待推荐对象具有关联关系的用户账号的用户标签;
基于所述用户账号的用户标签,执行对应所述用户账号的推荐操作。
本发明实施例提供一种基于人工智能的推荐处理装置,包括:
特征获取模块,用于获取待推荐对象的对象特征,并获取对应所述待推荐对象的文章中的标签词的标签词特征;
相关度确定模块,用于基于对应所述待推荐对象的对象特征和对应所述文章的标签词特征,确定所述标签词与所述待推荐对象的相关度;
关联关系确定模块,用于当所述相关度大于相关度阈值时,确定所述标签词与所述待推荐对象具有关联关系;
用户标签确定模块,用于将与所述待推荐对象具有关联关系的标签词,确定为与所述待推荐对象具有关联关系的用户账号的用户标签;
推荐操作执行模块,用于基于所述用户账号的用户标签,执行对应所述用户账号的推荐操作。
在上述方案中,所述特征获取模块,还用于:
获取对应所述待推荐对象中各个字的字特征,以及对应所述文章中各个字的字特征;
对所述待推荐对象中各个字的字特征和所述文章中各个字的字特征进行基于注意力机制的字合成处理,得到对应所述待推荐对象的对象特征以及对应所述文章中的多个词的词特征;
从对应所述文章中的多个词的词特征中提取出对应所述文章中的标签词的标签词特征。
在上述方案中,所述特征获取模块,还用于:
对所述待推荐对象进行分字处理,得到表征各个字的语义的字嵌入向量;
获取对应所述待推荐对象的各个字的分割嵌入向量以及位置嵌入向量;
对对应所述待推荐对象的各个字的字嵌入向量、分割嵌入向量以及位置嵌入向量进行求和处理,得到对应所述待推荐对象中各个字的输入特征。
在上述方案中,所述特征获取模块,还用于:
对对应所述待推荐对象中各个字的输入特征进行上下文信息分析处理,得到对应各个字的用于表征上下文信息的特征向量;
对所述特征向量进行语序信息分析处理,得到对应所述待推荐对象中各个字的用于表征上下文信息和语序信息的字特征。
在上述方案中,所述特征获取模块,还用于:
对所述文章进行分字处理,得到表征各个字的语义的字嵌入向量;
获取对应所述文章的各个字的分割嵌入向量以及位置嵌入向量;
对对应所述文章的各个字的字嵌入向量、分割嵌入向量以及位置嵌入向量进行求和处理,得到对应所述文章中各个字的输入特征。
在上述方案中,所述特征获取模块,还用于:
对对应所述文章中各个字的输入特征进行上下文信息分析处理,得到对应各个字的用于表征上下文信息的特征向量;
对所述特征向量进行语序信息分析处理,得到对应所述文章中各个字的用于表征上下文信息和语序信息的字特征。
在上述方案中,所述特征获取模块,还用于:
基于注意力机制确定所述待推荐对象中各个字的字特征的注意力权重、以及所述文章中各个字的字特征的注意力权重;
结合所述待推荐对象中各个字的字特征的注意力权重和所述待推荐对象中各个字的字特征,进行特征加权合成处理,得到对应所述待推荐对象的对象特征;
结合所述文章中各个字的字特征的注意力权重,以及所述文章中各个字的字特征,进行特征加权合成处理,得到对应所述文章中的多个词的词特征。
在上述方案中,所述相关度确定模块,还用于:
确定所述待推荐对象和各个标签词特征之间的相似度,并将对应每个标签词确定的相似度进行组合得到相似度矩阵;
对所述相似度矩阵逐行进行最大似然处理,得到对应所述标签词特征的注意力权重;
结合对应所述标签词特征的注意力权重以及所述标签词特征,确定对应所述标签词且耦合所述待推荐对象的输出特征;
其中,所述输出特征表征有所述待推荐对象和所述标签词的耦合关系;
基于所述输出特征,确定各个标签词与所述待推荐对象的相关度。
在上述方案中,所述基于人工智能的推荐处理装置还包括:
训练模块,用于:
基于待推荐对象集合、文章集合和标签词集合,构建由标签词集合以及具有关联关系的待推荐对象和文章组成的训练样本集合;
其中,所述训练样本集合中的待推荐对象和文章一一对应,所述标签词集合中标签词的类型包括:与所述待推荐对象具有关联关系的正样本标签词,与所述待推荐对象不具有关联关系的负样本标签词;
基于词特征提取模型以及注意力权重矩阵,构建标签处理模型;
基于所述训练样本集合,训练所述标签处理模型。
在上述方案中,所述训练模块,还用于:
初始化所述标签处理模型以及损失函数;
在所述标签处理模型每次迭代训练过程中执行以下处理:
将所述训练样本集合包括的所有具有关联关系的待推荐对象、文章作为输入样本,
通过所述标签处理模型为所述输入样本进行标签匹配处理,得到所述标签集合中各个标签词的相关度;
将所述正样本标签词的相关度和所述负样本标签词的相关度代入所述损失函数,以确定所述损失函数取得最小值时对应的标签处理模型参数;
根据所确定的标签处理模型参数更新所述标签处理模型。
在上述方案中,所述关联关系确定模块,还用于:
对确定与所述待推荐对象具有关联关系的标签词和所述待推荐对象进行关联处理,得到表征所述待推荐对象与所述标签词之间具有关联关系的第一映射;
结合所述第一映射以及所述用户账号与所述待推荐对象之间的关联关系,对所述标签词和所述用户账号进行关联处理,得到表征所述用户账号与所述标签词之间具有关联关系的第二映射;
基于所述第二映射,将所述标签词确定为所述用户账号的用户标签。
在上述方案中,所述推荐操作执行模块,还用于:
获取对应所述用户账号的所有用户标签;
基于所述用户标签与所述用户账号发生关联的时间戳,对所获取的用户标签进行时间维度的优先级排序,得到对应所述用户标签的优先级排序结果;
确定分别对应所获取的用户标签的待推荐对象,并按照对应所述优先级排序结果的推送策略,将所确定的待推荐对象按照推送策略推送至所述用户账号。
在上述方案中,所述基于人工智能的推荐处理装置还包括:
区块链管理模块,用于:
通过区块链网络中的节点,接收待推荐对象管理平台提交的包括待推荐对象的标签词的交易,将所述交易打包为新区块;
根据所述新区块中交易携带的所述待推荐对象管理平台的数字签名和数字证书,对所述新区块中的交易进行共识验证;
当共识验证通过时,将所述新区块添加到所述节点中用于存储所述标签词的区块链的尾部,并通过所述新区块中的标签词更新所述节点中的状态数据库。
本发明实施例提供一种基于人工智能的推荐处理设备,包括
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本发明实施例提供的基于人工智能的推荐处理方法。
本发明实施例提供一种存储介质,存储有可执行指令,用于引起处理器执行时,实现本发明实施例提供的基于人工智能的推荐处理方法。
本发明实施例具有以下有益效果:
通过本发明实施例提供的基于人工智能的推荐处理方法,能够自动学习出从待推荐对象到标签词的语义关系,从而将待推荐对象的标签词传递到用户账号,以针对用户账号进行有针对性的推荐。
附图说明
图1是相关技术中实现标签词与待推荐对象的相关度确定方法的架构图;
图2是本发明实施例提供的基于人工智能的推荐处理系统架构的一个可选的结构示意图;
图3是本发明实施例提供的推荐操作执行模块的结构示意图;
图4是本发明实施例提供的应用基于人工智能的推荐处理方法的服务器的一个可选的结构示意图;
图5是本发明实施例提供的基于人工智能的推荐处理方法的一个可选的流程示意图;
图6A-6D是本发明实施例提供的基于人工智能的推荐处理方法的一个可选的流程示意图;
图7是本发明实施例提供的基于人工智能的推荐处理方法的应用示意图;
图8是本发明实施例提供的基于人工智能的推荐处理方法的标签处理模型结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)待推荐对象:这里的待推荐对象指的是需要被推荐的对象,例如需要被推荐的餐厅,需要被推荐的服饰、需要被推荐的书籍等等。
2)注意力机制:源于对人类视觉的研究,在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息,注意力机制主要有两个方面:决定需要关注输入的哪部分以及分配有限的信息处理资源给重要的部分。
3)交易(Transaction),等同于计算机术语“事务”,交易包括了需要提交到区块链网络执行的操作,并非单指商业语境中的交易,鉴于在区块链技术中约定俗成地使用了“交易”这一术语,本发明实施例遵循了这一习惯。
例如,部署(Deploy)交易用于向区块链网络中的节点安装指定的智能合约并准备好被调用;调用(Invoke)交易用于通过调用智能合约在区块链中追加交易的记录,并对区块链的状态数据库进行操作,包括更新操作(包括增加、删除和修改状态数据库中的键值对)和查询操作(即查询状态数据库中的键值对)。
4)区块链(Blockchain),是由区块(Block)形成的加密的、链式的交易的存储结构。
5)区块链网络(Blockchain Network),通过共识的方式将新区块纳入区块链的一系列的节点的集合。
6)账本(Ledger),是区块链(也称为账本数据)和与区块链同步的状态数据库的统称。其中,区块链是以文件系统中的文件的形式来记录交易;状态数据库是以不同类型的键(Key)值(Value)对的形式来记录区块链中的交易,用于支持对区块链中交易的快速查询。
7)共识(Consensus),是区块链网络中的一个过程,用于在涉及的多个节点之间对区块中的交易达成一致,达成一致的区块将被追加到区块链的尾部,实现共识的机制包括工作量证明(PoW,Proof of Work)、权益证明(PoS,Proof of Stake)、股份授权证明(DPoS,Delegated Proof-of-Stake)、消逝时间量证明(PoET,Proof of Elapsed Time)等。
相关技术中的标签词与待推荐对象的相关性的确定方法主要基于人工特征设计和分类器,参见图1,图1是相关技术中实现标签词与待推荐对象的相关度确定方法的架构图;对待推荐对象和标签词在文章的特征进行分析发现如下特征,这里的待推荐对象为商家进行说明:文档相关性特征,文档相关性特征指商家核心词在文章中的出现次数,这里的核心词可以是商家的品牌,段落相关性特征,这里的段落相关性特征指的是段落中候选标签词的命中次数以及商家核心词与段落基于最佳匹配(BM,Best Matching)算法得到的分数,标签特征,这里的标签特征是标签词到商家名称的最小距离,表征标签词和商家核心词的语义相似度,然后使用机器学习分类器,如梯度提升决策树或者随机森林对数据进行学习,以预测标签词和商家的相关性。基于人工特征设计的方法有以下缺点:首先,其所获取的特征是离散的,且只能提取有限的离散特征,基本上依赖于手工特征工程,其次,浅层模型无法捕捉复杂的语义信息,最后,浅层模型的容量小,随着数据量的提升,浅层模型的效果难以提升,处于欠拟合状态。由于存在上述缺点,导致所得到的标签词与商家的相关度较低,使得无法实现标签词与用户账号之间的精准传递,从而无法实现有效的精确推荐,基于此,本发明实施例提出了一种基于人工智能的推荐处理方法。
在深度学习里,机器阅读理解任务主要是指让机器根据给定的文本回答与文本相关的问题,以此来衡量机器对自然语言的理解能力,机器阅读理解的片段抽取任务是指给定文章C(其中包含n个词)和问题Q,片段抽取任务通过最大化条件概率P(答案|C,Q)来从文章中抽取连续的子序列作为问题的正确答案。将其思想借鉴到标签相关性计算中,给定文章C和商家M,通过模型最大化概率P(标签|C,M)来计算文章中出现的标签与商家的相关性,其准确率优于传统方法,有效提升计算效果,可应用于篇章理解、关键词抽取、标签计算等场景,其支持直接将输入映射到输出的端到端模式,在本发明实施例提出的一种基于人工智能的推荐处理方法中,在机器阅读理解模型基础上进行改进和优化,由于深度学习具有良好的泛化能力,能够自动学习出从商家到标签词的语义关系,并且基于上下文信息给出合理的相关度推断,提高了相关度准确率,从而提高了相关标签准确率,从而实现了标签词与用户账号之间的精准传递,从而实现有效的精确推荐。
本发明实施例提供一种基于人工智能的推荐处理方法、装置、设备和存储介质,能够解决上述无法获得待推荐对象的准确标签词,以导致无法实现用户账号与标签词的精准传递,从而无法实现有效的精确推荐的技术问题,下面说明本发明实施例提供的基于人工智能的推荐处理设备的示例性应用,本发明实施例提供的基于人工智能的推荐处理设备可以实施为笔记本电脑,平板电脑,台式计算机,机顶盒,移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备)等各种类型的用户终端,也可以实施为服务器。下面,将说明设备实施为服务器时的示例性应用。
参见图2,图2是本发明实施例提供的基于人工智能的推荐处理系统100架构的一个可选的架构示意图,处理系统100包括服务器200、网络300、终端400,内容提供商500,终端400通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,内容提供商500将待推荐对象以及对应待推荐对象的文章发送至服务器200,服务器200中的关联关系确定模块2553基于文章获取到对应待推荐对象的标签词,服务器200中的用户标签确定模块2554将与待推荐对象具有关联关系的标签词,确定为与待推荐对象具有关联关系的用户账号的用户标签,服务器200中的推荐操作执行模块2555基于获取到的用户账号的用户标签执行对应用户账号的推荐操作,且服务器200中的推荐操作执行模块基于待推荐对象的标签词,对待推荐对象进行展示,展示模式可以是将标签词与待推荐对象绑定展示并推送至终端400,可以是将待推荐对象放到标签词所指向的类别下进行展示并推送至终端400,推荐操作执行模块2555中包括数据层、召回层、排序层,参见图3,图3是本发明实施例提供的推荐操作执行模块2555的结构示意图,数据层包括数据生成和数据存储,主要是利用各种数据处理工具对原始日志进行清洗,处理成格式化的数据,落地到不同类型的存储系统中,供下游的算法和模型使用,召回层主要是从用户账号的历史行为、实时行为等角度利用各种触发策略产生推荐的候选集,这里的候选集为待推荐对象的集合,当待推荐对象的标签词为用户账号的用户标签时,将待推荐对象加入对应该用户账号的候选集,召回层还会对候选集进行融合并按照产品规则进行过滤,一般融合和过滤后的候选集还是比较多的,一次线上请求过来之后线上系统无法对那么多的候选集进行排序,所以在召回层也会有粗排序,对融合的候选集进行一次粗排序,过滤掉粗排分数较低的候选集。排序层主要是利用机器学习的模型对召回层筛选出来的候选集进行粗排序和精排序。
参见图4,图4是本发明实施例提供的应用基于人工智能的推荐处理方法的服务器的一个可选的结构示意图,图4所示的终端200包括:至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。终端200中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图4中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器250可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Me mory),易失性存储器可以是随机存取存储器(RAM,Random Access Memor y)。本发明实施例描述的存储器250旨在包括任意适合类型的存储器。
在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块253,用于经由一个或多个与用户接口230相关联的输出装置231(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块254,用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本发明实施例提供的装置可以采用软件方式实现,图4示出了存储在存储器250中的基于人工智能的推荐处理装置255,其可以是程序和插件等形式的软件,包括以下软件模块:特征获取模块2551、相关度确定模块2552、关联关系确定模块2553、用户标签确定模块2554、推荐操作执行模块2555、训练模块2556和区块链管理模块2557,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分,将在下文中说明各个模块的功能。
在另一些实施例中,本发明实施例提供的基于人工智能的推荐处理装置255可以采用硬件方式实现,作为示例,本发明实施例提供的基于人工智能的推荐处理装置255可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的基于人工智能的推荐处理方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Devic e)、复杂可编程逻辑器件(CPLD,Complex ProgrammableLogic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
下面将结合本发明实施例提供的服务器的示例性应用和实施,说明本发明实施例提供的基于人工智能的推荐处理方法。
下面分两个阶段说明本发明实施例提供的基于人工智能的推荐处理方法,第一个部分是标签处理模型的训练阶段,第二个部分是利用标签处理模型的应用阶段。
下面说明标签处理模型的训练阶段,基于待推荐对象集合、文章集合和标签词集合,构建由标签词集合以及具有关联关系的待推荐对象和文章组成的训练样本集合;其中,训练样本集合中的待推荐对象和文章一一对应,标签词集合中标签词的类型包括:与待推荐对象具有关联关系的正样本标签词,与待推荐对象不具有关联关系的负样本标签词;基于词特征提取模型以及注意力权重矩阵,构建标签处理模型;基于训练样本集合,训练标签处理模型。
在一些实施例中,待推荐对象往往会具有对应于待推荐对象的文章,这里的文章可以是段落,篇章、收集到的评论信息,这里的文章可以是不同段落篇章的组合,即一个文本组合结果,也可以是一篇独立的文章,标签词集合中存在两种类型的样本,分别是与待推荐对象具有关联关系的正样本标签词和与待推荐对象不具有关联关系的负样本标签词,正样本标签词和待推荐对象具有关联关系,可以作为待推荐对象的标签词,负样本标签词和待推荐对象不具有关联关系,不可以作为待推荐对象的标签词,例如,假设待推荐对象是一家重庆火锅店,文章是关于这家火锅店的详细介绍,文章对“毛肚”进行了重点推荐,那么“毛肚”就是待推荐对象的正样本标签词,而“大闸蟹”则是待推荐对象的负样本标签词,标签处理模型一种端到端的处理模型,包括词特征提取模型和注意力权重矩阵,通过特征提取模型对待推荐对象和文章进行特征提取,利用注意力权重矩阵来实现两者信息耦合,以使得输出的标签词和待推荐对象的相关度更加准确。
参见图5,图5是本发明实施例提供的基于人工智能的推荐处理方法的一个可选的流程示意图,将结合图5示出的步骤101-102进行说明,下述方法的步骤可以在上述任意类型的电子设备(例如终端或服务器)上实现,下面以电子设备为服务器为例进行说明。
在步骤101中,服务器中的训练模块初始化标签处理模型以及损失函数。
在一些实施例中,初始化标签处理模型相当于初始化标签处理模型的参数,标签处理模型包括词特征提取模型以及注意力权重矩阵,词特征提取模型中可以包括嵌入表示模型和递归神经网络组合而成,嵌入表示模型用于获取各个字携带有上下文信息的特征,递归神经网络用语获取各个字携带有语序信息的特征,通过将这两种模型级联能够获得各个字既携带有上下文信息又携带有语序信息的特征,由于每个字根据不同的上下文信息能够表征不同的语义,且字的排列顺序不同也能够表征不同的语义,因此,通过能够捕捉动态上下文信息的嵌入表示模型和能够获取语序信息的递归神经网络得到的各个字的特征,能够更准确地获取待推荐对象的标签词,这里的损失函数可以是交叉熵损失函数,还可以是基于交叉熵损失函数的改进,即关注损失函数(Focal Loss),关注损失函数主要是为了解决目标检测中正负样本比例严重失衡的问题,该损失函数降低了大量简单负样本在训练中所占的权重,也可理解为一种困难样本挖掘,关注损失函数是在交叉熵损失函数基础上进行的修改,对于二分类交叉熵损失而言,经过激活函数的输出,对于正样本而言,输出概率越大则损失越小,对于负样本而言,输出概率越小则损失越小,此时的损失函数在大量简单样本的迭代过程中比较缓慢且无法优化至最优,关注损失函数在原有的基础上加了一个大于0的因子r,使得减少易分类样本的损失,使得更关注于困难的、错分的样本,此外,加入平衡因子,用来平衡正负样本本身的比例不均,只添加平衡因子虽然可以平衡正负样本的重要性,但是无法解决简单与困难样本的问题,因子r调节简单样本权重降低的速率,经过大量训练发现在训练样本中正样本标签词和负样本标签词的比例严重失衡,因此,通过经过改进的交叉熵改进损失函数,加快标签处理模型的迭代过程且使得模型达到最优,在关注损失函数的基础上,还可以加入乘以预设标签权重,增大正样本标签词的权重,减少负样本标签词的权重,以加快标签处理模型的迭代过程且使得模型达到最优。
在步骤102中,训练模块在标签处理模型每次迭代训练过程中执行以下处理:
在步骤1021中,训练模块将训练样本集合包括的所有具有关联关系的待推荐对象、文章作为输入样本,通过标签处理模型为输入样本进行标签匹配处理,得到标签集合中各个标签词的相关度。
在步骤1022中,训练模块将正样本标签词的相关度和负样本标签词的相关度代入损失函数,以确定损失函数取得最小值时对应的标签处理模型参数。
在步骤1023中,训练模块根据所确定的标签处理模型参数更新标签处理模型。
在一些实施例中,将训练样本集合包括的所有具有关联关系的待推荐对象、文章作为输入样本,通过标签处理模型为输入样本进行标签匹配处理,得到标签集合中各个标签词的相关度,将正样本标签词的相关度和负样本标签词的相关度代入损失函数,以确定损失函数取得最小值时对应的标签处理模型参数,根据所确定的标签处理模型参数更新标签处理模型,这里的标签集合中的标签词来源于文章,可以在文章中对标签词进行标注。
参见图6A,图6A是本发明实施例提供的基于人工智能的推荐处理方法的一个可选的流程示意图,将结合图6A示出的步骤201-206对标签处理模型的应用阶段进行说明,仍然以电子设备为服务器进行说明。
在步骤201中,内容提供商将待推荐对象和对应待推荐对象的文章发送至服务器。
在一些实施例中,待推荐对象可以是餐厅、服饰、书籍等等需要被进行推荐的实体,在推荐系统中将针对待推荐对象的广告信息或者其他具备推送功能的信息推送至用户使用的客户端,使客户端显示针对待推荐对象的广告等具备推送功能的信息,对应待推荐对象的文章可以是针对待推荐对象的软文、介绍或者是用户评论等等针对待推荐对象且具备一定信息量的篇章或者段落。这里的待推荐对象以及对应待推荐对象的文章可以是来自于内容提供商的,除此之外,也可以是服务器在网络上自动爬取到的信息,还可以是由客户端上传,在一些场景中,客户端可以获取用户上传的待推荐对象以及对应待推荐对象的文章,并将其发送至服务器进行处理,即待推荐对象和对应待推荐对象的文章来源广泛。
在步骤202中,服务器获取待推荐对象的对象特征,并获取对应待推荐对象的文章中的标签词的标签词特征。
参见图6B,基于图6A,图6B是本发明实施例提供的基于人工智能的推荐处理方法的一个可选的流程示意图,步骤202中服务器获取待推荐对象的对象特征,并获取对应待推荐对象的文章中的标签词的标签词特征,可以具体通过图6B示出的步骤2021-2023实现。
在步骤2021中,服务器获取对应待推荐对象中各个字的字特征,以及对应文章中各个字的字特征。
在一些实施例中,在执行步骤2021中获取对应待推荐对象中各个字的字特征之前,还可以执行以下技术方案,对待推荐对象进行分字处理,得到表征各个字的语义的字嵌入向量;获取对应待推荐对象的各个字的分割嵌入向量以及位置嵌入向量;对对应待推荐对象的各个字的字嵌入向量、分割嵌入向量以及位置嵌入向量进行求和处理,得到对应待推荐对象中各个字的输入特征。
在一些实施例中,用于获取字特征的模型的目标是利用大规模无标注语料训练获得文本的语义表示,在基于深度学习的语义表示方法中,文本中的字/词通常都用一维向量来表示,在此基础上,神经网络会将文本中各个字或词的一维词向量作为输入,经过一系列复杂的转换后,输出一个一维词向量作为文本的语义表示,训练目标在于希望语义相近的字/词在特征向量空间上的距离也接近,从而由字/词向量转换而来的文本向量也能够包含更为准确的语义信息,因此,获取字特征的模型的主要输入是文本中各个字/词的原始词向量,该向量既可以随机初始化,也可以利用其他自然语言处理算法进行预训练以作为初始值,输出是文本中各个字/词融合了全文语义信息后的向量表示,这里的文本统一以字向量作为输入,这里也可以以词向量作为输入,但是以字粒度进行处理能够获得更加详细的语义表示信息,因此,这里是先对待推荐对象进行分字处理,此外,用于获取字特征的模型的输入除了字嵌入向量,还包含另外两个部分:分割嵌入向量,该向量的取值在模型训练过程中自动学习,用于刻画文本的全局语义信息,并与单字/词的语义信息相融合,位置嵌入向量,由于出现在文本不同位置的字/词所携带的语义信息存在差异,因此,对不同位置的字/词分别附加一个不同的向量以作区分,最后用于获取字特征的模型将字嵌入向量、分割嵌入向量和位置嵌入向量的加和作为模型的输入,对于英文而言,将英文词汇作进一步切割,划分为更细粒度的语义单位,例如:将“working”分割为“work”和“ing”。
在一些实施例中,获取对应待推荐对象中各个字的字特征,可以通过下述技术方案实现,对对应待推荐对象中各个字的输入特征进行上下文信息分析处理,得到对应各个字的用于表征上下文信息的特征向量;对特征向量进行语序信息分析处理,得到对应待推荐对象中各个字的用于表征上下文信息和语序信息的字特征。
在一些实施例中,用于获取字特征的模型可以由嵌入表示模型和递归神经网络组合而成,嵌入表示模型用于获取各个字携带有上下文信息的特征,递归神经网络用语获取各个字携带有语序信息的特征,通过将这两种模型级联能够获得各个字既携带有上下文信息又携带有语序信息的特征,由于每个字根据不同的上下文信息能够表征不同的语义,且字的排列顺序不同也能够表征不同的语义,因此,通过能够捕捉动态上下文信息的嵌入表示模型和能够获取语序信息的递归神经网络得到的各个字的特征,能够更准确地获取待推荐对象的标签词。
在一些实施例中,在执行步骤2021中获取对应文章中各个字的字特征之前,还可以执行以下技术方案,对文章进行分字处理,得到表征各个字的语义的字嵌入向量;获取对应文章的各个字的分割嵌入向量以及位置嵌入向量;对对应文章的各个字的字嵌入向量、分割嵌入向量以及位置嵌入向量进行求和处理,得到对应文章中各个字的输入特征。获取对应文章中各个字的字特征,可以通过以下技术方案实现,对对应文章中各个字的输入特征进行上下文信息分析处理,得到对应各个字的用于表征上下文信息的特征向量;对特征向量进行语序信息分析处理,得到对应文章中各个字的用于表征上下文信息和语序信息的字特征。
在一些实施例中,文章的字的字特征和待推荐对象的字的字特征可以同时获取,则上下文信息以及语序信息是包括待推荐对象和文章整体的上下文信息和语序信息,即待推荐对象的字和文章的字构成了上下文关系,文章的字的字特征和待推荐对象的字的字特征可以互不影响,即上下文信息仅表征待推荐对象的字和待推荐对象的其他字的上下文信息,或者文章的字和文章的其他字的上下文信息,语序信息仅表征待推荐对象的字和待推荐对象的其他字的语序信息,或者,仅表征文章的字和文章的其他字的语序信息,待推荐对象和文章互相影响的实施方式能够加强待推荐对象和文章之间的耦合关系,待推荐对象和文章互不影响的实施方式能够加快处理效率。
在步骤2022中,服务器对待推荐对象中各个字的字特征和文章中各个字的字特征进行基于注意力机制的字合成处理,得到对应待推荐对象的对象特征以及对应文章中的多个词的词特征。
参见图6C,基于图6A,图6C是本发明实施例提供的基于人工智能的推荐处理方法的一个可选的流程示意图,步骤2022中服务器对待推荐对象中各个字的字特征和文章中各个字的字特征进行基于注意力机制的字合成处理,得到对应待推荐对象的对象特征以及对应文章中的多个词的词特征,可以具体通过图6C示出的步骤20221-20224实现。
在步骤20221中,服务器基于注意力机制,确定待推荐对象中各个字的字特征的注意力权重。
在步骤20222中,服务器基于注意力机制,确定文章中各个字的字特征的注意力权重。
在一些实施例中,递归神经网络算法用于处理时序特征的特点,隐含状态迭代更新,因此t时刻的状态包含了从开始到t时刻的所有信息,因此,还需要通过注意力机制对字特征进行特征加权融合得到词特征,而不仅仅是进行特征平均融合,可以同时将注意力机制应用到待推荐对象和文章,即对待推荐对象中各个字的字特征进行注意力池化,对文章中各个字的字特征进行注意力池化,在进行注意力机制的池化的过程中需要训练出注意力权重。
在步骤20223中,服务器结合待推荐对象中各个字的字特征的注意力权重和待推荐对象中各个字的字特征,进行特征加权合成处理,得到对应待推荐对象的对象特征。
在步骤20224中,服务器结合文章中各个字的字特征的注意力权重,以及文章中各个字的字特征,进行特征加权合成处理,得到对应文章中的多个词的词特征。
在步骤2023中,服务器从对应文章中的多个词的词特征中提取出对应文章中的标签词的标签词特征。
在一些实施例中,标签词是提前在文章中标注好的,例如,对于一篇文章而言,由于将动词作为标签词的可能性远小于将名词或者形容词作为标签词,可以在进行分词以及词性处理的时候,将文章中的所有名词作为标签词进行标注,还可以对文章进行专门的预处理,从文章中提取出标签词,例如,根据标签词的特征进行建模,从而基于特定的标签词提取模型从文章中提取出标签词,通过这种方式获取到的标签词的数目远少于直接根据词性将所有名词作为标签词所得到的标签词的数目。
在步骤203中,服务器基于对应待推荐对象的对象特征和对应文章的标签词特征,确定标签词与待推荐对象的相关度。
参见图6D,基于图6A,图6D是本发明实施例提供的基于人工智能的推荐处理方法的一个可选的流程示意图,步骤203中服务器基于对应待推荐对象的对象特征和对应文章的标签词特征,确定标签词与待推荐对象的相关度,可以具体通过图6D示出的步骤2031-2034实现。
在步骤2031中,服务器确定待推荐对象的对象特征和各个标签词特征之间的相似度,并将对应每个标签词确定的相似度进行组合得到相似度矩阵。
在一些实施例中,这里的相关度可以通过特征向量之间的余弦相似度进行计算,计算每个标签词的标签词特征和对象特征进行相似度计算,从而将所得到的对应各个标签词的相似度进行组合得到相似度矩阵。
在步骤2032中,服务器对相似度矩阵逐行进行最大似然处理,得到对应标签词特征的注意力权重。
在一些实施例中,这里的最大似然处理实际上是通过最大似然(Softmax)函数,对相似度矩阵进行逐行的Softmax运算,来获得自注意力权重矩阵,并且为每个标签词特征计算注意力向量,参见公式(1)和(2):
vi=∑jaijuj (2);
其中,rij是相似度矩阵中的第i行第j列的相似度的值,aij是注意力权重,uj是标签词的标签词特征,vi是注意力向量,反映了每个标签词与待推荐对象的直接交互。
在步骤2033中,服务器结合对应标签词特征的注意力权重以及标签词特征,确定对应标签词且耦合待推荐对象的输出特征;其中,输出特征表征有待推荐对象和标签词的耦合关系。
在一些实施例中,将各个标签词特征的注意力权重和标签词特征相乘即得到上述注意力向量以作为输出特征,这里的输出特征可以表征待推荐对象和标签词的耦合关系。
在步骤2034中,服务器基于输出特征,确定各个标签词与待推荐对象的相关度。
在一些实施例中,确定各个标签词与待推荐对象的相关度实际上是预测标签词的边界位置,这里的边界位置可以是开始位置或者是结束位置,即在文章中标签词所在的位置,以位置作为索引,来确定该位置的标签词成为对应待推荐对象的标签词的概率,以此概率来表征该位置的标签词和待推荐对象之间的相关度,这里的相关度预测公式(3)如下所示:
其中,pi是第i个标签词是对应待推荐对象的标签词的概率,w是可训练的矩阵,vi是输出特征,因此,对于训练之后的标签处理模型而言,可以直接从输出特征映射得到各个标签词与待推荐对象的相关度。
在步骤204中,当相关度大于相关度阈值时,服务器确定标签词与待推荐对象具有关联关系。
在一些实施例中,在执行完步骤204后,还可以执行以下技术方案,通过区块链网络中的节点,接收待推荐对象管理平台提交的包括待推荐对象的标签词的交易,将交易打包为新区块;根据新区块中交易携带的待推荐对象管理平台的数字签名和数字证书,对新区块中的交易进行共识验证;当共识验证通过时,将新区块添加到节点中用于存储标签词的区块链的尾部,并通过新区块中的标签词更新节点中的状态数据库。
在一些实施例中,通过待推荐对象管理平台,向区块链网络中的节点发送包括待推荐对象的标签词的交易,通过区块链网络中的节点,接收待推荐对象管理平台提交的包括待推荐对象的标签词的交易,将交易打包为新区块,根据新区块中交易携带的待推荐对象管理平台的数字签名和数字证书,通道内的记账节点各自验证接收的区块中的各个交易,并在验证通过后追加到各自维护的区块链的尾部,并利用区块中交易的交易结果更新账本数据库,记账节点对区块中交易的验证包括:是否为合法的交易:交易格式是否正确,是否有合法的签名,交易内容是否被篡改;记账节点是否加入交易中所指示的接收交易的通道;交易是否符合背书策略。背书策略是对交易进行背书的规则,指定一个交易在提交前需要的背书所来自的组织、相应组织内节点的类型和有效背书的数量。当区块链网络中的各个节点对新区块的交易中的共识验证通过时,将新区块添加到各个节点中用于存储标签词的区块链的尾部,并通过新区块中的标签词更新节点中账本的状态数据库。
在步骤205中,服务器将与待推荐对象具有关联关系的标签词,确定为与待推荐对象具有关联关系的用户账号的用户标签。
在一些实施例中,步骤205中服务器将与待推荐对象具有关联关系的标签词,确定为与待推荐对象具有关联关系的用户账号的用户标签,可以通过下述技术方案实现,对确定与待推荐对象具有关联关系的标签词和待推荐对象进行关联处理,得到表征待推荐对象与标签词之间具有关联关系的第一映射;结合第一映射以及用户账号与待推荐对象之间的关联关系,对标签词和用户账号进行关联处理,得到表征用户账号与标签词之间具有关联关系的第二映射;基于第二映射,将标签词确定为用户账号的用户标签。
在一些实施例中,这涉及到标签词的传递过程,建立标签词和待推荐对象之间的第一映射,进而根据用户账号和待推荐对象之间的关联关系,建立用户账号和标签词的第二映射,将标签词由待推荐对象的标签词转化为用户账号的用户标签,这里的用户账号和待推荐对象之间的关联关系可以是待推荐对象和用户账号之间的交易记录、关注记录甚至是访问记录,这里的访问记录可以是在线访问记录,可以是线下通过用户账号上报的定位数据得到的访问记录,甚至是由线下商家上报的与用户账号关联的线下访问记录,从而将待推荐对象的标签词传播到用户账号,实现用户账号的用户标签建模,从而实现了针对用户账号更加精确的推荐。
在步骤206中,基于用户账号的用户标签,服务器中的推荐操作执行模块执行对应用户账号的推荐操作。
在一些实施例中,步骤206中基于用户账号的用户标签,服务器中的推荐操作执行模块执行对应用户账号的推荐操作,可以通过下述技术方案实现,获取对应用户账号的所有用户标签;基于用户标签与用户账号发生关联的时间戳,对所获取的用户标签进行时间维度的优先级排序,得到对应用户标签的优先级排序结果;确定分别对应所获取的用户标签的待推荐对象,并按照对应优先级排序结果的推送策略,将所确定的待推荐对象按照推送策略推送至用户账号。
在一些实施例中,获取对应用户账号的所有用户标签,基于所有用户标签形成了对应用户账号的用户画像,用户标签和用户账号发生关联的时间戳即为作为用户标签的标签词对应的待推荐对象与用户账号发生关联的时间戳,这里查询与作为用户标签的标签词对应的待推荐对象可以通过第一映射来实现,因此,这里对所获取的用户标签进行时间维度的优先级排序,得到对应用户标签的优先级排序结果后所得到的结果能够表征用户账号和各个待推荐对象发生关联的时间顺序,将最近与用户账号发生关联的待推荐对象优先推送给用户账号,或者按照发生关联时间最近至最远的顺序,将各个待推荐对象推送给用户账号,这里的推送策略可以是完全按照时间先后顺序的,还可以是根据历史推送策略结合优先级排序所产生的推送策略,例如,将待推荐对象与用户账号重复发生关联的次数作为比关联产生时间更高的优先级,来进行待推荐对象的推送。
下面,将说明本发明实施例在一个实际的应用场景中的示例性应用。参见图7,图7是本发明实施例提供的基于人工智能的推荐处理方法的应用示意图,本发明实施例提供的基于人工智能的推荐处理方法的实际应用场景包括视频推荐场景、音频推荐场景、商家推荐场景、服饰推荐场景等等需要被推荐给用户使用的实体商品或者虚拟商品,也可以是需要被用户进行消费的各种实体商家或者虚拟商家,实体商品可以是服饰、图书、食物等等,虚拟商品可以是各种应用软件、各种影音作品甚至是应用游戏软件中虚拟道具等等,实体商家可以是服饰商家、各种餐厅、商场、电影院、出版商等等,虚拟商家可以是各种应用商店、购买虚拟道具的平台等等,在以下说明中,将以商家推荐场景进行具体说明。
商家的标签词是各种支付平台中商家画像及用户画像的重要部分,商家的标签词的相关性计算是准确且全面的理解商家的至关重要一环。商家的标签词对支付平台的多个业务场景提供支持,例如支付平台的运营平台、推荐系统等,其中,商户的标签词可以为推荐系统提供有效的商家特征,运营平台可以使用商户的标签词,从而可以圈定出特定用户,以进行精细化运营,通过标签的相关性计算,将自动获得的商户的标签词传播到用户账号,从而完成用户账号与用户标签的建模。
本发明实施例提供的基于人工智能的推荐处理方法实现了端到端的标签相关性计算方法。参见图8,图8是本发明实施例提供的基于人工智能的推荐处理方法的标签处理模型结构图,首先进行全局上下文的动态嵌入式表达(Word Embedding),具体采用字级向量表示,使用字粒度基于预训练模型,可以很好地捕捉动态上下文信息,这里的预训练模型可以是基于双向语义编码表示(B ERT-base,Bidirectional Encoder Representationsfrom Transformers)预训练模型,输入文本可以是商家名和商家相关文章,字向量是对应输入文本各个字的向量,例如,E咖,段向量是EA和EB,位置向量是E1-E12,模型的输入是字向量、段向量和位置向量的和,针对语序信息不足的问题:利用双向长短期记忆网络(BiLSTM,Bidirectional Long Short-Term Memory)捕捉正向反向序列信息,采用注意力池化机制来关注标签词中的关键字,以实现由字合成到词的过程,由于商家信息耦合不足,于是建立标签词和商家名称耦合层,接收到池化层传递的融合向量后,通过自注意力匹配机制,建模商家名称表示和标签词表示的直接交互,从而实现两者的深度融合,为了避免标签词的不均衡问题,采用关注损失函数(Focal Loss)对整体模型进行训练,并在损失函数中融入预先设定的标签权重,从而通过减少易分类样本的权重,从而使得模型在训练时更专注于难分类的样本,通过上述标签处理模型能够基于商家名称和商家文章得到对应商家的标签词,进而基于商家和用户账号之间的关联关系,这里的关联关系可以是商家和用户账号之间的交易记录、关注记录甚至是访问记录,这里的访问记录可以是在线访问记录,可以是线下通过用户账号上报的定位数据得到的访问记录,甚至是由线下商家上报的与用户账号关联的线下访问记录,从而将商家的标签词传播到用户账号,实现用户账号的标签词建模,从而实现了针对用户账号更加精确的推荐。
本发明实施例提供的基于人工智能的推荐处理方法的有益效果包括:基于端到端模型能够通过输入商家名称、文章、标签词,直接得到标签词的相关度,这里的相关度即为相关性分数,无需前述提到的人工设计特征,标签处理模型具有学习隐含语义的能力,通过测试数据集上的实验,相比较相关技术中的技术方案而言,在测试集上前五名标签的准确率为0.616,而相关技术中的技术方案在测试集上前五名标签的准确率为0.522,准确率提升明显,对于获取标签词的相关度的任务,可能的替代的特征提取方案有转换器(Transformer-XL,Tra nsformer Extra Long)模型,基于注意力机制的长短期记忆网络模型,本发明实施例提供的基于人工智能的推荐处理方法还可以应用到其他自然语言处理的任务上,例如,篇章理解、关键词抽取等等。
下面继续说明本发明实施例提供的基于人工智能的标签处理装置255的实施为软件模块的示例性结构,在一些实施例中,如图4所示,存储在存储器250的基于人工智能的标签处理装置255中的软件模块可以包括:特征获取模块2551,用于获取待推荐对象的对象特征,并获取对应所述待推荐对象的文章中的标签词的标签词特征;相关度确定模块2552,用于基于对应所述待推荐对象的对象特征和对应所述文章的标签词特征,确定所述标签词与所述待推荐对象的相关度;关联关系确定模块2553,用于当所述相关度大于相关度阈值时,确定所述标签词与所述待推荐对象具有关联关系;用户标签确定模块2554,用于将与所述待推荐对象具有关联关系的标签词,确定为与所述待推荐对象具有关联关系的用户账号的用户标签;推荐操作执行模块2555,用于基于所述用户账号的用户标签,执行对应所述用户账号的推荐操作。
在上述方案中,所述特征获取模块2551,还用于:获取对应所述待推荐对象中各个字的字特征,以及对应所述文章中各个字的字特征;对所述待推荐对象中各个字的字特征和所述文章中各个字的字特征进行基于注意力机制的字合成处理,得到对应所述待推荐对象的对象特征以及对应所述文章中的多个词的词特征;从对应所述文章中的多个词的词特征中提取出对应所述文章中的标签词的标签词特征。
在上述方案中,所述特征获取模块2551,还用于:对所述待推荐对象进行分字处理,得到表征各个字的语义的字嵌入向量;获取对应所述待推荐对象的各个字的分割嵌入向量以及位置嵌入向量;对对应所述待推荐对象的各个字的字嵌入向量、分割嵌入向量以及位置嵌入向量进行求和处理,得到对应所述待推荐对象中各个字的输入特征。
在上述方案中,所述特征获取模块2551,还用于:对对应所述待推荐对象中各个字的输入特征进行上下文信息分析处理,得到对应各个字的用于表征上下文信息的特征向量;对所述特征向量进行语序信息分析处理,得到对应所述待推荐对象中各个字的用于表征上下文信息和语序信息的字特征。
在上述方案中,所述特征获取模块2551,还用于:对所述文章进行分字处理,得到表征各个字的语义的字嵌入向量;获取对应所述文章的各个字的分割嵌入向量以及位置嵌入向量;对对应所述文章的各个字的字嵌入向量、分割嵌入向量以及位置嵌入向量进行求和处理,得到对应所述文章中各个字的输入特征。
在上述方案中,所述特征获取模块2551,还用于:对对应所述文章中各个字的输入特征进行上下文信息分析处理,得到对应各个字的用于表征上下文信息的特征向量;对所述特征向量进行语序信息分析处理,得到对应所述文章中各个字的用于表征上下文信息和语序信息的字特征。
在上述方案中,所述特征获取模块2551,还用于:基于注意力机制确定所述待推荐对象中各个字的字特征的注意力权重、以及所述文章中各个字的字特征的注意力权重;结合所述待推荐对象中各个字的字特征的注意力权重和所述待推荐对象中各个字的字特征,进行特征加权合成处理,得到对应所述待推荐对象的对象特征;结合所述文章中各个字的字特征的注意力权重,以及所述文章中各个字的字特征,进行特征加权合成处理,得到对应所述文章中的多个词的词特征。
在上述方案中,所述相关度确定模块2552,还用于:确定所述待推荐对象和各个标签词特征之间的相似度,并将对应每个标签词确定的相似度进行组合得到相似度矩阵;对所述相似度矩阵逐行进行最大似然处理,得到对应所述标签词特征的注意力权重;结合对应所述标签词特征的注意力权重以及所述标签词特征,确定对应所述标签词且耦合所述待推荐对象的输出特征;其中,所述输出特征表征有所述待推荐对象和所述标签词的耦合关系;基于所述输出特征,确定各个标签词与所述待推荐对象的相关度。
在上述方案中,所述基于人工智能的推荐处理装置还包括:训练模块2556,用于:基于待推荐对象集合、文章集合和标签词集合,构建由标签词集合以及具有关联关系的待推荐对象和文章组成的训练样本集合;其中,所述训练样本集合中的待推荐对象和文章一一对应,所述标签词集合中标签词的类型包括:与所述待推荐对象具有关联关系的正样本标签词,与所述待推荐对象不具有关联关系的负样本标签词;基于词特征提取模型以及注意力权重矩阵,构建标签处理模型;基于所述训练样本集合,训练所述标签处理模型。
在上述方案中,所述训练模块2556,还用于:初始化所述标签处理模型以及损失函数;在所述标签处理模型每次迭代训练过程中执行以下处理:将所述训练样本集合包括的所有具有关联关系的待推荐对象、文章作为输入样本,通过所述标签处理模型为所述输入样本进行标签匹配处理,得到所述标签集合中各个标签词的相关度;将所述正样本标签词的相关度和所述负样本标签词的相关度代入所述损失函数,以确定所述损失函数取得最小值时对应的标签处理模型参数;根据所确定的标签处理模型参数更新所述标签处理模型。
在上述方案中,所述关联关系确定模块2554,还用于:对确定与所述待推荐对象具有关联关系的标签词和所述待推荐对象进行关联处理,得到表征所述待推荐对象与所述标签词之间具有关联关系的第一映射;结合所述第一映射以及所述用户账号与所述待推荐对象之间的关联关系,对所述标签词和所述用户账号进行关联处理,得到表征所述用户账号与所述标签词之间具有关联关系的第二映射;基于所述第二映射,将所述标签词确定为所述用户账号的用户标签。
在上述方案中,所述推荐操作执行模块2555,还用于:获取对应所述用户账号的所有用户标签;基于所述用户标签与所述用户账号发生关联的时间戳,对所获取的用户标签进行时间维度的优先级排序,得到对应所述用户标签的优先级排序结果;确定分别对应所获取的用户标签的待推荐对象,并按照对应所述优先级排序结果的推送策略,将所确定的待推荐对象按照推送策略推送至所述用户账号。
在上述方案中,所述基于人工智能的推荐处理装置还包括:区块链管理模块2557,用于:通过区块链网络中的节点,接收待推荐对象管理平台提交的包括待推荐对象的标签词的交易,将所述交易打包为新区块;根据所述新区块中交易携带的所述待推荐对象管理平台的数字签名和数字证书,对所述新区块中的交易进行共识验证;当共识验证通过时,将所述新区块添加到所述节点中用于存储所述标签词的区块链的尾部,并通过所述新区块中的标签词更新所述节点中的状态数据库。
本发明实施例提供一种存储有可执行指令的存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本发明实施例提供的基于人工智能的推荐处理方法,例如,如图6A-6D示出的基于人工智能的推荐处理方法。
在一些实施例中,存储介质可以是FRAM、ROM、PROM、EPROM、EE PROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(H TML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
综上所述,通过本发明实施例提供的基于人工智能的推荐处理方法,能够自动学习出从待推荐对象到标签词的语义关系,从而将待推荐对象的标签词传递到用户账号,以针对用户账号进行有针对性的推荐。
以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。
Claims (15)
1.一种基于人工智能的推荐处理方法,其特征在于,所述方法包括:
获取待推荐对象的对象特征,并获取对应所述待推荐对象的文章中的标签词的标签词特征;
基于对应所述待推荐对象的对象特征和对应所述文章的标签词特征,确定所述标签词与所述待推荐对象的相关度;
当所述相关度大于相关度阈值时,确定所述标签词与所述待推荐对象具有关联关系;
将与所述待推荐对象具有关联关系的标签词,确定为与所述待推荐对象具有关联关系的用户账号的用户标签;
基于所述用户账号的用户标签,执行对应所述用户账号的推荐操作。
2.根据权利要求1所述的方法,其特征在于,所述获取待推荐对象的对象特征,并获取对应所述待推荐对象的文章中的标签词的标签词特征,包括:
获取对应所述待推荐对象中各个字的字特征,以及对应所述文章中各个字的字特征;
对所述待推荐对象中各个字的字特征和所述文章中各个字的字特征进行基于注意力机制的字合成处理,得到对应所述待推荐对象的对象特征以及对应所述文章中的多个词的词特征;
从对应所述文章中的多个词的词特征中提取出对应所述文章中的标签词的标签词特征。
3.根据权利要求2所述的方法,其特征在于,在获取对应所述待推荐对象中各个字的字特征之前,所述方法还包括:
对所述待推荐对象进行分字处理,得到表征各个字的语义的字嵌入向量;
获取对应所述待推荐对象的各个字的分割嵌入向量以及位置嵌入向量;
对对应所述待推荐对象的各个字的字嵌入向量、分割嵌入向量以及位置嵌入向量进行求和处理,得到对应所述待推荐对象中各个字的输入特征。
4.根据权利要求3所述的方法,其特征在于,所述获取对应所述待推荐对象中各个字的字特征,包括:
对对应所述待推荐对象中各个字的输入特征进行上下文信息分析处理,得到对应各个字的用于表征上下文信息的特征向量;
对所述特征向量进行语序信息分析处理,得到对应所述待推荐对象中各个字的用于表征上下文信息和语序信息的字特征。
5.根据权利要求1所述的方法,其特征在于,在获取对应所述文章中各个字的字特征之前,所述方法还包括:
对所述文章进行分字处理,得到表征各个字的语义的字嵌入向量;
获取对应所述文章的各个字的分割嵌入向量以及位置嵌入向量;
对对应所述文章的各个字的字嵌入向量、分割嵌入向量以及位置嵌入向量进行求和处理,得到对应所述文章中各个字的输入特征。
6.根据权利要求5所述的方法,其特征在于,所述获取对应所述文章中各个字的字特征,包括:
对对应所述文章中各个字的输入特征进行上下文信息分析处理,得到对应各个字的用于表征上下文信息的特征向量;
对所述特征向量进行语序信息分析处理,得到对应所述文章中各个字的用于表征上下文信息和语序信息的字特征。
7.根据权利要求2所述的方法,其特征在于,所述对所述待推荐对象中各个字的字特征和所述文章中各个字的字特征进行基于注意力机制的字合成处理,得到对应所述待推荐对象的对象特征以及对应所述文章中的多个词的词特征,包括:
基于注意力机制确定所述待推荐对象中各个字的字特征的注意力权重、以及所述文章中各个字的字特征的注意力权重;
结合所述待推荐对象中各个字的字特征的注意力权重和所述待推荐对象中各个字的字特征,进行特征加权合成处理,得到对应所述待推荐对象的对象特征;
结合所述文章中各个字的字特征的注意力权重,以及所述文章中各个字的字特征,进行特征加权合成处理,得到对应所述文章中的多个词的词特征。
8.根据权利要求1所述的方法,其特征在于,所述基于对应所述待推荐对象的对象特征和对应所述文章的标签词特征,得到所述标签词与所述待推荐对象的相关度,包括:
确定所述待推荐对象的对象特征和各个标签词特征之间的相似度,并将对应每个标签词确定的相似度进行组合得到相似度矩阵;
对所述相似度矩阵逐行进行最大似然处理,得到对应所述标签词特征的注意力权重;
结合对应所述标签词特征的注意力权重以及所述标签词特征,确定对应所述标签词且耦合所述待推荐对象的输出特征;
其中,所述输出特征表征有所述待推荐对象和所述标签词的耦合关系;
基于所述输出特征,确定各个标签词与所述待推荐对象的相关度。
9.根据权利要求1-7任一项所述的方法,其特征在于,所述方法还包括:
基于待推荐对象集合、文章集合和标签词集合,构建由标签词集合以及具有关联关系的待推荐对象和文章组成的训练样本集合;
其中,所述训练样本集合中的待推荐对象和文章一一对应,所述标签词集合中标签词的类型包括:与所述待推荐对象具有关联关系的正样本标签词,与所述待推荐对象不具有关联关系的负样本标签词;
基于词特征提取模型以及注意力权重矩阵,构建标签处理模型;
基于所述训练样本集合,训练所述标签处理模型。
10.根据权利要求9所述的方法,其特征在于,所述基于所述训练样本集合,训练所述标签处理模型,包括:
初始化所述标签处理模型以及损失函数;
在所述标签处理模型每次迭代训练过程中执行以下处理:
将所述训练样本集合包括的所有具有关联关系的待推荐对象、文章作为输入样本,
通过所述标签处理模型为所述输入样本进行标签匹配处理,得到所述标签集合中各个标签词的相关度;
将所述正样本标签词的相关度和所述负样本标签词的相关度代入所述损失函数,以确定所述损失函数取得最小值时对应的标签处理模型参数;
根据所确定的标签处理模型参数更新所述标签处理模型。
11.根据权利要求1所述的方法,其特征在于,所述将与所述待推荐对象具有关联关系的标签词,确定为与所述待推荐对象具有关联关系的用户账号的用户标签,包括:
对确定与所述待推荐对象具有关联关系的标签词和所述待推荐对象进行关联处理,得到表征所述待推荐对象与所述标签词之间具有关联关系的第一映射;
结合所述第一映射以及所述用户账号与所述待推荐对象之间的关联关系,对所述标签词和所述用户账号进行关联处理,得到表征所述用户账号与所述标签词之间具有关联关系的第二映射;
基于所述第二映射,将所述标签词确定为所述用户账号的用户标签。
12.根据权利要求11所述的方法,其特征在于,所述基于所述用户账号的用户标签,执行对应所述用户账号的推荐操作,包括:
获取对应所述用户账号的所有用户标签;
基于所述用户标签与所述用户账号发生关联的时间戳,对所获取的用户标签进行时间维度的优先级排序,得到对应所述用户标签的优先级排序结果;
确定分别对应所获取的用户标签的待推荐对象,并按照对应所述优先级排序结果的推送策略,将所确定的待推荐对象按照推送策略推送至所述用户账号。
13.根据权利要求1所述的方法,其特征在于,在确定所述标签词与所述待推荐对象具有关联关系之后,所述方法还包括:
通过区块链网络中的节点,接收待推荐对象管理平台提交的包括待推荐对象的标签词的交易,将所述交易打包为新区块;
根据所述新区块中交易携带的所述待推荐对象管理平台的数字签名和数字证书,对所述新区块中的交易进行共识验证;
当共识验证通过时,将所述新区块添加到所述节点中用于存储所述标签词的区块链的尾部,并通过所述新区块中的标签词更新所述节点中的状态数据库。
14.一种基于人工智能的推荐处理装置,其特征在于,包括:
特征获取模块,用于获取待推荐对象的对象特征,并获取对应所述待推荐对象的文章中的标签词的标签词特征;
相关度确定模块,用于基于对应所述待推荐对象的对象特征和对应所述文章的标签词特征,确定所述标签词与所述待推荐对象的相关度;
关联关系确定模块,用于当所述相关度大于相关度阈值时,确定所述标签词与所述待推荐对象具有关联关系;
用户标签确定模块,用于将与所述待推荐对象具有关联关系的标签词,确定为与所述待推荐对象具有关联关系的用户账号的用户标签;
推荐操作执行模块,用于基于所述用户账号的用户标签,执行对应所述用户账号的推荐操作。
15.一种基于人工智能的推荐处理设备,其特征在于,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至13任一项所述的基于人工智能的推荐处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010015140.1A CN111177569B (zh) | 2020-01-07 | 2020-01-07 | 基于人工智能的推荐处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010015140.1A CN111177569B (zh) | 2020-01-07 | 2020-01-07 | 基于人工智能的推荐处理方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111177569A true CN111177569A (zh) | 2020-05-19 |
CN111177569B CN111177569B (zh) | 2021-06-11 |
Family
ID=70650896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010015140.1A Active CN111177569B (zh) | 2020-01-07 | 2020-01-07 | 基于人工智能的推荐处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111177569B (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460286A (zh) * | 2020-03-26 | 2020-07-28 | 平安科技(深圳)有限公司 | 信息推荐方法、装置、电子设备及介质 |
CN111695053A (zh) * | 2020-06-12 | 2020-09-22 | 上海智臻智能网络科技股份有限公司 | 序列标注方法、数据处理设备、可读存储介质 |
CN111708920A (zh) * | 2020-06-06 | 2020-09-25 | 谢国柱 | 基于人工智能的互联网大数据处理方法及智能云服务平台 |
CN111737476A (zh) * | 2020-08-05 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、计算机可读存储介质及电子设备 |
CN112100440A (zh) * | 2020-08-21 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 视频推送方法、设备及介质 |
CN112163164A (zh) * | 2020-10-16 | 2021-01-01 | 腾讯科技(深圳)有限公司 | 一种用户标签确定方法和相关装置 |
CN112395426A (zh) * | 2020-11-16 | 2021-02-23 | 四川大学 | 语义匹配模型训练方法及系统、检索系统、装置、介质 |
CN112449002A (zh) * | 2020-10-19 | 2021-03-05 | 微民保险代理有限公司 | 一种待推送对象的推送方法、装置、设备及存储介质 |
CN112633419A (zh) * | 2021-03-09 | 2021-04-09 | 浙江宇视科技有限公司 | 小样本学习方法、装置、电子设备和存储介质 |
CN112632384A (zh) * | 2020-12-25 | 2021-04-09 | 北京百度网讯科技有限公司 | 针对应用程序的数据处理方法、装置、电子设备和介质 |
CN112836130A (zh) * | 2021-02-20 | 2021-05-25 | 四川省人工智能研究院(宜宾) | 一种基于联邦学习的上下文感知推荐系统及方法 |
CN112860992A (zh) * | 2021-01-25 | 2021-05-28 | 西安博达软件股份有限公司 | 基于网站内容数据推荐的特征优化预训练方法 |
CN113434388A (zh) * | 2021-06-02 | 2021-09-24 | 华东师范大学 | 一种模型驱动的事务型数据库测试案例生成系统及方法 |
CN113779185A (zh) * | 2020-06-10 | 2021-12-10 | 武汉Tcl集团工业研究院有限公司 | 一种自然语言模型的生成方法和计算机设备 |
CN113837216A (zh) * | 2021-06-01 | 2021-12-24 | 腾讯科技(深圳)有限公司 | 数据分类方法、训练方法、装置、介质及电子设备 |
CN113836389A (zh) * | 2020-06-23 | 2021-12-24 | 北京达佳互联信息技术有限公司 | 内容推荐方法及装置 |
CN114281944A (zh) * | 2021-12-27 | 2022-04-05 | 北京中科闻歌科技股份有限公司 | 文档匹配模型的构建方法、装置、电子设备及存储介质 |
CN115062232A (zh) * | 2022-08-18 | 2022-09-16 | 中航信移动科技有限公司 | 一种用于民航数据的标签处理方法、电子设备及存储介质 |
CN116911929A (zh) * | 2023-09-13 | 2023-10-20 | 北京茄豆网络科技有限公司 | 基于大数据的广告服务终端及方法 |
TWI820845B (zh) * | 2022-08-03 | 2023-11-01 | 中國信託商業銀行股份有限公司 | 訓練資料標註方法及其運算裝置、文章標註模型建立方法及其運算裝置,以及文章標註方法及其運算裝置 |
CN117315665A (zh) * | 2023-11-30 | 2023-12-29 | 上海又寸科技有限公司 | 一种基于原笔迹识别的题目自动批阅方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170048304A (ko) * | 2015-05-21 | 2017-05-08 | 네이버 주식회사 | 컨텐츠 공유 서비스 제공 방법, 표시 제어 방법 및 컴퓨터 프로그램 |
CN106651519A (zh) * | 2016-12-23 | 2017-05-10 | 广州赛宝认证中心服务有限公司 | 基于标签信息的个性化推荐方法和系统 |
CN107679217A (zh) * | 2017-10-19 | 2018-02-09 | 北京百度网讯科技有限公司 | 基于数据挖掘的关联内容提取方法和装置 |
US20180211174A1 (en) * | 2017-01-24 | 2018-07-26 | International Business Machines Corporation | System for evaluating journal articles |
CN108595660A (zh) * | 2018-04-28 | 2018-09-28 | 腾讯科技(深圳)有限公司 | 多媒体资源的标签信息生成方法、装置、存储介质及设备 |
CN109840301A (zh) * | 2019-01-22 | 2019-06-04 | 珠海天燕科技有限公司 | 一种信息筛选方法及装置 |
CN110162749A (zh) * | 2018-10-22 | 2019-08-23 | 哈尔滨工业大学(深圳) | 信息提取方法、装置、计算机设备及计算机可读存储介质 |
CN110580292A (zh) * | 2019-08-28 | 2019-12-17 | 腾讯科技(深圳)有限公司 | 一种文本标签生成方法、装置和计算机可读存储介质 |
CN110598011A (zh) * | 2019-09-27 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、计算机设备以及可读存储介质 |
-
2020
- 2020-01-07 CN CN202010015140.1A patent/CN111177569B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170048304A (ko) * | 2015-05-21 | 2017-05-08 | 네이버 주식회사 | 컨텐츠 공유 서비스 제공 방법, 표시 제어 방법 및 컴퓨터 프로그램 |
CN106651519A (zh) * | 2016-12-23 | 2017-05-10 | 广州赛宝认证中心服务有限公司 | 基于标签信息的个性化推荐方法和系统 |
US20180211174A1 (en) * | 2017-01-24 | 2018-07-26 | International Business Machines Corporation | System for evaluating journal articles |
CN107679217A (zh) * | 2017-10-19 | 2018-02-09 | 北京百度网讯科技有限公司 | 基于数据挖掘的关联内容提取方法和装置 |
CN108595660A (zh) * | 2018-04-28 | 2018-09-28 | 腾讯科技(深圳)有限公司 | 多媒体资源的标签信息生成方法、装置、存储介质及设备 |
CN110162749A (zh) * | 2018-10-22 | 2019-08-23 | 哈尔滨工业大学(深圳) | 信息提取方法、装置、计算机设备及计算机可读存储介质 |
CN109840301A (zh) * | 2019-01-22 | 2019-06-04 | 珠海天燕科技有限公司 | 一种信息筛选方法及装置 |
CN110580292A (zh) * | 2019-08-28 | 2019-12-17 | 腾讯科技(深圳)有限公司 | 一种文本标签生成方法、装置和计算机可读存储介质 |
CN110598011A (zh) * | 2019-09-27 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、计算机设备以及可读存储介质 |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111460286A (zh) * | 2020-03-26 | 2020-07-28 | 平安科技(深圳)有限公司 | 信息推荐方法、装置、电子设备及介质 |
CN111708920A (zh) * | 2020-06-06 | 2020-09-25 | 谢国柱 | 基于人工智能的互联网大数据处理方法及智能云服务平台 |
CN113779185B (zh) * | 2020-06-10 | 2023-12-29 | 武汉Tcl集团工业研究院有限公司 | 一种自然语言模型的生成方法和计算机设备 |
CN113779185A (zh) * | 2020-06-10 | 2021-12-10 | 武汉Tcl集团工业研究院有限公司 | 一种自然语言模型的生成方法和计算机设备 |
CN111695053A (zh) * | 2020-06-12 | 2020-09-22 | 上海智臻智能网络科技股份有限公司 | 序列标注方法、数据处理设备、可读存储介质 |
CN113836389B (zh) * | 2020-06-23 | 2024-03-26 | 北京达佳互联信息技术有限公司 | 内容推荐方法及装置 |
CN113836389A (zh) * | 2020-06-23 | 2021-12-24 | 北京达佳互联信息技术有限公司 | 内容推荐方法及装置 |
CN111737476A (zh) * | 2020-08-05 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 文本处理方法、装置、计算机可读存储介质及电子设备 |
CN112100440A (zh) * | 2020-08-21 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 视频推送方法、设备及介质 |
CN112100440B (zh) * | 2020-08-21 | 2023-12-12 | 深圳市雅阅科技有限公司 | 视频推送方法、设备及介质 |
CN112163164A (zh) * | 2020-10-16 | 2021-01-01 | 腾讯科技(深圳)有限公司 | 一种用户标签确定方法和相关装置 |
CN112163164B (zh) * | 2020-10-16 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 一种用户标签确定方法和相关装置 |
CN112449002A (zh) * | 2020-10-19 | 2021-03-05 | 微民保险代理有限公司 | 一种待推送对象的推送方法、装置、设备及存储介质 |
CN112395426A (zh) * | 2020-11-16 | 2021-02-23 | 四川大学 | 语义匹配模型训练方法及系统、检索系统、装置、介质 |
CN112395426B (zh) * | 2020-11-16 | 2023-04-21 | 四川大学 | 语义匹配模型训练方法及系统、检索系统、装置、介质 |
CN112632384A (zh) * | 2020-12-25 | 2021-04-09 | 北京百度网讯科技有限公司 | 针对应用程序的数据处理方法、装置、电子设备和介质 |
CN112860992A (zh) * | 2021-01-25 | 2021-05-28 | 西安博达软件股份有限公司 | 基于网站内容数据推荐的特征优化预训练方法 |
CN112860992B (zh) * | 2021-01-25 | 2023-03-24 | 西安博达软件股份有限公司 | 基于网站内容数据推荐的特征优化预训练方法 |
CN112836130A (zh) * | 2021-02-20 | 2021-05-25 | 四川省人工智能研究院(宜宾) | 一种基于联邦学习的上下文感知推荐系统及方法 |
CN112836130B (zh) * | 2021-02-20 | 2023-02-03 | 四川省人工智能研究院(宜宾) | 一种基于联邦学习的上下文感知推荐系统及方法 |
CN112633419A (zh) * | 2021-03-09 | 2021-04-09 | 浙江宇视科技有限公司 | 小样本学习方法、装置、电子设备和存储介质 |
CN112633419B (zh) * | 2021-03-09 | 2021-07-06 | 浙江宇视科技有限公司 | 小样本学习方法、装置、电子设备和存储介质 |
CN113837216A (zh) * | 2021-06-01 | 2021-12-24 | 腾讯科技(深圳)有限公司 | 数据分类方法、训练方法、装置、介质及电子设备 |
CN113837216B (zh) * | 2021-06-01 | 2024-05-10 | 腾讯科技(深圳)有限公司 | 数据分类方法、训练方法、装置、介质及电子设备 |
CN113434388B (zh) * | 2021-06-02 | 2022-04-05 | 华东师范大学 | 一种模型驱动的事务型数据库测试案例生成系统及方法 |
CN113434388A (zh) * | 2021-06-02 | 2021-09-24 | 华东师范大学 | 一种模型驱动的事务型数据库测试案例生成系统及方法 |
CN114281944A (zh) * | 2021-12-27 | 2022-04-05 | 北京中科闻歌科技股份有限公司 | 文档匹配模型的构建方法、装置、电子设备及存储介质 |
TWI820845B (zh) * | 2022-08-03 | 2023-11-01 | 中國信託商業銀行股份有限公司 | 訓練資料標註方法及其運算裝置、文章標註模型建立方法及其運算裝置,以及文章標註方法及其運算裝置 |
CN115062232B (zh) * | 2022-08-18 | 2022-11-04 | 中航信移动科技有限公司 | 一种用于民航数据的标签处理方法、电子设备及存储介质 |
CN115062232A (zh) * | 2022-08-18 | 2022-09-16 | 中航信移动科技有限公司 | 一种用于民航数据的标签处理方法、电子设备及存储介质 |
CN116911929A (zh) * | 2023-09-13 | 2023-10-20 | 北京茄豆网络科技有限公司 | 基于大数据的广告服务终端及方法 |
CN116911929B (zh) * | 2023-09-13 | 2023-12-12 | 北京茄豆网络科技有限公司 | 基于大数据的广告服务终端及方法 |
CN117315665A (zh) * | 2023-11-30 | 2023-12-29 | 上海又寸科技有限公司 | 一种基于原笔迹识别的题目自动批阅方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111177569B (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177569B (zh) | 基于人工智能的推荐处理方法、装置及设备 | |
US11334635B2 (en) | Domain specific natural language understanding of customer intent in self-help | |
JP6446602B2 (ja) | データのカテゴリ分類のための方法およびシステム | |
JP6894534B2 (ja) | 情報処理方法及び端末、コンピュータ記憶媒体 | |
WO2022057658A1 (zh) | 推荐模型训练方法、装置、计算机设备及存储介质 | |
CN111143576A (zh) | 一种面向事件的动态知识图谱构建方法和装置 | |
CN107844533A (zh) | 一种智能问答系统及分析方法 | |
WO2022048363A1 (zh) | 网站分类方法、装置、计算机设备及存储介质 | |
US11276099B2 (en) | Multi-perceptual similarity detection and resolution | |
CN102314440B (zh) | 利用网络维护语言模型库的方法和系统 | |
WO2019133506A1 (en) | Intelligent routing services and systems | |
CN115017893A (zh) | 校正通过深度学习生成的内容 | |
US20210065245A1 (en) | Using machine learning to discern relationships between individuals from digital transactional data | |
CN111400584A (zh) | 联想词的推荐方法、装置、计算机设备和存储介质 | |
US11822590B2 (en) | Method and system for detection of misinformation | |
CN109271624A (zh) | 一种目标词确定方法、装置及存储介质 | |
CN112199954B (zh) | 基于语音语义的疾病实体匹配方法、装置及计算机设备 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN111126073B (zh) | 语义检索方法和装置 | |
CN116955591A (zh) | 用于内容推荐的推荐语生成方法、相关装置和介质 | |
CN109062551A (zh) | 基于大数据开发命令集的开发框架 | |
JP2022111020A (ja) | 文書類似度学習に基づくディープラーニングモデルの転移学習方法およびコンピュータ装置 | |
CN114595377A (zh) | 词汇推荐方法、装置、终端及可读存储介质 | |
CN110909777A (zh) | 一种多维特征图嵌入方法、装置、设备及介质 | |
KR102649622B1 (ko) | 브랜드 평판 분석 서비스를 제공하기 위한 방법, 컴퓨터 장치, 및 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |