CN113256386A - 一种基于人工智能的商品描述方法及装置 - Google Patents

一种基于人工智能的商品描述方法及装置 Download PDF

Info

Publication number
CN113256386A
CN113256386A CN202110634891.6A CN202110634891A CN113256386A CN 113256386 A CN113256386 A CN 113256386A CN 202110634891 A CN202110634891 A CN 202110634891A CN 113256386 A CN113256386 A CN 113256386A
Authority
CN
China
Prior art keywords
correction factor
knowledge
commodity
vector
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110634891.6A
Other languages
English (en)
Inventor
艾的梦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110634891.6A priority Critical patent/CN113256386A/zh
Publication of CN113256386A publication Critical patent/CN113256386A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于人工智能的商品描述方法,包括:云服务器获取商品实体entity、商品描述describe和商品搜索排序search关系;将实体、描述和搜索排序组成多个知识三元组;将知识三元组输入BERT模型,获取知识三元组的第一向量;基于知识三元组的第一向量,设置翻译模型的损失值与校正因子;基于损失值和校正因子,确定翻译模型的动态损失函数;将动态损失函数引入翻译模型进行迭代,并在迭代过程中监控校正因子;计算校正因子的标准差,当校正因子低于第一预设阈值且校正因子的标准差低于第二预设阈值时,结束模型迭代,获取迭代后的知识三元组的第二向量;基于知识三元组的第二向量,设立知识图谱;基于知识图谱,设立商品及对应描述。

Description

一种基于人工智能的商品描述方法及装置
技术领域
本申请涉及电子商务技术领域,尤其涉及基于人工智能的商品描述方法及装置。
背景技术
商品知识图谱(product knowledge graph,PKG)是一种基于商品推荐的方法。商品知识图谱可以将不同商品实体(entity)之间的复杂结构关系进行关系实例化,并基于海量商品形成了知识补全、搜索排序以及推荐的任务。
在PKG中,商品与商品之间的关系包括互补关系、同时浏览关系以及相互替代关系,例如音响与电视是互补关系,遥控器与电视也是互补关系,而品牌A的电视与品牌B的电视则是替代关系。因此,不同商品需要有特定的描述describe,从而通过该描述形成与其他商品,与同类商品之间形成一定的联系。
在商品推荐领域,不同的商品实体和该商品描述往往是通过搜索排序关系进行关联,例如带遥控器的电视描述的是遥控器和电视两个商品,通过搜索search关联到电视和遥控器。
现有技术中,往往通过翻译模型的TransE,TransH,TransR和TransD等方法,将商品实体和关联关系映射到一个低维的连续向量空间中。但是,PKG的学习也具有噪声(noise)的问题,即现实的商品往往对应于大量的描述,噪声较大,或者一个简单的描述又往往对应于数以万计的商品,不相关的商品较多。导致商品的知识图谱转化模型的误差大,不适用于大型电子商务平台。
发明内容
本申请实施例提供一种基于人工智能的商品描述方法及装置,用于解决现有技术中商品知识图谱存在噪声导致适用范围窄的问题。
本发明实施例提供一种基于人工智能的商品描述方法,包括:
云服务器获取商品实体entity、商品描述describe和商品搜索排序search关系;
将所述实体、描述和搜索排序组成多个知识三元组{h,r,t},其中h表示商品实体,r表示搜索排序关系,t表示商品描述;
将所述知识三元组输入BERT模型,获取所述知识三元组的第一向量;
基于所述知识三元组的向量,设置翻译模型的损失值与校正因子;
基于所述损失值和校正因子,确定所述翻译模型的动态损失函数,所述动态损失函数基于所述校正因子的取值而动态调整;
将所述动态损失函数引入翻译模型进行迭代,并在迭代过程中监控所述校正因子;
计算所述校正因子的标准差,当所述校正因子低于第一预设阈值且所述校正因子的标准差低于第二预设阈值时,结束模型迭代,获取迭代后的所述知识三元组的第二向量;
基于所述知识三元组的第二向量,设立知识图谱;
基于所述知识图谱,设立商品及对应描述。
可选地,所述基于所述知识三元组的向量,设置翻译模型的损失值与校正因子,包括:
基于如下公式求取损失值f(h,r,t)
Figure BDA0003105216130000031
基于如下公式求取校正因子λ
Figure BDA0003105216130000032
其中,Dr=(∑||Δr||o)/N,
Figure BDA0003105216130000033
Zt=(β∑||Δt||o)/N
K为自定义超参数,Dr为检索排序关系不同向量之间的平均距离,Zh为商品实体不同向量之间的平均距离,Zh为商品描述不同向量之间的平均距离,Δr,Δt,Δh分别为检索排序向量的欧式距离,商品描述向量的欧式距离,商品实体向量的欧式距离,α,β为自定义权重因子。
可选地,基于所述损失值和校正因子,确定所述翻译模型的动态损失函数,包括:
基于如下公式设置损失函数S(h,r,t):
Figure BDA0003105216130000034
其中,A是第一预设阈值,B是第二预设阈值。
可选地,所述在迭代过程中监控所述校正因子,包括:
在每次迭代过程结束后计算所述校正因子,并基于每次校正因子计算所述校正因子的标准差;
基于所述校正因子调整所述动态损失函数,将所述调整后的动态损失函数用于下一次迭代过程。
可选地,所述基于每次校正因子计算所述校正因子的标准差,包括:
基于下列公式计算所述校正因子的标准差:
Figure BDA0003105216130000041
其中σ为标准差,μ为λi的算数平均值,λi是第i次迭代后的校正因子。
可选地,所述将所述知识三元组输入BERT模型,获取所述知识三元组的第一向量,包括:
下载模型和分类器,对所述知识三元组进行序列化标记;
增加标签以及注意力屏蔽,对序列对进行分割,输入到所述BERT模型中,得到所述知识三元组的向量化表示。
可选地,在所述将所述动态损失函数引入翻译模型进行迭代之前,所述方法还包括:
设置所述翻译模型的超参数。
可选地,所述将所述知识三元组输入BERT模型之前,所述方法还包括:
对所述知识三元组进行数据去噪及数据压缩。
可选地,所述方法还包括:
在迭代过程中,采用随机梯度下降方法对所述翻译模型进行优化。
本发明实施例还提供一种装置,其特征在于,包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时实现上述方法。
本发明实施例提供的方法,在翻译模型开始迭代前,设置校正因子和损失值,并基于校正因子和损失值设置动态损失函数,该动态损失函数在每次迭代后进行动态调整,通过增加实体间的相对距离,可以有效的提高PKG表示学习模型的准确率,降低PKG中的噪声,应用前景更广,经测试,可适用于超大规模的电子商品平台中。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为一个实施例中基于人工智能的商品描述的流程示意图;
图2为一个实施例中BERT模型示意图;
图3为一个实施例中装置的硬件组成示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
图1是本发明实施例的其中一个基于人工智能的商品描述的流程图,如图1所示,该方法包括:
S101、云服务器获取商品实体entity、商品描述describe和商品搜索排序search关系;
知识图谱(Knowledge Graph),又称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。在商品知识图谱领域,需要将商品与商品的描述进行映射,二者通过搜索排序search进行关联。
S102、将所述实体、描述和搜索排序组成多个知识三元组{h,r,t},其中h表示商品实体,r表示搜索排序关系,t表示商品描述;
PKG的表示学习方法有几种代表类模型,如翻译模型、距离模型、能量模型、双线性模型、张量神经网络模型、矩阵分解模型。当前,最为常用的就是翻译模型,这类模型主要利用的是向量空间中的平移不变性,对知识库G=(E,R,S)中的知识三元组(h,r,t),表示为头实体h,经过关系r,到尾实体t的翻译,即做向量加法,尽可能使得
Figure BDA0003105216130000061
翻译模型主要目的是将知识三元组中的知识在向量空间中进行表示,且把实体以及关系的属性加入到向量空间中,让向量具有语义信息,方便计算机进行计算以及实现自然语言处理NLP任务。
因此,在本发明实施例中,定义h为商品实体,定义r为搜索排序关系,定义t为商品描述,三者组成了一组知识三元组,不同的商品实体、商品描述和搜索排序的组合可形成多组知识三元组。
S103、将所述知识三元组输入BERT模型,获取所述知识三元组的第一向量;
在大型或超大型的电子商务平台中,实体集往往是百万或者千万量级,而实体之间的关系仅仅有几百种,因此,必要会带来传统的翻译模型的噪声问题,检索排序的准确率不高。
BERT是一种语言模型,经过该模型的加工,输出的向量会携带词语本身的语义信息。该模型有两个特点,第一是该模型非常的深,12层,并不宽(wide),中间层只有1024,而之前的Transformer模型中间层有2048。第二,MLM(Masked Language Model),同时利用左侧和右侧的词语。
本发明中将BERT用作替代Word2vec的工具,被用作数据预处理的一种手段,对提升模型的准确率也有一定的效果,其模型图如图2所示,输入层为实体或关系,中间层为双向的Transformer特征提取器组成,输出层为对应的向量
Figure BDA0003105216130000071
其中,所述将所述知识三元组输入BERT模型,获取所述知识三元组的第一向量,具体可以为:
下载模型和分类器,对所述知识三元组进行序列化标记;
增加标签以及注意力屏蔽,对序列对进行分割,输入到所述BERT模型中,得到所述知识三元组的向量化表示。
此外,在将所述知识三元组输入BERT模型之前,还需要对所述知识三元组进行数据去噪及数据压缩。需要对得到的数据集进行数据清洗,包括去除和补全有缺失的数据,去除和修改格式或内容错误的数据,去除或修改逻辑错误的数据,去除不需要和重复的数据,最后对数据进行压缩。
S104、基于所述知识三元组的第一向量,设置翻译模型的损失值与校正因子;
在本发明实施例中,为了降低翻译模型的噪声问题,创造性地定义了校正因子来影响损失函数,从而改变模型学习效果。
在翻译模型中,设置基础的损失值,需要说明的是,翻译模型是以TransE为基础模型,其损失值f(h,r,t)如公式1所示:
Figure BDA0003105216130000081
Figure BDA0003105216130000082
为头实体(商品实体)向量,
Figure BDA0003105216130000083
为关系(检索排序)的向量表示,
Figure BDA0003105216130000084
表示为尾实体(商品描述)的向量,字母o指的是距离函数使用欧式距离进行计算,优化目标是使得头实体向量加上关系向量可以得到尾实体向量,即优化目标为h+r≈t。
在本发明中,是对原目标损失函数整体进行优化,在每次迭代更新前加入影响更新方向的实体校正因子。模型的校正因子λ按照如下公式获得:
Figure BDA0003105216130000091
其中,Dr=(∑||Δr||o)/N 公式3,
Figure BDA0003105216130000092
Zt=(β∑||Δt||o)/N 公式5
K为自定义超参数,Dr为检索排序关系不同向量之间的平均距离,Zh为商品实体不同向量之间的平均距离,Zt为商品描述不同向量之间的平均距离,Δr,Δt,Δh分别为检索排序向量的欧式距离,商品描述向量的欧式距离,商品实体向量的欧式距离,α,β为自定义权重因子,字母o表示欧式距离。
S105、基于所述损失值和校正因子,确定所述翻译模型的动态损失函数,所述动态损失函数基于所述校正因子的取值而动态调整;
对于校正因子与基础损失值的组合方式,也有不同的表示方式,这取决于校正因子对于损失值的影响大小,即本发明实施例中应用的损失函数S(h,r,t)可以表示为:
Figure BDA0003105216130000093
其中,A是第一预设阈值,B是第二预设阈值,且B大于A。
本发明实施例中,采用了不同的损失函数进行动态设置,更加拟合了不同的应用场景以及相同场景下不同数据集的情况,其中,由于校正因子的设置大于等于0,当校正因子取值不一样的时候,模型整体的损失函数也不同。
S106、将所述动态损失函数引入翻译模型进行迭代,并在迭代过程中监控所述校正因子;
监控校正因子,具体可以为:在每次迭代过程结束后计算所述校正因子,并基于每次校正因子计算所述校正因子的标准差;
基于所述校正因子调整所述动态损失函数,将所述调整后的动态损失函数用于下一次迭代过程。
此外,在迭代之前,还需要设置所述翻译模型的超参数,包括不限于准确率,边际值γ,嵌入维度和批处理。
S107、计算所述校正因子的标准差,当所述校正因子低于第一预设阈值且所述校正因子的标准差低于第二预设阈值时,结束模型迭代,获取迭代后的所述知识三元组的第二向量;
本发明实施例中,在翻译模型中利用训练集进行迭代训练,并持续的对校正因子的变化进行监控,当校正因子低于第一预设阈值且标准差低于第二预设阈值时,则停止模型的训练学习,此时,模型训练完成。
此外,在迭代过程中,采用随机梯度下降方法对所述翻译模型进行优化。
其中,基于下列公式7计算所述校正因子的标准差:
Figure BDA0003105216130000101
其中σ为标准差,μ为λi的算数平均值,λi是第i次迭代后的校正因子。
经本发明实施例的损失函数的计算,会使得向量空间中,各个向量较为分散,在模型评估中,就表现为准确率提高了,噪声降低了。因为,此类表示学习模型使用的评价方式是计算h+r≈t,使得头实体加上关系,在找到的距离最近(经过向量计算,差值最小)的对应实体向量中,可以得到正确的存在于数据集的尾实体。
S108、基于所述知识三元组的第二向量,设立知识图谱;
通过校正因子进行模型后,输出知识三元组的第二向量
Figure BDA0003105216130000111
S109、基于所述知识图谱,设立商品及对应描述。
本发明实施例提供的方法,在翻译模型开始迭代前,设置校正因子和损失值,并基于校正因子和损失值设置动态损失函数,该动态损失函数在每次迭代后进行动态调整,通过增加实体间的相对距离,可以有效的提高PKG表示学习模型的准确率,降低PKG中的噪声,应用前景更广,经测试,可适用于超大规模的电子商品平台中。
本发明实施例还包括一种装置,其特征在于,包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时实现上述方法。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机可执行指令,该计算机可执行指令用于执行上述实施例中的方法。
本发明实施例还提供一种装置,包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时实现上述方法。
图3为一个实施例中装置的硬件组成示意图。可以理解的是,图3仅仅示出了装置的简化设计。在实际应用中,装置还可以分别包含必要的其他元件,包含但不限于任意数量的输入/输出系统、处理器、控制器、存储器等,而所有可以实现本申请实施例的大数据管理方法的装置都在本申请的保护范围之内。
存储器包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read至only memory,ROM)、可擦除可编程只读存储器(erasable programmable readonly memory,EPROM)、或便携式只读存储器(compact disc read至only memory,CD至ROM),该存储器用于相关指令及数据。
输入系统用于输入数据和/或信号,以及输出系统用于输出数据和/或信号。输出系统和输入系统可以是独立的器件,也可以是一个整体的器件。
处理器可以包括是一个或多个处理器,例如包括一个或多个中央处理器(centralprocessing unit,CPU),在处理器是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。处理器还可以包括一个或多个专用处理器,专用处理器可以包括GPU、FPGA等,用于进行加速处理。
存储器用于存储网络设备的程序代码和数据。
处理器用于调用该存储器中的程序代码和数据,执行上述方法实施例中的步骤。具体可参见方法实施例中的描述,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程系统。该计算机指令可以存储在计算机可读存储介质中,或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是只读存储器(read至onlymemory,ROM),或随机存储存储器(random access memory,RAM),或磁性介质,例如,软盘、硬盘、磁带、磁碟、或光介质,例如,数字通用光盘(digital versatile disc,DVD)、或者半导体介质,例如,固态硬盘(solid state disk,SSD)等。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于人工智能的商品描述方法,其特征在于,包括:
云服务器获取商品实体entity、商品描述describe和商品搜索排序search关系;
将所述实体、描述和搜索排序组成多个知识三元组{h,r,t},其中h表示商品实体,r表示搜索排序关系,t表示商品描述;
将所述知识三元组输入BERT模型,获取所述知识三元组的第一向量;
基于所述知识三元组的第一向量,设置翻译模型的损失值与校正因子;
基于所述损失值和校正因子,确定所述翻译模型的动态损失函数,所述动态损失函数基于所述校正因子的取值而动态调整;
将所述动态损失函数引入翻译模型进行迭代,并在迭代过程中监控所述校正因子;
计算所述校正因子的标准差,当所述校正因子低于第一预设阈值且所述校正因子的标准差低于第二预设阈值时,结束模型迭代,获取迭代后的所述知识三元组的第二向量;
基于所述知识三元组的第二向量,设立知识图谱;
基于所述知识图谱,设立商品及对应描述。
2.根据权利要求1所述的方法,其特征在于,所述基于所述知识三元组的向量,设置翻译模型的损失值与校正因子,包括:
基于如下公式求取损失值f(h,r,t)
Figure FDA0003105216120000011
基于如下公式求取校正因子λ
Figure FDA0003105216120000021
其中,Dr=(∑||Δr||o)/N,
Figure FDA0003105216120000022
Zt=(β∑||Δt||o)/N
K为自定义超参数,Dr为检索排序关系不同向量之间的平均距离,Zh为商品实体不同向量之间的平均距离,Zt为商品描述不同向量之间的平均距离,Δr,Δt,Δh分别为检索排序向量的欧式距离,商品描述向量的欧式距离,商品实体向量的欧式距离,α,β为自定义权重因子。
3.根据权利要求2所述的方法,其特征在于,基于所述损失值和校正因子,确定所述翻译模型的动态损失函数,包括:
基于如下公式设置损失函数S(h,r,t):
Figure FDA0003105216120000023
其中,A是第一预设阈值,B是第二预设阈值。
4.根据权利要求2所述的方法,其特征在于,所述在迭代过程中监控所述校正因子,包括:
在每次迭代过程结束后计算所述校正因子,并基于每次校正因子计算所述校正因子的标准差;
基于所述校正因子调整所述动态损失函数,将所述调整后的动态损失函数用于下一次迭代过程。
5.根据权利要求4所述的方法,其特征在于,所述基于每次校正因子计算所述校正因子的标准差,包括:
基于下列公式计算所述校正因子的标准差:
Figure FDA0003105216120000031
其中σ为标准差,μ为λi的算数平均值,λi是第i次迭代后的校正因子。
6.根据权利要求1所述的方法,其特征在于,所述将所述知识三元组输入BERT模型,获取所述知识三元组的第一向量,包括:
下载模型和分类器,对所述知识三元组进行序列化标记;
增加标签以及注意力屏蔽,对序列对进行分割,输入到所述BERT模型中,得到所述知识三元组的向量化表示。
7.根据权利要求1所述的方法,其特征在于,在所述将所述动态损失函数引入翻译模型进行迭代之前,所述方法还包括:
设置所述翻译模型的超参数。
8.根据权利要求1所述的方法,其特征在于,所述将所述知识三元组输入BERT模型之前,所述方法还包括:
对所述知识三元组进行数据去噪及数据压缩。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在迭代过程中,采用随机梯度下降方法对所述翻译模型进行优化。
10.一种装置,其特征在于,包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时实现权利要求1至9任一项所述的方法。
CN202110634891.6A 2021-06-08 2021-06-08 一种基于人工智能的商品描述方法及装置 Withdrawn CN113256386A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110634891.6A CN113256386A (zh) 2021-06-08 2021-06-08 一种基于人工智能的商品描述方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110634891.6A CN113256386A (zh) 2021-06-08 2021-06-08 一种基于人工智能的商品描述方法及装置

Publications (1)

Publication Number Publication Date
CN113256386A true CN113256386A (zh) 2021-08-13

Family

ID=77186970

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110634891.6A Withdrawn CN113256386A (zh) 2021-06-08 2021-06-08 一种基于人工智能的商品描述方法及装置

Country Status (1)

Country Link
CN (1) CN113256386A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610034A (zh) * 2021-08-16 2021-11-05 脸萌有限公司 识别视频中人物实体的方法、装置、存储介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610034A (zh) * 2021-08-16 2021-11-05 脸萌有限公司 识别视频中人物实体的方法、装置、存储介质及电子设备
CN113610034B (zh) * 2021-08-16 2024-04-30 脸萌有限公司 识别视频中人物实体的方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
US9218365B2 (en) Device, system, and method of visual inference by collaborative composition
CN110532417B (zh) 基于深度哈希的图像检索方法、装置及终端设备
WO2022057658A1 (zh) 推荐模型训练方法、装置、计算机设备及存储介质
CN107766555B (zh) 基于软约束无监督型跨模态哈希的图像检索方法
CN114048331A (zh) 一种基于改进型kgat模型的知识图谱推荐方法及系统
CN111881671B (zh) 一种属性词提取方法
CN112734873B (zh) 对抗生成网络的图像属性编辑方法、装置、设备及介质
CN111052128B (zh) 用于检测和定位视频中的对象的描述符学习方法
CN111581923A (zh) 文案生成方法、装置、设备和计算机可读存储介质
CN111581926A (zh) 文案生成方法、装置、设备和计算机可读存储介质
US20210073890A1 (en) Catalog-based image recommendations
CN113011568B (zh) 一种模型的训练方法、数据处理方法及设备
CN111091010A (zh) 相似度确定、网络训练、查找方法及装置和存储介质
CN114547307A (zh) 文本向量模型训练方法、文本匹配方法、装置及设备
CN112418320A (zh) 一种企业关联关系识别方法、装置及存储介质
CN113849661A (zh) 实体嵌入数据的提取方法和装置、电子设备、存储介质
US20230229570A1 (en) Graph machine learning for case similarity
KR20150112832A (ko) 산출 프로그램, 산출 장치 및 산출 방법
CN114861758A (zh) 多模态数据处理方法、装置、电子设备及可读存储介质
CN113256386A (zh) 一种基于人工智能的商品描述方法及装置
CN111832782B (zh) 确定物品物流属性的方法和装置
US11568621B2 (en) Dynamic character model fitting of three-dimensional digital items
CN115344794A (zh) 一种基于知识图谱语义嵌入的旅游景点推荐方法
Wu et al. Active 3-D shape cosegmentation with graph convolutional networks
CN113139556B (zh) 基于自适应构图的流形多视图图像聚类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210813