CN112329954A - 物品召回方法、装置、终端设备及存储介质 - Google Patents

物品召回方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
CN112329954A
CN112329954A CN202011217586.9A CN202011217586A CN112329954A CN 112329954 A CN112329954 A CN 112329954A CN 202011217586 A CN202011217586 A CN 202011217586A CN 112329954 A CN112329954 A CN 112329954A
Authority
CN
China
Prior art keywords
recalled
article
item
similarity
recall
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011217586.9A
Other languages
English (en)
Other versions
CN112329954B (zh
Inventor
纪曾文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202011217586.9A priority Critical patent/CN112329954B/zh
Publication of CN112329954A publication Critical patent/CN112329954A/zh
Application granted granted Critical
Publication of CN112329954B publication Critical patent/CN112329954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/30Administration of product recycling or disposal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W90/00Enabling technologies or technologies with a potential or indirect contribution to greenhouse gas [GHG] emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Sustainable Development (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请适用于人工智能技术领域,提供了一种物品召回方法、装置、终端设备及存储介质,该方法包括:根据待召回的召回物品的向量特征计算向量相似度,根据向量相似度构建相似度列表;对用户点击序列与待召回的召回物品进行匹配得到目标召回物品,将目标召回物品的相似度列表设置为点击物品的相似度列表;根据点击物品的相似度列表计算物品相似度,根据点击物品相似度进行排序得到物品召回列表;根据物品召回列表对待召回的召回物品进行物品召回。本申请通过物品相似度对待召回的召回物品进行排序得到物品召回列表,根据物品召回列表对待召回的召回物品进行物品召回,提高了物品召回的准确率。此外,本申请还涉及区块链技术。

Description

物品召回方法、装置、终端设备及存储介质
技术领域
本申请涉及人工智能领域,尤其涉及一种物品召回方法、装置、终端设备 及存储介质。
背景技术
随着技术的发展,系统中包含的相似的物品的数量也越来越多,在用户搜 索到原始物品时,如何将与原始物品类似的其他待召回的召回物品召回给用户 是一个亟待解决的技术问题,在该技术问题中,如何确定待召回的召回物品与 原始物品之间的相似度评价最为关键。
现有的物品召回,是利用离线的用户行为日志,计算用户点击过的物品作 为用户感兴趣物品,构建物品矩阵以计算物品与物品两两相似度,使得可以离 线计算用户的召回列表,但系统中的物品数量较多时,物品矩阵的维度过高, 导致基于物品矩阵计算物品与物品两两相似度的准确性低下,进而降低了物品 召回的准确率。
发明内容
有鉴于此,本申请实施例提供了一种物品召回方法、装置、终端设备及存 储介质,以解决现有技术的物品召回过程中,由于在物品数量较多时,物品矩 阵的维度过高,所导致的物品召回准确率低下的问题。
本申请实施例的第一方面提供了一种物品召回方法,包括:
获取待召回的召回物品,并提取所述待召回的召回物品的向量特征;
根据所述向量特征计算不同所述待召回的召回物品之间的向量相似度,并 根据所述向量相似度构建所述待召回的召回物品的相似度列表;
获取用户点击物品的点击序列,将所述点击序列中的点击物品与所述待召 回的召回物品进行匹配得到目标召回物品,并将所述目标召回物品的所述相似 度列表设置为所述点击物品的相似度列表;
根据所述点击物品的相似度列表计算不同所述待召回的召回物品与所述点 击序列之间的物品相似度,并根据所述物品相似度对所述待召回的召回物品进 行排序,得到物品召回列表;
根据所述物品召回列表对所述待召回的召回物品进行物品召回。
进一步地,所述根据所述向量特征计算不同所述待召回的召回物品之间的 向量相似度,并根据所述向量相似度构建所述待召回的召回物品的相似度列表, 包括:
计算不同所述向量特征之间的余弦值,得到不同所述待召回的召回物品之 间的所述向量相似度;
对任一所述待召回的召回物品,根据所述待召回的召回物品与其他待召回 的召回物品之间的向量相似度,构建所述待召回的召回物品对应的所述相似度 列表,得到所述待召回的召回物品的相似度列表,其中,所述其他待召回的召 回物品与所述待召回的召回物品不相同;循环执行所述对任一所述待召回的召 回物品,根据所述待召回的召回物品与其他待召回的召回物品之间的向量相似 度的步骤以及后续步骤,直到计算出所有待召回的召回物品的相似度列表。
进一步地,所述获取用户点击物品的点击序列,包括:
获取所述用户在第一预设时长内的物品点击信息,所述物品点击信息包括 所述用户在第一预设时长内点击的点击物品与对应的点击时间;
根据所述点击时间对所述用户在第一预设时长内点击的点击物品进行排序, 得到所述点击序列。
进一步地,所述获取所述用户在第一预设时长内的物品点击信息之后,还 包括:
若所述用户在第一预设时长内有点击相同的点击物品,则获取所述相同的 点击物品对应的点击时间,并计算所述相同的点击物品对应的点击时间与当前 时间之间的时间差;
将最小所述时间差对应的所述相同的点击物品进行保留,并在所述物品点 击信息中删除其余所述时间差对应的所述相同的点击物品。
进一步地,所述获取待召回的召回物品,并提取所述待召回的召回物品的 向量特征,包括:
获取不同样本对象在第二预设时长内的物品点击数量,所述样本对象是预 先设置的用户;
若任一所述样本对象在第二预设时长内的物品点击数量大于数量阈值,则 获取所述样本对象在第二预设时长内点击的物品,得到所述待召回的召回物品;
将所述待召回的召回物品输入词向量模型进行特征提取,得到所述向量特 征。
进一步地,所述根据所述点击物品的相似度列表计算不同所述待召回的召 回物品与所述点击序列之间的物品相似度,包括:
根据所述点击物品的相似度列表,分别获取不同所述待召回的召回物品与 不同所述点击物品之间的所述向量相似度;
分别计算所述待召回的召回物品与不同所述点击物品之间的所述向量相似 度的和,得到所述待召回的召回物品与所述点击序列之间的物品相似度。
进一步地,所述根据所述物品相似度对所述待召回的召回物品进行排序, 得到物品召回列表之后,还包括:
若任一所述待召回的召回物品与所述点击序列之间的所述物品相似度小于 相似度阈值,则在所述物品召回列表中删除所述待召回的召回物品。
本申请实施例的第二方面提供了一种物品召回装置,包括:
向量特征提取单元,用于获取待召回的召回物品,并提取所述待召回的召 回物品的向量特征;
列表构建单元,用于根据所述向量特征计算不同所述待召回的召回物品之 间的向量相似度,并根据所述向量相似度构建所述待召回的召回物品的相似度 列表;
列表查询单元,用于获取用户点击物品的点击序列,将所述点击序列中的 点击物品与所述待召回的召回物品进行匹配得到目标召回物品,并将所述目标 召回物品的所述相似度列表设置为所述点击物品的相似度列表;
相似度计算单元,用于根据所述点击物品的相似度列表计算不同所述待召 回的召回物品与所述点击序列之间的物品相似度,并根据所述物品相似度对所 述待召回的召回物品进行排序,得到物品召回列表;
物品召回单元,用于根据所述物品召回列表对所述待召回的召回物品进行 物品召回。
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及 存储在所述存储器中并可在终端设备上运行的计算机程序,所述处理器执行所 述计算机程序时实现第一方案提供的物品召回方法的各步骤。
本申请实施例的第四方面提供了一种存储介质,所述存储介质存储有计算 机程序,所述计算机程序被处理器执行时实现第一方案提供的物品召回方法的 各步骤。
实施本申请实施例提供的一种物品召回方法、装置、终端设备及存储介质 具有以下有益效果:
本申请实施例提供的一种物品召回方法,通过计算不同待召回的召回物品 之间的向量相似度,并根据向量相似度构建不同待召回的召回物品的相似度列 表,有效的方便了不同待召回的召回物品之间向量相似度的查询,基于点击序 列中不同点击物品对应相似度列表的设置,能有效的获取到点击序列中不同点 击物品与不同待召回的召回物品之间的向量相似度,基于点击序列中不同点击 物品与不同待召回的召回物品之间的向量相似度,以计算不同待召回的召回物 品与点击序列之间的物品相似度,由于物品相似度表用于表征对应待召回的召 回物品与点击序列之间相似程度,通过物品相似度对待召回的召回物品进行排 序得到物品召回列表,并根据物品召回列表对待召回的召回物品进行物品召回, 有效的提高了物品召回的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技 术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅 仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳 动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种物品召回方法的实现流程图;
图2是本申请另一实施例提供的一种物品召回方法的实现流程图;
图3是本申请实施例提供的一种物品召回装置的结构框图;
图4是本申请实施例提供的一种终端设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅 仅用以解释本申请,并不用于限定本申请。
本申请实施例所涉及的物品召回方法,可以由控制设备或终端(以下称“移 动终端”)执行。
请参阅图1,图1示出了本申请实施例提供的一种物品召回方法的实现流 程图,包括:
步骤S10,获取待召回的召回物品,并提取所述待召回的召回物品的向量 特征。
其中,该待召回的召回物品的数量和物品信息均可以根据需求进行设置, 该物品信息包括对应待召回的召回物品的物品标识和调用地址,该调用地址用 于保障对应待召回的召回物品的调用,例如,本实施例中的待召回的召回物品 包括待召回的召回物品A、待召回的召回物品B和待召回的召回物品C。
具体的,该步骤中,根据获取到的待召回的召回物品生成训练样本,并将 该训练样本输入词向量(word2vec)模型进行训练,当word2vec模型收敛后,根 据收敛后的word2vec模型对待召回的召回物品进行特征提取,得到待召回的召 回物品的向量特征,需要说明的是,word2vec模型用于训练词向量,word2vec 模型所需的训练样本为文章的切词,而本实施例中,将文章比作用户,切词比 作待召回的召回物品,使得word2vec模型训练得到的词向量即为待召回的召回 物品的向量特征。
步骤S20,根据所述向量特征计算不同所述待召回的召回物品之间的向量 相似度,并根据所述向量相似度构建所述待召回的召回物品的相似度列表。
其中,可以基于欧式距离公式或不同向量特征之间的矢量关系,以计算不 同待召回的召回物品之间的向量相似度,例如,本实施例中的待召回的召回物 品包括待召回的召回物品A、待召回的召回物品B和待召回的召回物品C,将 待召回的召回物品A、待召回的召回物品B和待召回的召回物品C输入收敛后 的word2vec模型得到的向量特征为向量特征a、向量特征b和向量特征c,通 过根据欧式距离公式分别计算向量特征a与向量特征b之间、向量特征a与向 量特征c之间、向量特征b与向量特征c之间的相似度,以得到向量相似度s1、向量相似度s2和向量相似度s3。
可选的,该步骤中,基于得到的向量相似度s1和向量相似度s2构建该待 召回的召回物品A对应的相似度列表,基于得到的向量相似度s1和向量相似 度s3构建该待召回的召回物品B对应的相似度列表,基于得到的向量相似度 s2和向量相似度s3构建该待召回的召回物品C对应的相似度列表。
步骤S30,获取用户点击物品的点击序列,将所述点击序列中的点击物品 与所述待召回的召回物品进行匹配得到目标召回物品,并将所述目标召回物品 的所述相似度列表设置为所述点击物品的相似度列表。
该步骤中,通过将点击序列中的点击物品与待召回的召回物品进行匹配, 以判断待召回的召回物品中是否存在与该用户在第一预设时间内点击的点击物 品相匹配的物品,并将与该用户在第一预设时间内点击的点击物品相匹配的待 召回的召回物品对应的相似度列表设置为对应点击物品的相似度列表。
例如,点击序列中的点击物品包括物品a1、物品a2、物品a3和物品a4, 将物品a1、物品a2、物品a3和物品a4与本实施例中的待召回的召回物品进行 匹配,得到目标召回物品,并将目标召回物品的相似度列表设置为对应物品a1、 物品a2、物品a3和物品a4的相似度列表,得到相似度列表b1、相似度列表 b2、相似度列表b3和相似度列表b4,该相似度列表b1中存储有物品a1与不 同待召回的召回物品之间的向量相似度,相似度列表b2中存储有物品a2与不 同待召回的召回物品之间的向量相似度,相似度列表b3中存储有物品a3与不同待召回的召回物品之间的向量相似度,相似度列表b4中存储有物品a4与不 同待召回的召回物品之间的向量相似度。具体的,该步骤中,所述获取用户点 击物品的点击序列,包括:
获取所述用户在第一预设时长内的物品点击信息,该物品点击信息包括用 户在第一预设时长内点击的点击物品与对应的点击时间,并根据所述点击时间 对所述用户在第一预设时长内点击的点击物品进行排序,得到所述点击序列;
其中,该第一预设时长可以根据需求进行设置,例如,该第一预设时长可 以设置为1天、1周或1个月等,通过根据点击时间可以采用升序或降序等方 式对用户在第一预设时长内点击的点击物品进行排序,以得到对应的点击序列。
可选的,该步骤中,所述获取所述用户在第一预设时长内的物品点击信息 之后,还包括:
对所述用户在第一预设时长内点击的点击物品进行重复点击检测;
若所述用户在第一预设时长内有点击相同的点击物品,则分别获取所述相 同的点击物品的点击时间,并根据所述相同的点击物品的点击时间进行物品删 除,且删除掉的所述点击物品的数量小于所述相同的点击物品的数量;
其中,该重复点击检测用于检测用户在第一预设时长内是否有点击相同的 点击物品,若用户在第一预设时长内有点击相同的点击物品,则在该物品点击 信息中存在物品重复点击现象。
例如,该物品点击信息包括用户在一天内点击的点击物品和对应的点击时 间,该物品点击信息包括:上午点击的物品H、物品I和下午点击的物品H, 由于该用户一天内有重复对物品H进行点击,则用户在第一预设时长内有点击 相同的点击物品“物品H”,分别获取上午点击的物品H和下午点击的物品H 对应的点击时间,得到点击时间d1和点击时间d2,并根据点击时间d1和点击时 间d2进行物品的删除,以防止物品点击信息中重复点击的物品对相似度列表构 建的影响。
具体的,该步骤中,若针对同一个点击物品,相同的点击物品的数量为n 个时,则删除掉的点击物品的数量为n-1个,例如,若针对物品H,相同的数 量为2个时,则删除1个物品H,仅保留另1个物品H,若针对物品H,相同 的点击物品的数量为10个时,则删除9个物品H。
优选的,该步骤中,所述据所述相同的点击物品的点击时间进行物品删除, 包括:
获取所述相同的点击物品对应的点击时间,并计算所述相同的点击物品对 应的点击时间与当前时间之间的时间差;
将最小所述时间差对应的所述相同的点击物品进行保留,并在所述物品点 击信息中删除其余所述时间差对应的所述相同的点击物品;
其中,通过分别计算相同的点击物品的点击时间与当前时间之间的时间差, 并将最小时间差对应的相同的点击物品进行保留,使得在物品点击信息中针对 同一点击物品仅保留一个点击信息,以防止物品点击信息中重复点击的物品对 相似度列表构建的影响。
例如,针对物品H,存在不同点击时间的相同物品H1、物品H2和物品H3, 则分别获取物品H1、物品H2和物品H3的点击时间,得到点击时间d3、点击时 间d4和点击时间d5,并根据当前时间分别计算与点击时间d3、点击时间d4和 点击时间d5之间的时间差,得到时间差m1、时间差m2和时间差m3,且当时间 差m1小于时间差m2,时间差m2小于时间差m3时,则仅保留时间差m1对应的 相同物品H1,该相同物品H1是针对物品H距离当前时间最近的一次点击行为。
步骤S40,根据所述点击物品的相似度列表计算不同所述待召回的召回物 品与所述点击序列之间的物品相似度,并根据所述物品相似度对所述待召回的 召回物品进行排序,得到物品召回列表。
其中,根据物品的相似度列表能有效的计算到不同待召回的召回物品与点 击序列中所有点击物品之间的向量相似度,即对应的得到了不同待召回的召回 物品与点击序列之间的物品相似度,当该物品相似度越大时,则该物品相似度 对应的待召回的召回物品与该点击序列之间的相似度越大。
具体的,该步骤中,可以基于物品相似度采用降序的方式对待召回的召回 物品进行排序,得到该物品召回列表,进一步地,该步骤中,可以基于预设个 数对该物品召回列表进行过滤,以防止由于物品召回列表中待召回的召回物品 较多所导致的召回效率低下的现象,该预设个数可以根据需求进行设置,例如, 该预设个数可以设置为10个、20个或30个等,当该预设个数设置为10个时, 则在该物品召回列表中仅保留序号在前10位的待召回的召回物品。
可选的,该步骤中,所述根据所述物品相似度对所述待召回的召回物品进 行排序,得到物品召回列表之后,还包括:若任一所述待召回的召回物品与所 述点击序列之间的所述物品相似度小于相似度阈值,则在所述物品召回列表中 删除所述待召回的召回物品,其中,该相似度阈值用于检测该物品相似度对应 的待召回的召回物品是否满足召回条件,通过在该物品召回列表中删除物品相 似度小于相似度阈值的待召回的召回物品,有效的提高了物品召回的准确性。
步骤S50,根据所述物品召回列表对所述待召回的召回物品进行物品召回。
其中,根据该物品召回列表中不同待召回的召回物品的排序顺序依序进行 物品召回,使得先召回与用户点击序列相似度较高的待召回的召回物品,提高 了物品召回的准确性。
本实施例中,通过计算不同待召回的召回物品之间的向量相似度,并根据 向量相似度构建不同待召回的召回物品的相似度列表,有效的方便了不同待召 回的召回物品之间向量相似度的查询,基于点击序列中不同点击物品对应相似 度列表的设置,能有效的获取到点击序列中不同点击物品与不同待召回的召回 物品之间的向量相似度,基于点击序列中不同点击物品与不同待召回的召回物 品之间的向量相似度,以计算不同待召回的召回物品与点击序列之间的物品相 似度,由于物品相似度表用于表征对应待召回的召回物品与点击序列之间相似 程度,通过物品相似度对待召回的召回物品进行排序得到物品召回列表,并根 据物品召回列表对待召回的召回物品进行物品召回,有效的提高了物品召回的 准确率。
请参阅图2,图2是本申请另一实施例提供的一种物品召回方法的实现流 程图。相对于图1对应的实施例,本实施例提供的物品召回方法是对图1对应 的实施例中步骤S20的进一步细化,包括:
步骤S21,计算不同所述向量特征之间的余弦值,得到不同所述待召回的 召回物品之间的所述向量相似度。
其中,通过基于余弦值的方式以表征对应两个向量特征之间的相似度,以 得到对应两个待召回的召回物品之间的向量相似度,例如,针对待召回的召回 物品A和待召回的召回物品B,待召回的召回物品A对应的向量特征为向量特 征a,待召回的召回物品B对应的向量特征为向量特征b,则在向量特征a与向 量特征b之间进行余弦计算,得到余弦值x,该余弦值x为待召回的召回物品 A和待召回的召回物品B之间的向量相似度。
步骤S22,对任一所述待召回的召回物品,根据所述待召回的召回物品与 其他待召回的召回物品之间的向量相似度,构建所述待召回的召回物品对应的 所述相似度列表,得到所述待召回的召回物品的相似度列表;
其中,该其他待召回的召回物品与待召回的召回物品不相同,循环执行对 任一待召回的召回物品,根据待召回的召回物品与其他待召回的召回物品之间 的向量相似度的步骤以及后续步骤,直到计算出所有待召回的召回物品的相似 度列表。
具体的,该步骤中,待召回的召回物品的相似度列表包含该待召回的召回 物品与其他待召回的召回物品之间的向量相似度,例如,本实施例中的待召回 的召回物品包括待召回的召回物品A、待召回的召回物品B、待召回的召回物 品C和待召回的召回物品D,针对待召回的召回物品A、待召回的召回物品B、 待召回的召回物品C和待召回的召回物品D,根据向量相似度均构建有对应的 相似度列表,则针对待召回的召回物品A的相似度列表包含待召回的召回物品 A与待召回的召回物品B之间、待召回的召回物品A与待召回的召回物品C之 间、待召回的召回物品A与待召回的召回物品D之间的向量相似度,并通过采 用列表的方式将待召回的召回物品A与待召回的召回物品B之间、待召回的召 回物品A与待召回的召回物品C之间、待召回的召回物品A与待召回的召回 物品D之间的向量相似度进行存储,得到该待召回的召回物品A对应相似度列 表。
可选的,该步骤中,针对图1对应的实施例中的步骤S1,所述获取待召回 的召回物品,并提取所述待召回的召回物品的向量特征,包括:
获取不同样本对象在第二预设时长内的物品点击数量;
若任一所述样本对象在第二预设时长内的物品点击数量大于数量阈值,则 获取所述样本对象在第二预设时长内点击的物品,得到所述待召回的召回物品;
将所述待召回的召回物品输入词向量模型进行特征提取,得到所述向量特 征;
其中,该样本对象是预先设置的用户,该第二预设时长和数量阈值均可以 根据需求进行设置,例如,当该步骤中的第二预设时长设置为30天、数量阈值 设置为2个,则判断不同样本对象在30天内的物品点击数量是否大于2个,若 样本对象在30天内的物品点击数量大于2个,则获取样本对象在30天内点击 的物品,得到该待召回的召回物品,若样本对象在30天内的物品点击数量小于 或等于2个,则判定该样本对象是无效对象,针对该无效对象不进行待召回的 召回物品的获取。
进一步地,本实施例中,针对图1对应的实施例中的步骤S40,所述根据 所述点击物品的相似度列表计算不同所述待召回的召回物品与所述点击序列之 间的物品相似度,包括:
根据所述点击物品的相似度列表,分别获取不同所述待召回的召回物品与 不同所述点击物品之间的所述向量相似度;
分别计算所述待召回的召回物品与不同所述点击物品之间的所述向量相似 度的和,得到所述待召回的召回物品与所述点击序列之间的物品相似度;
其中,通过分别获取不同待召回的召回物品与不同物品之间的向量相似度, 提高了待召回的召回物品与点击序列之间物品相似度计算的准确性;
例如,当待召回的召回物品包括待召回的召回物品r1、待召回的召回物品 r2和待召回的召回物品r3,点击序列包括物品r4和物品r5,物品r4和物品r5 对应的相似度列表为相似度列表E1和相似度列表E2,由于相似度列表E1中 存储有物品r4与不同待召回的召回物品之间的向量相似度,相似度列表E2中 存储有物品r5与不同待召回的召回物品之间的向量相似度,因此,根据相似度 列表E1分别获取待召回的召回物品r1、待召回的召回物品r2和待召回的召回 物品r3与物品r4之间的向量相似度,得到向量相似度p1、向量相似度p2、向 量相似度p3和向量相似度p4,根据相似度列表E2分别获取待召回的召回物品 r1、待召回的召回物品r2和待召回的召回物品r3与物品r5之间的向量相似度, 得到向量相似度p5、向量相似度p6、向量相似度p7和向量相似度p8。
具体的,针对待召回的召回物品r1,则计算向量相似度p1与向量相似度 p5之间的和,得到物品相似度w1,该物品相似度w1为待召回的召回物品r1 与用户点击序列之间的相似度,可以理解的,针对待召回的召回物品r2,则计 算向量相似度p2与向量相似度p6之间的和,得到物品相似度w2,针对待召回 的召回物品r3,则计算向量相似度p3与向量相似度p7之间的和,得到物品相 似度w3,针对待召回的召回物品r4,则计算向量相似度p4与向量相似度p8 之间的和,得到物品相似度w4。
需要说明的是,若w1大于w2,w2小于w3,w3小于w4,w4小于w1, 则步骤S40中物品召回列表排序后的顺序为待召回的召回物品r1-待召回的召 回物品r4-待召回的召回物品r3-待召回的召回物品r2。
本实施例中,通过基于余弦值的方式以表征对应两个向量特征之间的相似 度,以得到对应两个待召回的召回物品之间的向量相似度,基于不同待召回的 召回物品之间的向量相似度以构建不同待召回的召回物品的相似度列表,提高 了相似度列表构建的准确性,针对同一待召回的召回物品,通过计算与不同物 品之间向量相似度的和,以准确计算待召回的召回物品与用户点击序列之间的 物品相似度,通过基于不同待召回的召回物品与用户点击序列之间的物品相似 度构建得到的物品召回列表,有效的提高了物品召回的准确性。
在本申请的所有实施例中,根据物品相似度对待召回的召回物品进行排序 得到物品召回列表,具体来说,物品召回列表由物品相似度对待召回的召回物 品进行排序得到。将物品召回列表上传至区块链可保证其安全性和对用户的公 正透明性。用户设备可以从区块链中下载得到该物品召回列表,以便查证物品 召回列表是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共 识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上 是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一 个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和 生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
请参阅图3,图3是本申请实施例提供的一种物品召回装置100的结构框 图。本实施例中该物品召回装置100包括的各单元用于执行图1、图2对应的 实施例中的各步骤。具体请参阅图1、图2以及图1、图2所对应的实施例中 的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图3,物 品召回装置100包括:向量特征提取单元10、列表构建单元11、列表查询单元 12、相似度计算单元13和物品召回单元14,其中:
向量特征提取单元10,用于获取待召回的召回物品,并提取所述待召回的 召回物品的向量特征。
其中,向量特征提取单元10还用于:获取不同样本对象在第二预设时长内 的物品点击数量,所述样本对象是预先设置的用户;
若任一所述样本对象在第二预设时长内的物品点击数量大于数量阈值,则 获取所述样本对象在第二预设时长内点击的物品,得到所述待召回的召回物品;
将所述待召回的召回物品输入词向量模型进行特征提取,得到所述向量特 征。
列表构建单元11,用于根据所述向量特征计算不同所述待召回的召回物品 之间的向量相似度,并根据所述向量相似度构建所述待召回的召回物品的相似 度列表。
其中,列表构建单元11还用于:计算不同所述向量特征之间的余弦值,得 到不同所述待召回的召回物品之间的所述向量相似度;
对任一所述待召回的召回物品,根据所述待召回的召回物品与其他待召回 的召回物品之间的向量相似度,构建所述待召回的召回物品对应的所述相似度 列表,得到所述待召回的召回物品的相似度列表,其中,所述其他待召回的召 回物品与所述待召回的召回物品不相同;循环执行所述对任一所述待召回的召 回物品,根据所述待召回的召回物品与其他待召回的召回物品之间的向量相似 度的步骤以及后续步骤,直到计算出所有待召回的召回物品的相似度列表。
列表查询单元12,用于获取用户点击物品的点击序列,将所述点击序列中 的点击物品与所述待召回的召回物品进行匹配得到目标召回物品,并将所述目 标召回物品的所述相似度列表设置为所述点击物品的相似度列表。
其中,列表查询单元12还用于:获取所述用户在第一预设时长内的物品点 击信息,所述物品点击信息包括所述用户在第一预设时长内点击的点击物品与 对应的点击时间;
根据所述点击时间对所述用户在第一预设时长内点击的点击物品进行排序, 得到所述点击序列。
可选的,列表查询单元12还用于:若所述用户在第一预设时长内有点击相 同的点击物品,则获取所述相同的点击物品对应的点击时间,并计算所述相同 的点击物品对应的点击时间与当前时间之间的时间差;
将最小所述时间差对应的所述相同的点击物品进行保留,并在所述物品点 击信息中删除其余所述时间差对应的所述相同的点击物品。
相似度计算单元13,用于根据所述点击物品的相似度列表计算不同所述待 召回的召回物品与所述点击序列之间的物品相似度,并根据所述物品相似度对 所述待召回的召回物品进行排序,得到物品召回列表。
其中,相似度计算单元13还用于:根据所述点击物品的相似度列表,分别 获取不同所述待召回的召回物品与不同所述点击物品之间的所述向量相似度;
分别计算所述待召回的召回物品与不同所述点击物品之间的所述向量相似 度的和,得到所述待召回的召回物品与所述点击序列之间的物品相似度。
可选的,相似度计算单元13还用于:若任一所述待召回的召回物品与所述 点击序列之间的所述物品相似度小于相似度阈值,则在所述物品召回列表中删 除所述待召回的召回物品。
物品召回单元14,用于根据所述物品召回列表对所述待召回的召回物品进 行物品召回。
以上可以看出,通过计算不同待召回的召回物品之间的向量相似度,并根 据向量相似度构建不同待召回的召回物品的相似度列表,有效的方便了不同待 召回的召回物品之间向量相似度的查询,基于点击序列中不同点击物品对应相 似度列表的设置,能有效的获取到点击序列中不同点击物品与不同待召回的召 回物品之间的向量相似度,基于点击序列中不同点击物品与不同待召回的召回 物品之间的向量相似度,以计算不同待召回的召回物品与点击序列之间的物品 相似度,由于物品相似度表用于表征对应待召回的召回物品与点击序列之间相 似程度,通过物品相似度对待召回的召回物品进行排序得到物品召回列表,并 根据物品召回列表对待召回的召回物品进行物品召回,有效的提高了物品召回 的准确率。
图4是本申请另一实施例提供的一种终端设备2的结构框图。如图4所示, 该实施例的终端设备2包括:处理器20、存储器21以及存储在所述存储器21 中并可在所述处理器20上运行的计算机程序22,例如物品召回方法的程序。 处理器20执行所述计算机程序23时实现上述各个物品召回方法各实施例中的 步骤,例如图1所示的S10至S50,或者图2所示的S21至S22。或者,所述 处理器20执行所述计算机程序22时实现上述图3对应的实施例中各单元的功 能,例如,图3所示的单元10至14的功能,具体请参阅图4对应的实施例中 的相关描述,此处不赘述。
示例性的,所述计算机程序22可以被分割成一个或多个单元,所述一个或 者多个单元被存储在所述存储器21中,并由所述处理器20执行,以完成本申 请。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段, 该指令段用于描述所述计算机程序22在所述终端设备2中的执行过程。例如, 所述计算机程序22可以被分割成物品召回装置100包括:向量特征提取单元 10、列表构建单元11、列表查询单元12、相似度计算单元13和物品召回单元 14,各单元具体功能如上所述。
所述终端设备可包括,但不仅限于,处理器20、存储器21。本领域技术人 员可以理解,图4仅仅是终端设备2的示例,并不构成对终端设备2的限定, 可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例 如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器20可以是中央处理单元(Central Processing Unit,CPU),还 可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专 用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵 列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门 或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处 理器也可以是任何常规的处理器等。
所述存储器21可以是所述终端设备2的内部存储单元,例如终端设备2 的硬盘或内存。所述存储器21也可以是所述终端设备2的外部存储设备,例如 所述终端设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC), 安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述 存储器21还可以既包括所述终端设备2的内部存储单元也包括外部存储设备。 所述存储器21用于存储所述计算机程序以及所述终端设备所需的其他程序和 数据。所述存储器21还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照 前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其 依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特 征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申 请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种物品召回方法,其特征在于,包括:
获取待召回的召回物品,并提取所述待召回的召回物品的向量特征;
根据所述向量特征计算不同所述待召回的召回物品之间的向量相似度,并根据所述向量相似度构建所述待召回的召回物品的相似度列表;
获取用户点击物品的点击序列,将所述点击序列中的点击物品与所述待召回的召回物品进行匹配得到目标召回物品,并将所述目标召回物品的所述相似度列表设置为所述点击物品的相似度列表;
根据所述点击物品的相似度列表计算不同所述待召回的召回物品与所述点击序列之间的物品相似度,并根据所述物品相似度对所述待召回的召回物品进行排序,得到物品召回列表;
根据所述物品召回列表对所述待召回的召回物品进行物品召回。
2.根据权利要求1所述的物品召回方法,其特征在于,所述根据所述向量特征计算不同所述待召回的召回物品之间的向量相似度,并根据所述向量相似度构建所述待召回的召回物品的相似度列表,包括:
计算不同所述向量特征之间的余弦值,得到不同所述待召回的召回物品之间的所述向量相似度;
对任一所述待召回的召回物品,根据所述待召回的召回物品与其他待召回的召回物品之间的向量相似度,构建所述待召回的召回物品对应的所述相似度列表,得到所述待召回的召回物品的相似度列表,其中,所述其他待召回的召回物品与所述待召回的召回物品不相同;循环执行所述对任一所述待召回的召回物品,根据所述待召回的召回物品与其他待召回的召回物品之间的向量相似度的步骤以及后续步骤,直到计算出所有待召回的召回物品的相似度列表。
3.根据权利要求1所述的物品召回方法,其特征在于,所述获取用户点击物品的点击序列,包括:
获取所述用户在第一预设时长内的物品点击信息,所述物品点击信息包括所述用户在第一预设时长内点击的点击物品与对应的点击时间;
根据所述点击时间对所述用户在第一预设时长内点击的点击物品进行排序,得到所述点击序列。
4.根据权利要求3所述的物品召回方法,其特征在于,所述获取所述用户在第一预设时长内的物品点击信息之后,还包括:
若所述用户在第一预设时长内有点击相同的点击物品,则获取所述相同的点击物品对应的点击时间,并计算所述相同的点击物品对应的点击时间与当前时间之间的时间差;
将最小所述时间差对应的所述相同的点击物品进行保留,并在所述物品点击信息中删除其余所述时间差对应的所述相同的点击物品。
5.根据权利要求1所述的物品召回方法,其特征在于,所述获取待召回的召回物品,并提取所述待召回的召回物品的向量特征,包括:
获取不同样本对象在第二预设时长内的物品点击数量,所述样本对象是预先设置的用户;
若任一所述样本对象在第二预设时长内的物品点击数量大于数量阈值,则获取所述样本对象在第二预设时长内点击的物品,得到所述待召回的召回物品;
将所述待召回的召回物品输入词向量模型进行特征提取,得到所述向量特征。
6.根据权利要求1所述的物品召回方法,其特征在于,所述根据所述点击物品的相似度列表计算不同所述待召回的召回物品与所述点击序列之间的物品相似度,包括:
根据所述点击物品的相似度列表,分别获取不同所述待召回的召回物品与不同所述点击物品之间的所述向量相似度;
分别计算所述待召回的召回物品与不同所述点击物品之间的所述向量相似度的和,得到所述待召回的召回物品与所述点击序列之间的物品相似度。
7.根据权利要求1所述的物品召回方法,其特征在于,所述根据所述物品相似度对所述待召回的召回物品进行排序,得到物品召回列表之后,还包括:
若任一所述待召回的召回物品与所述点击序列之间的所述物品相似度小于相似度阈值,则在所述物品召回列表中删除所述待召回的召回物品。
8.一种物品召回装置,其特征在于,包括:
向量特征提取单元,用于获取待召回的召回物品,并提取所述待召回的召回物品的向量特征;
列表构建单元,用于根据所述向量特征计算不同所述待召回的召回物品之间的向量相似度,并根据所述向量相似度构建所述待召回的召回物品的相似度列表;
列表查询单元,用于获取用户点击物品的点击序列,将所述点击序列中的点击物品与所述待召回的召回物品进行匹配得到目标召回物品,并将所述目标召回物品的所述相似度列表设置为所述点击物品的相似度列表;
相似度计算单元,用于根据所述点击物品的相似度列表计算不同所述待召回的召回物品与所述点击序列之间的物品相似度,并根据所述物品相似度对所述待召回的召回物品进行排序,得到物品召回列表;
物品召回单元,用于根据所述物品召回列表对所述待召回的召回物品进行物品召回。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN202011217586.9A 2020-11-04 2020-11-04 物品召回方法、装置、终端设备及存储介质 Active CN112329954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011217586.9A CN112329954B (zh) 2020-11-04 2020-11-04 物品召回方法、装置、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011217586.9A CN112329954B (zh) 2020-11-04 2020-11-04 物品召回方法、装置、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN112329954A true CN112329954A (zh) 2021-02-05
CN112329954B CN112329954B (zh) 2024-06-11

Family

ID=74323694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011217586.9A Active CN112329954B (zh) 2020-11-04 2020-11-04 物品召回方法、装置、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN112329954B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656708A (zh) * 2021-10-20 2021-11-16 北京搜狐新媒体信息技术有限公司 一种确定物品相似度的方法及系统
CN114443989A (zh) * 2022-01-30 2022-05-06 北京百度网讯科技有限公司 排序方法、排序模型的训练方法、装置、电子设备及介质
US20240104154A1 (en) * 2022-01-30 2024-03-28 Beijing Baidu Netcom Science Technology Co., Ltd. Ranking of recall data

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400546A (zh) * 2020-03-18 2020-07-10 腾讯科技(深圳)有限公司 一种视频召回方法、视频推荐方法及装置
CN111415196A (zh) * 2020-03-18 2020-07-14 深圳市卡牛科技有限公司 一种广告召回方法、装置、服务器及存储介质
CN111538908A (zh) * 2020-06-22 2020-08-14 腾讯科技(深圳)有限公司 搜索排序方法、装置、计算机设备和存储介质
WO2020168839A1 (zh) * 2019-02-21 2020-08-27 北京京东尚科信息技术有限公司 物品召回方法、系统、电子设备及可读存储介质
CN111782925A (zh) * 2019-04-04 2020-10-16 阿里巴巴集团控股有限公司 物品推荐方法、装置、设备、系统及可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020168839A1 (zh) * 2019-02-21 2020-08-27 北京京东尚科信息技术有限公司 物品召回方法、系统、电子设备及可读存储介质
CN111782925A (zh) * 2019-04-04 2020-10-16 阿里巴巴集团控股有限公司 物品推荐方法、装置、设备、系统及可读存储介质
CN111400546A (zh) * 2020-03-18 2020-07-10 腾讯科技(深圳)有限公司 一种视频召回方法、视频推荐方法及装置
CN111415196A (zh) * 2020-03-18 2020-07-14 深圳市卡牛科技有限公司 一种广告召回方法、装置、服务器及存储介质
CN111538908A (zh) * 2020-06-22 2020-08-14 腾讯科技(深圳)有限公司 搜索排序方法、装置、计算机设备和存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656708A (zh) * 2021-10-20 2021-11-16 北京搜狐新媒体信息技术有限公司 一种确定物品相似度的方法及系统
CN113656708B (zh) * 2021-10-20 2021-12-24 北京搜狐新媒体信息技术有限公司 一种确定物品相似度的方法及系统
CN114443989A (zh) * 2022-01-30 2022-05-06 北京百度网讯科技有限公司 排序方法、排序模型的训练方法、装置、电子设备及介质
CN114443989B (zh) * 2022-01-30 2023-02-03 北京百度网讯科技有限公司 排序方法、排序模型的训练方法、装置、电子设备及介质
WO2023142406A1 (zh) * 2022-01-30 2023-08-03 北京百度网讯科技有限公司 排序方法、排序模型的训练方法、装置、电子设备及介质
US20240104154A1 (en) * 2022-01-30 2024-03-28 Beijing Baidu Netcom Science Technology Co., Ltd. Ranking of recall data
JP7518927B2 (ja) 2022-01-30 2024-07-18 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ソーティング方法、ソーティングモデルのトレーニング方法、装置、電子機器及び記憶媒体

Also Published As

Publication number Publication date
CN112329954B (zh) 2024-06-11

Similar Documents

Publication Publication Date Title
CN112329954A (zh) 物品召回方法、装置、终端设备及存储介质
CN112613917B (zh) 基于用户画像的信息推送方法、装置、设备及存储介质
CN109242002A (zh) 高维数据分类方法、装置及终端设备
CN110888981B (zh) 基于标题的文档聚类方法、装置、终端设备及介质
EP3921760A1 (en) Mapping natural language utterances to operations over a knowledge graph
CN112559726A (zh) 简历信息的过滤方法、模型训练方法、装置、设备及介质
CN110275889B (zh) 一种适用于机器学习的特征处理方法及装置
CN112487122A (zh) 地址归一化处理方法及装置
CN112035471A (zh) 一种事务处理方法及计算机设备
CN114780606A (zh) 一种大数据挖掘方法及系统
CN112328881B (zh) 文章推荐方法、装置、终端设备及存储介质
CN112328882B (zh) 信息推荐方法、装置、终端设备及存储介质
CN109101630B (zh) 一种应用程序搜索结果的生成方法、装置及设备
CN112328779B (zh) 训练样本构建方法、装置、终端设备及存储介质
CN107203633B (zh) 数据表推数处理方法、装置及电子设备
CN111737542B (zh) 药品实体信息的搜索方法及存储介质
CN113886690A (zh) 基于用户行为的影片推荐方法、装置、电子设备及介质
CN110929207B (zh) 数据处理方法、装置和计算机可读存储介质
CN113724817A (zh) 基于人工智能的知识推荐方法、装置、计算机设备及介质
CN113282837A (zh) 事件分析方法、装置、计算机设备及存储介质
CN111611056A (zh) 数据处理方法、装置、计算机设备及存储介质
CN112000709B (zh) 一种社交媒体信息的总曝光量批量挖掘方法及装置
CN113282807B (zh) 基于二部图的关键词扩展方法、装置、设备及介质
CN114153830B (zh) 数据验证方法及其装置、计算机存储介质、电子设备
CN118332126A (zh) 用户评论信息推送方法、计算机设备与可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant