CN114065750A - 商品信息匹配、发布方法及其装置、设备、介质、产品 - Google Patents

商品信息匹配、发布方法及其装置、设备、介质、产品 Download PDF

Info

Publication number
CN114065750A
CN114065750A CN202111348124.5A CN202111348124A CN114065750A CN 114065750 A CN114065750 A CN 114065750A CN 202111348124 A CN202111348124 A CN 202111348124A CN 114065750 A CN114065750 A CN 114065750A
Authority
CN
China
Prior art keywords
text
commodity
historical
similarity
detail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111348124.5A
Other languages
English (en)
Inventor
葛莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huaduo Network Technology Co Ltd
Original Assignee
Guangzhou Huaduo Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huaduo Network Technology Co Ltd filed Critical Guangzhou Huaduo Network Technology Co Ltd
Priority to CN202111348124.5A priority Critical patent/CN114065750A/zh
Publication of CN114065750A publication Critical patent/CN114065750A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开一种商品信息匹配、发布方法及其装置、设备、介质、产品,所述匹配方法包括:获取终端设备提交的待发布商品的标题文本;提取所述标题文本的深层语义信息,获得相应的文本特征向量;计算所述文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,根据相似度对历史商品的详情文本进行排序;将排序后的详情文本推送至所述终端设备显示,以作为所述待发布商品的备选详情文本列表。本申请方便待发布商品的商品信息的录入,可根据已输入的商品信息的标题文本智能推荐商品信息的详情文本,可服务于电商领域在内的多种应用场景,具有广泛通用性。

Description

商品信息匹配、发布方法及其装置、设备、介质、产品
技术领域
本申请涉及电商信息技术领域,尤其涉及一种商品信息匹配、发布方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。
背景技术
电商平台中,存在多种应用场景需要录入商品信息,例如,当商家用户需要发布新商品时,需要提交待发布商品的商品信息;当商家用户需要发布商品广告时,也需要提交待发布商品的商品信息。对于这些应用场景,均需用户在移动终端或者计算机终端中访问电商平台的相应录入页面,向页面中输入相应的商品信息以便提交给服务器进行商品发布。
所述的商品信息包括用于概要描述商品的综合信息的商品标题、用于描述商品的详情信息(包括以广告投放为目的)的商品详情、用于展示商品形状、结构、色彩等内容的商品图片等。其中,商品标题所对应的标题文本和商品详情所对应的详情文本,均以文本形式存在,标题文本相对简单,但详情文本则相对复杂精细,当商家需要填写详情文本时,特别是对于移动终端而言,其录入编辑过程是非常繁琐低效的。由于现有技术中不存在相关辅助技术,目前面对这种情况,即使待发布商品相近似的商品已经存在相关商品信息,用户也无法直接引用,因此,在操作上给用户带来诸多不便,商品信息发布效率低下。
而在服务器侧,存在海量的商品信息,这些商品信息的数据价值存在待挖掘的空间,如果未能有效挖掘这些商品信息的数据价值,也会造成信息浪费,特别是在用户发布商品信息时,服务器如果不能提升智能服务程度,将影响电商平台的运营效率及其综合用户体验。
综上,有必要针对商品信息的匹配、发布相关的技术进行深度的研究,以探索更多适于服务实际需求的技术方案。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种商品信息匹配方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种商品信息匹配方法,包括如下步骤:
获取终端设备提交的待发布商品的标题文本;
提取所述标题文本的深层语义信息,获得相应的文本特征向量;
计算所述文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,根据相似度对历史商品的详情文本进行排序;
将排序后的详情文本推送至所述终端设备显示,以作为所述待发布商品的备选详情文本列表。
深化的实施例中,计算所述文本特征向量与商品特征库中历史商品的详情文本相对应的文本特征向量之间的相似度,根据相似度对历史商品的详情文本进行排序,包括如下步骤:
计算所述待发布商品的标题文本的文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,获得历史商品相似度序列,所述各文本特征向量均采用同一预训练的神经网络模型进行提取;
根据相似度,对历史商品相似度序列中相似度超过预设阈值的历史商品进行排序,获得第一推荐组;
构造出详情文本推荐列表用于推送至所述终端设备显示,所述详情文本推荐列表包括所述第一推荐组。
扩展的实施例中,根据相似度,对历史商品相似度序列中相似度超过预设阈值的历史商品进行排序,获得第一推荐组的步骤之后,还包括如下步骤:
根据历史商品的广告数据,对历史商品相似度序列中相似度低于预设阈值的历史商品进行排序,获得第二推荐组,第二推荐组被连接于所述详情文本推荐列表中第一推荐组之后。
具体化的实施例中,根据历史商品的广告数据,对历史商品相似度序列中相似度低于预设阈值的历史商品进行排序,获得第二推荐组,包括如下步骤:
从历史商品相似度序列中提取出相似度低于预设阈值的历史商品获得临时计算列表;
调用所述临时计算列表中各个历史商品的多项广告数据,所述广告数据包括相应的历史商品投放广告距今时长、广告投放时长、广告投放成效数据中任意一项或任意多项;
针对所述临时计算列表中的每个历史商品,将多项所述的广告数据加权求和获得相应的临时得分;
根据所述临时得分对所述临时计算列表中的历史商品进行排序,获得所述第二推荐组。
适应本申请的目的之一而提供的一种商品信息发布方法,包括如下步骤:
显示待发布商品的商品信息录入界面,该录入界面包括商品信息中标题文本相应的第一输入框和详情文本相应的第二输入框;
响应作用于第二输入框的预设触发事件,向服务器提交第一输入框中的标题文本以获取该标题文本语义上相匹配的备选详情文本列表,该列表包括多个历史商品相对应的详情文本;
将所述备选详情文本列表输出至当前录入界面以展示来源于多个历史商品的详情文本,使每个详情文本响应触控操作而添加至第二输入框中;
响应作用于所述录入界面的信息提交事件,将第一输入框和第二输入框所显示的商品信息提交至服务器以执行待发布商品的发布。
较佳的实施例中,所述作用于第二输入框的预设触发事件为所述第一输入框中输入文本所产生的文本输入事件。
扩展的实施例中,将所述备选详情文本列表输出至当前录入界面以展示来源于多个历史商品的详情文本,使每个详情文本响应触控操作而添加至第二输入框中的步骤之后,包括如下步骤:
响应作用于所述备选详情文本列表中的任意详情文本的选定事件,将选定的详情文本连接于第二输入框中的已输入内容之后显示。
适应本申请的目的之一而提供的一种商品信息匹配装置,包括:标题获取模块、语义提取模块、相似匹配模块,以及推送显示模块,其中,所述标题获取模块,用于获取终端设备提交的待发布商品的标题文本;所述语义提取模块,用于提取所述标题文本的深层语义信息,获得相应的文本特征向量;所述相似匹配模块,用于计算所述文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,根据相似度对历史商品的详情文本进行排序;所述推送显示模块,用于将排序后的详情文本推送至所述终端设备显示,以作为所述待发布商品的备选详情文本列表。
深化的实施例中,所述相似计算模块,包括:相似计算子模块,用于计算所述待发布商品的标题文本的文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,获得历史商品相似度序列,所述各文本特征向量均采用同一预训练的神经网络模型进行提取;相似优选子模块,用于根据相似度,对历史商品相似度序列中相似度超过预设阈值的历史商品进行排序,获得第一推荐组;列表推送子模块,用于构造出详情文本推荐列表用于推送至所述终端设备显示,所述详情文本推荐列表包括所述第一推荐组。
扩展的实施例中,所述相似计算模块,还包括:历史优选子模块,用于根据历史商品的广告数据,对历史商品相似度序列中相似度低于预设阈值的历史商品进行排序,获得第二推荐组,第二推荐组被连接于所述详情文本推荐列表中第一推荐组之后。
具体化的实施例中,所述历史优选子模块,包括:低值提取单元,用于从历史商品相似度序列中提取出相似度低于预设阈值的历史商品获得临时计算列表;数据调用单元,用于调用所述临时计算列表中各个历史商品的多项广告数据,所述广告数据包括相应的历史商品投放广告距今时长、广告投放时长、广告投放成效数据中任意一项或任意多项;综合量化单元,用于针对所述临时计算列表中的每个历史商品,将多项所述的广告数据加权求和获得相应的临时得分;排序处理单元,用于根据所述临时得分对所述临时计算列表中的历史商品进行排序,获得所述第二推荐组。
适应本申请的目的之一而提供的一种商品信息发布装置,包括:界面显示模块、备选获取模块、文本展示模块,以及提交发布模块,其中,所述界面显示模块,用于显示待发布商品的商品信息录入界面,该录入界面包括商品信息中标题文本相应的第一输入框和详情文本相应的第二输入框;所述备选获取模块,用于响应作用于第二输入框的预设触发事件,向服务器提交第一输入框中的标题文本以获取该标题文本语义上相匹配的备选详情文本列表,该列表包括多个历史商品相对应的详情文本;所述文本展示模块,用于将所述备选详情文本列表输出至当前录入界面以展示来源于多个历史商品的详情文本,使每个详情文本响应触控操作而添加至第二输入框中;所述提交发布模块,用于响应作用于所述录入界面的信息提交事件,将第一输入框和第二输入框所显示的商品信息提交至服务器以执行待发布商品的发布。
较佳的实施例中,所述作用于第二输入框的预设触发事件为所述第一输入框中输入文本所产生的文本输入事件。
扩展的实施例中,所述商品信息发布装置,还包括:选定插入模块,用于响应作用于所述备选详情文本列表中的任意详情文本的选定事件,将选定的详情文本连接于第二输入框中的已输入内容之后显示。
适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的商品信息匹配方法或商品信息发布方法的步骤。
适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的商品信息匹配方法或商品信息发布方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
适应本申请的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述方法的步骤。
相对于现有技术,本申请的优势如下:
首先,本申请在服务器侧实现根据待发布商品的商品信息中标题文本的文本特征向量进行语义匹配,通过计算该文本特征向量与历史商品的商品信息中详情文本的文本特征向量之间的相似度,根据相似度确定与待发布商品的标题文本在语义上相关联的多个历史商品的详情文本,推送给终端设备作为录入所述待发布商品的商品信息中详情文本的可选项,提升了服务器的商品录入服务的智能化程度,进一步可以提升用户侧的商品信息录入效率,为商品的广告发布、上线发布等应用场景提供了快捷发布的便利。
其次,本申请在终端设备侧实现根据用户在待发布商品的录入界面的商品标题相对应的第一输入框中输入的标题文本来向服务器获取语义上相关联的备选详情文本列表,将列表中的各个详情文本作为该录入界面用于录入待发布商品的详情文本的第二输入框的输入内容的可选项,从而,用户只需在第一输入框中输入待发布商品的商品标题的标题文本,便可在第二输入框中获得与该标题文本在语义上相似的可选详情文本,用户便可在选中一个详情文本的基础上对待发布商品的第二输入框进行快速的修改编辑,从而实现快速便捷地输入待发布商品的商品详情,提升待发布商品的商品信息的编辑效率,获得良好用户体验。
此外,本申请所实现的业务逻辑中,利用了待发布商品的标题文本与历史商品的详情文本进行语义上的匹配,而非标题文本与标题文本之间的语义匹配,因此,可以直接通过标题文本命中备选的详情文本,两者由于在语义上实现了关联,匹配度较高,命中更精准。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的商品信息匹配方法的典型实施例的流程示意图;
图2为本申请实施例中第一推荐组构建的流程示意图;
图3为本申请实施例中详情文本推荐列表构建的流程示意图;
图4为本申请实施例中第二推荐组构建的流程示意图;
图5为本申请的商品信息发布方法的典型实施例的流程示意图;
图6为本申请一个较佳实施例中无控件显示机制的备选详情文本列表执行的示意图;
图7为本申请实施例中商品发布的流程示意图;
图8为本申请一种实施例中待发布商品的商品信息录入界面图;
图9为本申请实施例中待发布商品的商品信息录入界面中推荐文案展示图;
图10为本申请另一种实施例中待发布商品的商品信息录入界面图;
图11为本申请的商品信息匹配装置的原理框图;
图12为本申请的商品信息发布装置的原理框图;
图13为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种商品信息匹配方法,可被编程为计算机程序产品,部署于服务器中运行而实现,以便藉此通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品进行人机交互而执行该方法。
请参阅图1,本申请的商品信息匹配方法,包括如下步骤:
步骤S1100、获取终端设备提交的待发布商品的标题文本;
本申请的应用场景之一,当商家用户需要上架新商品时,需要录入新商品的商品信息用于上架发布,为此在待发布商品的商品信息录入界面录入所述待发布商品的商品信息,所述商品信息通常包括标题文本、详情文本、商品图片等,详情文本相对应的字数相对较多,直接编写比较慢,而输入字数较少的标题文本相对较快,因此本申请允许终端设备将所述标题文本提交至服务器,以获取与所述标题文本语义相匹配的历史商品的详情文本,作为所述待发布商品的详情信息模板。
本申请的另一应用场景中,商家用户需要将商品作为广告对象进行广告发布时,也需要录入相应的广告商品的商品信息用于发布商品广告,为此在待发布商品的商品信息录入界面录入待发布商品的商品信息,同理,通常要求输入标题文本、详情文本、商品图片等信息,为了便于详情文本信息的填写,同理允许终端设备将所述标题文本提交至服务器,以获取与所述标题文本相似或相关的、广告成效较好的历史商品的详情文本,作为所述待发布商品的详情信息模板。
上述场景中的需要上架的新商品以及需要发布广告的商品,作为待发布商品,可使用手机、电脑等终端设备访问电商平台的待发布商品发布页面进行商品信息的录入,在完成商品信息录入后提交至电商平台的服务器。
步骤S1200、提取所述标题文本的深层语义信息,获得相应的文本特征向量;
一种实施例中,考虑到提升语义信息准确性,可对标题文本进行格式预处理。具体而言,一般的商品标题文本信息格式相对比较整齐,大多为纯文字,而商品详情文本信息则格式比较乱,尽管如此,也不排除商品标题可能包含换行符、链接、表情、多余的标点符号、多余的空白字符等,为使语义提取更为准确,可与详情文本同理,将这些无表征商品内容意义的多余字符进行相应的格式化处理,去除这些无用字符,使得标题文本和详情文本在格式上保持统一,使彼此所包含的字符集都较为接近。
示例性的部分预处理过程包括:把换行符、制表符替换成空格符号;把http连接替换成空格符号;把emoji表情替换成空格符号;把英文字符都转化成小写;过滤诸如@xxx这种注释格式字符串;将2个以上的空白字符串替换成只保留一个空白字符;将2个以上的标点符号替换成只保留一个等等。格式预处理的方式按需采用,本技术领域人员可根据实际业务情况进行灵活变通实施。
当然,如果标题文本的格式较为齐整,也可无需进行所述的格式化预处理。
服务器接收所述的标题文本之后,便可调用预训练的文本特征提取模型对所述标题文本进行深层语义信息提取,从而获得相应的文本特征向量。所述的文本特征提取模型,预先被训练至收敛状态,用于对输入其中的标题文本进行基于深层语义的表示学习。本领域技术人员知晓,只要采用足量的样本对所述文本特征提取模型进行训练,使该文本特征提取模型适于对标题文本提取深层语义信息,便可将文本特征提取模型投入本申请的技术方案中使用。所述文本特征提取模型一般为神经网络模型,优选基于Transformer实现的模型,以便更适合处理文字之类的序列信息。本申请后续的实施例将进一步揭示优选的模型选用方式,此处暂且按下不表。
步骤S1300、计算所述文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,根据相似度对历史商品的详情文本进行排序;
获得标题文本的文本特征向量之后,便可将其与一个预设的商品特征库中的各个历史商品的详情文本的文本特征向量求取相似度数据,以确定终端设备提交的标题文本与商品特征库中的各个历史商品的详情之本之间的相似度信息。
所述的商品特征库中,包括多个历史商品,该些历史商品是预先发布和/或预先选取的商品。商品特征库中关联存储各个历史商品的详情文本及其对应的文本特征向量。同理,历史商品的文本特征向量,也由所述的文本特征提取模型所预先提取。
计算标题文本的文本特征向量与历史商品的文本特征向量之间的相似度,可以采用多种方式来实现。例如:
一种实施例中,可选用余弦相似度算法、欧式距离算法、皮尔逊系数算法、杰卡德相似算法等常见算法来计算。以余弦相似度算法为例,将所述标题文本的文本特征向量及一个历史商品的详情文本特征向量作为方法参数,输入至余弦相似度算法函数中,便可应用预设的余弦相似度计算公式,计算所述两个文本特征向量的乘积除以所述两两向量分别对应的模的乘积,获得相应的输出结果,即为所述两个文本特征向量之间的相似度。
另一实施例中,通过faiss框架提供的接口构造所述商品特征库中历史商品的详情文本的文本特征向量的索引,进一步通过该框架提供的相似度计算接口,便可应用相应的预设算法获得相似度数据,从而快速计算所述待发布商品的标题文本与历史商品的详情文本之间的相似度。
可见,实现标题文本的文本特征向量与商品特征库中的历史商品的文本特征向量之间的相似度的算法可灵活设定。当一个标题文本与各个历史商品的详情文本基于文本特征向量计算出相似度后,便可获得一个相应的相似序列,为方便查找,可根据相似度从高到低的顺序对历史商品的详情文本进行排序。
步骤S1400、将排序后的详情文本推送至所述终端设备显示,以作为所述待发布商品的备选详情文本列表。
为向终端设备提供输入待发布商品的详情文本的参考方案,至此,可将排序后的历史商品的详情文本构造为备选详情文本列表推送至所述终端设备上的待发布商品信息录入界面上显示,所述备选详情文本列表包括备选的历史商品的详情文本,所述备选详情文本可作为待发布商品采用的详情文本模板。如前所述,商品特征库中的详情文本可以被预先进行格式化处理,为方便显示,可被处理为单行数据。
终端设备接收所述备选详情文本列表后可将其显示到录入界面上,供用户进行选取,由此,用户便可获得语义相近的历史商品的详情文本模板,点选其中之一,便可使用相应的详情文本模板作为其待发布商品的详情文本,在此基础上还可进一步编辑直至满意。
一种实施例中,终端设备可以通过触控一个预设的控件来向服务器提交所述标题文本,以触发服务器执行步骤S1100至步骤1400以使终端设备获得所述备选详情文本列表。变通的实施例中,终端设备也可无需通过控件触发服务器的执行,而是在其捕捉到其界面中输入待发布商品的标题文本后便在后台触发服务器执行,同理也可获得所述的备选详情文本。
本典型实施例,体现出本申请的优势,通过在服务器侧实现根据待发布商品的商品信息中标题文本的文本特征向量进行语义匹配,通过计算该文本特征向量与历史商品的商品信息中详情文本的文本特征向量之间的相似度,根据相似度确定与待发布商品的标题文本在语义上相关联的多个历史商品的详情文本,推送给终端设备作为录入所述待发布商品的商品信息中详情文本的可选项,提升了服务器的商品录入服务的智能化程度,进一步可以提升用户侧的商品信息录入效率,为商品的广告发布、上线发布等应用场景提供了快捷发布的便利。
进一步的,本申请在终端设备侧实现根据用户在待发布商品的录入界面的商品标题相对应的第一输入框中输入的标题文本来向服务器获取语义上相关联的备选详情文本列表,将列表中的各个详情文本作为该录入界面用于录入待发布商品的详情文本的第二输入框的输入内容的可选项,从而,用户只需在第一输入框中输入待发布商品的商品标题的标题文本,便可在第二输入框中获得与该标题文本在语义上相似的可选详情文本,用户便可在选中一个详情文本的基础上对待发布商品的第二输入框进行快速的修改编辑,从而实现快速便捷地输入待发布商品的商品详情,提升待发布商品的商品信息的编辑效率,获得良好用户体验。
此外,本申请所实现的业务逻辑中,利用了待发布商品的标题文本与历史商品的详情文本进行语义上的匹配,而非标题文本与标题文本之间的语义匹配,因此,可以直接通过标题文本命中备选的详情文本,两者由于在语义上实现了关联,匹配度较高,命中更精准。
请参阅图2,深化的实施例中,所述步骤S1300、计算所述文本特征向量与商品特征库中历史商品的详情文本相对应的文本特征向量之间的相似度,根据相似度对历史商品的详情文本进行排序,包括如下步骤:
步骤S1310、计算所述待发布商品的标题文本的文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,获得历史商品相似度序列,所述各文本特征向量均采用同一预训练的神经网络模型进行提取;
所述预训练的神经网络模型为能够计算句子获得其向量化表示的文本特征向量的神经网络模型,可采用开源的框架Sentence Transformers,它提供了大量的预训练的Transformer模型,譬如:BERT、RoBERTa、XLM-RoBERTaModel、MPNet等,本实施例中推荐使用XLMRobertaModel,具体实施方式本领域的技术人员可根据实际业务场景进行灵活变通。
通过XLMRobertaModel模型提取所述预处理后的待发布商品的标题文本的深层语义特征获得对应的文本特征向量,同理,预处理后的历史商品的详情文本同样通过XLMRobertaModel模型预先提取其深层语义特征获得对应的文本特征向量并将其存储至商品特征库中。
获取商品特征库中一组历史商品的详情文本对应的文本特征向量,分别与所述待发布商品的标题文本对应的文本特征向量使用余弦相似度函数计算相互之间的相似度,作为待发布商品的标题文本与历史商品的详情文本在语义相近层面的衡量指标,示例公式如下:
Figure BDA0003354969510000131
其中:product_title_embedding为待发布商品的标题文本对应的文本特征向量,pase_detail_embedding为历史商品的详情文本对应的文本特征向量。
根据该公式,计算所述待发布商品的标题文本与历史商品的详情文本分别对应的文本特征向量的乘积除以其向量分别对应的模的乘积获得余弦相似度,为计算的便利,将所述余弦相似度的值范围归一化为0-1,极限分别是0和1,余弦相似度值越大两者语义近似程度越高,反之值越小两者差异越大语义近似程度越低。
至此,计算出一组历史商品的详情文本中每个对应的余弦相似度,所述余弦相似度与历史商品为一对一的映射关系,据此便构成历史商品相似度序列。
步骤S1320、根据相似度,对历史商品相似度序列中相似度超过预设阈值的历史商品进行排序,获得第一推荐组;
对于待发布商品而言,已计算出其标题文本与历史商品中的详情文本在语义近似层面代表值余弦相似度,筛选历史商品相似度序列中余弦相似度超过预先设定的相似度阈值即所述预设阈值对应的历史商品并以余弦相似度从高到低的顺序进行相应的排序,由此构造出第一推荐组,获得与待发布商品的标题文本的语义近似程度较高的多个历史商品的详情文本作为第一推荐组。
所述预先设定的相似度阈值为0.8,本实施例推荐所述相似度阈值从0.3-0.8区间内进行选取设定,具体所述预设阈值如何取值,本领域的技术人员可依据业务实际情况灵活变通。
步骤S1340、构造出详情文本推荐列表用于推送至所述终端设备显示,所述详情文本推荐列表包括所述第一推荐组。
一个实施例中,获取第一推荐组中各历史商品的详情文本构造为详情文本推荐列表也即备选详情文本列表,将各详情文本作为详情文本推荐列表选项内容,推送至所述的终端设备。由此,终端设备的用户通过浏览详情文本推荐列表选项即可大致了解对应的详情文本内容,据此可进行选择,从而获得对应的历史商品的详情文本内容。将所述详情文本推荐列表关联推荐文案控件,在用户点击推荐方案控件时,便触发服务器执行本方法的相应步骤而推送该详情文本推荐列表至所述终端设备的发布商品信息录入界面展开显示。
本实施例中,通过与待发布商品的标题文本语义相近的历史商品的详情文本构建推荐列表,为用户输入待发布商品的详情文本提供智能化的商品信息录入服务,更合理化地利用已有的资源,使用户通过简单操作即可获得语义相近的详情文本模板作为参考,便于用户更快地编写大篇幅的详情文本,用户亦可通过所述各式模板获取灵感在选定的模板上进行更好的创作,提升了用户体验以及商品信息录入效率。
请参阅图3,扩展的实施例中,所述步骤S1320、根据相似度,对历史商品相似度序列中相似度超过预设阈值的历史商品进行排序,获得第一推荐组的步骤之后,还包括如下步骤:
步骤S1330、根据历史商品的广告数据,对历史商品相似度序列中相似度低于预设阈值的历史商品进行排序,获得第二推荐组,第二推荐组被连接于所述详情文本推荐列表中第一推荐组之后。
筛选出所述历史商品相似度序列中相似度低于预设阈值的历史商品,获取所述历史商品在广告商品数据库中最新的广告数据,量化所述广告数据获得相应的评分,进而以所述评分从高到低对所述历史商品进行顺序重排,进一步的以该排序的历史商品的详情文本构建第二推荐组。将所述第一推荐组居先,第二推荐组居后,两者先后拼接在一起,构建并扩充所述详情文本推荐列表,然后将所述详情文本推荐列表推送至商品发布界面上。
本实施例中,用户首选使用与其定下的标题文本语义高度相近的第一推荐组中的详情文本作为模板,快速完成大篇幅的详情文本的创作,其次还可选择与其定下的标题语义相似度稍欠但广告成效较好的第二推荐组的详情文本作为模板,后者具有描述清晰、受大众受欢迎等优势,在此基础上进行创作可获得更好的广告效果。
请参阅图4,具体化的实施例中,所述步骤S1330、根据历史商品的广告数据,对历史商品相似度序列中相似度低于预设阈值的历史商品进行排序,获得第二推荐组,包括如下步骤:
步骤S1331、从历史商品相似度序列中提取出相似度低于预设阈值的历史商品获得临时计算列表;
所述历史商品相似度序列为根据待发布商品的标题文本的文本特征向量与历史商品的详情文本的文本特征向量计算出的余弦相似度并以高到低进行排序所构建,因此依照历史商品相似度序列的相似度排序以及对应的余弦相似度,筛选出所述余弦相似度低于预设阈值的历史商品,获得临时计算列表。
步骤S1332、调用所述临时计算列表中各个历史商品的多项广告数据,所述广告数据包括相应的历史商品投放广告距今时长、广告投放时长、广告投放成效数据中任意一项或任意多项;
为所述临时计算列表中的历史商品调用预定的多项广告数据,所述广告数据包括用于分析历史商品在广告投放时间以及相应的成效的相关数据,可以从存储这些数据的广告商品库中调用。所述广告数据,示例而言,包括:广告据今时长,指所述历史商品在最近一次投放日期距离当前日期的天数;广告投放时长,指所述历史商品最近一次投放广告的天数;广告投放成效数据,包括所述历史商品最近一次投放广告获得的点击率、购买率、ROAS(广告支出回报率)相加计算出的综合量化数据。此处仅为示例,本领域技术人员也可根据实际需要而灵活设定这些广告数据。
为了更好地分析所述历史商品最近一期的广告数据进而综合评估历史商品的广告投放成效,可将所述各项广告数据进行归一化处理,获得相同尺度规范下的广告数据。一种实施例中遍历所述临时计算列表中历史商品的广告距今时长、广告投放时长、广告投放成效数据,对应的分别获得所述各个广告数据中的最大值以及最小值,进而计算历史商品当前所述各个广告数据减去对应的最大值并除以对应的最大值与最小值的差值获得归一化的结果,即使用Min-Max标准化对当前各个广告数据进行线性变换,将归一化的结果映射到0-1之间,示范例公式如下:
Figure BDA0003354969510000151
其中:y为所述各个广告数据归一化的结果,;x为各个广告数据对应的值,min{x}为各个广告数据对应的值中的最小值,max{x}为各个广告数据对应的值中的最大值。
所述归一化方法不局限当前实施例中使用的min-max标准化,亦可使用其他归一化的方法如:截尾、分箱、对数变换、Box-Cox、Z-Score标准化等,本领域技术人员可根据实际评分分布情况灵活变通选取使用。
步骤S1333、针对所述临时计算列表中的每个历史商品,将多项所述的广告数据加权求和获得相应的临时得分;
计算临时计算列表中的每个历史商品归一化的广告据今时长、广告投放时长、广告投放成效数据分别乘上相应的权重并相加获得相应的临时得分,示例性的公式如下:
score=a*x1+b*x2+c*x3
其中:score为临时得分,x1为广告据今时长数据值,x2为广告投放时长数据值,x3为广告投放成效数据值,a、b、c为各个广告数据值对应的权重。
一种实施例中,所述广告据今时长数据值对应的权重为0.3、广告投放时长数据值对应的权重为0.3、广告投放成效数据值对应的权重为0.4。具体权重设置可由本领域技术人员依照实际情况灵活变通。
步骤S1334、根据所述临时得分对所述临时计算列表中的历史商品进行排序,获得所述第二推荐组。
根据临时计算列表中的历史商品的临时得分对历史商品进行相应的排序,进一步的根据所述排序的历史商品的详情文本以及标题文本构建第二推荐组。
第二推荐组紧接于第一推荐组之后,与第一推荐组一同构成所述的详情文本推荐列表即可。
本实施例中,充分分析历史商品最近一期的广告数据,实现深度数据挖掘,进一步量化所述广告数据计算出相应的得分进而据此构建第二推荐组,并将所述第二推荐组用于构建详情文本推荐列表。可见,本实施例合理化运用已有的资源,科学准确地量化已有资源的最新广告投放成效为相应的评分,使详情文本推荐列表中提供的详情文本更有参考价值,方便用户快速且简便地获得广告投放良好的历史商品的详情文本作为参考,极大程度上提升了用户体验,可期望待发布商品获得良好的广告效果。
本申请的一种商品信息发布方法,可被编程为计算机程序产品,部署于客户端中运行而实现,以便藉此通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品进行人机交互而执行该方法。
请参阅图5,本申请的商品信息发布方法,包括如下步骤:
步骤S2100、显示待发布商品的商品信息录入界面,该录入界面包括商品信息中标题文本相应的第一输入框和详情文本相应的第二输入框;
请参阅图8,作为客户端的终端设备上,待发布商品的商品信息录入界面上包括商品信息中标题文本对应的第一输入框100和详情文本相应的第二输入框110,以及推荐文案控件120,用于推荐备选详情文本列表。由用户在所述界面上的第一输入框100中输入待发布商品的标题文本。
步骤S2200、响应作用于第二输入框的预设触发事件,向服务器提交第一输入框中的标题文本以获取该标题文本语义上相匹配的备选详情文本列表,该列表包括多个历史商品相对应的详情文本;
请参阅图8,用户在待发布商品的商品信息录入界面上点击推荐文本控件120,便触发所述预设触发事件,从而向服务器提交第一输入框中已输入的标题文本。服务器执行本申请的商品信息匹配方法,依据第一输入框100中的标题文本,获取对应的备选详情文本列表,推送给终端设备显示。如前所述,备选详情文本列表中的详情文本,是与所述第一输入框中的标题文本在语义上相匹配的历史商品详情文本。步骤S2300、将所述备选详情文本列表输出至当前录入界面以展示来源于多个历史商品的详情文本,使每个详情文本响应触控操作而添加至第二输入框中;
请参阅图9,终端设备将所述备选详情文本列表130输出至所述界面中的待发布商品的详情文本输入框下,以展示多个历史商品的标题文本选项。用户浏览所述选项知悉与待发布商品的标题文本语义相匹配的详情文本的内容之后,选定合适的详情文本。响应用户作用于所述备选详情文本中任意选项的触控操作,终端设备将用户触控选定的详情文本添加至第二输入框110内作为待发布商品的详情文本模板,以供用户进一步编辑。
步骤S2400、响应作用于所述录入界面的信息提交事件,将第一输入框和第二输入框所显示的商品信息提交至服务器以执行待发布商品的发布。
请参阅图9,用户在待发布商品信息录入界面上,完成第一输入框100的标题文本以及第二输入框110的详情文本,以及其他商品信息的输入之后,可点击提交控件140进行发布。响应作用于所述提交控件140的提交事件,终端设备将待发布商品的所有商品信息提交至服务器,由服务器进行待发布商品的发布。相应的,适应不同的应用场景,可以实现新商品上架或者商品广告发布。
本实施例中,在发布商品录入信息界面上,提供与标题文本语义相匹配的备选详情文本的推荐文案,简单的点击选取即可获得优质详情文本模板,进而快速完成商品信息的录入,提升了用户体验,增加用户粘性。
请参阅图6,较佳的实施例中,所述作用于第二输入框的预设触发事件为所述第一输入框中输入文本所产生的文本输入事件。
请参阅图10,终端设备可监听用户在待发布商品录入信息界面上的第一输入框200输入标题文本的输入事件,将其视为所述的预设触发事件,因此,相应触发向服务器提交所述的标题文本,从而获得服务器根据该标题文本而推送的备选详情文本列表,备选详情文本列表220便在所述界面上进行展示,展示的备选文本列表选项为对应的详情文本中出现第一输入框中输入的标题文本作为关键字的缩略文本,用户选中的详情文本选项被添加至第二输入框210中作为待发布商品的详情文本模板。
本实施例中,为大篇幅的详情文本编写提供智能化模板服务,简化一定量的输入,使得用户能够快速完成商品信息录入中最繁杂的步骤,提高了商品信息录入效率。
请参阅图7,扩展的实施例中,所述步骤S2300、将所述备选详情文本列表输出至当前录入界面以展示来源于多个历史商品的详情文本,使每个详情文本响应触控操作而添加至第二输入框中的步骤之后,包括如下步骤:
步骤S2301、响应作用于所述备选详情文本列表中的任意详情文本的选定事件,将选定的详情文本连接于第二输入框中的已输入内容之后显示。
点击选中备选详情文本列表中的选项,响应所述选定事件,将选定的详情文本添加至第二输入框中的已输入内容之后显示,若多次选中备选详情文本列表中的选项,相应的将各选定的详情文本依照选定时间顺序依次添加至第二输入框中已有的内容之后。由此,可避免对用户在其界面上已编辑的详情文本构成影响。
本实施例中,可借鉴多个详情文本模板供待发布商品详情文本进一步的创作,使得详情文本编写更为简单,拥有更好的成效。
请参阅图11,适应本申请的目的之一而提供的一种商品信息匹配装置,包括:标题获取模块1100、语义提取模块1200、相似匹配模块1300,以及推送显示模块1400,其中,所述标题获取模块,用于获取终端设备提交的待发布商品的标题文本;所述语义提取模块,用于提取所述标题文本的深层语义信息,获得相应的文本特征向量;所述相似匹配模块,用于计算所述文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,根据相似度对历史商品的详情文本进行排序;所述推送显示模块,用于将排序后的详情文本推送至所述终端设备显示,以作为所述待发布商品的备选详情文本列表。
深化的实施例中,所述相似计算模块,包括:相似计算子模块,用于计算所述待发布商品的标题文本的文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,获得历史商品相似度序列,所述各文本特征向量均采用同一预训练的神经网络模型进行提取;相似优选子模块,用于根据相似度,对历史商品相似度序列中相似度超过预设阈值的历史商品进行排序,获得第一推荐组;列表推送子模块,用于构造出详情文本推荐列表用于推送至所述终端设备显示,所述详情文本推荐列表包括所述第一推荐组。
扩展的实施例中,所述相似计算模块,还包括:历史优选子模块,用于根据历史商品的广告数据,对历史商品相似度序列中相似度低于预设阈值的历史商品进行排序,获得第二推荐组,第二推荐组被连接于所述详情文本推荐列表中第一推荐组之后。
具体化的实施例中,所述历史优选子模块,包括:低值提取单元,用于从历史商品相似度序列中提取出相似度低于预设阈值的历史商品获得临时计算列表;数据调用单元,用于调用所述临时计算列表中各个历史商品的多项广告数据,所述广告数据包括相应的历史商品投放广告距今时长、广告投放时长、广告投放成效数据中任意一项或任意多项;综合量化单元,用于针对所述临时计算列表中的每个历史商品,将多项所述的广告数据加权求和获得相应的临时得分;排序处理单元,用于根据所述临时得分对所述临时计算列表中的历史商品进行排序,获得所述第二推荐组。
请参阅图12,适应本申请的目的之一而提供的一种商品信息发布装置,包括:界面显示模块2100、备选获取模块2200、文本展示模块2300,以及提交发布模块2400,其中,所述界面显示模块,用于显示待发布商品的商品信息录入界面,该录入界面包括商品信息中标题文本相应的第一输入框和详情文本相应的第二输入框;所述备选获取模块,用于响应作用于第二输入框的预设触发事件,向服务器提交第一输入框中的标题文本以获取该标题文本语义上相匹配的备选详情文本列表,该列表包括多个历史商品相对应的详情文本;所述文本展示模块,用于将所述备选详情文本列表输出至当前录入界面以展示来源于多个历史商品的详情文本,使每个详情文本响应触控操作而添加至第二输入框中;所述提交发布模块,用于响应作用于所述录入界面的信息提交事件,将第一输入框和第二输入框所显示的商品信息提交至服务器以执行待发布商品的发布。
较佳的实施例中,所述作用于第二输入框的预设触发事件为所述第一输入框中输入文本所产生的文本输入事件。
扩展的实施例中,所述商品信息发布装置,还包括:选定插入模块,用于响应作用于所述备选详情文本列表中的任意详情文本的选定事件,将选定的详情文本连接于第二输入框中的已输入内容之后显示。
为解决上述技术问题,本申请实施例还提供计算机设备。如图13所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种商品信息匹配方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的商品信息匹配方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图11、12中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的商品信息匹配装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的商品信息匹配方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本申请任一实施例所述方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请方便待发布商品的商品信息的录入,可根据已输入的商品信息的标题文本智能推荐商品信息的详情文本,可服务于电商领域在内的多种应用场景,具有广泛通用性。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种商品信息匹配方法,其特征在于,包括如下步骤:
获取终端设备提交的待发布商品的标题文本;
提取所述标题文本的深层语义信息,获得相应的文本特征向量;
计算所述文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,根据相似度对历史商品的详情文本进行排序;
将排序后的详情文本推送至所述终端设备显示,以作为所述待发布商品的备选详情文本列表。
2.根据权利要求1所述的商品信息匹配方法,其特征在于,计算所述文本特征向量与商品特征库中历史商品的详情文本相对应的文本特征向量之间的相似度,根据相似度对历史商品的详情文本进行排序,包括如下步骤:
计算所述待发布商品的标题文本的文本特征向量与商品特征库中历史商品的详情文本的文本特征向量之间的相似度,获得历史商品相似度序列,所述各文本特征向量均采用同一预训练的神经网络模型进行提取;
根据相似度,对历史商品相似度序列中相似度超过预设阈值的历史商品进行排序,获得第一推荐组;
构造出详情文本推荐列表用于推送至所述终端设备显示,所述详情文本推荐列表包括所述第一推荐组。
3.根据权利要求2所述的商品信息匹配方法,其特征在于,根据相似度,对历史商品相似度序列中相似度超过预设阈值的历史商品进行排序,获得第一推荐组的步骤之后,还包括如下步骤:
根据历史商品的广告数据,对历史商品相似度序列中相似度低于预设阈值的历史商品进行排序,获得第二推荐组,第二推荐组被连接于所述详情文本推荐列表中第一推荐组之后。
4.根据权利要求3所述的商品信息匹配方法,其特征在于,根据历史商品的广告数据,对历史商品相似度序列中相似度低于预设阈值的历史商品进行排序,获得第二推荐组,包括如下步骤:
从历史商品相似度序列中提取出相似度低于预设阈值的历史商品获得临时计算列表;
调用所述临时计算列表中各个历史商品的多项广告数据,所述广告数据包括相应的历史商品投放广告距今时长、广告投放时长、广告投放成效数据中任意一项或任意多项;
针对所述临时计算列表中的每个历史商品,将多项所述的广告数据加权求和获得相应的临时得分;
根据所述临时得分对所述临时计算列表中的历史商品进行排序,获得所述第二推荐组。
5.一种商品信息发布方法,其特征在于,包括如下步骤:
显示待发布商品的商品信息录入界面,该录入界面包括商品信息中标题文本相应的第一输入框和详情文本相应的第二输入框;
响应作用于第二输入框的预设触发事件,向服务器提交第一输入框中的标题文本以获取该标题文本语义上相匹配的备选详情文本列表,该列表包括多个历史商品相对应的详情文本;
将所述备选详情文本列表输出至当前录入界面以展示来源于多个历史商品的详情文本,使每个详情文本响应触控操作而添加至第二输入框中;
响应作用于所述录入界面的信息提交事件,将第一输入框和第二输入框所显示的商品信息提交至服务器以执行待发布商品的发布。
6.根据权利要求5所述的商品信息发布方法,其特征在于,所述作用于第二输入框的预设触发事件为所述第一输入框中输入文本所产生的文本输入事件。
7.根据权利要求5所述的商品信息发布方法,其特征在于,将所述备选详情文本列表输出至当前录入界面以展示来源于多个历史商品的详情文本,使每个详情文本响应触控操作而添加至第二输入框中的步骤之后,包括如下步骤:
响应作用于所述备选详情文本列表中的任意详情文本的选定事件,将选定的详情文本连接于第二输入框中的已输入内容之后显示。
8.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至7任意一项中所述方法的步骤。
CN202111348124.5A 2021-11-15 2021-11-15 商品信息匹配、发布方法及其装置、设备、介质、产品 Pending CN114065750A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111348124.5A CN114065750A (zh) 2021-11-15 2021-11-15 商品信息匹配、发布方法及其装置、设备、介质、产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111348124.5A CN114065750A (zh) 2021-11-15 2021-11-15 商品信息匹配、发布方法及其装置、设备、介质、产品

Publications (1)

Publication Number Publication Date
CN114065750A true CN114065750A (zh) 2022-02-18

Family

ID=80272190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111348124.5A Pending CN114065750A (zh) 2021-11-15 2021-11-15 商品信息匹配、发布方法及其装置、设备、介质、产品

Country Status (1)

Country Link
CN (1) CN114065750A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114663155A (zh) * 2022-04-01 2022-06-24 广州华多网络科技有限公司 广告投放选品方法及其装置、设备、介质、产品
CN115018549A (zh) * 2022-06-17 2022-09-06 广州华多网络科技有限公司 广告文案生成方法及其装置、设备、介质、产品
WO2023193332A1 (zh) * 2022-04-07 2023-10-12 青岛海尔科技有限公司 文本匹配方法和装置、存储介质及电子设备
CN117314546A (zh) * 2023-03-14 2023-12-29 广东南粤分享汇控股有限公司 基于人工智能的电商产品分析方法、系统、介质及计算机

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114663155A (zh) * 2022-04-01 2022-06-24 广州华多网络科技有限公司 广告投放选品方法及其装置、设备、介质、产品
WO2023193332A1 (zh) * 2022-04-07 2023-10-12 青岛海尔科技有限公司 文本匹配方法和装置、存储介质及电子设备
CN115018549A (zh) * 2022-06-17 2022-09-06 广州华多网络科技有限公司 广告文案生成方法及其装置、设备、介质、产品
CN117314546A (zh) * 2023-03-14 2023-12-29 广东南粤分享汇控股有限公司 基于人工智能的电商产品分析方法、系统、介质及计算机

Similar Documents

Publication Publication Date Title
CN110162593B (zh) 一种搜索结果处理、相似度模型训练方法及装置
US20240078386A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
CN114065750A (zh) 商品信息匹配、发布方法及其装置、设备、介质、产品
US11636341B2 (en) Processing sequential interaction data
CN111931500B (zh) 搜索信息的处理方法、装置
US20230205813A1 (en) Training Image and Text Embedding Models
WO2020159593A1 (en) Training image and text embedding models
CN106250464B (zh) 排序模型的训练方法及装置
CN104899322A (zh) 搜索引擎及其实现方法
US20210166014A1 (en) Generating document summary
CN114638646A (zh) 广告投放推荐方法及其装置、设备、介质、产品
US20220121668A1 (en) Method for recommending document, electronic device and storage medium
CN111414561A (zh) 用于呈现信息的方法和装置
CN115018549A (zh) 广告文案生成方法及其装置、设备、介质、产品
CN114663155A (zh) 广告投放选品方法及其装置、设备、介质、产品
CN113806588A (zh) 搜索视频的方法和装置
CN115545832A (zh) 商品搜索推荐方法及其装置、设备、介质
CN111225009B (zh) 用于生成信息的方法和装置
CN114218426A (zh) 音乐视频推荐方法及其装置、设备、介质、产品
CN107451194A (zh) 一种图片搜索方法及装置
CN116823404A (zh) 商品组合推荐方法及其装置、设备、介质
CN115907928A (zh) 商品推荐方法及其装置、设备、介质
CN113806536B (zh) 文本分类方法及其装置、设备、介质、产品
CN115700579A (zh) 广告文本生成方法及其装置、设备、介质
CN115018548A (zh) 广告文案预测方法及其装置、设备、介质、产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination