CN115689672A - 聊天式商品导购方法及其装置、设备、介质 - Google Patents

聊天式商品导购方法及其装置、设备、介质 Download PDF

Info

Publication number
CN115689672A
CN115689672A CN202211203805.7A CN202211203805A CN115689672A CN 115689672 A CN115689672 A CN 115689672A CN 202211203805 A CN202211203805 A CN 202211203805A CN 115689672 A CN115689672 A CN 115689672A
Authority
CN
China
Prior art keywords
commodity
text
chat
keywords
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211203805.7A
Other languages
English (en)
Inventor
许强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huanju Shidai Information Technology Co Ltd
Original Assignee
Guangzhou Huanju Shidai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huanju Shidai Information Technology Co Ltd filed Critical Guangzhou Huanju Shidai Information Technology Co Ltd
Priority to CN202211203805.7A priority Critical patent/CN115689672A/zh
Publication of CN115689672A publication Critical patent/CN115689672A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及计算机技术领域中一种聊天式商品导购方法及其装置、设备、介质,所述方法包括:获取聊天窗口中的聊天文本,采用文本识别模型识别出所述聊天文本中的关键词,所述关键词包括商品特征的描述信息;采用文本分类模型确定所述聊天文本所表达的购买意图是否明确;针对表达购买意图明确的所述聊天文本,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口;针对表达购买意图模糊的所述聊天文本,采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签,获取所述商品标签相对应的商品的商品信息,推送至聊天窗口。本申请实现聊天过程中及时推送聊天相关商品,保证导购服务效率,提升购物满意度。

Description

聊天式商品导购方法及其装置、设备、介质
技术领域
本申请涉及电商技术领域,尤其涉及一种聊天式商品导购方法及其相应的装置、计算机设备、计算机可读存储介质。
背景技术
在即时通讯的电商导购场景下,买家可与卖家进行即时通讯,向卖家描述其购买意图,由卖家提供相应供参考的导购话术,从而高效便捷地了解到符合购买意图对应的心仪商品。在此过程中,买家可请卖家提供聊天过程中提及的购买意图对应的商品,供买家参考,通常卖家可凭借自身对其店铺上线的众多商品充分了解,从而能够找出符合的商品。可见,对卖家要求较高,然而,传统技术中暂无相关的技术方案能够解决该业务困境。
有鉴于此,本申请人长期从事相关领域的研究,为解决电商领域业内难题,做出相应的探索。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种聊天式商品导购方法及其相应的装置、计算机设备、计算机可读存储介质。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种聊天式商品导购方法,包括如下步骤:
获取聊天窗口中的聊天文本,采用文本识别模型识别出所述聊天文本中的关键词,所述关键词包括商品特征的描述信息;
采用文本分类模型确定所述聊天文本所表达的购买意图是否明确;
针对表达购买意图明确的所述聊天文本,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口;
针对表达购买意图模糊的所述聊天文本,采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签,获取所述商品标签相对应的商品的商品信息,推送至聊天窗口。
进一步的实施例中,采用文本识别模型识别出所述聊天文本中的关键词的步骤中,包括如下步骤:
对所述聊天文本进行分词,获得相应的分词文本;
将所述分词文本输入文本识别模型,确定分词文本中各个词元相对应的实体标识;
筛选出用于表示商品特征的实体标识相对应的词元作为关键词。
进一步的实施例中,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口的步骤中,包括如下步骤:
根据所述聊天文本中的关键词,采用搜索引擎从商品数据库中,检索出与所述关键词相匹配的商品集;
获取所述商品集中各个商品相对应的用户行为数据,计算出各个商品相对应的排序评分,所述用户行为数据包括点击量、收藏量、加购量、购买量中的任意一项或多项;
从所述商品集中筛选出排序评分最高的商品,获取其商品信息推送至聊天窗口。
进一步的实施例中,采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签的步骤中,包括如下步骤:
将所述聊天文本中的关键词与预设商品标签构成数据对,输入至商品推荐模型进行编码,获得所述数据对中关键词和商品标签相对应的编码特征向量;
对所述关键词和商品标签相对应的编码特征向量分别进行平均池化,计算两者池化结果之间的相似度;
筛选出相似度超过预设阈值的商品标签。
进一步的实施例中,采用文本分类模型确定所述聊天文本所表达的购买意图是否明确的步骤中,确定出所述聊天文本所表达的购买意图明确或者模糊,其中:
表达购买意图明确的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图明确的各个聊天文本对应的关键词;
表达购买意图模糊的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图模糊的各个聊天文本对应的关键词。
进一步的实施例中,获取聊天窗口中的聊天文本之前,还包括如下步骤:
从预备的训练集中获取单个训练样本及其监督标签,所述训练样本包括表达购买意图模糊的聊天文本中的关键词与预设商品标签构成的数据对,所述监督标签表征所述训练样本的数据对中的关键词与商品标签相对应的描述是否相似;
将所述训练样本输入至商品推荐模型,提取数据对中关键词和商品标签相对应的深层语义信息,获得相应的编码特征向量;
对训练样本中关键词和商品标签相对应的编码特征向量进行平均池化,计算出两个池化结果之间的相似度;
采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对商品推荐模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
进一步的实施例中,获取聊天窗口中的聊天文本之前,还包括如下步骤:
根据商品数据库中各个商品的文本信息,采用聚类算法对各个商品进行分类,标注各个类别的商品相对应的商品标签,所述文本信息包括商品的描述信息。
另一方面,适应本申请的目的之一而提供的一种聊天式商品导购装置,包括文本获取模块、意图确定模块、第一推送模块以及第二推送模块,其中,文本获取模块,用于获取聊天窗口中的聊天文本,采用文本识别模型识别出所述聊天文本中的关键词,所述关键词包括商品特征的描述信息;意图确定模块,用于采用文本分类模型确定所述聊天文本所表达的购买意图是否明确;第一推送模块,用于针对表达购买意图明确的所述聊天文本,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口;第二推送模块,用于针对表达购买意图模糊的所述聊天文本,采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签,获取所述商品标签相对应的商品的商品信息,推送至聊天窗口。
进一步的实施例中,所述文本获取模块,包括:文本分词子模块,用于对所述聊天文本进行分词,获得相应的分词文本;命名实体识别子模块,用于将所述分词文本输入文本识别模型,确定分词文本中各个词元相对应的实体标识;关键词筛选子模块,用于筛选出用于表示商品特征的实体标识相对应的词元作为关键词。
进一步的实施例中,所述第一推送模块,包括:商品检索子模块,用于根据所述聊天文本中的关键词,采用搜索引擎从商品数据库中,检索出与所述关键词相匹配的商品集;评分计算子模块,用于获取所述商品集中各个商品相对应的用户行为数据,计算出各个商品相对应的排序评分,所述用户行为数据包括点击量、收藏量、加购量、购买量中的任意一项或多项;商品筛选子模块,用于从所述商品集中筛选出排序评分最高的商品,获取其商品信息推送至聊天窗口。
进一步的实施例中,所述第二推送模块,包括:文本编码子模块,用于将所述聊天文本中的关键词与预设商品标签构成数据对,输入至商品推荐模型进行编码,获得所述数据对中关键词和商品标签相对应的编码特征向量;平均池化子模块,用于对所述关键词和商品标签相对应的编码特征向量分别进行平均池化,计算两者池化结果之间的相似度;标签筛选子模块,用于筛选出相似度超过预设阈值的商品标签。
进一步的实施例中,所述意图确定模块,确定出所述聊天文本所表达的购买意图明确或者模糊,其中:第一关键词子模块,用于表达购买意图明确的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图明确的各个聊天文本对应的关键词;第二关键词子模块,用于表达购买意图模糊的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图模糊的各个聊天文本对应的关键词。
进一步的实施例中,所述文本获取模块之前,还包括:样本获取模块,用于从预备的训练集中获取单个训练样本及其监督标签,所述训练样本包括表达购买意图模糊的聊天文本中的关键词与预设商品标签构成的数据对,所述监督标签表征所述训练样本的数据对中的关键词与商品标签相对应的描述是否相似;文本编码模块,用于将所述训练样本输入至商品推荐模型,提取数据对中关键词和商品标签相对应的深层语义信息,获得相应的编码特征向量;平均池化模块,用于对训练样本中关键词和商品标签相对应的编码特征向量进行平均池化,计算出两个池化结果之间的相似度;迭代训练模块,用于采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对商品推荐模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
进一步的实施例中,所述文本获取模块之前,还包括:标签标注模块,用于根据商品数据库中各个商品的文本信息,采用聚类算法对各个商品进行分类,标注各个类别的商品相对应的商品标签,所述文本信息包括商品的描述信息。
又一方面,适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的聊天式商品导购方法的步骤。
又一方面,适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的聊天式商品导购方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
本申请的技术方案存在多方面优势,包括但不限于如下各方面:
本申请采用文本识别模型识别出在聊天窗口输入的聊天文本中的关键词,采用文本分类模型确定所述聊天文本所表达的购买意图是否明确,进而针对表达购买意图明确的聊天文本,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口;针对表达购买意图模糊的聊天文本,采用商品推荐模型确定该聊天文本相匹配的预设商品标签,获取所述商品标签相对应的商品的商品信息,推送至聊天窗口。可见,实现智能化,全程无需人工介入,便可根据聊天文本所表达的购买意图,提供符合的商品,保证及时性,执行十分高效,有效降低卖家了解上线的众多商品的门槛,高效辅助卖家提供优质的导购服务,提升购物满意度。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的聊天式商品导购方法的典型实施例的流程示意图;
图2为本申请的实施例中文本分类模型的构成及训练的流程示意图;
图3为本申请的实施例中文本分类模型的构成及训练的流程示意图;
图4为本申请的实施例中采用文本分类模型确定与查询文本相匹配的问题文本的流程示意图;
图5为本申请的实施例中确定问题文本及其对应的答复文本中的关键词的流程示意图;
图6为本申请的实施例中文本分类模型的训练过程的示意图;
图7为本申请的聊天式商品导购装置的原理框图;
图8为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种聊天式商品导购方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如,本申请的示例性应用场景中,可以在电商平台的服务器中部署实现,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
请参阅图1,本申请的聊天式商品导购方法,在其典型实施例中,包括如下步骤:
步骤S1100、获取聊天窗口中的聊天文本,采用文本识别模型识别出所述聊天文本中的关键词,所述关键词包括商品特征的描述信息;
一般而言,跨境电商平台提供独立站服务,商品租借该跨境电商平台的独立站点,部署线上店铺,在线上店铺上架商品信息,供平台上的买家用户选购其所需的商品。
通常跨境电商平台可为各个独立站点均设立聊天窗口,各个独立站点均被分配各自的聊天程序入口,以便于各个独立站点部署的线上店铺与买家用户进行聊天。买家用户可通过所述聊天程序入口,到达相应的线上店铺的聊天窗口,与该线上店铺的卖家用户进行聊天,譬如,在常见的电商导购场景下,买家用户可输入阐述自身需求的文本,发送至聊天窗口。卖家用户查阅后,若是据此能够直接确定该用户的需求,便可推送店铺内相应的商品在聊天窗口作为答复;若是不能够直接确定该用户的需求,便可进一步根据店铺的商品的商品特征例如商品属性、商品品类、商品品牌、商品名称等等,发送包含所述商品特征的描述信息的文本至聊天窗口作为答复,买家用户查阅后,便可根据确定该答复的文本所描述的商品特征是否为自身所需,输入相应的文本发送至聊天窗口,如此通过两者之间的聊天,卖家用户可以不断向买家用户提供包含商品特征的描述信息的文本,过程中根据买家用户的输入的文本,确认所提供的商品特征的描述信息是否为买家用户所需,循环往复,最终卖家用户便可确定用户的商品需求。
据此,可通过预先封装的数据接口获取相应的聊天窗口中的聊天文本,所述数据接口可由本领域技术人员灵活实现。
所述文本识别模型适用于命名实体识别任务,具体模型选型可为BiLSTM+CRF、CNN+CRF等,本领域技术人员按需选取一种选型实现即可,文本识别模型经过训练至收敛后,可以习得识别出向模型输入的聊天文本中的各个词元所属的实体标识集中相对应的实体标识的能力。所述实体标识集可由本领域技术人员按需预先设置,示范性举例,所述实体标识集包括表示商品特征的多种实体标识如商品属性、商品品类、商品品牌、商品名称等等,以及表示非商品特征的实体标识。
据此,便可将所述聊天文本作为所述文本识别模型的输入,识别出该聊天文本中各个词元相对应的实体标识,筛选出表示商品特征的实体标识相对应的词元作为关键词。
步骤S1200、采用文本分类模型确定所述聊天文本所表达的购买意图是否明确;
所述文本分类模型适用于文本分类任务,具体模型选型可为Bert模型、HAN模型、LEAM模型、TextCNN、TextRNN、TextRCNN,本领域技术人员按需选取一种选型实现即可。
可采集足量的表达购买意图明确的聊天文本例如:“给我推荐一个深红色的口红,送人的”、“请问有红色的保温杯吗”等等,以及表达购买意图模糊的聊天文本例如“宝宝怕热,有合适的夏装推荐吗”、“油性肌肤适合什么产品”、“目前怀孕中,有没有合适的产品推荐”等等,作为训练样本,为这些训练样本相应标注表征其表达的购买意图是否明确的监督标签,构造出训练集。应用该训练集训练所述文本分类模型,在训练过程中,调用单个训练样本输入至文本分类模型中,对所述训练样本进行编码,提取相应的深层语义特征,获得编码特征向量,将其映射至相应的分类空间,所述分类空间包括表征聊天文本所表达的购买意图明确的正类空间,以及表征聊天文本所表达的购买意图模糊的负类空间,获得相应的分类概率,根据训练样本对应的监督标签,计算该分类概率的损失值,在该损失值达到预设阈值时判定文本分类模型收敛而终止训练,否则调用下一个训练样本继续对文本分类模型实施迭代训练,当根据该损失值判定文本模型收敛之后,便可终止训练。可以理解,所述文本分类模型经过训练至收敛后,习得辨识向其输入的聊天文本所表达的购买意图是否明确的能力。所述预设阈值可由本领域技术人员根据先验知识或实验数据灵活变通设置。
据此,便可将所述聊天文本作为训练至收敛的所述文本分类模型的输入,对该聊天文本进行编码,提取相应的深层语义特征,获得编码特征向量,将其映射至相应的分类空间,确定所得的分类概率最大对应的分类空间,若该分类空间为正类空间表示所述聊天文本所表达的购买意图明确,反之,表示所述聊天文本所表达的购买意图模糊。另外,在此过程中,表达购买意图明确的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图明确的各个聊天文本对应的关键词;
表达购买意图模糊的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图模糊的各个聊天文本对应的关键词。
步骤S1300、针对表达购买意图明确的所述聊天文本,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口;
可以理解,各个独立站点可搭建并维护自身的商品数据库,以存储线上店铺上线的各个商品相对应的商品信息,所述商品信息包括但不限于商品的文本信息、商品特征的描述信息。所述的文本信息,可以包括商品的商品标题、商品详情文本、商品属性、品类标签等任意一种或任意多种文本。
采用搜索引擎从商品数据库中检索出与所述聊天文本的关键词相匹配多个商品,针对各个商品的商品标题,采用TF-IDF算法计算所述各个关键词相对应的TF*IDF作为搜索评分,以所述搜索评分从高到低的顺序,相应将各个商品进行排序,筛选出排序靠前的商品构成商品集。所述搜索引擎可选用Elasticsearch,其是位于Elastic Stack核心的分布式搜索和分析引擎。
进一步,获取商品集中各个商品相对应的用户行为数据,所述用户行为数据包括点击量、收藏量、加购量、购买量中的任意一项或多项,将各项用户行为数据匹配相应的预设权重再求和,计算出各个商品相对应的排序评分,所述预设权重可根据各项用户行为执行所带来的收益大小,设定相应的用户行为数据的权重,示范性举例,点击>收藏>加购>购买,具体对应权重可为,点击量:1、收藏量:2、加购量:3、购买量:4,本领域技术人员可按此处揭示灵活预先设定所述各项用户行为对应的权重。由此,便可从所述商品集中筛选出排序评分最高的商品,获取其商品信息,封装成商品页链接、商品推送海报图、二维码等任意一种形式的数据,推送至聊天窗口。
步骤S1400、针对表达购买意图模糊的所述聊天文本,采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签,获取所述商品标签相对应的商品的商品信息,推送至聊天窗口。
所述商品推荐模型适用于文本相似任务,模型结构可为文本编码器后接相似度计算模块,具体文本编码器选型可为所述深度学习模型可为NLP(Natural LanguageProcessing)领域中适用于提取文本语义特征的基于深层语义学习的网络模型,具体采用开源框架Sentence Transformers,它提供了大量的预先训练至收敛的Transformer模型,譬如:Bert、RoBERTa、XLM-RoBERTa、MPNet等等,本领域技术人员按需选取一种选型实现即可。所述相似度计算模块,适用于计算表征两个文本语义对应的向量化表示之间的向量距离作为相似度,以其表示该两个文本之间的语义相似程度。
可根据商品数据库中各个商品的文本信息,为各个商品人工标注其相应的商品标签,所述商品标签用于建立商品与买家用户的聊天文本所提及的对该商品的需求之间的关联,据此,商品标签需迎合其对应商品的买家用户需求而设定进行标注。示范性举例,商品的商品标题为“金盏花植物爽肤水控油保湿舒缓红血丝收缩毛孔”,该商品的商品标签可为“油性肌肤”、“干性皮肤”、“毛孔粗大”、“控油”、“保湿”等等,所述的文本信息,可以包括商品的商品标题、商品详情文本、商品属性、品类标签等任意一种或任意多种文本。
可以理解,可通过采集表达购买意图模糊的聊天文本中的关键词与预设商品标签构成的数据对作为训练样本,根据所述训练样本的数据对中的关键词与商品标签相对应的描述是否相似,相应标注该训练样本的监督标签,以此训练商品推荐模型直至收敛,使其习得确定商品标签与表达购买意图模糊的聊天文本中的关键词之间描述的相似度的能力。
据此,便可将所述聊天文本中的关键词分别与各个商品标签构成多个数据对,输入至训练至收敛的所述商品推荐模型,确定出各个商品标签与所述关键词之间的相似度,从而筛选出相似度超过预设阈值的商品标签,获取所述商品标签相对应的商品的商品信息,封装成商品页链接、商品推送海报图、二维码等任意一种形式的数据,推送至聊天窗口。所述预设阈值可由本领域技术人员按此处揭示按需设定。
根据本申请的典型实施例可以知晓,本申请的技术方案存在多方面优势,包括但不限于如下各方面:
本申请采用文本识别模型识别出在聊天窗口输入的聊天文本中的关键词,采用文本分类模型确定所述聊天文本所表达的购买意图是否明确,进而针对表达购买意图明确的聊天文本,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口;针对表达购买意图模糊的聊天文本,采用商品推荐模型确定该聊天文本相匹配的预设商品标签,获取所述商品标签相对应的商品的商品信息,推送至聊天窗口。可见,实现智能化,全程无需人工介入,便可根据聊天文本所表达的购买意图,提供符合的商品,保证及时性,执行十分高效,有效降低卖家了解上线的众多商品的门槛,高效辅助卖家提供优质的导购服务,提升购物满意度。
请参阅图2,进一步的实施例中,步骤S1100、采用文本识别模型识别出所述聊天文本中的关键词的步骤中,包括如下步骤:
步骤S1110、对所述聊天文本进行分词,获得相应的分词文本;
可采用WordPiece、jieba、n-gram等多种分词算法对所述聊天文本进行最细粒度分词,获得相应的分词文本,其中包含聊天文本中的各个词元。
一种实施例中,采用1-gram分词算法,取词窗口为1,移动步长为1,对所述聊天文本进行分词,获得包含该聊天文本中各个词元的分词文本。
步骤S1120、将所述分词文本输入文本识别模型,确定分词文本中各个词元相对应的实体标识;
一种实施例中,采用BiLSTM+CRF实现的文本识别模型,将所述分词文本输入文本识别模型的词嵌入层,利用预训练的embedding矩阵将分词文本中的各个词元映射为低维稠密向量,获得分词文本对应的嵌入表示序列。采用BiLSTM即双层LSTM对所述嵌入表示序列进行编码,提取相应的深层语义特征,其中,一个LSTM网络计算嵌入表示序列对应的前向的隐特征,另一个LSTM网络计算嵌入表示序列对应的后向的隐特征,继而将两个LSTM网络所得的隐特征进行拼接,获得所述嵌入表示序列的编码特征序列。将所述编码特征序列输入至线性层,映射至各个分类空间,所述各个分类空间表征所述实体标识集中相应的实体标识,获得所述分词文本中各个词元对应的分数矩阵,所述分数矩阵为映射至各个分类空间相对应的分数,据此,针对所述各个词元,确定其分数矩阵中分数最大的分类空间表征的实体标识,作为各个词或单词对应的实体标识。进一步,将所述分词文本中各个词元对应的实体标识作为CRF输入,根据该CRF层中训练习得的转移矩阵,计算出所述分词文本中各个词元对应的转移分数,所述转移分数表示当前实体标识转移至另一实体标识的概率。最终,根据所述分词文本中各个词元对应的分数矩阵以及转移分数,计算路径分数,示范性公式如下:
Figure BDA0003872730420000131
通过上式计算确定所述分词文本x,其对应的路径分数score为其中各个词元的打分之和,所述打分包含两个部分:
前半部分
Figure BDA0003872730420000132
由BiLSTM输出的相应词元对应的分数矩阵Pi决定。
后半部分
Figure BDA0003872730420000133
由CRF计算出的相应词元对应的转移矩阵A决定,其中
Figure BDA0003872730420000134
表示从yi-1实体标识转移至yi实体标识的转移分数。
从而确定出所述路径分数最大的实体标识序列,作为所述分词文本对应的实体标识序列。
步骤S1130、筛选出用于表示商品特征的实体标识相对应的词元作为关键词。
根据所述分词文本对应的实体标识序列,确定出该分词文本中各个词元所对应的实体标识,筛选出用于表示商品特征的实体标识相对应的词元作为关键词。
本实施例中,采用文本识别模型能够精准识别聊天文本各个词元对应的实体标识,从而可根据准确的实体标识,确定表示商品特征的实体标识作为关键词,执行高效便捷。
请参阅图3,进一步的实施例中,步骤S1300、从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口的步骤中,包括如下步骤:
步骤S1310、根据所述聊天文本中的关键词,采用搜索引擎从商品数据库中,检索出与所述关键词相匹配的商品集;
采用搜索引擎从商品数据库中检索出与所述聊天文本的关键词相匹配多个商品,针对各个商品的商品标题,采用TF-IDF算法计算所述各个关键词相对应的TF*IDF作为搜索评分,以所述搜索评分从高到低的顺序,相应将各个商品进行排序,筛选出排序靠前的商品构成商品集。所述搜索引擎可选用Elasticsearch,其是位于Elastic Stack核心的分布式搜索和分析引擎。
步骤S1320、获取所述商品集中各个商品相对应的用户行为数据,计算出各个商品相对应的排序评分,所述用户行为数据包括点击量、收藏量、加购量、购买量中的任意一项或多项;
进一步,获取商品集中各个商品相对应的用户行为数据,所述用户行为数据包括点击量、收藏量、加购量、购买量中的任意一项或多项,将各项用户行为数据匹配相应的预设权重再求和,计算出各个商品相对应的排序评分,所述预设权重可根据各项用户行为执行所带来的收益大小,设定相应的用户行为数据的权重,示范性举例,点击>收藏>加购>购买,具体对应权重可为,点击量:1、收藏量:2、加购量:3、购买量:4,本领域技术人员可按此处揭示灵活预先设定所述各项用户行为对应的权重。
步骤S1330、从所述商品集中筛选出排序评分最高的商品,获取其商品信息推送至聊天窗口。
以所述排序评分从高到低的顺序,相应将所述商品集中的各个商品进行排序,筛选出排序评分最高的商品,获取其商品信息,封装成商品页链接、商品推送海报图、二维码等任意一种形式的数据,推送至聊天窗口。
本实施例中,在商品匹配聊天文本中的关键词基础上,参考了该商品对应的用户行为数据,使得推送的商品一定程度上能够吸引到买家用户。
请参阅图4,进一步的实施例中,步骤S1400、采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签的步骤中,包括如下步骤:
步骤S1410、将所述聊天文本中的关键词与预设商品标签构成数据对,输入至商品推荐模型进行编码,获得所述数据对中关键词和商品标签相对应的编码特征向量;
一种实施例中,所述商品推荐模型为双塔模型,其中对应包括权重共享的两个文本编码器,分别与两个文本编码器后接的一个池化层,以及两个池化层共同后接相似度计算模块,所述两个文本编码器均为Bert且权重共享,所述两个池化层均执行平均池化。
将所述聊天文本中的关键词分别与各个商品标签构成多个数据对,输入至训练至收敛的所述商品推荐模型,针对各个数据对,由模型的一个文本编码器接收数据对中的关键词,另一个文本编码器接收商品标签进行编码,据此,提取各个数据对中的商品标签及关键词相对应的深层语义特征,获得相应的编码特征向量。
步骤S1420、对所述关键词和商品标签相对应的编码特征向量分别进行平均池化,计算两者池化结果之间的相似度;
采用所述商品推荐模型的两个池化层,分别对所述商品标签及关键词相对应的编码特征向量进行平均池化,进而将两路池化结果输入至相似度计算模块,计算两路池化结果之间的向量距离作为相似度,所述相似度计算模块可以Faiss、ElasticSearch、Milvus等大规模向量检索引擎中的任意一种来实施,也可以采用诸如余弦相似度、点积、曼哈顿距离、欧氏距离等任意一种现成的算法来计算。
步骤S1430、筛选出相似度超过预设阈值的商品标签。
基于上述步骤,便可计算各个商品标签与所述聊天文本中的关键词之间的相似度,可以理解,所述相似度表征各个商品标签与所述关键词之间的语义相似程度,据此,筛选出相似度超过预设阈值的商品标签,所述商品标签便是接近所述关键词的描述,所述预设阈值可由本领域技术人员按此处揭示按需设定。
本实施例中,采用商品推荐模型,精准计算出预设商品标签与聊天文本中的关键词之间的相似度,从而可根据准确的相似度,筛选出接近所述关键词描述的商品标签,执行高效便捷。
请参阅图5,进一步的实施例中,步骤S1100、获取聊天窗口中的聊天文本之前,还包括如下步骤:
步骤S1010、从预备的训练集中获取单个训练样本及其监督标签,所述训练样本包括表达购买意图模糊的聊天文本中的关键词与预设商品标签构成的数据对,所述监督标签表征所述训练样本的数据对中的关键词与商品标签相对应的描述是否相似;
可采集足量的涉及不同商品领域的表达购买意图模糊的聊天文本,参考步骤S1110-1130,采用所述文本识别模型识别出各个聊天文本中的关键词,针对各个聊天文本,将其关键词与各个预设商品标签构成多个数据对作为训练样本,为各个训练样本标注表征其数据对中的关键词与商品标签相对应的描述是否相似的监督标签,以各个所述训练样本及其监督标签构造训练集。所述商品领域包括但不限于,美妆领域、服装领域、电器领域、食品领域。
步骤S1020、将所述训练样本输入至商品推荐模型,提取数据对中关键词和商品标签相对应的深层语义信息,获得相应的编码特征向量;
一种实施例中,所述商品推荐模型为双塔模型,其中对应包括权重共享的两个文本编码器,分别与两个文本编码器后接的一个池化层,以及两个池化层共同后接相似度计算模块,所述两个文本编码器均为Bert且权重共享,所述两个池化层均执行平均池化。
采用商品推荐模型的两个文本编码器分别提取数据对中关键词和商品标签相对应的深层语义信息,获得相应编码特征向量,所述深层语义信息包含文本中的各个词元,基于在其上下文中进行注意力交互,对应所得的语义信息,所述编码特征向量中的各个元素表征文本中相应词元的语义表示。
步骤S1030、对训练样本中关键词和商品标签相对应的编码特征向量进行平均池化,计算出两个池化结果之间的相似度;
采用商品推荐模型的两个池化层,分别对训练样本中关键词和商品标签相对应的编码特征向量进行平均池化,获得相应的两个池化结果,继而采用相似度计算模块计算两个池化结果之间的相似度,所述相似度计算模块可以Faiss、ElasticSearch、Milvus等大规模向量检索引擎中的任意一种来实施,也可以采用诸如余弦相似度、点积、曼哈顿距离、欧氏距离等任意一种现成的算法来计算。
步骤S1040、采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对商品推荐模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,根据所述训练样本的监督标签,计算所述相似度的交叉熵损失值,当该损失值达到预设阈值时,表明商品推荐模型已被训练至收敛状态,从而可以终止模型训练;损失值未达到预设阈值时,表明模型未收敛,于是根据该损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用所述训练集中的下一训练样本对商品推荐模型实施迭代训练,直至商品推荐模型被训练至收敛状态为止。
本实施例中,揭示了商品推荐模型的训练过程,在训练至收敛后,文本分类模型习得精准地计算出向其输入的数据对中的两个文本之间的相似度的能力。
请参阅图6,进一步的实施例中,步骤S1100、获取聊天窗口中的聊天文本之前,还包括如下步骤:
步骤S1000、根据商品数据库中各个商品的文本信息,采用聚类算法对各个商品进行分类,标注各个类别的商品相对应的商品标签,所述文本信息包括商品的描述信息。
可根据商品数据库中各个商品的文本信息,采用聚类算法例如DBSCAN算法、Kmeans算法、拉普帕斯算法、PCA算法等等,对各个商品进行分类,区分出各个类别的商品,在此基础上,通过人工标注各个类别的商品相对应的商品标签,所述商品标签用于建立商品与买家用户的聊天文本所提及的对该商品的需求之间的关联,据此,商品标签需迎合其对应商品的买家用户需求而设定进行标注。示范性举例,商品的商品标题为“金盏花植物爽肤水控油保湿舒缓红血丝收缩毛孔”,该商品的商品标签可为“油性肌肤”、“干性皮肤”、“毛孔粗大”、“控油”、“保湿”等等,所述的文本信息,可以包括商品的商品标题、商品详情文本、商品属性、品类标签等任意一种或任意多种文本。
本实施例中,采用在算法基础上进行人工标注的方式,实现标注各个商品对应的商品标签,执行高效,效果可观。
请参阅图7,适应本申请的目的之一而提供的一种聊天式商品导购装置,是对本申请的聊天式商品导购方法的功能化体现,该装置包括文本获取模块1100、意图确定模块1200、第一推送模块1300以及第二推送模块1400,其中,文本获取模块1100,用于获取聊天窗口中的聊天文本,采用文本识别模型识别出所述聊天文本中的关键词,所述关键词包括商品特征的描述信息;意图确定模块1200,用于采用文本分类模型确定所述聊天文本所表达的购买意图是否明确;第一推送模块1300,用于针对表达购买意图明确的所述聊天文本,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口;第二推送模块1400,用于针对表达购买意图模糊的所述聊天文本,采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签,获取所述商品标签相对应的商品的商品信息,推送至聊天窗口。
进一步的实施例中,所述文本获取模块1100,包括:文本分词子模块,用于对所述聊天文本进行分词,获得相应的分词文本;命名实体识别子模块,用于将所述分词文本输入文本识别模型,确定分词文本中各个词元相对应的实体标识;关键词筛选子模块,用于筛选出用于表示商品特征的实体标识相对应的词元作为关键词。
进一步的实施例中,所述第一推送模块1300,包括:商品检索子模块,用于根据所述聊天文本中的关键词,采用搜索引擎从商品数据库中,检索出与所述关键词相匹配的商品集;评分计算子模块,用于获取所述商品集中各个商品相对应的用户行为数据,计算出各个商品相对应的排序评分,所述用户行为数据包括点击量、收藏量、加购量、购买量中的任意一项或多项;商品筛选子模块,用于从所述商品集中筛选出排序评分最高的商品,获取其商品信息推送至聊天窗口。
进一步的实施例中,所述第二推送模块1400,包括:文本编码子模块,用于将所述聊天文本中的关键词与预设商品标签构成数据对,输入至商品推荐模型进行编码,获得所述数据对中关键词和商品标签相对应的编码特征向量;平均池化子模块,用于对所述关键词和商品标签相对应的编码特征向量分别进行平均池化,计算两者池化结果之间的相似度;标签筛选子模块,用于筛选出相似度超过预设阈值的商品标签。
进一步的实施例中,所述意图确定模块1200,确定出所述聊天文本所表达的购买意图明确或者模糊,其中:第一关键词子模块,用于表达购买意图明确的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图明确的各个聊天文本对应的关键词;第二关键词子模块,用于表达购买意图模糊的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图模糊的各个聊天文本对应的关键词。
进一步的实施例中,所述文本获取模块1100之前,还包括:样本获取模块,用于从预备的训练集中获取单个训练样本及其监督标签,所述训练样本包括表达购买意图模糊的聊天文本中的关键词与预设商品标签构成的数据对,所述监督标签表征所述训练样本的数据对中的关键词与商品标签相对应的描述是否相似;文本编码模块,用于将所述训练样本输入至商品推荐模型,提取数据对中关键词和商品标签相对应的深层语义信息,获得相应的编码特征向量;平均池化模块,用于对训练样本中关键词和商品标签相对应的编码特征向量进行平均池化,计算出两个池化结果之间的相似度;迭代训练模块,用于采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对商品推荐模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
进一步的实施例中,所述文本获取模块1100之前,还包括:标签标注模块,用于根据商品数据库中各个商品的文本信息,采用聚类算法对各个商品进行分类,标注各个类别的商品相对应的商品标签,所述文本信息包括商品的描述信息。
为解决上述技术问题,本申请实施例还提供计算机设备。如图8所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种聊天式商品导购方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的聊天式商品导购方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图7中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的聊天式商品导购装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的聊天式商品导购方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请采取智能化的方式,无需人工介入,便可根据聊天过程中聊天文本所表达的购物意图,高效及时地提供符合的商品,保证导购服务效率,提升购物满意度。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种聊天式商品导购方法,其特征在于,包括如下步骤:
获取聊天窗口中的聊天文本,采用文本识别模型识别出所述聊天文本中的关键词,所述关键词包括商品特征的描述信息;
采用文本分类模型确定所述聊天文本所表达的购买意图是否明确;
针对表达购买意图明确的所述聊天文本,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口;
针对表达购买意图模糊的所述聊天文本,采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签,获取所述商品标签相对应的商品的商品信息,推送至聊天窗口。
2.根据权利要求1所述的聊天式商品导购方法,其特征在于,采用文本识别模型识别出所述聊天文本中的关键词的步骤中,包括如下步骤:
对所述聊天文本进行分词,获得相应的分词文本;
将所述分词文本输入文本识别模型,确定分词文本中各个词元相对应的实体标识;
筛选出用于表示商品特征的实体标识相对应的词元作为关键词。
3.根据权利要求1所述的聊天式商品导购方法,其特征在于,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口的步骤中,包括如下步骤:
根据所述聊天文本中的关键词,采用搜索引擎从商品数据库中,检索出与所述关键词相匹配的商品集;
获取所述商品集中各个商品相对应的用户行为数据,计算出各个商品相对应的排序评分,所述用户行为数据包括点击量、收藏量、加购量、购买量中的任意一项或多项;
从所述商品集中筛选出排序评分最高的商品,获取其商品信息推送至聊天窗口。
4.根据权利要求1所述的聊天式商品导购方法,其特征在于,采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签的步骤中,包括如下步骤:
将所述聊天文本中的关键词与预设商品标签构成数据对,输入至商品推荐模型进行编码,获得所述数据对中关键词和商品标签相对应的编码特征向量;
对所述关键词和商品标签相对应的编码特征向量分别进行平均池化,计算两者池化结果之间的相似度;
筛选出相似度超过预设阈值的商品标签。
5.根据权利要求1所述的聊天式商品导购方法,其特征在于,采用文本分类模型确定所述聊天文本所表达的购买意图是否明确的步骤中,确定出所述聊天文本所表达的购买意图明确或者模糊,其中:
表达购买意图明确的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图明确的各个聊天文本对应的关键词;
表达购买意图模糊的所述聊天文本,其对应的关键词包括当前识别出的该聊天文本中的关键词,以及在该聊天文本之前的同样是表达购买意图模糊的各个聊天文本对应的关键词。
6.根据权利要求1所述的聊天式商品导购方法,其特征在于,获取聊天窗口中的聊天文本之前,还包括如下步骤:
从预备的训练集中获取单个训练样本及其监督标签,所述训练样本包括表达购买意图模糊的聊天文本中的关键词与预设商品标签构成的数据对,所述监督标签表征所述训练样本的数据对中的关键词与商品标签相对应的描述是否相似;
将所述训练样本输入至商品推荐模型,提取数据对中关键词和商品标签相对应的深层语义信息,获得相应的编码特征向量;
对训练样本中关键词和商品标签相对应的编码特征向量进行平均池化,计算出两个池化结果之间的相似度;
采用所述训练样本的监督标签,确定所述相似度的损失值,在所述损失值未达到预设阈值时,对商品推荐模型实施权重更新,并继续调用其他训练样本实施迭代训练直至模型收敛。
7.根据权利要求1所述的聊天式商品导购方法,其特征在于,获取聊天窗口中的聊天文本之前,还包括如下步骤:
根据商品数据库中各个商品的文本信息,采用聚类算法对各个商品进行分类,标注各个类别的商品相对应的商品标签,所述文本信息包括商品的描述信息。
8.一种聊天式商品导购装置,其特征在于,包括:
文本获取模块,用于获取聊天窗口中的聊天文本,采用文本识别模型识别出所述聊天文本中的关键词,所述关键词包括商品特征的描述信息;
意图确定模块,用于采用文本分类模型确定所述聊天文本所表达的购买意图是否明确;
第一推送模块,用于针对表达购买意图明确的所述聊天文本,从商品数据库中检索出与该聊天文本中的关键词相匹配的商品的商品信息,推送至聊天窗口;
第二推送模块,用于针对表达购买意图模糊的所述聊天文本,采用商品推荐模型确定该聊天文本中的关键词相匹配的预设商品标签,获取所述商品标签相对应的商品的商品信息,推送至聊天窗口。
9.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
CN202211203805.7A 2022-09-29 2022-09-29 聊天式商品导购方法及其装置、设备、介质 Pending CN115689672A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211203805.7A CN115689672A (zh) 2022-09-29 2022-09-29 聊天式商品导购方法及其装置、设备、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211203805.7A CN115689672A (zh) 2022-09-29 2022-09-29 聊天式商品导购方法及其装置、设备、介质

Publications (1)

Publication Number Publication Date
CN115689672A true CN115689672A (zh) 2023-02-03

Family

ID=85064502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211203805.7A Pending CN115689672A (zh) 2022-09-29 2022-09-29 聊天式商品导购方法及其装置、设备、介质

Country Status (1)

Country Link
CN (1) CN115689672A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116521906A (zh) * 2023-04-28 2023-08-01 广州商研网络科技有限公司 元描述生成方法及其装置、设备、介质
CN116662555A (zh) * 2023-07-28 2023-08-29 成都赛力斯科技有限公司 一种请求文本处理方法、装置、电子设备及存储介质
CN117541275A (zh) * 2024-01-09 2024-02-09 深圳市微购科技有限公司 一种基于云技术的智能终端商品销售管理系统
CN117541275B (zh) * 2024-01-09 2024-06-07 深圳市微购科技有限公司 一种基于云技术的智能终端商品销售管理系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116521906A (zh) * 2023-04-28 2023-08-01 广州商研网络科技有限公司 元描述生成方法及其装置、设备、介质
CN116521906B (zh) * 2023-04-28 2023-10-24 广州商研网络科技有限公司 元描述生成方法及其装置、设备、介质
CN116662555A (zh) * 2023-07-28 2023-08-29 成都赛力斯科技有限公司 一种请求文本处理方法、装置、电子设备及存储介质
CN116662555B (zh) * 2023-07-28 2023-10-20 成都赛力斯科技有限公司 一种请求文本处理方法、装置、电子设备及存储介质
CN117541275A (zh) * 2024-01-09 2024-02-09 深圳市微购科技有限公司 一种基于云技术的智能终端商品销售管理系统
CN117541275B (zh) * 2024-01-09 2024-06-07 深圳市微购科技有限公司 一种基于云技术的智能终端商品销售管理系统

Similar Documents

Publication Publication Date Title
CN112231569B (zh) 新闻推荐方法、装置、计算机设备及存储介质
CN115689672A (zh) 聊天式商品导购方法及其装置、设备、介质
CN107145485B (zh) 用于压缩主题模型的方法和装置
CN112836130A (zh) 一种基于联邦学习的上下文感知推荐系统及方法
CN112307351A (zh) 用户行为的模型训练、推荐方法、装置和设备
CN113434716B (zh) 一种跨模态信息检索方法和装置
US11860932B2 (en) Scene graph embeddings using relative similarity supervision
CN113254711B (zh) 一种互动图像的显示方法、装置、计算机设备和存储介质
Roopak et al. OntoKnowNHS: ontology driven knowledge centric novel hybridised semantic scheme for image recommendation using knowledge graph
CN113392179A (zh) 文本标注方法及装置、电子设备、存储介质
CN113641797A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
CN116521906B (zh) 元描述生成方法及其装置、设备、介质
CN113792786A (zh) 商品对象自动分类方法及其装置、设备、介质、产品
CN113962224A (zh) 命名实体识别方法及其装置、设备、介质、产品
CN116976920A (zh) 商品导购方法及其装置、设备、介质
CN115545832A (zh) 商品搜索推荐方法及其装置、设备、介质
CN114329004A (zh) 数字指纹生成、数据推送方法、装置和存储介质
CN116823404A (zh) 商品组合推荐方法及其装置、设备、介质
CN115563280A (zh) 商品标签标注方法及其装置、设备、介质
CN116521843A (zh) 面向用户的智能客服方法及其装置、设备、介质
CN116957128A (zh) 业务指标预测方法、装置、设备和存储介质
CN116955707A (zh) 内容标签的确定方法、装置、设备、介质及程序产品
CN115936805A (zh) 商品推荐方法及其装置、设备、介质
CN114547313A (zh) 资源类型识别方法以及装置
CN115700579A (zh) 广告文本生成方法及其装置、设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination