CN111259281B - 商户标签的确定方法、装置及存储介质 - Google Patents

商户标签的确定方法、装置及存储介质 Download PDF

Info

Publication number
CN111259281B
CN111259281B CN202010066336.3A CN202010066336A CN111259281B CN 111259281 B CN111259281 B CN 111259281B CN 202010066336 A CN202010066336 A CN 202010066336A CN 111259281 B CN111259281 B CN 111259281B
Authority
CN
China
Prior art keywords
merchant
target
label
vector
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010066336.3A
Other languages
English (en)
Other versions
CN111259281A (zh
Inventor
郑景耀
刘洪�
张雨豪
陈新杰
周美旭
张开旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010066336.3A priority Critical patent/CN111259281B/zh
Publication of CN111259281A publication Critical patent/CN111259281A/zh
Application granted granted Critical
Publication of CN111259281B publication Critical patent/CN111259281B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9562Bookmark management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种商户标签的确定方法、装置及存储介质;方法包括:获取目标商户的基础信息及关联信息,关联信息为基于基础信息而得到的与目标商户相关联的信息;基于基础信息及关联信息,确定目标商户的原子标签,所述原子标签用于指示目标商户的属性类别;获取目标商户所归属的商户类别的标签体系,所述标签体系由至少两个用于指示商户类别的商户标签所构成;基于基础信息及原子标签,确定目标商户对应标签体系中的目标商户标签,以结合所述目标商户标签及目标用户针对所述目标商户的交易信息,构建所述目标用户的兴趣标签,并基于所述兴趣标签对所述目标用户进行商户推荐。通过本发明,能够提高商户标签挖掘的全面性及准确性。

Description

商户标签的确定方法、装置及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种商户标签的确定方法、装置及存储介质。
背景技术
随着互联网技术的发展,如微信支付、拼多多等服务商平台由于其能够便利地为商户发布营销活动、打造品牌知名度,帮助商户更好地获取客流,越来越多的商户选择入驻到服务商平台上进行营销。相关技术通常利用商户的基础信息,如行业信息、注册信息、经营信息及名称信息,进行商户标签的挖掘;然而,由于入驻到服务器平台的大量商户为间联商户,缺乏详细的基础信息;而且其并不能很好利用商户在互联网中存在的诸如商家菜单、用户评论、维基百科介绍等公开信息,导致对商户标签的挖掘的全面性和精确性都比较低。
发明内容
本发明实施例提供一种商户标签的确定方法、装置及存储介质,能够提高商户标签挖掘的全面性及准确性。
本发明实施例提供一种商户标签的确定方法,包括:
获取目标商户的基础信息及关联信息,所述关联信息为基于所述基础信息而得到的与所述目标商户相关联的信息;
基于所述基础信息及所述关联信息,确定所述目标商户的原子标签,所述原子标签用于指示所述目标商户的属性类别;
获取所述目标商户所归属的商户类别的标签体系,所述标签体系由至少两个用于指示商户类别的商户标签所构成;
基于所述基础信息及所述原子标签,确定所述目标商户对应所述标签体系中的目标商户标签,以结合所述目标商户标签及目标用户针对所述目标商户的交易信息,构建所述目标用户的兴趣标签,并基于所述兴趣标签对所述目标用户进行商户推荐。
本发明实施例提供一种商户标签的确定装置,包括:
第一获取模块,用于获取目标商户的基础信息及关联信息,所述关联信息为基于所述基础信息而得到的与所述目标商户相关联的信息;
第一确定模块,用于基于所述基础信息及所述关联信息,确定所述目标商户的原子标签,所述原子标签用于指示所述目标商户的属性类别;
第二获取模块,用于获取所述目标商户所归属的商户类别的标签体系,所述标签体系由至少两个用于指示商户类别的商户标签所构成;
第二确定模块,用于基于所述基础信息及所述原子标签,确定所述目标商户对应所述标签体系中的目标商户标签,以结合所述目标商户标签及目标用户针对所述目标商户的交易信息,构建所述目标用户的兴趣标签,并基于所述兴趣标签对所述目标用户进行商户推荐。
上述方案中,所述第一确定模块,还用于分别对所述基础信息及所述关联信息进行关键词提取,得到对应所述目标商户的至少两个关键词;
分别将各所述关键词与所述目标商户的商户名称进行相关性匹配,得到相应的相关性权重;
将相关性权重超过相关性权重阈值的关键词,作为所述目标商户的原子标签。
上述方案中,所述第一确定模块,还用于分别对各所述关键词进行向量转换,得到对应的关键词向量;
对所述目标商户的商户名称进行向量转换,得到对应的商户名称向量;
分别将各所述关键词向量与所述商户名称向量进行相似度匹配,得到对应的相似度值,将所述相似度值作为对应的相关性权重。
上述方案中,所述装置还包括标签体系构建模块,所述标签体系构建模块,用于确定目标商户所归属的商户类别;
获取所述商户类别所包括的至少两个子商户类别,及所述子商户类别所包括的至少两个商户标签;
基于所述商户类别、所述子商户类别及所述商户标签的层级关系,构建所述目标商户所归属商户类别对应的树形标签体系;
其中,所述树形标签体系的根节点对应所述商户类别,所述树形标签体系的叶子结点对应所述商户标签。
上述方案中,所述第二确定模块,还用于分别对所述基础信息与所述原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量;
将所述基础信息向量与所述原子标签向量进行拼接处理,得到对应所述目标商户的拼接信息向量;
通过第一标签分类模型对所述拼接信息向量进行分类,得到所述目标商户对应所述标签体系中的目标商户标签。
上述方案中,所述第一标签分类模型包括:输入层、隐藏层和输出层,所述第二确定模块,还用于将所述拼接信息向量输入至所述输入层,以通过所述输入层传递至所述隐藏层;
通过所述隐藏层,调用激活函数得到对应所述拼接信息向量的隐层特征;
通过所述输出层,对得到的所述隐层特征进行分类预测,得到对应所述目标商户的目标商户标签,所述目标商户标签归属于所述目标商户所归属的商户类别的标签体系。
上述方案中,所述装置还包括第一标签分类模型训练模块,所述第一标签分类模型训练模块,用于获取商户样本,所述商户样本标注有对应所述商户样本的目标分类结果,所述目标分类结果归属于所述商户样本所归属的商户类别的标签体系;
将所述商户样本输入至所述输入层,以通过所述输入层传递至所述隐藏层;
通过所述隐藏层,调用激活函数得到对应所述商户样本的隐层特征;
通过所述输出层,对得到的所述隐层特征进行分类预测,得到对应所述商户样本的分类结果;
获取所述分类结果与所述目标分类结果之间的差异,并基于所述差异更新所述第一标签分类模型的模型参数。
上述方案中,所述第二确定模块,还用于分别对所述基础信息与所述原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量;
通过第二标签分类模型的特征提取层,分别对所述基础信息向量和原子标签向量进行特征提取,得到对应的基础信息特征和原子标签特征;
通过所述第二标签分类模型的特征拼接层,对所述基础信息特征及所述原子标签特征进行拼接处理,得到对应所述目标商户的拼接特征;
通过所述第二标签分类模型的特征映射层,对所述拼接特征进行映射处理,得到对应所述目标商户的目标商户标签,所述目标商户标签归属于所述目标商户所归属的商户类别的标签体系。
上述方案中,所述装置还包括构建模块,所述构建模块,用于获取目标用户针对所述目标商户的交易信息;
基于所述目标商户标签及所述交易信息,建立所述目标用户与所述目标商户的关联关系;
基于所述关联关系,构建所述目标用户的兴趣标签。
上述方案中,所述装置还包括推荐模块,所述推荐模块,用于获取待推荐商户的商户标签;
将所述待推荐商户的商户标签与所述目标用户的兴趣标签进行匹配,得到匹配结果;
当所述匹配结果表征所述待推荐商户的商户标签与所述兴趣标签匹配成功时,将所述待推荐商户推荐给所述目标用户。
上述方案中,所述推荐模块,还用于获取所述目标商户针对所述目标用户的触达方式,以及所述目标用户针对所述触达方式的互动操作;
根据所述触达方式及所述互动操作,确定针对所述目标用户的推送方式;
基于所述推送方式,对所述目标用户进行商户推荐。
上述方案中,所述推荐模块,还用于获取用于标识所述目标用户的属性特征;
将所述属性特征添加到针对待推荐商户的推荐文案中,得到对应的目标推送文案;
基于所述目标推送文案,将所述待推荐商户推荐给所述目标用户。
上述方案中,所述推荐模块,还用于获取所述目标用户针对所述目标商户的互动时间;
基于所述互动时间,确定对应所述目标用户的推送时间;
基于所述推送时间,对所述目标用户进行商户推荐。
本发明实施例提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本发明实施例提供的方法。
本发明实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本发明实施例提供的方法。
本发明实施例具有以下有益效果:
通过目标商户的基础信息及关联信息,确定目标商户的原子标签,并基于目标商户所归属的商户类别的标签体系及目标商户的原子标签,确定目标商户对应标签体系中的目标商户标签;如此,结合目标商户的基础信息及基于基础信息而得到的与目标商户相关联的关联信息,充分考虑了与目标商户相关的信息,提高了商户标签挖掘的全面性及精确度。
附图说明
图1为本发明实施例提供的商户标签的确定系统的一个可选的架构示意图;
图2为本发明实施例提供的电子设备的一个可选的结构示意图;
图3为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图;
图4为本发明实施例提供的树形标签体系的架构示意图;
图5为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图;
图6为本发明实施例提供的第一标签分类模型的结构示意图;
图7为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图;
图8为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图;
图9为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图;
图10为本发明实施例提供的关键词提取的示意图;
图11为本发明实施例提供的商户标签的确定装置的一个可选的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)原子标签,实体名称,用于指示商户的属性类别,具有唯一指代特性,如苹果为名词,但说到苹果会联想到水果、手机等,不具备唯一性,因此,苹果不可作为原子标签;而生鱼片为名词,用于指示一种食物,具有唯一指代性,因此,生鱼片可作为食物的原子标签。
2)商户标签,又称概念标签,用于指示对某一类群体或对象的某项特征进行的抽象分类和概括。
参见图1,图1为本发明实施例提供的商户标签的确定系统100的一个可选的架构示意图,为实现支撑一个示例性应用,终端400(示例性示出了终端400-1、终端400-2)通过网络300连接服务商平台200,其中,终端400-1位于目标商户推荐发布侧,终端400-2位于推荐接收侧,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输。
如图1所示,用户打开终端400-1的应用客户端,如微信支付应用,通过应用客户端将目标商户入驻至服务商平台200,如微信支付商户平台时,服务商平台200用于获取目标商户的基础信息及关联信息,这里,关联信息为基于基础信息而得到的与目标商户相关联的信息;基于基础信息及关联信息,确定目标商户的原子标签;并获取目标商户所归属的商户类别的标签体系;基于基础信息及原子标签,确定目标商户对应标签体系中的目标商户标签,其中,得到的目标商户标签用于供结合目标用户针对目标商户的交易信息,构建目标用户的兴趣标签,以基于兴趣标签对目标用户进行商户推荐。
在实际应用中,当用户打开终端400-1的应用客户端,在服务商平台200上发布针对待推荐商户的营销活动时,服务商平台200获取待推荐商户的商户标签,将待推荐商户的商户标签与目标用户的兴趣标签进行匹配,得到匹配结果,当匹配结果表征待推荐商户的商户标签与目标用户的兴趣标签匹配成功时,将待推荐商户的营销活动推荐给目标用户对应的终端400-2。
参见图2,图2为本发明实施例提供的电子设备200的一个可选的结构示意图,以电子设备实施为服务商平台200为例,图2所示的电子设备200包括:至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。终端200中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器250可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Me mory),易失性存储器可以是随机存取存储器(RAM,Random Access Memo ry)。本发明实施例描述的存储器250旨在包括任意适合类型的存储器。
在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块253,用于经由一个或多个与用户接口230相关联的输出装置231(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块254,用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本发明实施例提供的商户标签的确定装置可以采用软件方式实现,图2示出了存储在存储器250中的商户标签的确定装置255,其可以是程序和插件等形式的软件,包括以下软件模块:第一获取模块2551、第一确定模块2552、第二获取模块2553和第二确定模块2554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在另一些实施例中,本发明实施例提供的商户标签的确定装置可以采用硬件方式实现,作为示例,本发明实施例提供的商户标签的确定装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的商户标签的确定方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application SpecificIntegrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Pr ogrammable Gate Array)或其他电子元件。
下面将结合本发明实施例提供的商户标签的确定方法实施为服务商平台时的示例性应用,说明本发明实施例提供的商户标签的确定方法。
参见图3,图3为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图,将结合图3示出的步骤进行说明。
步骤301:服务商平台获取目标商户的基础信息及关联信息。
在实际应用中,服务商平台,如微信支付商户平台,能够提供各种支付产品,满足商户通过微信支付收款的需求,以及平台能够提供智慧经营、现金红包、代金券等运营工具,助力商户发布营销活动、获取客流、打造品牌知名度以更好地玩转营销。商户为了利用服务商平台这一便利性优势,通过手机或电脑等终端申请入驻服务商平台,在入驻时需要在线提交营业执照、身份证、银行账户等基础信息。
服务商平台接收到针对目标商户的入驻请求,获取目标商户的基础信息及关联信息,其中,基础信息包括但不限于:商户标识、商户名称、商户公司名称、商户简称、商户经营信息、商户的公众号等。关联信息为基于基础信息而得到的与目标商户相关联的信息,分为两大类,一类是交易信息,如用户与该目标商户发生交易时,交易的商品数据、位置数据、金额等信息;另一类是公开数据,即通过互联网公开渠道及商户名称,进行搜索模糊匹配能够关联到的数据,如基于商户名称匹配关联的百度搜索结果、维基百科简介、腾讯地图商户标签、微信公众号文章。
步骤302:基于基础信息及关联信息,确定目标商户的原子标签。
其中,原子标签用于指示目标商户的属性类别。
在一些实施例中,服务商平台可通过如下方式基于基础信息及关联信息,确定目标商户的原子标签:
分别对基础信息及关联信息进行关键词提取,得到对应目标商户的至少两个关键词;分别将各关键词与目标商户的商户名称进行相关性匹配,得到相应的相关性权重;将相关性权重超过相关性权重阈值的关键词,作为目标商户的原子标签。
在一些实施例中,服务商平台可通过如下方式分别将关键词与目标商户的商户名称进行相关性匹配,得到相应的相关性权重:
分别对各关键词进行向量转换,得到对应的关键词向量;对目标商户的商户名称进行向量转换,得到对应的商户名称向量;分别将各关键词向量与商户名称向量进行相似度匹配,得到对应的相似度值,将得到的相似度值作为对应关键词的相关性权重。
在实际应用中,服务商平台获取到的基础信息及关联信息可能比较繁多与杂乱,为了得到与目标商户最相关的一些词语,需要对获取到的信息进行关键词提取,得到对应目标商户的多个关键词。在实际实施时,可通过但不限于:词频逆文档频率(TF-IDF,TermFrequency Inverse Document Frequency)和T extRank等无监督的关键词提取算法,机器学习或深度学习等有监督的分类算法,对获取的目标商户的基础信息及关联信息进行关键词提取,得到多个关键词。
针对上述获取的关键词,可采用但不限于无监督的embedrank相关性算法或有监督的深度学习相关性算法,计算提取的关键词与目标商户的相关性权重,以确定关键词是否归属于目标商户,或与目标商户的关联的强度大小。在实际实施时,可采用无监督的embedrank相关性算法,选用词向量模型,将目标商户的商户名称与提取的各个关键词进行向量化表示,通过余弦相似度计算出各关键词向量与商户名称向量的相似度值,将得到的相似度值作为对应关键词的相关性权重。这里,词向量模型可采用word2vec、glove等算法自行训练,也可采用公开的模型比如ailab开源的800万词向量模型,本发明对此并不做具体限定。
通过上述方式,目标商户的关键词列表中的关键词均带有相应的相关性权重,相关性权重取值范围为0-1,相关性权重取值越大,表征对应的关键字与目标商户的相关性就越大。可根据需求设置相关性权重阈值,选取相关性权重超过相关性权重阈值的关键词作为目标商户的原子标签。
步骤303:获取目标商户所归属的商户类别的标签体系。
其中,标签体系由至少两个用于指示商户类别的商户标签所构成。
在一些实施例中,服务商平台可通过如下方式构建目标商户所属商户类别的标签体系:
确定目标商户所归属的商户类别;获取商户类别所包括的至少两个子商户类别,及所述子商户类别所包括的至少两个商户标签;基于商户类别、子商户类别及商户标签的层级关系,构建目标商户所归属商户类别对应的树形标签体系;其中,树形标签体系的根节点对应商户类别,树形标签体系的叶子结点对应商户标签。
例如,参见图4,图4为本发明实施例提供的树形标签体系的架构示意图,如图4所示,假设目标商户归属于餐饮类,树形标签体系的根节点对应餐饮商户标签体系,表征目标商户所归属的商户类别;根节点的子节点分别对应饮品类、美食类及点心类,表征餐饮商户类别包括饮品类、美食类及点心类等子商户类别;饮品类这一子节点的叶子节点对应凉茶、果汁奶茶、茗茶和咖啡,表征对于饮品类这一子商户类别而言,其包括凉茶、果汁奶茶、茗茶和咖啡等4个商户标签,即仅用叶子节点作为标签体系,那么可知,餐饮商户标签体系有凉茶、果汁奶茶、…、甜品等13个商户标签。
步骤304:基于基础信息及原子标签,确定目标商户对应所述标签体系中的目标商户标签。
其中,目标商户标签,用于供结合目标用户针对目标商户的交易信息,构建目标用户的兴趣标签,以基于目标用户的兴趣标签对目标用户进行商户推荐。
在一些实施例中,服务商平台可通过如下方式基于基础信息及原子标签,确定目标商户对应标签体系中的目标商户标签:
分别对基础信息与原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量;将基础信息向量与原子标签向量进行加权求和处理,得到对应目标商户的加权求和向量;通过第一标签分类模型对加权求和向量进行分类处理,得到目标商户对应标签体系中的目标商户标签。
在一些实施例中,服务商平台可通过如下方式基于基础信息及原子标签,确定目标商户对应标签体系中的目标商户标签:
分别对基础信息与原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量;将基础信息向量与原子标签向量进行拼接处理,得到对应目标商户的拼接信息向量;通过第一标签分类模型对拼接信息向量进行分类,得到目标商户对应标签体系中的目标商户标签。
参见图5,图5为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图,如图5所示,将目标商户的基础信息和原子标签对应的向量表示进行拼接,得到拼接信息向量,并将得到的拼接信息向量输入至第一标签分类模型中,进行分类预测,得到目标商户的目标商户标签。需要说明的是,第一标签分类模型为多标签分类模型中的一种,用于实现对目标商户的商户标签进行分类,多标签分类模型结构可为多种形式,实现多标签分类的算法也有多种,本发明并不对多标签分类模型的结构与实现算法进行具体限制。
在一些实施例中,参见图6,图6为本发明实施例提供的第一标签分类模型的结构示意图,如图6所示,第一标签分类模型包括:输入层、隐藏层和输出层,服务商平台可通过如下方式通过第一标签分类模型对拼接信息向量进行分类,得到目标商户对应标签体系中的目标商户标签:
将拼接信息向量输入至输入层,以通过输入层传递至所述隐藏层;通过隐藏层,调用激活函数得到对应拼接信息向量的隐层特征;通过输出层,对得到的隐层特征进行分类预测,得到对应目标商户的目标商户标签,目标商户标签归属于目标商户所归属的商户类别的标签体系。
在一些实施例中,服务商平台可通过如下方式训练得到第一标签分类模型:
获取商户样本,商户样本标注有对应商户样本的目标分类结果,目标分类结果归属于商户样本所归属的商户类别的标签体系;将商户样本输入至输入层,以通过输入层传递至隐藏层;通过隐藏层,调用激活函数得到对应商户样本的隐层特征;通过输出层,对得到的隐层特征进行分类预测,得到对应商户样本的分类结果;获取分类结果与目标分类结果之间的差异,并基于差异更新第一标签分类模型的模型参数。
这里,在对第一标签分类模型训练之前,需构建训练的商户样本,商户样本携带有基础信息及关联信息,在实际实施时,首先对商户样本的基础信息进行分词处理,得到对应的多个词语,分别对得到的各个词语进行word2vector词向量转换处理,得到对应各个词语的词语向量;对得到的各个词语的词语向量加权求平均,得到对应的基础信息向量;然后基于同样的处理,得到对应商户样本的关联信息向量;最后,将得到的商户样本的基础信息向量及关联信息向量进行拼接处理,得到商户样本的拼接信息向量。
接下来将得到的商户样本的拼接信息向量输入至第一标签分类模型中进行模型的训练。在一些实施例中,服务商平台可通过如下方式基于获取的差异,更新第一标签分类模型的模型参数:
当差异超过差异阈值时,基于差异确定相应的误差信号;将确定的误差信号在第一标签分类模型中反向传播,并在传播的过程中更新各个层的模型参数。
在一些实施例中,服务商平台还可通过如下方式基于基础信息及原子标签,确定目标商户对应标签体系中的目标商户标签:
分别对基础信息与原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量;通过第二标签分类模型的特征提取层,分别对基础信息向量和原子标签向量进行特征提取,得到对应的基础信息特征和原子标签特征;通过第二标签分类模型的特征拼接层,对基础信息特征及原子标签特征进行拼接处理,得到对应目标商户的拼接特征;通过第二标签分类模型的特征映射层,对拼接特征进行映射处理,得到对应目标商户的目标商户标签,目标商户标签归属于目标商户所归属的商户类别的标签体系。
参见图7,图7为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图,如图7所示,第二标签分类模型包括特征提取层、特征拼接层和特征映射层,在实际实施时,分别将目标商家的基础信息向量及原子标签向量输入至第二标签分类模型中,通过特征提取层,得到对应的基础信息特征及原子标签特征;通过特征拼接层,得到对应的拼接特征;通过特征映射层,得到对应目标商户的目标商户标签。
在一些实施例中,服务商平台可通过如下方式基于目标商户的商户标签,构建目标用户的兴趣标签:
获取目标用户针对目标商户的交易信息;基于目标商户标签及交易信息,建立目标用户与目标商户的关联关系;基于建立的关联关系,构建目标用户的兴趣标签。
这里,在实际应用中,在构建目标用户的兴趣标签之前,需获取标签数据,标签数据可为目标用户与目标商户的交易数据,还可从服务商平台后端打通所有原始数据收集的通道,对原始数据进行身份识别,做去重、去刷单、去无效、去异常等数据清洗工作,以提取对构建兴趣标签有帮助的标签数据。在实际实施时,一旦目标用户与目标商户发生了交易,则两者之间就建立了关联关系,基于建立的关联关系,构建目标用户的兴趣标签。
例如,当目标用户通过微信支付商户平台到目标商户为“海底捞火锅世界城广场店”就餐,由于目标商户的商户标签为“川式火锅”,则微信支付商户平台即可为该目标用户标注“川式火锅”的兴趣标签。通过上述方法,即可基于目标用户与商户的交易信息,构建目标用户的多个兴趣标签。
在一些实施例中,当确定目标用户的兴趣标签后,服务商平台可通过如下方式将待推荐商户推荐给目标用户:
获取待推荐商户的商户标签;将待推荐商户的商户标签与目标用户的兴趣标签进行匹配,得到匹配结果;当匹配结果表征待推荐商户的商户标签与目标用户的兴趣标签匹配成功时,将待推荐商户推荐给目标用户。
这里,由于目标用户的兴趣标签表征目标用户的偏好,将与目标用户的兴趣标签匹配成功的商户标签对应的待推荐商户推荐给目标用户,提高了推荐的精准度。
在一些实施例中,服务商平台还可通过如下方式对目标用户进行商户推荐:
获取目标商户针对目标用户的触达方式,以及目标用户针对触达方式的互动操作;根据触达方式及互动操作,确定针对目标用户的推送方式;基于确定的推送方式,对目标用户进行商户推荐。
这里,触达方式是指能够接触到用户,并和用户发生联系的方式,根据实际情况,触达方式多种多样,比如,对于互联网产品来说,产品本身、站内信、推送、邮件、短信等均是触达用户的方式,在实际应用中,结合目标用户针对触发方式的互动情况,如是否点击链接、是否发表评、是否回复信息等来确定针对目标用户的推送方式,通过目标用户偏好的推送方式,推荐商户给目标用户,或将与目标用户的兴趣标签相匹配的商户标签对应的待推荐商户推荐给目标用户,实现了推送方式的个性化,在提升体验的同时节约了推荐成本。
在一些实施例中,服务商平台还可通过如下方式对目标用户进行商户推荐:
获取用于标识目标用户的属性特征;将属性特征添加到针对待推荐商户的推荐文案中,得到对应的目标推送文案;基于目标推送文案,将待推荐商户推荐给所述目标用户。
这里,目标用户的属性特征可为目标用户的姓名、昵称、星座等,将目标用户的属性特征植入针对商户的推荐文案中,比如,待推荐商户的推送文案为:“新春来临之际,凡预定年饭者享受88折优惠”,当服务商平台获取目标用户的姓名为“张三”时,将目标用户的姓名植入原来的推送文案中,得到目标推送文案为:“张三,新春来临之际,凡预定年饭者享受88折优惠”,将得到的目标推送文案推荐目标用户,实现推荐内容的个性化体验。
在一些实施例中,服务商平台还可通过如下方式对目标用户进行商户推荐:
获取目标用户针对目标商户的互动时间;基于获取的互动时间,确定对应目标用户的推送时间;基于确定的推送时间,对目标用户进行商户推荐。
通过上述方式,基于目标用户历史点击/购买时间,确定目标用户最易被营销触动的时间点,在黄金时间点,对目标用户进行商户推荐,或将与目标用户的兴趣标签相匹配的商户标签对应的待推荐商户推荐给目标用户,实现推荐时间个性化体验。
通过目标商户的基础信息及关联信息,确定目标商户的原子标签,并基于目标商户所归属的商户类别的标签体系及目标商户的原子标签,确定目标商户对应标签体系中的目标商户标签;如此,结合目标商户的基础信息及基于基础信息而得到的与目标商户相关联的关联信息,充分考虑了与目标商户相关的信息,得到的目标商户标签更加全面、更加准确。同时,结合目标商户标签及目标用户针对目标商户的交易信息,构建目标用户的兴趣标签,以基于兴趣标签对目标用户进行个性化的商户推荐。
接下来以服务商平台为微信支付商户平台为例,继续对本发明实施例提供的商户标签的确定方法进行介绍,图8为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图,参见图8,本发明实施例提供的商户标签的确定方法包括:
步骤401:微信支付应用客户端响应于点击操作,发送针对目标商户的入驻请求至微信支付商户平台。
这里,商家点击终端上的微信支付应用客户端,进入入驻注册界面,输入入驻信息,在线提交营业执照、身份证、银行账户等基础信息,相应地,微信支付应用客户端生成并发送针对目标商户的入驻请求至微信支付商户平台。
步骤402:微信支付商户平台获取目标商户的基础信息及关联信息。
其中,基础信息包括但不限于:商户标识、商户名称、商户公司名称、商户简称、商户经营信息、商户的公众号等;关联信息为基于基础信息而得到的与目标商户相关联的信息,如用户与该目标商户发生交易时,交易的商品数据、位置数据、金额等信息,或基于商户名称匹配关联的百度搜索结果、维基百科简介、腾讯地图商户标签、微信公众号文章。
步骤403:微信支付商户平台分别对基础信息及关联信息进行关键词提取,得到对应目标商户的至少两个关键词。
在实际实施时,可通过但不限于:词频逆文档频率(TF-IDF,Term Frequ encyInverse Document Frequency)和TextRank等无监督的关键词提取算法,机器学习或深度学习等有监督的分类算法,对获取的目标商户的基础信息及关联信息进行关键词提取,得到多个关键词。
步骤404:微信支付商户平台分别将各关键词与目标商户的商户名称进行相关性匹配,得到相应的相关性权重。
针对上述获取的关键词,可采用但不限于无监督的embedrank相关性算法或有监督的深度学习相关性算法,计算提取的关键词与目标商户的相关性权重,以确定关键词是否归属于目标商户,或与目标商户的关联的强度大小。在实际实施时,可采用无监督的embedrank相关性算法,选用词向量模型,将目标商户的商户名称与提取的各个关键词进行向量化表示,通过余弦相似度计算出各关键词向量与商户名称向量的相似度值,将得到的相似度值作为对应关键词的相关性权重。
步骤405:微信支付商户平台将相关性权重超过相关性权重阈值的关键词,作为目标商户的原子标签。
通过上述方式,目标商户的关键词列表中的关键词均带有相应的相关性权重,相关性权重取值范围为0-1,相关性权重取值越大,表征对应的关键字与目标商户的相关性就越大。可根据需求设置相关性权重阈值,选取相关性权重超过相关性权重阈值的关键词作为目标商户的原子标签。
步骤406:微信支付商户平台获取目标商户所归属的商户类别的标签体系。
例如,如图4所示,餐饮商户标签体系有凉茶、果汁奶茶、…、甜品等13个商户标签。
步骤407:微信支付商户平台分别对基础信息与原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量。
步骤408:微信支付商户平台将基础信息向量与原子标签向量进行拼接处理,得到对应目标商户的拼接信息向量。
这里,将目标商户的基础信息,如商户名称、公司名称和经营范围,和目标商户的原子标签列表,拼接成一个长字符串,将得到的长字符串输入至多标签分类模型中。
步骤409:微信支付商户平台通过多标签分类模型对拼接信息向量进行分类,得到目标商户对应标签体系中的目标商户标签。
这里,多标签分类模型用于实现对目标商户的商户标签进行分类,多标签分类模型结构可为多种形式,实现多标签分类的算法也有多种,本发明并不对多标签分类模型的结构与实现算法进行具体限制。
步骤410:微信支付商户平台基于目标商户标签,构建目标用户的兴趣标签。
这里,在实际实施时,微信支付商户平台获取目标用户针对目标商户的交易信息;基于目标商户标签及交易信息,建立目标用户与目标商户的关联关系;基于建立的关联关系,构建目标用户的兴趣标签。
步骤411:微信支付商户平台获取待推荐商户的商户标签。
步骤412:微信支付商户平台将待推荐商户的商户标签与目标用户的兴趣标签进行匹配,得到匹配结果。
步骤413:当匹配结果表征待推荐商户的商户标签与目标用户的兴趣标签匹配成功时,微信支付商户平台将待推荐商户推荐给目标用户。
这里,由于目标用户的兴趣标签表征目标用户的偏好,将与目标用户的兴趣标签匹配成功的商户标签对应的待推荐商户推荐给目标用户,提高了推荐的精准度。
下面,将说明本发明实施例在一个实际的应用场景中的示例性应用。
微信支付商户平台能够提供各种支付产品,满足商户通过微信支付收款的需求,以及能够提供智慧经营、现金红包、代金券等运营工具,助力商户发布营销活动、获取客流、打造品牌知名度以更好地玩转营销,为此,越来越多的商户入驻到微信支付商户平台;然而,在实际应用中,由于大量商户为间联客户,缺乏详细的基础信息,对于此类信息缺乏的商户,商户标签的挖掘识别能力不足,比如对于“大渔铁板烧(保利店)”,单从名称层面无法有效的识别出自助餐、日本料理等标签信息;并且,商户在互联网中存在许多公开信息,如商家菜单、用户评论、维基百科介绍等,而传统的挖掘建模方案,无法较好的利用这些公开信息进行建模,导致直接建模会遇到诸如信息存在噪音、某类信息存在缺失、信息复杂、信息过多等问题,致使对商户标签的挖掘的全面性和精确性都比较低。
鉴于此,本发明实施例提供了一种商户标签的确定方法,能够最大限度地利用商户的公开信息,提高商户标签挖掘的全面性和精确性,在实际实施时,微信支付商户平台获取目标商户的基础信息及关联信息,这里,关联信息为基于基础信息而得到的与目标商户相关联的信息;基于基础信息及关联信息,确定目标商户的原子标签;并获取目标商户所归属的商户类别的标签体系;基于基础信息及原子标签,确定目标商户对应标签体系中的目标商户标签,其中,得到的目标商户标签用于供结合目标用户针对目标商户的交易信息,构建目标用户的兴趣标签,以基于兴趣标签对目标用户进行商户推荐,提高营销活动的推送精准度。
参见图9,图9为本发明实施例提供的商户标签的确定方法的一个可选的流程示意图,如图9所示,本发明实施例提供的商户标签的确定方法涉及原子标签抽取和概念标签(即商户标签)抽取等两个阶段,接下来逐一进行说明。
1、原子标签抽取
1)商户数据获取
在实际应用中,针对每个要进行标签抽取的目标商户,比如商户A,商户A数据包括基础信息及关联信息,其中,基础信息包括但不限于:商户标识、商户名称、商户公司名称、商户简称、商户经营信息、商户的公众号等。关联信息为基于基础信息而得到的与目标商户相关联的信息,分为两大类,一类是交易信息,如用户与该目标商户发生交易时,交易的商品数据、位置数据、金额等信息;另一类是公开数据,即通过互联网公开渠道及商户名称,进行搜索模糊匹配能够关联到的数据,如基于商户名称匹配关联的百度搜索结果、维基百科简介、腾讯地图商户标签、微信公众号文章。
例如,针对商户名称为:深圳市南山区大渔铁板烧保利店的商户,其基础信息如表1所示:
基础信息 内容
商户名称 深圳市南山区大渔铁板烧保利店的商户
商户简称 大渔铁板烧
行业 正餐
表1
其关联信息,也即简称为大渔铁板烧的商户的百科介绍信息如下:
大渔铁板烧(Tairyo)是一家以日式铁板烧为主打的餐厅,以日式铁板烧为主,辅以各式生鱼片、刺身,多选取各式新鲜牛肉,及各式海鲜,不仅主食无限量,更能品尝到“松竹梅”日本清酒,法国葡萄酒,名牌啤酒,也在无限量之内,绝对物超所值,品种丰富,原料新鲜,口味正宗,铁板烧由厨师现场烧制而成,一边看师傅的烹饪表演一边吃东西,既饱口福又饱眼福啊,加上自助式的消费,让人过瘾。
大渔铁板烧(Tairyo)店内装饰充满浓郁的日本风格,房间也以不同的日本城市名命名,让客人有归属感。另外,大渔(Tairyo)以最实惠的价格提供给消费者,做到让消费者满意而归,经营定位为中档餐饮品牌,大渔(Tairyo)主要经营日式料理价格适中适宜于上班族、个人消费。
2)关键词抽取
在实际应用中,服务商平台获取到的基础信息及关联信息可能比较繁多与杂乱,为了得到与目标商户最相关的一些词语,需要对获取到的信息进行关键词提取,得到对应目标商户的多个关键词。在实际实施时,可通过但不限于:TF-IDF和TextRank等无监督的关键词提取算法,机器学习或深度学习等有监督的分类算法。通过该过程,得到对应每个目标商户的关键词列表。
例如,还以上述大渔铁板烧为例进行说明,参见图10,图10为本发明实施例提供的关键词提取的示意图,如图10所示,服务商平台对获取的商户名称为“深圳市南山区大渔铁板烧保利店”这一基础信息,及“大渔铁板烧”的百科信息进行关键词提取,这里采用关键词匹配算法,候选关键词包含餐饮菜品、菜系、行业词,匹配出的关键词列表为:铁板烧、Tairyo、日本清酒、日式铁板烧、生鱼片、刺身…。
3)相关性计算
针对上述获取的关键词,可采用但不限于无监督的embedrank相关性算法或有监督的深度学习相关性算法,计算提取的关键词与目标商户的相关性权重,得到如表2所示的相关性权重,以确定关键词是否归属于目标商户,或与目标商户的关联的强度大小。通过该过程,每个目标商户会获得携带相关性强度的关键词列表,相关性权重为0-1之间,相关性权重越大,相关性越高,可根据需求设置相关性权重阈值,选取相关性权重超过相关性权重阈值的关键词作为目标商户的原子标签。
商户名称 关键词列表 相关性权重
深圳市南山区大渔铁板烧保利店 铁板烧 0.95
深圳市南山区大渔铁板烧保利店 Tairyo 0.92
深圳市南山区大渔铁板烧保利店 日本清酒 0.44
深圳市南山区大渔铁板烧保利店 日式铁板烧 0.86
深圳市南山区大渔铁板烧保利店 生鱼片 0.77
深圳市南山区大渔铁板烧保利店 刺身 0.75
表2
从表2中可知,关键词列表中“铁板烧”这一关键词与“深圳市南山区大渔铁板烧保利店”这一商户名称之间的相关性最大,关键词列表中“日本清酒”这一关键词与“深圳市南山区大渔铁板烧保利店”这一商户名称之间的相关性最小,可根据需求,选取相关性权重较高的关键词作为目标商户的原子标签,比如,设置相关性权重阈值为0.80,将相关性权重超过0.80的“铁板烧”、“T airyo”和“日式铁板烧”这三个关键词,作为目标商户的原子标签。
通过上述方式,对每个目标商户的基础信息及关联信息,通过关键词抽取及相关性计算等过程,得到对应目标商户的至少两个关键词,并确定各关键词与目标商户的相关性,对信息进行置信度校验把关,这一阶段最终得到了目标商户的原子标签。
2、概念标签抽取
1)标签体系设计
根据业务或者应用的要求设计合适的标签体系,其中标签体系中每个商户标签需要定义明确,是对某一类群体或对象的某项特征进行的抽象分类和概括。如图5所示,标签体系的商户标签个数是有限的,在使用时,只用叶子节点。
2)多标签分类
多标签分类模型用于实现对目标商户的商户标签进行分类,多标签分类模型结构可为多种形式,如上述所述的第一标签分类模型和第二标签分类模型,实现多标签分类的算法也有多种,如双向编码(BERT,Bidirectional Encoder Representations fromTransformers)算法,本发明并不对多标签分类模型的结构与实现算法进行具体限制。
在实际实施时,通过将目标商户的基础信息,如商户名称、公司名称和经营范围,和目标商户的原子标签列表,拼接成一个长字符串,将得到的长字符串输入至多标签分类模型中,获得概念标签(即商户标签)的结果。
例如,还以上述商户名称为“深圳市南山区大渔铁板烧保利店”这一目标商户为例进行说明,将表1所示的目标商户的基础信息(商户名称、商户简称及行业)进行向量转换,得到对应的基础信息向量;将得到的原子标签,如铁板烧、Tairyo、日本清酒、日式铁板烧,进行向量转换,得到对应的原子标签向量,将基础信息向量与原子标签向量拼接后,输入至第一标签分类模型,即映射至如图5所示的餐饮商户标签体系中,对目标商户的商户标签进行分类预测,最终得到的目标商户标签为“日本料理”。
通过上述方式,可在微信支付产品的商户标签建设中,对商户挖掘上亿的原子标签,百级的概念标签,其中概念标签的覆盖率和准确率均在90%以上。
在实际应用中,确定了目标商户的商户标签,商户标签可通过交易行为形成用户偏好、用户画像标签,即可结合商户标签及目标用户针对目标商户的交易信息,构建目标用户的兴趣标签,以基于兴趣标签对目标用户进行个性化的商户推荐,如待推荐商户对自己的顾客进行定位,其群体是喜欢茶饮、火锅的年轻人,运营可通过选取具有茶饮、火锅偏好的用户,对该商户3km范围内进行面对面发券营销活动,从而实现精准营销功能。
下面继续说明本发明实施例提供的商户标签的确定装置255实施为软件模块的示例性结构,在一些实施例中,如图2和图11所示,图11为本发明实施例提供的商户标签的确定装置的一个可选的结构示意图,存储在存储器250中的商户标签的确定装置255,其可以是程序和插件等形式的软件,包括以下软件模块:第一获取模块2551、第一确定模块2552、第二获取模块2553和第二确定模块2554。
第一获取模块2551,用于获取目标商户的基础信息及关联信息,所述关联信息为基于所述基础信息而得到的与所述目标商户相关联的信息;
第一确定模块2552,用于基于所述基础信息及所述关联信息,确定所述目标商户的原子标签,所述原子标签用于指示所述目标商户的属性类别;
第二获取模块2553,用于获取所述目标商户所归属的商户类别的标签体系,所述标签体系由至少两个用于指示商户类别的商户标签所构成;
第二确定模块2554,用于基于所述基础信息及所述原子标签,确定所述目标商户对应所述标签体系中的目标商户标签,以结合所述目标商户标签及目标用户针对所述目标商户的交易信息,构建所述目标用户的兴趣标签,并基于所述兴趣标签对所述目标用户进行商户推荐。
在一些实施例中,所述第一确定模块,还用于分别对所述基础信息及所述关联信息进行关键词提取,得到对应所述目标商户的至少两个关键词;
分别将各所述关键词与所述目标商户的商户名称进行相关性匹配,得到相应的相关性权重;
将相关性权重超过相关性权重阈值的关键词,作为所述目标商户的原子标签。
在一些实施例中,所述第一确定模块,还用于分别对各所述关键词进行向量转换,得到对应的关键词向量;
对所述目标商户的商户名称进行向量转换,得到对应的商户名称向量;
分别将各所述关键词向量与所述商户名称向量进行相似度匹配,得到对应的相似度值,将所述相似度值作为对应的相关性权重。
在一些实施例中,所述装置还包括标签体系构建模块,所述标签体系构建模块,用于确定目标商户所归属的商户类别;
获取所述商户类别所包括的至少两个子商户类别,及所述子商户类别所包括的至少两个商户标签;
基于所述商户类别、所述子商户类别及所述商户标签的层级关系,构建所述目标商户所归属商户类别对应的树形标签体系;
其中,所述树形标签体系的根节点对应所述商户类别,所述树形标签体系的叶子结点对应所述商户标签。
在一些实施例中,所述第二确定模块,还用于分别对所述基础信息与所述原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量;
将所述基础信息向量与所述原子标签向量进行拼接处理,得到对应所述目标商户的拼接信息向量;
通过第一标签分类模型对所述拼接信息向量进行分类,得到所述目标商户对应所述标签体系中的目标商户标签。
在一些实施例中,所述第一标签分类模型包括:输入层、隐藏层和输出层,所述第二确定模块,还用于将所述拼接信息向量输入至所述输入层,以通过所述输入层传递至所述隐藏层;
通过所述隐藏层,调用激活函数得到对应所述拼接信息向量的隐层特征;
通过所述输出层,对得到的所述隐层特征进行分类预测,得到对应所述目标商户的目标商户标签,所述目标商户标签归属于所述目标商户所归属的商户类别的标签体系。
在一些实施例中,所述装置还包括第一标签分类模型训练模块,所述第一标签分类模型训练模块,用于获取商户样本,所述商户样本标注有对应所述商户样本的目标分类结果,所述目标分类结果归属于所述商户样本所归属的商户类别的标签体系;
将所述商户样本输入至所述输入层,以通过所述输入层传递至所述隐藏层;
通过所述隐藏层,调用激活函数得到对应所述商户样本的隐层特征;
通过所述输出层,对得到的所述隐层特征进行分类预测,得到对应所述商户样本的分类结果;
获取所述分类结果与所述目标分类结果之间的差异,并基于所述差异更新所述第一标签分类模型的模型参数。
在一些实施例中,所述第二确定模块,还用于分别对所述基础信息与所述原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量;
通过第二标签分类模型的特征提取层,分别对所述基础信息向量和原子标签向量进行特征提取,得到对应的基础信息特征和原子标签特征;
通过所述第二标签分类模型的特征拼接层,对所述基础信息特征及所述原子标签特征进行拼接处理,得到对应所述目标商户的拼接特征;
通过所述第二标签分类模型的特征映射层,对所述拼接特征进行映射处理,得到对应所述目标商户的目标商户标签,所述目标商户标签归属于所述目标商户所归属的商户类别的标签体系。
在一些实施例中,所述装置还包括构建模块,所述构建模块,用于获取目标用户针对所述目标商户的交易信息;
基于所述目标商户标签及所述交易信息,建立所述目标用户与所述目标商户的关联关系;
基于所述关联关系,构建所述目标用户的兴趣标签。
在一些实施例中,所述装置还包括推荐模块,所述推荐模块,用于获取待推荐商户的商户标签;
将所述待推荐商户的商户标签与所述目标用户的兴趣标签进行匹配,得到匹配结果;
当所述匹配结果表征所述待推荐商户的商户标签与所述兴趣标签匹配成功时,将所述待推荐商户推荐给所述目标用户。
在一些实施例中,所述推荐模块,还用于获取所述目标商户针对所述目标用户的触达方式,以及所述目标用户针对所述触达方式的互动操作;
根据所述触达方式及所述互动操作,确定针对所述目标用户的推送方式;
基于所述推送方式,对所述目标用户进行商户推荐。
在一些实施例中,所述推荐模块,还用于获取用于标识所述目标用户的属性特征;
将所述属性特征添加到针对待推荐商户的推荐文案中,得到对应的目标推送文案;
基于所述目标推送文案,将所述待推荐商户推荐给所述目标用户。
在一些实施例中,所述推荐模块,还用于获取所述目标用户针对所述目标商户的互动时间;
基于所述互动时间,确定对应所述目标用户的推送时间;
基于所述推送时间,对所述目标用户进行商户推荐。
本发明实施例提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本发明实施例提供的方法。
本发明实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本发明实施例提供的方法。
在一些实施例中,存储介质可以是FRAM、ROM、PROM、EPROM、EE PROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(H TML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。

Claims (15)

1.一种商户标签的确定方法,其特征在于,所述方法包括:
获取目标商户的基础信息及关联信息,所述关联信息为基于所述基础信息而得到的与所述目标商户相关联的信息;
基于所述基础信息及所述关联信息,确定所述目标商户的原子标签,所述原子标签用于指示所述目标商户的属性类别;
获取所述目标商户所归属的商户类别的标签体系,所述标签体系由至少两个用于指示商户类别的商户标签所构成;
分别对所述基础信息与所述原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量;
将所述基础信息向量与所述原子标签向量进行拼接处理,得到对应所述目标商户的拼接信息向量;
对所述拼接信息向量进行分类,得到所述目标商户对应所述标签体系中的目标商户标签;
结合所述目标商户标签及目标用户针对所述目标商户的交易信息,构建所述目标用户的兴趣标签,并基于所述兴趣标签对所述目标用户进行商户推荐。
2.如权利要求1所述的方法,其特征在于,所述基于所述基础信息及所述关联信息,确定所述目标商户的原子标签,包括:
分别对所述基础信息及所述关联信息进行关键词提取,得到对应所述目标商户的至少两个关键词;
分别将各所述关键词与所述目标商户的商户名称进行相关性匹配,得到相应的相关性权重;
将相关性权重超过相关性权重阈值的关键词,作为所述目标商户的原子标签。
3.如权利要求2所述的方法,其特征在于,所述分别将各所述关键词与所述目标商户的商户名称进行相关性匹配,得到相应的相关性权重,包括:
分别对各所述关键词进行向量转换,得到对应的关键词向量;
对所述目标商户的商户名称进行向量转换,得到对应的商户名称向量;
分别将各所述关键词向量与所述商户名称向量进行相似度匹配,得到对应的相似度值,将所述相似度值作为对应的相关性权重。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定目标商户所归属的商户类别;
获取所述商户类别所包括的至少两个子商户类别,及所述子商户类别所包括的至少两个商户标签;
基于所述商户类别、所述子商户类别及所述商户标签的层级关系,构建所述目标商户所归属商户类别对应的树形标签体系;
其中,所述树形标签体系的根节点对应所述商户类别,所述树形标签体系的叶子结点对应所述商户标签。
5.如权利要求1所述的方法,其特征在于,
所述分类是通过第一标签分类模型实现的,所述第一标签分类模型包括:输入层、隐藏层和输出层,所述对所述拼接信息向量进行分类,得到所述目标商户对应所述标签体系中的目标商户标签,包括:
将所述拼接信息向量输入至所述输入层,以通过所述输入层传递至所述隐藏层;
通过所述隐藏层,调用激活函数得到对应所述拼接信息向量的隐层特征;
通过所述输出层,对得到的所述隐层特征进行分类预测,得到对应所述目标商户的目标商户标签,所述目标商户标签归属于所述目标商户所归属的商户类别的标签体系。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
获取商户样本,所述商户样本标注有对应所述商户样本的目标分类结果,所述目标分类结果归属于所述商户样本所归属的商户类别的标签体系;
将所述商户样本输入至所述输入层,以通过所述输入层传递至所述隐藏层;
通过所述隐藏层,调用激活函数得到对应所述商户样本的隐层特征;
通过所述输出层,对得到的所述隐层特征进行分类预测,得到对应所述商户样本的分类结果;
获取所述分类结果与所述目标分类结果之间的差异,并基于所述差异更新所述第一标签分类模型的模型参数。
7.如权利要求1所述的方法,其特征在于,
所述分类是通过第二标签分类模型实现的;
所述分别对所述基础信息与所述原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量,包括:
通过所述第二标签分类模型的特征提取层,分别对所述基础信息向量和所述原子标签向量进行特征提取,得到对应的基础信息向量和原子标签向量;
所述将所述基础信息向量与所述原子标签向量进行拼接处理,得到对应所述目标商户的拼接信息向量,包括:
通过所述第二标签分类模型的特征拼接层,对所述基础信息向量及所述原子向量特征进行拼接处理,得到对应所述目标商户的拼接信息向量;
所述对所述拼接信息向量进行分类,得到所述目标商户对应所述标签体系中的目标商户标签,包括:
通过所述第二标签分类模型的特征映射层,对所述拼接信息向量进行映射处理,得到对应所述目标商户的目标商户标签,所述目标商户标签归属于所述目标商户所归属的商户类别的标签体系。
8.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取目标用户针对所述目标商户的交易信息;
基于所述目标商户标签及所述交易信息,建立所述目标用户与所述目标商户的关联关系;
基于所述关联关系,构建所述目标用户的兴趣标签。
9.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取待推荐商户的商户标签;
将所述待推荐商户的商户标签与所述目标用户的兴趣标签进行匹配,得到匹配结果;
当所述匹配结果表征所述待推荐商户的商户标签与所述兴趣标签匹配成功时,将所述待推荐商户推荐给所述目标用户。
10.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标商户针对所述目标用户的触达方式,以及所述目标用户针对所述触达方式的互动操作;
根据所述触达方式及所述互动操作,确定针对所述目标用户的推送方式;
基于所述推送方式,对所述目标用户进行商户推荐。
11.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取用于标识所述目标用户的属性特征;
将所述属性特征添加到针对待推荐商户的推荐文案中,得到对应的目标推送文案;
基于所述目标推送文案,将所述待推荐商户推荐给所述目标用户。
12.如权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标用户针对所述目标商户的互动时间;
基于所述互动时间,确定对应所述目标用户的推送时间;
基于所述推送时间,对所述目标用户进行商户推荐。
13.一种商户标签的确定装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标商户的基础信息及关联信息,所述关联信息为基于所述基础信息而得到的与所述目标商户相关联的信息;
第一确定模块,用于基于所述基础信息及所述关联信息,确定所述目标商户的原子标签,所述原子标签用于指示所述目标商户的属性类别;
第二获取模块,用于获取所述目标商户所归属的商户类别的标签体系,所述标签体系由至少两个用于指示商户类别的商户标签所构成;
第二确定模块,用于分别对所述基础信息与所述原子标签进行向量转换处理,得到对应的基础信息向量和原子标签向量;将所述基础信息向量与所述原子标签向量进行拼接处理,得到对应所述目标商户的拼接信息向量;对所述拼接信息向量进行分类,得到所述目标商户对应所述标签体系中的目标商户标签;结合所述目标商户标签及目标用户针对所述目标商户的交易信息,构建所述目标用户的兴趣标签,并基于所述兴趣标签对所述目标用户进行商户推荐。
14.一种计算机可读存储介质,其特征在于,所述存储介质存储有可执行指令,用于引起处理器执行时,实现权利要求1至12中任一项所述的商户标签的确定方法。
15.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令或者计算机程序时,实现权利要求1至12任一项所述的商户标签的确定方法。
CN202010066336.3A 2020-01-20 2020-01-20 商户标签的确定方法、装置及存储介质 Active CN111259281B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010066336.3A CN111259281B (zh) 2020-01-20 2020-01-20 商户标签的确定方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010066336.3A CN111259281B (zh) 2020-01-20 2020-01-20 商户标签的确定方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111259281A CN111259281A (zh) 2020-06-09
CN111259281B true CN111259281B (zh) 2023-04-07

Family

ID=70948125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010066336.3A Active CN111259281B (zh) 2020-01-20 2020-01-20 商户标签的确定方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111259281B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111931504A (zh) * 2020-08-13 2020-11-13 北京深演智能科技股份有限公司 实体的标签的确定方法、装置、存储介质和处理器
CN112308166B (zh) * 2020-11-09 2023-08-01 建信金融科技有限责任公司 一种处理标签数据的方法和装置
CN112364252B (zh) * 2021-01-12 2021-04-23 北京世纪好未来教育科技有限公司 内容推荐方法、装置、电子设备及存储介质
CN113569135B (zh) * 2021-06-30 2024-03-29 深圳市东信时代信息技术有限公司 基于用户画像的推荐方法、装置、计算机设备及存储介质
CN113610605A (zh) * 2021-08-10 2021-11-05 深圳新动信息技术有限公司 反向针对用户推荐感兴趣的反向被动搜索的方法及系统
CN113837811B (zh) * 2021-09-30 2023-10-10 成都屏盟科技有限公司 一种电梯广告点位推荐方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254525A (zh) * 2016-09-12 2016-12-21 中国银联股份有限公司 一种信息推送方法和系统
CN107220852A (zh) * 2017-05-26 2017-09-29 北京小度信息科技有限公司 用于确定目标推荐用户的方法、装置和服务器
CN107833076A (zh) * 2017-11-16 2018-03-23 中国银联股份有限公司 一种营销信息推送方法及装置
CN110263290A (zh) * 2019-06-26 2019-09-20 拉扎斯网络科技(上海)有限公司 商户标签设置方法、装置、电子设备及存储介质
CN110569353A (zh) * 2019-07-03 2019-12-13 重庆大学 一种基于注意力机制的Bi-LSTM的标签推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11037202B2 (en) * 2016-12-27 2021-06-15 Paypal, Inc. Contextual data in augmented reality processing for item recommendations

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254525A (zh) * 2016-09-12 2016-12-21 中国银联股份有限公司 一种信息推送方法和系统
CN107220852A (zh) * 2017-05-26 2017-09-29 北京小度信息科技有限公司 用于确定目标推荐用户的方法、装置和服务器
CN107833076A (zh) * 2017-11-16 2018-03-23 中国银联股份有限公司 一种营销信息推送方法及装置
CN110263290A (zh) * 2019-06-26 2019-09-20 拉扎斯网络科技(上海)有限公司 商户标签设置方法、装置、电子设备及存储介质
CN110569353A (zh) * 2019-07-03 2019-12-13 重庆大学 一种基于注意力机制的Bi-LSTM的标签推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
朱雨晗 ; .基于用户兴趣标签的混合推荐方法.电子制作.2018,(第22期),44-46. *
陈宇 ; 何剑华 ; .时空纬度下的个性推荐关键算法研究.信息技术与信息化.2018,(第06期),191-194. *
陈宇等.时空纬度下的个性推荐关键算法研究.《信息技术与信息化》.2018,(第06期),191-194. *

Also Published As

Publication number Publication date
CN111259281A (zh) 2020-06-09

Similar Documents

Publication Publication Date Title
CN111259281B (zh) 商户标签的确定方法、装置及存储介质
CN108536852B (zh) 问答交互方法和装置、计算机设备及计算机可读存储介质
CN111784455B (zh) 一种物品推荐方法及推荐设备
CN107833082B (zh) 一种商品图片的推荐方法和装置
WO2019056661A1 (zh) 一种搜索词推送方法、装置及终端
CN107077486A (zh) 情感评价系统和方法
CN104102639B (zh) 基于文本分类的推广触发方法和装置
CN104106087A (zh) 用于网上购物的关联提取的系统和方法
CN109635198B (zh) 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备
WO2012064664A2 (en) Mobile-based real-time food-and-beverage recommendation system
CN106886518A (zh) 一种微博账号分类的方法
CN111400507B (zh) 实体匹配方法及其装置
CN103858142A (zh) 店铺信息提供系统
CN109615408A (zh) 基于大数据的广告投放方法及装置、存储介质、电子设备
CN102893280A (zh) 数据搜索装置、数据搜索方法和程序
CN111311316A (zh) 商户画像的刻画方法、装置、电子设备、验证方法及系统
CN117350825B (zh) 基于大语言模型的导购方法和系统
CN106547365A (zh) 商品推荐的方法和装置
CN105408929A (zh) 利用反向拍卖的加盟店推荐方法及推荐装置
JP6841539B2 (ja) 行動促進方法、ユーザインタフェース、プログラム、コンピュータ記憶媒体及び行動促進システム
Shin et al. Analysis on review data of restaurants in Google Maps through text mining: Focusing on sentiment analysis
CN110309274A (zh) 引导语推荐方法、装置及电子设备
Sugitomo et al. Sentiment analysis using SVM and Naïve Bayes Classifiers on restaurant review dataset
CN112015970A (zh) 产品推荐方法、相关设备及计算机存储介质
US20230334516A1 (en) Product/service ordering system, product/service ordering method, and program for the same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024030

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant