CN110750697A - 商户分类方法、装置、设备及存储介质 - Google Patents

商户分类方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110750697A
CN110750697A CN201911045912.XA CN201911045912A CN110750697A CN 110750697 A CN110750697 A CN 110750697A CN 201911045912 A CN201911045912 A CN 201911045912A CN 110750697 A CN110750697 A CN 110750697A
Authority
CN
China
Prior art keywords
merchant
predicted
classification
category
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911045912.XA
Other languages
English (en)
Other versions
CN110750697B (zh
Inventor
吴荣旋
郭婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanhai Information Technology Shanghai Co Ltd
Original Assignee
Hanhai Information Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanhai Information Technology Shanghai Co Ltd filed Critical Hanhai Information Technology Shanghai Co Ltd
Priority to CN201911045912.XA priority Critical patent/CN110750697B/zh
Publication of CN110750697A publication Critical patent/CN110750697A/zh
Application granted granted Critical
Publication of CN110750697B publication Critical patent/CN110750697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Abstract

本申请公开了一种商户分类方法、装置、设备及存储介质,所述方法应用于计算机领域,所述方法包括:获取商户在至少一个互联网平台上对应的n种商户特征,n为大于1的整数;根据所述n种商户特征获取所述商户的n个预测商户类别以及对应的预测得分,所述n种商户特征和所述n个预测商户类别一一对应;当所述n个预测商户类别中存在相同的预测商户类别时,对所述相同的预测商户类别对应的预测得分进行合并;将具有最高的所述预测得分的前k个预测商户类别,确定为所述商户的商户分类结果。该方法可以解决人工进行商户分类,工作过于繁复,且具有较强的主观性,不同人对商户分类标准理解不同会导致分类结果的偏差较大的问题。

Description

商户分类方法、装置、设备及存储介质
技术领域
本申请涉及计算机领域,特别涉及一种商户分类方法、装置、设备及存储介质。
背景技术
在商户系统中,存储有多个商户的商户信息,包括每个商户的商户名称、商户类别、联系方式、商户产品、用户评论等。
在相关技术中,每个商户的商户类别是人工根据商户分类标准和商户的商户信息进行判断后得出的。例如,在商户分类标准中,当商户的商户产品为川菜时,将该商户的商户类别确定为餐饮类。
人工进行商户分类,工作过于繁复,且具有较强的主观性,不同人对商户分类标准理解不同会导致分类结果的偏差较大。
发明内容
本申请实施例提供了一种商户分类方法、装置、设备及存储介质,可以解决人工进行商户分类,工作过于繁复,且具有较强的主观性,不同人对商户分类标准理解不同会导致分类结果的偏差较大的问题。所述技术方案如下:
根据本申请的一个方面,提供了一种商户分类方法,所述方法包括:
获取商户在至少一个互联网平台上对应的n种商户特征,n为大于1的整数;
根据所述n种商户特征获取所述商户的n个预测商户类别以及对应的预测得分,所述n种商户特征和所述n个预测商户类别一一对应;
当所述n个预测商户类别中存在相同的预测商户类别时,对所述相同的预测商户类别对应的预测得分进行合并;
将具有最高的所述预测得分的前k个预测商户类别,确定为所述商户的商户分类结果。
根据本申请的另一方面,提供了一种商户分类装置,所述装置包括:
获取模块,用于获取商户在至少一个互联网平台上对应的n种商户特征,n为大于1的整数;
所述获取模块,还用于根据所述n种商户特征获取所述商户的n个预测商户类别以及对应的预测得分,所述n种商户特征和所述n个预测商户类别一一对应;
合并模块,用于当所述n个预测商户类别中存在相同的预测商户类别时,对所述相同的预测商户类别对应的预测得分进行合并;
确定模块,用于将具有最高的所述预测得分的前k个预测商户类别,确定为所述商户的商户分类结果。
根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的商户分类方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的商户分类方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过根据n种商户特征来获取商户的n个预测商户类别和对应的预测得分,并将n个预测商户类别中相同预测商户类别的预测得分进行合并,将预测得分最高的前k个预测商户类别确定为商户的商户分类结果。本申请的商户分类方法比人工分类速度更快、效率和准确度更高,且分类标准统一,分类结果准确。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的系统的实施环境框图;
图2是本申请一个示例性实施例提供的商户分类方法的流程图;
图3是本申请另一个示例性实施例提供的商户分类方法的流程图;
图4是本申请另一个示例性实施例提供的商户分类方法的流程图;
图5是本申请另一个示例性实施例提供的商户分类方法的流程图;
图6是本申请另一个示例性实施例提供的商户分类方法的流程图;
图7是本申请另一个示例性实施例提供的商户分类方法的流程图;
图8是本申请另一个示例性实施例提供的商户分类装置的框图;
图9是本申请另一个示例性实施例提供的服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1给出了本申请一个示例性实施例提供的计算机系统的结构框图。该计算机系统100包括:终端110、服务器120。
终端110安装和运行有支持商户浏览的客户端111,该客户端111是具有商户分类功能的应用程序,该客户端111可以是网络购物程序、地图程序、外卖程序、地理信息系统程序、商户调查程序、商户登记程序。当第一终端运行客户端111时,第一终端110的屏幕上显示客户端111的用户界面。
终端上安装的客户端可以是不同操作系统平台(安卓或IOS)的客户端。终端的设备类型包括:智能手机、平板电脑、电子书阅读器、MP3播放器、MP4播放器、膝上型便携计算机和台式计算机中的至少一种。
图1中仅示出了一个终端,但在不同实施例中存在多个其它终端140可以接入服务器120。可选地,还存在一个或多个其他终端140是开发者对应的终端,在其他终端140上安装有支持商户浏览客户端的开发和编辑平台,开发者可在其他终端140上对客户端进行编辑和更新,并将更新后的客户端安装包通过有线或无线网络传输至服务器120,终端110可从服务器120下载客户端安装包实现对客户端的更新。
终端110以及其它终端140通过无线网络或有线网络与服务器120相连。
服务器120包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。服务器120用于为支持三维虚拟世界的客户端提供后台服务。可选地,服务器120承担主要计算工作,终端承担次要计算工作;或者,服务器120承担次要计算工作,终端承担主要计算工作;或者,服务器120和终端之间采用分布式计算架构进行协同计算。
在一个示意性的例子中,服务器120包括处理器122、商户数据库123、商户分类模块124、面向用户的输入/输出接口(Input/Output Interface,I/O接口)125。其中,处理器122用于加载服务器120中存储的指令,处理商户数据库123和商户分类模块124中的数据;商户数据库123用于存储商户的数据,比如商户的名称、商户的商品、商户的图片、商户的评论、商户的联系方式、商户的地址、商户的评分、商户的销量等;商户分类模块124用于将商户按照分类规则进行分类;面向用户的I/O接口125用于通过无线网络或有线网络和第一终端110建立通信交换数据。
图2示出了本申请一个示例性实施例提供的商户分类方法的流程图。该方法可以由图1所示的第一计算机系统100中的服务器120来执行。所述方法包括:
步骤101,获取商户在至少一个互联网平台上对应的n种商户特征,n为大于1的整数。
商户特征包括:商户名称、商户图片、用户评论、商户商品、其他互联网平台上的商户类别、其他互联网平台上商户名称、其他互联网平台上商户图片、其他互联网平台上用户评论、其他互联网平台上商户商品中的至少一种。
服务器从至少一个互联网平台上获取商户的n种商户特征,n为大于1的整数。
互联网平台是具有商户数据库的互联网平台。互联网平台是提供商户浏览或商户分类的平台。用户可以在互联网平台上浏览商户、按照分类浏览商户、按照分类搜索商户、进行商户商品或服务的购买、查看其它用户对商户的评论、进行商户商品或服务的预订、查询商户电话地址中的至少一种。示例性的,互联网平台上存储有多个商户的商户信息,商户信息包括:商户的商户名称、商户分类、商户编码、商户标签、商户评分、电话、地址、商品、用户评论、商户图片、商品图片、菜单、折扣信息中的至少一个。示例性的,互联网平台是网络购物平台、外卖平台、地理信息平台、网络点评平台生活服务平台或在线旅游平台中的至少一个。
其他互联网平台包括至少一个互联网平台。
商户特征是商户区别于其他商户的特征信息。示例性的,商户特征包括存储于互联网平台中与商户相关的所有商户信息(或者,从商户信息中提取的特征)。示例性的,商户特征还包括商户在其他互联网平台上存储的商户信息,或可以从其他互联网平台上获取的商户信息。示例性的,商户特征还包括用户问卷调查结果中与商户相关的调查结果。例如,在互联网平台上发布有第一问卷调查,其中第一个问卷调查题目是“商户A的地址是?”,则第一问卷调查结果中,第一个问卷调查题目的调查结果也属于商户A的商户特征。
示例性的,一种商户特征包括至少一个商户信息。例如,第一商户特征包括商户A的商户名称和商户A的用户评论。
示例性的,服务器从互联网平台A上获取商户A的商户特征,商户特征包括:商户A的商户名称“第一便利店”;商户A的商户地址“第二市第三街道第四号”;商户A的商品“水”、“面包”、“方便面”;商户A的用户评论“第一便利店的关东煮很好吃”、“这个便利店在路边很好找”;商户A的商户图片“带有“第一便利店”字样的门头照片”、“超市物品摆放的照片”;商户A在第五问卷调查中第五题“商户A是什么类型的商户?”的调查结果“超市”、“便利店”、“快餐店”等。
示例性的,服务器还可以从多个互联网平台上获取商户的商户特征。例如,服务器从第一互联网平台上获取商户A的第一商户名“便利店(第一分店)”;第一商户地址“第二市第三街道第四号”。从第二互联网平台上获取商户B的第二商户名“便利店(一号分店)”;第二商户地址“第二市第三街道第四号”。服务器可以根据一定的商户对应规则,识别第一互联网平台和第二互联网平台上的商户是否为同一家商户。例如,根据第一商户名、第二商户名、第一商户地址、第二商户地址,可以识别出商户A和商户B是不同互联网平台上的同一家商户。
示例性的,当服务器根据商户对应规则,找出商户A在其他互联网平台上的商户后,可以获取到商户A在其他互联网平台上的商户信息和/或商户特征,服务器可以将商户A在其他互联网平台上的商户名称、商户图片、用户评论、商户商品等作为商户A的商户特征。
其中,商户分类是按照商户的商品、功能、服务、地址、评分、销量中的至少一种商户特征对商户进行分类。示例性的,商户分类是指将商户按照用户的需求进行分类。例如,用户的需求是吃饭、美发、休闲娱乐、看电影、出游等。示例性的,按照用户的需求对商户进行分类后还可以按照该类别下的其他分类方法对商户进行二次分类。例如,按照用户的需求:吃饭可以将商户分为餐饮类和非餐饮类。在餐饮类商户中还可以按照菜系将商户分为:川菜类、自助类、西餐类、烧烤类、汉堡类等。
步骤102,根据n种商户特征获取商户的n个预测商户类别以及对应的预测得分,n种商户特征和n个预测商户类别一一对应。
服务器根据n种商户特征获取商户的n个预测商户类别以及对应的预测得分,n种商户特征和n个预测商户类别一一对应。
商户类别是根据商户的商户特征对商户进行分类。商户类别是商户分类后得到的商户分类结果。示例性的,商户类别可以按照商户的商品、功能、服务、地址、评分、销量中的至少一种商户特征对商户进行分类后得到的商户分类结果。例如,根据商户服务可以把提供餐饮服务的商户分为餐饮类,把提供住宿服务的商户分为住宿类,把提供少儿教育服务的商户分为教育类,把提供烫发服务的商户分为美容美发类。示例性的,商户类别可以帮助互联网平台进行更好更有效的商户管理。例如,当互联网平台想要退出一期吃遍第一市的活动时,互联网平台可以直接向餐饮类的商户发出活动参与邀请。商户分类还可以帮助用户更快的找到目标商户。例如,当用户想要找一个商户做美容时,可以直接浏览美容美发类的商户。
预测商户类别是服务器预测的商户可能的商户类别。预测商户类别是与商户特征一一对应的,即,一种商户特征对应有一个预测商户类别,n种商户特征则对应有n个预测商户类别。预测商户类别是服务器根据商户的商户特征预测出的商户可能的商户类别。例如,服务器根据商户A的商户名称“第一便利店”预测商户A的商户类别可能是“超市便利”,则“超市便利”即为商户A的商户名称对应的预测商户类别。
预测得分是用来描述预测商户类别准确度的一个数值。示例性的,预测得分是服务器为预测商户类别确定的得分。示例性的,预测得分是服务器根据预测商户类别的获取方式来为预测商户类别确定的得分。示例性的,预测得分越高,预测商户类别的准确度越高。例如,服务器可以根据商户的商户名称、商户图片、用户评论来获取商户的预测商户类别,由于根据商户名称得到的预测商户类别较为准确,则通过商户名称获取的预测商户类别的预测得分为5分;根据商户图片得到的预测商户类别较不准确,则通过商户图片获取的预测商户类别的预测得分为3分;根据用户评论得到的预测商户类别非常不准确,则通过用户评论获取的预测商户类别的预测得分为1分。
例如,服务器根据商户A的3种商户特征获取了3个预测商户类别以及对应的3个预测得分。服务器根据商户A的商户名称“第一便利店”获取的预测商户类别为“超市便利”,预测得分为5分;根据商户A的商品“面包”获取的预测商户类别为“面包烘焙”,预测得分为3分;根据商户A的商户图片“商品货架图片”获取预测商户类别为“超市便利”,预测得分为1分。
步骤103,当n个预测商户类别中存在相同的预测商户类别时,对相同的预测商户类别对应的预测得分进行合并。
当n个预测商户类别中存在相同的预测商户类别时,服务器对相同的预测商户类别对应的预测得分进行合并。
合并可以是相加、分别乘以某系数后相加、去掉最高分和最低分后相加、将最高的两个分数相加中的至少一种。例如,当n个预测商户类别中存在相同的预测商户类别时,服务器把相同的预测商户类别对应的预测得分相加,或服务器把相同的预测商户类别对应的预测得分中分数最低的一项去掉后,将其他项相加。
示例性的,服务器对相同的预测商户类别对应的预测得分进行合并,得到合并后的预测商户类别和对应的预测得分。示例性的,合并后的预测商户类别中没有相同的预测商户类别。示例性的,合并后的预测商户类别对应的预测得分是该预测商户类别对应的所有预测得分合并后的分数。
例如,服务器根据商户A的3种商户特征获取了3个预测商户类别以及对应的3个预测得分。服务器根据商户A的商户名称“第一便利店”获取的第一预测商户类别为“超市便利”,第一预测得分为5分;根据商户A的商品“面包”获取的第二预测商户类别为“面包烘焙”,第二预测得分为3分;根据商户A的商户图片“商品货架图片”获取第三预测商户类别为“超市便利”,第三预测得分为1分。其中,第一预测商户类别和第二预测商户类别都是“超市便利”,则服务器将第一预测得分和第二预测得分相加,得到最终的预测商户类别和预测得分:“超市便利”“6分”、“面包烘焙”“3分”。
步骤104,将具有最高的预测得分的前k个预测商户类别,确定为商户的商户分类结果。
服务器将具有最高的预测得分的前k个预测商户类别,确定为商户的商户分类结果。示例性的,k为大于1且小于等于n的整数。
商户分类结果是服务器根据商户的商户特征最终输出的分类结果。
示例性的,服务器将预测得分最高的一个预测商户类别确定为商户的商户分类结果。例如,服务器对商户A的预测商户类别和预测得分是:“超市便利”“6分”、“面包烘焙”“3分”。则服务器将预测得分最高的“超市便利”确定为商户的商户分类结果。
综上所述,本实施例提供的方法,通过根据n种商户特征来获取商户的n个预测商户类别和对应的预测得分,并将n个预测商户类别中相同预测商户类别的预测得分进行合并,将预测得分最高的前k个预测商户类别确定为商户的商户分类结果。本申请的商户分类方法比人工分类速度更快、效率和准确度更高,且分类标准统一,分类结果准确。
示例性的,本申请还给出一种根据商户的商户特征获取预测商户类别的示例性实施例,以步骤101中获取的n种商户特征中的一种商户特征为例,给出一种根据商户特征获取预测商户类别的示例性实施例。
图3示出了本申请一个示例性实施例提供的商户分类方法的流程图。该方法可以由图1所示的第一计算机系统100中的服务器120来执行。与图2提供的示例性实施例相比不同的是,将步骤102替换为以下步骤:
步骤1021,对于n种商户特征中的第i种商户特征,获取第i种商户特征对应的第i种商户分类规则,第i种商户分类规则中包括商户分类库,商户分类库包括:候选商户类别和与候选商户类别对应的匹配条件,商户分类库对应有权重分数。
服务器对于n种商户特征中的第i种商户特征,获取第i种商户特征对应的第i种商户分类规则,第i种商户分类规则中包括商户分类库。
商户分类规则是与商户特征对应的规则。示例性的,商户分类规则是针对某一种商户特征的商户分类规则。针对不同类的商户特征有不同的商户分类规则。同类商户特征采用相同的商户分类规则来获取预测商户类别。例如,针对商户的商户名称有商户名称对应的商户分类规则,针对商户的用户评论有用户评论对应的商户分类规则。所有商户的商户名称都根据商户名称对应的商户分类规则确定预测商户类别,所有商户的用户评论,都根据这一用户评论对应的商户分类规则确定预测商户类别。例如,商户A的第一商户名称根据第一商户分类规则确定预测商户类别,商户B的第二商户名称也根据第一商户分类规则确定预测商户类别。
同类商户特征是不同商户拥有的相同种类的商户特征。例如,商户A有第一商户特征:第一商户名称,商户B有第二商户特征:第二商户名称,第一商户特征和第二商户特征都是商户的商户名称,则第一商户特征和第二商户特征为同类商户特征。
商户分类规则是将商户特征与预测商户类别对应的规则,根据商户分类规则,服务器可以用商户特征从商户分类规则中获取一个预测商户类别。商户分类规则可以是存储有商户特征和预测商户类别的商户分类库(数据库);也可以是直接根据商户特征直接提取商户类别的算法,例如,商户分类规则是商户名称提取算法,服务器将获取的商户A的商户名称“第一便利店”输入商户名称提取算法,可以得出一个预测商户类别“便利店”。例如,商户分类规则是问卷结果统计算法,服务器将问卷中第一题“商户A的商户类别是?A便利店,B快餐店,C面包烘焙店,D超市”的问卷调查结果输入问卷结果统计算法,可以得出问卷调查结果中选择人数最多的“便利店”,将便利店确定为预测商户类别。
商户分类库是存有候选商户类别、与候选商户类别对应的匹配条件的数据库。每个商户分类库都对应有一个权重分数。
根据该商户分类库得出的预测商户类别的预测得分即为该商户分类库对应的权重分数。即,商户分类库的权重分数是用来描述用该商户分类库得出的预测商户类别的准确度。示例性的,商户分类库对应的权重分数越高,得出的预测商户类别的准确度越高。
候选商户类别是商户分类库中存储有的预测商户类别。
匹配条件是将商户特征与候选商户类别对应的条件。示例性的,匹配条件可以是商户特征中有与候选商户类别对应的关键词,例如,候选商户类别“超市便利”的匹配条件是关键词“便利”、“超市”、“便利店”,当商户特征中有“便利”、“超市”、“便利店”中的任意一个时,该商户特征即满足匹配条件,则该商户特征的预测商户类别为“超市便利”。
示例性的,一个候选商户类别可以对应有多个匹配条件,例如,针对商户名称的商户分类库中有候选商户类别“超市”,与候“超市”对应的匹配条件有:商户名称中有关键词“超市”;或,商户名称中有“苏果”;或,商户名称的字数等于四。
例如,对于商户A的第一种商户特征:商户名称“第一便利店”,服务器获取商户名称对应的第一商户分类规则,第一商户分类规则是第一商户分类库。
步骤1022,根据第i种商户特征和候选商户类别对应的匹配条件,从商户分类库中确定与第i种商户特征对应的预测商户类别。
服务器根据第i种商户特征和候选商户类别对应的匹配条件,从商户分类库中确定与第i种商户特征对应的预测商户类别。
示例性的,当商户特征满足候选商户类别对应的匹配条件时,将该候选商户类别确定为该商户特征对应的预测商户类别。
例如,如表一所示,为商户分类库中存储有的候选商户类别和与候选商户类别对应的匹配条件。
表一
Figure BDA0002254130440000101
步骤1023,选择与商户分类库对应的权重分数,确定为与第i种商户特征对应的预测商户类别的预测得分。
服务器选择与商户分类库对应的权重分数,确定为与第i种商户特征对应的预测商户类别的预测得分。
示例性的,服务器将第i种商户特征对应的商户分类库的权重分数,确定为第i种商户特征对应的预测商户类别的预测得分。
综上所述,本实施例提供的方法,通过设置商户分类规则中的商户分类库,服务器根据商户分类库和商户特征来获取商户特征对应的预测商户类别和预测得分,商户分类库即为商户分类的标准,使商户分类具有统一的标准,分类结果更准确。
示例性的,一种商户分类规则下可以对应有多个商户分类库。示例性的,一种商户分类规则下的多个商户分类库是具有不同权重分数的分类库。
例如,商户名称对应的商户分类规则下有三个商户分类库,其中第一商户分类库中存有所有连锁品牌的候选商户类别和连锁品牌的匹配条件,第二商户分类库中存有候选商户类别和第一匹配条件,第三商户分类库中存有候选商户类别和第二匹配条件。其中,第一匹配条件是比第二匹配条件更为严格的匹配条件,即根据第一匹配条件得出的预测商户类别的准确度更高。
示例性的,如表二所示,为一种商户分类规则下的三个商户分类库,及三个商户分类库中“超市便利”类对应的匹配条件。
表二
Figure BDA0002254130440000111
可以看出,如果商户A的第一商户名称能够从第一商户分类库中获取到预测商户类别,即商户A是一个连锁品牌,则该预测商户结果是非常准确的分类结果,因此第一商户分类库的权重分数为最高分数。
如果商户A的第一商户名称不能从第一商户分类库中获取到预测商户类别,即商户A不是一个连锁品牌,则将第一商户名称输入第二商户分类库中获取预测商户类别,例如,第二商户分类库中候选商户类别“超市”对应的匹配条件是商户名称中含有关键词“超市”且“超市”位于商户名称的最后两位。因此,第二商户分类库中的匹配条件是比较严格的匹配条件,根据商户特征如果能够从第二商户分类库中获取预测商户类别,则该预测商户类别的准确度依旧是比较大的,所以,第二商户分类库的权重分数为较高分数。
如果商户A的第一商户名称从第二商户分类库中还是无法获取到预测商户类别,即第一商户名称不满足比较严格的第一匹配条件,再将第一商户名称输入第三商户分类库中获取预测商户类别,例如,第三商户分类库中候选商户类别“超市”对应的匹配条件是商户名称中含有关键词“超市”、“便利店”、“便利”、“生活”中的任意一个。因此,第三商户分类库中的匹配条件是比较宽松的匹配条件,根据商户特征从第三商户分类库中获取的预测商户类别的准确度比较低,所以,第三商户分类库的权重分数较低。
图4示出了本申请一个示例性实施例提供的商户分类方法的流程图。该方法可以由图1所示的第一计算机系统100中的服务器120来执行。与图3提供的示例性实施例相比不同的是,第i种商户分类规则中包括m个商户分类库,m为大于1的整数,m个商户分类库和m个权重分数一一对应,且m个商户分类库按照权重分数由高到低的顺序进行排序,将步骤1022替换为以下步骤201:
步骤201,在第j个商户分类库中,根据第i种商户特征和候选商户类别对应的匹配条件,确定与第i种商户特征对应的预测商户类别,j的起始值为1。
服务器根据第i种商户特征和候选商户类别对应的匹配条件,按照权重分数由高到低的顺序,依次从m个商户分类库中确定与第i种商户特征对应的一个预测商户类别。
示例性的,服务器从权重分数最高的第j个商户分类库开始,根据候选商户类别的匹配条件从第j个商户分类库中获取与第i个商户特征对应的候选商户类别。
示例性的,第i种商户分类规则下,对应有多个商户分类库,多个商户分类库分别对应有不同的权重分数。示例性的,将多个商户分类库按照权重分数由高到低排列。权重分数较高的商户分类库中匹配条件较难,但获取到的预测商户类别更加准确。权重分数较低的商户分类库中匹配条件较为容易,但获取到的预测商户类别准确性稍差。
例如,针对候选商户类别“超市”,权重分数高的商户分类库中的匹配条件是商户名称是“苏果便利”,权重分数低的商户分类库中的匹配条件是商户名称中含有关键词“超市”、“便利店”、“便利”、“生活”中的任意一个。
因此,服务器根据第i种商户特征,依次从权重分数高的商户分类库到权重分数低的商户分类库中获取候选商户类别,当获取到一个候选商户类别时,则将该候选商户类别确定为第i种商户特征对应的预测商户类别。
步骤202,当在第j个商户分类库中未能成功确定出与第i种商户特征对应的预测商户类别时,则在第j+1个商户分类库中,根据第i种商户特征和候选商户类别对应的匹配条件,确定与第i种商户特征对应的预测商户类别。
其中,j是不大于m-1的整数。
当服务器无法从第j个商户分类库中获取到与第i个商户特征对应的候选商户类别时,服务器从第j+1个商户分类库中获取第i个商户特征对应的候选商户类别。
第j+1个商户分类库是比第j个商户分类库权重分数略低的分类库。示例性的,第j+1个商户分类库是按照由高到低顺序排列的m个商户分类库中位于第j个商户分类库后的第一个商户分类库。
示例性的,当服务器无法从第j+1个商户分类库中获取到与第i个商户特征对应的候选商户类别时,服务器从第j+1+1个商户分类库中获取第i个商户特征对应的候选商户类别。
当j+n等于m时,即服务器从m个商户分类库中权重分数最小的商户分类库中,依旧无法获取到与第i个商户特征对应的候选商户类别时,则第i个商户特征没有与其对应的候选商户类别。
示例性的,步骤202中服务器从m个商户分类库中获取的预测商户类别只有一个,或没有。即,当服务器从权重分数较高的商户分类库中获取了一个预测商户类别时,不会再从权重分数较低的商户分类库中再获取预测商户类别。
例如,第一商户分类库的权重分数为5分,第二商户分类库的权重分数为3分,第三商户分类库的权重分数为1分。服务器用第i种商户特征从第一商户分类库中没有获取到满足匹配条件的候选商户类别,则用第i种商户特征从第二商户分类库中获取候选商户类别,若从第二商户分类库中获取到第一商户类别,则将第一商户类别确定为第i种商户特征对应的预测商户类别,将第二商户分类库的权重分数3分确定为预测得分。服务器不会再用第i种商户特征从第三个商户分类库中获取候选商户类别。
综上所述,本实施例提供的方法,通过在一种商户分类规则中设置有多个商户分类库,根据商户特征服务器可以从多个商户分类库中获取到多个候选商户类别,但服务器只将准确度最高(权重分数最高)的候选商户类别确定为预测商户类别,这样既提高了预测结果的准确度,又提高了从商户分类库中能够获取到预测商户类别的概率。
示例性的,本申请还给出一种根据两个互联网平台上的商户特征来获取预测商户类别的方法。
示例性的,可以参考其他互联网平台上的商户分类结果来给商户进行分类。例如,商户A在第二互联网平台上属于川菜类,则获取商户在第二互联网平台上的分类,然后将第二互联网平台的分类转换为本平台的分类,即将川菜转换为餐饮类,即可获得商户的预测商户类别。
但对于同一个商户,在不同的互联网平台上其商户名称可能不同,例如,商户A在第一互联网平台上的商户名称是“第一便利店(总店)”,在第二互联网平台上的商户名称是“第一便利店”,因此,首选需要将商户A在第一互联网平台和第二互联网平台上的商户名称对应起来。
将商户A在第一互联网平台和第二互联网平台上的商户名称对应起来后,第一互联网平台就可以了获取第二互联网平台对商户A的分类。例如,在第二互联网平台上“第一便利店”对应的分类是“生活”,将第一互联网平台上的“第一便利店(总店)”与“第一便利店”对应起来之后,第一互联网平台就可以获取到“第一便利店(总店)”在第二互联网平台上的分类“生活”。
图5示出了本申请一个示例性实施例提供的商户分类方法的流程图。该方法可以由图1所示的第一计算机系统100中的服务器120来执行。与图3所示的示例性实施例不同的是将步骤101替换为以下步骤:
步骤1011,获取商户在第一互联网平台上的第一商户特征,第一商户特征包括第一商户名称。
服务器获取商户在第一互联网平台上的第一商户特征,第一商户特征包括第一商户名称。
示例性的,服务器想要根据第二互联网平台上商户A的商户分类结果得到第一互联网平台上的商户A的商户分类结果,则首先获取商户A在第一互联网平台上的第一商户特征。示例性的,第一商户特征至少包括第一商户名称。示例性的,第一商户特征还可以包括L第一商户名称、第一商户地址、第一商户联系电话、第一商品等。
步骤1012,获取第二互联网平台上的第二商户分类结果,商户分类结果包括第二商户名称和第二商户名称对应的第二商户类别,第二商户名称是商户在第二互联网平台上的商户名称,第二商户类别是商户在第二互联网平台上的商户类别。
服务器获取第二互联网平台上的第二商户分类结果。
示例性的,第二分类结果是第二互联网平台中所有商户和所有商户对应的商户类别。例如,第二互联网平上存有100个商户,则第二商户分类结果中有100个商户和这100个商户的商户类别。
示例性的,服务器从第二互联网平台上获取商户A的第二商户分类结果,第二商户分类结果中包括商户A的第二商户名称和第二商户名称对应的第二商户类别。
步骤1013,根据第一商户名称、第二商户名称和商户名称对应规则从商户分类结果中获取第一商户名称对应的第二商户类别,商户名称对应规则是第一商户名称和第二商户名称一一对应的规则。
服务器根据第一商户名称、第二商户名称和商户名称对应规则从商户分类结果中获取第一商户名称对应的第二商户类别。
商户名称对应规则是判断两个商户名称是否属于同一商户的规则。示例性的,商户名称对应规则可以判断第一商户名称和第二商户名称属于同一商户的可能性,当可能性大于一定阈值,则判定第一商户名称和第二商户名称为同一商户的商户名称。
服务器根据商户名称对应规则和第一商户名称,从第二商户分类结果中,获取与第一商户名称属于同一商户的第二商户名称;再根据第二商户名称从商户分类结果中获取与第二商户名称对应的第二商户类别。
例如,第一商户名称是“第一便利店(总店)”,服务器根据商户名称对应规则,判断第二商户分类结果中的“第一便利店”是与第一商户名称属于同一商户的商户名称,然后服务器获取“第一便利店”在第二商户分类结果中对应的第二商户类别“生活”。
示例性的,服务器还可以根据其他商户特征来辅助验证商户名称对应规则的准确性,例如,根据商户A在第一互联网平台和第二互联网平台中的联系方式、商户地址是否一致,判断第一商户名称和第二商户名称是否属于同一商户。
步骤1014,将第二商户类别确定为商户的第i种商户特征。
服务器将第二商户类别确定为商户的第i种商户特征。
示例性的,服务器将商户A在第二互联网平台上的第二商户类别确定为商户A的第i种商户特征。
综上所述,本实施例提供的方法,通过获取其他互联网平台上该商户的商户类别,将其他互联网平台上的商户类别转换为本平台的商户类别,快捷高效的获取商户的商户分类结果。
示例性的,本申请还给出一种根据商户的商户名称获取该商户的商户分类结果的示例性实施例。
图6示出了本申请一个示例性实施例提供的商户分类方法的流程图。该方法可以由图1所示的第一计算机系统100中的服务器120来执行。所述方法包括:
步骤101,获取商户在至少一个互联网平台上对应的n种商户特征,n为大于1的整数。
步骤1021,对于n种商户特征中的第i种商户特征,获取第i种商户特征对应的第i种商户分类规则,第i种商户分类规则中包括商户分类库,商户分类库包括:候选商户类别和与候选商户类别对应的匹配条件,商户分类库对应有权重分数。
步骤203,在第一商户分类库中,根据第一匹配条件确定与商户名称对应的第一预测商户类别,第一匹配条件是商户名称是否符合品牌商户名称或连锁店商户名称。
示例性的,与商户名称对应的所述商户分类规则中包括权重分数由高到低顺序排列的:第一商户分类库、第二商户分类库和第三商户分类库。例如,第一商户分类库的权重分数是5分,第二商户分类库的权重分数是3分,第三商户分类库的权重分数是1分。
服务器在第一商户分类库中,根据第一匹配条件确定与商户名称对应的第一预测商户类别,第一匹配条件是商户名称是否符合品牌商户名称或连锁店商户名称。
示例性的,第一商户分类库中存有品牌、连锁商户的候选商户类别和候选商户类别对应的第一匹配条件。例如,匹配条件是商户名称是“苏苏便利”,对应的候选商户类别是“便利店”。
示例性的,如果商户的商户名称与某一个连锁品牌或连锁店的名称一致,则判断该商户为该连锁店,并获取该连锁店对应的候选商户类别。
步骤204,当在第一商户分类库中未能成功确定出第一预测商户类别时,则在第二商户分类库中,根据第二匹配条件确定与商户名称对应的第二预测商户类别,第二匹配条件是商户名称的后缀是否含有商户类别相关的关键词。
当在第一商户分类库中未能成功确定出第一预测商户类别时,服务器则在第二商户分类库中,根据第二匹配条件确定与商户名称对应的第二预测商户类别。
示例性的,第二商户分类库中存有商会名称的后缀关键词的候选商户类别和候选商户类别对应的第二匹配条件。第二商户分类库可以根据商户名称的后缀,例如:“xxx饭馆”“xxx超市”“xxx美容美发”来获取商户的候选商户类别。
示例性的,当商户的商户名称不符合第一匹配条件,服务器无法用商户名称从第一商户分类库中找出与之对应的候选商户类别。即,商户不是连锁店或连锁品牌。则服务器继续在第二商户分类库中,找与商户名称对应的候选商户类别。
步骤205,当在第二商户分类库中未能成功确定出第二预测商户类别时,则在第三商户分类库中,根据第三匹配条件确定与商户名称对应的第三预测商户类别,第三匹配条件是商户名称中是否含有商户类别相关的关键词。
当在第二商户分类库中未能成功确定出第二预测商户类别时,服务器则在第三商户分类库中,根据第三匹配条件确定与商户名称对应的第三预测商户类别。
示例性的,第三商户分类库中存有商会名称中包含关键词的候选商户类别和候选商户类别对应的第三匹配条件。第三商户分类库可以根据商户名称中包含的关键词,例如:“川菜xx”“百果xx”“鱼xx”来获取商户的候选商户类别。
示例性的,当商户的商户名称不符合第二匹配条件,服务器无法用商户名称从第二商户分类库中找出与之对应的候选商户类别。即,商户名称后缀不具有能够明显识别出商户分类的关键词。则服务器继续在第三商户分类库中,找与商户名称对应的候选商户类别。
步骤206,当在第三商户分类库中未能成功确定出第三预测商户类别时,不存在与商户名称对应的预测商户类别。
当服务器在第三商户分类库中未能成功确定出第三预测商户类别时,不存在与商户名称对应的预测商户类别。
示例性的,如果在三个商户分类库中都没有找到与商户名称对应的候选商户类别,则根据该商户名称无法获取商户的类别。例如:商户名是“一百分”,则无法通过商户名判断商户的分类。
示例性的,第一商户分类库中存储有与品牌或连锁店对应的候选商户类别以及与候选商户类别对应的匹配条件,第二商户分类库存储有与商户名称后缀对应的候选商户类别以及与候选商户类别对应的匹配条件,第三商户分类库中存储有与商户名称包含的关键词对应的候选商户类别以及与候选商户类别对应的匹配条件。
步骤1023,选择与商户分类库对应的权重分数,确定为与第i种商户特征对应的预测商户类别的预测得分。
步骤103,当n个预测商户类别中存在相同的预测商户类别时,对相同的预测商户类别对应的预测得分进行合并。
步骤207,将所有预测商户类别放入候选池。
示例性的,服务器在对相同的预测商户类别进行合并后,将合并后的预测商户类别和不需要合并的预测商户类别放入候选池。即,候选池中的预测商户类别没有相同的预测商户类别,且候选池中的预测商户类别的种类包括了n个预测商户类别中的所有种类。
示例性的,候选池中的预测商户类别对应的预测得分是在步骤103中得到的合并后的预测得分。
步骤1041,从候选池中将具有最高的预测得分的前k个预测商户类别,确定为商户的商户分类结果。
示例性的,服务器从候选池中将具有最高的预测得分的前k个预测商户类别,确定为商户的商户分类结果。
示例性的,服务器将候选池中的所有预测商户类别按照预测得分进行排序,将预测得分最高的前k个预测商户类别确定为商户的商户分类结果。
综上所述,本实施例提供的方法,通过根据商户的商户名称,一次从多个权重分数对应的商户分类库中获取商户名称对应的候选商户类别,可以提高预测商户类别对应的预测得分的准确度,既提高根据商户名称能够找到候选商户类别的可能性,又提高了根据商户名称找到候选商户类别的准确度。
通过将所有预测商户类别输入候选池,再根据预测得分从候选池中将预测得分最高的前k个确定为商户分类结果。当发现商户的分类结果有错误时,可以提取候选池中的其他预测商户分类,更加快捷的找出正确的商户分类结果。当发现商户的分类结果不准确时,可以提取候选池中的其他预测商户分类,分析预测商户分类的获取方式是否准确,以便调整预测商户分类获取的匹配条件。
示例性的,本申请还给出一种根据一个商户的n种商户特征,获取该商户的商户分类结果的示例性实施例。
图7示出了本申请一个示例性实施例提供的商户分类方法的流程图。该方法可以由图1所示的第一计算机系统100中的服务器120来执行。所述方法包括:
步骤301,服务器获取商户特征1规则:商户名规则。
示例性的,以商户A为例,服务器获取商户A的n种商户特征,包括:商户A的商户名称、商户A在其他互联网平台上的分类结果以及其他商户特征。
服务器根据获取的n种商户特征对应的获取商户特征规则(商户分类规则)。
例如,服务器根据商户特征1:商户A的商户名称,获取商户特征1规则:商户名规则。
步骤302,服务器根据商户名规则下的三个商户分类库获取预测商户类别,三个商户分类库分别是:1.高档位分值:品牌/连锁类、2.中档位分值:商户名后缀、3.低档位分值:商户名包含。
在商户名规则下有高、中、低三个档位的商户分类库,商户分类库的高、中、低档位是根据商户分类库的权重分数进行划分的。例如,高档位商户分类库对应的权重分数是4分,中档位商户分类库对应的权重分数是3分,低档位商户分类库对应的权重分数是1分。
示例性的,服务器根据商户名规则下的三个商户分类库,获取商户A的商户特征1:商户名称对应的预测商户类别。
示例性的,服务器根据如图4所示的示例性实施例的方法,从高中低三个商户分类库中获取预测商户类别。
例如,服务器首先将商户A的商户名称输入高档位分值:品牌/连锁类,判断商户A是否是品牌/连锁类商户,若商户A是品牌/连锁类商户,则获取该品牌对应的预测商户类别。
若商户A不是品牌/连锁类商户,即,服务器无法根据商户A的商户名称从高档位分值的商户分类库中获取预测商户类别。服务器继续将商户A的商户名称输入中档位分值:商户名后缀,判断根据商户A的商户名称后缀是否能够获取商户A的预测商户类别,若商户A的商户名称后缀可以获取到商户A的类别,则将该类别作为预测商户类别。
若商户A的商户名称后缀无法获取到商户A的类别,则将商户A的商户名称输入低档位分值的商户分类库中获取预测商户类别。服务器继续将商户A的商户名称输入低档位分值:商户名包含,判断根据商户A的商户名称中包含的信息是否能够获取商户A的预测商户类别,若商户A的商户名称中包含可以获取商户类别的信息,则将该商户类别作为预测商户类别,否则服务器无法根据商户名称获取该商户的预测商户类别,即商户A的商户特征1:商户名称没有对应的预测商户类别。
示例性的,服务器根据商户A的商户名称从中档位的商户分类库中获取了预测商户类别b,并获取了高档位的商户分类库对应的预测分数(3分)。
步骤303,服务器获取商户特征2规则:外源类目对称规则。
服务器根据商户特征2:商户A在其他互联网平台上的分类结果,获取商户特征2对应的商户分类规则(商户特征2规则:外源类目对称规则)。
示例性的,服务器根据如图5所示的示例性实施例的方法,获取商户A在其他互联网平台上的分类结果。
步骤304,服务器根据外源类目对称规则下的一个商户分类库获取预测商户类别,该商户分类库是:高档位分值:1对1对标关系规则。
服务器获取外源类目对称规则下的商户分类库:高档位分值:1对1对标关系规则。根据1对1对标关系规则获取商户A的商户特征2获取预测商户类别。
示例性的,服务器获取到商户A在其他互联网平台上的分类结果是类别d,则服务器根据1对1对应关系规则,将类别d对应的转换为本互联网平台的分类a,并获取1对1对应关系规则的权重分数(4分)。
例如,服务器获取到商户A在其他互联网平台上的分类结果是川菜类,但本互联网平台上没有川菜类,所以需要将川菜类转换为本互联网平台上的分类,即,根据1对1对应关系规则,将川菜类对应的转换为餐饮类,服务器将餐饮类作为商户A的预测商户类别。
步骤305,服务器获取商户特征3规则。
服务器再根据商户A的商户特征3获取商户特征3对应的商户分类规则(商户特征3规则)。
示例性的,商户特征3可以是商户的商品图片。
步骤306,服务器获取商户特征n规则。
服务器继续根据商户A的商户特征n获取商户特征n对应的商户分类规则(商户特征n规则)。
示例性的,商户特征n可以是用户评论中用户选择出的商户类别。例如,用户评论提供有用户选择商户分类的功能,用户可以根据自己的判断选择出商户A的商户类别。
步骤307,服务器根据商户特征3、商户特征n相对应的商户分类库(规则档位分类)获取预测商户类别。
服务器根据商户特征3和商户特征n分别对应的商户分类库(规则档位分类)获取预测商户类别。
例如,服务器根据商户特征3和商户特征3对应的商户分类库获取到预测商户类别a和预测得分(1分)。服务器根据商户特征n和商户特征n对应的商户分类库获取到预测商户类别c和预测得分(1分)。
步骤308,服务器将预测商户类别进行规则加权计分。
服务器将步骤302、步骤304、步骤307中获取的全部预测商户类别和预测得分进行规则加权计分。
示例性的,服务器将全部预测商户类别中相同预测商户类别的预测得分相加。
例如,步骤302中得到了预测商户类别b(3分),步骤304中得到了预测商户类别a(4分),步骤307中得到了预测商户类别a(1分)、c(1分)。其中a对应有两个预测分数,则将a的两个预测分数得到最终a的分数为(5分)。
步骤309,服务器得出候选的预测商户类别。例如:候选池:a(5分)、b(3分)、c(1分)。
服务器将规则加权计分后的预测商户类别和预测得分作为商户分类结果的候选池。
例如:候选池:a(5分)、b(3分)、c(1分)。
步骤310,服务器根据推荐池输出规则,从候选池中推荐处一个预测商户类别,将该预测商户类别输出到推荐池,作为商户分类结果。
示例性的,推荐池输出规则是从候选池中选出至少一个预测商户类别作为商户分类结果。
例如,服务器将候选池中预测分数最高的预测商户类别输出到推荐池,将预测商户类别a输出到推荐池。
步骤311,服务器获得推荐池(商户分类结果),例如:推荐池:a(5分)。
推荐池即为商户A的商户分类结果。
示例性的,本申请提供的商户分类方法至少可以应用于以下三种场景:
第一种场景:某互联网平台上需要新增一个商户时,用本申请提供的商户分类方法为该新增商户进行商户分类。
第二种场景:某互联网平台上有大量的未分类的商户、或大量的已分类商户但不确定分类是否准确时时,用本申请提供的商户分类方法为该大量的未分类商户进行商户分类。
第三种场景:当无法人工判断一个商户究竟属于该互联网平台的第一类还是第二类时,用本申请提供的分类方法为该商户进行商户分类。例如,某一商户是提供瑜伽课程的商户,但人工无法准确判断该商户应该属于健身类还是教育类,此时,可以采用本申请的商户分类方法,根据该商户的多个商户特征获取该商户的商户分类结果。
以下为本申请的装置实施例,对于装置实施例中未详细描述的细节,可以结合参考上述方法实施例中相应的记载,本文不再赘述。
图8示出了本申请的一个示例性实施例提供的商户分类装置的结构示意图。
所述装置包括:
获取模块401,用于获取商户在至少一个互联网平台上对应的n种商户特征,n为大于1的整数;
所述获取模块401,还用于根据所述n种商户特征获取所述商户的n个预测商户类别以及对应的预测得分,所述n种商户特征和所述n个预测商户类别一一对应;
合并模块402,用于当所述n个预测商户类别中存在相同的预测商户类别时,对所述相同的预测商户类别对应的预测得分进行合并;
确定模块403,用于将具有最高的所述预测得分的前k个预测商户类别,确定为所述商户的商户分类结果。
在一个可选的实施例中,所述获取模块401,还用于对于所述n种商户特征中的第i种商户特征,获取所述第i种商户特征对应的第i种商户分类规则,所述第i种商户分类规则中包括商户分类库,所述商户分类库包括:候选商户类别和与所述候选商户类别对应的匹配条件,所述商户分类库对应有权重分数;
所述确定模块403,还用于根据所述第i种商户特征和所述候选商户类别对应的匹配条件,从所述商户分类库中确定与所述第i种商户特征对应的预测商户类别;
所述确定模块403,还用于将与所述商户分类库对应的权重分数,确定为与所述第i种商户特征对应的预测商户类别的预测得分。
在一个可选的实施例中,所述第i种商户分类规则中包括m个商户分类库,m为大于1的整数,所述m个商户分类库和m个权重分数一一对应,且所述m个商户分类库按照所述权重分数由高到低的顺序进行排序;
所述确定模块403,还用于在第j个商户分类库中,根据所述第i种商户特征和所述候选商户类别对应的匹配条件,确定与所述第i种商户特征对应的预测商户类别,j的起始值为1;
所述确定模块403,还用于当在所述第j个商户分类库中未能成功确定出与所述第i种商户特征对应的预测商户类别时,则在第j+1个商户分类库中,根据所述第i种商户特征和所述候选商户类别对应的匹配条件,确定与所述第i种商户特征对应的预测商户类别;
其中,j是不大于m-1的整数。
在一个可选的实施例中,所述商户特征包括:商户名称、其他互联网平台上的商户类别、商户图片、用户评论、商户商品中的至少一种。
在一个可选的实施例中,所述获取模块401,还用于获取商户在第一互联网平台上的第一商户特征,所述第一商户特征包括第一商户名称;
所述获取模块401,还用于获取第二互联网平台上的第二商户分类结果,所述第二商户分类结果包括第二商户名称和第二商户名称对应的第二商户类别,所述第二商户名称是所述商户在所述第二互联网平台上的商户名称,所述第二商户类别是所述商户在所述第二互联网平台上的商户类别;
所述获取模块401,还用于根据所述第一商户名称、所述第二商户名称和商户名称对应规则从所述商户分类结果中获取所述第一商户名称对应的所述第二商户类别,所述商户名称对应规则是所述第一商户名称和所述第二商户名称一一对应的规则;
所述确定模块403,还用于将所述第二商户类别确定为所述商户的第i种商户特征。
图9是本申请一个实施例提供的构成一个服务器的结构示意图。具体来讲:服务器700包括中央处理单元(英文:Central Processing Unit,简称:CPU)701、包括随机存取存储器(英文:Random Access Memory,简称:RAM)702和只读存储器(英文:Read-OnlyMemory,简称:ROM)703的系统存储器704,以及连接系统存储器704和中央处理单元701的系统总线705。服务器700还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)706,和用于存储操作系统713、应用程序714和其他程序模块715的大容量存储设备707。
基本输入/输出系统706包括有用于显示信息的显示器708和用于用户输入信息的诸如鼠标、键盘之类的输入设备709。其中显示器708和输入设备709都通过连接到系统总线705的输入/输出控制器710连接到中央处理单元701。基本输入/输出系统706还可以包括输入/输出控制器710以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入/输出控制器710还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备707通过连接到系统总线705的大容量存储控制器(未示出)连接到中央处理单元701。大容量存储设备707及其相关联的计算机可读介质为服务器700提供非易失性存储。也就是说,大容量存储设备707可以包括诸如硬盘或者只读光盘(英文:Compact Disc Read-Only Memory,简称:CD-ROM)驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(英文:Erasable Programmable Read-Only Memory,简称:EPROM)、电可擦除可编程只读存储器(英文:Electrically Erasable Programmable Read-Only Memory,简称:EEPROM)、闪存或其他固态存储其技术,CD-ROM、数字通用光盘(英文:Digital Versatile Disc,简称:DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器704和大容量存储设备707可以统称为存储器。
根据本申请的各种实施例,服务器700还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器700可以通过连接在系统总线705上的网络接口单元711连接到网络712,或者说,也可以使用网络接口单元711来连接到其他类型的网络或远程计算机系统(未示出)。
本申请还提供一种计算机设备,该计算机设备包括:处理器和存储器,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的商户分类方法。
本申请还提供一种计算机可读存储介质,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的商户分类方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种商户分类方法,其特征在于,所述方法包括:
获取商户在至少一个互联网平台上对应的n种商户特征,n为大于1的整数;
根据所述n种商户特征获取所述商户的n个预测商户类别以及对应的预测得分,所述n种商户特征和所述n个预测商户类别一一对应;
当所述n个预测商户类别中存在相同的预测商户类别时,对所述相同的预测商户类别对应的预测得分进行合并;
将具有最高的所述预测得分的前k个预测商户类别,确定为所述商户的商户分类结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述n种商户特征获取所述商户的n个预测商户类别以及对应的预测得分,包括:
对于所述n种商户特征中的第i种商户特征,获取所述第i种商户特征对应的第i种商户分类规则,所述第i种商户分类规则中包括商户分类库,所述商户分类库包括:候选商户类别和与所述候选商户类别对应的匹配条件,所述商户分类库对应有权重分数;
根据所述第i种商户特征和所述候选商户类别对应的匹配条件,从所述商户分类库中确定与所述第i种商户特征对应的预测商户类别;
将与所述商户分类库对应的权重分数,确定为与所述第i种商户特征对应的预测商户类别的预测得分。
3.根据权利要求2所述的方法,其特征在于,所述第i种商户分类规则中包括m个商户分类库,m为大于1的整数,所述m个商户分类库和m个权重分数一一对应,且所述m个商户分类库按照所述权重分数由高到低的顺序进行排序;
所述根据所述第i种商户特征和所述候选商户类别对应的匹配条件从所述商户分类库中确定与所述第i种商户特征对应的预测商户类别,包括:
在第j个商户分类库中,根据所述第i种商户特征和所述候选商户类别对应的匹配条件,确定与所述第i种商户特征对应的预测商户类别,j的起始值为1;
当在所述第j个商户分类库中未能成功确定出与所述第i种商户特征对应的预测商户类别时,则在第j+1个商户分类库中,根据所述第i种商户特征和所述候选商户类别对应的匹配条件,确定与所述第i种商户特征对应的预测商户类别;
其中,j是不大于m-1的整数。
4.根据权利要求3所述的方法,其特征在于,与商户名称对应的所述商户分类规则中包括权重分数由高到低顺序排列的:第一商户分类库、第二商户分类库和第三商户分类库;
所述根据所述第i种商户特征和所述候选商户类别对应的匹配条件从所述商户分类库中确定与所述第i种商户特征对应的预测商户类别,包括:
在所述第一商户分类库中,根据第一匹配条件确定与所述商户名称对应的第一预测商户类别,所述第一匹配条件是所述商户名称是否符合品牌商户名称或连锁店商户名称;
当在所述第一商户分类库中未能成功确定出第一预测商户类别时,则在所述第二商户分类库中,根据第二匹配条件确定与所述商户名称对应的第二预测商户类别,所述第二匹配条件是所述商户名称的后缀是否含有商户类别相关的关键词;
当在所述第二商户分类库中未能成功确定出第二预测商户类别时,则在所述第三商户分类库中,根据第三匹配条件确定与所述商户名称对应的第三预测商户类别,所述第三匹配条件是所述商户名称中是否含有商户类别相关的关键词;
当在所述第三商户分类库中未能成功确定出第三预测商户类别时,不存在与所述商户名称对应的预测商户类别。
5.根据权利要求1至3任一所述的方法,其特征在于,所述商户特征包括:商户名称、商户图片、用户评论、商户商品、其他互联网平台上的商户类别、所述其他互联网平台上的所述商户名称、所述其他互联网平台上的所述商户图片、所述其他互联网平台上的所述用户评论、所述其他互联网平台上的所述商户商品中的至少一种。
6.根据权利要求2或3所述的方法,其特征在于,所述获取商户在至少一个互联网平台上对应的n种商户特征,包括:
获取商户在第一互联网平台上的第一商户特征,所述第一商户特征包括第一商户名称;
获取第二互联网平台上的第二商户分类结果,所述第二商户分类结果包括第二商户名称和第二商户名称对应的第二商户类别,所述第二商户名称是所述商户在所述第二互联网平台上的商户名称,所述第二商户类别是所述商户在所述第二互联网平台上的商户类别;
根据所述第一商户名称、所述第二商户名称和商户名称对应规则从所述商户分类结果中获取所述第一商户名称对应的所述第二商户类别,所述商户名称对应规则是所述第一商户名称和所述第二商户名称一一对应的规则;
将所述第二商户类别确定为所述商户的第i种商户特征。
7.根据权利要求1所述的方法,其特征在于,所述当所述n个预测商户类别中存在相同的预测商户类别时,对所述相同的预测商户类别对应的预测得分进行合并后,所述方法还包括:
将所有所述预测商户类别放入候选池;
所述将具有最高的所述预测得分的前k个预测商户类别,确定为所述商户的商户分类结果,包括:
从所述候选池中将具有最高的所述预测得分的前k个所述预测商户类别,确定为所述商户的商户分类结果。
8.一种商户分类装置,其特征在于,所述装置包括:
获取模块,用于获取商户在至少一个互联网平台上对应的n种商户特征,n为大于1的整数;
所述获取模块,还用于根据所述n种商户特征获取所述商户的n个预测商户类别以及对应的预测得分,所述n种商户特征和所述n个预测商户类别一一对应;
合并模块,用于当所述n个预测商户类别中存在相同的预测商户类别时,对所述相同的预测商户类别对应的预测得分进行合并;
确定模块,用于将具有最高的所述预测得分的前k个预测商户类别,确定为所述商户的商户分类结果。
9.一种计算机设备,其特征在于,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的商户分类方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的商户分类方法。
CN201911045912.XA 2019-10-30 2019-10-30 商户分类方法、装置、设备及存储介质 Active CN110750697B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911045912.XA CN110750697B (zh) 2019-10-30 2019-10-30 商户分类方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911045912.XA CN110750697B (zh) 2019-10-30 2019-10-30 商户分类方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110750697A true CN110750697A (zh) 2020-02-04
CN110750697B CN110750697B (zh) 2022-07-29

Family

ID=69281231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911045912.XA Active CN110750697B (zh) 2019-10-30 2019-10-30 商户分类方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110750697B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368543A (zh) * 2020-02-18 2020-07-03 银联智策顾问(上海)有限公司 一种确定商户类别的方法及装置
CN113518132A (zh) * 2021-05-18 2021-10-19 北京天融信网络安全技术有限公司 网络地址的类别识别方法、装置、设备及存储介质
CN113849759A (zh) * 2021-11-29 2021-12-28 中国电子科技集团公司第三十研究所 一种基于图像特征的暗网站点用户关联方法
WO2024055480A1 (zh) * 2022-09-14 2024-03-21 中国银联股份有限公司 信息处理方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8122031B1 (en) * 2009-06-11 2012-02-21 Google Inc. User label and user category based content classification
US20140172652A1 (en) * 2012-12-19 2014-06-19 Yahoo! Inc. Automated categorization of products in a merchant catalog
CN104408635A (zh) * 2014-12-01 2015-03-11 银联智惠信息服务(上海)有限公司 商户类别信息识别方法和装置
CN104778605A (zh) * 2015-04-09 2015-07-15 北京京东尚科信息技术有限公司 电商客户的分类方法及装置
CN105760526A (zh) * 2016-03-01 2016-07-13 网易(杭州)网络有限公司 一种新闻分类的方法和装置
CN105989184A (zh) * 2015-08-25 2016-10-05 中国银联股份有限公司 一种分类方法及装置
CN107067293A (zh) * 2017-03-07 2017-08-18 北京三快在线科技有限公司 商家分类方法、装置及电子设备
CN107577747A (zh) * 2017-08-29 2018-01-12 广州云移信息科技有限公司 一种商户智能分类方法及系统
CN109961296A (zh) * 2017-12-25 2019-07-02 腾讯科技(深圳)有限公司 商户类型识别方法及装置
CN110046959A (zh) * 2019-03-27 2019-07-23 拉扎斯网络科技(上海)有限公司 一种确定商户经营类别的方法、装置、设备和存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8122031B1 (en) * 2009-06-11 2012-02-21 Google Inc. User label and user category based content classification
US20140172652A1 (en) * 2012-12-19 2014-06-19 Yahoo! Inc. Automated categorization of products in a merchant catalog
CN104408635A (zh) * 2014-12-01 2015-03-11 银联智惠信息服务(上海)有限公司 商户类别信息识别方法和装置
CN104778605A (zh) * 2015-04-09 2015-07-15 北京京东尚科信息技术有限公司 电商客户的分类方法及装置
CN105989184A (zh) * 2015-08-25 2016-10-05 中国银联股份有限公司 一种分类方法及装置
CN105760526A (zh) * 2016-03-01 2016-07-13 网易(杭州)网络有限公司 一种新闻分类的方法和装置
CN107067293A (zh) * 2017-03-07 2017-08-18 北京三快在线科技有限公司 商家分类方法、装置及电子设备
CN107577747A (zh) * 2017-08-29 2018-01-12 广州云移信息科技有限公司 一种商户智能分类方法及系统
CN109961296A (zh) * 2017-12-25 2019-07-02 腾讯科技(深圳)有限公司 商户类型识别方法及装置
CN110046959A (zh) * 2019-03-27 2019-07-23 拉扎斯网络科技(上海)有限公司 一种确定商户经营类别的方法、装置、设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陆相氾: ""商家标签管理系统的设计与实现"", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368543A (zh) * 2020-02-18 2020-07-03 银联智策顾问(上海)有限公司 一种确定商户类别的方法及装置
CN111368543B (zh) * 2020-02-18 2023-06-02 银联智策顾问(上海)有限公司 一种确定商户类别的方法及装置
CN113518132A (zh) * 2021-05-18 2021-10-19 北京天融信网络安全技术有限公司 网络地址的类别识别方法、装置、设备及存储介质
CN113849759A (zh) * 2021-11-29 2021-12-28 中国电子科技集团公司第三十研究所 一种基于图像特征的暗网站点用户关联方法
WO2024055480A1 (zh) * 2022-09-14 2024-03-21 中国银联股份有限公司 信息处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110750697B (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN110750697B (zh) 商户分类方法、装置、设备及存储介质
CN108205768B (zh) 数据库建立方法和数据推荐方法及装置、设备和存储介质
US9082086B2 (en) Adaptively learning a similarity model
US20210073892A1 (en) Product ordering method
CN107808314B (zh) 用户推荐方法及装置
CN109635198A (zh) 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备
CN116308684B (zh) 一种网购平台店铺信息推送方法及系统
CN111612581A (zh) 一种物品推荐的方法、装置、设备及存储介质
JP6945518B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
EP3824427A1 (en) Determining item relevancy
US20210110410A1 (en) Methods, systems, and apparatuses for providing data insight and analytics
CN112783468A (zh) 目标对象的排序方法和排序装置
CN110895781A (zh) 菜品类别推荐方法、装置、电子设备及存储介质
CN115760315A (zh) 商品推荐方法及其装置、设备、介质
CN114519100A (zh) 餐饮数据分析方法、装置、电子设备及存储介质
US11210618B2 (en) Systems and methods for generating a two-dimensional planogram based on intermediate data structures
CN112667897A (zh) 信息推送方法、设备以及存储介质
CN111159163A (zh) 商品信息数据库生成方法、商品搜索方法及相关装置
CN112784861A (zh) 相似度的确定方法、装置、电子设备和存储介质
CN112016582A (zh) 菜品推荐方法及其装置
CN112015970A (zh) 产品推荐方法、相关设备及计算机存储介质
KR102041399B1 (ko) 화장품 가격 비교 장치 및 방법
CN112330351B (zh) 用于选址的方法、选址系统和电子设备
CN109840820A (zh) 一种确定用户对对象类型偏好度的方法和装置
CA3138745A1 (en) Method and device for circling and creating target population

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant