CN116361571A - 基于人工智能的商户画像生成方法、装置、设备及介质 - Google Patents
基于人工智能的商户画像生成方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116361571A CN116361571A CN202310298435.8A CN202310298435A CN116361571A CN 116361571 A CN116361571 A CN 116361571A CN 202310298435 A CN202310298435 A CN 202310298435A CN 116361571 A CN116361571 A CN 116361571A
- Authority
- CN
- China
- Prior art keywords
- transaction
- merchant
- frequency
- merchants
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 37
- 238000012216 screening Methods 0.000 claims abstract description 25
- 230000000694 effects Effects 0.000 claims description 28
- 230000015654 memory Effects 0.000 claims description 25
- 238000012795 verification Methods 0.000 claims description 23
- 238000007689 inspection Methods 0.000 claims description 15
- 238000010276 construction Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000004378 air conditioning Methods 0.000 claims 1
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000002354 daily effect Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical compound S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Mathematics (AREA)
- Evolutionary Biology (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Algebra (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提出一种基于人工智能的商户画像生成方法、装置、电子设备及存储介质,基于人工智能的商户画像生成方法包括:筛选交易平台的注册商户以获取活跃商户集;采集所述活跃商户集中商户的交易数据获得商户交易数据集;统计所述商户交易数据集中商户的交易频率以获取交易频次均值;基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段;统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度;基于所述高频交易时间段和所述通道交易额度构建商户画像以制定不同的商户画像策略。本申请通过获取商户的高频交易时间段,并结合获取到的通道交易额度实现对商户画像的生成,可以有效提升对商户的服务效率。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种基于人工智能的商户画像生成方法、装置、电子设备及存储介质。
背景技术
用户画像一般指根据用户人口学特征,对网络浏览内容、网络社交活动和生活中的各种消费行为等大量信息的收集,然后进行标准化的数据规整分类,以及精准的模型计算等过程抽象出来的一个标签化的用户模型。
现有的用户画像一般针对消费端的客户进行描述,很少有针对商家的商户画像,而商户掌握有大量的真实交易数据,因此在交易平台日常的维护和运行过程中,如果能够通过交易数据对商户生成画像,可以有效针对不同的商户画像制定不同的运维和营销策略,从而提升对商户的服务效率。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的商户画像生成方法、装置、电子设备及存储介质,以解决如何提升对用户的服务效率这一技术问题。
本申请提供一种基于人工智能的商户画像生成方法,所述方法包括:
筛选交易平台的注册商户以获取活跃商户集;
采集所述活跃商户集中商户的交易数据获得商户交易数据集;
统计所述商户交易数据集中商户的交易频率以获取交易频次均值;
基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段;
统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度;
基于所述高频交易时间段和所述通道交易额度构建商户画像以制定不同的商户画像策略。
在一些实施例中,所述筛选交易平台的注册商户以获取活跃商户集包括:
统计交易平台中注册商户的交易量;
基于所属交易量将所述注册商户划分为高活跃商户集和低活跃商户集;
对所述低活跃商户集中的商户进行筛选以获取低活跃有效商户集;
将所述高活跃商户集和所述低活跃有效商户集作为活跃商户集。
在一些实施例中,所述对所述低活跃商户集中的商户进行筛选以获取低活跃有效商户集包括:
向所述低活跃商户集中的商户推送巡检验证信息;
若所述低活跃商户集中的商户根据所述巡检验证信息的指示进行验证,则验证通过;
若所述低活跃商户集中的商户没有根据所述巡检验证信息的指示进行验证,则验证不通过;
将所有验证通过的商户作为低活跃有效商户集。
在一些实施例中,所述采集所述活跃商户集中商户的交易数据获得商户交易数据集包括:
采集所述交易平台中存储的所述活跃商户集中商户的日志数据获得交易日志数据集;
对所述交易日志数据集进行预处理获得结构化数据集;
对所述结构化数据集进行脱敏获得商户交易数据集。
在一些实施例中,所述统计所述商户交易数据集中商户的交易频率以获取交易频次均值包括:
统计所述交易数据集中各商户在预设时间间隔内的交易频率获得单位交易频率集;
对所述单位交易频率集中的单位交易频率按照由大到小的顺序进行排序获得交易频次序列;
依据预设的阈值范围对所述交易频次序列进行截取获得稳定交易频次序列;
计算所述稳定交易频次序列中各单位交易频率的平均值作为交易频次均值。
在一些实施例中,所述基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段包括:
对所述单位交易频率按预设时段进行划分获得多个时段频次数据集;
计算所述时段频次数据集中所有单位交易频率的平均值作为时段频次均值;
对比所述时段频次均值和所述交易频次均值,并将所有大于所述交易频次均值的时段频次均值所对应的时段作为高频交易时间段。
在一些实施例中,所述统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度包括:
统计所述商户交易数据集中的不同类别的支付方式;
统计每种支付方式所对应的商户数量和支付总额度;
将所述支付总额度和所述商户数量的比值作为对应类别的支付方式的通道交易额度。
本申请实施例还提供一种基于人工智能的商户画像生成装置,所述装置包括筛选模块、采集模块、统计模块、聚类模块、获取模块以及构建模块:
所述筛选模块,用于筛选交易平台的注册商户以获取活跃商户集;
所述采集模块,用于采集所述活跃商户集中商户的交易数据获得商户交易数据集;
所述统计模块,用于统计所述商户交易数据集中商户的交易频率以获取交易频次均值;
所述聚类模块,用于基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段;
所述获取模块,用于统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度;
所述构建模块,用于基于所述高频交易时间段和所述通道交易额度构建商户画像以制定不同的商户画像策略。
本申请实施例还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;
处理器,执行所述存储器中存储的指令以实现所述的基于人工智能的商户画像生成方法。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述的基于人工智能的商户画像生成方法。
本申请通过采集商户在不同时间段的交易频率获取商户的高频交易时间段,并结合获取到的通道交易额度实现对商户画像的生成,可以有效针对不同的商户画像制定不同的运维和营销策略,从而提升对商户的服务效率。
附图说明
图1是本申请所涉及的基于人工智能的商户画像生成方法的较佳实施例的流程图。
图2是本申请所涉及的基于人工智能的商户画像生成装置的较佳实施例的功能模块图。
图3是本申请所涉及的基于人工智能的商户画像生成方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本申请的目的、特征和优点,下面结合附图和具体实施例对本申请进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互结合。在下面的描述中阐述了很多具体细节以便于充分理解本申请,所述描述的实施例仅是本申请一部分实施例,而不是全部的实施例。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本申请实施例提供一种基于人工智能的商户画像生成方法,可应用于一个或者多个电子设备中,电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
电子设备可以是任何一种可与客户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能式穿戴式设备等。
电子设备还可以包括网络设备和/或客户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量主机或网络服务器构成的云。
电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
如图1所示,是本申请基于人工智能的商户画像生成方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
S10,筛选交易平台的注册商户以获取活跃商户集。
在一个可选的实施例中,所述筛选交易平台的注册商户以获取活跃商户集包括:
统计交易平台中注册商户的交易量;
基于所属交易量将所述注册商户划分为高活跃商户集和低活跃商户集;
对所述低活跃商户集中的商户进行筛选以获取低活跃有效商户集;
将所述高活跃商户集和所述低活跃有效商户集作为活跃商户集。
该可选的实施例中,可对预设时间内交易平台中每位已注册商户公布的交易量进行统计,其中,所述交易平台可以是电商交易平台,所述预设时间可以是一个月。
该可选的实施例中,可对获取到的交易量按照由大到小的顺序进行排序,并将排名在后30%的交易量对应的所有商户作为低活跃商户集,将排名在前70%的交易量对应的所有商户作为高活跃商户集。示例性的,电商平台共有1000名商户,按照交易量由大到小的顺序进行排序后,将排名在前700的交易量对应的所有商户作为高活跃商户集,将排名在后300的交易量对应的所有商户作为低活跃商户集。
该可选的实施例中,对于所述低活跃商户集中的商户,交易量不高可能是商品店铺等客观原因造成的,也可能是商户本身不积极的主观原因造成的,因此可通过向所述低活跃商户集中的商户推送巡检验证信息来对所述低活跃商户集中主观上不积极主动的商户进行筛选,从而保留更为活跃的商户,有利于后续过程获取更为准确的商户交易信息。
该可选的实施例中,所述巡检验证信息可以是通过交易平台推送的内部巡检验证信息,也可以是通过短信等方式向商户发送的巡检验证信息,其中,所述巡检验证信息可以是统一的URL验证链接,示例性的,所述巡检验证信息可以为:“您好,请您点击下述网址链接完成商户的巡检验证服务,验证完成后可收到平台发送的红包奖励,感谢您的配合。”
该可选的实施例中,若所述低活跃商户集中的商户根据所述巡检验证信息的指示进行验证,则验证通过;若所述低活跃商户集中的商户没有根据所述巡检验证信息的指示进行验证,则验证不通过;将所有验证通过的商户作为低活跃有效商户集。本方案中将所述高活跃商户集和所述低活跃有效商户集作为活跃商户集。
如此,可以通过对商户的初步筛选获得活跃度高的商户,有利于后续过程据此收集更为准确的商户交易信息。
S11,采集所述活跃商户集中商户的交易数据获得商户交易数据集。
在一个可选的实施例中,所述采集所述活跃商户集中商户的交易数据获得商户交易数据集包括:
采集所述交易平台中存储的所述活跃商户集中商户的日志数据获得交易日志数据集;
对所述交易日志数据集进行预处理获得结构化数据集;
对所述结构化数据集进行脱敏获得商户交易数据集。
该可选的实施例中,可通过电商交易平台中的日志收集系统Flume采集所述活跃商户集中商户的日志数据获得交易日志数据集,其中,Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统,用于在日志收集系统中收集数据商户的交易数据,所述交易数据可以是订单交易量、交易金额、商铺类型、商户名称、经营地址、经营内容等信息。
该可选的实施例中,可结合日志收集系统Flume中预置的日志分析处理器对获取到的交易日志数据集中的日志数据进行数据处理,得到携带头部信息的二维表数据,即结构化数据,本方案中将获得的这些结构化数据作为结构化数据集。
该可选的实施例中,可对所述结构化数据集中的结构化数据进行脱敏,所述结构化数据由具有不同数据属性的数据列组成,所述数据列可以分为可识别列、半识别列、包含商户敏感信息的列以及其他不包含商户敏感信息的列,其中可识别列为可以确切定位某个商户的列,如身份证号、商户店主地址以及商户店主姓名等;半识别列为单列不能定位某个商户的列,如邮编号码、生日以及性别;包含商户敏感信息的列包括银行账号以及利润收入等,对所述结构化数据进行脱敏时,可以通过移除可识别列、移除包含商户敏感信息的列等方式进行,本方案中将经过脱敏后的结构化数据作为结构化数据集。
如此,可在获取所述活跃商户集中商户的交易数据的同时保护商户的隐私数据不被泄露,提升商户交易数据的安全性。
S12,统计所述商户交易数据集中商户的交易频率以获取交易频次均值。
在一个可选的实施例中,所述统计所述商户交易数据集中商户的交易频率以获取交易频次均值包括:
统计所述交易数据集中各商户在预设时间间隔内的交易频率获得单位交易频率集;
对所述单位交易频率集中的单位交易频率按照由大到小的顺序进行排序获得交易频次序列;
依据预设的阈值范围对所述交易频次序列进行截取获得稳定交易频次序列;
计算所述稳定交易频次序列中各单位交易频率的平均值作为交易频次均值。
该可选的实施例中,可统计所述交易数据集中各商户在预设时间间隔内的交易频率,所述预设时间间隔可以为一分钟,即统计各商户在每分钟内的交易量作为单位交易频率,并通过采集一定时间周期内所有商户的单位交易频率后获得单位交易频率集。示例性的,可采集所有商户在一个月内的所有单位交易频率构成所述单位交易频率集。
该可选的实施例中,可对所述单位交易频率集中的单位交易频率按照由大到小的顺序进行排序从而获得交易频次序列,并通过预设的阈值范围对所述交易频次序列进行截取后获得稳定交易频次序列,最终通过计算所述稳定交易频次序列中各单位交易频率的平均值作为交易频次均值,其中,所述预设的阈值范围可以为21%到80%。
示例性的,所述单位交易频率集中共有100个单位交易频率数据,按照单位交易频率由大到小的顺序排序后获得交易频次序列,然后将所述交易频次序列中排名在前20名和排名在最后20名的交易频率数据舍弃,将剩下的60个交易频率数据作为稳定交易频次序列,即通过预设的阈值范围将所述交易频次序列中排名在21到80的单位交易频率数据作为稳定交易频次序列,最终将所述稳定交易频次序列中各单位交易频率的平均值作为交易频次均值。
该可选的实施例中,由于单位交易频率最高和最低的部分数据容易存储数据失真,不能有效代表大多数商户的真实单位交易频率,因此通过获取交易频率均值可以更为准确的表示出大多数商户的真实交易频率。
如此,通过获取所述商户交易数据集中商户的单位交易频率的交易频次均值,可以更为准确有效的获取大部分商户的真实交易频率,有利于提高后续过程中对交易频率进行划分的准确性。
S13,基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段。
在一个可选的实施例中,所述基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段包括:
对所述单位交易频率按预设时段进行划分获得多个时段频次数据集;
计算所述时段频次数据集中所有单位交易频率的平均值作为时段频次均值;
对比所述时段频次均值和所述交易频次均值,并将所有大于所述交易频次均值的时段频次均值所对应的时段作为高频交易时间段。
该可选的实施例中,将获得的所有单位交易频率按照预设时段为单位进行划分,所述预设时段可以为小时,即将所有的单位交易频率按照小时为单位进行时段划分,并将每个小时内包括的所有单位交易频率作为时段频次数据集从而获得多个时段频次数据集。
该可选的实施例中,可计算每个时段频次数据集中所有单位交易频率的平均值作为该时段频次数据集对应的时段频次均值,并通过对比所述时段频次均值和所述交易频次均值,将所有大于所述交易频次均值的时段频次均值所对应的时段作为每天、每周或者每月等时间周期的高频交易时间段,并将此高频交易时间段作为商户的画像标签。
如此,可以根据预设时段对所述单位交易频率进行划分,从而获取商户的高频交易时间段。
S14,统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度。
在一个可选的实施例中,所述统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度包括:
统计所述商户交易数据集中的不同类别的支付方式;
统计每种支付方式所对应的商户数量和支付总额度;
将所述支付总额度和所述商户数量的比值作为对应类别的支付方式的通道交易额度。
该可选的实施例中,可统计所述商户交易数据集中各种不同类别的支付方式,所述支付方式包括银行卡支付、二维码支付、支付软件支付等,并可按照日为单位统计每种支付方式所对应的商户数量以及每种支付方式在所述商户交易数据集中的支付总额度。
该可选的实施例中,可将每种支付方式所对应的支付总额度和该种支付方式所对应的商户数量的比值作为该种支付方式的通道交易额度,并将所述通道交易额度作为商户的画像标签。示例性的,通过银行卡支付方式进行交易的商户共有100名,对应的单日支付总额度为200w,则银行卡支付方式所对应的通道交易额度为2w。
如此,可以快速获取所述商户交易数据集中每种支付方式所对应的通道交易额度。
S15,基于所述高频交易时间段和所述通道交易额度构建商户画像以制定不同的商户画像策略。
该可选的实施例中,可将获取到的所述高频交易时间段和所述通道交易额度作为商户的画像标签来构建商户画像,并根据不同的商户画像标签来对商户制定不同的商户画像策略。
示例性的,针对具有高频交易时间段标签的商户,在涉及到交易平台需要进行代码变更、系统维护时,可避开高频交易时间段,从而减少对商户正常交易的影响。针对具有通道交易额度标签的商户,在涉及到对大额支付渠道变更或维护是,可根据所述通道交易额度由大到小的顺序优先通知对应的商户。
在一个可选的实施例中,可通过对所述高频交易时间段和所述通道交易额度的统计汇总出发生高频交易和大的通道交易额度的地区,在针对相关地区的优惠活动或支付规则变更时,可对该地区进行优先通知。示例性的,江浙沪地区的商户在每天的上午9点到晚上11点会出现高频交易且通道交易额度较大,因此可针对江浙沪地区的商户制定相应的优惠活动,如交易频率越高、通道支付交易额度越大,则平台补贴的快递费用越多。
如此,可将获取到的所述高频交易时间段和所述通道交易额度作为商户的画像标签,帮助交易平台根据不同的画像标签制定不同的商户画像策略,从而提高对商户的服务效率。
请参见图2,图2是本申请基于人工智能的商户画像生成装置的较佳实施例的功能模块图。基于人工智能的商户画像生成装置11包括筛选模块110、采集模块111、统计模块112、聚类模块113、获取模块114、构建模块115。本申请所称的单元/模块是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各单元/模块的功能将在后续的实施例中详述。
在一个可选的实施例中,筛选模块110用于筛选交易平台的注册商户以获取活跃商户集。
在一个可选的实施例中,所述筛选交易平台的注册商户以获取活跃商户集包括:
统计交易平台中注册商户的交易量;
基于所属交易量将所述注册商户划分为高活跃商户集和低活跃商户集;
对所述低活跃商户集中的商户进行筛选以获取低活跃有效商户集;
将所述高活跃商户集和所述低活跃有效商户集作为活跃商户集。
在一个可选的实施例中,采集模块111用于采集所述活跃商户集中商户的交易数据获得商户交易数据集。
在一个可选的实施例中,所述采集所述活跃商户集中商户的交易数据获得商户交易数据集包括:
采集所述交易平台中存储的所述活跃商户集中商户的日志数据获得交易日志数据集;
对所述交易日志数据集进行预处理获得结构化数据集;
对所述结构化数据集进行脱敏获得商户交易数据集。
在一个可选的实施例中,统计模块112用于统计所述商户交易数据集中商户的交易频率以获取交易频次均值。
在一个可选的实施例中,所述统计所述商户交易数据集中商户的交易频率以获取交易频次均值包括:
统计所述交易数据集中各商户在预设时间间隔内的交易频率获得单位交易频率集;
对所述单位交易频率集中的单位交易频率按照由大到小的顺序进行排序获得交易频次序列;
依据预设的阈值范围对所述交易频次序列进行截取获得稳定交易频次序列;
计算所述稳定交易频次序列中各单位交易频率的平均值作为交易频次均值。
在一个可选的实施例中,聚类模块113用于基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段。
在一个可选的实施例中,所述基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段包括:
对所述单位交易频率按预设时段进行划分获得多个时段频次数据集;
计算所述时段频次数据集中所有单位交易频率的平均值作为时段频次均值;
对比所述时段频次均值和所述交易频次均值,并将所有大于所述交易频次均值的时段频次均值所对应的时段作为高频交易时间段。
在一个可选的实施例中,获取模块114用于统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度。
在一个可选的实施例中,所述统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度包括:
统计所述商户交易数据集中的不同类别的支付方式;
统计每种支付方式所对应的商户数量和支付总额度;
将所述支付总额度和所述商户数量的比值作为对应类别的支付方式的通道交易额度。
在一个可选的实施例中,构建模块115用于基于所述高频交易时间段和所述通道交易额度构建商户画像以制定不同的商户画像策略。
由以上技术方案可以看出,本申请能够通过采集商户在不同时间段的交易频率获取商户的高频交易时间段,并结合获取到的通道交易额度实现对商户画像的生成,可以有效针对不同的商户画像制定不同的运维和营销策略,从而提升对商户的服务效率。
请参见图3,是本申请实施例提供的一种电子设备的结构示意图。电子设备1包括存储器12和处理器13。存储器12用于存储计算机可读指令,处理器13用执行所述储器中存储的计算机可读指令以实现上述任一实施例所述的基于人工智能的商户画像生成方法。
在一个可选的实施例中,电子设备1还包括总线、存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如基于人工智能的商户画像生成程序。
图3仅示出了具有存储器12和处理器13的电子设备1,本领域技术人员可以理解的是,图3示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
结合图1,电子设备1中的所述存储器12存储多个计算机可读指令以实现一种基于人工智能的商户画像生成方法,所述处理器13可执行所述多个指令从而实现:
筛选交易平台的注册商户以获取活跃商户集;
采集所述活跃商户集中商户的交易数据获得商户交易数据集;
统计所述商户交易数据集中商户的交易频率以获取交易频次均值;
基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段;
统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度;
基于所述高频交易时间段和所述通道交易额度构建商户画像以制定不同的商户画像策略。
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,电子设备1可以是总线型结构,也可以是星形结构,电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如电子设备1还可以包括输入输出设备、网络接入设备等。
需要说明的是,电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本申请,也应包含在本申请的保护范围以内,并以引用方式包含于此。
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质可以是非易失性的,也可以是易失性的。所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于人工智能的商户画像生成程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是电子设备1的控制核心(Control Unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于人工智能的商户画像生成程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于人工智能的商户画像生成方法实施例中的步骤,例如图1所示的步骤。
示例性的,所述计算机程序可以被分割成一个或多个单元/模块,所述一个或者多个单元/模块被存储在所述存储器12中,并由所述处理器13执行,以完成本申请。所述一个或多个单元/模块可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机程序在电子设备1中的执行过程。例如,所述计算机程序可以被分割成筛选模块110、采集模块111、统计模块112、聚类模块113、获取模块114、构建模块115。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本申请各个实施例所述的基于人工智能的商户画像生成方法的部分。
电子设备1集成的单元/模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存储器及其他存储器等。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
总线可以是外设部件互连标准(Peripheral Component Interconnect,简称PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
本申请实施例还提供一种计算机可读存储介质(图未示),计算机可读存储介质中存储有计算机可读指令,计算机可读指令被电子设备中的处理器执行以实现上述任一实施例所述的基于人工智能的商户画像生成方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
此外,显然“包括”一词不排除其他模块或步骤,单数不排除复数。说明书陈述的多个模块或装置也可以由一个模块或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本申请的技术方案而非限制,尽管参照较佳实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或等同替换,而不脱离本申请技术方案的精神和范围。
Claims (10)
1.一种基于人工智能的商户画像生成方法,其特征在于,所述方法包括:
筛选交易平台的注册商户以获取活跃商户集;
采集所述活跃商户集中商户的交易数据获得商户交易数据集;
统计所述商户交易数据集中商户的交易频率以获取交易频次均值;
基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段;
统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度;
基于所述高频交易时间段和所述通道交易额度构建商户画像以制定不同的商户画像策略。
2.如权利要求1所述的基于人工智能的商户画像生成方法,其特征在于,所述筛选交易平台的注册商户以获取活跃商户集包括:
统计交易平台中注册商户的交易量;
基于所属交易量将所述注册商户划分为高活跃商户集和低活跃商户集;
对所述低活跃商户集中的商户进行筛选以获取低活跃有效商户集;
将所述高活跃商户集和所述低活跃有效商户集作为活跃商户集。
3.如权利要求2所述的基于人工智能的商户画像生成方法,其特征在于,所述对所述低活跃商户集中的商户进行筛选以获取低活跃有效商户集包括:
向所述低活跃商户集中的商户推送巡检验证信息;
若所述低活跃商户集中的商户根据所述巡检验证信息的指示进行验证,则验证通过;
若所述低活跃商户集中的商户没有根据所述巡检验证信息的指示进行验证,则验证不通过;
将所有验证通过的商户作为低活跃有效商户集。
4.如权利要求1所述的基于人工智能的商户画像生成方法,其特征在于,所述采集所述活跃商户集中商户的交易数据获得商户交易数据集包括:
采集所述交易平台中存储的所述活跃商户集中商户的日志数据获得交易日志数据集;
对所述交易日志数据集进行预处理获得结构化数据集;
对所述结构化数据集进行脱敏获得商户交易数据集。
5.如权利要求1所述的基于人工智能的商户画像生成方法,其特征在于,所述统计所述商户交易数据集中商户的交易频率以获取交易频次均值包括:
统计所述交易数据集中各商户在预设时间间隔内的交易频率获得单位交易频率集;
对所述单位交易频率集中的单位交易频率按照由大到小的顺序进行排序获得交易频次序列;
依据预设的阈值范围对所述交易频次序列进行截取获得稳定交易频次序列;
计算所述稳定交易频次序列中各单位交易频率的平均值作为交易频次均值。
6.如权利要求5所述的基于人工智能的商户画像生成方法,其特征在于,所述基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段包括:
对所述单位交易频率按预设时段进行划分获得多个时段频次数据集;
计算所述时段频次数据集中所有单位交易频率的平均值作为时段频次均值;
对比所述时段频次均值和所述交易频次均值,并将所有大于所述交易频次均值的时段频次均值所对应的时段作为高频交易时间段。
7.如权利要求1所述的基于人工智能的商户画像生成方法,其特征在于,所述统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度包括:
统计所述商户交易数据集中的不同类别的支付方式;
统计每种支付方式所对应的商户数量和支付总额度;
将所述支付总额度和所述商户数量的比值作为对应类别的支付方式的通道交易额度。
8.一种基于人工智能的商户画像生成装置,其特征在于,所述装置包括筛选模块、采集模块、统计模块、聚类模块、获取模块以及构建模块:
所述筛选模块,用于筛选交易平台的注册商户以获取活跃商户集;
所述采集模块,用于采集所述活跃商户集中商户的交易数据获得商户交易数据集;
所述统计模块,用于统计所述商户交易数据集中商户的交易频率以获取交易频次均值;
所述聚类模块,用于基于所述交易频次均值对所述交易频率进行划分以获取高频交易时间段;
所述获取模块,用于统计所述商户交易数据集中的不同类别的支付方式和支付额度以获取通道交易额度;
所述构建模块,用于基于所述高频交易时间段和所述通道交易额度构建商户画像以制定不同的商户画像策略。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至7中任意一项所述的基于人工智能的商户画像生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的基于人工智能的商户画像生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310298435.8A CN116361571A (zh) | 2023-03-15 | 2023-03-15 | 基于人工智能的商户画像生成方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310298435.8A CN116361571A (zh) | 2023-03-15 | 2023-03-15 | 基于人工智能的商户画像生成方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116361571A true CN116361571A (zh) | 2023-06-30 |
Family
ID=86941406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310298435.8A Pending CN116361571A (zh) | 2023-03-15 | 2023-03-15 | 基于人工智能的商户画像生成方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116361571A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610680A (zh) * | 2023-07-20 | 2023-08-18 | 上海富友支付服务股份有限公司 | 高频库和使用高频库的数据分级存储和查询方法和系统 |
-
2023
- 2023-03-15 CN CN202310298435.8A patent/CN116361571A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610680A (zh) * | 2023-07-20 | 2023-08-18 | 上海富友支付服务股份有限公司 | 高频库和使用高频库的数据分级存储和查询方法和系统 |
CN116610680B (zh) * | 2023-07-20 | 2023-10-13 | 上海富友支付服务股份有限公司 | 高频库和使用高频库的数据分级存储和查询方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2011309773B2 (en) | System, method, and computer readable medium for distributing targeted data using anonymous profiles | |
WO2014015233A1 (en) | System and method for protecting consumer privacy in the measuring of the effectiveness of advertisements | |
CN112598513B (zh) | 识别股东风险交易行为的方法及装置 | |
CN112330412B (zh) | 一种产品推荐方法、装置、计算机设备及存储介质 | |
CN112801498A (zh) | 风险识别模型的训练方法、风险识别方法、装置及设备 | |
CN112733531A (zh) | 虚拟资源分配方法、装置、电子设备及计算机存储介质 | |
CN110866698A (zh) | 用于评定服务提供方的服务分值的装置 | |
CN111062799A (zh) | 家庭客户的管理方法、装置、电子设备及存储介质 | |
CN108737138B (zh) | 服务提供方法及服务平台 | |
CN111861487A (zh) | 金融交易数据处理方法、欺诈行为的监测方法和装置 | |
CN110019774B (zh) | 标签分配方法、装置、存储介质及电子装置 | |
CN116361571A (zh) | 基于人工智能的商户画像生成方法、装置、设备及介质 | |
CN113792089A (zh) | 基于人工智能的非法行为检测方法、装置、设备及介质 | |
CN114840527A (zh) | 数据处理方法、装置及计算机可读存储介质 | |
CN108694609B (zh) | 一种广告网盟平台 | |
CN110070383B (zh) | 基于大数据分析的异常用户识别方法及装置 | |
CN117094764A (zh) | 银行积分处理方法及装置 | |
CN114625975B (zh) | 一种基于知识图谱的客户行为分析系统 | |
CN114398562A (zh) | 一种店铺数据管理方法、装置、设备及存储介质 | |
CN113298530A (zh) | 基于行情数据分类的交易配置方法、装置、设备及介质 | |
CN113052673A (zh) | 对账清算方法、装置、计算机设备及存储介质 | |
US20200193468A1 (en) | Blockchain for ads and coupons | |
CN117455579B (zh) | 商品推荐干预方法、装置以及介质和设备 | |
CN115174238B (zh) | 网络攻击源识别方法及装置 | |
CN117495454A (zh) | 一种用户评级方法、系统、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |