CN114547459B - 一种跨境电商数据处理方法及系统 - Google Patents
一种跨境电商数据处理方法及系统 Download PDFInfo
- Publication number
- CN114547459B CN114547459B CN202210169833.5A CN202210169833A CN114547459B CN 114547459 B CN114547459 B CN 114547459B CN 202210169833 A CN202210169833 A CN 202210169833A CN 114547459 B CN114547459 B CN 114547459B
- Authority
- CN
- China
- Prior art keywords
- commodity
- target
- model
- interest intensity
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 26
- 238000000605 extraction Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 7
- 108010001267 Protein Subunits Proteins 0.000 claims 1
- 238000010276 construction Methods 0.000 claims 1
- 238000000034 method Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004888 barrier function Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Finance (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种跨境电商数据处理方法及系统,以统一商品模型特征框架为基础,通过对不同地区用户的商品搜索记录数据的分析,将搜索关键词与统一商品模型特征框架中的特征指标进行匹配以构建具有当地特色的商品模型和兴趣强度子模型,并计算得到对应的兴趣强度参数,可以精准识别不同地区用户的兴趣点。
Description
技术领域
本发明涉及电商技术领域,特别涉及一种跨境电商数据处理方法及系统。
背景技术
跨境电子商务作为推动经济一体化、贸易全球化的技术基础,具有非常重要的战略意义。跨境电子商务不仅冲破了国家间的障碍,使国际贸易走向无国界贸易,同时它也正在引起世界经济贸易的巨大变革。对企业来说,跨境电子商务构建的开放、多维、立体的多边经贸合作模式,极大地拓宽了进入国际市场的路径,大大促进了多边资源的优化配置与企业间的互利共赢;对于消费者来说,跨境电子商务使他们非常容易地获取其他国家的信息并买到物美价廉的商品。频繁的跨境交易每天都会在各大跨境电子商务系统中产生大量的数据,通过对这些数据的处理和分析,可以为企业的营销策略提供数据基础,从而为客户推荐其所感兴趣的商品。然而现有跨境电子商务系统一般采用统一的商品模型描述商品,只能简单利用用户的商品浏览行为和商品交易行为来识别用户对商品的兴趣点,灵活性不足,无法根据地区差异精准地识别各地用户的兴趣点所在,从而错失促成更多交易成单的机会。
发明内容
本发明正是基于上述问题,提出了一种跨境电商数据处理方法及系统,可以根据地域性差异动态构建具有地域特色的商品模型,精准识别不同地区用户的兴趣点。
有鉴于此,本发明的一方面提出了一种跨境电商数据处理方法,包括:
S100:从数据库中获取统一商品模型特征框架,所述统一商品模型特征框架包括商品外观属性特征指标、商品品类属性特征指标、商品定位属性特征指标以及商品功能属性特征指标中的至少一个;
S200:从数据库中获取目标地域用户与目标商品关联的搜索记录,并从所述搜索记录中提取搜索关键词,将所述搜索关键词与所述统一商品模型特征框架中的特征指标进行匹配以构建所述目标商品的目标地域商品模型;
S300:根据所述目标商品的目标地域商品模型建立所述目标商品的用户兴趣强度子模型以及地域兴趣强度子模型;
S400:根据所述目标地域用户与目标商品关联的搜索记录计算得到所述用户兴趣强度子模型以及地域兴趣强度子模型的兴趣强度参数并写入数据库。
进一步的,在上述跨境电商数据处理方法中,所述步骤S200具体包括:
S210:对所述搜索关键词进行分词、去噪以及标准化处理后提取核心关键词;
S220:将所述核心关键词输入预先训练好的商品特征指标识别模型中进行匹配以获取所述核心关键词对应的特征指标;
S230:将所述核心关键词确定为所述目标商品对应所述特征指标的特征标签。
进一步的,在上述跨境电商数据处理方法中,所述步骤S400具体包括:
S410:根据同一用户对同一所述目标商品的搜索次数、搜索频率以及多次搜索间的时间间隔计算得到所述用户兴趣强度子模型的兴趣强度参数。
进一步的,在上述跨境电商数据处理方法中,所述步骤S410具体包括:
S411:获取目标用户的全部搜索记录,从目标用户的全部搜索记录中提取与目标商品相关联的搜索记录;
S412:确定所述目标用户对所述目标商品的每一个搜索关键词在所述目标地域商品模型中对应的特征标签;
S413:如所述搜索关键词在所述目标地域商品模型中没有对应的特征标签,执行所述步骤S210到S230;如所述搜索关键词在所述目标地域商品模型中有对应的特征标签T,确定对应所述特征标签的搜索次数n,得到所述目标用户对应所述特征标签T的基础兴趣强度T0=n;
S414:当n>1时,确定所述目标用户对应所述特征标签T的n次搜索记录的搜索日期是否为同一天;
S415:是同一天则所述目标用户对所述目标商品对应所述特征标签T的兴趣强度T=T0,不是同一天则获取所述目标用户对应所述特征标签T的n次搜索记录中每一次搜索日期相对于下一次搜索日期的时间间隔Dn,当Dn小于预设值D0时,当次搜索的兴趣强度增益值为Tn=1,当Dn小于预设值D0时,当次搜索的兴趣强度增益值为Tn=1/Dn,所述目标用户对所述目标商品对应所述特征标签T的兴趣强度
进一步的,在上述跨境电商数据处理方法中,所述步骤S400还包括:
S420:根据所述目标地域的用户对同一所述目标商品的搜索次数、搜索频率以及每个所述目标地域的用户的用户兴趣强度子模型的兴趣强度参数计算得到所述地域兴趣强度子模型的兴趣强度参数。
本发明的另一方面提出了一种跨境电商数据处理系统,包括:
统一商品模型特征框架获取单元,用于从数据库中获取统一商品模型特征框架,所述统一商品模型特征框架包括商品外观属性特征指标、商品品类属性特征指标、商品定位属性特征指标以及商品功能属性特征指标中的至少一个;
目标地域商品模型构建单元,用于从数据库中获取目标地域用户与目标商品关联的搜索记录,并从所述搜索记录中提取搜索关键词,将所述搜索关键词与所述统一商品模型特征框架中的特征指标进行匹配以构建所述目标商品的目标地域商品模型;
兴趣强度子模型构建单元,用于根据所述目标商品的目标地域商品模型建立所述目标商品的用户兴趣强度子模型以及地域兴趣强度子模型;
兴趣强度参数计算单元,用于根据所述目标地域用户与目标商品关联的搜索记录计算得到所述用户兴趣强度子模型以及地域兴趣强度子模型的兴趣强度参数并写入数据库。
进一步的,在上述跨境电商数据处理系统中,所述目标地域商品模型构建单元包括:
核心关键词提取子单元,用于对所述搜索关键词进行分词、去噪以及标准化处理后提取核心关键词;
特征指标匹配子单元,用于将所述核心关键词输入预先训练好的商品特征指标识别模型中进行匹配以获取所述核心关键词对应的特征指标;
特征标签确定子单元,用于将所述核心关键词确定为所述目标商品对应所述特征指标的特征标签。
进一步的,在上述跨境电商数据处理系统中,所述兴趣强度参数计算单元包括:
用户兴趣强度计算子单元,用于根据同一用户对同一所述目标商品的搜索次数、搜索频率以及多次搜索间的时间间隔计算得到所述用户兴趣强度子模型的兴趣强度参数。
进一步的,在上述跨境电商数据处理系统中,所述用户兴趣强度计算子单元包括:
第一关联记录提取子模块,用于获取目标用户的全部搜索记录,从目标用户的全部搜索记录中提取与目标商品相关联的搜索记录;
第一特征标签确定子模块,用于确定所述目标用户对所述目标商品的每一个搜索关键词在所述目标地域商品模型中对应的特征标签;
第一基础兴趣强度计算子模块,用于如所述搜索关键词在所述目标地域商品模型中没有对应的特征标签,执行所述步骤S210到S230;如所述搜索关键词在所述目标地域商品模型中有对应的特征标签T,确定对应所述特征标签的搜索次数n,得到所述目标用户对应所述特征标签T的基础兴趣强度T0=n;
搜索日期确定子模块,用于当n>1时,确定所述目标用户对应所述特征标签T的n次搜索记录的搜索日期是否为同一天;
第一兴趣强度计算子模块,用于是同一天则所述目标用户对所述目标商品对应所述特征标签T的兴趣强度T=T0,不是同一天则获取所述目标用户对应所述特征标签T的n次搜索记录中每一次搜索日期相对于下一次搜索日期的时间间隔Dn,当Dn小于预设值D0时,当次搜索的兴趣强度增益值为Tn=1,当Dn小于预设值D0时,当次搜索的兴趣强度增益值为Tn=1/Dn,所述目标用户对所述目标商品对应所述特征标签T的兴趣强度
进一步的,在上述跨境电商数据处理系统中,所述兴趣强度参数计算单元包括:
地域兴趣强度计算子单元,根据所述目标地域的用户对同一所述目标商品的搜索次数、搜索频率以及每个所述目标地域的用户的用户兴趣强度子模型的兴趣强度参数计算得到所述地域兴趣强度子模型的兴趣强度参数。
本发明提出的一种跨境电商数据处理方法及系统,以统一商品模型特征框架为基础,通过对不同地区用户的商品搜索记录数据的分析,将搜索关键词与统一商品模型特征框架中的特征指标进行匹配以构建具有当地特色的商品模型和兴趣强度子模型,并计算得到对应的兴趣强度参数,可以精准识别不同地区用户的兴趣点。
附图说明
图1是本发明一个实施例提供的一种跨境电商数据处理方法的示意流程图;
图2是本发明一个实施例提供的一种跨境电商数据处理方法的示意流程图;
图3是本发明一个实施例提供的一种跨境电商数据处理方法的示意流程图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
在本发明的描述中,术语“多个”则指两个或两个以上,除非另有明确的限定,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。术语“连接”、“安装”、“固定”等均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本说明书的描述中,术语“一个实施例”、“一些实施方式”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
下面参照图1至图来描述根据本发明一些实施方式提供的一种跨境电商数据处理方法及系统。
如图1所示,本发明的一方面提出了一种跨境电商数据处理方法,包括:
S100:从数据库中获取统一商品模型特征框架,所述统一商品模型特征框架包括商品外观属性特征指标、商品品类属性特征指标、商品定位属性特征指标以及商品功能属性特征指标中的至少一个;
S200:从数据库中获取目标地域用户与目标商品关联的搜索记录,并从所述搜索记录中提取搜索关键词,将所述搜索关键词与所述统一商品模型特征框架中的特征指标进行匹配以构建所述目标商品的目标地域商品模型;
S300:根据所述目标商品的目标地域商品模型建立所述目标商品的用户兴趣强度子模型以及地域兴趣强度子模型;
S400:根据所述目标地域用户与目标商品关联的搜索记录计算得到所述用户兴趣强度子模型以及地域兴趣强度子模型的兴趣强度参数并写入数据库。
本发明提出的一种跨境电商数据处理方法及系统,以统一商品模型特征框架为基础,通过对不同地区用户的商品搜索记录数据的分析,将搜索关键词与统一商品模型特征框架中的特征指标进行匹配以构建具有当地特色的商品模型和兴趣强度子模型,并计算得到对应的兴趣强度参数,可以精准识别不同地区用户的兴趣点。
在本发明实施例的技术方案中,所述统一商品模型特征框架为两层架构,第一层为属性层,包括商品外观属性、商品品类属性、商品定位属性以及商品功能属性中的至少一个;第二层为特征指标层,例如商品外观属性对应的特征指标层包括商品的颜色、形状、重量、尺寸竺等,所述商品品类属性对应的特征指标层包括服装鞋帽、家用电器、零食饮品、3C数码等等,根据平台商品的复杂性还可以进行进一步扩展或细分,此处不再一一列举。此处仅为示例,在本发明的其它实施例中,所述属性层还可以包括其它属性,例如商品财务属性或者商品场景属性等,所述商品财务属性对应的特征指标层可以包括如商品价格、商品成本等等,所述商品场景属性对应的特征指标层可以包括适用场地特征指标如室内、户外、沙滩、飞机等,适用场合特征指标如郊游、冲浪、露营等等。在本发明的其它实施例中,所述统一商品模型特征框架还可以根据实际使用需要扩展为三层甚至更多层,此处不再赘述。
如图2所示,在上述跨境电商数据处理方法中,所述步骤S200具体包括:
S210:对所述搜索关键词进行分词、去噪以及标准化处理后提取核心关键词;
S220:将所述核心关键词输入预先训练好的商品特征指标识别模型中进行匹配以获取所述核心关键词对应的特征指标;
S230:将所述核心关键词确定为所述目标商品对应所述特征指标的特征标签。
不同用户的搜索习惯往往具有或大或小的差异,例如,有的用户搜索商品习惯只输入单个词汇进行搜索,有的用户搜索商品习惯输入多个词汇进行组合搜索,有的用户习惯输入长句进行搜索,而用户输入的词汇或句子的内容中也会涉及商品的不同属性。例如用户可以输入“羽绒服”以搜索商品品类属性的“羽绒服”的商品,也可以输入“黄色背包”以搜索商品外观属性中颜色特征指标为“黄色”、商品品类属性中品类特征指标为“背包”的商品,也可以输入“沙滩露营用的南极人帐篷”以搜索商品场景属性中适用场地指标为“沙滩”、适用场合特征指标为“露营”、商品定位属性中的品牌特征指标为“南极人”、商品品类属特中的品类特征指标为“帐篷”的商品。对于只输入单个词汇作为搜索关键词的商品搜索行为,可以直接对该关键词进行标准化处理后作为核心关键词;对于输入多个词汇进行组合搜索的商品搜索行为,通过分词及标准化处理即可获得一个或多个核心关键词;对于输入长句进行搜索的商品搜索行为,需要对长句进行分词后,去除停顿词如“的”、“了”、“啊”等,通用词汇如“可以”、“适合”等再进行标准化处理后获得一个或多个核心关键词。关键词的标准化处理是指对于语义相同但表达方式不相同的词汇采用统一的表述。例如,对于颜色为黄色的产品,有的用户在搜索时会输入“黄色”,有的用户在搜索时会输入“黄颜色”,其语义完全相同,仅表达方式有所差异,通过标准化处理后,统一输出例如“黄色”作为对应的核心关键词。
在本发明实施例的技术方案中,初始状态下,所述跨境电商数据处理系统中每个商品的商品模型均只有商品属性层和特征指标层的名称,每个特征指标下对应的特征标签为空。通过对所述跨境电商数据处理系统的数据库中目标地域的用户与目标商品关联的搜索记录进行遍历识别,从中提出出核心关键词后,通过预先训练好的商品特征指标识别模型中进行匹配以获取所述核心关键词对应的特征指标,从而将该核心关键词确定为所述目标商品对应所述特征指标的特征标签。以这些特征标签为基础组合形成所述目标商品在所述目标地域的商品模型,即所述目标商品的所述目标地域商品模型。
在本发明实施例的技术方案中,所述目标地域商品模型包括用户兴趣强度子模型和地域兴趣强度子模型。所述用户兴趣强度子模型由每个用户各自对所述目标地域商品模型中的每个特征标签的兴趣强度组成。所述地域兴趣强度子模型由所述目标地域所有用户对对所述目标地域商品模型中的每个特征标签的兴趣强度组成。
进一步的,在上述跨境电商数据处理方法中,所述步骤S400具体包括:
S410:根据同一用户对同一所述目标商品的搜索次数、搜索频率以及多次搜索间的时间间隔计算得到所述用户兴趣强度子模型的兴趣强度参数。
用户对商品的兴趣强度与其搜索商品的搜索次数、搜索频率以及多次搜索间的时间间隔相关联。通过对同一用户对同一所述目标商品的搜索记录进行识别、分析和计算,可以得到所述用户兴趣强度子模型的兴趣强度参数。
如图3所示,在本发明一些实施方式的技术方案中,所述步骤S410具体包括:
S411:获取目标用户的全部搜索记录,从目标用户的全部搜索记录中提取与目标商品相关联的搜索记录;
S412:确定所述目标用户对所述目标商品的每一个搜索关键词在所述目标地域商品模型中对应的特征标签;
S413:如所述搜索关键词在所述目标地域商品模型中没有对应的特征标签,执行所述步骤S210到S230;如所述搜索关键词在所述目标地域商品模型中有对应的特征标签T,确定对应所述特征标签的搜索次数n,得到所述目标用户对应所述特征标签T的基础兴趣强度T0=n;
S414:当n>1时,确定所述目标用户对应所述特征标签T的n次搜索记录的搜索日期是否为同一天;
S415:是同一天则所述目标用户对所述目标商品对应所述特征标签T的兴趣强度T=T0,不是同一天则获取所述目标用户对应所述特征标签T的n次搜索记录中每一次搜索日期相对于下一次搜索日期的时间间隔Dn,当Dn小于预设值D0时,当次搜索的兴趣强度增益值为Tn=1,当Dn小于预设值D0时,当次搜索的兴趣强度增益值为Tn=1/Dn,所述目标用户对所述目标商品对应所述特征标签T的兴趣强度其中k为大于等于1小于n的正整数。
进一步的,在本发明上述实施例的技术方案中,所述步骤S410还包括:
S416:获取所述所述目标用户对所述目标商品对应所述特征标签T最后一次搜索日期与当前日期的时间间隔Dm,所述目标用户对所述目标商品对应所述特征标签T的兴趣强度其中α<1,其中α为用户兴趣强度衰减系数。
进一步的,在上述跨境电商数据处理方法中,所述步骤S400还包括:
S420:根据所述目标地域的用户对同一所述目标商品的搜索次数、搜索频率以及每个所述目标地域的用户的用户兴趣强度子模型的兴趣强度参数计算得到所述地域兴趣强度子模型的兴趣强度参数。
进一步的,在上述跨境电商数据处理方法中,所述步骤S420还包括:
S421:获取目标地域与目标商品相关联的全部搜索记录;
S422:确定所述目标地域全部用户对所述目标商品的每一个搜索关键词在所述目标地域商品模型中对应的特征标签;
S423:确定对应所述特征标签的搜索次数n,所述目标地域全部用户的数量i,得到所述目标地域全部用户对应所述特征标签T的基础兴趣强度T0=n/i;
S424:获取所述目标地域有对所述目标商品搜索记录的用户数量j以及每个所述有对所述目标商品搜索记录的用户对所述目标商品对应所述特征标签T的兴趣强度Tj;
S425:所述目标地域兴趣强度子模型中对所述目标商品对应所述特征标签T的兴趣强度其中k为大于等于1小于n的正整数。
本发明的另一方面提出了一种跨境电商数据处理系统,包括:
统一商品模型特征框架获取单元,用于从数据库中获取统一商品模型特征框架,所述统一商品模型特征框架包括商品外观属性特征指标、商品品类属性特征指标、商品定位属性特征指标以及商品功能属性特征指标中的至少一个;
目标地域商品模型构建单元,用于从数据库中获取目标地域用户与目标商品关联的搜索记录,并从所述搜索记录中提取搜索关键词,将所述搜索关键词与所述统一商品模型特征框架中的特征指标进行匹配以构建所述目标商品的目标地域商品模型;
兴趣强度子模型构建单元,用于根据所述目标商品的目标地域商品模型建立所述目标商品的用户兴趣强度子模型以及地域兴趣强度子模型;
兴趣强度参数计算单元,用于根据所述目标地域用户与目标商品关联的搜索记录计算得到所述用户兴趣强度子模型以及地域兴趣强度子模型的兴趣强度参数并写入数据库。
进一步的,在上述跨境电商数据处理系统中,所述目标地域商品模型构建单元包括:
核心关键词提取子单元,用于对所述搜索关键词进行分词、去噪以及标准化处理后提取核心关键词;
特征指标匹配子单元,用于将所述核心关键词输入预先训练好的商品特征指标识别模型中进行匹配以获取所述核心关键词对应的特征指标;
特征标签确定子单元,用于将所述核心关键词确定为所述目标商品对应所述特征指标的特征标签。
进一步的,在上述跨境电商数据处理系统中,所述兴趣强度参数计算单元包括:
用户兴趣强度计算子单元,用于根据同一用户对同一所述目标商品的搜索次数、搜索频率以及多次搜索间的时间间隔计算得到所述用户兴趣强度子模型的兴趣强度参数。
进一步的,在上述跨境电商数据处理系统中,所述用户兴趣强度计算子单元包括:
第一关联记录提取子模块,用于获取目标用户的全部搜索记录,从目标用户的全部搜索记录中提取与目标商品相关联的搜索记录;
第一特征标签确定子模块,用于确定所述目标用户对所述目标商品的每一个搜索关键词在所述目标地域商品模型中对应的特征标签;
第一基础兴趣强度计算子模块,用于如所述搜索关键词在所述目标地域商品模型中没有对应的特征标签,执行所述步骤S210到S230;如所述搜索关键词在所述目标地域商品模型中有对应的特征标签T,确定对应所述特征标签的搜索次数n,得到所述目标用户对应所述特征标签T的基础兴趣强度T0=n;
搜索日期确定子模块,用于当n>1时,确定所述目标用户对应所述特征标签T的n次搜索记录的搜索日期是否为同一天;
第一兴趣强度计算子模块,用于是同一天则所述目标用户对所述目标商品对应所述特征标签T的兴趣强度T=T0,不是同一天则获取所述目标用户对应所述特征标签T的n次搜索记录中每一次搜索日期相对于下一次搜索日期的时间间隔Dn,当Dn小于预设值D0时,当次搜索的兴趣强度增益值为Tn=1,当Dn小于预设值D0时,当次搜索的兴趣强度增益值为Tn=1/Dn,所述目标用户对所述目标商品对应所述特征标签T的兴趣强度
进一步的,在上述跨境电商数据处理系统中,所述兴趣强度计算子模块还用于获取所述所述目标用户对所述目标商品对应所述特征标签T最后一次搜索日期与当前日期的时间间隔Dm,所述目标用户对所述目标商品对应所述特征标签T的兴趣强度 其中α<1,其中α为用户兴趣强度衰减系数。
进一步的,在上述跨境电商数据处理系统中,所述兴趣强度参数计算单元包括:
地域兴趣强度计算子单元,根据所述目标地域的用户对同一所述目标商品的搜索次数、搜索频率以及每个所述目标地域的用户的用户兴趣强度子模型的兴趣强度参数计算得到所述地域兴趣强度子模型的兴趣强度参数。
进一步的,在上述跨境电商数据处理系统中,所述地域兴趣强度计算子单元包括:
第二关联记录提取子模块,用于获取目标地域与目标商品相关联的全部搜索记录;
第二特征标签确定子模块,用于确定所述目标地域全部用户对所述目标商品的每一个搜索关键词在所述目标地域商品模型中对应的特征标签;
第二基础兴趣强度计算子模块,用于确定对应所述特征标签的搜索次数n,所述目标地域全部用户的数量i,得到所述目标地域全部用户对应所述特征标签T的基础兴趣强度T0=n/i;
第二兴趣强度计算子模块,用于获取所述目标地域有对所述目标商品搜索记录的用户数量j以及每个所述有对所述目标商品搜索记录的用户对所述目标商品对应所述特征标签T的兴趣强度Tj,所述目标地域兴趣强度子模型中对所述目标商品对应所述特征标签T的兴趣强度其中k为大于等于1小于n的正整数。
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
依照本发明的实施例如上文所述,这些实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施例。显然,根据以上描述,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地利用本发明以及在本发明基础上的修改使用。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (10)
1.一种跨境电商数据处理方法,其特征在于,包括:
S100:从数据库中获取统一商品模型特征框架,所述统一商品模型特征框架包括商品外观属性特征指标、商品品类属性特征指标、商品定位属性特征指标以及商品功能属性特征指标中的至少一个;
S200:从数据库中获取目标地域用户与目标商品关联的搜索记录,并从所述搜索记录中提取搜索关键词,将所述搜索关键词与所述统一商品模型特征框架中的特征指标进行匹配以构建所述目标商品的目标地域商品模型,所述目标地域商品模型包括用户兴趣强度子模型和地域兴趣强度子模型;
S300:根据所述目标商品的目标地域商品模型建立所述目标商品的用户兴趣强度子模型以及地域兴趣强度子模型,所述用户兴趣强度子模型由每个用户各自对所述目标地域商品模型中的每个特征标签的兴趣强度组成,所述地域兴趣强度子模型由所述目标地域所有用户对对所述目标地域商品模型中的每个特征标签的兴趣强度组成;
S400:根据所述目标地域用户与目标商品关联的搜索记录计算得到所述用户兴趣强度子模型以及地域兴趣强度子模型的兴趣强度参数并写入数据库。
2.根据权利要求1所述的跨境电商数据处理方法,其特征在于,所述步骤S200具体包括:
S210:对所述搜索关键词进行分词、去噪以及标准化处理后提取核心关键词;
S220:将所述核心关键词输入预先训练好的商品特征指标识别模型中进行匹配以获取所述核心关键词对应的特征指标;
S230:将所述核心关键词确定为所述目标商品对应所述特征指标的特征标签。
3.根据权利要求2所述的跨境电商数据处理方法,其特征在于,所述步骤S400具体包括:
S410:根据同一用户对同一所述目标商品的搜索次数、搜索频率以及多次搜索间的时间间隔计算得到所述用户兴趣强度子模型的兴趣强度参数。
4.根据权利要求3所述的跨境电商数据处理方法,其特征在于,所述步骤S410具体包括:
S411:获取目标用户的全部搜索记录,从目标用户的全部搜索记录中提取与目标商品相关联的搜索记录;
S412:确定所述目标用户对所述目标商品的每一个搜索关键词在所述目标地域商品模型中对应的特征标签;
S413:如所述搜索关键词在所述目标地域商品模型中没有对应的特征标签,执行所述步骤S210到S230;如所述搜索关键词在所述目标地域商品模型中有对应的特征标签T,确定对应所述特征标签的搜索次数n,得到所述目标用户对应所述特征标签T的基础兴趣强度T0=n;
S414:当n>1时,确定所述目标用户对应所述特征标签T的n次搜索记录的搜索日期是否为同一天;
S415:是同一天则所述目标用户对所述目标商品对应所述特征标签T的兴趣强度TI=T0,否则所述目标用户对所述目标商品对应所述特征标签T的兴趣强度,其中k为大于等于1小于n的正整数。
5.根据权利要求1至2任一项所述的跨境电商数据处理方法,其特征在于,所述步骤S400还包括:
S420:根据所述目标地域的用户对同一所述目标商品的搜索次数、搜索频率以及每个所述目标地域的用户的用户兴趣强度子模型的兴趣强度参数计算得到所述地域兴趣强度子模型的兴趣强度参数。
6.一种跨境电商数据处理系统,其特征在于,包括:
统一商品模型特征框架获取单元,用于从数据库中获取统一商品模型特征框架,所述统一商品模型特征框架包括商品外观属性特征指标、商品品类属性特征指标、商品定位属性特征指标以及商品功能属性特征指标中的至少一个;
目标地域商品模型构建单元,用于从数据库中获取目标地域用户与目标商品关联的搜索记录,并从所述搜索记录中提取搜索关键词,将所述搜索关键词与所述统一商品模型特征框架中的特征指标进行匹配以构建所述目标商品的目标地域商品模型,所述目标地域商品模型包括用户兴趣强度子模型和地域兴趣强度子模型;
兴趣强度子模型构建单元,用于根据所述目标商品的目标地域商品模型建立所述目标商品的用户兴趣强度子模型以及地域兴趣强度子模型,所述用户兴趣强度子模型由每个用户各自对所述目标地域商品模型中的每个特征标签的兴趣强度组成,所述地域兴趣强度子模型由所述目标地域所有用户对对所述目标地域商品模型中的每个特征标签的兴趣强度组成;
兴趣强度参数计算单元,用于根据所述目标地域用户与目标商品关联的搜索记录计算得到所述用户兴趣强度子模型以及地域兴趣强度子模型的兴趣强度参数并写入数据库。
7.根据权利要求6所述的跨境电商数据处理系统,其特征在于,所述目标地域商品模型构建单元包括:
核心关键词提取子单元,用于对所述搜索关键词进行分词、去噪以及标准化处理后提取核心关键词;
特征指标匹配子单元,用于将所述核心关键词输入预先训练好的商品特征指标识别模型中进行匹配以获取所述核心关键词对应的特征指标;
特征标签确定子单元,用于将所述核心关键词确定为所述目标商品对应所述特征指标的特征标签。
8.根据权利要求7所述的跨境电商数据处理系统,其特征在于,所述兴趣强度参数计算单元包括:
用户兴趣强度计算子单元,用于根据同一用户对同一所述目标商品的搜索次数、搜索频率以及多次搜索间的时间间隔计算得到所述用户兴趣强度子模型的兴趣强度参数。
9.根据权利要求8所述的跨境电商数据处理系统,其特征在于,所述用户兴趣强度计算子单元包括:
第一关联记录提取子模块,用于获取目标用户的全部搜索记录,从目标用户的全部搜索记录中提取与目标商品相关联的搜索记录;
第一特征标签确定子模块,用于确定所述目标用户对所述目标商品的每一个搜索关键词在所述目标地域商品模型中对应的特征标签;
第一基础兴趣强度计算子模块,用于如所述搜索关键词在所述目标地域商品模型中没有对应的特征标签,调用所述核心关键词提取子单元、特征指标匹配子单元以及特征标签确定子单元;如所述搜索关键词在所述目标地域商品模型中有对应的特征标签T,确定对应所述特征标签的搜索次数n,得到所述目标用户对应所述特征标签T的基础兴趣强度T0=n;
搜索日期确定子模块,用于当n>1时,确定所述目标用户对应所述特征标签T的n次搜索记录的搜索日期是否为同一天;
第一兴趣强度计算子模块,用于是同一天则所述目标用户对所述目标商品对应所述特征标签T的兴趣强度TI= T0,否则所述目标用户对所述目标商品对应所述特征标签T的兴趣强度,其中k为大于等于1小于n的正整数。
10.根据权利要求6至7任一项所述的跨境电商数据处理系统,其特征在于,所述兴趣强度参数计算单元包括:
地域兴趣强度计算子单元,根据所述目标地域的用户对同一所述目标商品的搜索次数、搜索频率以及每个所述目标地域的用户的用户兴趣强度子模型的兴趣强度参数计算得到所述地域兴趣强度子模型的兴趣强度参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210169833.5A CN114547459B (zh) | 2022-02-23 | 2022-02-23 | 一种跨境电商数据处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210169833.5A CN114547459B (zh) | 2022-02-23 | 2022-02-23 | 一种跨境电商数据处理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114547459A CN114547459A (zh) | 2022-05-27 |
CN114547459B true CN114547459B (zh) | 2023-10-31 |
Family
ID=81677366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210169833.5A Active CN114547459B (zh) | 2022-02-23 | 2022-02-23 | 一种跨境电商数据处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114547459B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118365404A (zh) * | 2023-08-16 | 2024-07-19 | 杭州阿里巴巴海外网络科技有限公司 | 提供商品对象信息的方法及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102147795A (zh) * | 2010-02-05 | 2011-08-10 | 北京四维图新科技股份有限公司 | 兴趣点检索方法、兴趣点检索装置和导航系统 |
CN102334118A (zh) * | 2010-11-29 | 2012-01-25 | 华为技术有限公司 | 基于用户兴趣学习的个性化广告推送方法与系统 |
CN102792330A (zh) * | 2010-03-16 | 2012-11-21 | 日本电气株式会社 | 兴趣度测量系统,兴趣度测量装置,兴趣度测量方法和兴趣度测量程序 |
CN104462385A (zh) * | 2014-12-10 | 2015-03-25 | 山东科技大学 | 一种基于用户兴趣模型的电影个性化相似度计算方法 |
CN109816421A (zh) * | 2018-12-13 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 广告机投放内容控制方法、装置、计算机设备及存储介质 |
KR20210074493A (ko) * | 2019-12-12 | 2021-06-22 | 엔에이치엔 주식회사 | 지역 기반의 선호 상품 파라미터에 기초한 상품 제공방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9734251B2 (en) * | 2010-01-12 | 2017-08-15 | Excalibur Ip, Llc | Locality-sensitive search suggestions |
-
2022
- 2022-02-23 CN CN202210169833.5A patent/CN114547459B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102147795A (zh) * | 2010-02-05 | 2011-08-10 | 北京四维图新科技股份有限公司 | 兴趣点检索方法、兴趣点检索装置和导航系统 |
CN102792330A (zh) * | 2010-03-16 | 2012-11-21 | 日本电气株式会社 | 兴趣度测量系统,兴趣度测量装置,兴趣度测量方法和兴趣度测量程序 |
CN102334118A (zh) * | 2010-11-29 | 2012-01-25 | 华为技术有限公司 | 基于用户兴趣学习的个性化广告推送方法与系统 |
CN104462385A (zh) * | 2014-12-10 | 2015-03-25 | 山东科技大学 | 一种基于用户兴趣模型的电影个性化相似度计算方法 |
CN109816421A (zh) * | 2018-12-13 | 2019-05-28 | 深圳壹账通智能科技有限公司 | 广告机投放内容控制方法、装置、计算机设备及存储介质 |
KR20210074493A (ko) * | 2019-12-12 | 2021-06-22 | 엔에이치엔 주식회사 | 지역 기반의 선호 상품 파라미터에 기초한 상품 제공방법 |
Non-Patent Citations (2)
Title |
---|
互联网信息资源用户获取优化推送仿真研究;崔艳萍 等;计算机仿真;第34卷(第07期);273-276+280 * |
数据概化分析在电子商务网站中的应用;赵双萍;甘肃科技(第02期);38-39 * |
Also Published As
Publication number | Publication date |
---|---|
CN114547459A (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107748754B (zh) | 一种知识图谱完善方法和装置 | |
CN111369318B (zh) | 一种基于商品知识图谱特征学习的推荐方法及系统 | |
CN107705066B (zh) | 一种商品入库时信息录入方法及电子设备 | |
Chen et al. | Survey of preference elicitation methods | |
Sinha et al. | An integrated approach toward the spatial modeling of perceived customer value | |
CN110246011B (zh) | 可解释时尚服装个性化推荐方法 | |
JP3597370B2 (ja) | 文書処理装置および記録媒体 | |
US8326890B2 (en) | System and method for assisting computer users to search for and evaluate products and services, typically in a database | |
CN107833082B (zh) | 一种商品图片的推荐方法和装置 | |
US20090198593A1 (en) | Method and apparatus for comparing entities | |
US20160343004A1 (en) | Process journey sentiment analysis | |
CN114547459B (zh) | 一种跨境电商数据处理方法及系统 | |
CN116739836B (zh) | 一种基于知识图谱的餐饮数据分析方法及系统 | |
CN112163160A (zh) | 基于知识图谱的敏感识别方法 | |
Yudhistyra et al. | Using big data analytics for decision making: analyzing customer behavior using association rule mining in a gold, silver, and precious metal trading company in Indonesia | |
CN115392947A (zh) | 需求量预测方法以及装置 | |
CN113744019A (zh) | 一种商品推荐方法、装置、设备及存储介质 | |
Yu et al. | The Related Techniques of content-based image retrieval | |
CN115641179A (zh) | 信息推送方法、装置及电子设备 | |
Gupta et al. | Research Article Private Brands Waiting to Be Purchased-the Store Image Story | |
CN112884558A (zh) | 基于特征识别和线上线下联动的电子商务平台商品数据库建立方法 | |
KR101498944B1 (ko) | 상품 판매 업체 관련 글 판단 방법 및 그 장치 | |
WO2004027668A1 (ja) | 不動産共同購入マッチングシステム | |
CN115131108A (zh) | 一种电商商品筛选系统 | |
JP7290304B2 (ja) | 検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |