CN114880456A - 应用于数字化经济的跨境电商大数据分析方法及系统 - Google Patents
应用于数字化经济的跨境电商大数据分析方法及系统 Download PDFInfo
- Publication number
- CN114880456A CN114880456A CN202210371236.0A CN202210371236A CN114880456A CN 114880456 A CN114880456 A CN 114880456A CN 202210371236 A CN202210371236 A CN 202210371236A CN 114880456 A CN114880456 A CN 114880456A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- feedback knowledge
- user
- feedback
- user feedback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了应用于数字化经济的跨境电商大数据分析方法及系统,通过挖掘跨境电商业务大数据的场景化业务反馈知识集,并确定场景化业务反馈知识集中关联场景业务反馈知识集的目标反馈知识单元,并通过确定的共性知识向量进行反馈偏好的联合分析,从而尽可能减少跨境电商业务大数据中的干扰数据的影响。通过减少跨境电商业务大数据中的干扰数据的影响,能够减少对跨境电商业务大数据的用户兴趣分析难度。在本技术方案中,通过确定目标反馈知识单元,以通过目标反馈知识单元的偏好描述值确定共性知识向量,这样可以实现不同电商业务场景的用户反馈知识集的联合分析,尽可能细致地挖掘用户兴趣短语,确保用户兴趣短语挖掘的精度和可信度。
Description
技术领域
本申请涉及大数据技术领域,尤其涉及一种应用于数字化经济的跨境电商大数据分析方法及系统。
背景技术
随着时代的发展,信息技术逐渐成为发展的主流,数字化、智能化推动社会经济快速发展。打造数字化经济已是当下大力发展的重点。在未来,智能、云计算、数字化等主线将主导大部分行业。跨境电商作为数字化经济时代下的产物,跨境电商可以理解为跨境电子商务,主要是指分属于不同国家和地区的不同电子商务交易人群通过国内或国外电子商务平台进行交易且通过电子账单支付和贸易结算最终完成交易的一种国际间交易方式。鉴于灵活性以及无视时空限制等优点,跨境电商已然撼动了传统的线下商务模式。
在跨境电商的发展过程中,为了进一步优化跨境电商的服务质量,相关技术着眼于跨境电商的用户大数据分析,然而在实际的用户大数据分析和挖掘过程中,传统的大数据挖掘技术容易受到跨境电商场景的干扰,并且难以对不同的电商业务场景进行综合挖掘,这样难以保障大数据挖掘的精度和可信度。
发明内容
本申请的一个目的是提供一种应用于数字化经济的跨境电商大数据分析方法及系统。
本申请的技术方案是通过如下至少部分实施例实现的。
一种应用于数字化经济的跨境电商大数据分析方法,应用于跨境电商大数据系统,该方法至少包括:调取待进行用户兴趣分析的跨境电商业务大数据,并挖掘所述待进行用户兴趣分析的跨境电商业务大数据的场景化业务反馈知识集;确定所述场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元的偏好描述值,获得不少于一组偏好描述值;通过所述不少于一组偏好描述值确定所述场景化业务反馈知识集中每个电商业务场景的用户反馈知识集的共性知识向量;所述共性知识向量旨在反映所述目标反馈知识单元之间的差异程度;结合所述每个电商业务场景的用户反馈知识集的共性知识向量对所述待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集。
应用于本申请实施例,通过挖掘跨境电商业务大数据的场景化业务反馈知识集,并确定场景化业务反馈知识集中关联场景业务反馈知识集的目标反馈知识单元,并根据目标反馈知识单元的偏好描述值确定目标反馈知识单元之间的共性知识向量,以通过共性知识向量进行反馈偏好的联合分析,从而尽可能减少跨境电商业务大数据中的干扰数据的影响。通过减少跨境电商业务大数据中的干扰数据的影响,能够减少对跨境电商业务大数据的用户兴趣分析难度。在本技术方案中,通过确定目标反馈知识单元,以通过目标反馈知识单元的偏好描述值确定共性知识向量,这样可以实现不同电商业务场景的用户反馈知识集的联合分析,从而尽可能细致地挖掘用户兴趣短语,确保用户兴趣短语挖掘的精度和可信度。
对于一些可独立实施的设计思路而言,所述结合所述每个电商业务场景的用户反馈知识集的共性知识向量对所述待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集,包括:将所述共性知识向量与所对应的电商业务场景的用户反馈知识集中目标反馈知识单元的基础偏好描述值进行整理,获得各电商业务场景的用户反馈知识集的目标全局倾向性反馈;对各电商业务场景的用户反馈知识集的目标全局倾向性反馈进行反馈字段合并,并通过完成合并的反馈文本对所述待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集。
应用于本申请实施例,在将共性知识向量与每个电商业务场景的用户反馈知识集中目标反馈知识单元的基础偏好描述值进行整理,获得目标全局倾向性反馈之后,利用反馈知识单元的整理能够考虑不同电商业务场景之间的互动关联性和影响性从而实现多电商业务场景的用户反馈的联合分析。如此设计,可以避免用户兴趣短语抽取出现遗漏,从而保障用户兴趣短语抽取的完整性和可靠性。
对于一些可独立实施的设计思路而言,所述确定所述场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元,包括:在每组关联场景业务反馈知识集中挑选目标反馈知识单元,其中,所述目标反馈知识单元包括:热力型反馈知识单元和/或用户兴趣短语的区分型反馈知识单元,其中,所述用户兴趣短语为所述待进行用户兴趣分析的跨境电商业务大数据中所蕴藏的用户兴趣短语。
应用于本申请实施例,鉴于待进行用户兴趣分析的跨境电商业务大数据中价值数据和噪声数据的比例难以保障用户兴趣短语挖掘的质量,基于此,通过确定热力型反馈知识单元和/或用户兴趣短语的区分型反馈知识单元,能够削弱噪声数据的干扰,从而提高用户兴趣短语抽取的质量。
对于一些可独立实施的设计思路而言,所述关联场景业务反馈知识集包括:第一电商业务场景对应的用户反馈知识集和第二电商业务场景对应的用户反馈知识集,所述第一电商业务场景对应的用户反馈知识集的知识特征识别度低于所述第二电商业务场景对应的用户反馈知识集的知识特征识别度;所述确定所述场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元的偏好描述值,包括:通过所述第一电商业务场景对应的用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集,确定热力型用户反馈知识集;通过所述热力型用户反馈知识集确定所述目标反馈知识单元,并确定所述目标反馈知识单元的偏好描述值。
应用于本申请实施例,通过确定热力型用户反馈知识集来确定目标反馈知识单元的思路,可以尽可能准确可靠地从场景化业务反馈知识集中确定目标反馈知识单元,继而保障用户兴趣短语抽取操作的准确性和效率。
对于一些可独立实施的设计思路而言,所述通过所述第一电商业务场景对应的用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集,确定热力型用户反馈知识集,包括:分别对所述第一电商业务场景对应的用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集进行知识单元抽样;对完成知识单元抽样的第二电商业务场景对应的用户反馈知识集进行反馈知识更新;对完成知识单元抽样的第一电商业务场景对应的用户反馈知识集和完成反馈知识更新的第二电商业务场景对应的用户反馈知识集进行反馈字段合并操作,获得已合并反馈文本知识;依据窗口滑动策略对所述已合并反馈文本知识进行处理,获得所述热力型用户反馈知识集。
应用于本申请实施例,通过第一电商业务场景对应的用户反馈知识集和第二电商业务场景对应的用户反馈知识集进行知识单元抽样,能够精简用户反馈知识集的数据量,这样可以提高运算资源利用率;通过反馈知识更新,能够规范化不同电商业务场景下的用户反馈知识集,从而有助于反馈字段合并操作。在依据窗口滑动策略对已合并反馈文本知识进行处理的思路,可以精准定位具有分析价值的用户兴趣短语的偏好描述值的热力型用户反馈知识集。
对于一些可独立实施的设计思路而言,所述目标反馈知识单元包括:热力型反馈知识单元;所述通过所述热力型用户反馈知识集确定所述目标反馈知识单元,包括:对所述热力型用户反馈知识集进行识别优化操作,获得所述热力型反馈知识单元的第一个性化分布标签;对所述热力型用户反馈知识集和所述第一电商业务场景对应的用户反馈知识集进行局部聚焦优化,获得聚焦型用户反馈知识集;分别在所述聚焦型用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集中确定与所述第一个性化分布标签相匹配的反馈知识单元,获得所述热力型反馈知识单元。
应用于本申请实施例,通过识别优化操作可以可以对热力型反馈知识单元进行识别增强处理,从而保障第一个性化分布标签的精度,在根据第一个性化分布标签确定热力型反馈知识单元时,可以提高热力型反馈知识单元的捕捉准确性,保障大数据挖掘的质量。
对于一些可独立实施的设计思路而言,所述目标反馈知识单元包括:区分型反馈知识单元;所述通过所述热力型用户反馈知识集确定所述目标反馈知识单元,包括:通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行知识捕捉处理,获得所述待进行用户兴趣分析的跨境电商业务大数据中所蕴藏的用户兴趣短语的区分标识捕捉结果;确定所述区分标识捕捉结果中每个捕捉成员的命中指数,并通过所述命中指数确定所述区分型反馈知识单元的第二个性化分布标签;分别在所述第二电商业务场景对应的用户反馈知识集和所述第一电商业务场景对应的用户反馈知识集中确定与所述第二个性化分布标签相匹配的反馈知识单元,获得所述区分型反馈知识单元。
应用于本申请实施例,通过知识捕捉处理方法来获得区分标识捕捉结果的思路,针对待进行用户兴趣分析的跨境电商业务大数据中的深层次用户兴趣短语而言,可以获得精准的用户兴趣短语的区分标识捕捉结果。此外,基于命中指数来确定第二个性化分布标签,能够保障确定出的区分型反馈知识单元的可信度。
对于一些可独立实施的设计思路而言,所述通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行知识捕捉处理,获得所述待进行用户兴趣分析的跨境电商业务大数据中所蕴藏的用户兴趣短语的区分标识捕捉结果,包括:通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行噪声清洗,获得完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集;确定所述第一电商业务场景对应的用户反馈知识集的偏好描述值和完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集的偏好描述值之间的比较结果,并通过所述比较结果确定所述区分标识捕捉结果,其中,所述比较结果为所述区分标识捕捉结果的偏好描述值。
应用于本申请实施例,通过对较高特征识别度的用户反馈知识集进行噪声清洗,并根据较高特征识别度的用户反馈知识集的偏好描述值和完成噪声清洗的较高特征识别度的用户反馈知识集的偏好描述值之间的比较结果确定区分标识捕捉结果的思路,能够保障区分标识捕捉结果的准确性。
对于一些可独立实施的设计思路而言,所述通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行噪声清洗,获得完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集,包括:对所述热力型用户反馈知识集进行全局化精简操作,获得全局化精简知识集;借助所述全局化精简知识集对所述第一电商业务场景对应的用户反馈知识集进行噪声清洗,获得完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集。
对于一些可独立实施的设计思路而言,所述通过所述不少于一组偏好描述值确定所述场景化业务反馈知识集中每个电商业务场景的用户反馈知识集的共性知识向量,包括:对所述目标反馈知识单元的偏好描述值进行相关性系数确定,获得相关性确定结果;确定第一偏好描述值和所述相关性确定结果之间的指定运算数据,其中,所述第一偏好描述值为所述目标反馈知识单元中包括于所述场景化业务反馈知识集中第一电商业务场景对应的用户反馈知识集中的目标反馈知识单元的偏好描述值;对所述指定运算数据和第二偏好描述值进行向量化处理,获得所述共性知识向量,其中,所述第二偏好描述值为每组所述目标反馈知识单元中包括于所述场景化业务反馈知识集中第二电商业务场景对应的用户反馈知识集中的目标反馈知识单元的偏好描述值,所述第一电商业务场景对应的用户反馈知识集的知识特征识别度低于所述第二电商业务场景对应的用户反馈知识集的知识特征识别度。
应用于本申请实施例,通过共性知识向量来实现对场景化业务反馈知识集不同电商业务场景之间活动关联数据进行共享的思路,可以提高联合分析的完整性,从而保障用户兴趣短语挖掘的准确性。
对于一些可独立实施的设计思路而言,所述将所述共性知识向量与所述每个电商业务场景的用户反馈知识集中目标反馈知识单元的基础偏好描述值进行整理,获得所述每个电商业务场景的用户反馈知识集的目标全局倾向性反馈,包括:确定所述目标反馈知识单元的相对分布向量;通过所述相对分布向量在每个电商业务场景的用户反馈知识集中确定目标反馈知识单元;确定所述目标反馈知识单元的基础偏好描述值,并将所述共性知识向量和所述目标反馈知识单元的基础偏好描述值进行整理,获得所述目标全局倾向性反馈。
应用于本申请实施例,通过目标反馈知识单元的相对分布向量,将共性知识向量和所述共性知识向量的基础用户反馈知识进行整理的思路,能够从较低特征识别度的用户反馈知识集中确定出共性知识向量,继而提高反馈知识的整理效率。
一种跨境电商大数据系统,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。
附图说明
图1是示出可以实现本申请的实施例的跨境电商大数据系统的示意图。
图2是示出可以实现本申请的实施例的应用于数字化经济的跨境电商大数据分析方法的流程示意图。
图3是示出可以实现本申请的实施例的应用于数字化经济的跨境电商大数据分析方法的应用环境的架构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
图1是示出可以实现本申请的实施例的跨境电商大数据系统100的一种通信配置的框图,跨境电商大数据系统100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本申请实施例中应用于数字化经济的跨境电商大数据分析方法的处理器102。
图2是示出可以实现本申请的实施例的应用于数字化经济的跨境电商大数据分析方法的流程示意图,应用于数字化经济的跨境电商大数据分析方法可以通过图1所示的跨境电商大数据系统100实现,进一步可以包括以下相关步骤所描述的技术方案。
STEP101、调取待进行用户兴趣分析的跨境电商业务大数据,并挖掘所述待进行用户兴趣分析的跨境电商业务大数据的场景化业务反馈知识集。
对于本申请实施例而言,可利用梯度模型(比如金字塔模型)挖掘待进行用户兴趣分析的跨境电商业务大数据的场景化业务反馈知识集。而场景化业务反馈知识集中的每个电商业务场景的用户反馈知识集对应的规模存在差异(或维度存在差异),基于此,场景化业务反馈知识集还可以理解为多规模的用户反馈知识集(或者多维度的用户反馈知识集)。
对于本示例而言,待进行用户兴趣分析的跨境电商业务大数据可以理解为符合挖掘要求的跨境电商业务大数据,例如:跨境电商支付数据、跨境电商用户行为数据、跨境电商业务交互数据等。
此外,场景化业务反馈知识集可以理解为场景化业务反馈特征关系网,还可以理解为用户在不同电商业务场景下的反馈特征组成的知识图谱或者知识库。而电商业务场景可以涉及实时业务场景、延时业务场景、双端业务场景或者多端业务场景等,在此不作限定。
STEP103、确定所述场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元的偏好描述值。
对于本申请实施例而言,在获得场景化业务反馈知识集之后,对于场景化业务反馈知识集中任一关联电商业务场景的用户反馈知识集,确定目标反馈知识单元,并确定目标反馈知识单元的偏好描述值。
举例而言,关联场景业务反馈知识集包括第一电商业务场景对应的用户反馈知识集和第二电商业务场景对应的用户反馈知识集,其中,第一电商业务场景对应的用户反馈知识集可以理解为较高特征识别度的用户反馈知识集,第二电商业务场景对应的用户反馈知识集可以理解为较低特征识别度的用户反馈知识集。目标反馈知识单元可以理解为较高特征识别度的用户反馈知识集和较低特征识别度的用户反馈知识集中相配对的反馈知识单元。其中,较高特征识别度的用户反馈知识集的维度低于较低特征识别度的用户反馈知识集的维度。其中,相配对的反馈知识单元可以理解为较高特征识别度的用户反馈知识集和较低特征识别度的用户反馈知识集中旨在反映待进行用户兴趣分析的跨境电商业务大数据中相同用户兴趣短语的反馈知识单元。
对于本示例而言,关联场景业务反馈知识集可以理解为场景化业务反馈知识集中邻近/类似的电商业务场景对应的反馈知识集。目标反馈知识单元可以理解为场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间的配对业务反馈内容或者配对知识单元。而目标反馈知识单元的偏好描述值可以理解为配对业务反馈内容或者配对知识单元所对应的配对倾向指数值/特征值,其取值范围通常为0~1,这样可以在保障分析精度的前提下减少系统的资源开销。
STEP105、通过所述不少于一组偏好描述值确定所述场景化业务反馈知识集中每个电商业务场景的用户反馈知识集的共性知识向量;所述共性知识向量旨在反映所述目标反馈知识单元之间的差异程度。
对于本申请实施例而言,共性知识向量可以理解为场景化业务反馈知识集中每个电商业务场景的用户反馈知识集的相似性知识特征,而差异程度也可以理解为共性度或者类似程度。
STEP107、结合所述每个电商业务场景的用户反馈知识集的共性知识向量对所述待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集。
在一些示例中,对待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作可以理解为待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣倾向抽取处理,而用户兴趣短语集可以包括业务操作流程偏好对应的兴趣短语(比如“尽量简洁”、“指示性强”),也可以包括个人信息防护偏好对应的兴趣短语(比如“隐藏个人画像”、“屏蔽大数据杀熟式推送”),还可以包括电商产品的扩充操作对应的兴趣短语(比如“上架XXX产品”)。
对于本申请实施例而言,在确定出目标反馈知识单元的偏好描述值之后,可以结合目标反馈知识单元的偏好描述值确定共性知识向量,在将共性知识向量与目标反馈知识单元的基础偏好描述值(比如,原始偏好描述值)进行整理之后,能够实现通过共性知识向量将较高特征识别度的用户反馈知识集中的潜在关联需求共享到较低特征识别度的用户反馈知识集中。
对于本申请实施例而言,可以在通过基础梯度模型对待进行用户兴趣分析的跨境电商业务大数据进行处理之后,获得基础场景化业务反馈知识集,基础场景化业务反馈知识集的偏好描述值可以为基础偏好描述值。
可以理解的是,对于本申请实施例而言,假设待进行用户兴趣分析的跨境电商业务大数据的场景化业务反馈知识集的电商业务场景数目为Q,若其中一个关联场景业务反馈知识集为Knowledge Graph_1和Knowledge Graph_1_1,通过以上的思路进行处理,获得Knowledge Graph_1_1用户反馈知识集的共性知识向量,从而可以获得每个电商业务场景的共性知识向量。然后根据每个电商业务场景的用户反馈知识集的共性知识向量对待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集。
对于本申请实施例而言,首先调取待进行用户兴趣分析的跨境电商业务大数据,其次,通过梯度模型挖掘待进行用户兴趣分析的跨境电商业务大数据的场景化业务反馈知识集。然后,针对场景化业务反馈知识集中不少于一组关联场景业务反馈知识集,确定关联场景业务反馈知识集之间目标反馈知识单元以及目标反馈知识单元的偏好描述值。
对于一种可独立实施的技术方案而言,STEP103中所记录的确定所述场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元,示例性的可以包括如下内容:在每组关联场景业务反馈知识集中挑选目标反馈知识单元,其中,所述目标反馈知识单元包括:热力型反馈知识单元和/或用户兴趣短语的区分型反馈知识单元,其中,所述用户兴趣短语为所述待进行用户兴趣分析的跨境电商业务大数据中所蕴藏的用户兴趣短语。
对于本申请实施例而言,针对待进行用户兴趣分析的跨境电商业务大数据,一种思路可以是通过结合用户行为热力值差异程度的特征短语抽取思路对待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,然而在通过结合用户行为热力值差异程度的特征短语抽取思路在进行用户兴趣短语抽取时,鉴于待进行用户兴趣分析的跨境电商业务大数据中价值数据和噪声数据的比例难以保障用户兴趣短语挖掘的质量,而应用本申请的相关实施例,在每组关联场景业务反馈知识集之间挑选目标反馈知识单元,进而根据该目标反馈知识单元的偏好描述值来进行反馈知识的联动分析。基于上述方案,能够尽可能减少噪声数据对价值数据的影响,从而提高系统资源利用率,还能够提高用户兴趣短语抽取的精度。对于本申请实施例而言,在确定目标反馈知识单元时,可以根据关联场景业务反馈知识集确定热力型反馈知识单元(显著知识单元)和/或用户兴趣短语的区分型反馈知识单元(用于进行用户兴趣短语区分的知识单元)。
对于另一种可独立实施的技术方案而言,STEP103所记录的确定所述场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元的偏好描述值,还可以包括如下描述内容。
STEP1031、根据第一电商业务场景对应的用户反馈知识集和第二电商业务场景对应的用户反馈知识集,确定热力型用户反馈知识集;所述关联场景业务反馈知识集包括:第一电商业务场景对应的用户反馈知识集和第二电商业务场景对应的用户反馈知识集,所述第一电商业务场景对应的用户反馈知识集的知识特征识别度低于所述第二电商业务场景对应的用户反馈知识集的知识特征识别度。
STEP1032,通过所述热力型用户反馈知识集确定所述目标反馈知识单元,并确定所述目标反馈知识单元的偏好描述值。
对于本申请实施例而言,若关联场景业务反馈知识集中的较高特征识别度的用户反馈知识集(可以理解为第一电商业务场景对应的用户反馈知识集)标记为KnowledgeGraph_1,关联场景业务反馈知识集中的较低特征识别度的用户反馈知识集(可以理解为第二电商业务场景对应的用户反馈知识集)标记为Knowledge Graph_1_1。这时,可以根据较高特征识别度的用户反馈知识集Knowledge Graph_1和较低特征识别度的用户反馈知识集Knowledge Graph_1_1确定热力型用户反馈知识集标记为Knowledge set_1。可以理解的是,对于本申请实施例而言,热力型用户反馈知识集旨在反映待进行用户兴趣分析的跨境电商业务大数据中热力型电商业务交互事件的偏好描述值,该热力型电商业务交互事件为用户对待进行用户兴趣分析的跨境电商业务大数据中的关注点较高的业务交互事件。
其次,可以根据热力型用户反馈知识集Knowledge set_1和知识单元定位模块确定目标反馈知识单元的个性化分布标签(目标反馈知识单元在知识图谱中的定位标识),进而通过该个性化分布标签在较高特征识别度的用户反馈知识集Knowledge Graph_1和较低特征识别度的用户反馈知识集Knowledge Graph_1_1实施目标反馈知识单元的捕捉提取处理,从而获得目标反馈知识单元,并在较高特征识别度的用户反馈知识集KnowledgeGraph_1和较低特征识别度的用户反馈知识集Knowledge Graph_1_1中分别确定目标反馈知识单元的偏好描述值。
在一些示例中,可利用以下思路确定热力型用户反馈知识集,示例性的可以包括如下内容。
1)、分别对所述第一电商业务场景对应的用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集进行知识单元抽样;对完成知识单元抽样的第二电商业务场景对应的用户反馈知识集进行反馈知识更新。2)、对完成知识单元抽样的第一电商业务场景对应的用户反馈知识集和完成反馈知识更新的第二电商业务场景对应的用户反馈知识集进行反馈字段合并操作,获得已合并反馈文本知识。3)、依据窗口滑动策略对所述已合并反馈文本知识进行处理,获得所述热力型用户反馈知识集。
可以理解的是,首先可利用2*2的关键内容挖掘单元分别对较高特征识别度的用户反馈知识集(可以理解为第一电商业务场景对应的用户反馈知识集)Knowledge Graph_1和较低特征识别度的用户反馈知识集(可以理解为第二电商业务场景对应的用户反馈知识集)Knowledge Graph_1_1进行知识单元抽样,进一步的,知识单元抽样还可以理解为精简处理,降低用户反馈知识集的跨境电商场景数,这样可以提高运算资源利用率。然后,对完成知识单元抽样的较低特征识别度的用户反馈知识集Knowledge Graph_1_1进行反馈知识精简操作,获得完成反馈知识更新的较低特征识别度的用户反馈知识集,对于本申请实施例而言,对完成知识单元抽样的较低特征识别度的用户反馈知识集Knowledge Graph_1_1进行反馈知识精简操作可以理解为削弱完成知识单元抽样的较低特征识别度的用户反馈知识集Knowledge Graph_1_1的维度,使得完成知识单元抽样的较低特征识别度的用户反馈知识集Knowledge Graph_1_1的维度与较高特征识别度的用户反馈知识集KnowledgeGraph_1的维度相同。在维度相同之后,可以实施反馈字段合并的步骤。
然后,可利用合并算法对完成抽取操作后的较高特征识别度的用户反馈知识集Knowledge Graph_1和完成反馈知识更新的较低特征识别度的用户反馈知识集进行反馈字段合并,获得已合并反馈文本知识,然后,通过6*6的关键内容挖掘单元依据窗口滑动策略对已合并反馈文本知识进行处理,最后,通过标准化算法对以上处理后得到的内容进行标准化操作(比如归一化处理),获得热力型用户反馈知识集。
对于本申请实施例而言,通过对较高特征识别度的用户反馈知识集和较低特征识别度的用户反馈知识集进行知识单元抽样,能够精简用户反馈知识集的数据量,这样可以提高运算资源利用率;通过反馈知识更新,能够规范化不同电商业务场景下的用户反馈知识集,从而有助于反馈字段合并操作。在依据窗口滑动策略对已合并反馈文本知识进行处理的思路,可以精准定位具有分析价值的用户兴趣短语的偏好描述值的热力型用户反馈知识集。
对于一种可独立实施的技术方案而言,在目标反馈知识单元包括热力型反馈知识单元的前提下,以上STEP1032所记录的通过所述热力型用户反馈知识集确定所述目标反馈知识单元,可以包括以下内容。
STEP11、对所述热力型用户反馈知识集进行识别优化操作,获得所述热力型反馈知识单元的第一个性化分布标签。
STEP12、对所述热力型用户反馈知识集和所述第一电商业务场景对应的用户反馈知识集进行局部聚焦优化,获得聚焦型用户反馈知识集。
STEP13、分别在所述聚焦型用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集中确定与所述第一个性化分布标签相匹配的反馈知识单元,获得所述热力型反馈知识单元。
对于本申请实施例而言,在确定出热力型用户反馈知识集Knowledge set_1之后,可以将热力型用户反馈知识集Knowledge set_1和较高特征识别度的用户反馈知识集(可以理解为第一电商业务场景对应的用户反馈知识集)Knowledge Graph_1加载到知识单元定位模块中,而知识单元定位模块可以对热力型用户反馈知识集进行识别优化操作,比如可以通过最大池化处理的思路实现。
知识单元定位模块还可以对导入的用户反馈知识集(可以理解为热力型用户反馈知识集Knowledge set_1和较高特征识别度的用户反馈知识集Knowledge Graph_1)进行局部聚焦优化,获得聚焦型用户反馈知识集,标记为Knowledge Graph_1LYY。
对于本申请实施例而言,确定出聚焦型用户反馈知识集之后,可以依据第一个性化分布标签,在聚焦型用户反馈知识集和较低特征识别度的用户反馈知识集中确定与第一个性化分布标签相匹配的反馈知识单元,获得热力型反馈知识单元。
对于本申请实施例而言,通过识别优化操作可以可以对热力型反馈知识单元进行识别增强处理,从而保障第一个性化分布标签的精度在根据第一个性化分布标签确定热力型反馈知识单元时,可以提高热力型反馈知识单元的捕捉准确性,保障大数据挖掘的质量。
对于一种可独立实施的技术方案而言,在目标反馈知识单元包括区分型反馈知识单元的前提下,STEP1032所记录的通过所述热力型用户反馈知识集确定所述目标反馈知识单元,可以包括如下内容。
STEP21、通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行知识捕捉处理,获得所述待进行用户兴趣分析的跨境电商业务大数据中所蕴藏的用户兴趣短语的区分标识捕捉结果。
STEP22、确定所述区分标识捕捉结果中每个捕捉成员的命中指数,并通过所述命中指数确定所述区分型反馈知识单元的第二个性化分布标签。
STEP23,分别在所述第二电商业务场景对应的用户反馈知识集和所述第一电商业务场景对应的用户反馈知识集中确定与所述第二个性化分布标签相匹配的反馈知识单元,获得所述区分型反馈知识单元。
对于本申请实施例而言,在确定区分型反馈知识单元时,可以根据热力型用户反馈知识集Knowledge set_1对较高特征识别度的用户反馈知识集(可以理解为第一电商业务场景对应的用户反馈知识集)Knowledge Graph_1进行知识捕捉处理,从而通过知识捕捉处理的思路来进行区分标识捕捉,从而获得待进行用户兴趣分析的跨境电商业务大数据的差异性检测信息,可以理解为区分标识捕捉结果。然后,可以确定区分标识捕捉结果中每个捕捉成员的命中指数(置信度),该命中指数旨在反映每个捕捉成员处于区分界限可能性。最后,可以结合该命中指数从区分标识捕捉结果中挑选符合条件的捕捉成员作为区分型反馈知识单元,进而根据命中指数最大的A个捕捉成员确定区分型反馈知识单元的第二个性化分布标签label_DGZ,进一步地,A的取值可以基于真实需求进行设置。
进一步地,在确定出第二个性化分布标签label_DGZ之后,就可以分别在较低特征识别度的用户反馈知识集和较高特征识别度的用户反馈知识集中确定与第二个性化分布标签相匹配的反馈知识单元,获得所述区分型反馈知识单元。
可以理解的是,对于差异化用户反馈的挑选,并不是单纯通过Knowledge Graph_1或Knowledge Graph_1_1进行差异化分析,通过知识捕捉处理方法来获得区分标识捕捉结果的思路,针对待进行用户兴趣分析的跨境电商业务大数据中的深层次用户兴趣短语而言,可以获得精准的用户兴趣短语的区分标识捕捉结果。此外,基于命中指数来确定第二个性化分布标签,能够保障确定出的区分型反馈知识单元的可信度。
对于一种可独立实施的技术方案而言,STEP21所记录的通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行知识捕捉处理,获得所述待进行用户兴趣分析的跨境电商业务大数据中所蕴藏的用户兴趣短语的区分标识捕捉结果,包括以下内容。
STEP211、通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行噪声清洗,获得完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集。
对于本申请实施例而言,可利用平均池化思路对所述热力型用户反馈知识集进行全局化精简操作,获得全局化精简知识集。然后,借助所述全局化精简知识集P_Knowledgeset_2对所述较高特征识别度的用户反馈知识集(可以理解为第一电商业务场景对应的用户反馈知识集)Knowledge Graph_1进行噪声清洗(比如:平滑处理),获得完成噪声清洗的较高特征识别度的用户反馈知识集。举例而言,可利用平均池化思路对较高特征识别度的用户反馈知识集Knowledge Graph_1进行噪声清洗。
STEP212、确定所述第一电商业务场景对应的用户反馈知识集的偏好描述值和完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集的偏好描述值之间的比较结果,并通过所述比较结果确定所述区分标识捕捉结果,其中,所述比较结果为所述区分标识捕捉结果的偏好描述值。
对于本申请实施例而言,从较高特征识别度的用户反馈知识集Knowledge Graph_1中除去噪声清洗部分,获得的比较结果可以理解为区分标识捕捉结果的偏好描述值。
对于本申请实施例而言,通过对较高特征识别度的用户反馈知识集进行噪声清洗,并根据较高特征识别度的用户反馈知识集的偏好描述值和完成噪声清洗的较高特征识别度的用户反馈知识集的偏好描述值之间的比较结果确定区分标识捕捉结果的思路,能够保障区分标识捕捉结果的准确性。
对于本申请实施例而言,在依据以上的思路确定场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元的偏好描述值,可以根据偏好描述值确定所述场景化业务反馈知识集中每个电商业务场景的用户反馈知识集的共性知识向量,若关联场景业务反馈知识集包括:第一电商业务场景对应的用户反馈知识集和第二电商业务场景对应的用户反馈知识集,所述第一电商业务场景对应的用户反馈知识集的知识特征识别度低于所述第二电商业务场景对应的用户反馈知识集的知识特征识别度,基于此,以上步骤可以包括如下内容。
STEP1051、对目标反馈知识单元的偏好描述值进行相关性系数确定,获得相关性确定结果。
STEP1052、确定第一偏好描述值和所述相关性确定结果之间的指定运算数据,其中,所述第一偏好描述值为所述目标反馈知识单元中包括于所述场景化业务反馈知识集中第一电商业务场景对应的用户反馈知识集中的目标反馈知识单元的偏好描述值。
STEP1053、对所述指定运算数据和第二偏好描述值进行向量化处理,获得所述共性知识向量,其中,所述第二偏好描述值为每组所述目标反馈知识单元中包括于所述第二电商业务场景对应的用户反馈知识集中的目标反馈知识单元的偏好描述值。
对于本申请实施例而言,通过Pearson product-moment correlationcoefficient(皮尔森相关系数算法)对目标反馈知识单元的偏好描述值进行相关性系数确定,比如,相关性系数表示表示一个知识单元与其他知识单元之间的关联程度,换言之,对目标反馈知识单元的偏好描述值之间的关联程度。之后,可以将第一偏好描述值与相关性确定结果进行点积处理,获得指定运算数据。然后对所述指定运算数据和第二偏好描述值进行向量化处理,获得共性知识向量。
应用以上实施例,通过共性知识向量来实现对场景化业务反馈知识集不同电商业务场景之间活动关联数据进行共享的思路,可以提高联合分析的完整性,从而保障用户兴趣短语挖掘的准确性。
对于本申请实施例而言,在确定出每个电商业务场景的用户反馈知识集的共性知识向量之后,就可以结合所述每个电商业务场景的用户反馈知识集的共性知识向量对所述待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集,具体可以包括如下内容。
node1、将所述共性知识向量与所对应的电商业务场景的用户反馈知识集中目标反馈知识单元的基础偏好描述值进行整理,获得各电商业务场景的用户反馈知识集的目标全局倾向性反馈。
对于本申请实施例而言,所对应的电商业务场景的用户反馈知识集可以是针对一组关联场景业务反馈知识集而言,该组关联场景业务反馈知识集中的较低特征识别度的用户反馈知识集(或者,维度较大的用户反馈知识集)。
node2、对各电商业务场景的用户反馈知识集的目标全局倾向性反馈进行反馈字段合并,并通过完成合并的反馈文本对所述待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集。
对于本申请实施例而言,在将所述共性知识向量与所对应的电商业务场景的用户反馈知识集中目标反馈知识单元的基础偏好描述值进行整理,获得所述每个电商业务场景的用户反馈知识集的目标全局倾向性反馈(融合倾向性反馈/融合反馈描述)时,可以首先确定所述目标反馈知识单元的相对分布向量(相对分布区域或者单元定位情况);其次,通过所述相对分布向量在所对应的电商业务场景的用户反馈知识集中确定目标反馈知识单元;然后,获取目标反馈知识单元的基础偏好描述值,并将所述共性知识向量和目标反馈知识单元的基础偏好描述值进行整理,获得目标全局倾向性反馈。其中,在获得目标全局倾向性反馈之后,可以根据目标反馈知识单元的相对分布向量将目标全局倾向性反馈记录在每个电商业务场景的用户反馈知识集的基础用户反馈内容中。
对于本申请实施例而言,关联场景业务反馈知识集中的第一电商业务场景对应的用户反馈知识集标记为Knowledge Graph_1,关联场景业务反馈知识集中的第二电商业务场景对应的用户反馈知识集标记为Knowledge Graph_1_1。在依据以上的思路确定出第二电商业务场景对应的用户反馈知识集的目标全局倾向性反馈之后,可以将目标全局倾向性反馈确定为Knowledge Graph_1_1用户反馈知识集的偏好描述值实施针对下一电商业务场景的处理。比如,针对用户反馈知识集Knowledge Graph_1_1和Knowledge Graph_1_2,在这种情况下,可以将该目标全局倾向性反馈确定为该用户反馈知识集Knowledge Graph_1_1的偏好描述值,对用户反馈知识集Knowledge Graph_1_1和Knowledge Graph_1_2同样实施以上的过程,直到确定出场景化业务反馈知识集中每个电商业务场景的用户反馈知识集的目标全局倾向性反馈,之后,比如,可以对每个电商业务场景的用户反馈知识集的目标全局倾向性反馈进行反馈字段合并,并借助反馈字段合并之后的反馈内容进行用户兴趣短语抽取操作,获得用户兴趣短语集。
在一些可独立实施的实施例中,在获得用户兴趣短语集之后,该方法还可以包括如下内容:利用所述用户兴趣短语集,确定与所述待进行用户兴趣分析的跨境电商业务大数据对应的业务升级需求;依据所述业务升级需求对指定电商业务功能进行升级。
对于本申请实施例而言,可以利用相关需求挖掘规则对用户兴趣短语集进行挖掘,得到业务升级需求,上述需求挖掘规则可以是基于神经网络模型生成的挖掘策略或者挖掘算法,而业务升级需求可以通过特征短语或者特征字段的形式表达。例如,业务升级需求可以是“GUI界面模块简化需求”、“用户隐私信息保密需求”或者“强制推送拦截处理”。进一步地,跨境电商大数据系统可以根据业务升级需求进行针对性的电商业务功能的升级,从而提高电商业务的服务智能化程度。
在一些可独立实施的实施例中,利用所述用户兴趣短语集,确定与所述待进行用户兴趣分析的跨境电商业务大数据对应的业务升级需求,可以包括如下内容:对所述用户兴趣短语集进行兴趣导向特征提取,得到所述用户兴趣短语集对应的第一兴趣导向特征组;根据所述第一兴趣导向特征组进行服务需求特征字段挖掘,得到服务需求特征字段组;对所述服务需求特征字段组进行升级需求翻译,得到所述服务需求特征字段组对应的第一业务升级需求内容集。可以理解的是,通过进一步的兴趣导向特征提取,能够实现对用户兴趣短语集的兴趣导向挖掘汇总,从而得到精度和可信度更高的第一兴趣导向特征组,这样可以基于第一兴趣导向特征组进行服务需求特征字段挖掘,快速准确地定位服务需求特征字段组,继而通过升级需求翻译保障第一业务升级需求内容集确定的时效性。
在一些可独立实施的实施例中,在所述得到所述服务需求特征字段组对应的第一业务升级需求内容集之后,所述方法还包括:根据所述用户兴趣短语集中的用户兴趣短语子集进行服务需求特征字段挖掘,得到关联的第二业务升级需求内容集;根据所述第一业务升级需求内容集和所述第二业务升级需求内容集,得到关联的第三业务升级需求内容集。如此设计,可以尽可能地丰富业务升级需求内容集。
在一些可独立实施的实施例中,
在一些可独立实施的实施例中,所述对用户兴趣短语集进行兴趣导向特征提取,得到所述用户兴趣短语集对应的第一兴趣导向特征组,包括:对用户兴趣短语集进行词向量抽样,得到所述用户兴趣短语集对应的第一倾向性词向量组;对所述第一倾向性词向量组进行挖掘处理,得到所述用户兴趣短语集对应的第一兴趣导向特征组。
在一些可独立实施的实施例中,所述根据所述第一兴趣导向特征组进行服务需求特征字段挖掘,得到服务需求特征字段组,包括:将所述第一兴趣导向特征组输入第一规则化特征处理模型,通过所述第一规则化特征处理模型解析获得所述第一兴趣导向特征组对应的服务需求特征字段组。例如,规则化特征处理模型可以是长短期记忆网络。
在一些可独立实施的实施例中,所述对所述服务需求特征字段组进行升级需求翻译,得到所述服务需求特征字段组对应的第一业务升级需求内容集,包括:对所述服务需求特征字段组进行升级需求翻译,得到所述服务需求特征字段组对应的第二倾向性词向量组;对所述第二倾向性词向量组进行需求内容解码,得到所述服务需求特征字段组对应的第一业务升级需求内容集。
在一些可独立实施的实施例中,所述对所述服务需求特征字段组进行升级需求翻译,得到所述服务需求特征字段组对应的第二倾向性词向量组,包括:基于非限制性参数的翻译窗口对所述服务需求特征字段组进行调整处理,得到所述服务需求特征字段组对应的第二倾向性词向量组。
在一些可独立实施的实施例中,所述根据所述用户兴趣短语集中的用户兴趣短语子集进行服务需求特征字段挖掘,得到关联的第二业务升级需求内容集,包括:将所述用户兴趣短语集中的用户兴趣短语子集输入第二规则化特征处理模型,通过所述第二规则化特征处理模型解析获得所述用户兴趣短语子集对应的第二业务升级需求内容集。
图3是示出可以实现本申请的实施例的应用于数字化经济的跨境电商大数据分析方法的应用环境的架构示意图,应用于数字化经济的跨境电商大数据分析方法的应用环境中可以包括互相通信的跨境电商大数据系统100和跨境电商业务终端200。基于此,跨境电商大数据系统100和跨境电商业务终端200在运行时实现或者部分实现本申请实施例的应用于数字化经济的跨境电商大数据分析方法。
以上已经结合附图描述了本申请的实施例,至少具有如下有益效果:通过挖掘跨境电商业务大数据的场景化业务反馈知识集,并确定场景化业务反馈知识集中关联场景业务反馈知识集的目标反馈知识单元,并根据目标反馈知识单元的偏好描述值确定目标反馈知识单元之间的共性知识向量,以通过共性知识向量进行反馈偏好的联合分析,从而尽可能减少跨境电商业务大数据中的干扰数据的影响。通过减少跨境电商业务大数据中的干扰数据的影响,能够减少对跨境电商业务大数据的用户兴趣分析难度。在本技术方案中,通过确定目标反馈知识单元,以通过目标反馈知识单元的偏好描述值确定共性知识向量,这样可以实现不同电商业务场景的用户反馈知识集的联合分析,从而尽可能细致地挖掘用户兴趣短语,确保用户兴趣短语挖掘的精度和可信度。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。
Claims (10)
1.一种应用于数字化经济的跨境电商大数据分析方法,其特征在于,应用于跨境电商大数据系统,该方法至少包括:
调取待进行用户兴趣分析的跨境电商业务大数据,并挖掘所述待进行用户兴趣分析的跨境电商业务大数据的场景化业务反馈知识集;其中,所述场景化业务反馈知识集中每个电商业务场景的用户反馈知识集对应的规模存在差异;
确定所述场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元的偏好描述值,获得不少于一组偏好描述值;通过所述不少于一组偏好描述值确定所述场景化业务反馈知识集中每个电商业务场景的用户反馈知识集的共性知识向量;其中,所述共性知识向量旨在反映所述目标反馈知识单元之间的差异程度;
结合所述每个电商业务场景的用户反馈知识集的共性知识向量对所述待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集。
2.根据权利要求1所述的方法,其特征在于,所述结合所述每个电商业务场景的用户反馈知识集的共性知识向量对所述待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集,包括:将所述共性知识向量与所对应的电商业务场景的用户反馈知识集中目标反馈知识单元的基础偏好描述值进行整理,获得各电商业务场景的用户反馈知识集的目标全局倾向性反馈;对各电商业务场景的用户反馈知识集的目标全局倾向性反馈进行反馈字段合并,并通过完成合并的反馈文本对所述待进行用户兴趣分析的跨境电商业务大数据进行用户兴趣短语抽取操作,获得用户兴趣短语集;
其中,所述将所述共性知识向量与所对应的电商业务场景的用户反馈知识集中目标反馈知识单元的基础偏好描述值进行整理,获得各电商业务场景的用户反馈知识集的目标全局倾向性反馈,包括:确定所述目标反馈知识单元的相对分布向量;通过所述相对分布向量在所对应的电商业务场景的用户反馈知识集中确定目标反馈知识单元;确定所述目标反馈知识单元的基础偏好描述值,并将所述共性知识向量和所述目标反馈知识单元的基础偏好描述值进行整理,获得各电商业务场景的用户反馈知识集的目标全局倾向性反馈。
3.根据权利要求1所述的方法,其特征在于,所述确定所述场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元,包括:在每组关联场景业务反馈知识集中挑选目标反馈知识单元,其中,所述目标反馈知识单元包括:热力型反馈知识单元和用户兴趣短语的区分型反馈知识单元中的至少一种,其中,所述用户兴趣短语为所述待进行用户兴趣分析的跨境电商业务大数据中所蕴藏的用户兴趣短语。
4.根据权利要求1所述的方法,其特征在于,所述关联场景业务反馈知识集包括:第一电商业务场景对应的用户反馈知识集和第二电商业务场景对应的用户反馈知识集,所述第一电商业务场景对应的用户反馈知识集的知识特征识别度低于所述第二电商业务场景对应的用户反馈知识集的知识特征识别度;
所述确定所述场景化业务反馈知识集中不少于一组关联场景业务反馈知识集之间目标反馈知识单元的偏好描述值,包括:
通过所述第一电商业务场景对应的用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集,确定热力型用户反馈知识集;
通过所述热力型用户反馈知识集确定所述目标反馈知识单元,并确定所述目标反馈知识单元的偏好描述值。
5.根据权利要求4所述的方法,其特征在于,所述通过所述第一电商业务场景对应的用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集,确定热力型用户反馈知识集,包括:
分别对所述第一电商业务场景对应的用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集进行知识单元抽样;
对完成知识单元抽样的第二电商业务场景对应的用户反馈知识集进行反馈知识更新;
对完成知识单元抽样的第一电商业务场景对应的用户反馈知识集和完成反馈知识更新的第二电商业务场景对应的用户反馈知识集进行反馈字段合并操作,获得已合并反馈文本知识;
依据窗口滑动策略对所述已合并反馈文本知识进行处理,获得所述热力型用户反馈知识集。
6.根据权利要求4所述的方法,其特征在于,所述目标反馈知识单元包括:热力型反馈知识单元;
所述通过所述热力型用户反馈知识集确定所述目标反馈知识单元,包括:
对所述热力型用户反馈知识集进行识别优化操作,获得所述热力型反馈知识单元的第一个性化分布标签;
对所述热力型用户反馈知识集和所述第一电商业务场景对应的用户反馈知识集进行局部聚焦优化,获得聚焦型用户反馈知识集;
分别在所述聚焦型用户反馈知识集和所述第二电商业务场景对应的用户反馈知识集中确定与所述第一个性化分布标签相匹配的反馈知识单元,获得所述热力型反馈知识单元。
7.根据权利要求4所述的方法,其特征在于,所述目标反馈知识单元包括:区分型反馈知识单元;
所述通过所述热力型用户反馈知识集确定所述目标反馈知识单元,包括:
通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行知识捕捉处理,获得所述待进行用户兴趣分析的跨境电商业务大数据中所蕴藏的用户兴趣短语的区分标识捕捉结果;
确定所述区分标识捕捉结果中每个捕捉成员的命中指数,并通过所述命中指数确定所述区分型反馈知识单元的第二个性化分布标签;
分别在所述第二电商业务场景对应的用户反馈知识集和所述第一电商业务场景对应的用户反馈知识集中确定与所述第二个性化分布标签相匹配的反馈知识单元,获得所述区分型反馈知识单元。
8.根据权利要求7所述的方法,其特征在于,所述通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行知识捕捉处理,获得所述待进行用户兴趣分析的跨境电商业务大数据中所蕴藏的用户兴趣短语的区分标识捕捉结果,包括:
通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行噪声清洗,获得完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集;
确定所述第一电商业务场景对应的用户反馈知识集的偏好描述值和完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集的偏好描述值之间的比较结果,并通过所述比较结果确定所述区分标识捕捉结果,其中,所述比较结果为所述区分标识捕捉结果的偏好描述值;
其中,所述通过所述热力型用户反馈知识集对所述第一电商业务场景对应的用户反馈知识集进行噪声清洗,获得完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集,包括:对所述热力型用户反馈知识集进行全局化精简操作,获得全局化精简知识集;借助所述全局化精简知识集对所述第一电商业务场景对应的用户反馈知识集进行噪声清洗,获得完成噪声清洗的所述第一电商业务场景对应的用户反馈知识集。
9.根据权利要求1所述的方法,其特征在于,所述关联场景业务反馈知识集包括:第一电商业务场景对应的用户反馈知识集和第二电商业务场景对应的用户反馈知识集,所述第一电商业务场景对应的用户反馈知识集的知识特征识别度低于所述第二电商业务场景对应的用户反馈知识集的知识特征识别度;
所述通过所述不少于一组偏好描述值确定所述场景化业务反馈知识集中每个电商业务场景的用户反馈知识集的共性知识向量,包括:
对所述目标反馈知识单元的偏好描述值进行相关性系数确定,获得相关性确定结果;
确定第一偏好描述值和所述相关性确定结果之间的指定运算数据,其中,所述第一偏好描述值为所述目标反馈知识单元中包括于所述第一电商业务场景对应的用户反馈知识集中的目标反馈知识单元的偏好描述值;
对所述指定运算数据和第二偏好描述值进行向量化处理,获得所述共性知识向量,其中,所述第二偏好描述值为每组所述目标反馈知识单元中包括于所述第二电商业务场景对应的用户反馈知识集中的目标反馈知识单元的偏好描述值。
10.一种跨境电商大数据系统,其特征在于,包括:
用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现权利要求1-9任一所述的方法的处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210371236.0A CN114880456A (zh) | 2022-04-11 | 2022-04-11 | 应用于数字化经济的跨境电商大数据分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210371236.0A CN114880456A (zh) | 2022-04-11 | 2022-04-11 | 应用于数字化经济的跨境电商大数据分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114880456A true CN114880456A (zh) | 2022-08-09 |
Family
ID=82669119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210371236.0A Withdrawn CN114880456A (zh) | 2022-04-11 | 2022-04-11 | 应用于数字化经济的跨境电商大数据分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114880456A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115423569A (zh) * | 2022-09-23 | 2022-12-02 | 黎祯 | 一种基于大数据的推荐方法及ai推荐系统 |
CN115660738A (zh) * | 2022-12-06 | 2023-01-31 | 南宁重望电子商务有限公司 | 一种基于大数据的电商交易方法及系统 |
CN115860783A (zh) * | 2022-12-23 | 2023-03-28 | 广东南粤分享汇控股有限公司 | 一种基于人工智能的电商平台用户反馈分析方法及系统 |
CN116739641A (zh) * | 2023-06-26 | 2023-09-12 | 广东粤贸全球科技有限公司 | 一种跨境电商知识图谱分析方法及系统 |
-
2022
- 2022-04-11 CN CN202210371236.0A patent/CN114880456A/zh not_active Withdrawn
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115423569A (zh) * | 2022-09-23 | 2022-12-02 | 黎祯 | 一种基于大数据的推荐方法及ai推荐系统 |
CN115423569B (zh) * | 2022-09-23 | 2023-09-01 | 厦门淦启莱科技有限公司 | 一种基于大数据的推荐方法及基于大数据的推荐系统 |
CN115660738A (zh) * | 2022-12-06 | 2023-01-31 | 南宁重望电子商务有限公司 | 一种基于大数据的电商交易方法及系统 |
CN115660738B (zh) * | 2022-12-06 | 2023-09-22 | 深圳市大道四九科技有限公司 | 一种基于大数据的电商交易方法及系统 |
CN115860783A (zh) * | 2022-12-23 | 2023-03-28 | 广东南粤分享汇控股有限公司 | 一种基于人工智能的电商平台用户反馈分析方法及系统 |
CN115860783B (zh) * | 2022-12-23 | 2023-09-26 | 广东南粤分享汇控股有限公司 | 一种基于人工智能的电商平台用户反馈分析方法及系统 |
CN116739641A (zh) * | 2023-06-26 | 2023-09-12 | 广东粤贸全球科技有限公司 | 一种跨境电商知识图谱分析方法及系统 |
CN116739641B (zh) * | 2023-06-26 | 2023-12-12 | 广东粤贸全球科技有限公司 | 一种跨境电商知识图谱分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114880456A (zh) | 应用于数字化经济的跨境电商大数据分析方法及系统 | |
CN111339990B (zh) | 一种基于人脸特征动态更新的人脸识别系统和方法 | |
CN109543516A (zh) | 签约意向判断方法、装置、计算机设备和存储介质 | |
CN110930246A (zh) | 信贷反欺诈识别方法、装置、计算机设备及计算机可读存储介质 | |
CN112801103B (zh) | 文本方向识别及文本方向识别模型训练方法、装置 | |
CN114529765B (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
CN112733645B (zh) | 手写签名校验方法、装置、计算机设备及存储介质 | |
CN114219971B (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
CN114638234B (zh) | 应用于线上业务办理的大数据挖掘方法及系统 | |
CN113449011A (zh) | 基于大数据预测的信息推送更新方法及大数据预测系统 | |
CN117011581A (zh) | 图像识别方法、介质、装置和计算设备 | |
CN115238081B (zh) | 一种文物智能识别方法、系统及可读存储介质 | |
CN113449676B (zh) | 一种基于双路互促进解纠缠学习的行人重识别方法 | |
CN111275694A (zh) | 一种注意力机制引导的递进式划分人体解析模型及方法 | |
CN115587252A (zh) | 基于互联网大数据的用户行为意图挖掘方法及系统 | |
CN113887214A (zh) | 基于人工智能的意愿推测方法、及其相关设备 | |
CN115935265B (zh) | 训练风险识别模型的方法、风险识别方法及对应装置 | |
CN115660001A (zh) | 近场通信卡片确认方法及装置、存储介质和电子设备 | |
CN114661998A (zh) | 基于互联网热点话题的大数据处理方法及系统 | |
Zhao et al. | Online learning of dynamic multi-view gallery for person re-identification | |
Meng et al. | Structure preservation adversarial network for visual domain adaptation | |
CN114880572A (zh) | 新闻客户端智能推荐系统 | |
CN114639127A (zh) | 指纹识别方法及装置、存储介质及电子设备 | |
CN113222609A (zh) | 风险识别方法和装置 | |
CN113569839A (zh) | 证件识别方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220809 |