CN115345710A - 一种电商商务大数据决策分析与数据处理方法 - Google Patents
一种电商商务大数据决策分析与数据处理方法 Download PDFInfo
- Publication number
- CN115345710A CN115345710A CN202211003022.4A CN202211003022A CN115345710A CN 115345710 A CN115345710 A CN 115345710A CN 202211003022 A CN202211003022 A CN 202211003022A CN 115345710 A CN115345710 A CN 115345710A
- Authority
- CN
- China
- Prior art keywords
- commerce
- data
- decision
- label
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种电商商务大数据决策分析与数据处理方法,涉及商务决策分析技术领域。本发明包括如下步骤:获取大量电商商务数据信息以及决策信息,提取电商商务标签和决策标签,获取因果关系,定义匹配规则并对电子商务标签设置权重值;建立电子商务标匹配分析模型并计算匹配结果;将匹配结构进行数据理解、数据建模和结果解释,获得初始权重下的方案分数;利用极小极大方案优化权重,并计算最终的方案分数。本发明通过获取大量电商商务数据信息以及决策信息,提取电商商务标签和决策标签,建立定义匹配规则并对电子商务标签设置权重值;建立电子商务标匹配分析模型并计算匹配结果,提高电子商务平台决策的准确率,减少金融损失。
Description
技术领域
本发明属于商务决策分析技术领域,特别是涉及一种电商商务大数据决策分析与数据处理方法。
背景技术
“电商”一词是业内人士对电子商务的简称。在概念上,业界将电商划分为狭义与广义,狭义电商(E-Commerce)是指实现整个贸易过程中各阶段贸易活动的电子化,而广义电商(E-Business)是指利用网络实现所有商务活动业务流程的电子化。前者集中于基于互联网的电子交易,强调企业利用互联网与外部发生交易与合作;而后者则把涵盖范围扩大了很多,指企业使用各种电子工具从事商务活动。从狭义到广义,电商是一个不断发展的概念,其最初的狭义电商概念是由电子商务的先驱IBM公司于1996年提出ElectronicCommerce(E-Commerce)的概念,到了1997年,IBM公司又提出ElectronicBusiness(E-Business)这一广义电商的概念。我国在引进这些概念的时候都翻译成了电子商务。
市场上也有很多跨境电子商务平台,大数据缺少提高数据质量、有效地进行处理分析,缺少决策分析,这样给用户搜索后呈现的结果不尽合理。
发明内容
本发明的目的在于提供一种电商商务大数据决策分析与数据处理方法,通过获取大量电商商务数据信息以及决策信息,提取电商商务标签和决策标签,建立定义匹配规则并对电子商务标签设置权重值;建立电子商务标匹配分析模型并计算匹配结果,解决了现有的电子商务平台缺少决策分析、推荐结果不准确的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种电商商务大数据决策分析与数据处理方法,包括如下步骤:
步骤S1:获取大量电商商务数据信息以及决策信息;
步骤S2:对电商商务数据信息进和决策信息进行预处理,提取电商商务标签和决策标签;
步骤S3:将电子商务标签与决策标签进行分析,并利用知识库得到电子商务标签与决策标签之间的因果关系;
步骤S4:根据电子商务标签与决策标签之间的因果关系,定义匹配规则并对电子商务标签设置权重值;
步骤S5:根据匹配规则和权重值,建立电子商务标匹配分析模型并计算匹配结果;
步骤S6:将匹配结构进行数据理解、数据建模和结果解释,获得初始权重下的方案分数;
步骤S7:利用极小极大方案优化权重,并计算最终的方案分数。
作为一种优选的技术方案,所述步骤S1中,通过网络爬虫引擎获取大量电商商务数据信息和决策信息构建电商商务数据库和决策信息库;所述电商商务数据库和决策信息库用于训练决策模型。
作为一种优选的技术方案,所述网络爬虫引擎获取的数据来自于内部数据和外部数据,内部数据来源于核心业务系统、ERP系统、财务系统以及CRM系统中的数据;所述外部数据来源于互联网资源、行业报告以及市场信息所构成的数据,其中包括以各种文本文件作为载体导入到数据源中的数据文件。
作为一种优选的技术方案,所述步骤S2中,提取电商商务标签和决策标签时,先定义标签属性等级,然后分别对定量标签和定性标签定义属性,最后对定量标签和定性标签赋予权重。
作为一种优选的技术方案,所述步骤S2中,提取电商商务标签和决策标签进行预处理,对数据的预处理采用模型计算、分组聚合或表达式计算的方式,模型计算过程中派生数据是以历史数据和模型数据的指标作为自变量,分组聚合是按照不同维度进行的分组聚合数据,聚合函数包括:合计、平均、最大值、最小值、加权平均值,表达式计算是以自变量在相同的维度背景下通过表达式对数据进行运算。
作为一种优选的技术方案,所述步骤S3中,电子商务标签和对应的决策标签进行建模,并利用信息库得到电子商务标签与决策标签因果关系,获取区分因果关系和非因果关系的边界阈值,然后对实时的电子商务标签进行检测为正确决策或异常决策,并建立一条正确的电子商务标签与决策标签规则。
作为一种优选的技术方案,所述步骤S4中,根据电子商务标签与决策标签之间的因果关,通过回归算法训练数据得到电子商务的模拟模型,在根据数据的目标信息,通过智能优化算法进行求解,得到电子商务标签设置权重值。
作为一种优选的技术方案,所述根据电子商务标签与决策标签之间的因果关系,定义匹配规则并对电子商务标签设置权重值。
作为一种优选的技术方案,所述步骤S5中,根据匹配规则和权重值进行因果分析和数据对比,并利用决策库和推理基准得到初步的搜索结果,将关键词与大数据进行因果分析和比对后,进行数据解释、数据建模和结果解释,进行推理得到匹配结果。
本发明具有以下有益效果:
本发明通过获取大量电商商务数据信息以及决策信息,提取电商商务标签和决策标签,建立定义匹配规则并对电子商务标签设置权重值;建立电子商务标匹配分析模型并计算匹配结果,提高电子商务平台决策的准确率,减少金融损失。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种电商商务大数据决策分析与数据处理方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种电商商务大数据决策分析与数据处理方法,包括如下步骤:
步骤S1:获取大量电商商务数据信息以及决策信息;通过网络爬虫引擎获取大量电商商务数据信息和决策信息构建电商商务数据库和决策信息库;电商商务数据库和决策信息库用于训练决策模型;网络爬虫引擎获取的数据来自于内部数据和外部数据,内部数据来源于核心业务系统、ERP系统、财务系统以及CRM系统中的数据;外部数据来源于互联网资源、行业报告以及市场信息所构成的数据,其中包括以各种文本文件作为载体导入到数据源中的数据文件。
步骤S2:对电商商务数据信息进和决策信息进行预处理,提取电商商务标签和决策标签;提取电商商务标签和决策标签时,先定义标签属性等级,然后分别对定量标签和定性标签定义属性,最后对定量标签和定性标签赋予权重;提取电商商务标签和决策标签进行预处理,对数据的预处理采用模型计算、分组聚合或表达式计算的方式,模型计算过程中派生数据是以历史数据和模型数据的指标作为自变量,分组聚合是按照不同维度进行的分组聚合数据,聚合函数包括:合计、平均、最大值、最小值、加权平均值,表达式计算是以自变量在相同的维度背景下通过表达式对数据进行运算;
步骤S3:将电子商务标签与决策标签进行分析,并利用知识库得到电子商务标签与决策标签之间的因果关系;电子商务标签和对应的决策标签进行建模,并利用信息库得到电子商务标签与决策标签因果关系,获取区分因果关系和非因果关系的边界阈值,然后对实时的电子商务标签进行检测为正确决策或异常决策,并建立一条正确的电子商务标签与决策标签规则;
步骤S4:根据电子商务标签与决策标签之间的因果关系,定义匹配规则并对电子商务标签设置权重值;根据电子商务标签与决策标签之间的因果关,通过回归算法训练数据得到电子商务的模拟模型,在根据数据的目标信息,通过智能优化算法进行求解,得到电子商务标签设置权重值;根据电子商务标签与决策标签之间的因果关系,定义匹配规则并对电子商务标签设置权重值;
步骤S5:根据匹配规则和权重值,建立电子商务标匹配分析模型并计算匹配结果;根据匹配规则和权重值进行因果分析和数据对比,并利用决策库和推理基准得到初步的搜索结果,将关键词与大数据进行因果分析和比对后,进行数据解释、数据建模和结果解释,进行推理得到匹配结果;
步骤S6:将匹配结构进行数据理解、数据建模和结果解释,获得初始权重下的方案分数;
步骤S7:利用极小极大方案优化权重,并计算最终的方案分数。
值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (9)
1.一种电商商务大数据决策分析与数据处理方法,其特征在于,包括如下步骤:
步骤S1:获取大量电商商务数据信息以及决策信息;
步骤S2:对电商商务数据信息进和决策信息进行预处理,提取电商商务标签和决策标签;
步骤S3:将电子商务标签与决策标签进行分析,并利用知识库得到电子商务标签与决策标签之间的因果关系;
步骤S4:根据电子商务标签与决策标签之间的因果关系,定义匹配规则并对电子商务标签设置权重值;
步骤S5:根据匹配规则和权重值,建立电子商务标匹配分析模型并计算匹配结果;
步骤S6:将匹配结构进行数据理解、数据建模和结果解释,获得初始权重下的方案分数;
步骤S7:利用极小极大方案优化权重,并计算最终的方案分数。
2.根据权利要求1所述的一种电商商务大数据决策分析与数据处理方法,其特征在于,所述步骤S1中,通过网络爬虫引擎获取大量电商商务数据信息和决策信息构建电商商务数据库和决策信息库;所述电商商务数据库和决策信息库用于训练决策模型。
3.根据权利要求2所述的一种电商商务大数据决策分析与数据处理方法,其特征在于,所述网络爬虫引擎获取的数据来自于内部数据和外部数据,内部数据来源于核心业务系统、ERP系统、财务系统以及CRM系统中的数据;所述外部数据来源于互联网资源、行业报告以及市场信息所构成的数据,其中包括以各种文本文件作为载体导入到数据源中的数据文件。
4.根据权利要求1所述的一种电商商务大数据决策分析与数据处理方法,其特征在于,所述步骤S2中,提取电商商务标签和决策标签时,先定义标签属性等级,然后分别对定量标签和定性标签定义属性,最后对定量标签和定性标签赋予权重。
5.根据权利要求1所述的一种电商商务大数据决策分析与数据处理方法,其特征在于,所述步骤S2中,提取电商商务标签和决策标签进行预处理,对数据的预处理采用模型计算、分组聚合或表达式计算的方式,模型计算过程中派生数据是以历史数据和模型数据的指标作为自变量,分组聚合是按照不同维度进行的分组聚合数据,聚合函数包括:合计、平均、最大值、最小值、加权平均值,表达式计算是以自变量在相同的维度背景下通过表达式对数据进行运算。
6.根据权利要求1所述的一种电商商务大数据决策分析与数据处理方法,其特征在于,所述步骤S3中,电子商务标签和对应的决策标签进行建模,并利用信息库得到电子商务标签与决策标签因果关系,获取区分因果关系和非因果关系的边界阈值,然后对实时的电子商务标签进行检测为正确决策或异常决策,并建立一条正确的电子商务标签与决策标签规则。
7.根据权利要求1所述的一种电商商务大数据决策分析与数据处理方法,其特征在于,所述步骤S4中,根据电子商务标签与决策标签之间的因果关,通过回归算法训练数据得到电子商务的模拟模型,在根据数据的目标信息,通过智能优化算法进行求解,得到电子商务标签设置权重值。
8.根据权利要求1所述的一种电商商务大数据决策分析与数据处理方法,其特征在于,所述根据电子商务标签与决策标签之间的因果关系,定义匹配规则并对电子商务标签设置权重值。
9.根据权利要求1所述的一种电商商务大数据决策分析与数据处理方法,其特征在于,所述步骤S5中,根据匹配规则和权重值进行因果分析和数据对比,并利用决策库和推理基准得到初步的搜索结果,将关键词与大数据进行因果分析和比对后,进行数据解释、数据建模和结果解释,进行推理得到匹配结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211003022.4A CN115345710A (zh) | 2022-08-19 | 2022-08-19 | 一种电商商务大数据决策分析与数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211003022.4A CN115345710A (zh) | 2022-08-19 | 2022-08-19 | 一种电商商务大数据决策分析与数据处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115345710A true CN115345710A (zh) | 2022-11-15 |
Family
ID=83954351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211003022.4A Pending CN115345710A (zh) | 2022-08-19 | 2022-08-19 | 一种电商商务大数据决策分析与数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115345710A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116821489A (zh) * | 2023-06-21 | 2023-09-29 | 易方达基金管理有限公司 | 一种股票筛选方法及系统 |
-
2022
- 2022-08-19 CN CN202211003022.4A patent/CN115345710A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116821489A (zh) * | 2023-06-21 | 2023-09-29 | 易方达基金管理有限公司 | 一种股票筛选方法及系统 |
CN116821489B (zh) * | 2023-06-21 | 2024-05-10 | 易方达基金管理有限公司 | 一种股票筛选方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106572001B (zh) | 一种智能客服的对话方法及系统 | |
CN113312447A (zh) | 基于概率标签估计的半监督日志异常检测方法 | |
CN111209472A (zh) | 一种铁路事故故障关联和事故故障原因分析方法及系统 | |
CN111191099A (zh) | 一种基于社交媒体的用户活动类型识别方法 | |
CN113283795A (zh) | 基于二分类模型的数据处理方法及装置、介质、设备 | |
CN115345710A (zh) | 一种电商商务大数据决策分析与数据处理方法 | |
CN108509588B (zh) | 一种基于大数据的律师评估方法及推荐方法 | |
Zhao | RETRACTED ARTICLE: Application of deep learning algorithm in college English teaching process evaluation | |
CN116805245A (zh) | 基于图神经网络与解耦表示学习的欺诈检测方法及系统 | |
CN111339258A (zh) | 基于知识图谱的大学计算机基础习题推荐方法 | |
CN115564276A (zh) | 项目统计储备管理系统、方法及存储介质 | |
CN110443646B (zh) | 产品竞争关系网络分析方法和系统 | |
Zhao et al. | Detecting fake reviews via dynamic multimode network | |
CN114328903A (zh) | 基于文本聚类的客服日志回流方法及装置 | |
CN112199518A (zh) | 生产技术中知识图谱推荐驱动的生产技术路线图配置方法 | |
CN114282875A (zh) | 流程审批确定性规则和语义自学习结合判定方法及装置 | |
CN113177164A (zh) | 基于大数据的多平台协同新媒体内容监控管理系统 | |
Bochkaryov et al. | Application of the ensemble clustering algorithm in solving the problem of segmentation of users taking into account their loyalty | |
CN110928924A (zh) | 基于神经网络的电力系统客户满意度分析与预测方法 | |
CN111583394A (zh) | 一种基于特征识别的知识化工艺性检查方法及系统 | |
Li et al. | Research on demand forecasting of engineering positions based on fusion of multisource and heterogeneous data | |
CN114637849B (zh) | 基于人工智能的法律关系认知方法及系统 | |
CN114880588B (zh) | 基于知识图谱的新闻热度预测方法 | |
CN118012921B (zh) | 一种用于知识产权虚拟实验的人机交互数据处理系统 | |
CN115687632B (zh) | 一种刑事量刑情节分解分析的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |