CN106127522A - 基于网络数据挖据技术的企业经营状况分析方法及系统 - Google Patents

基于网络数据挖据技术的企业经营状况分析方法及系统 Download PDF

Info

Publication number
CN106127522A
CN106127522A CN201610496153.9A CN201610496153A CN106127522A CN 106127522 A CN106127522 A CN 106127522A CN 201610496153 A CN201610496153 A CN 201610496153A CN 106127522 A CN106127522 A CN 106127522A
Authority
CN
China
Prior art keywords
data
enterprise
url
behavior
employee
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610496153.9A
Other languages
English (en)
Inventor
周明中
王红星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUZHOU MAIKE NETWORK SAFETY TECHNOLOGY Co Ltd
Original Assignee
SUZHOU MAIKE NETWORK SAFETY TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU MAIKE NETWORK SAFETY TECHNOLOGY Co Ltd filed Critical SUZHOU MAIKE NETWORK SAFETY TECHNOLOGY Co Ltd
Priority to CN201610496153.9A priority Critical patent/CN106127522A/zh
Publication of CN106127522A publication Critical patent/CN106127522A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明揭示了基于网络数据挖据技术的企业经营状况分析方法和系统,首先通过获取企业网络数据及其他相关数据形成原始数据库;将原始数据库中的数据转化为可分析的数据源;对数据源进行分析,形成企业经营状况分析的评价指数;将数据源与企业基础数据结合,对员工分群画像;将员工分群画像与企业基础数据结合,对企业互联网行为进行画像;将企业互联网行为和评价指数结合,形成企业经营行为的预判和趋势分析。本发明能够实时的、连续的、全维度的、真实精准的反映企业经营状况,改变了原有以财务报表、企业信用等信息为基础,以人工分析为主评的价方法数据滞后、准确性差、效率低的不利局面,大大提高了效率、及时性和准确性。

Description

基于网络数据挖据技术的企业经营状况分析方法及系统
技术领域
本发明涉及企业经营状况分析方法及系统,尤其涉及一种基于网络数据挖据技术的企业经营状况分析方法及系统。
背景技术
企业经营状况是指企业的收益性、安全性、效益性及成长性,直接反映了企业的活力,同样也从微观层次反应本地区所属产业的活跃度。
目前企业经营状况的获取方法主要包括:当政府或征信机构需要了解企业的经营状况时,一般需要通过工商、税务和社保等职能部门,或者直接的现场调查拜访、企业历史信用状况获取、企业公布的经营活动信息调查等方法获取企业财务报表、信用历史等信息,再通过专业人员对这些繁杂的数据分析综合,得到企业的运营状况的评估信息。
虽然,企业的这些数据有针对性强,内容相对详实等特点,但是同时也存在数据获取滞后,数据获取间隔周期较大,从工商税务等职能机构的获取信息通常以月或季、甚至年为周期,时间延迟长,数据获取不及时,并且数据不实时不连贯,甚至可能存在数据真实性存疑不高,存在虚假因素(特别是对一些公司治理不完善的企业)等缺陷。
随着现代企业逐渐向轻资产、快节奏、低能耗、高附加值模式转换,这些不足逐渐凸显;因此亟需具备及时反映企业真实经营状况的调查方法,以对现有机制进行有益补充。
发明内容
本发明的目的就是为了解决现有技术中存在的上述问题,利用企业网络流量数据所反映的企业行为与企业经营状况之间的关联性,从而提供一种基于网络数据挖据技术的企业经营状况分析方法及系统。
本发明的目的将通过以下技术方案得以实现:
基于网络数据挖据技术的企业经营状况分析方法,包括如下步骤:
S1,数据采集步骤:获取企业网络数据、预定义基础数据、配置基础数据以及数据挖掘获得的基础数据,形成原始数据库;
S2,数据处理步骤:通过数据分离、数据清洗及数据综合关联将原始数据库中的数据转化为可分析的数据源;
S3,评价指数生成步骤:通过数据关联分析方法对数据源进行分析,形成企业经营状况分析的评价指数;
S4,员工分群画像生成步骤:将所述数据源与企业基础数据结合,对员工分群画像;
S5,企业互联网行为分析步骤:将员工分群画像与企业基础数据结合,对企业的互联网行为进行画像;
S6,企业经营状况分析步骤:将企业互联网行为和评价指数结合,形成企业经营行为的预判和趋势分析。
优选的,所述企业网络数据至少包括以固定时段上报的会话数据,URL数据,终端识别数据,上下行流量数据,搜索关键字数据以及IMEI/IMSI数据,并过深度报文检测技术获取。
优选的, 所述数据分离包括内部用户分组,应用及URL分组和用户唯一ID生成。
优选的,所述数据清洗至少包括对脏数据的去重、缺失值处理、过滤以及合并。
优选的,所述数据综合关联包括:
S21,会话数据和基础数据关联步骤:至少针对会话源IP地址、MAC、用户信息,通过配置基础数据的匹配,将会话打上会话源分组的信息;以及,至少针对会话目的IP地址、appid信息,通过基础数据,获取该应用属于企业应用分析分组的信息,并做相关标记;
S22, URL数据和基础数据关联步骤:使URL数据至少针对源IP地址、MAC、用户信息,通过配置基础数据的匹配,将URL数据打上会话源分组的信息;针对URL的分类,获得对应DOMAIN的URL分类信息,并做标记;
S23,人员分类和基础数据关联步骤:至少通过MAC、IP或用户认证的认证方式,为每一个数据确定具体的用户。
优选的,所述评价指数至少包括企业经营成长指数、企业经营活跃指数、企业经营创新指数、员工勤勉度指数以及员工情绪指数。
优选的,所述企业经营成长指数满足以下公式:企业经营成长指数= (有效主机归一值+上下行流量归一值+URL总访问量归一值)* min(1.1,(当前额定带宽-期初额定带宽)/期初额定带宽 * 0.1+1)。
优选的,所述企业经营活跃指数满足以下公式:企业经营活跃指数= 工作时段*(有效主机归一值+生产流量人均归一值+生产URL人均归一值)+ H_NW * 非工作时段*(有效主机归一值+生产流量人均归一值+生产URL人均归一值),其中H_NW为权重值。
优选的,所述企业经营创新指数满足以下公式:企业经营创新指数=(RD_OVERTIME_RATIO归一值+ RD_HOSTNUM_RATIO归一值+ RD_APP_RATIO归一值 + RD_URL_RATIO归一值),其中,RD_OVERTIME_RATI为研发人员加班比率,RD_HOSTNUM_RATIO为研发主机数比率,RD_APP_RATIO为研发流量比率,RD_URL_RATIO为研发点击量比率。
优选的,所述员工勤勉度指数满足以下公式:员工勤勉度指数= (行为权重 *(URL生产行为比率归一值+ URL研发行为比率归一值)+强度权重* ((员工URL生产行为的平均次数归一值+员工URL研发行为的平均次数归一值)–(员工URL娱乐消遣行为的平均次数归一值+员工流量APP娱乐消遣行为的平均次数归一值 )。
优选的,所述员工情绪指数满足如下公式:员工情绪指数=(访问招聘类URL的HR与非HR的比率归一值-访问招聘类URL的员工比率归一值-访问招聘类URL的人均值归一值+访问招聘类URL的人均值与中位数的比值归一值)。
本发明的另一目的在于提供一种能够实现上述方法的系统,所述基于网络数据挖据技术的企业经营状况分析系统,包括:
数据采集单元,用于获取企业网络数据、预定义基础数据、配置基础数据以及数据挖掘获得的基础数据,形成原始数据库;
数据处理单元,用于通过数据分离、数据清洗及数据综合关联将原始数据库中的数据转化为数据源;
评价指数生成单元,用于通过数据关联分析方法对数据源进行分析,形成企业经营状况分析的评价指数;
员工分群画像生成单元,用于将数据源与企业基础数据结合,对员工分群画像;
企业互联网行为分析单元,用于将员工分群画像与企业基础数据结合,对企业的互联网行为进行画像;
以及,企业经营状况分析单元,用于将企业互联网行为和评价指数结合,形成企业经营行为的预判和趋势分析。
本发明技术方案的优点主要体现在:
本发明设计精巧,过程简单,通过实时获取企业的网络流量情况,并根据企业实际情况分析流量数据产生的网络行为及行为动机,再结合企业基础数据建立企业综合经营指数模型,得到相应指数,通过分析行为动机和指数体系,能够实时的、连续的、全维度的、真实精准的反映企业经营状况,是在现有数据采集统计基础上的升华,彻底改变了原有以财务报表、企业信用等信息为基础,以人工分析为主评价方法数据滞后、准确性差、效率低的不利局面,大大提高了效率、及时性和准确性。
由于分析的基础改变为流量数据,因此受财务数据、信用数据的真假性影响小,能够充分保证分析的准确性。
本发明的方法和系统,能够运用于各行各业的企业运行情况分析,适用范围广,便于推广应用。
附图说明
图1 是发明的过程示意图;
图2是本发明的系统示意图。
具体实施方式
本发明的目的、优点和特点,将通过下面优选实施例的非限制性说明进行图示和解释。这些实施例仅是应用本发明技术方案的典型范例,凡采取等同替换或者等效变换而形成的技术方案,均落在本发明要求保护的范围之内。
随着企业信息化深入向“互联网+”转型,企业经营与互联网的相关性日益密切,企业互联网访问流量与企业业务经营相关关系也日益加强,而流量是由企业从事经营活动的人产生的,访问行为直接反映了企业员工的工作状态,而企业员工的群体行为进一步反映企业整体经营活动的情况,而企业经营活动的连续性历史数据则反映了一定时间范围内企业的发展情况。
因此,通过分析企业的互联网流量以及流量产生的行为动机,获取行为动机与企业经营状态的确定性关联关系为企业经营状况分析的实现创造了条件。
在此基础上,本发明揭示了一种基于网络数据挖据技术的企业经营状况分析系统,如附图2所示,包括:数据采集单元、数据处理单元、评价指数生成单元、员工分群画像生成单元、企业互联网行为分析单元以及企业经营状况分析单元。
其中,所述数据采集单元用于获取企业网络数据、预定义基础数据、配置基础数据以及数据挖掘获得的基础数据以形成原始数据库。
详细的,所述企业网络数据指企业内网和外网互访的流量数据信息,其至少包括以固定时段上报的会话数据,URL数据,终端识别数据,上下行流量数据,搜索关键字数据以及IMEI/IMSI数据,并过深度报文检测技术获取。
所述预定义基础数据定义了生产行为类、娱乐消遣行为类、招聘行为类、研发行为类、未判断应用类等若干网络行为分组,后期分析时,将所有的应用都归纳到特定应用分组中,并将所有URL的分类,也纳入到相关分组中。
所述配置基础数据包括:配置中关于带宽保障自定义进行带宽保障的IP、DOMAIN、URL等,作为重点应用关注,比如企业生产相关的数据,可能是OA、ERP等数据,可用于行为维度的分析;配置中关于分组的内容,包含组名,各分组中的用户等信息;配置中关于分组策略的内容,包含Deny某些应用、对某些应用进行QoS等。
由于每个企业的基础数据分类可能存在不同,譬如就非游戏企业而言,游戏类应用可能是非生产相关应用,而就游戏类企而言,游戏类应用是生产相关应用;在生物医药行业中,有一些固定的URL/IP是隶属于研发类应用,而对其他行业,此为未判定应用,因此由每个企业维护各自的配置基础数据。
所述数据挖掘获得的基础数据指通过对会话行为、URL访问行为的聚类分析,可以获得的人员维度和行为维度的推测数据,从而形成新的基础数据;其中,所述人员维度数据通过对研发行为的聚类,对人员进行初步分类;所述行为维度数据通过URL和会话中对IP地址聚类,分析外部系统可以获得。
进一步,所述数据处理单元用于通过数据分离、数据清洗及数据综合关联将原始数据库中的数据转化为可分析的数据源,上述数据处理的目标是为数据分析作前期准备。
详细的,所述数据分离即将数据按照上报企业用户进行分类,保证所有的数据都是归属于各自企业,其包括内部用户分组,应用及URL分组和用户唯一ID生成。
具体的,将企业内部用户分为:研发、工程、实施和维护、销售、财务、人事、高管及其他等不同的分组;将应用和URL按照生产应用类、娱乐消遣应用类、招聘应用类、研发应用类、未判断应用类等方式,为每一个URL标定分类Type,为每一个会话标定分类Type;同时,由于用户管理有基于IP、基于MAC和基于用户的,因此需要生成唯一ID。
而所述数据清洗主要是对“脏数据”进行去重、缺失值处理、过滤、合并等操作,具体包括会话数据清洗,URL数据清洗,有效主机清洗,出入流量统计清洗和全局URL清洗。
同时,所述数据综合关联就是把会话数据、url数据和人员分类分别和基础数据关联,所述会话数据包括time_v、proto、sip、dip、sport、dport、appid、rx、tx、user_id、person_grp、behavior_grp、time_grp;所述URL数据包括time_v、sip、dip、URL、user_id、person_grp、behavior_grp、time_grp。
进一步,所述评价指数生成单元,用于通过数据关联分析方法对所述数据处理单元生成的数据源进行分析,形成企业经营状况分析的评价指数,所述评价指数至少包括企业经营成长指数、企业经营活跃指数、企业经营创新指数、员工勤勉度指数以及员工情绪指数。
详细的,数据关联分析的目标是根据不同的维度分解组合,将数据源加工为若干个多维指标,这些多维指标通过融合运算,最后形成指数;本方案中以人员、时间、行为、趋势四个维度进行分析,通过维度之间的相互关联,形成企业经营成长指数、企业经营活跃指数、企业经营创新指数、员工勤勉度指数以及员工情绪指数等综合判断指数。
更为具体的,所述企业经营成长指数主要考察较长周期内(周、月)企业互联网访问的人数、流量、URL访问及额定带宽的变化情况,获得这些指标的变化趋势,然后推导企业业务成长和指标之间的关系;并且,参与指数计算的全局指标,以天为单位统计,使用统计时段内最小统计周期数值的最大值作为以天为单位的统计值,如:有效主机数、上下行流量、URL数等。
并且,所述企业经营成长指数根据以下公式计算,企业经营成长指数=(有效主机归一值+上下行流量归一值+URL总访问量归一值) * min(1.1,(当前额定带宽-期初额定带宽)/期初额定带宽 * 0.1+1)。
而所述企业经营活跃指数主要考察全局角度从事工作相关的互联网访问的人数,流量,URL等相关指标,计算各指标的活跃度,获得这些指标的变化趋势,然后推导企业业务经营活跃度和指标之间的关系,分别以周为单位统计企业活跃度趋势,由若干部分构成:工作时段在线有效主机数H(A,W),工作时段生产类上下行流量T(P, W),工作时段总上下行流量T(A, W),工作时段生产类URL/IP访问量U(P, W),工作时段总URL/IP访问总量U(A, W);加班时段(工作日加班,周末,节假日)在线有效主机数H(A, NW),加班时段生产类上下行流量T(P, NW),加班时段总上下行流量T(A, NW),加班时段生产类URL/IP访问量U(P, NW),加班时段URL/IP访问总量U(A, NW);取得数据的前两个周的数据,获得在线有效主机、生产流量人均值(上下行流量生产类除以有效主机数),生产URL人均值(URL生产类除以有效主机数)的平均值;分别计算统计单位内,工作时段的在线有效主机,生产流量人均值,生产URL人均值,再使用各自的平均值归一化处理;分别计算统计单位内,各非工作时段的在线有效主机,生产流量人均值,生产URL人均值,再使用各自的平均值归一化处理,对非工作时段的内容采用权重H_NW。
并且,所述企业经营活跃指数通过以下公式计算:企业经营活跃度指数=工作时段*(有效主机归一值+生产流量人均归一值+生产URL人均归一值)+ H_NW * 非工作时段*(有效主机归一值+生产流量人均归一值+生产URL人均归一值)。
而参与所述企业经营创新指数计算的全局指标和终端个体指标,以天为单位统计,使用统计时段内最小统计周期数值的最大值作为以天为单位的统计值,其具体的计算满足如下公式:企业经营创新指数= ( RD_OVERTIME_RATIO归一化+RD_HOSTNUM_RATIO归一化+RD_APP_RATIO归一化+RD_URL_RATIO归一化),其中,RD_OVERTIME_RATI为研发人员加班比率,RD_HOSTNUM_RATIO为研发主机数比率,RD_APP_RATIO为研发流量比率,RD_URL_RATIO为研发点击量比率。
而所述员工勤勉指数主要考察员工在不同时段从事工作相关互联网活动的记录;考察点主要包含工作时间,员工从事生产类活动,研发类活动等的变化情况;加班时间,员工从事生产类活动的变化状况。
并且,所述员工勤勉度指数的计算公式如下:员工勤勉度指数= (行为权重 *(URL生产行为比率归一值+URL研发行为比率归一值)+强度权重*((员工URL生产行为的平均次数归一值+员工URL研发行为的平均次数归一值)–(员工URL娱乐消遣行为的平均次数归一值+员工流量APP娱乐消遣行为的平均次数归一值 ))。
而所述员工情绪指数主要考察员工在不同时段访问互联网活动的记录,考察员工是否存在负面情绪,主要表现在:非HR人员是否频繁光顾招聘类网站。
并且,所述员工情绪指数的计算满足如下公式:员工情绪指数=(访问招聘类URL的HR与非HR的比率归一值-访问招聘类URL的员工比率归一值 -访问招聘类URL的人均值归一值+访问招聘类URL的人均值与中位数的比值归一值)。
更进一步,所述员工分群画像生成单元用于将数据源与企业基础数据结合,对员工分群画像,其中,所述企业基础数据可以通过已知的可行渠道获取,其包括但不限于企业的财务数据、企业行业分类数据、企业规模数据、业务特点数据等;而员工分群画像是指基于企业员工的网络行为来刻画员工职责、行为模式、工作状态、态度、兴趣爱好等,分群画像将相同上述特点的员工分到一个组,打上相同的标签,旨在通过实际数据刻画企业的员工构成模式。
再进一步,企业互联网行为分析单元用于将员工分群画像与企业基础数据结合分析企业互联网行为进行画像,企业互联网行为的画像是指企业整体的成长性、活跃性、创新性、员工情绪分布、员工勤勉度等,体现的是企业的综合经营状况。
最后,所述企业经营状况分析单元用于将上述的企业互联网行为和评价指数结合,形成企业经营行为的预判和趋势分析。
本发明揭示的基于网络数据挖据技术的企业经营状况分析系统,其分析的过程,如附图1所示,包括如下步骤:
S1,数据采集步骤:所述数据采集单元获取企业网络数据、预定义基础数据、配置基础数据以及数据挖掘获得的基础数据结合,形成原始数据库;
S2,数据处理步骤:所述数据处理单元通过数据分离、数据清洗及数据综合关联将原始数据库中的数据转化为可分析的数据源;
其中,所述数据关联的详细过程如下:
S21,会话数据和基础数据关联步骤:至少针对会话源IP地址、MAC、用户信息,通过上述的配置基础数据的匹配,将会话打上会话源分组的信息;以及,至少针对会话目的IP地址、appid信息,通过上述基础数据,获取该应用属于企业应用分析分组的信息,并做相关标记。
S22, URL数据和基础数据关联步骤:使URL数据至少针对源IP地址、MAC、用户信息,通过配置基础数据的匹配,将URL数据打上会话源分组的信息;针对URL的分类,获得对应DOMAIN的URL分类信息,并做标记。
S23,人员分类和基础数据关联步骤:至少通过MAC、IP或用户认证的认证方式,为每一个数据确定具体的用户。
S3,评价指数生成步骤:所述评价指数生成单元通过数据关联分析方法对所述数据源进行分析,形成企业经营状况分析的评价指数。
S4,员工分群画像生成步骤:所述员工分群画像生成单元将所述数据源与企业基础数据结合,对员工分群画像。
S5,企业互联网行为分析步骤:所述企业互联网行为分析单元将员工分群画像与企业基础数据结合,对企业互联网行为进行画像。
S6,企业经营状况分析步骤:所述企业经营状况分析单元将企业互联网行为和评价指数结合,形成企业经营行为的预判和趋势分析。
当然,上述描述方式并不造成对本方法的唯一限定,例如所述S3,评价指数生成步骤只要在S6企业经营状况分析步骤之前且在S2,数据处理步骤之后完成即可。
本发明尚有多种实施方式,凡采用等同变换或者等效变换而形成的所有技术方案,均落在本发明的保护范围之内。

Claims (12)

1.基于网络数据挖据技术的企业经营状况分析方法,其特征在于:包括如下步骤:
S1,数据采集步骤:获取企业网络数据、预定义基础数据、配置基础数据以及数据挖掘获得的基础数据,形成原始数据库;
S2,数据处理步骤:通过数据分离、数据清洗及数据综合关联将原始数据库中的数据转化为可分析的数据源;
S3,评价指数生成步骤:通过数据关联分析方法对数据源进行分析,形成企业经营状况分析的评价指数;
S4,员工分群画像生成步骤:将所述数据源与企业基础数据结合,对员工分群画像;
S5,企业互联网行为分析步骤:将员工分群画像与企业基础数据结合对企业的互联网行为进行画像;
S6,企业经营状况分析步骤:将企业互联网行为和评价指数结合,形成企业经营行为的预判和趋势分析。
2.根据权利要求1所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述企业网络数据至少包括以固定时段上报的会话数据,URL数据,终端识别数据,上下行流量数据,搜索关键字数据以及IMEI/IMSI数据,并过深度报文检测技术获取。
3.根据权利要求1所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述数据分离包括内部用户分组,应用及URL分组和用户唯一ID生成。
4.根据权利要求1所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述数据清洗至少包括对脏数据的去重、缺失值处理、过滤以及合并。
5.根据权利要求1所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述数据综合关联包括:
S21,会话数据和基础数据关联步骤:至少针对会话源IP地址、MAC、用户信息,通过配置基础数据的匹配,将会话打上会话源分组的信息;以及,至少针对会话目的IP地址、appid信息,通过基础数据,获取该应用属于企业应用分析分组的信息,并做相关标记;
S22, URL数据和基础数据关联步骤:使URL数据至少针对源IP地址、MAC、用户信息,通过配置基础数据的匹配,将URL数据打上会话源分组的信息;针对URL的分类,获得对应DOMAIN的URL分类信息,并做标记;
S23,人员分类和基础数据关联步骤:至少通过MAC、IP或用户认证的认证方式,为每一个数据确定具体的用户。
6.根据权利要求1-5任一所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述评价指数至少包括企业经营成长指数、企业经营活跃指数、企业经营创新指数、员工勤勉度指数以及员工情绪指数。
7.根据权利要求6所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述企业经营成长指数满足以下公式:企业经营成长指数=(有效主机归一值+上下行流量归一值+URL总访问量归一值)* min(1.1,(当前额定带宽-期初额定带宽)/期初额定带宽* 0.1+1)。
8.根据权利要求6所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述企业经营活跃指数满足以下公式:企业经营活跃指数= 工作时段*(有效主机归一值+生产流量人均归一值+生产URL人均归一值)+ H_NW * 非工作时段*(有效主机归一值+生产流量人均归一值+生产URL人均归一值),其中H_NW为权重值。
9.根据权利要求6所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述企业经营创新指数满足以下公式:企业经营创新指数=(RD_OVERTIME_RATIO归一值+RD_HOSTNUM_RATIO归一值+ RD_APP_RATIO归一值 + RD_URL_RATIO归一值),其中,RD_OVERTIME_RATI为研发人员加班比率,RD_HOSTNUM_RATIO为研发主机数比率,RD_APP_RATIO为研发流量比率,RD_URL_RATIO为研发点击量比率。
10.根据权利要求6所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述员工勤勉度指数满足以下公式:员工勤勉度指数= (行为权重 * (URL生产行为比率归一值+ URL研发行为比率归一值)+强度权重*((员工URL生产行为的平均次数归一值+员工URL研发行为的平均次数归一值)–(员工URL娱乐消遣行为的平均次数归一值+员工流量APP娱乐消遣行为的平均次数归一值 )。
11.根据权利要求6所述的基于网络数据挖据技术的企业经营状况分析方法,其特征在于:所述员工情绪指数满足如下公式:员工情绪指数=(访问招聘类URL的HR与非HR的比率归一值-访问招聘类URL的员工比率归一值-访问招聘类URL的人均值归一值+访问招聘类URL的人均值与中位数的比值归一值)。
12.基于网络数据挖据技术的企业经营状况分析系统,其特征在于:包括:
数据采集单元,用于获取企业网络数据、预定义基础数据、配置基础数据以及数据挖掘获得的基础数据,形成原始数据库;
数据处理单元,用于通过数据分离、数据清洗及数据综合关联将原始数据库中的数据转化为可分析的数据源;
评价指数生成单元,用于通过数据关联分析方法对数据源进行分析,形成企业经营状况分析的评价指数;
员工分群画像生成单元,用于将数据源与企业基础数据结合,对员工分群画像;
企业互联网行为分析单元,用于将员工分群画像与企业基础数据结合分析企业互联网行为进行画像;
以及,企业经营状况分析单元,用于将企业互联网行为和评价指数结合,形成企业经营行为的预判和趋势分析。
CN201610496153.9A 2016-06-29 2016-06-29 基于网络数据挖据技术的企业经营状况分析方法及系统 Pending CN106127522A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610496153.9A CN106127522A (zh) 2016-06-29 2016-06-29 基于网络数据挖据技术的企业经营状况分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610496153.9A CN106127522A (zh) 2016-06-29 2016-06-29 基于网络数据挖据技术的企业经营状况分析方法及系统

Publications (1)

Publication Number Publication Date
CN106127522A true CN106127522A (zh) 2016-11-16

Family

ID=57284748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610496153.9A Pending CN106127522A (zh) 2016-06-29 2016-06-29 基于网络数据挖据技术的企业经营状况分析方法及系统

Country Status (1)

Country Link
CN (1) CN106127522A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934054A (zh) * 2017-03-17 2017-07-07 前海梧桐(深圳)数据有限公司 基于大数据的企业细分行业精准分析方法及其系统
CN107220799A (zh) * 2017-04-24 2017-09-29 广西民族师范学院 一种创业信息反馈系统
CN107562866A (zh) * 2017-08-30 2018-01-09 肖翱 基于用户需求的匹配方法及装置
CN108416494A (zh) * 2018-01-29 2018-08-17 广州越秀金融科技有限公司 基于大数据的企业客户画像构建方法及系统实现
CN108629475A (zh) * 2017-09-08 2018-10-09 淄博职业学院 一种基于宏观经济数据的经营信息分析系统的交互方法
CN108764991A (zh) * 2018-05-22 2018-11-06 江南大学 基于K-means算法的供应链信息分析方法
CN109636111A (zh) * 2018-11-09 2019-04-16 航天信息股份有限公司 一种确定企业进项销项差异度的方法和系统
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN110348703A (zh) * 2019-06-21 2019-10-18 平安科技(深圳)有限公司 基于用户行为画像的数据处理方法、装置及电子设备
CN110941652A (zh) * 2019-12-05 2020-03-31 中投摩根信息技术(北京)有限责任公司 银行流水数据的分析方法
CN111553563A (zh) * 2020-04-07 2020-08-18 国网电子商务有限公司 企业欺诈风险的确定方法及装置
CN112819297A (zh) * 2021-01-18 2021-05-18 树根互联股份有限公司 生产任务完成效率分析方法、装置和终端设备
CN114004456A (zh) * 2021-10-09 2022-02-01 金蝶征信有限公司 数据标签的计算方法、装置、计算机设备和存储介质
CN117521969A (zh) * 2023-11-21 2024-02-06 上海张江智荟科技有限公司 一种基于数字孪生的智慧园区运行指数计算系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105371857A (zh) * 2015-10-14 2016-03-02 山东大学 一种基于公交车gnss时空轨迹数据建构路网拓扑的装置及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105371857A (zh) * 2015-10-14 2016-03-02 山东大学 一种基于公交车gnss时空轨迹数据建构路网拓扑的装置及方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934054A (zh) * 2017-03-17 2017-07-07 前海梧桐(深圳)数据有限公司 基于大数据的企业细分行业精准分析方法及其系统
CN107220799A (zh) * 2017-04-24 2017-09-29 广西民族师范学院 一种创业信息反馈系统
CN107562866A (zh) * 2017-08-30 2018-01-09 肖翱 基于用户需求的匹配方法及装置
CN108629475A (zh) * 2017-09-08 2018-10-09 淄博职业学院 一种基于宏观经济数据的经营信息分析系统的交互方法
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN109658478B (zh) * 2017-10-10 2022-11-15 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN108416494A (zh) * 2018-01-29 2018-08-17 广州越秀金融科技有限公司 基于大数据的企业客户画像构建方法及系统实现
CN108764991B (zh) * 2018-05-22 2021-11-02 江南大学 基于K-means算法的供应链信息分析方法
CN108764991A (zh) * 2018-05-22 2018-11-06 江南大学 基于K-means算法的供应链信息分析方法
CN109636111B (zh) * 2018-11-09 2023-04-18 航天信息股份有限公司 一种确定企业进项销项差异度的方法和系统
CN109636111A (zh) * 2018-11-09 2019-04-16 航天信息股份有限公司 一种确定企业进项销项差异度的方法和系统
CN110348703A (zh) * 2019-06-21 2019-10-18 平安科技(深圳)有限公司 基于用户行为画像的数据处理方法、装置及电子设备
CN110348703B (zh) * 2019-06-21 2024-03-01 平安科技(深圳)有限公司 基于用户行为画像的数据处理方法、装置及电子设备
CN110941652A (zh) * 2019-12-05 2020-03-31 中投摩根信息技术(北京)有限责任公司 银行流水数据的分析方法
CN111553563A (zh) * 2020-04-07 2020-08-18 国网电子商务有限公司 企业欺诈风险的确定方法及装置
CN112819297A (zh) * 2021-01-18 2021-05-18 树根互联股份有限公司 生产任务完成效率分析方法、装置和终端设备
CN114004456A (zh) * 2021-10-09 2022-02-01 金蝶征信有限公司 数据标签的计算方法、装置、计算机设备和存储介质
CN114004456B (zh) * 2021-10-09 2024-04-09 金蝶征信有限公司 数据标签的计算方法、装置、计算机设备和存储介质
CN117521969A (zh) * 2023-11-21 2024-02-06 上海张江智荟科技有限公司 一种基于数字孪生的智慧园区运行指数计算系统
CN117521969B (zh) * 2023-11-21 2024-05-24 上海张江智荟科技有限公司 一种基于数字孪生的智慧园区运行指数计算系统

Similar Documents

Publication Publication Date Title
CN106127522A (zh) 基于网络数据挖据技术的企业经营状况分析方法及系统
Galbreath et al. Entrepreneurial orientation and firm performance in Italian firms: The moderating role of competitive strategy
CN108846547A (zh) 一种动态调整的企业信用风险评估方法
Ting et al. The moderating role of environmental dynamism on the influence of innovation strategy and firm performance
CN104361445B (zh) 劳动力实时管理系统及管理方法
CN104809933B (zh) 一种电网无脚本应急演练系统、演练方法及设备
CN101667266A (zh) 征信评级管理咨询系统
CN101996381A (zh) 一种零售资产风险的计算方法及系统
CN110210762A (zh) 一种基于大数据分析的员工绩效动态考核方法
CN109597936A (zh) 一种新用户筛选系统及方法
CN103218743A (zh) 一种企业税务风险评估平台
CN109726247A (zh) 一种数据可视化分析系统及方法
CN110163758A (zh) 人工智能股票投资分析系统
CN107808261A (zh) Ace决策股票分析方法及系统
Wang et al. The empirical study on operating efficiency of agricultural cooperatives in Langao
CN110162572A (zh) 策略执行方法、服务器及计算机存储介质
CN112860973A (zh) 基于社交网络分析的组织健康评估方法
Yang et al. Interlocking directorate and firm’s diversification strategy: perspective of strategy learning
Guan et al. Modeling the spatial-temporal characteristics of mutual funds’ herd behavior
CN108629475A (zh) 一种基于宏观经济数据的经营信息分析系统的交互方法
Shepherd Facilitating Trade in Pharmaceuticals: A Response to the COVID 19 Pandemic
CN106779273A (zh) 一种服务质量评估系统
Jamali et al. An assessment of the causal model of effective metrics on urban competitiveness using a fuzzy DEMATEL approach
CN107730080A (zh) 一种用于政府购买服务的第三方食品检测机构评价方法
Nikomaram et al. Conceptual Model for Behavioral Accounting

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161116