CN113259150B - 一种数据处理方法、系统以及存储介质 - Google Patents

一种数据处理方法、系统以及存储介质 Download PDF

Info

Publication number
CN113259150B
CN113259150B CN202110341335.XA CN202110341335A CN113259150B CN 113259150 B CN113259150 B CN 113259150B CN 202110341335 A CN202110341335 A CN 202110341335A CN 113259150 B CN113259150 B CN 113259150B
Authority
CN
China
Prior art keywords
data
network data
network
parameter
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110341335.XA
Other languages
English (en)
Other versions
CN113259150A (zh
Inventor
徐艺萍
齐思慧
李晨龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202110341335.XA priority Critical patent/CN113259150B/zh
Publication of CN113259150A publication Critical patent/CN113259150A/zh
Application granted granted Critical
Publication of CN113259150B publication Critical patent/CN113259150B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种数据处理方法、系统以及存储介质。该方法包括:获取包含目标数据的网络数据;所述网络数据,来源于至少两种类型的网络平台;对网络数据进行分析,确定相应参数,基于所述网络数据中所述目标数据的分布状态,确定第一参数;基于所述网络数据的来源信息,确定第二参数;对所述网络数据进行分析,确定第三参数;所述第三参数,至少包括情感分析结果;对所述网络数据的内容进行分析,确定第四参数以及第五参数;所述第四参数,包括对所述网络数据的访问参数;所述第五参数,包括所述网络数据的内容特征参数;基于所述相应参数中的至少两个参数,对所述网络数据进行处理,得到处理结果;所述处理结果表示所述目标数据的网络影响程度。

Description

一种数据处理方法、系统以及存储介质
技术领域
本申请涉及信息技术领域,尤其涉及一种数据处理方法、数据处理系统系统以及计算机可读存储介质。
背景技术
在相关技术中,在进行品牌推广策划、或品牌价值评估时,品牌运营商通常需要获取品牌的认知度,品牌的认知度可以通过品牌的影响力获得。在实际应用中,通常是由各个网络平台自主评估的,并且,各个网络平台的自主评估,只能根据网络平台自身对网络数据的固有管理特点进行。然而,通过以上方式得到的品牌认知度,无法全面而客观的反映出该品牌在整个互联网体系中的真实影响力。
发明内容
本申请实施例提供了一种数据处理方法、数据处理系统以及计算机可读存储介质。
本申请实施例提供的数据处理方法,能够根据包含有目标数据的网络数据,确定至少两种分析参数,并依据至少两种分析参数,对来自任意至少两个网络平台的网络数据进行处理,得到表示目标数据的网络影响程度的处理结果,从而能够实现对全网络平台中任意多个网络平台的网络数据分析,进而能够得到目标数据在全网络平台中的全面而客观的影响程度信息。
本申请实施例提供的技术方案是这样的:
一种数据处理方法,所述方法包括:
获取包含目标数据的网络数据;其中,所述网络数据,来源于至少两种类型的网络平台;
对网络数据进行分析,确定相应参数,其中:
基于所述网络数据中所述目标数据的分布状态,确定第一参数;
基于所述网络数据的来源信息,确定第二参数;
对所述网络数据进行分析,确定第三参数;其中,所述第三参数,至少包括情感分析结果;
对所述网络数据的内容进行分析,确定第四参数以及第五参数;其中,所述第四参数,包括对所述网络数据的访问参数;所述第五参数,包括所述网络数据的内容特征参数;
基于所述相应参数中的至少两个参数,对所述网络数据进行处理,得到处理结果;其中,所述处理结果表示所述目标数据的网络影响程度。
在一些实施方式中,所述第二参数,包括以下至少之一:所述网络数据对应的网络平台的类型、所述网络数据对应的网络平台的级别、发布所述网络数据的用户账户的类型。
在一些实施方式中,所述第三参数,还包括可信度以及地址有效性至少之一;所述对所述网络数据进行分析,确定第三参数,包括:
对所述网络数据进行有效性分析,确定所述可信度以及所述地址有效性;其中,所述可信度,用于表示所述网络数据是否真实;所述地址有效性,用于表示所述网络数据对应的链接地址的持续有效时间;
对所述网络数据中所包含的情感数据进行标签标注,得到所述情感分析结果。
情感分析结果,为对所述网络数据的进行情感分析确定的结果。
在一些实施方式中,所述第四参数,为分享所述网络数据的数量信息。
在一些实施方式中,所述第五参数,包括以下至少之一:原创标识、分享信息、内容信息量;其中,所述原创标识,用于表示所述网络数据是否为原创数据;所述分享信息,包括所述网络数据的分享状态信息;所述内容信息量,包括所述网络数据所承载的内容的种类和/或数量。
在一些实施方式中,所述基于所述相应参数中的至少两个参数,对所述网络数据进行处理,得到处理结果,包括:
基于所述网络数据,确定处理策略;其中,所述处理策略,包括对所述相应参数中至少两个参数的选择策略;
基于所述处理策略以及所述相应参数,对所述网络数据进行处理,得到所述处理结果。
在一些实施方式中,所述选择策略,包括对所述相应参数中至少两个参数的加权策略;所述基于所述网络数据,确定处理策略,包括:
对所述网络数据的结构进行分析,确定分析结果;其中,所述分析结果,包括所述网络数据所包含的至少一种数据的类型;
基于所述分析结果,确定所述加权策略。
在一些实施方式中,所述处理策略,还包括对所述网络数据的融合策略;所述基于所述网络数据,确定处理策略,包括:
对所述网络数据进行分析,确定比例信息;其中,所述比例信息,包括所述源于各个所述网络平台的网络数据之间的比例;
基于所述比例信息,确定所述融合策略。
本申请实施例还提供了一种数据处理系统,所述数据处理系统包括:数据获取模块、参数处理模块以及数据处理模块,其中:
所述数据获取模块,用于获取包含目标数据的网络数据;其中,所述网络数据,来源于至少两种类型的网络平台;
所述参数处理模块,用于对所述网络数据进行处理,确定相应参数;
所述参数处理模块,用于基于所述网络数据中的所述目标数据的分布状态,确定第一参数;基于所述网络数据的来源信息,确定第二参数;对所述网络数据进行分析,确定第三参数;其中,所述第三参数,至少包括情感分析结果;对所述网络数据的内容进行分析,确定第四参数以及第五参数;其中,所述第四参数,包括对所述网络数据的访问参数;所述第五参数,包括所述网络数据的内容特征参数;
所述数据处理模块,用于基于所述相应参数中的至少两个参数,对所述网络数据进行处理,得到处理结果;其中,所述处理结果表示所述目标数据的网络影响程度。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序;所述计算机程序能够被处理器执行,以实现如前任一所述的数据处理方法。
由以上可知,通过本申请实施例提供的数据处理方法,在获取到包含目标数据的、源于至少两种类型的网络平台的网络数据之后,能够对网络数据进行分析,得到表征目标数据分布状态、网络数据来源信息、网络数据的情感分析结果、对网络数据的访问参数以及网络数据的内容特征参数的相应参数,以上各个参数分别能够从不同的维度、不同的侧面反应网络数据在网络平台中的存在特征,然后基于相应参数中的至少两个参数,对网络数据进行处理,因此,通过上述得到的处理结果,能够从不同维度、不同侧面,全面而客观的反应目标数据在全网络中的真实的网络影响程度。
附图说明
图1为本申请实施例提供的数据处理方法的第一种流程示意图;
图2为本申请实施例提供的数据处理方法的第二种流程示意图;
图3为本申请实施例提供的相应参数的分布结构示意图;
图4为本申请实施例提供的数据处理系统的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请涉及信息技术领域,尤其涉及一种数据处理方法、数据处理系统系统以及计算机可读存储介质。
随着互联网技术的发展,各种类型的信息数据在互联网上的传播速度、以及传播范围超过了以往任何时代。其中,上述各种类型的信息数据,包括与品牌相关的信息数据,比如商品品牌信息、用户对品牌的关注程度、用户对品牌的使用感受等。
因此,在品牌商执行品牌推广之前,通常需要基于网络中传播和分布的与品牌相关的网络数据,对本品牌的市场影响力、或者相关竞品的市场影响力进行分析,然后再根据分析结果制定针对性更强的品牌推广方案。
在实际应用中,任一品牌的市场影响力的数据分析结果,通常是通过各个网络平台的平台独立统计得到的。也就是说,各个不同的网络平台所提供的品牌的市场影响力的分析结果,是依据网络平台本身对数据的管理特性,对网络平台所承载和管理的网络数据进行分析而得到的。
以微博平台为例,比如品牌运营商想要在微博中确定某一品牌的品牌影响力,则微博平台可以提供与品牌影响力统计结果,在实际应用中,微博平台提供的上述结果,通常是以与账号信息关联的日榜、或月榜、或周榜体现的;而品牌运营商通常需要获取多个平台中的品牌影响力,以微信平台为例,微信平台又根据其对数据的管理方式、对品牌相关的数据进行统计,得到微信平台的品牌影响力统计结果。以上两种统计结果之间是相互独立的、彼此割裂开来的,因此,品牌运营商无法根据以上两种统计结果,全面而客观的获知该品牌或竞品在两个平台中的整体影响力。
基于以上问题,本申请实施例提供了一种数据处理方法,该数据处理方法,在获取包含目标数据的、来源于至少两种类型的网络平台的网络数据之后,对网络数据进行处理,可以确定对网络数据进行分析的相应参数,再根据相应参数中的至少两个参数,对网络数据进行处理,从而能够得到表征目标数据在至少两种类型的网络平台中的网络影响程度的处理结果,因此,通过本申请实施例提供的数据处理方法,能够得到品牌在全网络平台中的全面而客观的品牌网络影响力信息。
需要说明的是,本申请实施例提供的数据处理方法,可以是通过数据处理系统中的处理器来实现的,上述处理器可以为特定用途集成电路(Application SpecificIntegrated Circuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(ProgrammableLogic Device,PLD)、现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。
图1为本申请实施例提供的数据处理方法的第一种流程示意图。如图1所示,该方法可以包括步骤101至步骤103:
步骤101、获取包含目标数据的网络数据。
其中,网络数据,来源于至少两种类型的网络平台。
在一种实施方式中,网络平台的类型,可以是根据网络平台所管理的数据的类型划分的,比如第一类型的网络平台,管理的数据类型可以为视频数据和/或图片数据;第二类型的网络平台,可以管理的数据类型可以为音频数据。
在一种实施方式中,网络平台的类型,可以是根据网络平台对数据的管理方式划分的,比如,第三类型的网络平台,可以是用于提供数据上传和下载功能的网络平台;第四类型的网络平台,可以是用于提供数据搜索功能的网络平台。
在一种实施方式中,目标数据,可以是与指定品牌相关的数据,比如,与第一品牌相关的数据。
在一种实施方式中,与指定品牌相关的数据,可以是指定品牌的关键词,这些关键词中可以包括指定品牌的品牌名称、功能信息描述、品牌历史等至少一个。
在一种实施方式中,与指定品牌相关的数据,可以是用户发布的品牌使用感受数据。示例性地,品牌使用感受数据,可以包括对品牌的投诉数据、对品牌功能肯定性的数据等。
在一种实施方式中,与指定品牌相关的数据,可以是与指定品牌的功能相似或相同的竞品品牌数据;比如,指定品牌为第一品牌的制冷设备,那么,与指定品牌相关的数据,可以为第二品牌的制冷设备。
在一种实施方式中,与指定品牌相关的数据,可以是与指定品牌的功能有关联关系的数据;比如,指定品牌为第一品牌的清洁工具,比如吸尘器;那么,与指定品牌相关的数据,可以为第二品牌的清洁工具配件产品,比如滤网。
在一种实施方式中,目标数据可以是字符串的形式体现,且字符串的长度可以较长;或者,字符串的个数,可以为多个。
在一种实施方式中,包含目标数据的网络数据,可以包括文本数据、图片数据、视频数据、音频数据中的至少一种。
在一种实施方式中,网络数据的数量,可以超过第一阈值。
在一种实施方式中,网络数据中来自每一网络平台的数量,可以分别超过第二阈值。
在一种实施方式中,网络数据,可以是实时获取的。
在一种实施方式中,网络数据,可以包括从至少两种类型的网络平台获取的多个时段内的历史数据。
在一种实施方式中,网络数据,可以包括至少两种类型的网络平台所管理的历史数据、以及这些历史数据的变化信息。
在一种实施方式中,两种类型的网络平台的数量,可以不同,比如,在获取网络数据时,可以从第一类型的网络平台,选取第一数量的网络平台;可以从第二类型的网络平台,选取第二数量的网络平台。
步骤102、对网络数据进行分析,确定相应参数。
在一种实施方式中,对网络数据进行分析,可以是通过以下任一方式进行的:
对来源于每一类型的网络平台的网络数据分别进行分析;
对网络数据进行预处理,得到预结果,并对预处理结果进行分析。
在一种实施方式中,对网络数据进行预处理,可以包括以下任一种处理方式:
按照网络数据的大小,对网络数据进行排序处理;
按照网络数据的获取时间,对网络数据进行排列处理;
按照网络数据的类型,对网络数据进行分类处理;
按照网络数据中目标数据出现的频率,对网络数据进行排列处理。
在本申请实施例中,相应参数,可以至少包括第一参数、第二参数、第三参数、第四参数以及第五参数。
在本申请实施例中,相应参数中的第一参数,可以通过以下方式获取:
基于网络数据中目标数据的分布状态,确定第一参数。
在本申请实施例中,第一参数,还可以包括与目标数据相关的竞品数据的分布状态。
在一种实施方式中,竞品数据,可以为目标数据对应的竞品品牌相关的数据。
在一种实施方式中,目标数据的分布状态,可以包括目标数据是否出现在网络数据的指定位置;其中,指定位置,可以为网络数据的标题位置。
在一种实施方式中,目标数据的分布状态,可以包括目标数据在任一份网络数据中出现的位置信息。
在一种实施方式中,位置信息,可以包括网络数据的标题位置、首段位置、末段位置、中间段落位置等。
在一种实施方式中,第一参数,可以包括网络数据中各个目标数据出现的位置的统计信息。
在本申请实施例中,由于目标数据可以分布在网络参数的各个位置,因此,第一参数,可以表示目标数据在网络数据中的提及度、或者谈论度。
在一种实施方式中,第一参数,可以包括目标数据中的每一数据、在网络数据中出现的位置信息的第一统计结果。比如,第一个目标数据出现在网络数据的第一位置,第二目标数据出现在网络数据的第二位置。
在一种实施方式中,第一参数,还可以包括目标数据中的每一数据、在网络数据中出现的位置信息的第二统计结果;其中,第二统计结果,可以包括目标数据中的每一数据在网络数据中的出现位置、以及出现频次。比如,第一个目标数据出现在网络数据的第一位置出现M次;其中,M为大于0的整数。
在一种实施方式中,第一参数,可以是对第二统计结果执行第一计算得到的。
在一种实施方式中,第一计算,可以包括对第二统计结果中每一目标数据的统计结果进行加权计算。
在一种实施方式中,第一计算,可以基于德菲尔法(Delphi Method)的位置权重,对第二统计结果进行加权计算,比如,标题部分出现的目标数据的权重为第一权值;首段部分出现的目标数据的权重为第二权值;末段部分出现的目标数据的权重为第三权值。示例性地,第一权值可以为1;第二权值可以为0.3;第三权值可以为0.1;示例性地,网络数据其它位置出现的目标数据对应的权值可以为0.1。
在一种实施方式中,第一计算,可以是按照目标数据出现位置对应的权重、对各个目标数据分别出现的次数进行加权计算。
通过以上方式,本申请实施例提供的数据处理方法,能够确定源自任意类型的网络平台中目标数据的分布状态,即实现了目标数据分布状态的客观的、全网络平台的提取,为品牌的网络影响程度的全面客观分析提供了有力保障。
在本申请实施例中,相应参数中的第二参数,可以通过以下方式获取:
基于网络数据的来源信息,确定第二参数。
在一种实施方式中,第二参数,可以包括网络数据的第一来源的信息。示例性地,第一来源,可以包括得到网络数据的网络平台的类型。
在一种实施方式中,第二参数,可以包括网络数据的第二来源的信息,示例性地,第二来源,可以包括网络数据对应的网络地址。
在一种实施方式中,网络数据的来源信息,可以是直接包含在网络数据对应的链接中的,示例性地,上述链接可以为统一资源定位符(Uniform Resource Locator,URL)。
在本申请实施例中,相应参数中的第三参数,可以通过以下方式获取:
对网络数据进行分析,确定第三参数;其中,第三参数,至少包括情感分析结果;所述第三参数,。
在一种实施方式中,情感分析结果,为对网络数据的进行情感分析确定的结果。
在一种实施方式中,情感分析结果,可以表示对发布网络数据的用户的情感进行分析的结果。
在一种实施方式中,情感分析结果的取值,可以在-1至1之间,接近-1的取值,表示用户的情感为负面情感;接近1的取值,则可以表示用户的情感为正面情感;在上述区间中间位置的取值,可以为较为中性的情感。在本申请实施例中,相应参数中的第四参数以及第五参数,可以通过以下方式获取:
对网络数据的内容进行分析,确定第四参数以及第五参数。
其中,第四参数,包括对网络数据的访问参数;第五参数,包括网络数据的内容特征参数。
在一种实施方式中,对网络数据的访问参数,可以包括浏览网络数据次数、阅读网络数据次数、下载网络数据次数、截屏网络数据次数等的至少一种信息。
在一种实施方式中,第四参数,还可以包括网络平台的会员账户、非会员账户等任一类型账户对网络数据的访问信息。
在一种实施方式中,第四参数,可以是根据网络平台中会员账户的级别、对各个级别的账户访问网络数据的访问信息进行统计得到的。
在一种实施方式中,第四参数,可以是根据各种类型的账户、以及网络数据访问的时间轨迹,对网络数据进行统计而得到的。
在一种实施方式中,网络数据的内容特征参数,可以包括网络数据的类型参数,比如,网络数据的类型为文本数据、视频数据、音频数据还是图片数据等。
在一种实施方式中,网络数据的内容特征参数,可以包括网络数据中各种类型数据的组织形式,比如,网络数据中可以包含文本数据、视频数据、音频数据以及图片数据中的至少两种数据,其中,文本数据与视频数据在网络数据中可以相邻设置。
由以上可知,本申请实施例提供的数据处理方法,在获取到包含目标数据的、源于至少两种类型的网络平台的网络数据之后,能够对网络数据进行分析,得到表征目标数据分布状态、网络数据来源信息、网络数据有效性、对网络数据的访问参数以及网络数据的内容特征参数的相应参数,以上各个参数分别能够从不同的维度、不同的侧面反应网络数据在网络平台中的存在特征,从而为后续全面而客观的确定目标数据、在全网络平台的网络影响程度奠定了基础。
步骤103、基于相应参数中的至少两个参数,对网络数据进行处理,得到处理结果。
其中,处理结果表示目标数据的网络影响程度。
在一种实施方式中,基于相应参数中的至少两个参数,对网络数据进行处理,可以是通过以下任一方式进行的:
基于相应参数中的至少两个参数,对网络数据集合中的每一网络数据进行处理。
基于相应参数中的至少两个参数,从网络数据集合中抽取指定数量的网络数据并进行处理。
从至少两种类型的网络平台中获取的新的网络数据,然后基于相应参数中的至少两个参数,对获取的新的网络数据进行处理。
在一种实施方式中,目标数据的网络影响程度,可以用影响级别表示,比如,一级影响力、二级影响力等。
在一种实施方式中,目标数据的网络影响程度,可以用数字表示,其中,上述数字可以是十进制、八进制、十六进制等。
在一种实施方式中,目标数据的网络影响程度,可以是对网络数据中的、各种类型数据体现形式的统计结果,比如,在视频类型的网络数据中的影响力为一级影响力、在音频类型的网络数据中的影响力为二级影响力等。
由以上可知,通过本申请实施例提供的数据处理方法,在获取到包含目标数据的、源于至少两种类型的网络平台的网络数据之后,能够对网络数据进行分析,得到表征目标数据分布状态、网络数据来源信息、网络数据的情感分析结果、对网络数据的访问参数以及网络数据的内容特征参数的相应参数,以上各个参数分别能够从不同的维度、不同的侧面反应网络数据在网络平台中的存在特征,然后基于相应参数中的至少两个参数,对网络数据进行处理,得到的处理结果,能够从不同维度、不同侧面,全面而客观的反应目标数据的真实的网络影响程度。
基于前述实施例,本申请实施例提供了第二种数据处理方法,图2为本申请实施例提供的数据处理方法的第二种流程示意图,如图2所示,该数据处理方法可以包括步骤201至步骤204:
步骤201、获取包含目标数据的网络数据。
其中,网络数据,来源于至少两种类型的网络平台。
步骤202、对网络数据进行分析,确定相应参数。
在本申请实施例中,相应参数,可以包括前述实施例中的第一参数、第二参数、第三参数、第四参数以及第五参数。
在本申请实施例中,第二参数,包括以下至少之一:网络数据对应的网络平台的类型、网络数据对应的网络平台的级别、发布网络数据的用户账户的类型。
在一种实施方式中,网络平台的类型,可以是根据网络平台管理的数据类型划分的,比如,网络平台可以包括门户网站、行业网站、企业网站、政府网站以及个人网站等。
在一种实施方式中,网络平台的类型,可以是根据网络平台提供的功能划分的,比如网络平台包括社交平台、资讯获取平台等。
在一种实施方式中,网络平台的级别,可以是根据网络平台承载的数据、和/或触达人群划分的。
在一种实施方式中,网络平台的级别,可以分为第一级别、第二级别以及第三级别等。示例性地,第一级别,可以高于第二级别以及第三级别。
在一种实施方式中,根据德尔菲法,网络平台的级别不同,对应的权重也不同。
在一种实施方式中,发布网络数据的用户账户的类型,可以包括核心账户、重要(Very Important Person,VIP)账户、普通账户等。
在一种实施方式中,发布网络数据的用户账户的类型确定因素可以包括:账户的认证信息、账户的关注信息等;其中,账户的关注信息,可以包括关注该账户的用户的数量,比如粉丝数量。示例性地,粉丝数量少于一指定阈值的情况下,可以认为账户为普通账户,通过这种类型的账户发布的网络数据的权重可以是较低的;相应地,在粉丝数量超过指定阈值的情况下,可以认为账户为非普通账户,通过这种类型的账户发布的网络数据的权重,可以是较高的。
在一种实施方式中,第二参数中所包含的各个维度的参数对应的权重,也可以是按照德尔菲法确定的。
在相关技术中,任一网络平台中与品牌相关的网络数据,是以相互独立的账户为单位进行统计并呈现的,比如某一平台的品牌数据发布的账户周排行榜。这种方式并未考虑不同的账户级别对网络数据中目标数据传播的影响因素。而本申请实施例提供的数据处理方法,能够综合考虑网络平台类型、网络平台级别、以及账户类型对目标数据传播的影响,从而为目标数据在网络平台中影响力的客观平度提供了保障。
在本申请实施例中,第三参数,还包括可信度以及地址有效性至少之一。相应地,对网络数据进行分析,确定第三参数,是通过以下方式实现的:
对网络数据进行有效性分析,确定可信度和/或地址有效性;其中,可信度,用于表示网络数据是否真实;地址有效性,用于表示网络数据对应的链接地址的持续有效时间;
对网络数据中所包含的情感数据进行标签标注,得到情感分析结果。
在一种实施方式中,有效性分析,可以用于确定网络数据是否为有效数据,即网络数据的数据量是否大于指定阈值,或者网络数据对应的数据量是否大于0。
在一种实施方式中,第三参数的取值,可以包括网络数据有效、以及网络数据无效两种。
在一种实施方式中,第三参数,可以包括网络数据的有效级别,比如,第一份网络数据的有效级别为一级;第二份网络数据的有效级别为二级等。
在一种实施方式中,第三参数,可以包括网络数据在网络平台中的有效时间,比如,第三参数的可持续访问时间为三天。
在一种实施方式中,可信度,可以表示网络数据是否符合实际客观事实;相应地,网络数据的可信度,可以包括网络数据真实、以及网络数据虚假两种类型。示例性地,网络数据的可信度的取值,可以是数字。
在一种实施方式中,网络数据是否真实,可以表示网络数据是否为谣言数据。示例性地,若网络数据为谣言,该网络数据对应的权重可以为0;反之,网络数据对应的权重可以为大于0的数字。
在一种实施方式中,对网络数据是否真实的评价,可以参照权威网络平台中发布的、与网络数据内容相似、或内容相关的信息进行。
在一种实施方式中,持续有效时间,可以为一个连续的时间段,比如连续的24小时。
在一种实施方式中,持续有效时间,可以表示一个离散的时间段,比如,第一天的15:00-18:00有效,第二天的12:00-14:00有效。
在一种实施方式中,网络数据对应的链接地址的持续有效时间大于时间阈值,则可以设定该网络数据的权重较重;反之,则可以设定该网络数据的权重较轻。示例性地,时间阈值,可以是通过多个网络平台中,对用户针对网络数据的关注热度持续时间分析得到的,比如,通过网络平台比如微博平台中用户转发持续时间、评论持续时间、点赞持续时间等数据的分析,可以得知,90%左右的关注度、转发热度、评论热度、点赞热度的拐点发生在一天左右,因此,时间阈值可以相应设置为一天。
在一种实施方式中,可以根据持续有效时间的实际长度,设定网络数据对应的持续有效性分值,示例性地,若持续有效时间的实际长度小于时间阈值,则可以设定持续地址有效性分值为0;反之,可以设定持续地址有效性分值为1。
在一种实施方式中,情感分析结果,可以以情感标签的方式体现,示例性地,情感标签可以以预先定义的枚举类型呈现。
在一种实施方式中,情感分析结果,可以是通过机器学习算法,对网络数据中所包含的信息进行统计得到的。在一种实施方式中,第三参数中所包含的各个维度的参数对应的权重,也可以是按照德尔菲法确定的。
在一种实施方式中,在除去情感分析结果之外、第三参数还包含有其它参数的情况下,第三参数中所包含的情感分析结果的权重,可以高于其它参数的权重。比如,在第三参数包括情感分析结果、可信度以及地址有效性三个参数的情况下,情感分析结果对应的第一权重,可以高于可信度对应的第二权重、以及地址有效性对应的第三权重。
在本申请实施例中,第四参数,为分享网络数据的数量信息。
在一种实施方式中,分享网络数据的数量信息,可以包括对网络数据的阅读数量或播放数量、点赞数量、评论数量、转发数量等至少一种。
在一种实施方式中,可以根据网络平台对数据管理的特点,确定第四参数的具体内容。比如,第一类型的网络平台主要用于呈现文本数据,则其所对应的第四参数,可以为阅读数量、评论数量、点赞数量以及转发数量等;第二类型的网络平台主要用于播放视频,则其所对应的第四参数,可以为点赞数量、转发数量等。
在一种实施方式中,第四参数,还可以用于表示网络平台中的用户对网络数据的互动指数。
在本申请实施例中,第五参数,包括以下至少之一:原创标识、分享信息、内容信息量。
其中,原创标识,用于表示网络数据是否为原创数据;分享信息,包括网络数据的分享状态信息;内容信息量,包括网络数据所承载的内容的种类和/或数量。
在一种实施方式中,原创标识,可以为网络平台为网络数据添加的、用于表示网络数据为原创数据的标识。
在一种实施方式中,若网络数据为原创数据,则网络数据携带有原创标识;反之,网络数据可以不携带该标识。
在一种实施方式中,网络数据是否为原创数据,还可以通过在全网范围内,检索、查找、判断是否存在与网络数据对应的数据确定。
在一种实施方式中,若网络数据为原创数据,则第五参数中原创标识对应的权重可以为1,反之,该权重可以为0。
在一种实施方式中,分享信息,可以包括网络数据是否被分享至指定类型的网络平台。比如,网络数据是否被分享至热度较高的日报、或周报。
在一种实施方式中,若网络数据被分享至指定类型的网络平台,则第五参数中与分享信息对应的权重可以较高;反之,该权重可以较低。
在一种实施方式中,内容信息量,可以包括网络数据所承载的内容的丰富程度,示例性地,还可以包括网络数据所承载的话题的丰富程度。
在一种实施方式中,内容信息量,可以是通过类似于识别机器人写作的方法,对网络数据进行分析而确定的。
在一种实施方式中,若内容信息量较大,则第五参数中与内容信息量对应的权重可以较高;反之,则该权重可以较低。
图3为本申请实施例提供的相应参数的分布结构示意图。如图3所述,前述实施例所提及的第一参数至第五参数可以合并为BASIC指数,其中,B代表品牌谈论度,即BrandTendency;A代表平台/作者权威性及影响力,即Authority;S代表情感指数,即Sentiment;I代表互动指数,即Interaction;C代表内容创作指数,即Content。
在图3中,内容创作指数,可以包括内容深度及话题丰富程度、内容是否被编辑推荐入日报/周报、以及内容是否原创。其中,上述内容,可以是对网络数据进行内容分析得到的。
在图3中,平台/或作者权威性及影响力,可以包括媒体等级、网站频道触达人群以及自媒体粉丝数等。其中,媒体等级,可以为前述实施例所述的网络平台的等级。
在图3中,互动指数,可以包括针对网络数据的阅读数/播放量、点赞数、评论数、转发数等。
在图3中,情感指数,可以包括情感分值、是否谣言、URL是否仍然有效等信息。
由图3可知,通过本申请实施例提供的数据处理方法,在获取到网络数据之后,对网络数据进行处理,可以灵活的获取多个维度的、多个方面的目标数据影响力评估参数,在后续对网络数据评估的过程中,这些参数能够极大地改善目标参数的网络影响程度的客观性、以及全面性。
在本申请实施例中,对网络数据进行分析,还可以确定除去相应参数之外的其它参数,本申请实施例对此不做限定。
在相关技术中,大型的网络平台能够提供品牌影响力的数据分析,但这些平台只能根据其自身的数据管理优势,确定对网络数据分析的维度,比如,有的网络平台的数据管理优势在于搜索,而有的网络平台的数据管理优势在于数据推荐。由于各个网络平台的数据管理优势各不相同,因此,这些网络平台提供的网络数据分析结果,仅能体现单一平台上的、固定维度的网络影响程度。
而本申请实施例提供的数据处理方法,在获取至少两种类型的网络平台的数据之后,对网络数据进行分析,就可以获取第一参数、第二参数、第三参数、第四参数以及第五参数,还能够对各个参数进行进一步的细化,从而使得对网络数据的分析维度得到了极大的扩展和改善,更进一步地,针对细化得到的更高维度的维度参数设置对应的权重,那么,基于这些权重以及参数对网络数据的内容进行处理得到的处理结果,就能够更加全面、更加客观的反应出目标数据在各个网络平台中的网络影响程度。
步骤203、基于网络数据,确定处理策略。
其中,处理策略,包括对相应参数中至少两个参数的选择策略。
在一种实施方式中,处理策略,可以包括基于网络数据,如何确定选择相应参数中的两个参数、三个参数、四个参数还是全部参数的策略。
在一种实施方式中,处理策略,可以包括基于网络数据,对相应参数中的各个参数设定优先级,并按照优先级,从相应参数中选择至少两个参数的策略。
在一种实施方式中,处理策略,可以包括根据网络数据的类型,确定相应参数中、与网络数据的特征信息匹配度较好的参数的策略。
在一种实施方式中,处理策略,可以包括对相应参数中各个参数所包含的子参数选取与否的策略。
步骤204、基于处理策略以及相应参数,对网络数据进行处理,得到处理结果。
在一种实施方式中,基于处理策略以及相应参数,对网络数据进行处理,可以是基于处理策略,从相应参数中选取目标参数,再基于目标参数对网络数据进行处理。
在一种实施方式中,可以是基于处理策略以及相应参数确定目标参数,然后基于目标参数中的每一参数,分别对网络数据中所包含的目标数据、以及与目标数据相关的数据进行加权计算,得到与每一参数对应的计算结果,最后将各个计算结果相乘,从而得到最终的处理结果。
在一种实施方式中,处理结果可以以数值的形式体现,且该数值越大,可以表示目标数据的网络影响程度越高。
在一种实施方式中,处理结果,可以按照与第一参数至第五参数中的至少两个参数、对应的维度展示目标数据的网络影响程度。
在本申请实施例中,选择策略,包括对相应参数中至少两个参数的加权策略。
在一种实施方式中,对相应参数中至少两个参数的加权策略,可以是基于网络数据确定的。示例性地,若网络数据来自于权威网络平台,则可以确定第三参数和/或第三参数中的各个子参数的权重较高。
在一种实施方式中,对相应参数中至少两个参数的加权策略,可以是基于对网络数据分析的需要而确定的。示例性地,若网络数据源自于多种类型的网络平台,或者网络数据来自多个网络平台,则可以确定第一参数至第五参数的权重可以平均分配;反之,若网络数据源于非权威网络平台,则除去第三参数以及第五参数之外的其它参数和/或子参数的权重可以较高;而第三参数以及第五参数的权重可以较低。
相应地,在选择策略,包括对相应参数中至少两个参数的加权策略的情况下,步骤204,可以通过步骤A1至步骤A2实现:
步骤A1、对网络数据的结构进行分析,确定分析结果。
其中,分析结果,包括网络数据所包含的至少一种数据的类型。
在一种实施方式中,对网络数据的结构进行分析,可以包括对网络数据集合的中每一网络数据的来源结构进行分析,相应地,分析结果中可以包含网络数据来源的划分信息,比如有第一数量的网络数据来自第一类型网络平台;第二数量的网络数据来自第二类型的网络平台。
在一种实施方式中,对网络数据的结构进行分析,可以包括对网络数据集合中每一网络数据所承载的数据类型的特征结构进行分析,相应地,分析结果中,可以包含网络数据所承载的与数据类型相关的划分信息,比如第一部分的网络数据中视频数据所占比例较大;第二部分的网络数据中文本数据的所占比例较大。
步骤A2、基于分析结果,确定加权策略。
在一种实施方式中,基于分析结果,确定加权策略,可以是通过以下任一方式实现的:
基于分析结果,确定至少两个参数中每一参数的绝对权重。
基于分析结果,确定至少两个参数中每一参数的相对权重。
基于分析结果,确定至少两个参数中各个子参数是否选择。
基于分析结果,确定至少两个参数中被选择的每一子参数的权重。
通过以上方式,本申请实施例提供的数据处理方法,在对网络数据处理的过程中,能够基于网络数据本身的特性确定加权策略,再根据加权策略对网络数据进行处理,从而使得最终得到的处理结果能够客观的反应网络数据真实的网络影响程度。
在本申请实施例中,处理策略,还包括对网络数据的融合策略。
在一种实施方式中,网络数据的融合策略,可以包括是否增加对某一网络平台的网络数据的数据量的策略。示例性地,在从某一网络平台中获取的网络数据的数据量较少的情况下,可以再次执行获取该网络平台中网络数据的获取操作。
在一种实施方式中,网络数据的融合策略,可以包括对各个网络平台的数据进行加权的策略,比如,将源于第一网络平台的网络数据的权重,设置为第一数值;将源于第二网络平台的网络数据的权重,设置为第二数值。
在一种实施方式中,网络数据的融合策略,可以是根据各个网络数据中所携带的账户级别信息确定的,比如,源于第一网络平台的网络数据并未携带账户级别信息,则基于第二参数对该网络数据分析时,可以降低第一网络平台的网络数据的权重。
在一种实施方式中,网络数据的融合策略,可以是根据对目标数据的分析需求而确定的,比如,网络数据处理的侧重点可以是视频类型的网络数据,则对包含有视频类型的网络数据,可以设置较高的权重,而对未包含视频类型的网络数据,可以设置较低的权重。
相应地,在处理策略包括对网络数据的融合策略的情况下,步骤204,可以通过步骤B1至步骤B2实现:
步骤B1、对网络数据进行分析,确定比例信息。
其中,比例信息,包括源于各个网络平台的网络数据之间的比例。
在一种实施方式中,步骤B1可以通过以下任一方式实现:
根据网络平台的数据管理方式,对网络数据进行分析,确定比例信息。
根据网络数据所携带的数据类型,确定比例信息。
对网络数据携带的数据的可信度首先进行分析,并根据可信度分析结果,确定比例信息。
对网络数据的原创标识进行确认,根据原创标识确认结果,确定比例信息。
对网络数据中目标数据的分布状态进行分析,若分布状态表示分布较为分散、或者网络数据的指定位置并未分布目标数据,则可以确定网络数据的比例较低。
在一种实施方式中,各个网络数据对应的比例信息之和,可以为1。
步骤B2、基于比例信息,确定融合策略。
在一种实施方式中,基于比例信息,确定融合策略,可以是通过以下任一方式实现的:
基于比例信息,确定对各个网络数据处理时如何加权的策略。
基于比例信息,确定从网络数据集合中选择最终需要分析的网络数据的策略。
而通过本申请实施例提供的数据处理方法,能够根据网络数据本身所包含的信息确定网络数据的融合策略,再根据融合策略以及相应参数,对网络数据进行处理,如此,在网络数据处理过程中,兼顾了每一类型的网络平台的数据特性,从而减少了由于任一类型的网络平台未包含指定数据、而导致的与目标数据相关的信息缺失问题,进而提高了处理结果的准确性。
由以上可知,本申请实施例提供的数据处理方法中,相应参数中的各个子参数还包括多种类型,因此,这些子参数能够从多个维度反应网络数据的实际特性;在实际对网络数据分析的过程中,还能基于网络数据确定处理策略,再根据处理策略对网络数据进行处理,从而能够使得网络数据的处理操作能够兼顾网络数据特性、以及网络平台的数据管理特性,进而使得最终确定的处理结果能够全面而客观的反应出目标数据在网络平台中的实际影响程度。
基于前述实施例,本申请实施例还提供了一种数据处理系统4。图4为本申请实施例提供的数据处理系统4的结构示意图,如图4所示,该系统可以包括:数据获取模块401、参数处理模块402以及数据处理模块403,其中:
数据获取模块401,用于获取包含目标数据的网络数据;其中,网络数据,来源于至少两种类型的网络平台;
参数处理模块402,用于对网络数据进行处理,确定相应参数;
参数处理模块402,用于基于网络数据中的目标数据的分布状态,确定第一参数;基于网络数据的来源信息,确定第二参数;对网络数据进行分析,确定第三参数;其中,第三参数,至少包括情感分析结果;对网络数据的内容进行分析,确定第四参数以及第五参数;其中,第四参数,包括对网络数据的访问参数;第五参数,包括网络数据的内容特征参数;
数据处理模块403,用于基于相应参数中的至少两个参数,对网络数据进行处理,得到处理结果;其中,处理结果表示目标数据的网络影响程度。
在一些实施方式中,第二参数,包括以下至少之一:网络数据对应的网络平台的类型、网络数据对应的网络平台的级别、发布网络数据的用户账户的类型。
在一些实施方式中,第三参数,还包括可信度以及地址有效性至少之一;
数据处理模块403,用于对网络数据进行有效性分析,确定可信度和/或地址有效性;其中,可信度,用于表示网络数据是否真实;地址有效性,用于表示网络数据对应的链接地址的持续有效时间;
数据处理模块403,还用于对网络数据中所包含的情感数据进行标签标注,得到情感分析结果。
在一些实施方式中,第四参数,为分享网络数据的数量信息。
在一些实施方式中,第五参数,包括以下至少之一:原创标识、分享信息、内容信息量;其中,原创标识,用于表示网络数据是否为原创数据;分享信息,包括网络数据分享状态信息;内容信息量,包括网络数据所承载的内容的种类和/或数量。
在一些实施方式中,数据处理模块403,用于基于网络数据,确定处理策略;其中,处理策略,包括对相应参数中至少两个参数的选择策略;
数据处理模块403,还用于基于处理策略以及相应参数,对网络数据进行处理,得到处理结果。
在一些实施方式中,选择策略,包括对相应参数中至少两个参数的加权策略。
数据处理模块403,用于对网络数据的结构进行分析,确定分析结果;其中,分析结果,包括网络数据所包含的至少一种数据的类型;
基于分析结果,确定加权策略。
在一些实施方式中,处理策略,还包括对网络数据的融合策略;
数据处理模块403,用于对网络数据进行分析,确定比例信息;其中,比例信息,包括源于各个网络平台的网络数据之间的比例;
基于比例信息,确定融合策略。
需要说明的是,实际应用中,数据获取模块401、参数处理模块402以及数据处理模块403,可以利用电子设备中的处理器实现,上述处理器可以为ASIC、DSP、DSPD、PLD、FPGA、CPU、控制器、微控制器、微处理器中的至少一种。
由以上可知,通过本申请实施例提供的数据处理系统4,在获取到包含目标数据的、源于至少两种类型的网络平台的网络数据之后,能够对网络数据进行分析,得到表征目标数据分布状态、网络数据来源信息、网络数据的情感分析结果、对网络数据的访问参数以及网络数据的内容特征参数的相应参数,以上各个参数分别能够从不同的维度、不同的侧面反应网络数据在网络平台中的存在特征,然后基于相应参数中的至少两个参数,对网络数据进行处理,得到的处理结果,能够从不同维度、不同侧面,全面而客观的反应目标数据的真实的网络影响程度。
基于前述实施例,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序能够被处理器执行,以实现如前任一所述的数据处理方法。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
本申请所提供的各方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的各产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的各方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
需要说明的是,上述计算机可读存储介质可以是只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种电子设备,如移动电话、计算机、平板设备、个人数字助理等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件节点的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所描述的方法。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (8)

1.一种数据处理方法,其特征在于,所述方法包括:
获取包含目标数据的网络数据;其中,所述网络数据,来源于至少两种类型的网络平台;
对网络数据进行分析,确定相应参数,其中:
基于所述网络数据中所述目标数据的分布状态,确定第一参数;
基于所述网络数据的来源信息,确定第二参数;
对所述网络数据进行分析,确定第三参数;其中,所述第三参数,至少包括情感分析结果;
对所述网络数据的内容进行分析,确定第四参数以及第五参数;其中,所述第四参数,包括对所述网络数据的访问参数;所述第五参数,包括所述网络数据的内容特征参数;
基于所述相应参数中的至少两个参数,对所述网络数据进行处理,得到处理结果;其中,所述处理结果表示所述目标数据的网络影响程度;
所述基于所述相应参数中的至少两个参数,对所述网络数据进行处理,得到处理结果,包括:
基于所述网络数据,确定处理策略;其中,所述处理策略,包括对所述相应参数中至少两个参数的选择策略;基于所述处理策略以及所述相应参数,对所述网络数据进行处理,得到所述处理结果;
所述选择策略,包括对所述相应参数中至少两个参数的加权策略;所述基于所述网络数据,确定处理策略,包括:对所述网络数据的结构进行分析,确定分析结果;其中,所述分析结果,包括所述网络数据所包含的至少一种数据的类型;基于所述分析结果,确定所述加权策略。
2.根据权利要求1所述的方法,其特征在于,所述第二参数,包括以下至少之一:所述网络数据对应的网络平台的类型、所述网络数据对应的网络平台的级别、发布所述网络数据的用户账户的类型。
3.根据权利要求1所述的方法,其特征在于,所述第三参数,还包括可信度以及地址有效性至少之一;所述对所述网络数据进行分析,确定第三参数,包括:
对所述网络数据进行有效性分析,确定所述可信度和/或所述地址有效性;其中,所述可信度,用于表示所述网络数据是否真实;所述地址有效性,用于表示所述网络数据对应的链接地址的持续有效时间;
对所述网络数据中所包含的情感数据进行标签标注,得到所述情感分析结果。
4.根据权利要求1所述的方法,其特征在于,所述第四参数,为分享所述网络数据的数量信息。
5.根据权利要求1所述的方法,其特征在于,所述第五参数,包括以下至少之一:原创标识、分享信息、内容信息量;其中,所述原创标识,用于表示所述网络数据是否为原创数据;所述分享信息,包括所述网络数据的分享状态信息;所述内容信息量,包括所述网络数据所承载的内容的种类和/或数量。
6.根据权利要求1所述的方法,其特征在于,所述处理策略,还包括对所述网络数据的融合策略;所述基于所述网络数据,确定处理策略,包括:
对所述网络数据进行分析,确定比例信息;其中,所述比例信息,包括所述源于各个所述网络平台的网络数据之间的比例;
基于所述比例信息,确定所述融合策略。
7.一种数据处理系统,其特征在于,所述数据处理系统包括:数据获取模块、参数处理模块以及数据处理模块,其中:
所述数据获取模块,用于获取包含目标数据的网络数据;其中,所述网络数据,来源于至少两种类型的网络平台;
所述参数处理模块,用于对所述网络数据进行处理,确定相应参数;
所述参数处理模块,用于基于所述网络数据中的所述目标数据的分布状态,确定第一参数;基于所述网络数据的来源信息,确定第二参数;对所述网络数据进行分析,确定第三参数;其中,所述第三参数,至少包括情感分析结果;对所述网络数据的内容进行分析,确定第四参数以及第五参数;其中,所述第四参数,包括对所述网络数据的访问参数;所述第五参数,包括所述网络数据的内容特征参数;
所述数据处理模块,用于基于所述相应参数中的至少两个参数,对所述网络数据进行处理,得到处理结果;其中,所述处理结果表示所述目标数据的网络影响程度;
所述数据处理模块,还用于基于所述网络数据,确定处理策略;其中,所述处理策略,包括对所述相应参数中至少两个参数的选择策略;基于所述处理策略以及所述相应参数,对所述网络数据进行处理,得到所述处理结果,所述选择策略,包括对所述相应参数中至少两个参数的加权策略;
所述数据处理模块,还用于对所述网络数据的结构进行分析,确定分析结果;其中,所述分析结果,包括所述网络数据所包含的至少一种数据的类型;基于所述分析结果,确定所述加权策略。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序;所述计算机程序能够被处理器执行,以实现如权利要求1-6任一所述的数据处理方法。
CN202110341335.XA 2021-03-30 2021-03-30 一种数据处理方法、系统以及存储介质 Active CN113259150B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110341335.XA CN113259150B (zh) 2021-03-30 2021-03-30 一种数据处理方法、系统以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110341335.XA CN113259150B (zh) 2021-03-30 2021-03-30 一种数据处理方法、系统以及存储介质

Publications (2)

Publication Number Publication Date
CN113259150A CN113259150A (zh) 2021-08-13
CN113259150B true CN113259150B (zh) 2022-09-23

Family

ID=77181475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110341335.XA Active CN113259150B (zh) 2021-03-30 2021-03-30 一种数据处理方法、系统以及存储介质

Country Status (1)

Country Link
CN (1) CN113259150B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800960A (zh) * 2018-12-26 2019-05-24 北京中科闻歌科技股份有限公司 一种品牌综合影响度评估方法、系统及存储介质
CN109840687A (zh) * 2018-12-26 2019-06-04 北京中科闻歌科技股份有限公司 一种品牌影响力指数构建方法、系统及存储介质
CN111506789A (zh) * 2020-04-09 2020-08-07 宣亚国际营销科技(北京)股份有限公司上海分公司 一种基于汽车行业的舆情数据分析方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8954449B2 (en) * 2011-07-12 2015-02-10 Salesforce.Com, Inc. Method and system for determining a user's brand influence
CN102800009A (zh) * 2012-09-05 2012-11-28 宋梁 通过互联网对品牌展示及品牌影响力评估的方法
CN105247507B (zh) * 2013-05-31 2018-11-02 企业服务发展公司有限责任合伙企业 用于确定品牌的影响力得分的方法、系统和存储介质
CN106484802A (zh) * 2016-09-22 2017-03-08 中国标准化研究院 一种针对汽车缺陷发布的信息的数据处理方法及装置
US20190026786A1 (en) * 2017-07-19 2019-01-24 SOCI, Inc. Platform for Managing Social Media Content Throughout an Organization
CN108416627A (zh) * 2018-03-09 2018-08-17 北京搜狐新媒体信息技术有限公司 一种基于互联网数据的品牌影响力监控方法及系统
CN111967911A (zh) * 2020-08-20 2020-11-20 广州原仓信息科技有限公司 衍生品的监控分析方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800960A (zh) * 2018-12-26 2019-05-24 北京中科闻歌科技股份有限公司 一种品牌综合影响度评估方法、系统及存储介质
CN109840687A (zh) * 2018-12-26 2019-06-04 北京中科闻歌科技股份有限公司 一种品牌影响力指数构建方法、系统及存储介质
CN111506789A (zh) * 2020-04-09 2020-08-07 宣亚国际营销科技(北京)股份有限公司上海分公司 一种基于汽车行业的舆情数据分析方法

Also Published As

Publication number Publication date
CN113259150A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
US9300755B2 (en) System and method for determining information reliability
US8818928B2 (en) Evaluating an item based on user reputation information
US10540660B1 (en) Keyword analysis using social media data
TWI491217B (zh) 使用自使用者活動更新所得觀點增加內容關聯性之方法
US7720835B2 (en) Systems and methods for consumer-generated media reputation management
US20070255702A1 (en) Search Engine
US11275748B2 (en) Influence score of a social media domain
US20080104034A1 (en) Method For Scoring Changes to a Webpage
WO2008133368A1 (en) Information search ranking system and method based on users' attention levels
CN110134842B (zh) 基于信息图谱的信息匹配方法、装置、存储介质和服务器
CN113869931A (zh) 广告投放策略确定方法、装置、计算机设备和存储介质
CN110196941B (zh) 一种资讯推荐方法、装置、服务器与存储介质
JP2011227721A (ja) 関心抽出装置、関心抽出方法、及び関心抽出プログラム
CN112131507A (zh) 网站内容处理方法、装置、服务器和计算机可读存储介质
CN104641314A (zh) 计算机化的互联网搜索系统和方法
CN111460181A (zh) 多媒体资源推荐方法、电子设备及存储介质
CN111966946A (zh) 一种页面权威值的识别方法、装置、设备和存储介质
CN113259150B (zh) 一种数据处理方法、系统以及存储介质
KR101568800B1 (ko) 실시간 이슈 검색어 선별 방법 및 시스템
CN111461727A (zh) 交易行为的监控预警方法、装置、存储介质和智能设备
CN111400516A (zh) 标签确定方法、电子设备及存储介质
CN110827078A (zh) 一种信息推荐方法、装置、设备及存储介质
CN116431895A (zh) 安全生产知识个性化推荐方法及系统
KR20130091391A (ko) 콘텐츠 추천 서버 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체
CN110633408A (zh) 智能商业资讯的推荐方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant