CN106021622A - 一种基于大数据的信息定量分析系统 - Google Patents
一种基于大数据的信息定量分析系统 Download PDFInfo
- Publication number
- CN106021622A CN106021622A CN201610564765.7A CN201610564765A CN106021622A CN 106021622 A CN106021622 A CN 106021622A CN 201610564765 A CN201610564765 A CN 201610564765A CN 106021622 A CN106021622 A CN 106021622A
- Authority
- CN
- China
- Prior art keywords
- information
- data
- module
- analysis
- behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于大数据的信息定量分析系统,包括指标数据分析计算模块,对数据获取的数据进行组合线型处理得到对应的指标数据;信息总量分析计算模块,将指标数据分析计算模块得到的数据进行分析和调整运算得到信息总量;比值分析计算模块,用于对得到的信息总量和信息基本量以及输入的信息延伸量通过相应的比值计算得到信息质量比值;信息均值比计算模块,用于根据指标数据分析计算模块得到的指标数据进行分析计算信息均值比;信息稳定性分析计算模块,用于对信息的衰减系数、稳定性指数、时效性指数和有效期的计算。本发明通过直观的定量分析的方法,以直观的形式输出结果,使得数据更容易理解,避免了数据理解错误造成财产损失。
Description
技术领域
本发明涉及信息数据处理技术领域,尤其涉及一种基于大数据的信息定量分析系统。
背景技术
大数据指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。对大量消费者提供产品或服务的企业可以利用大数据进行精准营销,做小而美模式的中长尾企业可以利用大数据做服务转型,面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值。现有技术中,关于技术信息、客户信息、品牌信息、以及一切与人的属性或行为有关的信息的处理均采用人工处理的方式,决策者进行数据梳理和判断时需要花费较大的时间,容易出错。
依托大数据对某一个行为或者一个对象的优劣度分析和决策过程中,数据的处理、数据与数据之间的关系模型的合理性将直接影响到分析的结果,如何对获取到的数据进行处理并发现各数据之间的逻辑关系也是现有技术中无法解决的问题。
发明内容
为克服现有技术中存在的针对品牌特性缺少定量化分析的问题,本发明提供了一种基于大数据的信息定量分析系统。
一种基于大数据的信息定量分析系统,包括指标数据分析计算模块,对数据获取的数据进行组合线型处理得到对应的指标数据;信息总量分析计算模块,将指标数据分析计算模块得到的数据进行分析和调整运算得到信息总量;比值分析计算模块,用于对得到的信息总量和信息基本量以及输入的信息延伸量通过相应的比值计算得到信息质量比值;信息均值比计算模块,用于根据指标数据分析计算模块得到的指标数据进行分析计算信息均值比;信息稳定性分析计算模块,用于对信息的衰减系数、稳定性指数、时效性指数和有效期的计算。
进一步的,还包括参比数据库,用于存储信息总量参比数据、信息质量比值参比数据、信息均值比参比数据和稳定性指数参比数据,所述信息总量参比数据、信息质量比值参比数据、信息均值比参比数据和稳定性指数参比数据分别通过独立的存储单元进行存储形成数据库。
进一步的,还包括输出模块,用于输出信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果;将信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果与参比数据库内的数据进行比对,并输出参比数据库内各个参比数据的区间名称。
进一步的,所述输出模块包括比对单元、结果匹配数据库和输出单元,所述比对单元用于将信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果与参比数据库内的数据进行比对,并将比对的结果与结果匹配数据库内的数据进行匹配;所述结果匹配数据库和输出单元用于存放与比对结果相匹配的结果数据;所述输出单元用于输出比对单元的比对结果。
进一步的,还包括数据获取模块,用于获取有效信息的数据;数据输入模块,用于输入相关的行为或者对象的信息数据;数据获取模块和数据输入模块获取的数据输出到指标数据分析计算模块。
进一步的,所述数据获取模块包括还一结构化分析模块,将参数获取模块的数据结果进行结构化分析。
进一步的,所述指标数据包括:与某一个行为或者对象有关的总人数,普通群体完全知道该行为或者对象所要传播的信息量的极值,该行为或者对象当前平均认知度。
进一步的,普通群体完全知道该行为或者对象所要传播的信息量的极值依据该行为或者对象的备选、替代的行为或者对象的数量而确定。
进一步的,所述指标数据包括:多个目标范围内与某一个行为或者对象有关的总人数,多个目标范围内普通群体完全知道该行为或者对象所要传播的信息量的极值,多个目标范围内的该行为或者对象当前平均认知度。
进一步的,所述信息总量计算模块在计算信息总量之前,先对指标数据中的平均认知度、评价程度和调整系数指数函数中的底数进行运算得到比例因子,用于调整计算结果;所述评价程度为正面评价程度与加权的负面评价程度之和。
与现有技术相比,本发明的有益效果是:
本发明能够基于网络或者获取某一行为或者对象的与人的决策有关的数据,其通过对数据进行科学的处理,并将有关的指标进行定量的数值量化,通过建立参比数据库将信息总量、信息质量比值、信息均值比和稳定性指数进行划分区间,并通过将区间的名称与预先设置的匹配结果进行匹配,输出直观的信息分析结果,便于理解信息数据,从而利于决策,避免对信息数据理解错误导致财产损失。
附图说明
图1是本发明的结构示意图。
具体实施方式
以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,本具体实施方式披露了一种基于大数据的信息定量分析系统,所述大数据的内容可以是技术信息、客户信息、品牌信息、以及一切与人的属性或行为有关的信息,这些数据可以是结构化的或者非结构化的。所述系统包括:
数据获取模块,用于获取有效信息的数据;优选的,其用于获取网络数据库中的关于的数据,通过互联网将系统与网络上的数据库进行连接,从而获取关于信息的数据。其中,网络数据库是通过对网络用户发起问卷调查和对指定区域的信息收集而生成的数据库。更进一步,所述数据源可以是非结构化数据。所述数据可以是分布在网络上的跟某一技术主题有关的技术信息,例如“3D打印”,也可以是跟某一对象有关的数据,例如跟某一品牌有关的数据,也可以是跟人的行为有关的数据,例如,乘坐公共交通工具有关的数据。
优选的,所述数据获取模块包括以下组成部分:
一参数获取模块,用于获取数据的指标及其数值范围,所述范围可以是一个时间段,例如早上八点到十点;一个具体的地区,例如北京市;一个特定的人群,例如学生;或者一个具体的行为,例如上车刷卡;或者一个具体的对象,例如一个或者几个品牌、一个或者几个企业。非限制性地,参数获取模块连接至移动互联网和/或因特网等网络,接收来自于网络的数据。例如,数据获取模块可连接到一具有调查反馈功能的在线网站,访问者通过该网站提交或者留下数据信息。例如,当需要获取于某一对象有关的人数统计时,例如需要获取某一时间段通过地铁进站口刷卡的人数、或者需要获取某一时间段在办公室登录电脑的特定人群、或者需要获取对某一家或者几家企业知晓的人数、对某一学校口碑的反馈、以及对某几个商标知晓的人数等等。该网站对受访者人数、受访者的反馈结果进行统计后发送至参数获取模块;另一方面,可选地,该网站可直接将受访者的反馈结果发送至参数获取模块,由参数获取模块进行访问人数的统计。此外,本领域的技术人员应当理解,所述网站的数量可以不止一个,同一网站所提供的数据的内容也可以不止一个,也就是说,参数获取模块可以与多个在线网站通过有线或无线的方式相连接,获取多个在线网站的反馈信息。优选的,对于调查某一行为或者对象而言,所述信息的数据包括指定区域内的人口总数、对该行为或者对象知晓的人数、访问人数、与该类似行为或者对象有关的其他行为或对象的数量、愿意作出该行为或者选择该对象的人数和不愿意作出该行为或者选择该对象的人数等。例如,调查获取的对象可以是选择高速铁路出行、到某企业就职、对某一个学校知名度的调查、对某一品牌知名度的调查等。
一数据输入模块,用于输入相关的行为或者对象的信息数据;优选的,数据获取模块还可以设置输入单元,通过人工输入的方式录入数据,可以通过键盘输入、语音输入等方式实现。一结构化分析模块,将参数获取模块的数据结果进行结构化分析。因为参数获取模块获取的数据可能不具有结构化特点,而要进行定量分析的前提是数据结构化,因此结构化分析模块对参数获取模块所提供的数据进行结构化。例如参数获取模块可能是基于摸一个关键词、一份调查问卷、一段采访内容进行搜集获取,其所反馈的可能是一段文字、一段文字和图片、一个没有表头的表格、一份调查问卷中的简要回答等。结构化分析模块首先建立一个结构化的表格,而后对参数获取模块的数据进行关键词抽取或者特定字符、字符串的匹配、简短语义的匹配,将抽取的结果或者匹配的结果插入到结构化表格中。另一方面,结构化分析模块也对参数获取模块的数据进行统计,将统计的结果插入到结构化表格中。例如,该结构化表格可以包括但不限于:访问某一网站的人数、时间段、倾向性意见等等。
在取得了必要的信息数据之后,通过计算机将获取的数据进行相应的组合线型处理得到相应的指标数据,所述指标数据包括但不限于:与某一个行为或者对象有关的总人数,例如乘坐高速列车的群体数量、使用3D打印技术的客户数量、某一个著名品牌消费者人群总数等;该行为或者对象的知晓程度,例如对高速列车了解程度、对3D打印设备性能了解的程度、对某一品牌知名度等;普通群体完全知道该行为或者对象所要传播的信息量的极值,例如普通乘客对高铁完全了解所需要传播的最大信息量、对普通技术人员3D打印完全技术了解所要传播的信息量的极值、某一个地区的家长要完全了解某一个学校所要传播的最大信息量、普通消费者对某一个品牌认知所要传播的信息量的极值;该行为或者对象当前平均认知度,例如当前对高速列车的平均认知度、对3D打印技术的平均认知度、对某一个学校的平均认知度、对某一个企业或者品牌的平均认知度。
具体的,其中对于某一行为或者对象的人群总数即以地域为划分的当地人口总数,即步骤一中指定区域内的人口总数。
优选地,在利用大数据进行分析某一行为或者对象时,可以定义对该行为或对象的知名度,知名度意指受众对某一行为或者对象知晓程度的度量指标,即有多少知晓该行为或对象。在分析计算时,知名度可以采用知晓该行为或者对象的人数与总人数的比值。
优选的,在求解上述极值Z值之前,还需要确定目标人群的总数,以及目标人群的结构。按照目标人群的结构进行分层取样,并按照其结构的比例安排调研的样本。此外,普通群体完全知道该行为或者对象所要传播的信息量的极值Z可以依据该行为或者对象的备选、替代的行为或者对象的数量而确定,例如可以根据普通群体选择其备选、替代的行为或者对象概率发生时的信息公式而定。例如普通乘客对高铁完全了解所需要传播的最大信息量可以由普通乘客对其他交通工具的种类数量而定、对普通技术人员3D打印完全技术了解所要传播的信息量的极值可以根据现有的型材成型工艺的规模数量而定、某一个地区的家长要完全了解某一个学校所要传播的最大信息量可以根据该地区内其他同性质的学校的数量确定、普通消费者对某一个品牌认知所要传播的信息量的极值可以依据行业内的备选品牌数目等概率发生时的信息公式而定。可以认为普通群体完全知道该行为或者对象所要传播的信息量的极值Z是认知度达到100%时的信息量。
正如前文所述,对于交通工具而言,存在高铁、飞机、汽车等多种选择,对于3D打印技术而言同样也存在其替代的技术,对于某一个学校、某一个品牌而言,在其所在的区域或者行业也存在其他的竞争性的学校或者品牌。也就是说,在一个特定的环境中,某一个行为或者对象存在至少一种或者多种备选或者替代的行为或者对象。经验表明,每个普通群体的对某一个行为或者对象认知度能够到达的最大值都是一个确定的值。一个普通群体完全知道一个技术、一个学校、一种新的出行方式、一个品牌所要传播的信息量,或者说一个消费者在一个具体的环境中,对其中一个行为或者对象掌握的所有信息的量是个确定的值,它依据其备选或者替代的行为或者对象的数量而定。
可以认为,某一个行为或者对象认知度能够到达的最大值是依据“在备选对象或者行为发生概率相等时该对象或行为信息量最大”的原则下,根据该行为或者对象所处的环境中的总体行为或者对象数目而确定的值。
本发明中,普通群体中的个体完全知道某一行为或者对象所要传播的信息量的极值通过如下技术公式计算得到:
式中,p(xi)为某一个体对第i个行为或者对象选择的概率,n为一个特定环境中的该行为或对象的个数。
此外,对某个行为或者对象平均认知度是通过将一个普通个体完全知道一个该行为或者对象所要传播的信息量的极值与1的差值进行等分得到的。在一定知名度的情况下,每个个体知晓该行为或者对象的样本其信息量为1时,每个个体对该行为或者对象的认知程度有差异。Rmax是满信息的情况,一个普通个体对该行为或者对象的所有信息都掌握,满信息对该个体来说就是100%有效到达。Rmax到1就是认知深度,将Rmax-1等分用来表示其中任一普通个体达到的有效认知程度,称为某一个体达到任意一个程度,表示为r=Xir%,并由此可以得到一个平均认知度的值。
此外,对某一行为或者对象可进一步分析其评价程度,其可以通过一设置的评价程度计算模块实现。通过设置在内部的如下公式计算得到:式中,α1为评价程度,x为发生的真实采用或接受行为或者对象的普通群体样本中,采纳或者接受该行为或对象时与特定的行为提供者无关的个体数目;例如,对于选择高速列车出行的行为进行分析时,x表示作出该选择时不考虑特定的列车车型的个体数量,在对3D打印技术的选择行为进行分析时,x表示选择3D打印技术时不考虑特定的成型工艺(例如激光烧结、电子束烧结)的个体数量,在分析是否选择学校就读时,x表示不考虑该学校的名称的个体数量,同样,在分析某一品牌的选择时,x表示作出该选择时与具体厂家无关的个体数量。sx为发生的真实采用或接受行为或者对象的普通群体样本的总数量;y为拒绝该行为或者对象的普通群体样本中,原因是与该行为或者对象直接有关的选项的消个体人数;例如,对于选择高速列车出行的行为进行分析时,x表示对高速列车本身不接纳的个体数量,在对3D打印技术的选择行为进行分析时,x表示对3D打印技术时不考虑的个体数量,在分析是否选择学校就读时,x表示因某一个学校本身而拒绝的个体数量,同样,在分析某一品牌的选择时,x表示因品牌原因拒绝的个体数量。sy为选择该行为或者对象的替代行为或者对象的个体数量;例如,对于选择高速列车出行的行为进行分析时,y表示选择飞机、汽车等其他出行方式的个体数量,在对3D打印技术的选择行为进行分析时,y表示选择现有的成型工艺的个体数量,在分析是否选择某一学校就读时,y表示选择其他学校的个体数量,同样,在分析某一品牌的选择时,y表示同业竞争者品牌商品的消费者样本的消费者数目;η为变频系数。
上述评价程度是普通群体对一个行为或者对象的好感度。上述信息可以通过对非结构化数据中的关键词和主题进行抓取和分析得到,也可以通过简单的调研获取,然后汇总并求出平均数,是个百分比表达的度的指标。
科学统计表明,即使是再成熟的技术、再便捷的新科技、口碑再好的学校、医院、企业、品牌、或者某一个公众人物,也会有反感的人。也就是说,对一个行为或者对象并不能存在100%接受的现象,评价程度有好有坏。
本发明进一步将对行为或对象的评价程度分为正面评价程度、负面评价程度。有关正面评价程度的分析方法为:式中,有关负面评价程度的分析方法为:
因此,关于某一行为或者对象的评价程度的度量是将正负评价程度合计,而且负评价程度对普通个体的影响更大,因此,在合计的算式中需要对负评价程度进行加权,并且使用变频系数进行处理,最终评价程度通过如下计算公式得到:
变频系数η是普通个体对该行为或者对象所在的特定环境的关注度(例如行业关注度)和媒体对其的关注度有关的系数,该变频系数可以依赖于更大规模的数据进行计算得到,例如在分析对高速列车出行时,普通群体不限于经常出行的人群,而是可以将几乎不出行的群体也纳入进来;在分析3D打印时可以将整个装备制造领域的企业纳入进来,在分析学校或者品牌时,可以将能接触到更大地区的学校或者整个行业的品牌的群体也纳入进来。在具体计算式,可以将关注度从0至9分为10个等级,同样将媒体对其的关注度的关注度划分为10个等级,用1×2矩阵来表示,如:(1,2),表示消费者对该品牌所在行业的关注度等级为1,媒体对企业的关注度等级为2;根据矩阵位置,即可建立相应的映射关系,通过该矩阵而获得相应的变频系数。本领域的技术人员应当理解,所述变频系数的具体计算方式可以有多样性,本发明中所提到的普通个体对该行为或者对象所在的特定环境的关注度(例如行业关注度)和媒体对其的关注度是可以量化的,期间之间的映射关系也是可以根据具体情况设定的,本发明不限于具体的映射方式和数据,例如变频系数η可以取值1、2、3、……,也可以是分数形式或者其他无理数。
此外,上述特定环境的平均评价程度通过如下公式计算得到:式中,Q为普通群体中的一类个体的数量,这类个体受其他个体的影响进行选择,也就是说该个体是由于收到他人的影响而做出的决策;SZ为作出过该行为或者选择过该对象的消费者总数。例如在分析对高速列车出行时,Q为因受其他人影响而选择坐高铁的人数,Sz为已经乘坐过高铁的人数;在分析3D打印时,Q为因受其他人口碑影响而选择3D打印技术的人数,Sz为已经使用过3D打印的人数,在分析学校或者品牌时,Q为因受其他人的评价影响而选择该学校或者该品牌的人数,Sz为已经在该学校就读或者选择了该品牌的人数。
指标数据分析计算模块,用于将从数据获取模块和数据输入模块获取的数据进行组合线型处理得到对应的指标数据;该模块内存储有各个指标数据的计算公式和计算代码,通过计算代码将获取或输入的数据带入公式计算得到指标数据,所述指标数据包括普通群体的人数(也可以是使用某一个app的人数,或者接受调查反馈的人数)、某一行为或者对象的知名度、一个普通群体中的个体完全知道某一行为或者对象所要传播的信息量的极值、平均认知度、由知名度而来的基本信息量、评价程度、一个特定环境的平均评价程度和调整系数指数函数中的底数。得到的指标数据用于计算该行为或者对象的信息总量。
信息总量分析计算模块,用于将指标数据分析计算模块得到的数据进行分析和调整运算得到信息总量;该模块在计算信息总量之前,首先对指标数据中的平均认知度、评价程度和调整系数指数函数中的底数进行运算得到比例因子,用于调整计算结果。
某一行为或者对象的信息是对该某一行为或者对象事实的不确定性的消除;其信息量就是对这种不确定性的消除程度的度量。
将调整系数指数函数中的底数为底数,评价程度与一特定环境平均评价程度的差值与该平均评价程度的比值作为指数进行指数运算得到比例因子;将信息基本量与比例因子进行调整运算得到信息总量;信息总量通过如下计算公式计算得到:
式中,S为特定群体人群总数;Z为某一行为或者对象的知名度;Rmax一个普通群体中的个体完全知道某一行为或者对象所要传播的信息量的极值;r为某一行为或者对象的平均认知度;m为由知名度而来的某一行为或者对象的基本信息量;α为评价程度;为一特定环境的平均评价度;Nz为调整系数指数函数中的底数。
比值分析计算模块,用于对得到的信息总量和信息基本量以及输入的信息延伸量通过相应的比值计算得到信息质量比值。具体的,通过对得到的信息总量和信息基本量以及输入的信息延伸量通过相应的比值计算得到信息质量比值;采用如下公式计算信息基本量:J=[S×Z+(Rmax—1)×r×m×s];式中,J为某一行为或者对象的信息基本量;S为普通群体人群总数;Z为某一行为或者对象的知名度;Rmax一个普通群体中的个体完全知道某一行为或者对象所要传播的信息量的极值;r为某一行为或者对象的平均认知度;m为由知名度而来的某一行为或者对象的基本信息量,其中m即由知名度而来的某一行为或者对象的基本信息量为目标人群总数与某一行为或者对象的知名度的乘积。
某一行为或者对象的信息是对该某一行为或者对象事实的不确定性的消除;其信息量就是对这种不确定性的消除程度的度量。
将调整系数指数函数中的底数为底数,评价程度与一特定环境平均评价程度的差值与该平均评价程度的比值作为指数进行指数运算得到比例因子;将信息基本量与信息总量计算模块计算得到的信息总量的比值作为信息基本量的贡献率。
优选的,品牌信息基本量的贡献率通过如下计算公式计算得到:式中θ表示信息的基本量的贡献率;J表示信息基本量;所述QE表示信息总量。信息基本量贡献率是信息基本量和总的信息量的比值。该值越小表示基本量在整个行为或对象信息作用中所占比重越小,该行为或对象的外界依赖性越小。
将信息延伸增量与信息总量的比值作为信息延伸增量的贡献率。优选的,其中信息延伸增量采用输入的方法输入到计算机系统中,信息延伸量的贡献率通过如下计算公式计算得到:
信息延伸增量贡献率=(信息延伸增量/总信息量)*100%。
延伸是指将某一行为或对象扩展到不同的行为或对象上。例如,对于高速列车出行分析而言,其延伸可以是将高铁与其他的交通工具换乘对接;对于3D打印技术而言,其延伸可以是用于建筑物的应用;对于学校而言,延伸指的是可以提供低一级别或者高一级别的教学;对于品牌而言,可以是将该品牌应用于其他产品上。
将信息总量与信息基本量和信息延伸增量的差值与信息总量的比值作为信息质的贡献率。优选的,信息质的贡献率通过如下计算公式计算得到:
信息质贡献率=(总信息量-信息基本量-信息延伸增量)/(总信息量)*100%
信息质的贡献率,意指该行为或者对象通过评价程度获得的其质量在信息总量中所占的比值。
将信息质的贡献率与品牌信息基本量的贡献率和信息延伸量的贡献率的和进行比值计算得到信息质量比;信息质量比值通过如下计算公式计算得到:
信息质量比=信息质的贡献率/(信息基本量的贡献率+信息延伸增量的贡献率)。
信息质量比值反映的是某一个行为或者对象通过评价程度获得的其质量比重占总的行为或对象质量的比例,其反映出一个行为或对象的真实质量情况。
信息均值比计算模块,用于根据指标数据分析计算模块得到的指标数据进行分析计算信息均值比。优选的,用于此模块的信息计算数据的获取以各个不同的范围进行划分,包括较大范围的总的数据,也包括较小的指定范围的小范围数据。例如全国范围的数据和某一指定人群或者的地区的数据。其分别用于计算全国范围的信息总量和信息平均值,以及指定人群或地区的信息总量和信息平均值。特别的,指定地区的信息总量和信息平均值用于和全国范围的信息总量和信息平均值进行比较判断该地区范围的信息是否具有地域特质。在本发明的另一可行的具体实施方式中,对于某个指定人群的信息总量和信息平均值与全国范围的信息总量和信息平均值进行比较判断则能够判断该信息是否具有某个人群的倾向特质。例如,对乘坐出租车的人群的信息统计分析中,通过对青年人乘坐出租车的信息总量和信息平均值与全国人乘坐出租车的信息总量与信息平均值进行比较,前者的信息平均值远远大于后者,则可说乘坐出租车的人群分布具有青年人偏向特质。
通过信息总量计算模块计算出小范围信息总量和大范围的信息总量,优选的,信息均值比计算模块还包括一平均信息量计算模块。通过信息总量计算模块计算得到的小范围信息总量和大范围的信息总量,进行计算小范围和大范围的信息量平均值。
平均信息量计算模块,用于计算指定范围的信息总量的平均值;其中包括多个组成单元,分别用于计算各个不同范围的信息总量的平均值。具体的,各个范围的信息总量与该范围的样本数的比值作为该范围的信息总量的平均值。可行的,其可以是某一地区或某一群体内的信息总量与该地区或群体的人数的比值。
由于信息总量的平均值计算与同一个模块内进行,而其包括多个范围的数据计算,为提高可行性,可行的,在本发明的一个具体实施方式中,通过设置一数据存放模块,用于临时存放各个范围的信息总量的平均值。存放的数据可用于信息均值比计算或者直接用于判断比较。
在本发明的另一具体实施例中,还可以通过一数据处理判断模块对信息的特质进行比较判断,具体是将小范围的信息总量的平均值与大范围的信息总量的平均值进行比较,若小范围的信息总量的平均值大于大范围的信息总量的平均值一定的倍数则判断该信息具有该小范围的特质。其中,该小范围可以是一个区域或者一个群体。特别的,当该小范围是一个区域时,则判断该信息具有该区域的地域特质。此外,信息特质的判断还可以通过信息均值比计算模块进行计算出一个定量的数值与信息均值比参比数据库内的信息均值比参比数据进行比较,并得出其特质。优选的,信息均值比参比数据被分成若干个区间,当计算得到的信息均值比落在某一个区间内时,则该信息具有该区间的特质。优选的,将小范围的信息总量平均值与大范围的信息总量的平均值的比值作为该信息的均值比。
信息稳定性分析计算模块,用于对信息的衰减系数、稳定性指数、时效性指数和有效期的计算。可行的,在本发明的的一个具体实施方式中,所述信息稳定性分析计算模块包括衰减系数计算单元、稳定性指数计算单元、时效性指数计算单元和有效期计算单元。
所述衰减系数计算单元根据如前所述的评价程度计算模块的计算结果进行分析计算衰减系数。优选的,在信息稳定性计算模块进行分析计算之前,需要在指标数据计算模块中对多镒信息重复率进行计算,其中多镒信息重复率是某一行为或者对象对已某一事物的关注重复度往往受到其他同领域的行为或者对象的影响,所述同一领域的全部事物在同一行为或者对象上重复的平均时间间隔与该事物在同一行为或者对象上重复的时间间隔的比值作为该事物的多镒信息重复率。多镒信息重复率反映了其在同领域内的相对性的特征。优选的,在本发明的一个具体实施例中通过来表示多镒信息重复率。
衰减系数计算单元,用于计算信息的衰减系数,可行的,在本发明的一个具体实施方式中可通过如下计算公式计算得到,
其中,式中,Γ为衰减系数;N2为调整参数,调整参数的数值由同领域的竞争状况决定,具体的可通过查阅调研得到的数据表获得;为多镒信息重复率;为评价程度。
衰减系数是某一行业、某一事物或者某个人物对用户的影响力,而评价程度和多镒信息重复率则是评价其影响力的两个重要因素,并且成反比关系。因此将多镒信息重复率与评价程度的比值作为衰减系数。
稳定性指数计算单元,以2为底数,衰减系数计算单元计算得到的衰减系数为指数进行运算,并进行去整扩大相应的倍数得到稳定性指数。其中,扩大倍数根据不同的行业、事物或者人物采用不同的标准,处于同一领域的采用相同的倍数。
优选的,在本发明的另一具体实施方式中,在进行稳定性分析的同时,评价程度分析模块还应当包含一偏向度分析计算模块,用于对信息偏向度的分析计算。评价程度的偏向度是指用户在决策中,多次表现出来对某个行为或者事物或者人物有偏向性的(而非随意的)行为反应。它是一种行为过程,也是一种心理(决策和评估)过程。在本具体实施例中,评价程度的偏向度通过偏向度测量模型分析计算得到。偏向度测量模型系统由态度、价值及领导地位、体现价值及差别化、沟通及行为五大类十个变量所构成。在对具体的偏向度测量模型进行测量时,此测量模型系统中的变量可作为一个备选变量,选择其中一些适当变量,并赋予其一定的权重。即通过对各个因素按照权重进行比例分配,加权求和得到最终的偏向度。
时效性指数计算单元,用于根据信息的衰减系数与偏向度的差值进行指数运算得到时效性指数。优选的,时效性指数通过如下计算公式得到:
式中,γ为时效性指数;Γ为衰减系数;L为偏向度;t为信息的有效期。同样的,时效性指数也可以通过稳定性输出模块进行输出,用户根据时效性指数的大小能够直观的看出分析的信息与同领域的其他信息的相对差异,时效性指数越大,其相对影响力越大,时效性指数越小,相对影响力越小,与同领域平均水平差的越多。
根据时效性指数计算单元计算得到的结果,还能够计算出信息的有效期。可行的,在本发明的另一个具体实施例中,根据时效性指数的对数值与信息的衰减系数与偏向度的差值的对数值进行线性计算得到有效期。具体通过如下计算公式计算得到,
式中,t为有效期;γ为时效性指数;Γ为衰减系数;L为偏向度。与时效性指数相类似,有效期同样反映信息在同领域内的相对影响力,用户通过有效期值的大小能够直观的判断信息的相对影响力的大小,有效期长则该信息的相对影响力较大,若有效期较短则相对影响力较小。
参比数据库,用于存储信息总量参比数据、信息质量比值参比数据、信息均值比参比数据和稳定性指数参比数据,所述信息总量参比数据、信息质量比值参比数据、信息均值比参比数据和稳定性指数参比数据分别通过独立的存储单元进行存储形成数据库。优选的,参比数据库内的数据根据信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果进行划分区间,每个独立的存储单元内的数据库的划分区间均建立独立的映射标签用于区分,当各个模块的计算结果在相应的区间内时,所对应的计算结果与相对应的区间的映射标签之间建立映射关系。其中,信息总量分析计算模块输出的是信息总量,比值分析计算模块输出的信息质量比值,信息均值比计算模块输出的是信息均值比,稳定性分析计算模块输出的是衰减系数、稳定性指数、时效性指数和有效期,参比数据库内的参比数据及稳定性指数参比数据,并且稳定性指数与对应的映射标签之间建立映射关系。
输出模块,用于输出信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果;将信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果与参比数据库内的数据进行比对,并输出参比数据库内各个参比数据的区间名称,输出模块获取的参比数据的名称还包括对应的参比数据区间的映射标签。优选的,所述输出模块包括比对单元、结果匹配数据库和输出单元,所述比对单元用于将信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果与参比数据库内的数据进行比对,并将比对的结果与结果匹配数据库内的数据进行匹配。优选的,通过将每个计算结果对应的映射标签匹配结果,并且每个映射标签与计算结果之间存在对应的映射关系。从而在输出结果的时候避免结果与数据发生错乱。所述结果匹配数据库和输出单元用于存放与比对结果相匹配的结果数据,优选的,所述结果匹配数据库包括各个独立的存储单元内的数据库的数据区间的组合结果,通过映射关系进行匹配,由输出单元进行输出供决策者查看。所述输出单元用于输出比对单元的比对结果,并将据信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块分析计算结果的值进行输出。可行的,在本发明的一个具体实施方式中,通过一液晶显示器将输出单元输出的结果进行显示。
上述说明示出并描述了本发明的优选实施例,如前所述,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (10)
1.一种基于大数据的信息定量分析系统,其特征在于,包括指标数据分析计算模块,对数据获取的数据进行组合线型处理得到对应的指标数据;信息总量分析计算模块,将指标数据分析计算模块得到的数据进行分析和调整运算得到信息总量;比值分析计算模块,用于对得到的信息总量和信息基本量以及输入的信息延伸量通过相应的比值计算得到信息质量比值;信息均值比计算模块,用于根据指标数据分析计算模块得到的指标数据进行分析计算信息均值比;信息稳定性分析计算模块,用于对信息的衰减系数、稳定性指数、时效性指数和有效期的计算。
2.根据权利要求1所述的一种基于大数据的信息定量分析系统,其特征在于,还包括参比数据库,用于存储信息总量参比数据、信息质量比值参比数据、信息均值比参比数据和稳定性指数参比数据,所述信息总量参比数据、信息质量比值参比数据、信息均值比参比数据和稳定性指数参比数据分别通过独立的存储单元进行存储形成数据库。
3.根据权利要求2所述的一种基于大数据的信息定量分析系统,其特征在于,还包括输出模块,用于输出信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果;将信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果与参比数据库内的数据进行比对,并输出参比数据库内各个参比数据的区间名称。
4.根据权利要求3所述的一种基于大数据的信息定量分析系统,其特征在于,所述输出模块包括比对单元、结果匹配数据库和输出单元,所述比对单元用于将信息总量分析计算模块、比值分析计算模块、信息均值比计算模块和信息稳定性分析计算模块的分析计算结果与参比数据库内的数据进行比对,并将比对的结果与结果匹配数据库内的数据进行匹配;所述结果匹配数据库和输出单元用于存放与比对结果相匹配的结果数据;所述输出单元用于输出比对单元的比对结果。
5.根据权利要求1所述的一种基于大数据的信息定量分析系统,其特征在于,还包括数据获取模块,用于获取有效信息的数据;数据输入模块,用于输入相关的行为或者对象的信息数据;数据获取模块和数据输入模块获取的数据输出到指标数据分析计算模块。
6.根据权利要求5所述的一种基于大数据的信息定量分析系统,其特征在于,所述数据获取模块包括还一结构化分析模块,将参数获取模块的数据结果进行结构化分析。
7.根据权利要求1所述的一种基于大数据的信息定量分析系统,其特征在于,所述指标数据包括:与某一个行为或者对象有关的总人数,普通群体完全知道该行为或者对象所要传播的信息量的极值,该行为或者对象当前平均认知度。
8.根据权利要求7所述的一种基于大数据的信息定量化分析系统,其特征在于,普通群体完全知道该行为或者对象所要传播的信息量的极值依据该行为或者对象的备选、替代的行为或者对象的数量而确定。
9.根据权利要求7所述的一种基于大数据的信息定量化分析系统,其特征在于,所述指标数据包括:多个目标范围内与某一个行为或者对象有关的总人数,多个目标范围内普通群体完全知道该行为或者对象所要传播的信息量的极值,多个目标范围内的该行为或者对象当前平均认知度。
10.根据权利要求1所述的一种基于大数据的信息定量化分析系统,其特征在于,所述信息总量计算模块在计算信息总量之前,先对指标数据中的平均认知度、评价程度和调整系数指数函数中的底数进行运算得到比例因子,用于调整计算结果;所述评价程度为正面评价程度与加权的负面评价程度之和。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610564765.7A CN106021622A (zh) | 2016-07-18 | 2016-07-18 | 一种基于大数据的信息定量分析系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610564765.7A CN106021622A (zh) | 2016-07-18 | 2016-07-18 | 一种基于大数据的信息定量分析系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106021622A true CN106021622A (zh) | 2016-10-12 |
Family
ID=57119459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610564765.7A Pending CN106021622A (zh) | 2016-07-18 | 2016-07-18 | 一种基于大数据的信息定量分析系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106021622A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846047A (zh) * | 2016-12-23 | 2017-06-13 | 《中国医药科学》杂志社有限公司 | 一种基于网络流媒体的数字化广告系统 |
CN107886239A (zh) * | 2017-11-09 | 2018-04-06 | 安徽律正科技信息服务有限公司 | 一种企业匹配科技信息遴选方法 |
CN110019790A (zh) * | 2017-10-09 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 文本识别、文本监控、数据对象识别、数据处理方法 |
CN110674258A (zh) * | 2019-09-26 | 2020-01-10 | 北京字节跳动网络技术有限公司 | 文档的交互方法、装置、存储介质及电子设备 |
CN111781339A (zh) * | 2020-06-30 | 2020-10-16 | 河北科技师范学院 | 一种阳原驴种公驴精液等级评定系统 |
CN113643761A (zh) * | 2021-10-13 | 2021-11-12 | 苏州赛美科基因科技有限公司 | 一种用于解读二代测序结果所需数据的提取方法 |
-
2016
- 2016-07-18 CN CN201610564765.7A patent/CN106021622A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846047A (zh) * | 2016-12-23 | 2017-06-13 | 《中国医药科学》杂志社有限公司 | 一种基于网络流媒体的数字化广告系统 |
CN110019790A (zh) * | 2017-10-09 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 文本识别、文本监控、数据对象识别、数据处理方法 |
CN110019790B (zh) * | 2017-10-09 | 2023-08-22 | 阿里巴巴集团控股有限公司 | 文本识别、文本监控、数据对象识别、数据处理方法 |
CN107886239A (zh) * | 2017-11-09 | 2018-04-06 | 安徽律正科技信息服务有限公司 | 一种企业匹配科技信息遴选方法 |
CN110674258A (zh) * | 2019-09-26 | 2020-01-10 | 北京字节跳动网络技术有限公司 | 文档的交互方法、装置、存储介质及电子设备 |
CN111781339A (zh) * | 2020-06-30 | 2020-10-16 | 河北科技师范学院 | 一种阳原驴种公驴精液等级评定系统 |
CN113643761A (zh) * | 2021-10-13 | 2021-11-12 | 苏州赛美科基因科技有限公司 | 一种用于解读二代测序结果所需数据的提取方法 |
CN113643761B (zh) * | 2021-10-13 | 2022-01-18 | 苏州赛美科基因科技有限公司 | 一种用于解读二代测序结果所需数据的提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106021622A (zh) | 一种基于大数据的信息定量分析系统 | |
Hu et al. | Hierarchical pattern recognition for tourism demand forecasting | |
Polski et al. | An institutional framework for policy analysis and design | |
Swann et al. | What do we know about urban sustainability? A research synthesis and nonparametric assessment | |
Card et al. | Dropout and enrollment trends in the postwar period: What went wrong in the 1970s? | |
Gill et al. | Elicited priors for Bayesian model specifications in political science research | |
Avineri | A cumulative prospect theory approach to passengers behavior modeling: waiting time paradox revisited | |
Boyd | A socioeconomic scale for Canada: Measuring occupational status from the census | |
Dean | Multi-criteria analysis | |
US8082168B1 (en) | Method for statistical comparison of occupations by skill sets and other relevant attributes | |
Gao | [Retracted] Research and Implementation of Intelligent Evaluation System of Teaching Quality in Universities Based on Artificial Intelligence Neural Network Model | |
CN112116103B (zh) | 基于联邦学习的个人资质评估方法、装置及系统及存储介质 | |
Geissel et al. | Explaining political efficacy in deliberative procedures-A novel methodological approach | |
Nichols et al. | Evaluation of environmental assessment methods | |
CN109949174A (zh) | 一种异构社交网络用户实体锚链接识别方法 | |
Asah-Kissiedu et al. | Integrated safety, health and environmental management in the construction industry: key organisational capability attributes | |
Do et al. | Trapezoidal fuzzy AHP and fuzzy comprehensive evaluation approaches for evaluating academic library service | |
Amer et al. | Expert judgment quantification | |
Khan et al. | Validation of an activity-based travel demand modeling system | |
Kim et al. | Comparative analysis of traveler destination choice models by method of sampling alternatives | |
Zhang et al. | Dynamic time warp-based clustering: Application of machine learning algorithms to simulation input modelling | |
Wang | Perception and reality in developing an outcome performance measurement system | |
Wang et al. | A new method on decision-making using fuzzy linguistic assessment variables and fuzzy preference relations | |
CN106202473A (zh) | 一种基于大数据的品牌分析方法及系统 | |
Jiang et al. | [Retracted] Employment Recommendation for Education Talents Based on Big Data Precision Technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161012 |