CN106021505A - 大数据因子的价值参数的处理方法及装置 - Google Patents

大数据因子的价值参数的处理方法及装置 Download PDF

Info

Publication number
CN106021505A
CN106021505A CN201610344256.3A CN201610344256A CN106021505A CN 106021505 A CN106021505 A CN 106021505A CN 201610344256 A CN201610344256 A CN 201610344256A CN 106021505 A CN106021505 A CN 106021505A
Authority
CN
China
Prior art keywords
big data
factor
value
data
data object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610344256.3A
Other languages
English (en)
Inventor
赵鑫
钱旻奇
段佳宁
郝竞超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610344256.3A priority Critical patent/CN106021505A/zh
Publication of CN106021505A publication Critical patent/CN106021505A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种大数据因子的价值参数的处理方法及装置。其方法包括:确定待处理的大数据因子;根据预先采集的数据对象的个性化信息数据源以及预存储的数据对象的基本信息数据源,获取所述大数据因子的第一价值参数;输出所述大数据因子以及对应的所述第一价值参数,以供用户根据所述大数据因子的所述第一价值参数,对数据对象进行处理。通过采用本发明的上述技术方案,可以弥补现有技术的不足,提供一种利用互联网大数据来获取大数据因子的价值参数,从而可以确定每一个大数据因子对价值参数的影响力。

Description

大数据因子的价值参数的处理方法及装置
【技术领域】
本发明涉及互联网技术领域,尤其涉及一种大数据因子的价值参数的处理方法及装置。
【背景技术】
随着互联网的发展,尤其是“互联网+”概念的提出,推动了互联网与传统的餐饮、旅游、影视以及金融等传统行业的结合,带动了传统行业在互联网模式的新形态下的快速发展。
其中,在互联网+金融的互联网金融领域中,越来越多的互联网公司与传统的金融类的基金公司合作开始探索各类互联网大数据在证券市场投资活动当中的价值。例如:百度使用用户对股票的搜索量和关注程度预测股票的价值参数;阿里巴巴和京东利用网商的交易数据,挖掘网商在二级市场中消费类行业的影响力;腾讯和东方财富利用用户在平台上对股票的关注行为预测股票未来的涨跌情况。且无论是何种互联网大数据,最终都需要落脚在二级市场实际投资当中。
但是,现有的互联网金融中,通常是对股票或者网商的价值参数的评估,而缺乏某些参数如大数据因子对价值参数的影响。因此亟需提供一种如何有效地利用互联网大数据来实现大数据因子对价值参数的处理方案。
【发明内容】
本发明提供了一种大数据因子的价值参数的处理方法及装置,以弥补现有技术的不足,提供一种有效地利用互联网大数据来实现大数据因子对价值参数的处理方案。
本发明提供一种大数据因子的价值参数的处理方法,所述方法包括:
确定待处理的大数据因子;
根据预先采集的数据对象的个性化信息数据源以及预存储的数据对象的基本信息数据源,获取所述大数据因子的第一价值参数;
输出所述大数据因子以及对应的所述第一价值参数,以供用户根据所述大数据因子的所述第一价值参数,对数据对象进行处理。
本发明还提供一种大数据因子的价值参数的处理装置,所述装置包括:
数据对象信息库,用于存储数据对象的基本信息数据源;
确定模块,用于确定待处理的大数据因子;
第一处理模块,用于根据预先采集的数据对象的个性化信息数据源以及所述数据对象信息库中存储的所述数据对象的基本信息数据源,获取所述大数据因子的第一价值参数;
输出模块,用于输出所述大数据因子以及对应的所述第一价值参数,以供用户根据所述大数据因子的所述第一价值参数,对数据对象进行处理。
本发明的大数据因子的价值参数的处理方法及装置,通过确定待处理的大数据因子;根据预先采集的数据对象的个性化信息数据源以及预存储的数据对象的基本信息数据源,获取所述大数据因子的第一价值参数;输出所述大数据因子的所述第一价值参数,以供用户根据所述大数据因子的所述第一价值参数,对数据对象进行处理。本发明通过采用上述技术方案,可以弥补现有技术的不足,提供一种利用互联网大数据来获取大数据因子的价值参数,从而可以确定每一个大数据因子对价值参数的影响力,进而可以更加有效地指导用户对数据对象进行处理。
【附图说明】
图1为本发明的大数据因子的价值参数的处理方法实施例一的流程图。
图2为本发明的一种大数据因子的收益能力表现示意图。。
图3为本发明的一种股市行情表现示意图。
图4为本发明的大数据因子的价值参数的处理方法实施例二的流程图。
图5为本发明的大数据因子的价值参数的处理装置实施例一的结构示意图。
图6为本发明的大数据因子的价值参数的处理装置实施例二的结构示意图。
图7为本发明的大数据因子的价值参数的处理装置实施例三的结构示意图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的大数据因子的价值参数的处理方法实施例一的流程图。如图1所示,本实施例的大数据因子的价值参数的处理方法,具体可以包括如下步骤:
100、确定待处理的大数据因子;
本实施例的大数据因子具体可以为一种参数,例如该参数具体可以为数据源中某一字段的名称,或者还可以为根据该数据源中的某一字段的名称结合需要对该字段进行的定制化处理方式而演变而来的名称。
例如,本实施例中,步骤100具体可以采用如下两种方上式中任意一种来实现:
第一种实现方式、将数据对象的个性化信息数据源中的第一字段的名称作为大数据因子;
该实现方式中,可以直接从数据对象的个性化信息数据源的数据中提取第一字段的名称作为大数据因子;或者也可以从数据对象的个性化信息数据源提取多个可以作为大数据因子的字段的名称,并向用户展示提取的多个可以作为大数据因子的字段的名称,由用户从中选择一个字段的名称如第一字段的名称作为大数据因子,获取用户选择的该第一字段的名称,将其作为大数据因子。该实现方式中,由于未对数据对象的个性化信息数据源中的字段名称做修改,这种大数据因子也可以称之为传统因子。
本实施例中的数据对象的个性化信息数据源具体可以为一种大数据源,包括非常非常高数量级的数据。该数据对象的个性化信息数据源中的数据可以从互联网上预先采集。具体地,本实施例中的数据对象的个性化信息数据源中的数据可以为一些关于数据对象的各种数据,例如本实施例的数据对象可以为股票。且该数据对象的个性化信息数据源中的数据可以按照其关联性一条一条来存储。如在该数据对象的个性化信息数据源中,某一天某一用户的某一支股票的交易数据,可以按照股票代码或者股票名称、该用户购买该股票的交易价、该用户的持有量、该股票这一天的跌涨情况、当天的日期、持有时间以及该股票被搜索的搜索量等等。也就是说,在每一条数据中,可以包括有多个字段以及每个字段的数值。例如本实施例中的第一字段可以为搜索量。
第二种实现方式、根据数据对象的个性化信息数据源中的第二字段的名称和预设的定制化处理方式,确定大数据因子。
该实现方式中的预设的定制化处理方式具体可以为一种数学变换,例如具体可以为同比增长、环比增长或者短期波动的数学计算处理。结合第二字段的名称和预设的定制化处理方式来定义该大数据因子。例如第二字段名称为日收益时,可以根据相应的定制化处理,计算日收益的同比增长率、日收益的环比增长率或者日收益的短期波动率。此时可以将日收益的同比增长率、日收益的环比增长率或者日收益的短期波动率作为确定的大数据因子。按照类似的方式可以确定其它大数据因子。该实现方式中对数据对象的个性化信息数据源中的字段进行了修改,因此该种实现方式中的大数据因子为对传统因子进行演变的因子,为非传统因子。其中该第二字段的名称可以作为该大数据因子对应的传统因子。该方案具体实现时,第二字段的名称的确定可以参考上述第一种实现方式中记载的第一字段的名称的确定方式。
本实施例中第一字段和第二字段可以相同,也可以不相同。例如第二字段也可以为搜索量或者其它字段。
另外,需要说明的是,步骤100按照第二种实现方式确定的大数据因子非传统因子,且与传统因子的相关性极低,例如经过试验计算,该种方式确定的大数据因子与传统因子的相关性普遍都在0.01左右。因此本实施例中,此种方式确定的大数据因子的价值参数是传统因子的价值参数所不能体现,具有其自身的特殊性。
101、根据预先采集的数据对象的个性化信息数据源以及预存储的数据对象的基本信息数据源,获取大数据因子的第一价值参数;
本实施例中该数据对象的个性化信息数据源中的数据可以从互联网上预先采集,包括数据对象的个性化信息。预存储的数据对象的基本信息数据源包括数据对象的所有基本信息。例如当该数据对象为股票时,该数据对象的基本信息数据源可以为包括所有上市公司的股票信息。所有上市公司的股票信息可以从证劵公司网站公开的数据中获取,这些数据内容较为真实,质量较高。为了便于数据维护,可以将数据对象的基本信息数据源预存储在一数据对象信息库中。本实施例中的股票信息具体可以包括盈利(如净资产收益率)、成长(如ROE同比增长率)、规模(如流通市值)、杠杆(如资产负债率)、估值(如PE,PB值)、营运(TTM现金流量)和量价(如日级收盘价、成交量等)7大类数据。
由于数据对象的个性化信息数据源中包含的字段非常多,包含的数据种类非常丰富,包括多支股票的相关数据。例如,对于每一种大数据因子,都可以从数据对象的个性化信息数据源中获取每支股票对应的与该大数据因子相关的数值。然后都可以根据数据对象的基本信息数据源以及数据对象的个性化信息数据源中多支股票的相关数据,评估该大数据因子对于股票涨跌的影响,从而评估该的大数据因子的第一价值参数。例如,该大数据因子的数值越大,股票的涨幅越高,大数据因子的数值越小,股票的涨幅越低,且没有跌的风险,可以确定该大数据因子具有一定的价值参数。基于此原理,并结合上述股票信息,可以评估出该大数据因子的第一价值参数,该第一价值参数主要用于表征对应的大数据因子的收益能力和风险能力。
102、输出大数据因子以及对应的第一价值参数,以供用户根据大数据因子的第一价值参数,对数据对象进行处理。
本实施例中,最终将大数据因子以及对应的第一价值参数进行输出,以供用户根据大数据因子的第一价值参数,对数据对象进行处理,例如具体可以指导用户根据该大数据因子的第一价值参数进行股票的选择,对于第一价值参数比较高的股票用户可以投资,而对于第一投资价值较低的股票,用户可以观望或者直接忽略,从而能够有效地提高用户的投资效率。其中大数据因子的第一价值参数的输出方式可以为图表输出方式,也可以为数字输出方式,具体可以根据用户的需求选择合适的输出方式。
例如,本实施例中的步骤101的一种实现方式,具体可以包括如下步骤:
(a1)从数据对象的个性化信息数据源中提取多个数据对象和多个数据对象共同覆盖的时间区间;
(a2)获取时间区间内各数据对象的大数据因子的数值;
具体地,在具体实施时,选取的多个数据对象可以参考时间区间和大数据因子的数值或者大数据因子对应的传统因子的数值来选取的,以提高选择的数据对象的效率。因为在评估中,需要参与评估的多个数据对象必须具有共同的时间区间,且必须具有大数据因子的数值或者大数据因子对应的传统因子的数值,否则选择的数据对象将不能参与评估,必须重新选取。本实施例的时间区间精确到以天为单位。
例如,以股票作为数据对象为例,从数据对象的个性化信息数据源中提取的多个数据对象,具体可以为股票对应的股票代码。按照上述数据对象的选取原则,选取的股票代码的数量可以为200或者500或者1000,具体数量根据需求来选取。然后根据选取的多个股票代码,确定多个股票代码对应的股票共同覆盖的时间区间,以在后续以选取的多个股票代码为对象,以多个股票代码对应的股票共同覆盖的时间区间为研究区间,评估大数据因子的第一价值参数。
需要说明的是,从数据对象的个性化信息数据源的数据中提取多个股票代码和多个股票代码对应的股票共同覆盖的时间区间之前,还可以对数据对象的个性化信息数据源中的数据进行检测,判断每一条数据中是否都包括股票代码,若未包括股票代码,再检测该条数据中是否包括该数据对象对应的其它标识如股票名称,若包括股票名称,这条数据为有效数据(否则,这条数据为无效数据),进一步根据预存储的数据对象的基本信息数据源,查找股票名称对应的股票代码,将股票代码补充至数据对象的个性化信息数据源的该条数据中,从而在后续提取多个股票代码的时候,该条数据可以作为有效数据,可以被选择。
本实施例中的步骤(a2)具体可以采用如下三种方式中任意一种来实现:
第一种实现方式、从数据对象的个性化信息数据源中提取时间区间内各数据对象对应的大数据因子的原始数值,作为时间区间内各数据对象对应的大数据因子的数值。
该种实现方式对应步骤100采用第一种实现方式。该种实现方式中,数据对象的个性化信息数据源中的第一字段的名称作为大数据因子,各数据对象在时间区间的大数据因子的数值也选取的是最原始的未经任何处理的原始数值。需要说明的是,该时间区间内同一个数据对象对应的大数据因子的数值具体为一组数据,即包括该数据对象在该时间区间内每一天对应的大数据因子的数据。
第二种实现方式、从数据对象的个性化信息数据源中提取时间区间内各数据对象对应的大数据因子对应的原始数值,将时间区间内各数据对象对应的大数据因子对应的原始数值进行去燥、平滑处理以及去周期处理中的至少一种处理,将处理后的时间区间内各数据对象对应的大数据因子对应的数值作为大数据因子的数值。
该种实现方式也对应步骤100采用第一种实现方式。由于上述第一实现方式中大数据因子对应的数据为原始数值,可能比较粗糙,导致最终评估结果不是很完美,第二种实现方式中,将从数据对象的个性化信息数据源中提取的时间区间内各数据对象对应的大数据因子对应的原始数值进行去燥处理、平滑处理以及去周期处理中的至少一种处理,以将大数据因子对应的部分原始数值进行了调整,可以保证处理后的大数据因子对应的数值更具有代表性和研究价值。
具体处理时,可以按照每一支数据对象来处理,以得到时间区间内该数据对象对应的大数据因子的数值。且该时间区间内,该数据对象对应的大数据因子的原始数值为一组数据,每一个数据为一天的数据。该种实现方式中的去燥、平滑处理以及去周期处理均是对大数据因子的原始数值的这一组数据进行处理。其中去燥处理具体用于去除数据对象的个性化信息数据源中大数据因子对应的一组数据中的一些明显偏离数据有效区间范围的噪声点的数据。平滑处理具体用于将数据对象的个性化信息数据源中大数据因子对应的一组数据进行去棱角处理,使得大数据因子对应的该组数据的整体状态图更加平滑。去周期处理具体用于对该组数据中一些周期性比较明显的数据,去掉其周期性,使得数据走势比较平稳,更具有代表性。例如以数据对象是股票为例,股票交易数据,由于股票交易是在周一到周五,周六和周日没有任何交易,导致股票交易数据的周期性非常明显,因此需要对股票交易数据进行去周期处理,具体地,可以采用周一到周五的数据对周六和周日的数据进行填补。具体如何填补,可以取周一到周五的数据的平均值对周六和周日的数据进行填补;也可以取周一到周五某一天或者两天的数据对周六和周日的数据进行填补。经过上述处理,可以将数据对象的个性化信息数据源中各数据对象对应的大数据因子对应的原始数值中的一组数据中的部分数据进行调整。
对于上述第一种和第二种实现方式,当预存储的数据对象的基本信息数据源中包括有大数据因子的数值时,也可以从预存储的所有上是公司的股票信息中获取该大数据因子的数值。
第三种实现方式、从数据对象的个性化信息数据源中提取时间区间内各数据对象对应的第二字段对应的原始数值,将时间区间内各数据对象对应的第二字段对应的原始数值进行去燥、平滑处理以及去周期处理中的至少一种处理,将处理后的时间区间内各数据对象对应的第二字段对应的数值,按照对应的预设的定制化处理方式进行定制化处理,将定制化处理后得到的时间区间内各数据对象对应的第二字段对应的数值,作为时间区间内各数据对象对应的大数据因子的数值。
该种实现方式也对应步骤100采用第二种实现方式。同理,该种实现方式中,第二字段可以与第一字段相同,也可以与第二字段不同。本实施例中,对数据对象的个性化信息数据源中时间区间内第二字段对应的原始数值进行去燥、平滑处理以及去周期处理中的至少一种处理的处理方式,与上述第二实现方式的实现原理相同,在此不再赘述。
例如,若第二字段为搜索量时,此时对应的定制化处理方式为同比增长率、环比增长率或者短期波动率,从而可以对搜索量进行同比增长率、环比增长率或者短期波动率的计算,确定的大数据因为可以为搜索量的同比增长率、搜索量的环比增长率或者搜索量的短期波动率。同理,第二字段对应的原始数值也为一组数据,将从数据对象的个性化信息数据源中提取时间区间内各数据对象对应的第二字段对应该组数据,进行去燥、平滑处理以及去周期处理中的至少一种处理,处理之后,该组数据中去除了噪点、棱角以及周期性等特性,将处理后的该组数据按照对应的预设的定制化处理方式进行定制化处理,将定制化处理后该组数据,作为时间区间内各数据对象对应的大数据因子的数值。
(a3)根据多个数据对象以及时间区间,从数据对象的基本信息数据源中获取各数据对象在时间区间的量价参数值;
具体地,以数据对象是股票为例,从数据对象的基本信息数据源如所有上市公司的股票信息中获取每一支股票代码对应的股票在时间区间的日级收盘价和交易量等等量价参数值。本实施例中确定的时间区间可以按照年来统计,如一年、两年、三年或者五年,或者其他整数年。或者确定的时间区间也可以按照天数来统计,如30天、90天或者100天或者也可以为其他整数天;或者时间区间还可以按照月数来统计如1月、2月或者其他整数月。
(a4)根据各数据对象在时间区间的量价参数值和大数据因子的数值,评估大数据因子的第一价值参数。
例如,以数据对象是股票为例,根据各股票代码对应的股票在时间区间的量价参数值如量价信息,可以得至每一支股票的每一天的交易量以及每一天的日级收盘价,这样可以算出该股票的每一天的收益情况,然后根据每一天的大数据因子的数值和对应的每一支股票的每天的收益,整体上核算出大数据因子对股票涨跌的影响,从而拟合出大数据因子与收益及风险能力之间的关系,从而确定出大数据因子的第一价值参数。
例如,具体在核算时,由于数据较多,为了更加清晰地找出大数据因子与对应的收益及风险能力之间的关系,可以将数据分为多档,每一档的数据可以归一化为一个大数据因子与对应的收益及风险能力的对应的关系,得到每一档的大数据因子对应的第一价值参数。
具体地,以数据对象是股票为例,在每一档数据的计算中,可以将所有股票代码的大数据因子取平均,对应的收益及风险能力取平均,找出大数据因子与对应的收益及分享能力之间的关系。或者也可以各支股票的大数据因子按照的市值或者行业加权求和再取平均作为平均的大数据因子,然后再将对应的收益及风险能力也按照类似的加权求和取平均的方式获取平均收益,再寻找出大数据因子与对应的收益及风险能力之间的关系,从而确定每一档中大数据因子的第一价值参数。
以数据对象是股票为例,如果股票代码有500个时,在作评估时,可以将股票代码分为多档,本实施例以5档为例来说明;每一百支股票代码归为一档。在具体归一过程中,也可以按照上述的直接取平均的方式,也可以按照加权求和取平均的方式,确定每一档中大数据因子的第一价值参数。还可以根据得到的五档数据拟合大数据因子与对应的收益之间的关系,从而确定在同时考虑500支数据对象的时候,大数据因子的整体的第一价值参数;即全样本情况下的大数据因子的第一价值参数。
例如,该步骤(a4)的一种实现方式,具体可以包括如下步骤:
(b1)根据各数据对象在时间区间的量价参数值,确定各数据对象在每个设定周期的收益;
本实施例中,以数据对象是股票为例,各代码对应的股票在时间区间的量价参数值如量价信息包括该时间区间内每一天的量价信息。本实施例的设定周期具体可以为换仓周期,例如可以按照选取的时间区间选择一个合适的换仓周期,具体也可以按照年来统计,也可以分别按照月或者天来统计。
如果按照天来评估各大数据因子的第一价值参数的话,可能计算量较为复杂,在本实施例中,先选定换仓周期,然后根据各股票代码对应的股票在时间区间的量价信息,确定各股票在每个换仓周期的收益。
(b2)根据各数据对象对应的大数据因子对应的数值、各数据对象在每个设定周期的收益以及确定的各评估区间,评估大数据因子在各评估区间对应的第一价值参数。
在步骤(b2)之前,还可以包括:根据评估分类以及时间区间确定各评估区间;评估分类按照年份划分或者按照变化趋势划分;变化趋势包括上涨、震荡和下跌三种状态。
例如,当评估分类按照年份划分的时候,可以将时间区间按照自然年分开,可以分为多个评估区间。当数据对象为股票时,变化趋势具体可以为股票行情,当评估分类按照股市行情划分时,可以将时间区间分为多个评估区间,各评估区间呈上涨、震荡或者下跌状态。
在评估时,可以按照步骤(a4)进行整体评估。当需要了解每种状态或者每个年份的评估时,也可以具体按照步骤(b1)和(b2)进行更加详细的按照评估区间进行评估。
具体地,在该评估区间内,可以参考上述(a4)的具体实现方式,将每一个评估区间作为一个时间区间,按照直接取平均的方式,或者加权求和取平均的方式,确定大数据因子在每一个评估区间对应的第一价值参数。
当按照股市行情将时间区间划分时,整个时间区间内可以包括多个上涨评估区间,多个震荡评估区间或者多个下跌区间。也可以按照直接取平均的方式,或者加权求和取平均的方式,确定大数据因子在整体的上涨行情下的第一价值参数、在整体的震荡行情下的第一价值参数,以及在整体的下跌行情下的第一价值参数。
进一步可选地,在上述实施例的步骤101之后,还可以包括如下步骤:
(c1)根据大数据因子的第一价值参数以及其它大数据因子对应的第一价值参数,确定大数据因子的第一价值参数相对于其他大数据因子的第一价值参数的第一排名值;
上述实施例计算的大数据因子的第一价值参数可以称之为绝对价值参数。当存在多个大数据因子时,采用上述实施例的方式,可以计算每一个大数据因子的第一价值参数,并且可以根据当前大数据因子的第一价值参数以及其它大数据因子对应的第一价值参数,确定当前大数据因子的第一价值参数相对于其他大数据因子的第一价值参数的第一排名值。本实施例的大数据因子的第一排名值可以称为大数据因子对应的相对值。
(d1)输出大数据因子对应的第一排名值。
本实施例的大数据因子的第一排名值的输出方式为数字输出方式,例如第1、第2或者其他数值。本实施例中的第一排名值也可以为第一排名分位。
其中第一价值参数可以包括年化收益率、日均超额收益率、夏普比率、胜率、信息比率以及最大回撤比率中的任意一种。
综上所述,可以将大数据因子的评估主要有三个维度,大数据因子的收益能力,大数据收益的稳定度和与传统因子的差异度。而这三个维度可以同时以绝对值和相对值的形式进行展示。可输出的数值包括下表1所示。
表1
下面结合几个样例的输出来描述本发明的技术方案。其中某大数据因子整体和分年度的收益能力(以年化收益率为描述指标)和收益稳定性(以最大回撤比例为描述指标)的表格输出。其大数据因子第五档的收益表现常年较高且稳定,且风险表现常年处于较低水平,是非常有投资潜力的因子。
表2为本发明输出的一种大数据因子的收益能力表现图表。如表2所示,本实施例中将数据对象分为五档,按照不划分评估区间和按照自然年划分评估区间两种方式描述收益。
表2
第一档 第二档 第三档 第四档 第五档
全样本 25.5 21.9 32.8 36.1 64.4
2012年 0.5 -0.8 0 9.8 5
2013年 10.8 11.6 13 10.3 34
2014年 52.8 34.1 47.3 45.8 61.1
2015年 6.5 14.2 32.1 31.3 61.3
从表2可以看出,在全样本的情况下,该大数据因子在第五档的收益最高,可参考性最强,如果数据对象为股票时,说明该大数据因子在第五档的股票中具有较强的选股能力。按自然年划分评估区间的时候,在2012年,该大数据因子的收益较小,参考性较低,以股票为例,说明该数据因子在该年度不具备优秀的选股能力。2013年相比2012年该大数据因子的收益有所提高。2014年为分析的这几年中,该大数据因子的收益总体上最高的一年,尤其是在第五档中的收益最高。进入2015年,该大数据因子的收益有所下降。且在五档中,该大数据因子在第五档中收益最高,具有最强可参考价值,以股票为例,说明该大数据因子在2015年所支持的选股能力最强。
表3为本发明输出的一种大数据因子的风险能力表现图表。如表2所示,同理,本实施例中仍将数据对象分为五档,按照不划分评估区间和按照自然年划分评估区间两种方式描述风险。
表3
第一档 第二档 第三档 第四档 第五档
全样本 44.5 46.4 44.4 46.2 40.2
2012年 25.5 26.4 25.6 19.5 21.5
2013年 16.6 18.4 19.5 19.4 17.3
2014年 10.7 10.7 10.2 8.9 10.2
2015年 45.4 44.3 43 48.2 39.4
从表3可以看出,无论是在全样本的情况下,还是按照自然年划分评估区间的情况下,该大数据因子在五档中所表现的风险能力差不多在同一等级。对比各自然年,该大数据因子在2012年和2015年具有较高的风险能力,可以提醒用户谨慎选择。该大数据因子在2013年和2014年的风险能力相对较低,尤其是2014年达到分析的这几年中风险能力最低的一年。
图2为本发明的一种大数据因子的收益能力表现示意图。与表3不同的是,图2采用的是图的方式来表示另一种大数据因子的价值参数。且如图2所示,本实施例中以数据对象为股票为例,将所选取的股票代码分为五档、价值参数采用净值来体现、且时间区间采用交易日来统计。如图2所示,本实施例中,将大盘所对应的净值作为基准(benchmark),分析该大数据因子在该时间区间内的五档中各档的净值。如图2所示,可以看出在该时间区间内,该大数据因子在第一档的净值最高,具有最优的选股能力。第二档和第三档次之,而第四档围绕大盘的benchmark,与benchmark不分上下;而第五档低于大盘的benchmark,选股能力较差。
表4为输出的一种大数据因子的日均超额收益能力表现图表。表4以数据对象为股票、日均超额收益为描述指标。将时间区间按照图3所示的股市行情划分,得到每种行情下对应的日均超额收益能力。如图3所示,根据时间区间内每个交易日的净值中将股市行情分为为三阶段,上涨行情阶段采用实线表示,下跌行情阶段采用虚线表示,震荡行情阶段采用间断线条表示。根据表4可以看出,从不分行情的整体角度来看,该大数据因子的价值参数可以达到0.16%。分行情时,在上涨行情中,该大数据因子的价值参数可以达到0.18%,下跌行情中,该大数据因子的价值参数仅为0.07%,在震荡行情中,该大数据因子的价值参数仅为0.02%;因此可以看到该大数据因子在上涨行情中的价值参数最高,表现的有更优秀的选股能力。上述实施例中的价值参数具体为第一价值参数。
表4
本实施例的大数据因子的价值参数的处理方法,通过采用上述技术方案,可以弥补现有技术的不足,提供一种利用互联网大数据来获取大数据因子对价值参数,从而可以确定大数据因子对价值参数的影响力,进而可以更加有效地指导用户对数据对象进行处理。
图4为本发明的大数据因子的价值参数的处理方法实施例二的流程图。如图4所示,本实施例的大数据因子的价值参数的处理方法,具体可以包括如下步骤:
200、确定待处理的大数据因子;
201、从数据对象的个性化信息数据源中提取多个数据对象和多个数据对象共同覆盖的时间区间;
202、获取时间区间内各数据对象的大数据因子的数值;
其中步骤200参考上述实施例的步骤100的具体实现方式,步骤201和步骤202分别参考上述实施例中的步骤(a1)和步骤(a2)的具体实现方式,详细参考上述实施例的记载,在此不再赘述。
203、根据时间区间内各数据对象对应的大数据因子的数值以及预设分析模型,获取大数据因子的第二价值参数;
以数据对象为股票为例,本实施例的预设分析模型具体可以为预设投资模型,例如可以为证劵公司公开的常用的投资模型。本实施例的评估大数据因子的价值参数对整个时间区间进行整体评估。根据各数据对象在时间区间的大数据因子的数值,可以知道各数据对象对应的大数据因子在时间区间内每一天的数值。根据该大数据因子和预设投资模型可以确定各数据对象的该大数据因子在该投资模型下的每一天的收益,因此,可以根据各数据对象对应的大数据因子在时间区间内每一天的数值以及每一天对应的收益,核算该大数据因子的整体收益能力,即该大数据因子在整个时间区间所能产生的第二价值参数,例如实际收益率或者夏普比率等等。同理该第二价值参数也用于表征大数据因子的收益及风险能力。且第二价值参数也可以包括年化收益率、日均超额收益率、夏普比率、胜率、信息比率以及最大回撤比率中的任意一种。当数据对象为其他时,对应的预设分析模型可以为其他领域的预设模型,
例如,该步骤203的一种实现方式,具体可以包括如下步骤:
(d1)根据大数据因子简化预设分析模型;
以数据对象为股票为例,由于预设投资模型中会包括许多参数,为了表征该待处理的大数据因子,因此,本实施例中,需要根据大数据因子简化预设投资模型,以仅考虑要评估的大数据因子,而忽略其他大数据因子的影响,可以理解为简化得到一个因子分析模型。根据该因子分析模型,可以计算筛选出的股票列表和每支股票每天产生的收益值。
(d2)将时间区间内各数据对象对应的大数据因子的数值应用至简化的预设分析模型中,核算大数据因子在时间区间内所产生的第二价值参数。
具体地,将时间区间内各数据对象对应的大数据因子的数值,即具体为一组数据,将这组数据应用到简化的预设分析模型中。由于该简化的预设分析模型中仅考虑该待处理的大数据因子,因此可以根据该简化的预设投资模型,计算该组数据中,每一个数据因子每一天所产生的收益能力。同理,可以参考上述实施例中第一价值参数的计算方式,可以采用直接取平均的方式,或者也可以采用加权求和取平均的方式,确定大数据因子与对应的收益及风险能力之间的关系,从而确定大数据因子在时间区间内的第二价值参数。同理,本实施例中也可以将时间区间按照变化趋势或者自然年划分得到各个评估区间,分别计算各个评估区间中该大数据因子的第二价值参数,其计算原理同上述实施例相同,在此不再赘述。
204、输出大数据因子以及对应的第二价值参数,以供用户根据大数据因子的第二价值参数,对数据对象进行处理。
同理,第二价值参数也可以采用图标或者数字形式输出。该第二价值参数与第一价值参数的计算方式不一样,从另一个角度表现大数据因子的收益及风险能力,也可以指导用户根据大数据因子的第二价值参数,对数据对象进行处理;例如可以指导用户根据大数据因子的第二价值参数,对股票投资进行有效地指导。
进一步可选地,在上述步骤204之后,还可以包括如下步骤:
(e1)根据大数据因子的第二价值参数以及其它大数据因子对应的第二价值参数,确定大数据因子的第二价值参数相对于其他大数据因子的所述第二价值参数的第二排名值;
(e2)输出大数据因子对应的第二排名值;
同大数据因子的第一价值参数的计算方式类似,可以计算出大数据因子的第二排名值,同理第二排名值的输出方式也为数字输出方式。本实施例中的第二排名值也可以为第二排名分位。
本实施例的大数据因子的价值参数的处理方法,可以独立作为一个实施例单独实施例,也可以从属于上述图1所示实施例,在图1所示实施例的基础上增加步骤203和204即可。此时由于第一价值参数输出时已经输出了大数据因子,此时步骤204中可以不再输出大数据因子。
本实施例的大数据因子的价值参数的处理方法,通过采用上述技术方案,可以弥补现有技术的不足,提供一种利用互联网大数据来获取大数据因子对价值参数,从而可以确定大数据因子对价值参数的影响力,进而可以更加有效地指导用户对数据对象进行处理。
图5为本发明的大数据因子的价值参数的处理装置实施例一的结构示意图。如图5所示,本实施例的大数据因子的价值参数的处理装置,具体可以包括:数据对象信息库10、确定模块11、第一处理模块12和输出模块13。
其中数据对象信息库10用于存储数据对象的基本信息数据源;确定模块11用于确定待处理的大数据因子;第一处理模块12用于根据预先采集的数据对象的个性化信息数据源以及数据对象信息库10中存储的数据对象的基本信息数据源,获取确定模块11确定的大数据因子的第一价值参数;输出模块13用于输出确定模块11确定的大数据因子以及第一处理模块12获取的大数据因子的第一价值参数,以供用户根据大数据因子的第一价值参数,对数据对象进行处理。
进一步可选地,确定模块11具体用于将数据对象的个性化信息数据源中的第一字段的名称作为大数据因子;或者确定模块11具体用于根据数据对象的个性化信息数据源中的第二字段的名称和预设的定制化处理方式,确定大数据因子。图6为本发明的大数据因子的价值参数的处理装置实施例二的结构示意图。如图6所示,本实施例的大数据因子的价值参数的处理装置,在上述图5所示实施例的技术方案的基础上,第一处理模块12具体包括获取单元121和评估单元122。
其中获取单元121具体用于从数据对象的个性化信息数据源中提取多个数据对象和多个数据对象共同覆盖的时间区间;获取时间区间内各数据对象对应的大数据因子的数值;根据多个数据对象以及时间区间,从数据对象信息库10中预存储的数据对象的基本信息数据源中获取各数据对象在时间区间的量价参数值;评估单元122具体用于根据获取单元121获取的各数据对象在时间区间的量价参数值和大数据因子的数值,评估大数据因子的第一价值参数。
进一步可选地,当确定模块11具体用于将数据对象的个性化信息数据源的第一字段的名称作为大数据因子时,获取单元121具体用于从数据对象的个性化信息数据源中提取时间区间内各数据对象对应的大数据因子的原始数值,作为时间区间内各数据对象对应的大数据因子的数值;或者获取单元121具体用于从数据对象的个性化信息数据源中提取时间区间内各数据对象对应的大数据因子对应的原始数值,将时间区间内各数据对象对应的大数据因子对应的原始数值进行去燥、平滑处理以及去周期处理中的至少一种处理,将处理后的时间区间内各数据对象对应的大数据因子对应的数值作为大数据因子的数值;
进一步可选地,当确定模块11具体用于根据数据对象的个性化信息数据源中的第二字段的名称和预设的定制化处理方式,确定大数据因子时,获取单元121具体用于从数据对象的个性化信息数据源中提取时间区间内各数据对象对应的第二字段对应的原始数值,将时间区间内各数据对象对应的第二字段对应的原始数值进行去燥、平滑处理以及去周期处理中的至少一种处理,将处理后的时间区间内各数据对象对应的第二字段对应的数值,按照对应的预设的定制化处理方式进行定制化处理,将定制化处理后得到的时间区间内各数据对象对应的第二字段对应的数值,作为时间区间内各数据对象对应的大数据因子的数值。
进一步可选地,评估单元122具体用于根据获取单元121获取的各数据对象在时间区间的量价参数值,确定各数据对象在每个设定周期的收益;根据各数据对象对应的大数据因子的数值、各数据对象在每个设定周期的收益以及确定的各评估区间,评估大数据因子在各评估区间对应的第一价值参数。此时对应的输出模块13输出评估单元122评估的第一价值参数。
进一步可选地,确定模块11还用于根据评估分类以及时间区间确定各评估区间;评估分类按照年份划分或者按照股市行情划分;股市行情包括上涨、震荡和下跌三种状态。
如图6所示,进一步可选地,本实施例的大数据因子的价值参数的处理装置,还包括第二处理模块14。第二处理模块14具体用于根据获取单元121获取的时间区间内各数据对象对应的大数据因子的数值以及预设投资模型,评估大数据因子的第二价值参数;输出模块13还用于输出第二处理模块14评估的大数据因子的第二价值参数。
进一步可选地,第二处理模块14具体用于根据大数据因子简化预设投资模型;将时间区间内各数据对象对应的大数据因子的数值应用至简化的预设投资模型中,核算大数据因子在时间区间内所产生的第二价值参数。
进一步可选地,各大数据因子的第一价值参数和第二投资的价值的输出方式包括图标输出方式或者数字输出方式。
进一步可选地,确定模块11还用于根据大数据因子的第一价值参数以及其它大数据因子对应的第一价值参数,确定大数据因子的第一价值参数相对于其他大数据因子的第一价值参数的第一排名值;输出模块13还用于输出确定模块11确定的大数据因子对应的第一排名值;
进一步地,确定模块11还用于根据大数据因子的第二价值参数以及其它大数据因子对应的第二价值参数,确定大数据因子的第二价值参数相对于其他大数据因子的第二价值参数的第二排名值;输出模块13还用于输出确定模块11确定的大数据因子对应的第二排名值;
进一步可选地,第一价值参数和第二价值参数各包括年化收益率、日均超额收益率、夏普比率、胜率、信息比率以及最大回撤比率中的任意一种;
进一步可选地,大数据因子的第一排名值和第二排名值的输出方式为数字输出方式。
上述实施例的大数据因子的价值参数的处理装置,通过采用上述模块实现大数据因子的价值参数的处理与上述相关方法实施例的实现原理以及技术效果相同,详细可以参考上述相关实施例的记载,在此不再赘述。
图7为本发明的大数据因子的价值参数的处理装置实施例三的结构示意图。如图7所示,本实施例的大数据因子的价值参数的处理装置,将图6中参与大数据因子的第二价值参数处理的模块单独拿出来作为一个独立的实施例。如图7所示,本实施例的大数据因子的价值参数的处理装置,具体可以包括:确定模块21、获取模块22、第二处理模块23和输出模块24。
其中确定模块21用于确定待处理的大数据因子;参考上图5所示实施例的确定模块11的具体实现方式;获取模块22用于从数据对象的个性化信息数据源中提取多个数据对象和多个数据对象共同覆盖的时间区间;获取时间区间内各数据对象对应的确定模块21确定的大数据因子的数值;参考上图6所示实施例的获取单元121的具体实现方式;第二处理模块23用于根据获取模块22获取的时间区间内各数据对象对应的大数据因子的数值以及预设分析模型,获取大数据因子的第二价值参数;第二处理模块23参考上图6所示实施例的第二处理模块14的具体实现方式;输出模块24用于输出确定模块21确定的大数据因子以及第二处理模块23获取的大数据因子的第二价值参数。输出模块24参考上图6所示实施例的输出模块13的具体实现方式。
本实施例中,通过采用上述模块实现大数据因子的价值参数的处理与上述相关方法实施例的实现原理以及技术效果相同,详细可以参考上述相关实施例的记载,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (20)

1.一种大数据因子的价值参数的处理方法,其特征在于,所述方法包括:
确定待处理的大数据因子;
根据预先采集的数据对象的个性化信息数据源以及预存储的数据对象的基本信息数据源,获取所述大数据因子的第一价值参数;
输出所述大数据因子以及对应的所述第一价值参数,以供用户根据所述大数据因子的所述第一价值参数,对数据对象进行处理。
2.根据权利要求1所述的方法,其特征在于,确定待处理的大数据因子,具体包括:
将所述数据对象的个性化信息数据源中的第一字段的名称作为所述大数据因子;或者
根据所述数据对象的个性化信息数据源中的第二字段的名称和预设的定制化处理方式,确定所述大数据因子。
3.根据权利要求2所述的方法,其特征在于,根据预先采集的数据对象的个性化信息数据源以及预存储的数据对象的基本信息数据源,获取所述大数据因子的第一价值参数,具体包括:
从所述数据对象的个性化信息数据源中提取多个数据对象和所述多个数据对象共同覆盖的时间区间;
获取所述时间区间内各所述数据对象对应的所述大数据因子的数值;
根据所述多个数据对象以及所述时间区间,从所述数据对象的基本信息数据源中获取各所述数据对象在所述时间区间的量价参数值;
根据各所述数据对象在所述时间区间的量价参数值和所述大数据因子的数值,评估所述大数据因子的所述第一价值参数。
4.根据权利要求3所述的方法,其特征在于,当将所述数据对象的个性化信息数据源中的第一字段的名称作为所述大数据因子时,获取所述时间区间内各所述数据对象对应的所述大数据因子的数值,具体包括:
从所述数据对象的个性化信息数据源中提取所述时间区间内各所述数据对象对应的所述大数据因子的原始数值,作为所述时间区间内各所述数据对象对应的所述大数据因子的数值;
或者从所述数据对象的个性化信息数据源中提取所述时间区间内各所述数据对象对应的所述大数据因子对应的原始数值,将所述时间区间内各所述数据对象对应的所述大数据因子对应的原始数值进行去燥、平滑处理以及去周期处理中的至少一种处理,将处理后的所述时间区间内各所述数据对象对应的所述大数据因子对应的数值作为所述大数据因子的数值;
当根据所述数据对象的个性化信息数据源中的第二字段的名称和预设的定制化处理方式,确定所述大数据因子时,获取所述时间区内各所述数据对象对应的所述大数据因子的数值,具体包括:
从所述数据对象的个性化信息数据源中提取所述时间区间内各所述数据对象对应的所述第二字段对应的原始数值,将所述时间区间内各所述数据对象对应的所述第二字段对应的原始数值进行去燥、平滑处理以及去周期处理中的至少一种处理,将处理后的所述时间区间内各所述数据对象对应的所述第二字段对应的数值,按照对应的所述预设的定制化处理方式进行定制化处理,将定制化处理后得到的所述时间区间内各所述数据对象对应的所述第二字段对应的数值,作为所述时间区间内各所述数据对象对应的所述大数据因子的数值。
5.根据权利要求3所述的方法,其特征在于,根据各所述数据对象在所述时间区间的量价参数值和所述大数据因子的数值,评估所述大数据因子的所述第一价值参数,具体包括:
根据各所述数据对象在所述时间区间的量价参数值,确定各所述数据对象在每个设定周期的收益;
根据各所述数据对象对应的所述大数据因子的数值、各所述数据对象在每个设定周期的收益以及确定的各评估区间,评估所述大数据因子在各所述评估区间对应的第一价值参数。
6.根据权利要求5所述的方法,其特征在于,根据各所述数据对象对应的所述大数据因子的数值、各所述数据对象在每个设定周期的收益以及确定的各评估区间,评估所述大数据因子在各所述评估区间对应的第一价值参数之前,所述方法还包括:
根据评估分类以及所述时间区间确定各所述评估区间;所述评估分类按照年份划分或者按照变化趋势划分;所述变化趋势包括上涨、震荡和下跌三种状态。
7.根据权利要求3-6任一所述的方法,其特征在于,获取所述时间区间内各所述数据对象对应的所述大数据因子的数值之后,所述方法还包括:
根据所述时间区间内各所述数据对象对应的所述大数据因子的数值以及预设分析模型,获取所述大数据因子的第二价值参数;
输出所述大数据因子的所述第二价值参数,以供用户根据所述大数据因子的所述第二价值参数,对数据对象进行处理。
8.根据权利要求7所述的方法,其特征在于,根据所述时间区间内各所述数据对象对应的所述大数据因子的数值以及预设分析模型,获取所述大数据因子的第二价值参数,具体包括:
根据所述大数据因子简化所述预设分析模型;
将所述时间区间内各所述数据对象对应的所述大数据因子的数值应用至简化的所述预设分析模型中,核算所述大数据因子在所述时间区间内所产生的第二价值参数。
9.根据权利要求7所述的方法,其特征在于,各所述大数据因子的所述第一价值参数和所述第二投资的价值的输出方式包括图标输出方式或者数字输出方式。
10.根据权利要求8或9所述的方法,其特征在于,根据数据对象的个性化信息数据源以及预存储的数据对象的基本信息数据源,获取所述大数据因子的第一价值参数之后,所述方法还包括:
根据所述大数据因子的所述第一价值参数以及其它大数据因子对应的第一价值参数,确定所述大数据因子的第一价值参数相对于其他大数据因子的所述第一价值参数的第一排名值;
输出所述大数据因子对应的所述第一排名值;
进一步地,根据各所述数据对象对应的所述大数据因子的数值以及预设分析模型,获取所述大数据因子的第二价值参数之后,所述方法还包括:
根据所述大数据因子的所述第二价值参数以及其它大数据因子对应的第二价值参数,确定所述大数据因子的第二价值参数相对于其他大数据因子的所述第二价值参数的第二排名值;
输出所述大数据因子对应的所述第二排名值;
进一步地,所述第一价值参数和所述第二价值参数各包括年化收益率、日均超额收益率、夏普比率、胜率、信息比率以及最大回撤比率中的任意一种;
进一步地,所述大数据因子的所述第一排名值和所述第二排名值的输出方式为数字输出方式。
11.一种大数据因子的价值参数的处理装置,其特征在于,所述装置包括:
数据对象信息库,用于存储数据对象的基本信息数据源;
确定模块,用于确定待处理的大数据因子;
第一处理模块,用于根据预先采集的数据对象的个性化信息数据源以及所述数据对象信息库中存储的所述数据对象的基本信息数据源,获取所述大数据因子的第一价值参数;
输出模块,用于输出所述大数据因子以及对应的所述第一价值参数,以供用户根据所述大数据因子的所述第一价值参数,对数据对象进行处理。
12.根据权利要求11所述的装置,其特征在于,所述确定模块,具体用于将所述数据对象的个性化信息数据源中的第一字段的名称作为所述大数据因子;或者
所述确定模块,具体用于根据所述数据对象的个性化信息数据源中的第二字段的名称和预设的定制化处理方式,确定所述大数据因子。
13.根据权利要求12所述的装置,其特征在于,所述第一处理模块,具体包括:获取单元和评估单元;
所述获取单元,具体用于:
从所述数据对象的个性化信息数据源中提取多个数据对象和所述多个数据对象共同覆盖的时间区间;
获取所述时间区间内各所述数据对象对应的所述大数据因子的数值;
根据所述多个数据对象以及所述时间区间,从所述数据对象的基本信息数据源中获取各所述数据对象在所述时间区间的量价参数值;
所述评估单元,具体用于根据各所述数据对象在所述时间区间的量价参数值和所述大数据因子的数值,评估所述大数据因子的所述第一价值参数。
14.根据权利要求13所述的装置,其特征在于,当所述确定模块具体用于将所述数据对象的个性化信息数据源中的第一字段的名称作为所述大数据因子时,对应地,所述获取单元,具体用于从所述数据对象的个性化信息数据源中提取所述时间区间内各所述数据对象对应的所述大数据因子的原始数值,作为所述时间区间内各所述数据对象对应的所述大数据因子的数值;
或者具体用于从所述数据对象的个性化信息数据源中提取所述时间区间内各所述数据对象对应的所述大数据因子对应的原始数值,将所述时间区间内各所述数据对象对应的所述大数据因子对应的原始数值进行去燥、平滑处理以及去周期处理中的至少一种处理,将处理后的所述时间区间内各所述数据对象对应的所述大数据因子对应的数值作为所述大数据因子的数值;
当所述确定模块具体用于根据所述数据对象的个性化信息数据源中的第二字段的名称和预设的定制化处理方式,确定所述大数据因子时,所述获取单元,具体用于从所述数据对象的个性化信息数据源中提取所述时间区间内各所述数据对象对应的所述第二字段对应的原始数值,将所述时间区间内各所述数据对象对应的所述第二字段对应的原始数值进行去燥、平滑处理以及去周期处理中的至少一种处理,将处理后的所述时间区间内各所述数据对象对应的所述第二字段对应的数值,按照对应的所述预设的定制化处理方式进行定制化处理,将定制化处理后得到的所述时间区间内各所述数据对象对应的所述第二字段对应的数值,作为所述时间区间内各所述数据对象对应的所述大数据因子的数值。
15.根据权利要求13所述的装置,其特征在于,所述评估单元,具体用于:
根据各所述数据对象在所述时间区间的量价参数值,确定各所述数据对象在每个设定周期的收益;
根据各所述数据对象对应的所述大数据因子的数值、各所述数据对象在每个设定周期的收益以及确定的各评估区间,评估所述大数据因子在各所述评估区间对应的第一价值参数。
16.根据权利要求15所述的装置,其特征在于,所述确定模块,还用于根据评估分类以及所述时间区间确定各所述评估区间;所述评估分类按照年份划分或者按照变化趋势划分;所述变化趋势包括上涨、震荡和下跌三种状态。
17.根据权利要求13-16任一所述的装置,其特征在于,所述装置还包括第二处理模块:
所述第二处理模块,具体用于根据所述时间区间内各所述数据对象对应的所述大数据因子的数值以及预设分析模型,评估所述大数据因子的第二价值参数;
所述输出模块,还用于输出所述大数据因子的所述第二价值参数,以供用户根据所述大数据因子的所述第二价值参数,对数据对象进行处理。
18.根据权利要求17所述的装置,其特征在于,所述第二处理模块,具体用于:
根据所述大数据因子简化所述预设分析模型;
将所述时间区间内各所述数据对象对应的所述大数据因子的数值应用至简化的所述预设分析模型中,核算所述大数据因子在所述时间区间内所产生的第二价值参数。
19.根据权利要求17所述的装置,其特征在于,各所述大数据因子的所述第一价值参数和所述第二投资的价值的输出方式包括图标输出方式或者数字输出方式。
20.根据权利要求18或19所述的装置,其特征在于,所述确定模块,还用于根据所述大数据因子的所述第一价值参数以及其它大数据因子对应的第一价值参数,确定所述大数据因子的第一价值参数相对于其他大数据因子的所述第一价值参数的第一排名值;
所述输出模块,还用于输出所述大数据因子对应的所述第一排名值;
进一步地,所述确定模块,还用于根据所述大数据因子的所述第二价值参数以及其它大数据因子对应的第二价值参数,确定所述大数据因子的第二价值参数相对于其他大数据因子的所述第二价值参数的第二排名值;
所述输出模块,还用于输出所述大数据因子对应的所述第二排名值;
进一步地,所述第一价值参数和所述第二价值参数各包括年化收益率、日均超额收益率、夏普比率、胜率、信息比率以及最大回撤比率中的任意一种;
进一步地,所述大数据因子的所述第一排名值和所述第二排名值的输出方式为数字输出方式。
CN201610344256.3A 2016-05-23 2016-05-23 大数据因子的价值参数的处理方法及装置 Pending CN106021505A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610344256.3A CN106021505A (zh) 2016-05-23 2016-05-23 大数据因子的价值参数的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610344256.3A CN106021505A (zh) 2016-05-23 2016-05-23 大数据因子的价值参数的处理方法及装置

Publications (1)

Publication Number Publication Date
CN106021505A true CN106021505A (zh) 2016-10-12

Family

ID=57096959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610344256.3A Pending CN106021505A (zh) 2016-05-23 2016-05-23 大数据因子的价值参数的处理方法及装置

Country Status (1)

Country Link
CN (1) CN106021505A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633455A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 基于数据模型的信用评估方法及装置
CN109460892A (zh) * 2018-09-25 2019-03-12 平安科技(深圳)有限公司 优势业务的确定方法及终端设备
CN111932379A (zh) * 2020-09-23 2020-11-13 北京口袋财富信息科技有限公司 数据处理方法、装置、电子设备及可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633455A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 基于数据模型的信用评估方法及装置
CN109460892A (zh) * 2018-09-25 2019-03-12 平安科技(深圳)有限公司 优势业务的确定方法及终端设备
CN109460892B (zh) * 2018-09-25 2024-01-30 平安科技(深圳)有限公司 优势业务的确定方法及终端设备
CN111932379A (zh) * 2020-09-23 2020-11-13 北京口袋财富信息科技有限公司 数据处理方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
Carmona et al. A survey of commodity markets and structural models for electricity prices
US8694402B2 (en) Using accounting data based indexing to create a low volatility portfolio of financial objects
US20140317023A1 (en) Stock information provision method and system for displaying a business growth cycle and calculating undervalued/overvalued stocks using same
US20120215719A1 (en) Systems and Methods for Creating, Modeling, and Managing Investment Indexes Based Upon Intrinsic Values
WO2012116309A2 (en) System, method & computer program product for constructing an optimized factor portfolio
Chiodi et al. Semi-absolute deviation rule for mutual funds portfolio selection
CN109583966A (zh) 一种高价值客户识别方法、系统、设备及存储介质
WO2008123861A2 (en) Locality based index
CN112052385A (zh) 一种投融资项目推荐方法、装置、电子设备和可读存储介质
CN106021505A (zh) 大数据因子的价值参数的处理方法及装置
Li et al. Option prices and stock market momentum: evidence from China
Cho Trade, aid and global interdependence
CN109767333A (zh) 选基方法、装置、电子设备及计算机可读存储介质
CN107194724A (zh) 塑料原料成交价格趋势预测方法及装置
Deng et al. Multiple kernel learning on time series data and social networks for stock price prediction
Capocci The sustainability of hedge fund performance: New insights
Kumar An investigation of pricing efficiency of CPSE ETF in India
Agudo et al. Does Mutual Fund Management in India correspond to its investment objective classification?
Zhang Comparative Analysis of NPV and IRR Indicators Based on Practical Applications
Friedman et al. Estimating future transition probabilities when the value of side information decays, with applications to credit modeling
Park et al. Technical trading rules in Australian financial markets
Mulvey et al. Linking momentum strategies with single-period portfolio models
Chevallier et al. Understanding momentum in commodity markets
CA2765820A1 (en) System and method of evaluating an investment portfolio
Hoang Swedish Hedge Fund and mutual fund performance during the financial crisis of 2008

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20161012

Assignee: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

Assignor: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Contract record no.: X2019110000005

Denomination of invention: Processing method and apparatus of value parameters of big data factors

License type: Common License

Record date: 20191119

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012