CN112612817B - 数据处理方法、装置、终端设备及计算机可读存储介质 - Google Patents
数据处理方法、装置、终端设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN112612817B CN112612817B CN202011417384.9A CN202011417384A CN112612817B CN 112612817 B CN112612817 B CN 112612817B CN 202011417384 A CN202011417384 A CN 202011417384A CN 112612817 B CN112612817 B CN 112612817B
- Authority
- CN
- China
- Prior art keywords
- data
- service
- business
- main
- service data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims abstract description 25
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000004590 computer program Methods 0.000 claims description 22
- 230000004927 fusion Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013523 data management Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000002360 explosive Substances 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请适用于计算机技术领域,提供了一种数据处理方法、装置、终端设备及计算机可读存储介质,方法包括:当检测到预设事件时,从预指定的数据库中获取业务数据,并将业务数据与本地数据仓库中已存储的业务数据进行整合;当接收到用户的取数指令时,根据取数指令包括的取数约束条件,从数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;将所述目标业务数据发送至所述用户。本申请实施例将预指定的数据库中获取业务数据整合至本地数据仓库中,并且用户通过取数指令,从数据仓库中获取被进行结构化处理的目标业务数据,使得用户可简单方便的从大量的资本市场数据中获取有效数据,从而可高效的统计、分析、利用资本市场数据。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、终端设备及计算机可读存储介质。
背景技术
随着社会主义市场经济的蓬勃发展,中国资本市场日臻繁荣,资本大数据爆发式增长。目前资本数据孤岛是一种普遍现象,如资本数据通常是分布在不同的数据库或者分布在不同的机构实体之间,无法满足数据快速共享、提取和使用的问题。
但是企业用户或个人用户对资本数据的需求是多种多样的,企业或者个人需要根据实际应用场景,简单方便的获取和使用这些数据。目前并不能简单方便的获取和使用这些数据,从而难以高效的统计、分析、利用资本市场数据。同时使得资本数据在生产上无法表现低成本和可持续的特性。
发明内容
本申请实施例提供了一种数据处理方法、装置、终端设备及计算机可读存储介质,旨在解决现有用户无法简单方便的从大量的资本市场数据中获取有效数据,从而难以高效的统计、分析、利用资本市场数据。
第一方面,本申请实施例提供了一种数据处理方法,包括:
当检测到预设事件时,从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合;
当接收到用户的取数指令时,根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;
将所述目标业务数据发送至所述用户。
第二方面,本申请实施例提供一种数据处理装置,包括:
第一获取模块,用于当检测到预设事件时,从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合;
第一处理模块,用于当接收到用户的取数指令时,根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;
发送模块,用于将所述目标业务数据存储至预设的数据库中,并将所述目标业务数据发送至所述用户。
第三方面,本申请实施例提供了一种终端设备,终端设备包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述数据处理方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述数据处理方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述现上述数据处理方法的步骤。
本申请实施例第一方面与现有技术相比存在的有益效果是:本申请实施例通过在检测到预设事件时,从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合;当接收到用户的取数指令时,根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据。本申请实施例将预指定的数据库中获取业务数据整合至本地数据仓库中,并且用户通过取数指令,可从数据仓库中获取被进行结构化处理的目标业务数据,使得用户可简单方便的从大量的资本市场数据中获取有效数据,从而可高效的统计、分析、利用资本市场数据。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的数据处理方法的流程示意图;
图2是本申请一实施例提供的步骤S10的具体流程示意图;
图3是本申请一实施例提供的步骤S102的具体流程示意图;
图4是本申请一实施例提供的结构化显示目标业务数据的示例图
图5是本申请另一实施例提供的数据处理方法的流程示意图;
图6是本申请一实施例提供的数据处理装置的结构示意图;
图7是本申请一实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供的数据处理方法,可以应用于数据管理系统,所述数据管理系统可以是在终端设备上运行的软件系统,所述终端设备包括但不限于:服务器、台式电脑、平板电脑、云端服务器、手机等。本申请实施例对终端设备的具体类型不做任何限制。
为了说明本申请的技术方案,下面通过以下实施例来进行说明。
请参阅图1,本申请实施例提供的一种数据处理方法,包括:
步骤S10,当检测到预设事件时,从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合。
在具体应用中,检测到预设事件可以是检测到预设时间,如用户预先设定时间,当到达该时间时,自动从预指定的数据库中获取业务数据;检测到预设事件还包括是检测到执行所述数据处理方法的数据管理系统的后台管理用户的请求指令时,所述请求指令可以是请求将所述业务数据与本地数据仓库中已存储的业务数据进行整合的指令。预指定的数据库可以是预先指定并获得授权的第三方信息源的数据库,可理解为外部数据库,第三方信息源的数据库会定期更新自己数据库中的业务数据,在预先设置指定的时间,从预指定的数据库中获取业务数据,将第三方信息源的数据库中的业务数据与本地仓库中已存储的业务数据进行整合可以理解为:将第三方信息源的数据库中离散的数据根据预设规则与本地数据仓库中的数据进行组合后并进行存储,从而使得可直接从本地数据仓库中快速有效获取需要获取的数据。预指定的数据库还可以是预先指定的本地预设的信息源数据库,可理解为内部数据库,本地预设的信息源数据库可以是会定期更新自身数据的数据库,如可以是通过爬虫技术定期进行更新,或者通过人工录入的方式进行更新等。如上述业务数据可以是首次公开募股(IPO)的业务数据、并构重组的业务数据等资本数据。
在一个实施例中,用户可通过人工采集并输入的方式获得业务数据,获取到用户输入的业务数据,并将用户输入的业务数据以本地数据仓库处中已存储的业务数据进行整合。
在一个实施例中,如图2所示,上述将业务数据以本地数据仓库中已存储的业务数据进行整合包括步骤S101至步骤S103:
步骤S101,解析所述业务数据的结构信息,得到所述业务数据对应的业务指标和主数据种类。
在具体应用中,由于获取的业务数据较离散且没有统一的标准,因此对业务数据进行分析,以将业务数据整理至本地仓库中进行存储。在资本市场中的业务数据中包括业务数据的具体内容、业务数据所属的主数据种类,以及用于反映主数据业务形态的业务指标,业务指标可以理解为是对业务的描述信息,对业务的标识信息。
比如主数据种类可以是对数据相关的某一种属性进行分类,如主数据可以是企业名称或组织代码、商品(基金的名称或代码、以及债券的名称或代码)、机构(如政府单位、券商、投行、律所等)的名称或组织代码等,业务指标可以是公司的市盈率TTM、商誉、法定代表人、注册资金等可以反应主数据的业务形态的数据。从预指定的数据库中获取到业务数据之后,解析业务数据的结构信息可以是解析出业务数据的主数据种类和业务指标,从而得到业务数据对应的业务指标和主数据种类。
步骤S102,若所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,则将所述业务数据与数据仓库中已存储的业务数据进行融合。
在具体应用中,将所述业务数据与数据仓库中已存储的业务数据进行融合可以理解为:将从第三方信息源中的数据库获得的业务数据与数据仓库中主数据种类相匹配且业务指标相匹配的业务数据进行融合成一组业务数据,融合是指将两种或多种的数据合成组数据。具体融合过程可以是先根据业务数据的主数据种类判断数据仓库中是否有相匹配的主数据种类,若数据仓库中有相匹配的主数据种类,再判断该相匹配的主数据种类中包括的业务指标是否有与获得的业务数据相匹配的业务指标,若获得的业务指标与相匹配的主数据种类中任一业务指标相匹配,则将从预指定的数据库中获得的业务数据与数据仓库中主数据种类相匹配且业务指标相匹配的业务数据进行融合,例如可根据获取业务数据的获取时间或识别出业务数据的发布时间,按时间顺序进行融合,将融合后的业务数据存储至本地数据仓库。
在一个实施例中,预先设置不同主数据种类下不同业务指标对应的码值,并存储在本地数据仓库中,其中,所述码值为主数据种类下对应业务指标的一个代码,通常数据源相同时,码值相同,数据源不同时码值有可能不同,因此先将业务数据对应的主数据种类和业务指标所对应的码值统一,再与本地仓库中的业务数据进行融合。根据从预指定的数据库中获取业务数据的主数据种类和业务指标,根据业务数据对应的业务指标和主数据种类,赋予预先存储与业务指标和主数据种类对应的码值,若业务指标和主数据种类本身具有码值且与预先存储与业务指标和主数据种类对应的码值相同,则无需赋予,保留自身码值即可。再根据所述业务数据的码值,将所述业务数据与数据仓库中已存储的业务数据进行融合。
在一个实施例中,如图3所示,步骤S102包括步骤S1021至步骤S1026:
步骤S1021,若所述数据仓库中已存储业务指标和主数据种类中,存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并将所述业务数据与数据仓库中已存储的业务数据进行融合。
在具体应用中,若数据仓库中已存储的业务指标和主数据种类中,存在与获取的业务数据相同的主数据种类,且业务指标也与该主数据种类下包括的任一的业务指标相同,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并根据业务数据的获取时间或者识别出业务数据的发布时间,按时间顺序将获取的业务数据融合至相同主数据种类下且业务指标相同的存储区域中。
步骤S1022,若所述数据仓库中已存储业务指标和主数据种类中,不存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类,则根据所述业务数据的业务指标和主数据种类的关键字进行消歧。
在具体应用中,若数据仓库中已存储的业务指标和主数据种类中,不存在与获取的业务数据相同的主数据种类,则判定不存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类;若数据仓库中已存储的业务指标和主数据种类中,存在与获取的业务数据相同的主数据种类,但不存在与该主数据种类下包括的任一的业务指标相同的业务指标,则同样判定不存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类。在判定不存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类后,对所述业务数据的业务指标和主数据种类进行消歧。
如可根据所述业务数据的业务指标和主数据种类的关键字进行消歧,具体可以是:对获取的业务数据,识别其主数据种类的关键字,若主数据种类的关键字与数据仓库中已存储的主数据种类关联的关键字相同,则将主数据种类转变为与数据仓库中相同的主数据种类;获取的业务数据识别其业务指标的关键字,若业务指标的关键字与数据仓库中该主数据种类下已存储的业务指标关联的关键字相同,则将业务指标转变为与数据仓库中的业务指标相同。
如数据仓库中某个主数据种类为“律师事务所”,预存储与该主数据种类关联的关键字“律所”和“律师所”等。当获取的业务数据的主数据种类的关键字为“律所”时,则将获取的业务数据的主数据种类转换为与数据仓库中相同的“律师事务所”,从而可进行主数据种类消歧。如数据仓库中某个业务指标为“首次公开募股”,预存储与该主数据种类关联的关键字“IPO”和“IPO案例”等。当获取的业务数据的业务指标的关键字为“IPO”,则将业务数据的业务指标转换为与数据仓库中存储的一样的“首次公开募股”,从而可进行业务指标消歧。
在一个实施例中,对业务数据的业务指标和主数据种类进行消歧还可以是:基于业务指标和主数据种类的语义进行消岐,预先存储将相同或相似语义的词进行关联并存储在预设语义数据库中,对业务指标和主数据种类的名称进行分词,在对分词后的业务指标和主数据种类的名称分别进行语义识别,若语义识别出相同语义的主数据种类的名称中存在与数据仓库中与已存储的主数据种类的名称相同,则将主数据种类转变为与数据仓库中相同名称的主数据种类;在该主数据种类完成消岐后,若语义识别出相同语义的业务指标的名称中与数据仓库中该主数据种类下已存储的业务指标的名称相同,则将业务指标转变为该主数据种类下已存储的业务指标的名称。预设语义数据库可通过人工定期更新,或者也可通过网络采集设备在特定在线数据库中检索出相同词语,再定期更新预设语义数据库。如可通过爬虫技术基于语义网检索出相同或相近词语,定期更新预设语义数据库中的相同或相似语义的词语。
在一个实施例中,对所述业务数据的业务指标和主数据种类进行消歧还可以在已记录的人工历史确认的消岐记录中,查询是否存在与当前需要消岐的业务指标或主数据种类相同的业务指标或主数据种类成功消岐记录,若曾通过人工消岐过,则采用同样的消岐方式对当前需要消岐的业务指标或主数据种类进行消岐。
步骤S1023,若消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类相同,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并根据消歧后的业务指标和主数据种类,将所述业务数据与数据仓库中已存储的业务数据进行融合。
在具体应用中,若消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类相同,即表示消岐成功,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并根据业务数据的获取时间或者识别出业务数据的发布时间,按时间顺序将获取的业务数据融合至对应主数据种类下相同业务指标对应的存储区域中。
步骤S1024,若消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类不相同,则将所述业务数据存储至预设的问题数据库中,并提示通过人工方式进行业务数据处理。
在具体应用中,在进行上述消岐步骤时,若消岐失败。在消歧失败后,消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类是不相同的,因此若消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类不相同,则将所述业务数据存储至预设的问题数据库中可理解为:若消岐失败后,则将所述业务数据存储至预设的问题数据库。提示通过人工方式进行业务数据处理可以是,将通过人工方式进行业务数据处理的提示信息发送至预先指定的用户。
步骤S1025,当获取到通过人工方式消歧后的业务指标和主数据种类,若所述人工方式消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类相同,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并将所述业务数据与数据仓库中已存储的业务数据进行融合。
在具体应用场景中,若消岐失败后,则将所述业务数据存储至预设的问题数据库,且提示人工的方式来确定。从而可由人工确定一些消岐后也无法在数据仓库中找到相同的业务指标和主数据种类,当预先指定的用户对从预指定的数据库中获取的业务数据进行人工消岐后,即人工确定或修改的业务指标和主数据种类后,若在预设时间内获取到人工确定或修改的业务指标和主数据种类,且人工确定或修改后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类相同,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并再根据确定后的业务指标和主数据种类,将对于的业务数据与数据仓库中已存储的业务数据进行融合。将每次人工进行消岐的过程进行记录,如记录每次消岐前的业务指标和主数据种类,以及记录对应人工消岐后的业务指标和主数据种类。
步骤S1026,若接收到通过人工确认的所述业务数据属于错误数据的信息时,丢弃所述业务数据。
在具体应用中,将所述业务数据存储至预设的问题数据库中,并提示通过人工方式进行业务数据处理之后,若预指定的用户发现从预指定的数据库中获取业务数据是获取到的错误业务数据,可发送人工确认的所述业务数据属于错误数据的信息,若在预设时间内接收到通过人工确认的所述业务数据属于错误数据的信息时,丢弃所述业务数据,即不进行处理直接删除。
步骤S103,若所述本地数据仓库中不存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,则将所述业务数据新增至所述本地数据仓库中,并在预设的指标数据库中新增所述业务数据的业务指标,在预设的主数据库中新增所述业务数据的主数据类型。
在具体应用中,当执行完步骤S102后未判定本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,则判定本地数据仓库中不存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,再将业务数据新增至本地数据仓库中,并在预设的指标数据库中新增所述业务数据的业务指标,在预设的主数据库中新增所述业务数据的主数据类型。将业务数据新增至本地数据仓库中可以是:当本地数据仓库中有与获取的业务数据的主数据种类相同的主数据种类,且没有与业务数据的业务指标相同的业务指标,则将业务数据新增至本地数据仓库中相同的主数据种类下的存储区域;当本地数据仓库中没有与获取的业务数据的主数据种类相同的主数据种类,且没有与业务数据的业务指标相同的业务指标,则本地数据仓库创建新区域,将业务数据新增至本地数据仓库中所创建的新区域中。预设的指标数据库用于存储业务指标,主数据库用于存储业务数据对应的主数据类型,便于直接查询,显示或调用业务指标和主数据类型等。
步骤S20,当接收到用户的取数指令时,根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据。
在具体应用中,用户可根据自身需求,发送取数指令,若用户发送的取数指令中包括取数约束条件,可根据取数约束条件,从数据仓库中获取对应的业务数据,并对获取的业务数据进行结构化处理,得到目标业务数据,并记录用户此次的取数约束条件。
在一个实施例中,所述取数约束条件包括但不限于主数据种类、业务指标和取数时间范围中的一项或多项信息;所述业务指标可以包括某个具体业务指标、多个业务指标、某个具体业务指标中的关键数据信息,或者多个业务指标中相同的关键数据信息。当然取数约束条件可根据实际应用还包括其他条件,对此不做限定。所述根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据,包括:所述根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据;对从所述数据仓库中获取对应的业务数据进行结构化处理,生成预设结构化数据格式的业务数据,得到所述目标业务数据。
在具体应用中,对从所述数据仓库中获取对应的业务数据进行结构化处理,生成预设结构化数据格式的业务数据,得到所述目标业务数据。可以是对从所述数据仓库中获取对应的业务数据进行结构化处理,并以预设结构化格式(如json格式)存储所述业务数据,将以预设结构化格式进行存储的业务数据,作为目标业务数据,以使用户可根据自身需求,有效的从数据仓库中获取数据。
在一种具体应用场景中,例如,当取数约束条件包括主数据种类为上市公司的名称,具体可以是金山办公、汇金科技、中能电气、豫王科技。取数约束条件还包括某一个上市公司的业务指标,业务指标可以包括IPO案例、重组案例、重组标的、商誉净值、保荐机构、标的商誉净值,此处上市公司和对应的业务指标仅是举例,并不作为对本申请的限制。若取数时间范围为A年至B年,则在数据仓库中提取对应的业务数据,并根据主数据种类和业务指标获取对应的业务数据,并进行结构化处理后得到目标业务数据,并将目标业务数据以预设显示方式进行结构化显示,如图4所示为一个结构化显示目标业务数据的示例图。
在一个实施例中,在接收到用户的取数指令时,若所述取数指令未包括取数约束条件,则获取存储的历史取数约束条件;根据所述历史取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据。或者,获取所述用户的使用场景,以及通过大数据分析并获取在所述使用场景中的热门取数约束条件,根据所述热门数据约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;其中,所述热门取数约束条件为搜索频率最多的取数约束条件。
在具体应用中,历史取数约束条件可以是根据用户的最近一次的历史取数行为,获取最近一次的历史取数约束条件;或者,是对用户预设时间范围内(如近一周,近一个月等)的历史取数行为进行分析,根据用户自身的历史取数行为分析出用户搜索频率最多的取数约束条件。
或者,也可获取用户的使用场景,如获取用户输入或用户预先设定的使用场景,或者检测用户当前操作界面所属的使用场景。通过大数据分析该使用场景中搜索频率最多的取数约束条件作为热门取数约束条件,根据所述热门数据约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据,并推送至用户。
在一个实施例中,当用户发送的取数指令未包括取数约束条件时,根据用户标识关联的历史取数约束条件,根据所述历史取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据。
在一个实施例中,当用户发送的取数指令未包括取数约束条件时,若用户为预先指定用户,则获取与所述指定用户关联的取数约束条件,根据指定用户关联的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据。
在一个实施例中,如图5所示,数据处理方法还包括步骤S21至步骤S22:
步骤S21,通过预设方式将所述目标业务数据进行可视化,若接收到基于可视化的目标业务数据的编辑指令,则根据所述编辑指令对所述目标业务数据进行编辑。
在具体应用中,当用户需要对目标业务数据进行编辑时,发送编辑指令,编辑指令包括增加、修改和/或删除等命令,根据编辑指令对所述目标业务数据进行编辑。如接收到编辑指令后,以结构化显示目标业务数据,用户在结构化显示目标业务数据中进行增加、修改和/或删除等编辑操作,根据编辑操作对目标业务数据进行编辑。
步骤S22,将编辑后的所述目标业务数据进行可视化,并关联所述用户信息以预设结构化存储方式进行存储。
在具体应用中,将编辑后的目标业务数据以可视化的方式展示给用户,并将编辑后的业务目标数据关联用户信息,以预设结构化存储方式进行存储可以是以预设存储格式(如json格式)进行存储。
步骤S3,将所述目标业务数据发送至所述用户。
在具体应用中,可以预先设置用于临时存储目标业务的预设数据库,当获得到目标业务数据时,将目标业务数据存储至预设数据库。将目标业务数据以预设的文件形式发送给用户,可以是API,数据表,数据库等方式将目标业务数据发送至用户,如目标业务数据是用户进行编辑,将编辑后的目标业务数据发送至所述用户。
在一个实施例中,所述将所述目标业务数据发送至所述用户,包括:将所述目标业务数据以预设方式存储至数据接口平台,通过所述数据接口平台将所述目标业务数据发送至所述用户。
在具体应用中,预设数据接口平台,数据接口平台是用于存储目标业务数据的区域,可将目标业务数据以多种形式存储在数据接口平台,通过所述数据接口平台将所述目标业务数据发送至所述用户可以是用户在数据接口平台中以自身需求方式获取目标业务数据。如可生成目标业务数据的访问接口存储在数据接口平台,在接收到用户获取访问接口的指令时,将数据接口平台中存储的访问接口发送至目标用户,用户可通过访问接口获取目标业务数据;还可将创建目标业务数据的数据表存储在数据接口平台,在接收到用户获取数据表的指令时,将数据表发送至用户,用户通过数据表获取目标业务数据;还可直接在数据接口平台中为目标数据库创建子数据库,将目标业务数据备份至子数据库中,作为用户自有的数据库,用户进入该数据库即可方便查询与自身需求匹配的目标业务数据。当然还可以即时浏览和其他office文件工具等方式将目标业务数据存储在数据接口平台,使得用户可通过多种输出形式获取目标业务数据。
本申请实施例通过在检测到预设事件时,从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合;当接收到用户的取数指令时,根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据。本申请实施例将预指定的数据库中获取业务数据整合至本地数据仓库中,并且用户通过取数指令,从数据仓库中获取被进行结构化处理的目标业务数据,可简单方便的从大量的资本市场数据中获取有效数据,从而可高效的统计、分析、利用资本市场数据。
本申请实施例还提供一种数据处理装置,用于执行上述数据处理方法实施例中的步骤。数据处理装置可以是终端设备中的虚拟装置(virtual appliance),由终端设备的处理器运行,也可以是终端设备本身。
如图6所示,本申请实施例提供的数据处理装置600包括:
第一获取模块601,用于当检测到预设事件时,从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合;
第一处理模块602,用于当接收到用户的取数指令时,根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;
发送模块603,用于将所述目标业务数据发送至所述用户。
在一个实施例中,第一获取模块601包括:
解析单元,用于解析所述业务数据的结构信息,得到所述业务数据对应的业务指标和主数据种类;
融合单元,用于若所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,则将所述业务数据与数据仓库中对应的业务数据进行融合;
新增单元,用于若所述本地数据仓库中不存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,则将所述业务数据新增至所述本地数据仓库中,并在预设的指标数据库中新增所述业务数据的业务指标,在预设的主数据库中新增所述业务数据的主数据类型。
在一个实施例中,所述融合单元包括:
第一融合子单元,用于若所述数据仓库中已存储业务指标和主数据种类中,存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并将所述业务数据与数据仓库中已存储的业务数据进行融合;
消岐子单元,用于若所述数据仓库中已存储业务指标和主数据种类中,不存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类,则根据所述业务数据的业务指标和主数据种类的关键字进行消歧;
第二融合子单元,用于若消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类相同,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并根据消歧后的业务指标和主数据种类,将所述业务数据与数据仓库中已存储的业务数据进行融合;
存储子单元,用于若消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类不相同,则将所述业务数据存储至预设的问题数据库中,并提示对应用户通过人工方式进行业务数据处理;
第三融合子单元,用于当获取到用户通过人工方式消歧后的业务指标和主数据种类,若所述人工方式消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类相同,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并将所述业务数据与数据仓库中已存储的业务数据进行融合;
丢弃单元,用于若接收到通过人工确认的所述业务数据属于错误数据的信息时,丢弃所述业务数据。
在一个实施例中,所述取数约束条件包括主数据种类、业务指标和取数时间范围中的一项或多项信息;所述第一处理模块具体用于:所述根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据;对从所述数据仓库中获取对应的业务数据进行结构化处理,生成预设结构化数据格式的业务数据,得到所述目标业务数据。
在一个实施例中,所述数据处理装置还包括:
第二获取模块,用于在接收到用户的取数指令时,若所述取数指令未包括取数约束条件,则获取存储的历史取数约束条件;
第二处理模块,用于根据所述历史取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;
大数据分析模块,用于获取所述用户的使用场景,以及通过大数据分析并获取在所述使用场景中的热门取数约束条件,根据所述热门数据约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;其中,所述热门取数约束条件为搜索频率最多的取数约束条件。
在一个实施例中,所示数据处理装置还包括:
编辑模块,用于通过预设方式将所述目标业务数据进行可视化,若接收到所述用户基于可视化的目标业务数据的编辑指令,则根据所述编辑指令对所述目标业务数据进行编辑;
关联存储模块,用于将编辑后的所述目标业务数据进行可视化,并关联所述用户信息以预设结构化存储方式进行存储。
在一个实施例中,所述发送模块具体用于:将所述目标业务数据以预设方式存储至数据接口平台,通过所述数据接口平台将所述目标业务数据发送至所述用户。
在一个实施例中,所述发送模块包括:
数据平台单元,用于将所述目标业务数据以预设方式存储至数据接口平台,通过所述数据接口平台将所述目标业务数据发送至所述用户。
本申请实施例通过在检测到预设事件时,从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合;当接收到用户的取数指令时,根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据。本申请实施例将预指定的数据库中获取业务数据整合至本地数据仓库中,并且用户通过取数指令,从数据仓库中获取被进行结构化处理的目标业务数据,使得用户可简单方便的从大量的资本市场数据中获取有效数据,从而可高效的统计、分析、利用资本市场数据。
如图7所示,本申请的一个实施例还提供一种终端设备700包括:处理器701,存储器702以及存储在存储器702中并可在处理器701上运行的计算机程序703,例如数据处理程序。处理器701执行计算机程序703时实现上述各个数据处理方法实施例中的步骤。处理器701执行计算机程序703时实现上述各装置实施例中各模块的功能,例如图6所示模块601至603的功能。
示例性的,计算机程序703可以被分割成一个或多个模块,一个或者多个模块被存储在存储器702中,并由处理器701执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序703在终端设备700中的执行过程。例如,计算机程序703可以被分割成第一获取模块,第一处理模块,发送模块,各模块具体功能在上述实施例中已有描述,此处不再赘述。
终端设备700可以是服务器、平板电脑、可穿戴设备、车载设备、增强现实(Augmented Reality,AR)/虚拟现实(Virtual Reality,VR)设备、笔记本电脑、超级移动个人计算机(Ultra-Mobile Personal Computer,UMPC)、上网本、个人数字助理(PersonalDigital Assistant,PDA)等终端设备等计算设备。终端设备可包括,但不仅限于,处理器701,存储器702。本领域技术人员可以理解,图7仅仅是终端设备700的示例,并不构成对终端设备700的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器701可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器702可以是终端设备700的内部存储单元,例如终端设备700的硬盘或内存。存储器702也可以是终端设备700的外部存储设备,例如终端设备700上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,存储器702还可以既包括终端设备700的内部存储单元也包括外部存储设备。存储器702用于存储计算机程序以及终端设备所需的其他程序和数据。存储器702还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
当检测到预设事件时,从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合;
当接收到用户的取数指令时,根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;
将所述目标业务数据发送至所述用户;
其中,所述从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合,包括:
解析所述业务数据的结构信息,得到所述业务数据对应的业务指标和主数据种类;
若所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,则将所述业务数据与数据仓库中对应的业务数据进行融合,包括:若所述数据仓库中已存储业务指标和主数据种类中,不存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类,则根据所述业务数据的业务指标和主数据种类的关键字或语义进行消歧;
若消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类相同,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并根据消歧后的业务指标和主数据种类,将所述业务数据与数据仓库中已存储的业务数据进行融合。
2.根据权利要求1所述的数据处理方法,其特征在于,若所述本地数据仓库中不存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,则将所述业务数据新增至所述本地数据仓库中,并在预设的指标数据库中新增所述业务数据的业务指标,在预设的主数据库中新增所述业务数据的主数据类型。
3.根据权利要求2所述的数据处理方法,其特征在于,若所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,则将所述业务数据与数据仓库中已存储的业务数据进行融合,包括:
若所述数据仓库中已存储业务指标和主数据种类中,存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并将所述业务数据与数据仓库中已存储的业务数据进行融合;
若消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类不相同,则将所述业务数据存储至预设的问题数据库中,并提示通过人工方式进行业务数据处理;
当获取到通过人工方式消歧后的业务指标和主数据种类,若所述人工方式消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类相同,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并将所述业务数据与数据仓库中已存储的业务数据进行融合;
若接收到通过人工确认的所述业务数据属于错误数据的信息时,丢弃所述业务数据。
4.根据权利要求2所述的数据处理方法,其特征在于,所述取数约束条件包括主数据种类、业务指标和取数时间范围中的一项或多项信息;
所述根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据,包括:
所述根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据;
对从所述数据仓库中获取对应的业务数据进行结构化处理,生成预设结构化数据格式的业务数据,得到所述目标业务数据。
5.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:
在接收到用户的取数指令时,若所述取数指令未包括取数约束条件,则获取存储的历史取数约束条件;
根据所述历史取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;
或者,获取所述用户的使用场景,以及通过大数据分析并获取在所述使用场景中的热门取数约束条件,根据热门数据约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;其中,所述热门取数约束条件为搜索频率最多的取数约束条件。
6.根据权利要求1所述的数据处理方法,其特征在于,所述方法还包括:
通过预设方式将所述目标业务数据进行可视化,若接收到所述用户基于可视化的目标业务数据的编辑指令,则根据所述编辑指令对所述目标业务数据进行编辑;
将编辑后的所述目标业务数据进行可视化,并关联用户信息以预设结构化存储方式进行存储。
7.根据权利要求1至6任一项所述的数据处理方法,其特征在于,所述将所述目标业务数据发送至所述用户,包括:
将所述目标业务数据以预设方式存储至数据接口平台,通过所述数据接口平台将所述目标业务数据发送至所述用户。
8.一种数据处理装置,其特征在于,包括:
第一获取模块,用于当检测到预设事件时,从预指定的数据库中获取业务数据,并将所述业务数据与本地数据仓库中已存储的业务数据进行整合;
第一处理模块,用于当接收到用户的取数指令时,根据所述取数指令包括的取数约束条件,从所述数据仓库中获取对应的业务数据,并进行结构化处理,得到目标业务数据;
发送模块,用于将所述目标业务数据发送至所述用户;
其中,所述第一获取模块包括:解析单元,用于解析所述业务数据的结构信息,得到所述业务数据对应的业务指标和主数据种类;
融合单元,用于若所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,则将所述业务数据与数据仓库中对应的业务数据进行融合;
所述融合单元包括:消岐子单元,用于若所述数据仓库中已存储业务指标和主数据种类中,不存在与所述业务数据对应的业务指标和主数据种类相同的业务指标和主数据种类,则根据所述业务数据的业务指标和主数据种类的关键字或语义进行消歧;
第二融合子单元,用于若消歧后的业务指标和主数据种类与数据仓库中已存储业务指标和主数据种类相同,则判定所述本地数据仓库中存在与所述业务数据的业务指标和主数据种类相匹配的业务指标和主数据种类,并根据消歧后的业务指标和主数据种类,将所述业务数据与数据仓库中已存储的业务数据进行融合。
9.一种终端设备,其特征在于,所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011417384.9A CN112612817B (zh) | 2020-12-07 | 2020-12-07 | 数据处理方法、装置、终端设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011417384.9A CN112612817B (zh) | 2020-12-07 | 2020-12-07 | 数据处理方法、装置、终端设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112612817A CN112612817A (zh) | 2021-04-06 |
CN112612817B true CN112612817B (zh) | 2024-02-27 |
Family
ID=75229141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011417384.9A Active CN112612817B (zh) | 2020-12-07 | 2020-12-07 | 数据处理方法、装置、终端设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112612817B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113205402A (zh) * | 2021-05-29 | 2021-08-03 | 长沙市到家悠享家政服务有限公司 | 对账方法、装置、电子设备及计算机可读介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224630A (zh) * | 2015-09-24 | 2016-01-06 | 中国科学院自动化研究所 | 基于语义网本体数据的集成方法 |
CN108763333A (zh) * | 2018-05-11 | 2018-11-06 | 北京航空航天大学 | 一种基于社会媒体的事件图谱构建方法 |
CN108897860A (zh) * | 2018-06-29 | 2018-11-27 | 中国科学技术信息研究所 | 信息推送方法、装置、电子设备及计算机可读存储介质 |
CN108984521A (zh) * | 2018-06-20 | 2018-12-11 | 国家计算机网络与信息安全管理中心 | 一种新闻事件中人物观点抽取方法 |
CN109992672A (zh) * | 2019-04-11 | 2019-07-09 | 华北科技学院 | 基于灾害场景的知识图谱构建方法 |
CN110147360A (zh) * | 2019-04-03 | 2019-08-20 | 深圳价值在线信息科技股份有限公司 | 一种数据整合方法、装置、存储介质和服务器 |
CN111767440A (zh) * | 2020-09-03 | 2020-10-13 | 平安国际智慧城市科技股份有限公司 | 基于知识图谱的车辆画像方法、计算机设备和存储介质 |
-
2020
- 2020-12-07 CN CN202011417384.9A patent/CN112612817B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224630A (zh) * | 2015-09-24 | 2016-01-06 | 中国科学院自动化研究所 | 基于语义网本体数据的集成方法 |
CN108763333A (zh) * | 2018-05-11 | 2018-11-06 | 北京航空航天大学 | 一种基于社会媒体的事件图谱构建方法 |
CN108984521A (zh) * | 2018-06-20 | 2018-12-11 | 国家计算机网络与信息安全管理中心 | 一种新闻事件中人物观点抽取方法 |
CN108897860A (zh) * | 2018-06-29 | 2018-11-27 | 中国科学技术信息研究所 | 信息推送方法、装置、电子设备及计算机可读存储介质 |
CN110147360A (zh) * | 2019-04-03 | 2019-08-20 | 深圳价值在线信息科技股份有限公司 | 一种数据整合方法、装置、存储介质和服务器 |
CN109992672A (zh) * | 2019-04-11 | 2019-07-09 | 华北科技学院 | 基于灾害场景的知识图谱构建方法 |
CN111767440A (zh) * | 2020-09-03 | 2020-10-13 | 平安国际智慧城市科技股份有限公司 | 基于知识图谱的车辆画像方法、计算机设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
Graph neural entity disambiguation;Linmei Hu 等;《Knowledge-Based Systems》;20200531;1-7 * |
命名实体消歧研究进展综述;温萍梅 等;《数据分析与知识发现》;20200623;15-25 * |
Also Published As
Publication number | Publication date |
---|---|
CN112612817A (zh) | 2021-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111400392B (zh) | 多源异构数据处理方法及装置 | |
CN110929125A (zh) | 搜索召回方法、装置、设备及其存储介质 | |
US20160162507A1 (en) | Automated data duplicate identification | |
US9886711B2 (en) | Product recommendations over multiple stores | |
CN110879808B (zh) | 一种信息处理方法和装置 | |
CN112506925A (zh) | 一种基于区块链的数据检索系统及方法 | |
CN111371858A (zh) | 群控设备识别方法、装置、介质及电子设备 | |
CN113420057A (zh) | 对账数据处理方法及相关装置 | |
CN115098440A (zh) | 电子档案查询方法、装置、存储介质和设备 | |
CN112612817B (zh) | 数据处理方法、装置、终端设备及计算机可读存储介质 | |
CN114049089A (zh) | 一种构建政务大数据平台的方法及系统 | |
US9984107B2 (en) | Database joins using uncertain criteria | |
CN111680110B (zh) | 数据处理方法、装置、bi系统及介质 | |
CN111045983B (zh) | 核电站电子文件管理方法、装置、终端设备及介质 | |
CN112416713A (zh) | 操作审计系统及方法、计算机可读存储介质、电子设备 | |
CN111984797A (zh) | 客户身份识别装置及方法 | |
CN111563107A (zh) | 信息推荐的方法、装置、电子设备和存储介质 | |
CN109740130B (zh) | 用于生成文件的方法和装置 | |
CN113609407B (zh) | 地区一致性校验方法和装置 | |
CN115357765A (zh) | 数据搜索方法、装置、电子设备以及存储介质 | |
CN114860667A (zh) | 文件分类方法、装置、电子设备及计算机可读存储介质 | |
CN113138974A (zh) | 数据库合规检测的方法和装置 | |
US11036939B2 (en) | Data driven approach for automatically generating a natural language processing cartridge | |
CN111914259B (zh) | 数据处理方法及计算设备 | |
CN109582534B (zh) | 系统的操作入口的确定方法、装置和服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |