CN109542891B

CN109542891B - 数据融合方法及计算机存储介质

Info

Publication number: CN109542891B
Application number: CN201811216604.4A
Authority: CN
Inventors: 陈旷; 龙阳雨; 付国为
Original assignee: Beijing Xintang Sichuang Educational Technology Co Ltd
Current assignee: Beijing Xintang Sichuang Educational Technology Co Ltd
Priority date: 2018-10-18
Filing date: 2018-10-18
Publication date: 2021-04-09
Anticipated expiration: 2038-10-18
Also published as: CN109542891A

Abstract

本发明实施例提供了一种数据融合方法及计算机存储介质，其中，所述数据融合方法包括：获取多个业务数据表中每个业务数据表的业务数据项的信息；根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则；根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合。通过本发明实施例，可以有效地对业务数据进行整合和梳理，提高业务数据的利用效果。

Description

数据融合方法及计算机存储介质

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种数据融合方法及计算机存储介质。

背景技术

目前，企业的发展越来越依赖于通过计算机和网络系统实现管理。然而，企业的高速发展使得企业内部存在很多遗留系统和遗留数据，特别是对于大公司和运营时间比较长的公司，这样的系统和数据会非常多。

以包括多条业务线的企业系统为例，可能存在着诸如：1)不同业务线记录的用户信息有差别；2)不同业务线的技术架构有很大差别，导致原始数据的存储分散，等等问题。由此，导致数据的整合和梳理极端困难，无法对已有数据进行有效利用。

发明内容

有鉴于此，本发明实施例提供了一种数据融合方法及计算机存储介质，以解决上述问题。

根据本发明实施例的一个方面，提供了一种数据融合方法，包括：获取多个业务数据表中每个业务数据表的业务数据项的信息；根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则；根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合。

根据本发明实施例的另一个方面，还提供了一种计算机可读介质，所述计算机存储介质存储有：用于获取多个业务数据表中每个业务数据表的业务数据项的信息的指令；用于根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则的指令；用于根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合的指令。

通过本发明实施例，针对某一业务中具有关联关系的多个业务数据表，为这些业务数据表生成对应的业务规则，进而，根据生成的业务规则生成谓词规则，并使用谓词规则进行多个业务数据表中的业务数据融合。通过生成业务规则，可以对多个业务数据表中的业务数据进行关联；而使用谓词规则对业务数据进行数据融合，则实现了对业务数据表中的数据的归纳和梳理，获取其中的用户的用户特征。可见，通过本发明实施例，可以有效地对业务数据进行整合和梳理，提高业务数据的利用效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例一的一种数据融合方法的步骤流程图；

图2是根据本发明实施例二的一种数据融合方法的步骤流程图。

具体实施方式

当然，实施本发明实施例的任一技术方案必不一定需要同时达到以上的所有优点。

为了使本领域的人员更好地理解本发明实施例中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明实施例一部分实施例，而不是全部的实施例。基于本发明实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本发明实施例保护的范围。

实施例一

参照图1，示出了根据本发明实施例一的一种数据融合方法的步骤流程图。

本实施例的数据融合方法包括以下步骤：

步骤S102：获取多个业务数据表中每个业务数据表的业务数据项的信息。

如前所述，一个企业系统中可能包括多个业务线，每个业务线可能使用一个或多个(如无特别说明，本发明实施例中，“多个”意指两个及两个以上)数据库存储业务数据，具有记录业务数据的多个业务数据表。当有多个数据库时，这些数据库的类型可能相同也可能不同，也可能部分相同。无论数据库的类型为何，均可适用于本发明实施例的方案。

每个业务数据表中具有相应的业务数据项，在实际应用中，业务数据项可以采用任意适当形式，例如可以为字段的形式，如一张SQL数据表中的各个字段，每个记录包括对应于各个业务数据项的值。例如，以业务数据表为下表1中的学生信息表为例，

表1学生信息表

如上表1所示，学生的基本信息存在一张SQL数据表中，每一个记录对应一个学生的信息。其中包含的学生信息有：“student_id”、“student_name”、“student_city”、“grade”、“course_id”等多个字段。从数据库中获取一个学生记录对应的格式为：{'student_id':'1','student_name':'刘森','student_city':'北京','grade':'3','course_id':'001'}。

上表1中，“student_id”、“student_name”、“student_city”、“grade”、“course_id”为业务数据项，表1中包括除第一行之外的、序号为1～5的五条记录，各条记录包括对应于业务数据项的值，即表中第2～6行的内容。

步骤S104：根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则。

其中，所述业务规则用于指示以下信息至少之一：业务数据项之间的关联关系、业务数据表之间的关联关系，以及如何对业务数据进行处理。

例如，根据“student_id”，即可获得“student_name”、“student_city”、“grade”、“course_id”等多个字段的值；再例如，根据学生信息表可以关联学生成绩表；又例如，可以通过学生信息表中的“student_id”字段查找其它数据表，以根据处理目的获得其它数据表中相应的业务数据，等等。

步骤S106：根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合。

谓词规则的基本思想为以谓词逻辑来对业务进行表示，并且基于业务自有场景进行业务的规则制定。谓词逻辑是一种形式语言，其目的是将数学中的逻辑论证符号化，将自然特征事物之间共同的特征抽象出来进一步的表示，以方便后续的分析和推理。一个谓词逻辑基本组成部分是谓词符号、变量符号、函数符号和常量符号，并用括号，逗号等进行分隔。谓词符号为规定定义域内的一个相应关系；常量符号为最简单的项，为论域内的物体或者实体。变量符号也是项，不明确涉及是哪一个具体的实体；函数符号代表论域内的函数，是从论域内一个实体到另一个实体的映射。

例如：所有的学生都需要做作业。对应的谓词逻辑为

其中Student和Homework为谓词符号，为每个学生个体对应的属性和动作，x为变量符号表示一个不确定的学生，Student(x)和Homework(x)都是一个函数符号，代表的是学生x和学生做作业这样的关系映射。符号<-以及符号与(∧)等都属于连词，对多个谓词逻辑进行组合，以表达更加复杂的含义。如：Level(x)<-

[belongto<question<id,x>∧frame<Course.Level.question>∧in_memory<Student,做题>]代表的为对任意学生x,如果他回答的题目id满足给定的ID，且对应的问题属于课程中对应的Level内容，并且将题目完成正确，那么这个学生就完成了关卡的内容。

本发明实施例中，业务规则可以由一系列的子规则构成，可以理解为一个子规则集合。在一个示例中，首先，使用自然语言对业务规则进行阐述如下所示：

子规则1：关键标识(main_id)and学生信息(student_info)and学生标识(student_id)——>学生姓名(Name)

子规则2：关键标识(main_id)and课程标识(course_id)——>课程名(Course_name)

子规则3：关键标识(main_id)and学生姓名(Name)and课程名(Course_name)——>学生报名课程

转换为谓词规则为：

{

子规则1：

Name(x)<-match<main_id,x>∧match<student_info,x>∧match<student_id,x>

子规则2：

Course_name(y)<-match<main_id,y>∧match<course_id,x>

子规则3：

Apply(x,y)<-match<main_id,x>∧match<name,x>∧match<course_name,y>

}

在确定了谓词规则后，即可使用该谓词规则对业务数据表中的业务数据进行数据融合。

数据融合是一种利用计算机对按时序获得的若干观测信息，在一定准则下加以自动分析、综合，以完成所需的决策和评估任务而进行的信息处理。具体到本实施例，则是对业务数据表中的业务数据，在谓词规则下进行自动分析和综合，获得分析和综合结果以进行后续的数据分析和处理的过程。

通过本实施例，针对某一业务中具有关联关系的多个业务数据表，为这些业务数据表生成对应的业务规则，进而，根据生成的业务规则生成谓词规则，并使用谓词规则进行多个业务数据表中的业务数据融合。通过生成业务规则，可以对多个业务数据表中的业务数据进行关联；而使用谓词规则对业务数据进行数据融合，则实现了对业务数据表中的数据的归纳和梳理，获取其中的用户的用户特征。可见，通过本发明实施例，可以有效地对业务数据进行整合和梳理，提高业务数据的利用效果。

本实施例的数据融合方法可以由任意适当的具有数据处理能力的设备执行，包括但不限于：服务器和终端设备(如PC机、移动终端，等等)。

实施例二

参照图2，示出了根据本发明实施例二的一种数据融合方法的步骤流程图。

本实施例的数据融合方法包括以下步骤：

步骤S202：确定待处理的业务逻辑及该业务逻辑对应的多个业务数据表。

本发明实施例中，待处理的业务逻辑可以有多个，不同的业务逻辑实现不同的业务功能。例如，业务逻辑A用于管理小学网络教学，业务逻辑B用于管理初中网络教学，业务逻辑C用于管理高中网络教学。或者，业务逻辑D用于管理英语学习数据，业务逻辑E用于管理语文学习数据，业务逻辑F用于管理数学学习数据，等等，本发明实施例对具体的业务逻辑实现的功能和具体实现形式不作限制。

每个业务逻辑相应的业务数据以一个或多个相同或不同的数据存储方式存储，如，通过多个不同类型的数据库存储一个或多个业务数据表存储业务数据，不同的业务数据表之间，以及，不同类型的数据库中存储的业务数据具有一定的关联性，如，数据库A存储用户的考试数据，数据库B存储用户的课堂学习数据，数据库C存储用户的用户个人信息数据，这些数据库间可以通过相应的信息或数据，例如用户的标识信息，产生关联。

以下，以一个业务逻辑对应的多个业务数据表为例，说明业务数据之间的关联性：

表1课程基本信息表

表2题目基本信息表

表3关卡基本信息表

表4学生报名数据表

表5学生答题数据表

由上述表1-表5可见，表1和表2之间可以通过course_id产生关联，表2和表3之间可以通过level_id产生关联，表3和表4之间可以通过course_id产生关联，表4和表5之间可以通过student_id产生关联。因各个表之间均有关联关系，因此，通过一个表即可获得其它表的数据。

步骤S204：获取多个业务数据表中每个业务数据表的业务数据项的信息。

例如，本实施例中，设定多个业务数据表包括：课程基本信息表、题目基本信息表、关卡基本信息表、学生报名数据表、和学生答题数据表。

其中，课程基本信息表中的业务数据项包括：“course_id”(课程标识),“course_start_tm”(课程开始时间)，“course_end_tm”(课程结束时间),“subject”(科目)；题目基本信息表中的业务数据项包括：“question_id”(问题标识),“course_id”(课程标识),“level_id”(关卡标识)；关卡基本信息表中的业务数据项包括：“level_id”(关卡标识)，“course_id”(课程标识)，“level_name”(关卡名字)；学生报名数据表中的业务数据项包括：“student_id”(学生标识)，“student_name”(学生姓名)，“course_id”(课程标识)，“course_start_tm”(课程开始时间)，“course_end_tm”(课程结束时间)，“subject”(科目)；学生答题数据表中的业务数据项包括：“anwser_tm”(答题时间),“student_id”(学生标识),“question_id”(问题标识),“anwser_status”(答题状态),“class_id”(班级标识),“level_id”(级别标识),“course_id”(课程标识)。

步骤S206：根据每个业务数据表中的业务数据项的信息，生成与多个业务数据表对应的业务规则。

在一种可行方式中，本步骤可以包括：根据每个业务数据表中的业务数据项的信息，获得多个业务数据表之间的关联关系；根据所述关联关系，生成与所述多个业务数据表对应的业务规则。

一般来说，一个业务数据表中包括的多个业务数据项中应当包含有业务标识项，以唯一标识一条记录。因此，在一种可行方式中，当业务数据项包括业务标识项时，根据每个业务数据表中的业务数据项的信息，获得多个业务数据表之间的关联关系包括：根据每个业务数据表中的业务数据项的信息，使用所述业务标识项获得多个业务数据表之间的关联关系。如步骤S202中所述，表1-表5的五个表中，两两之间均存在相同的业务标识项，根据这些业务标识项，即可获得表1-表5这五个表之间的关联关系。

步骤S208:根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合。

在获得了业务规则后，可以根据业务规则，使用业务数据项中的部分或全部，生成所需的谓词规则。通常情况下，可以将业务标识项与其它业务数据项中的部分或全部按照业务规则分别进行组合，以生成相应的谓词规则。通过这种方式，简化了谓词规则的生成过程。

在一种可行方式中，可以根据所述业务规则和所述业务数据项的信息，提取谓词因子；根据提取的谓词因子，生成谓词规则。例如，如前实施例一中步骤S106中所述，根据3个业务子规则生成包括3个子规则的谓词规则。

其中，谓词因子根据待生成的谓词规则的不同而不同，可以理解为组成谓词规则的组件，如前述多个业务数据项、各个业务数据项之间的关系、待生成的目标信息，等等。谓词规则可能包括多个子规则，则所述根据提取的谓词因子，生成谓词规则，包括：根据提取的谓词因子中的部分因子，以及每个业务数据表中的业务标识项的信息，生成至少一个第一子规则；根据第一子规则中的部分或全部子规则，生成至少一个第二子规则；根据生成的第一子规则和第二子规则，生成谓词规则。在生成谓词规则时，可以先生成较为简单的第一子规则，进而由第一子规则生成更复杂一些的第二子规则，通过第一子规则和第二子规则，可以获得更为全面的谓词规则，实现对业务数据表中的业务数据的有效融合。可选地，第一子规则和第二子规则之间具有层次关联关系。

仍以前述课程基本信息表、题目基本信息表、关卡基本信息表、学生报名数据表、和学生答题数据表为例，生成的谓词规则如下所示：

agent(课程基本信息表)//课程基本信息表对应的谓词规则

{

'Course<-def<course,id,course_id>',

//定义谓词子规则，使用'course','id','course_id'推导出'Course'，其中，'id'表示业务标识；

'create_frame<course,id,course_id><-！＝<course_id,null>',

//根据'course_id'建立'course','id','course_id'之间的谓词子规则；

'create_frame<course,start_time,course_id><-！＝<course_id,null>',

//根据'course_id'建立'course','start_time','course_id'之间的谓词子规则；

'create_frame<course,end_time,course_id><-！＝<course_id,null>',

//根据'course_id'建立'course','end_time','course_id'之间的谓词子规则；

'create_frame<course,subject,course_id><-！＝<course_id,null>'

//根据'course_id'建立'course','subject','course_id'之间的谓词子规则；

}

agent(题目基本信息表)//题目基本信息表对应的谓词规则

{

'Question<-def<question,id,question_id>',

//定义谓词子规则1，使用'question','id','question_id'推导出'Question'，其中，'id'表示业务标识；

'Level<-def<level,id,level_id>',

//定义谓词子规则2，使用'level','id','level_id'推导出'Level'；

'Course<-def<course,id,course_id>',

//定义谓词子规则3，使用'course','id','course_id'推导出'Course'；

}

agent(关卡基本信息表)//关卡基本信息表对应的谓词规则

{

'create_frame<level,id,level_id><-！＝<level_id,null>',

//根据'level_id'建立'level','id','level_id'之间的谓词子规则，其中，'id'表示业务标识；

'create_frame<level,name,level_name><-！＝<level_id,null>',

//根据'level_id'建立'level','name','level_name'之间的谓词子规则；

}

agent(学生报名数据表)//学生报名数据表对应的谓词规则

{

'Student<-def<student,id,student_id>',

//定义谓词子规则1，使用'student','id','student_id'推导出'Student'，其中，'id'表示业务标识；

'Course<-def<course,id,course_id>',

//定义谓词子规则2，使用'course','id','course_id'推导出'Course'；

'create_frame<student,id,student_id><-！＝<student_id,null>',

//根据'student_id'建立'student','id','student_id'之间的谓词子规则；

'create_frame<student,name,student_name><-！＝<student_id,null>',

//根据'student_id'建立'student','name','student_name'之间的谓词子规则；

'Student报名了Course<-！＝<course_id,null>and！＝<student_id,null>'

//根据'course_id'和'student_id'推导出'Student报名了Course'的谓词子规则；

}

agent(学生答题数据表)//学生答题数据表对应的谓词规则

{

'Student<-def<student,id,student_id>',

//定义谓词子规则1，使用'student_id','id','student'推导出'Student'，其中，'id'表示业务标识；

'Create_Time<-def<time,datetime,anwser_tm>',

//定义谓词子规则2，使用'time','datetime','anwser_tm'推导出'Create_Time'，其中，'time'表示'anwser_tm'对应的时间，'datetime'表示'anwser_tm'的类型是日期型数据；

'Question<-def<question,id,question_id>',

//定义谓词子规则3，使用'question','id','question_id'推导出'Question'；

'Level<-def<level,id,level_id>',

//定义谓词子规则4，使用'level','id','level_id'推导出'Level'；

'Course<-def<course,id,course_id>',

//定义谓词子规则5，使用'course','id','course_id'推导出'Course'；

'remember<Student,Question,做题><-in<anwser_status,[0,1]>',

//根据'anwser_status'建立并记录'Student','Question','做题'之间的谓词子规则，其中，'做题'表示学生'Student'在题目'Question'的答题状态'anwser_status'为0或1的时候，代表存在学生'Student'做了题目'Question'；

'学员Student做对了题目Question<-＝<anwser_status,1>andnotin_memory<Student,做题>',

//当不存在'<Student,做题>的记录时，根据'anwser_status'建立'学员Student做对了题目Question'的谓词子规则；

'学员Student做错了题目Question<-＝<anwser_status,0>andnotin_memory<Student,做题>',

//当不存在'<Student,做题>的记录时，根据'anwser_status'建立'学员Student做错了题目Question'的谓词子规则；

'学员Student重做并作对了题目Question<-＝<anwser_status,1>and in_memory<Student,做题>'，

//当存在'<Student,做题>的记录时，根据'anwser_status'建立'学员Student重做并做对了题目Question'的谓词子规则；

'学员Student完成了关卡Level<-(anyx)[belongto<question<id,x>,frame<Course.Level.question>>in_memory<Student,做题>]'，

//任意的学生x，如果完成的题目id满足该关卡下面的所有的id，且都做对了，那么该学生通过这个学习关卡；

'学员Student完成了课程Course<-(anyx)[belongto<question<id,x>,frame<Course.level.question>>in_memory<Student,做题>]'

//对任意学生X，如果完成了所有课程上面的问题和对应的关卡，那么学生这门课程完成；

}

可见，通过上述过程，实现了谓词规则的建立，基于建立的谓词规则，即可对业务数据表中的业务数据进行数据融合。例如，某学员是否完成了某关卡、某学员是否完成了某课程、有多少学员完成了某关卡、有多少学员完成了某课程，等等。

在本实施例二中，数据融合是首先对每一个业务数据表中的业务数据进行获取，如果是相同业务逻辑的业务数据，则可以基于人为给定的特定标志或数据分析获得的标志进行业务数据的数据汇总和融合，如果是不同业务逻辑的业务数据，如培优、网校等业务数据，则需要首先通过账号融合推理得到同一个用户在不同业务逻辑的账号，然后进行该用户在不同业务逻辑的业务数据进行数据汇总和融合。

例如，学生答题数据表中包括以下记录：

{'anwser_tm':'2017-03-01 12:00:00','student_id':'123','question_id':'456','anwser_status':'0','class_id':'abc','level_id':'tal_1_1','course_id':'tal_2_1'}；

{'anwser_tm':'2017-03-01 12:02:00','student_id':'123','question_id':'456','anwser_status':'1','class_id':'abc','level_id':'tal_1_1','course_id':'tal_2_1'}；

{'anwser_tm':'2017-03-01 12:02:00','student_id':'123','question_id':'457','anwser_status':'1','class_id':'abc','level_id':'tal_1_1','course_id':'tal_2_1'}；

{'anwser_tm':'2017-03-01 13:00:00','student_id':'123','question_id':'458','anwser_status':'0','class_id':'bcd','level_id':'tal_1_2','course_id':'tal_2_1'}。

按照前述生成的学生答题数据表对应的谓词规则，则：

当传入{'anwser_tm':'2017-03-01 12:00:00','student_id':'123','question_id':'456','anwser_status':'0','class_id':'abc','level_id':'tal_1_1','course_id':'tal_2_1'}时：

由于规则'＝<anwser_status,1>and not in_memory<Student,做题>'成立，所以产生一条记录学员123作对了题456；学员123做过的题目里增加了题456；

当传入{'anwser_tm':'2017-03-01 12:02:00','student_id':'123','question_id':'456','anwser_status':'1','class_id':'abc','level_id':'tal_1_1','course_id':'tal_2_1'}时：

由于规则'＝<anwser_status,1>and in_memory<Student,做题>'成立，所以产生一条记录学员123重做并作对了题456；

当传入{'anwser_tm':'2017-03-01 12:02:00','student_id':'123','question_id':'457','anwser_status':'1','class_id':'abc','level_id':'tal_1_1','course_id':'tal_2_1'}时：

由于规则'＝<anwser_status,1>and not in_memory<Student,做题>'成立，所以产生一条记录学员123作对了题457；学员123做过的题目里增加了题457；

此外，由于规则'(any x)[belongto<question<id,x>,frame<Course.Level.question>>in_memory<Student,做题>]'成立，即该关卡下面的所有题目都被做过了，所以产生一条记录学员123完成了关卡tal_1_1；

当传入{'anwser_tm':'2017-03-01 13:00:00','student_id':'123','question_id':'458','anwser_status':'0','class_id':'bcd','level_id':'tal_1_2','course_id':'tal_2_1'}时：

由于规则'＝<anwser_status,1>and not in_memory<Student,做题>'成立，所以产生一条记录学员123作对了题458；学员123做过的题目里增加了题458；

此外，由于规则'(any x)[belongto<question<id,x>,frame<Course.Level.question>>in_memory<Student,做题>]'成立，即该课程下所有关卡下面的所有题目都被做过了，所以产生一条记录学员123完成了课程tal_1_1。

其中，如前所述，谓词规则可以包括第一子规则和第二子规则，第一子规则和第二子规则之间可以具有层次关联关系，如，建立题目-关卡-课程的层次模型，若某学员完成了某一部分题目，则可认为其通过了某关卡，若某学员完成了某一部分关卡，则可认为其通过了某课程，由此，根据题目的完成情况即可推导出关卡或课程的学习情况。

更进一步地，还可以采用类似方式对多个业务逻辑进行数据融合，实现对业务逻辑的分析和处理。

此外，基于多个或一个业务逻辑的数据融合结果，还可以实现业务事件的查询、追踪、事件流的过程展示，等等应用层面的数据处理，为业务逻辑的使用提供全方位的服务。例如，在进行事件追踪时，对业务数据的提取是基于时间先后进行增量数据提取的，则时间发生也是基于这样的时间流数据有一个先后的过程，从而可以进行反向的追溯。

本实施例二中[基于上面几个表数据]，以针对一个业务逻辑对应的多个业务数据表为例，对本发明提供的数据融合方法进行说明，其它业务逻辑的数据融合处理均可参照本实施例实现。

此外，本实施例中，设定一个业务逻辑对应多个业务数据表，每个业务数据表中包括多个业务数据项。但不限于此，在实际应用中，也有可能一个业务逻辑仅对应一个业务数据表，该一个业务数据表中包括多个业务数据项，此种情况也可参照本实施例实现对一个业务数据表的处理。

实施例三

根据本发明实施例，还提供了一种计算机可读介质，所述计算机存储介质存储有：用于获取多个业务数据表中每个业务数据表的业务数据项的信息的指令；用于根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则的指令；用于根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合的指令。

可选地，所述用于根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则的指令，包括：用于根据每个业务数据表中的业务数据项的信息，获得多个业务数据表之间的关联关系的指令；用于根据所述关联关系，生成与所述多个业务数据表对应的业务规则的指令。

可选地，所述业务数据项包括业务标识项；所述用于根据每个业务数据表中的业务数据项的信息，获得多个业务数据表之间的关联关系的指令，包括：用于根据每个业务数据表中的业务数据项的信息，使用所述业务标识项获得多个业务数据表之间的关联关系的指令。

可选地，所述用于根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合的指令，包括：用于根据所述业务规则和所述业务数据项的信息，提取谓词因子的指令；用于根据提取的谓词因子，生成谓词规则的指令；用于使用所述谓词规则对多个业务数据表中的业务数据进行数据融合的指令。

可选地，所述用于根据提取的谓词因子，生成谓词规则的指令，包括：用于根据提取的谓词因子中的部分因子，以及每个业务数据表中的业务标识项的信息，生成至少一个第一子规则的指令；用于根据所述第一子规则中的部分或全部子规则，生成至少一个第二子规则的指令；用于根据生成的所述第一子规则和所述第二子规则，生成所述谓词规则的指令。

可选地，所述第一子规则和所述第二子规则之间具有层次关联关系。

通过本实施例的计算机可读介质，针对某一业务中具有关联关系的多个业务数据表，为这些业务数据表生成对应的业务规则，进而，根据生成的业务规则生成谓词规则，并使用谓词规则进行多个业务数据表中的业务数据融合。通过生成业务规则，可以对多个业务数据表中的业务数据进行关联；而使用谓词规则对业务数据进行数据融合，则实现了对业务数据表中的数据的归纳和梳理，获取其中的用户的用户特征。可见，通过本发明实施例，可以有效地对业务数据进行整合和梳理，提高业务数据的利用效果。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，所述计算机可读记录介质包括用于以计算机(例如计算机)可读的形式存储或传送信息的任何机制。例如，机器可读介质包括只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪速存储介质、电、光、声或其他形式的传播信号(例如，载波、红外信号、数字信号等)等，该计算机软件产品包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明实施例的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

本领域的技术人员应明白，本发明实施例的实施例可提供为方法、装置(设备)、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

Claims

1.一种数据融合方法，其特征在于，包括：

获取多个业务数据表中每个业务数据表的业务数据项的信息；

根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则，其中，所述业务规则用于指示以下信息至少之一：业务数据项之间的关联关系、业务数据表之间的关联关系、如何对业务数据进行处理；

根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合，所述谓词规则为业务的谓词逻辑表示；

其中，所述根据所述业务规则，生成对应的谓词规则包括：

根据所述业务规则和所述业务数据项的信息，提取谓词因子；

根据提取的谓词因子，生成谓词规则。

2.根据权利要求1所述的方法，其特征在于，所述根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则，包括：

根据每个业务数据表中的业务数据项的信息，获得多个业务数据表之间的关联关系；

根据所述关联关系，生成与所述多个业务数据表对应的业务规则。

3.根据权利要求2所述的方法，其特征在于，所述业务数据项包括业务标识项；

所述根据每个业务数据表中的业务数据项的信息，获得多个业务数据表之间的关联关系，包括：

根据每个业务数据表中的业务数据项的信息，使用所述业务标识项获得多个业务数据表之间的关联关系。

4.根据权利要求1所述的方法，其特征在于，所述根据提取的谓词因子，生成谓词规则，包括：

根据提取的谓词因子中的部分因子，以及每个业务数据表中的业务标识项的信息，生成至少一个第一子规则；

根据所述第一子规则中的部分或全部子规则，生成至少一个第二子规则；

根据生成的所述第一子规则和所述第二子规则，生成所述谓词规则。

5.根据权利要求4所述的方法，其特征在于，所述第一子规则和所述第二子规则之间具有层次关联关系。

6.一种计算机可读介质，其特征在于，所述计算机可读介质存储有：

用于获取多个业务数据表中每个业务数据表的业务数据项的信息的指令；

用于根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则的指令，其中，所述业务规则用于指示以下信息至少之一：业务数据项之间的关联关系、业务数据表之间的关联关系、如何对业务数据进行处理；

用于根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合的指令，所述谓词规则为业务的谓词逻辑表示；

其中，所述用于根据所述业务规则，生成对应的谓词规则，并使用所述谓词规则对多个业务数据表中的业务数据进行数据融合的指令，包括：

用于根据所述业务规则和所述业务数据项的信息，提取谓词因子的指令；

用于根据提取的谓词因子，生成谓词规则的指令；

用于使用所述谓词规则对多个业务数据表中的业务数据进行数据融合的指令。

7.根据权利要求6所述的计算机可读介质，其特征在于，所述用于根据每个业务数据表中的业务数据项的信息，生成与所述多个业务数据表对应的业务规则的指令，包括：

用于根据每个业务数据表中的业务数据项的信息，获得多个业务数据表之间的关联关系的指令；

用于根据所述关联关系，生成与所述多个业务数据表对应的业务规则的指令。

8.根据权利要求6所述的计算机可读介质，其特征在于，所述业务数据项包括业务标识项；

所述用于根据每个业务数据表中的业务数据项的信息，获得多个业务数据表之间的关联关系的指令，包括：

用于根据每个业务数据表中的业务数据项的信息，使用所述业务标识项获得多个业务数据表之间的关联关系的指令。