CN112527834A - 跨模态面向本质计算与推理的内容查询方法及组件 - Google Patents
跨模态面向本质计算与推理的内容查询方法及组件 Download PDFInfo
- Publication number
- CN112527834A CN112527834A CN202011405978.8A CN202011405978A CN112527834A CN 112527834 A CN112527834 A CN 112527834A CN 202011405978 A CN202011405978 A CN 202011405978A CN 112527834 A CN112527834 A CN 112527834A
- Authority
- CN
- China
- Prior art keywords
- attribute
- value
- query
- specific
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24564—Applying rules; Deductive queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种跨模态面向本质计算与推理的内容查询方法、装置、设备及可读存储介质,该方法包括:接收并解析查询请求,确定待查询的目标属性;查询数据库,得到目标属性的统计值;解析统计值,得到目标属性的具体属性内容;输出具体属性内容。该方法,对从数据库中查询得到的统计值进行解析,便可得到无法直接从数据库中查询的具体属性内容。能够在数据库无法提供直接查询具体属性内容的情况下,对直接查询得到的统计值进行分析,仍然可以得到具体属性内容,能够满足实际应用场景需要。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种跨模态面向本质计算与推理的内容查询方法、装置、设备及可读存储介质。
背景技术
数据库是长期存储在计算机内、有组织的、可共享的数据集合,是类型化资源中数据资源(DataDIK)的重要组成部分,对其中存在的数据可由统一软件(如统计系统)进行增、删、改、查等管理和控制行为。
数据集是一种由数据所组成的集合,是DataDIK的重要组成部分,通常以表格形式出现,每一列代表一个特定变量,表示不同属性,每一行都代表某一成员对应于不同特定变量的值,表格中的每一个值都属于DataDIK。对应于行数,数据集的数据可能包括一个或多个成员。这些具体属性内容往往存在较高的价值。例如,若对表格中的内容进行对应理解,即对表格内容所在的行与列进行关联分析,能够表达丰富的语义,描述出现实世界的实体以及实体的不同属性值,此时DataDIK转化成为知识资源(InformationDIK)。
但是,在实际应用中,数据库对外所提供的查询方式往往会存在一些限制,如无法查询直接获得数据集中表格内某个单元格的具体数值,即无法直接查询获得具体属性内容。
综上所述,如何有效地解决数据库中内容查询等问题,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种跨模态面向本质计算与推理的内容查询方法、装置、设备及可读存储介质,以通过对从数据库中查询获得的统计值进行解析,可得到具体属性内容,能够弥补无法直接查询数据库中存储的具体属性内容这一缺点。
为解决上述技术问题,本发明提供如下技术方案:
一种跨模态面向本质计算与推理的内容查询方法,包括:
接收并解析查询请求,确定待查询的目标属性;
查询数据库,得到所述目标属性的统计值;
解析所述统计值,得到所述目标属性的具体属性内容;
输出所述具体属性内容。
优选地,所述查询数据库,得到所述目标属性的统计值,包括:
查询所述数据库中数据表内特定列关于特定若干行部分的属性值总和,并将所述属性值总和确定为所述统计值。
优选地,所述查询数据库,得到所述目标属性的统计值,包括:
查询所述数据库中数据表内指定行、列部分的属性值总和,并将所述属性值总和确定为所述统计值。
优选地,解析所述统计值,得到所述目标属性的具体属性内容,包括:
确定所述目标属性的属性类型;所述属性类型为布尔值属性或数值属性;
按照与所述属性类型对应的数据解析规则,解析所述属性值总和,得到所述具体属性内容。
优选地,所述查询数据库,得到所述目标属性的统计值,包括:
查询所述数据库中数据表内指定行、列中属性值相同的记录总数,并将所述记录总数确定为所述统计值;
或,查询所述数据表内指定列中与指定属性值相同的记录总数,并将所述记录总数确定为所述统计值。
优选地,解析所述统计值,得到所述目标属性的具体属性内容,包括:
确定所述目标属性的具体类型;所述具体类型为布尔值属性,数值属性、字符串属性或代号代码属性;
按照所述具体类型对应的数据解析规则,解析所述记录总数,得到所述具体属性内容。
优选地,在所述接收并解析查询请求,确定待查询的目标属性之后,在所述查询数据库,得到所述目标属性的统计值之前,还包括:
判断所述数据库是否支持直接查询所述目标属性的所述具体属性内容;
如果是,则直接查询所述数据库,得到所述具体属性内容;
如果否,则执行所述查询数据库,得到所述目标属性的统计值的步骤。
一种跨模态面向本质计算与推理的内容查询装置,包括:
请求接收模块,用于接收并解析查询请求,确定待查询的目标属性;
数据查询模块,用于查询数据库,得到所述目标属性的统计值;
数据分析模块,用于解析所述统计值,得到所述目标属性的具体属性内容;
内容输出模块,用于输出所述具体属性内容。
一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述跨模态面向本质计算与推理的内容查询方法的步骤。
一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述跨模态面向本质计算与推理的内容查询方法的步骤。
应用本发明实施例所提供的方法,接收并解析查询请求,确定待查询的目标属性;查询数据库,得到目标属性的统计值;解析统计值,得到目标属性的具体属性内容;输出具体属性内容。
在本方法中,在接收到查询请求后,首先确定出待查询的目标属性。对于不支持直接查询具体属性内容的数据库,转变为查询数据库中关于目标属性的统计值,然后,再对统计值进行解析,可得到该目标属性的具体属性内容。最终将具体属性内容输出。可见,在本方法中,对可直接从数据库中查询得到的统计值进行解析,便可得到无法直接从数据库中查询的具体属性内容。能够在数据库无法提供直接查询具体属性内容的情况下,对直接查询得到的统计值进行分析,仍然可以得到具体属性内容,能够满足实际应用场景需要。
相应地,本发明实施例还提供了与上述跨模态面向本质计算与推理的内容查询方法相对应的跨模态面向本质计算与推理的内容查询装置、设备和可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种跨模态面向本质计算与推理的内容查询方法的实施流程图;
图2为本发明实施例中一种跨模态面向本质计算与推理的内容查询装置的结构示意图;
图3为本发明实施例中一种电子设备的结构示意图;
图4为本发明实施例中一种电子设备的具体结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例中一种跨模态面向本质计算与推理的内容查询方法的流程图,该方法包括以下步骤:
S101、接收并解析查询请求,确定待查询的目标属性。
具体的,可设置一个客户端,用户可以对客户端进行操作,使之发出查询请求。在服务端接收到查询请求之后,便可对该查询请求进行解析,确定查询请求所请求查询的目标属性。
当然,该查询请求也可以为上层应用或其他应用有数据调用或读取需求时而产生的,同样的,在接收到查询请求中,首先解析该查询请求,确定出需要进行查询的目标属性。
数据库(DataBase)中存放多条记录,每行表示一名用户对应于不同属性的值,属性值通常被认为是DataDIK,有纯数值型和字符串型两种,纯数值型只有数字,字符串型包括其他各种字符以及数字和其他字符共同出现的情形。目标属性可以为数据库中任意一种属性。
例如,该数据库可以存放医疗记录、购买记录、通话记录等常见的需要进行记录的数据内容。在本实施例中对于数据库具体存放什么数据内容,以何种形式存放等均不做限定。
其中,目标属性为无法直接从数据库查询得到的属性即可。
在本发明的一种具体实施方式中,在接收并解析查询请求,确定待查询的目标属性之后,在查询数据库,得到目标属性的统计值之前,还可以执行以下步骤:
判断数据库是否支持直接查询目标属性的具体属性内容;
如果是,则直接查询数据库,得到具体属性内容;
如果否,则跳转至步骤S102执行查询数据库,得到目标属性的统计值。
也就是说,在确定目标属性之后,可先尝试直接从数据库中查收具体属性内容,仅在无法直接查询的情况下,再执行步骤S102,以快速响应。具体的,可直接向数据库进行查询,基于查询情况来确定是否支持直接查询目标属性的具体属性内容。
S102、查询数据库,得到目标属性的统计值。
其中,数据库不支持直接查询具体属性内容。该数据库可以因为数据库版本问题、数据库部署问题、或出于对数据进行保护等因素,导致其无法支持直接查询具体属性内容。在本发明实施例中,对于数据库因何不支持直接查询具体属性内容不作限定。
由于数据库无法支持直接返回该目标属性的具体属性内容,因而在本发明实施例中,转而采用数据库支持的查询方式对数据库进行查询,得到关于该目标属性的统计值。
举例说明,目标属性为医疗记录中某用户是否患有胃病的表征属性,则该统计值即为该医疗记录中若干个用户对应是否患有胃病的统计数据,而并非某个用户是否患有胃病的表征属性。
相应地,在本实施例中,将某个用户是否患有胃病的表征属性的具有数据内容称之为具体属性内容。
该统计值即使用查询Qi返回数据库中的某些统计值。对于属性值是纯数值型的属性来说,可以进行的相关统计方法主要有:
(1)直接进行数值相加,计算总和,主要针对表示长度、数量、长短等表示大小的属性;
(2)按某些条件进行筛选后计算满足条件的记录个数,主要针对属性对应的不同记录中有重复属性值的情况,包括用数字作为某些实体的代号的情形,例如邮编、区号等。
对于属性值为布尔值的属性来说,由于可以用布尔值代替的属性值比较特殊,可以按以上两种方法进行统计,最后得到的统计结果相同,因为直接对布尔值属性值进行相加的结果同样表示使用第二个方法统计属性值为1的记录个数。
对于属性值是字符串型的属性来说,可以进行的相关统计方法主要记录按照某些条件进行筛选后满足条件的记录个数。
S103、解析统计值,得到目标属性的具体属性内容。
在本发明实施例中,可以预先针对各个不同的查询方式进行分析,进而依据其特点指定对应的数据解析规则,然后按照对应数据解析规则对统计值进行解析,从而获得该目标属性对应的具体属性内容。
下面针对不同的查询方式,结合从数据库中查询该统计值的具体过程,以及解析统计值进而获得具体属性内容进行详细说明。
假如,某医院拥有一个医疗记录数据库DataBase1,某一个数据表DataTable1里的每条记录表现为(Name,X,Y,Z,...),其中X,Y,Z,...是特定变量,分别表示不同属性。
例如,此处X表示病人是否患有胃炎,属性值用布尔值表示,1表示有胃炎,0表示没有胃炎;Y表示病人身高,用数值表示大小;Z表示病人的主治医生,用字符串表示;P表示处方,用数字表示药品代码;部分DataDIK如下表1所示:
表1
Name | Gastritis(Yes/No) | Height | Attending Doctor | Prescription |
Emory | 0 | 180 | Dr.Chen | 1002 |
German | 1 | 173 | Dr.Chen | 2003 |
Marci | 0 | 159 | Dr.Li | 4001 |
Damion | 0 | 186 | Dr.Liu | 4006 |
Ronald | 1 | 177 | Dr.Chen | 2003 |
Karrie | 1 | 167 | Dr.Li | 4001 |
Dell | 1 | 181 | Dr.Shen | 2003 |
Vince | 0 | 170 | Dr.Chen | 1002 |
Aldo | 0 | 155 | Dr.Shen | 1004 |
Ryan | 0 | 180 | Dr.Li | 3008 |
该医院不直接公布DataTable1的具体内容(即该数据库不支持直接查询具体属性内容),规定第三方只能通过使用查询方式查询Qi返回DataTable1中的统计值。经研究发现,对不同的属性值采用不同的查询方式可以暴露不同的InformationDIK,接下来按不同的查询方式进行详细说明。
方式一:
对于上述步骤S102按照特定形式查询数据库,得到目标属性的统计值,包括:查询数据库中数据表内特定列关于特定若干行部分的属性值总和,并将属性值总和确定为统计值。为便于描述,在本发明实施例中将能够使统计系统返回数据库中数据表内特定列关于特定若干行部分的属性值总和,这一查询方式用Q1(i,j)来表示,即特定形式的查询方式Q1(i,j)功能是使统计系统返回数据表中第j列前i行的部分总和,下文称之为属性值总和,也即数据库返回的统计值。
相应地,得到该属性值总和之后,步骤S103解析统计值,得到目标属性的具体属性内容,包括:
步骤一、确定目标属性的属性类型;属性类型为布尔值属性或数值属性;
步骤二、按照与属性类型对应的数据解析规则,解析属性值总和,得到具体属性内容。
为便于描述,下面将上述两个步骤结合起来进行说明。
也就是说,在Q1(i,j)功能查询功能下,目标属性可以具体为布尔值属性或数值属性。针对不同的属性类型,分别对应不同的数据解析规则,对属性值总和进行解析,进而可获得具体属性内容。
下面以不同的属性类型为例,对如何解析属性值总和,进而得到具体属性内容进行详细说明。
(1)、对DataTable1中的布尔值属性进行查询,此处以属性X对应是否患有胃炎为例:
①若已知患者的相关医疗记录在数据表中的第i行,所要查询的属性在第j列,则只需要执行两个查询Q1(i-1,j)和Q1(i,j),分别计算第j列前i-1行和前i行的属性值总和,将结果看作DataDIK和InformationDIK,然后计算两个查询的差别,即计算Q1(i,j)-Q1(i-1,j),再将已有的DataDIK和InformationDIK融合,分析得到的NewInformation是计算的差值可以表示数据表中的第i行的具体属性值。
例如,患者Dell的记录计算两个查询的差别,即计算Q1(7,2)-Q1(6,2)=4-3=1,融合分析得到的NewInformation是患者Dell的肺炎患病情况,差值是1,表示Dell是肺炎患者;若差值为0,则表示患者不是肺炎患者。
仅有一行差异的差值计算还可以确定DataTable1中新增一条信息的具体情况。例如,DataTable1中已有病人记录10条,执行计算Q1(10,2)=4,说明有4位胃炎患者,此时有一名新患者的记录被添加进DataTable1,此时只需要再次查询计算,即可得知这名新患者发胃炎患病情况。
②若已知患者的相关医疗记录在数据表中的某个行区间,i∈[a,b](a,b表示行数且|a-b|≥2),所要查询的属性在第j列,则只需要执行两个查询Q1(a-1,j)和Q1(b,j),分别计算第j列前a-1行和前b行的属性值总和,将结果看作DataDIK和InformationDIK,然后计算两个查询的差别,即计算Q1(a-1,j)-Q1(b,j),再将已有的DataDIK和InformationDIK融合,分析得到的NewInformation是计算的差值可以表示数据表中的第a行到第b行的属性值之和。
例如,已知患者Dell的记录所属行数i∈[5,8],则先执行两个查询Q1(4,2)和Q1(8,2),分别计算第二列前4行和前8行的总和,然后计算两个查询的差值,得到Q1(8,2)-Q1(4,2)=4-1=3,将已有的DataDIK和InformationDIK融合,分析得到NewInformation=“第5行到第8行共4位患者中共有3人患有肺炎”。在此例中,在未经相关操作时,认为患者Dell患胃炎的可能性是50%,进行多行差异的差值计算后,可以计算出不同的可能性数值。即,多行差异的差值计算还可以确定DataTable1中新增多条信息的大致情况。
例如,DataTable1中已有病人记录10条,且有4位胃炎患者,此时有三名新患者的记录被添加进DataTable1,此时只需要再次查询计算,即可得知这三名新患者胃炎患病情况,进一步缩小信息范围。
③若并不知道患者的相关医疗记录在数据表中的位置,可将多行记录看作一个模块,上述提到的多行差异的差值计算还可以用于筛查目标所在区域。例如,存在一个DataTable2,其中存在大量记录,需要进行筛查的属性其取值是布尔值,且记录中0和1取值的数目差距很大,比如500条记录中只有10个记录的属性值为1,此时可从第一条记录、最后一条记录甚至是随意某一行记录开始,以50条记录为一个模块进行差值计算,若从第一条记录开始,则执行查询Q1(50,2)得到前50行共有几个属性值为1的记录,接下来执行查询Q1(100,2),Q1(100,2)-Q1(50,2)可得51行至100行属性值为1的记录,继续进行多行差异的差值计算,可得到属性值为1的记录其大致所在范围,后期灵活修改模块大小,甚至可以确定属性值为1的记录的具体行数,最后联系属性值的具体含义。
从最后一条记录或随意某一行记录开始进行模块差值计算的方法与上同理。
(2)、对DataTable1中表示数值大小属性进行查询,此处以属性Y身高为例:
①若已知患者的相关医疗记录在数据表中的第i行,所要查询的属性在第j列,则只需要执行两个查询Q1(i-1,j)和Q1(i,j),分别计算第j列前i-1行和前i行的属性值总和,将结果看作DataDIK和InformationDIK,然后计算两个查询的差别,即计算Q1(i,j)-Q1(i-1,j),再将计算结果与已有的DataDIK和InformationDIK融合,分析得到的NewInformation是计算的差值,可以表示数据表中的第i行的具体属性值(即具体属性内容)。
例如,患者Dell的记录在第七行,想要知道Dell的具体身高数据,只需要执行两个查询Q1(6,3)和Q1(7,3),即分别计算第三列前6行和前7行的总和,然后计算两个查询的差别,即计算Q1(7,3)-Q1(6,3)=1223-1042=181,融合分析得到的NewInformation是患者Dell的具体身高为181厘米。
仅有一行差异的差值计算还可以确定DataTable1中新增一条信息的具体情况,例如DataTable1中已有病人记录10条,执行计算Q1(10,3),得到10位病人的身高数据的总和,此时有一名新病人的记录被添加进DataTable1,此时只需要再次查询和差值计算,即可得到这名新病人的身高数据。
②若已知患者的相关医疗记录在数据表中的某个行区间,i∈[a,b](a,b表示行数且|a-b|≥2),所要查询的属性在第j列,则只需要执行两个查询Q1(a-1,j)和Q1(b,j),分别计算第j列前a-1行和前b行的属性值总和,将结果看作DataDIK和InformationDIK,然后计算两个查询的差别,即计算Q1(a-1,j)-Q1(b,j),再将已有的DataDIK和InformationDIK融合,分析得到的NewInformation是计算的差值可以表示数据表中的第a行到第b行的属性值总和。
例如,已知患者Dell的记录所属行数i∈[5,8],则先执行两个查询Q1(4,3)和Q1(8,3),分别计算第二列前4行和前8行的总和,然后计算两个查询的差值,得到Q1(8,3)-Q1(4,3)=1393-698=695,将已有的DataDIK和InformationDIK融合,分析得到NewInformation=“第5行到第8行共4位病人的身高数据总和为695厘米”。进行以上差值计算虽然无法直接得到具体属性内容,但可具体属性内容的范围缩小。
若在此基础上结合相关统计KnowledgeDIK,例如均值计算。在此例中,若得到第五行到第八行总共四位病人的身高数据总和后进行均值计算,得到结果为173.75厘米,结合一些InformationDIK或KnowledgeDIK,跨模态资源融合后可进行相关推理。
例如,InformationDIK=“全国男性的平均身高为168厘米,女性的平均身高为156厘米”,与计算得到的平均值关联融合可得到一些推测,因为计算得到的平均值大于男性平均身高,所以这四位病人可能男性居多,使得平均值被拉高,也有可能这四位病人中有女性病人的身高明显高于全国女性身高的平均水平,或是有男性病人身高较低等,推测的真实性和更多的可能性可在更多的DataDIK、InformationDIK等资源的融合下被进一步证实。多行差异的差值计算还可以确定DataTable1中新增多条信息的大致情况,例如DataTable1中已有病人记录10条,此时有多名新病人的记录被添加进DataTable1,此时只需要再次查询计算,即可得知这多名新病人的身高情况,进一步缩小信息范围,还可以借助统计KnowledgeDIK计算、分析出更多InformationDIK。
③若并不知道病人的相关医疗记录在数据表中的位置,对DataDIK逐行进行单行差异的差值计算,可以将整个数据表中的所有数值型DataDIK计算出来,此时虽然无法直接将计算得到的DataDIK与特定人员连接起来暴露特定人员的具体属性内容,但可进一步通过类似链接攻击等方法连接特定人员,从而获得具体属性内容。例如,在DataTable1中属性列Height中,从第一行开始进行求和计算,再与上一个求和结果相减,即得不同病人的具体身高数据。
方式二:
对于上述步骤S102按照特定形式查询数据库,得到目标属性的统计值,包括:查询数据库中数据表内指定行、列部分的属性值总和,并将属性值总和确定为统计值。为便于描述,在本发明实施例中将能够使统计系统返回数据库中数据表内指定行、列部分的属性值总和,这一查询方式用Q2{(i1,j1),(i2,j2),...}来表示,即特定形式的查询方式Q2{(i1,j1),(i2,j2),...}功能是使统计系统返回数据表中指定行、列的部分总和,下文称之为属性值总和,也即数据库返回的统计值,其中i表示行数,j表示列数。通常对相同列数的记录进行Q2查询。
相应地,得到该属性值总和之后,步骤S103解析统计值,得到目标属性的具体属性内容,包括:
步骤一、确定目标属性的属性类型;属性类型为布尔值属性或数值属性;
步骤二、按照与属性类型对应的数据解析规则,解析属性值总和,得到具体属性内容。
为便于描述,下面将上述两个步骤结合起来进行说明。
在Q2{(i1,j1),(i2,j2),...}功能下,目标属性可以具体为布尔值属性或数值属性。针对不同的属性类型,分别对应不同的数据解析规则,对属性值总和进行解析,进而获得具体属性内容。
下面以不同的属性类型为例,对如何解析属性值总和,进而得到具体属性内容进行详细说明。
若Q2查询允许查询单条记录,记为Q2(i,j),统计系统返回数据表中指定行、列的部分总和即为单条记录对应例的属性值。
若Q2查询不允许直接查询单条记录,只能查询连续的多行记录且行数固定,记为Q2{(i,j),n},统计系统返回数据表中指定列为j、起始行为i的固定数量行数为n的属性值总和,进行求和计算的n行记录是连续的,可将n行属性值看作一个模块,该查询可简称为多行模块查询方式。
若Q2查询不允许直接查询单条记录,只能通过某种算法查询不连续的多行记录j列属性值总和且总行数固定,记为Q2(j,n,F(x,t)),F(x,t)是能计算出所选行序的循环算法,x表示算法选出的第几个行记录,t表示当前循环次数,结束循环的条件是选取的行记录为空,n表示进行一轮循环得到的行序数量,F(0)表示循环算法从第几行开始,可随意选取,每一轮循环选出的n行作为一个模块进行求和,每个模块的和单独显示。
若Q2查询不允许直接查询单条记录,只能随机选取n个不同行进行求和,则无法确定特定人员的记录是否被选取,但此类结果能结合统计相关KnowledgeDIK反应群体的某些性质,提供更多InformationDIK、DataDIK。
(1)、对DataTable1中的布尔值属性进行查询,此处以属性X是否患有胃炎为例:
①若已知病人的相关医疗记录在数据表中的第i行,所要查询的属性在第j列。
若Q2查询允许查询单条记录,则只需要执行单行查询Q2(i,j),便可得到特定病人的患病情况,即具体属性内容。
若Q2查询不允许直接查询单条记录,只能查询连续的多行记录且行数固定,则执行多行模块查询Q2{(i,j),n}和Q2{(i+1,j),n},即定义模块固定行数为n,计算j列从第i行至i+n-1行以及第i+1行至i+n行的属性值总和,将求和结果进行差值计算,|Q2{(i+1,j),n}-Q2{(i,j),n}|,结果可作为DataDIK、InformationDIK,意为第i行和i+n行属性值存在差异,差异情况需根据已有的InformationDIK具体分析。
例如:若已知病人Emory的相关医疗记录在DataTable1中的第1行,只能进行多行模块查询,模块内行数为4。若要得知病人患胃炎的情况,则执行查询Q2{(1,2),4}和Q2{(2,2),4},模块求和结果分别为1和2,将求和结果进行差值计算,|Q2{(2,2),4}-Q2{(1,2),4}|=2-1=1=DataDIK,结合已有的InformationDIK=“1表示病人患胃炎,0表示病人未患胃炎”,DataDIK、InformationDIK进行同模态、跨模态关联融合,可进行推理得到NewInformation=“差值计算结果为1,在属性值是布尔值的情况下说明第1行和第5行所代表的病人患胃炎的情况不同,必然有一人患病,一人未患病”。
因此,这种查询方法虽然无法直接得知该病人是否患病,但得到了该病人与其他病人的患病差异等相关信息,相当于此种方法无法准确识别一个个体,但可将个体识别缩小到一个范围,能够不精确地识别该个体,为识别个体提供支持。同理,在此例中差值结果若为0,则表示两病人患胃炎或均未患胃炎。
具体应用时,还可灵活使用多行模块查询,得到更多InformationDIK,可进行差值计算的前提是两模块内有重合记录,否则相减无意义。
例如,查询得到Q2{(4,2),4}=3和Q2{(2,2),4}=2,进行差值计算|Q2{(4,2),4}-Q2{(2,2),4}|=3-2=1=DataDIK,结合已有的InformationDIK得到NewInformation=“第二行和第三行代表的病人作为一组,第六行和第七行作为一组,这两组病人患胃炎的人数之差为1”,对NewInformation继续进行分析,得到两组病人胃炎患病情况的所有八种可能结果Resulti如下表2所示。
再根据查询得到的Q2{(4,2),4}=3和Q2{(2,2),4}=2,可继续推出第四行和第五行的结果,打斜杠的表格表示可能结果无法满足Q2{(4,2),4}=3和Q2{(2,2),4}=2,形成矛盾,说明此种情形Resulti不满足已有条件,应被删去,最后符合要求的情形有六种。
表2
若Q2查询不允许直接查询单条记录,则可通过某种算法查询固定行数的记录属性值之和,可将选取的行记录看作是一个模块,模块内行是不连续的。且已知选取不同行的具体算法F(x,t),此时进行Q2查询可以获取固定行的属性值总和,对属性值总和进行相关统计、分析等得到更多DataDIK、InformationDIK。
若已知特定病人所在行序为4,查询Q2(2,4,F(x,t)),表示利用F(x,t)进行模块内行数为4的循环,对每个模块内选取的不同行记录进行求和,已知选取不同行的算法为F(x,t)=F(0)+2x,x=n(t-1)+i,i=1,2,...,n,x表示进行循环算法选取的第几个行,t表示循环算法的轮数,F(0)=1表示第一轮循环从第一行之后开始计算行序。计算F(x,t)=F(0)+2x=4,推出当F(0)=0时,x=2=4(1-1)+2,即t=1,i=2,F(2,1)=4,表示从第一行开始选取,进行第一轮循环第二个被选的行即为DataTable1中第四行,第一个模块中选取行序为2,4,6,8,属性值总和为2。除此外根据不同F(0)还有其他查询方式,得到的求和结果也不同。此时Q2查询得到包括特定病人所在行以及其他人的属性值总和,虽然无法直接识别特定DataDIK,但可确定一个范围,完成模糊识别。
若Q2查询不允许直接查询单条记录,只能随机选取n个不同行进行求和,则无法确定特定人员的记录是否被选取,但此类结果能结合统计相关KnowledgeDIK反应群体的某些性质,提供更多InformationDIK、DataDIK。
②若已知病人的相关医疗记录在数据表中的某个行区间,i∈[a,b](a,b表示行数且|a-b|≥2),所要查询的属性在第j列。
若Q2查询允许查询单条记录,则只需要执行单行查询Q2(i,j),i∈[a,b](a,b表示行数且|a-b|≥2),得到该区间内所有病人的属性值,特定病人的属性值即为其中之一,然后可将该区间内的记录进行属性值相加求和,结合统计等相关KnowledgeDIK得到更多的DataDIK、InformationDIK,不仅可以对特定病人的相关DataDIK进行分析,还可得到包括特定病人在内的某些群体的相关特征分析。
若Q2查询不允许直接查询单条记录,可查询连续的多行记录且行数固定,则执行多行模块查询Q2{(i,j),n}对行区间进行统计分析可分为两种情形:一、Q2查询连续多行记录包含特定行区间,即进行Q2{(a,j),n}查询的行区间为[a,a+n-1],总共有n行,且a+n-1≥b,即使用Q2查询到的行数大于等于特定病人所在区间的行数,则进行一次Q2查询得到的统计求和值大于或等于特定行区间统计求和值,结合已有KnowledgeDIK能解释说明多行连续记录这一群体的某些特征,缩小识别特定人员DataDIK的范围。二、Q2查询连续多行记录包含部分特定行区间,即进行Q2{(a,j),n}查询的行区间为[a,a+n-1],且a+n-1<b,即使用Q2查询到的行数小于特定病人所在区间的行数,则要获取行区间[a,b]内所有记录,需要进行多次Q2查询,直到通过Q2查询可以获取行区间[a,b]内所有记录。
例如,已知特定病人的相关医疗记录在行区间[2,5],多行模块查询Q2{(i,j),n}规定n=5,此种情形区间总行数小于n,因此只需要进行一次Q2查询,即Q2{(2,2),5}=3,得到的属性值总和虽然不能恰好表现行区间的总和值,但也为识别行区间提供一些DataDIK、InformationDIK,缩小了识别范围。若已知特定病人的相关医疗记录在行区间[2,7],多行模块查询Q2{(i,j),n}规定n=4,此种情形区间总行数大于n,因此需要进行两次Q2查询才能包含区间内所有行记录,即Q2{(2,2),4}=2,Q2{(6,2),4}=2,将两次查询结果相加得到包含行区间和其他所有记录的总和值,缩小行区间的识别范围。
若Q2查询不允许直接查询单条记录,可通过某种算法查询不连续的多行记录j列属性值之和且总行数固定,已知病人的相关医疗记录在数据表中的某个行区间,由于行区间表示行序是连续的,而Q2查询到的行序是不连续的,无法获取连续行记录,因此无法通过Q2(j,n,F(x,t))获取行区间内连续记录,同时无法查询获取DataDIK、InformationDIK。
若Q2查询不允许直接查询单条记录,只能随机选取n个不同行进行求和,由于随机选取的n个不同行不能保证是连续的,因此无法让行区间内所有行记录都恰好被随机选中,进而无法通过Q2(n)查询获取DataDIK、InformationDIK。
③若并不知道病人的相关医疗记录在数据表中的位置。
若Q2查询允许查询单条记录,则只需要不断执行单行查询Q2(i,j),就可得到DataTable1中所有行的属性值。
若Q2查询不允许直接查询单条记录,只能查询连续的多行记录且行数固定,则可从第一条记录开始逐模块查询,直到最后一行,得到不同模块的属性值总和,模块的属性值总和可以表示该模块多条记录的某些性质和特征。将所有模块的属性值总和相加得到全部记录的属性值总和,可以表示一个大规模集体的某些性质和特征,提供更多相关资源。
若Q2查询不允许直接查询单条记录,可通过某种算法查询不连续的多行记录的j列属性值之和且总行数固定。若不知道所要识别的病人所在行序,例如进行Q2(2,4,F(x,t))查询,选取不同行的算法F(x,t)=F(0)+2x,x=n(t-1)+i。若不知特定病人所在行序,则进行查询Q2(2,4,F(x,t)),得到F(1,1)=3,F(2,1)=5,F(3,1)=7,F(4,1)=9,即第一轮循环所选行序为3,5,7,9,将其作为第一模块,其属性值之和为2,说明这四位病人中有两位患有胃炎,同理第二模块所选序列为11,13,15,17,直到筛选完整个DataTable1。查询结果虽然无法直接识别出特定人员的DataDIK,但也缩小了识别范围,为得到真实DataDIK提供了相应支持。
若Q2查询不允许直接查询单条记录,只能随机选取n个不同行进行求和,求和结果再关联融合DataDIK、InformationDIK,在统计KnowledgeDIK等的支持下进行相关分析,得到关于整个群体的一些性质特征。
(2)、对DataTable1中表示数值大小的属性进行查询,此处以属性Y身高为例:
①若已知病人的相关医疗记录在数据表中的第i行,所要查询的属性在第j列。
若Q2查询允许查询单条记录,则只需要执行单行查询Q2(i,j),便可得到特定病人的身高情况,即获得具体属性内容。
若Q2查询不允许直接查询单条记录,只能查询连续的多行记录且行数固定,则执行多行模块查询Q2{(i,j),n}和Q2{(i+1,j),n},即定义模块固定行数为n,计算j列从第i行至i+n-1行以及第i+1行至i+n行的属性值总和,将求和结果进行差值计算,Q2{(i+1,j),n}-Q2{(i,j),n},结果可作为新的DataDIK、InformationDIK,意为第i行和i+n行属性值存在差异,差异情况需根据已有的DataDIK、InformationDIK进行具体分析。
例如:若已知病人Emory的相关医疗记录在DataTable1中的第1行,只能进行多行模块查询,模块内行数为4。若要得知病人的身高情况,则执行查询Q2{(1,2),4}和Q2{(2,2),4},模块求和结果分别为698和695,将求和结果进行差值计算,Q2{(2,2),4}-Q2{(1,2),4}=698-695=3=DataDIK,结合已有的DataDIK、InformationDIK进行同模态、跨模态关联融合,可进行推理得到NewInformation=“差值计算结果为3,在属性值是表示大小的数字情况下说明第1行和第5行所代表的病人身高存在3厘米的差别,更具体一些就是第1行所代表的病人比第5行高3厘米”。因此,这种查询方法虽然无法直接得知该病人具体身高,但得到了该病人与其他病人的患病差异等相关信息,若从其他渠道得到其中一个病人的身高DataDIK,可以推理出其他病人的身高。同时此种方法虽然无法直接识别一个个体,但可将个体识别缩小到一个范围,能够不精确地识别该个体,为识别个体提供支持。
具体应用时还可灵活使用多行模块查询,得到更多InformationDIK,可进行差值计算的前提是两模块内有重合的记录,否则相减无意义。例如,查询得到Q2{(4,2),4}=711和Q2{(2,2),4}=695,进行差值计算Q2{(4,2),4}-Q2{(2,2),4}=711-695=26=DataDIK,结合已有的InformationDIK得到NewInformation=“第二行和第三行代表的病人作为一组,第六行和第七行作为一组,这两组病人身高总和之差为26,第一组病人身高和比第二组高26厘米”,差值结果的正负号表示两组进行大小比较的结果,此例中差值结果若是负号,则表示第一组病人身高和比第二组低26厘米。
若Q2查询不允许直接查询单条记录,可通过某种算法查询固定行数的记录属性值之和,可将选取的行记录看作是一个模块,模块内行是不连续的。且已知选取不同行的具体算法F(x,t),此时进行Q2查询可以获取固定行的属性值之和,对属性值之和进行相关统计、分析等得到更多DataDIK、InformationDIK,。
若已知特定病人所在行序为4,查询Q2(3,4,F(x,t)),表示利用F(x,t)进行模块内行数为4的循环,对每个模块内选取的不同行记录进行求和,已知选取不同行的算法为F(x,t)=F(0)+2x,x=n(t-1)+i,i=1,2,...,n,x表示进行循环算法选取的第几个行,t表示循环算法的轮数,F(0)=1表示第一轮循环从第一行之后开始计算行序。则进行计算F(x,t)=F(0)+2x=4,推出当F(0)=0时,x=2=4(1-1)+2,即t=1,i=2,F(2,1)=4,表示从第一行开始选取,进行第一轮循环第二个被选的行即为DataTable1中第四行,第一个模块中选取行序为2,4,6,8,和为696,表示包括特定病人在内的4人总身高为696厘米。除此外根据不同F(0)还有其他查询方式,得到的求和结果也不同。此种Q2查询得到包括特定病人所在行以及其他人的属性值总和,虽然无法直接识别特定DataDIK,但可确定一个范围,完成模糊识别。
若用Q2(n)随机选取n个不同行进行求和,则无法确定特定人员的记录是否被选取,但此类结果能结合统计相关KnowledgeDIK反应群体的某些性质,提供更多InformationDIK、DataDIK。
②若已知病人的相关医疗记录在数据表中的某个行区间,i∈[a,b](a,b表示行数且|a-b|≥2),所要查询的属性在第j列。
若Q2查询允许查询单条记录,则只需要执行单行查询Q2(i,j),i∈[a,b](a,b表示行数且|a-b|≥2),得到该区间内所有病人的属性值,特定病人的属性值即为其中之一,然后可将该区间内的记录进行属性值相加求和,结合统计等相关KnowledgeDIK得到更多的DataDIK、InformationDIK,不仅可以对特定病人的相关DataDIK进行分析,还可得到包括特定病人在内的某些群体的相关特征分析。
若Q2查询不允许直接查询单条记录,只能查询连续的多行记录且行数固定,则执行多行模块查询Q2{(i,j),n}对行区间进行统计分析可分为两种情形:A、Q2查询连续的多行记录包含特定行区间,即进行Q2{(a,j),n}查询的行区间为[a,a+n-1],总共有n行,且a+n-1≥b,也可解释为使用Q2查询到的行数大于或等于特定病人所在区间的行数,则进行一次Q2查询得到的统计求和值大于或等于特定行区间统计求和值,结合已有KnowledgeDIK能解释说明多行连续记录这一群体的某些特征,缩小识别特定人员DataDIK的范围。B、Q2查询连续的多行记录包含部分特定行区间,即进行Q2{(a,j),n}查询的行区间为[a,a+n-1],且a+n-1<b,即使用Q2查询到的行数小于特定病人所在区间的行数,则要获取行区间[a,b]内所有记录,需要进行多次Q2查询,直到通过Q2查询可以获取行区间[a,b]内所有记录。例如,已知特定病人的相关医疗记录在行区间[2,5],多行模块查询Q2{(i,j),n}规定n=5,此种情形区间总行数小于n,因此只需要进行一次Q2查询,即Q2{(2,3),5}=862,得到的属性值总和虽然有很大可能不能恰好表现行区间的总和值,但也为识别行区间提供一些DataDIK、InformationDIK,缩小了识别范围。若已知特定病人的相关医疗记录在行区间[2,7],多行模块查询Q2{(i,j),n}规定n=4,此种情形区间总行数大于n,因此需要进行两次Q2查询才能包含区间内所有行记录,即Q2{(2,3),4}=695,Q2{(6,3),4}=673,将两次查询结果相加得到包含行区间和其他所有记录的总和值为1368,为识别行区间的相关DataDIK提供一些支持,缩小行区间的识别范围。
若Q2查询不允许直接查询单条记录,只能通过某种算法查询不连续的多行记录j列属性值总和且总行数固定,已知病人的相关医疗记录在数据表中的某个行区间,由于行区间表示行序是连续的,而Q2查询到的行序是不连续的,无法获取连续行记录,因此无法通过Q2(j,n,F(x,t))获取行区间内连续记录,同时无法查询获取跟指定行区间有关的DataDIK、InformationDIK。
若Q2查询不允许直接查询单条记录,只能随机选取n个不同行进行求和,由于随机选取的n个不同行不能保证是连续的,因此无法让行区间内所有行记录都恰好被随机选中,进而无法通过Q2(n)查询获取跟指定行区间有关的DataDIK、InformationDIK。
③若并不知道病人的相关医疗记录在数据表中的位置。
若Q2查询允许查询单条记录,则只需要不断执行单行查询Q2(i,j),就可得到DataTable1中所有行的属性值。
若Q2查询不允许直接查询单条记录,只能查询连续的多行记录且行数固定,则可从第一条记录开始逐模块查询,直到最后一行,得到不同模块的属性值之和,模块中的属性值之和可以表示该模块多条记录的某些性质和特征。将所有模块的属性值之和相加得到全部记录的属性值之和,可以表示一个大规模集体的某些性质和特征,提供更多相关资源。
若Q2查询不允许直接查询单条记录,只能通过某种算法查询不连续的多行记录的j列属性值之和且总行数固定,若不知道所要识别的病人所在行序,例如进行Q2(2,4,F(x,t))查询,选取不同行的算法F(x,t)=F(0)+2x,x=n(t-1)+i,得到F(1,1)=3,F(2,1)=5,F(3,1)=7,F(4,1)=9,即第一轮循环所选行序为3,5,7,9,将其作为第一模块,其属性值之和为672,说明这四位病人身高总和,同理第二模块所选序列为11,13,15,17,直到筛选完整个DataTable1。查询结果虽然无法直接识别出特定人员的DataDIK,但提供了关于集体的某些DataDIK和InformationDIK,缩小了识别范围。
若Q2查询不允许直接查询单条记录,只能随机选取n个不同行进行求和,求和结果再关联融合DataDIK、InformationDIK,在统计KnowledgeDIK等的支持下进行相关分析,得到关于整个群体的一些性质特征。
方式三:
对于上述步骤S102按照特定形式查询数据库,得到目标属性的统计值,包括:查询数据库中数据表内指定行、列中属性值相同的记录总数,并将记录总数确定为统计值;或,查询数据表内指定列中与指定属性值相同的记录总数,并将记录总数确定为统计值。为便于描述,将此查询方式用Q3(i,j)表示,查询方式Q3(i,j)功能是使统计系统返回数据表中与指定行、列中的属性值相同的记录总数,或Q3(j,“Value1”,”Value2”,...,”Valuen”)功能是使统计系统返回数据表j列中与指定属性值相同的记录总数,若Q3查询中陈列了多个不同的属性值,则顺序输出与各个属性值对应的记录总数。其中i表示行数,j表示列数,Valuei表示属性值,Q3只能查询同一列中不同属性值对应的记录总数,即数据库返回的统计值,不可跨列。
相应地,得到该记录总数之后,步骤S103解析统计值,得到目标属性的具体属性内容,包括:
步骤一、确定目标属性的具体类型;具体类型为布尔值属性,数值属性、字符串属性或代号代码属性;
步骤二、按照与具体类型对应的数据解析规则,解析记录总数,得到具体属性内容。
为便于描述,下面将上述两个步骤结合起来进行说明。
也就是说,在Q3查询功能下,目标属性可以具体为布尔值属性,数值属性、字符串属性或代号代码属性。针对不同的属性类型,分别对应不同的数据解析规则,对记录总数进行解析,进而可获得具体属性内容。
下面以不同的属性类型为例,对如何解析记录总数,进而得到具体属性内容进行详细说明。
(1)对DataTable1中的布尔值属性进行查询,此处以属性X是否患有胃炎为例:
①若已知病人的相关医疗记录在数据表中的第i行,所要查询的属性在第j列。
若已知第j列中所有可能出现的属性值,在布尔值属性中可能出现的属性值有两个,分别为0、1,被赋予不同的含义。若已知特定病人的具体属性值,直接使用特定的Q3(i,j)查询,得到在DataTable1中与特定病人有相同属性值的记录总数,若特定病人在i行j列的属性值为1,则Q3(i,j)查询得到的结果等同于使用Q1查询整个DataTable1得到的属性值总和,表示属性值为1的记录总数;若特定病人的属性值为0,Q3(i,j)查询得到的结果表示属性值为0的记录总数。此时可确定不同属性对应的行数,将属性值为1和0的记录总数相加得到DataTable1中记录总和,即记入DataTable1的病人总数量。例如,在DataTable1中进行查询Q3(2,2)=4,说明在DataTable1中包括已知病人本身的记录,与已知病人有相同属性值的记录共有4条,即与已知病人有相同属性值的病人有3位;若已知2行2列的特定病人属性值为1,则能够直接确定在DataTable1中有4条记录的属性值为1;若不知布尔值具体含义,则Q3查询依然只能得到具有相同属性的记录总数InformationDIK,若了解布尔值具体含义,则Q3查询可以得到更多具体InformationDIK。例如,在DataTable1的第2列中1表示患胃炎,则Q3查询能得到患胃炎的病人总数InformationDIK。此种查询方式无法直接得知各个记录的具体属性值,只能得知具有某种相同属性值的记录个数,在此基础上若得到更具体的属性值代表含义等相关DataDIK、InformationDIK补充,可得到属性值所代表的含义的记录个数,缩小了特定识别范围。若不知特定病人的具体属性值,直接使用特定的Q3(i,j)查询,得到在DataTable1中与特定病人有相同属性值的记录总数,若无更具体的属性值代表含义等相关DataDIK、InformationDIK补充,则无法获取更多DataDIK和InformationDIK。无论已知还是不知特定病人的具体属性值,若对布尔值属性j列的每一行都进行Q3(i,j)查询,将特定病人所在行进行Q3查询得到的结果与其他行进行Q3查询得到的结果进行对比,若结果相同则表示该行与特定病人有相同属性值,由此可将所有记录的属性值分开,再加上其他InformationDIK补充,就可得到全部记录对应的属性值,即具体属性内容。
布尔值属性值固定,直接使用Q3(j,“0”,”1”)查询,得到两种属性值对应的记录总数,此种方法无法通过比对等操作确定具有某种属性值的记录的具体行序。
若已知第j列中可能出现的属性值,直接使用Q3(j,“Value1”,”Value2”,...,”Valuen”)查询,得到j列各种属性值对应的记录总数,此种方法无法确定具有某种属性值的记录的具体行序。需要注意的是,若不知第j列中可能出现的属性值,就无法使用Q3(j,“Value1”,”Value2”,...,”Valuen”)查询。
②若已知患者的相关医疗记录在数据表中的某个行区间,i∈[a,b](a,b表示行数且|a-b|≥2),所要查询的属性在第j列。
若已知第j列中所有可能出现的属性值。直接多次使用特定的Q3(i,j)查询,即从Q3(a,j)开始逐行进行查询,直到i=b。由查询得到的结果可为属性值分类提供一定程度的支持。例如,布尔值属性的属性值只有两种,则进行Q3查询后的结果也只有两种或一种;结果有两种时可以按属性值将不同记录分开,结果有一种时表示DataTable1中不同属性值的记录个数相同,可将其作为NewInformation,但此种情形无法将记录按属性值分开。若已知特定病人的具体属性值,根据以上方法可确定记录的属性值,此时可进一步确定特定病人的记录在具体哪一行,缩小了识别特定病人在区间的范围。
③若并不知道患者的相关医疗记录在数据表中的位置。若两种属性值对应的记录总数不同,则多次使用Q3(i,j)查询可将所有记录分类,但无法确定属性值的具体对应,但也为识别记录的属性值提供了支持。
(2)、对DataTable1中表示数值大小的属性进行查询,此处以属性Y身高为例:
①若已知患者的相关医疗记录在数据表中的第i行,所要查询的属性在第j列。
若表示数值大小的属性其属性值是离散的,即属性值是提前设定过的,每一行记录在录入属性值时都只能从这些被设定好的数据值中选取。
若已知第j列中所有可能出现的离散属性值,此时使用特定的Q3(i,j)查询,得到的结果表示在整个DataTable1的第j列共有多少个记录的属性值是第i行第j列显示的属性值,若从第一行记录开始逐行进行Q3(i,j)查询直到最后一行,若不同结果的数量等于不同设定属性值的数量,则可知全部属性值对应的记录个数,并且可将DataTable1的记录按Q3查询结果进行分类,结果相同的记录属于一类,但无法确定这一类记录对应的属性值,此时虽然无法得到所有记录的对应属性值,但也为匹配属性值提供了帮助;若不同结果的数量小于设定属性值的数量,则可能情形有:a.DataTable1存在没有被选择的设定属性值,即该属性值经过Q3查询得到的值为0;存在某些属性值的出现次数相同,被误归为一类;c.以上两种情况同时存在;此时可大致进行属性值分类,但准确度不高。假如,还知道特定病人的具体属性值,即第i行第j列显示的属性值,则通过Q3(i,j)查询就可确定该类属性值,缩小其他属性值的确认范围。若不知第j列中所有可能出现的离散属性值,此时使用特定的Q3(i,j)查询,得到的结果表示在整个DataTable1的第j列共有多少个记录的属性值是第i行第j列显示的属性值,若从第一行逐行进行Q3查询,按查询结果对记录进行分类,设定属性值的数量大于或等于查询结果的种类数量,为识别属性值提供支持。
若已知第j列中所有可能出现的离散属性值,可直接使用Q3(j,“Value1”,”Value2”,...,”Valuen”)查询,得到j列各种属性值对应的记录总数,此种方法无法确定记录的对应属性值分类。若不知第j列中可能出现的属性值,随意输入不同值进行Q3查询,若该值已被设定,则返回对应记录总数,若该值未被设定,则返回NULL,采用这个方法,可推出已被设定的属性值。
若表示数值大小的属性其属性值是连续的,即属性值的取值是无限的,则此时无法确定第j列中可能出现的属性值有多少。
若已知特定病人的记录所在行列,但不知道其对应的具体属性值,此时采用Q3(i,j)查询只能得到特定病人的对应属性值出现次数。由于属性值取值是无限的,此时若从第一行记录开始逐行进行Q3(i,j)查询直到最后一行,并且将查询结果作为属性值分类的重要评判标准,则分类的准确率可能不会太高,常常会出现漏分类的情形。例如,对DataTable1的第3列身高属性逐行进行Q3查询,得到结果分别为2,1,1,1,1,1,1,1,1,2,此时若按查询结果的不同进行分类,准确度较低,但从结果上分析可将第一行和最后一行的属性值划分为一类,缩小分类的范围。若还知道特定病人的具体属性值,则可进行部分属性值对应。
若想要知道在DataTable1中共有多少条记录的对应属性值为Valuei,可直接将值输入Q3(j,“Value1”,”Value2”,...,”Valuen”)进行计算,此时无法确定记录的属性值。
针对已将记录分类且已知属性值,却无法将分类与具体属性值对应起来的情况,可采取向DataTable1添加不同属性值记录的方式,每当添加一条属性值记录,对已分类的记录进行Q3查询,结果发生变化的类与该属性值对应,由此可得DataTable1中所有记录的属性值,造成隐私泄露。
②若已知患者的相关医疗记录在数据表中的某个行区间,i∈[a,b](a,b表示行数且|a-b|≥2),所要查询的属性在第j列。
若已知第j列中所有可能出现的离散属性值。直接多次使用特定的Q3(i,j)查询,即从Q3(a,j)开始逐行进行查询,直到i=b。由查询得到的结果可为属性值分类提供一定程度的支持。若已知特定病人的具体属性值,再进行Q3(j,“Value”),结果与多行记录进行Q3(i,j)查询的结果进行匹配,可推理出有相同结果的记录可能就是该特定病人的相关医疗记录,若有多行记录结果与Q3(j,“Value”)结果相同,可进一步缩小识别特定病人医疗记录所在行的范围。若不知第j列中所有可能出现的离散属性值,多次使用特定的Q3(i,j)查询,可得相关统计结果,根据结果进行大致分类,但无法确定病人医疗记录所在行。
若表示数值大小的属性其属性值是连续的,同样可使用以上方法缩小识别范围。
③若并不知道患者的相关医疗记录在数据表中的位置。
若已知第j列中所有可能出现的离散属性值。直接使用Q3(j,“Value1”,”Value2”,...,”Valuen”)可得到不同属性值的记录总数,再结合每一行记录进行的Q3(i,j)查询,由此可进行分类等操作。
若表示数值大小的属性其属性值是连续的,同样可使用以上方法缩小识别范围。
(3)、对DataTable1中字符串型的属性进行查询,此处主要以属性Z病人的主治医生为例:
①若已知病人的相关医疗记录在数据表中的第i行,所要查询的属性在第j列。
若字符串属性的属性值是提前设定好的,每一行记录在录入属性值时都只能从这些被设定好的数据值中选取。
若已知第j列中所有可能出现的字符串属性值,但不知特定病人i行j列的具体属性值,使用Q3(i,j)查询,结果表示在DataTable1第j列共有多少个记录的属性值是第i行第j列显示的属性值,从第一行记录开始逐行进行Q3(i,j)查询,可根据结果大致进行分类,分类的准确度较低;也可使用Q3(j,“Value1”,”Value2”,...,”Valuen”)得到不同属性值的记录总数,再结合每一行记录进行的Q3(i,j)查询,由此可进行分类和匹配具体属性值等操作,即DataDIK、InformationDIK同模态或跨模态互相关联补充得到NewInformation。在以上基础上若得知特定病人i行j列的具体属性值,则可确定特定病人对应属性值与之前得到的分类之间的一一对应关系,从而缩小其他分类与属性值对应的选择范围。
若不知第j列中所有可能出现的字符串属性值,且不知特定病人i行j列的具体属性值,则只能使用Q3(i,j)查询得到对应属性记录数,进而采用逐行Q3查询进行大致分类。若已知特定病人i行j列的具体属性值,能大致确定拥有该属性值的记录所在行序。
若字符串属性的属性值不是提前设定好的,每一行记录的属性值都是在某些规则的约束下(或无约束)填写的,通常这种属性的可能属性值更为多样,重复性也较低,例如姓名属性。
若不知特定病人i行j列的具体属性值,首先使用Q3(i,j)查询,得到DataTable1第j列出现与(i,j)相同的属性值的次数,再逐行对j列记录进行Q3查询,此时由于此种属性未设定具体属性值,即属性值非固定且种类众多,仅仅只能靠猜测再进行Q3(j,“Value”)查询判断一个值是否属于属性值,若不属于则返回Undefined,若属于则获取该属性值在DataTable1中的出现总数,这种方法效率和准确度都很低,且很难将属性值分类。为提高属性值分类、识别的效率和准确度,需要其他相关DataDIK、InformationDIK关联补充,例如与InformationDIK=“已知特定病人i行j列的具体属性值Valuei,j”关联融合后,可确定Valuei,j在DataTable1中的出现总数,缩小其余属性值的匹配范围,已知的有用DataDIK、InformationDIK越多,属性值分类、识别的效率和准确度越高。
②若已知病人的相关医疗记录在数据表中的某个行区间,i∈[a,b](a,b表示行数且|a-b|≥2),所要查询的属性在第j列。
若字符串属性的属性值是提前设定好的,当不知特定病人的具体属性值时,对第a行至第b行的第j列进行Q3(i,j)查询,得到记录对应属性值在DataTable1的出现次数,可根据查询结果进行模糊分类;进一步地,若已知特定病人的具体属性值,则再进行Q3(j,“Value”)查询,得到的结果与a行至b行的第j列进行Q3(i,j)查询得到的结果进行比对,可缩小识别特定病人记录所在行序的范围,同时进行分类和具体属性值的匹配并缩小其他属性值匹配的范围。
若字符串属性的属性值不是提前设定好的,当不知特定病人的具体属性值时,不可使用Q3(j,“Value1”,”Value2”,...,”Valuen”)进行查询,可使用Q3(i,j)查询第a行至第b行的第j列,得到对应属性值出现次数,无法确定特定病人记录的行序和其他相关信息。当已知特定病人的具体属性值时,采用Q3(j,“Value”)查询,将结果与使用Q3(i,j)查询得到的结果进行对比,相同值所在的行序可能就是该特定病人的记录行序,由此得到识别。
③若并不知道患者的相关医疗记录在数据表中的位置。
若字符串属性的属性值是提前设定好的,当不知特定病人的具体属性值时,对DataTable1的全体记录进行Q3(i,j)查询,得到对应属性值的记录总数以及模糊分类;进一步地,若已知特定病人的具体属性值,则再进行Q3(j,“Value”)查询,得到的结果与之前计算得到的结果进行Q3(i,j)查询得到的结果进行比对,可缩小属性值匹配和识别特定病人记录所在行序的范围,同时缩小其他属性值匹配的范围。
若字符串属性的属性值不是提前设定好的,当不知特定病人的具体属性值时,不可使用Q3(j,“Value1”,”Value2”,...,”Valuen”)进行查询,只能使用Q3(i,j)查询全体记录,得到对应属性值出现次数,无法确定特定病人记录的行序和其他相关信息。当已知特定病人的具体属性值时,采用Q3(j,“Value”)查询,将结果与使用Q3(i,j)查询得到的结果进行对比,相同值所在的行序可能就是该特定病人的记录行序,由此得到模糊识别并缩小识别的有效范围。
(4)、对DataTable1中表示代号代码的属性进行查询,此处主要以属性P处方为例:
①若已知病人的相关医疗记录在数据表中的第i行,所要查询的属性在第j列。
若DataOwner代码属性的属性值存在设定规则或规律,且不知表示代码属性的具体属性值,或不知DataOwner代码属性的属性值命名规则(代码通常是按照某种规则或规律进行编写,再与具体实体或抽象一一对应,通常可以由已有的代码或代号进行规则规律的推理,得到其他代码值)。进行Q3(i,j)查询,结果表示在DataTable1第j列共有多少个记录的属性值是Valuei,j,从第一行记录开始逐行进行Q3(i,j)查询,可根据结果大致进行分类,分类的准确度较低;若有其他相关DataDIK、InformationDIK进行补充。例如,已知特定病人对应的属性值,则可由该属性值进行相关推理,推出一部分可能代码,通过Q3(j,“Value1”,”Value2”,...,”Valuen”)查询结果分析该代码是否属于该属性,结果是Undefined表示不属于,结果是数字则表示属于,具体数字表示该代码出现次数;也可无相关DataDIK、InformationDIK进行补充,靠进行随机猜测,但此种方式效率很低。
若DataOwner代码属性的属性值不存在设定规则或规律,进行Q3(i,j)查询,结果表示在DataTable1第j列共有多少个记录的属性值是Valuei,j,从第一行记录开始逐行进行Q3(i,j)查询,得到DataTable1全体记录对应的属性值出现次数,除此之外无法得到更多DataDIK和InformationDIK,只能依靠随机猜测获取具体属性值的方法,但工作量巨大,最好的选择依然为有其他相关DataDIK、InformationDIK进行关联补充。
②若已知病人的相关医疗记录在数据表中的某个行区间,i∈[a,b](a,b表示行数且|a-b|≥2),所要查询的属性在第j列。
若DataOwner代码属性的属性值存在设定规则或规律,且不知表示代码属性的具体属性值或DataOwner代码属性的属性值命名规则。对第a行至第b行的第j列进行Q3(i,j)查询,得到记录对应属性值在DataTable1的出现次数,可根据查询结果进行模糊分类;进一步地,若已知特定病人的具体属性值,则再进行Q3(j,“Value”)查询,得到的结果与a行至b行的第j列进行Q3(i,j)查询得到的结果进行比对,可缩小识别特定病人记录所在行序的范围,同时由病人具体属性值推理出多个真实属性值,进一步对DataTable1全体记录进行分类匹配。
若DataOwner代码属性的属性值不存在设定规则或规律,对第a行至第b行的第j列进行Q3(i,j)查询,得到DataTable1全体记录对应的属性值出现次数,除此之外无法得到更多DataDIK和InformationDIK,只能依靠随机猜测获取具体属性值的方法,但工作量巨大,优选依然为有其他相关DataDIK、InformationDIK进行关联补充。若已知特定病人的具体属性值,再进行Q3(j,“Value”)查询,得到的结果与a行至b行的第j列进行Q3(i,j)查询得到的结果进行比对,可缩小识别特定病人记录所在行序的范围,但无法依靠病人具体属性值推理出多个真实属性值。
③若并不知道患者的相关医疗记录在数据表中的位置。
若DataOwner代码属性的属性值存在设定规则或规律,且不知表示代码属性的具体属性值或DataOwner代码属性的属性值命名规则。对全体记录进行Q3(i,j)查询,得到记录对应属性值在DataTable1的出现次数,可根据查询结果进行模糊分类;进一步地,若已知特定病人的具体属性值,则再进行Q3(j,“Value”)查询,得到的结果与全体记录的第j列进行Q3(i,j)查询得到的结果进行比对,可缩小识别特定病人记录所在行序的范围,同时由病人具体属性值推理出多个真实属性值,进一步对DataTable1全体记录进行分类匹配。
若DataOwner代码属性的属性值不存在设定规则或规律,对全体记录的第j列进行Q3(i,j)查询,得到DataTable1全体记录对应的属性值出现次数,除此之外无法得到更多DataDIK和InformationDIK,只能依靠随机猜测获取具体属性值的方法,但工作量巨大,最好的选择依然为有其他相关DataDIK、InformationDIK进行关联补充。若已知特定病人的具体属性值,再进行Q3(j,“Value”)查询,得到的结果与全体记录的第j列进行Q3(i,j)查询得到的结果进行比对,可缩小识别特定病人记录所在行序的范围,但无法依靠病人具体属性值推理出多个真实属性值。
以上提及的关于特定病人及其他病人的记录行序、属性值识别等特定目的的达成,或者虽无法顺利达成特定目的但可缩小识别范围完成模糊识别,若只依靠原有的DataDIK,则无法获取足够有效的各模态资源来达成特定目的,因此,需要对原有资源引入一些与特定DataDIK有关的DataDIK、InformationDIK,甚至是KnowledgeDIK来进行同模态、跨模态的关联融合,可以使特定目的实现更加准确、效率更高。
与特定DataDIK有关的DataDIK、InformationDIK、KnowledgeDIK除上文作为解释条件提到过的特定病人的记录状态、不同的查询方式、属性类型等外,还包括类似于“DataTable1中的记录是按特定规则输入的,特定规则为男女顺序输入”的各类资源,能为达成目的做出贡献的各类资源应与原有资源和特定目的有关,能够提供的贡献可由紧密程度、目标相关程度等指标进行衡量,通常情况下紧密程度、目标相关程度等指标均较高的各类资源对比其他资源来说,可以为特定目标提供更多的帮助和支持。
S104、输出具体属性内容。
得到该具体属性内容之后,便可将该具体属性内容输出。如将具体属性内容反馈给发送查询请求的客户端或者上层应用。
应用本发明实施例所提供的方法,接收并解析查询请求,确定待查询的目标属性;查询数据库,得到目标属性的统计值;解析统计值,得到目标属性的具体属性内容;输出具体属性内容。
在本方法中,在接收到查询请求后,首先确定出待查询的目标属性。对于不支持直接查询具体属性内容的数据库,转变为查询数据库中关于目标属性的统计值,然后,再对统计值进行解析,可得到该目标属性的具体属性内容。最终将具体属性内容输出。可见,在本方法中,对可直接从数据库中查询得到的统计值进行解析,便可得到无法直接从数据库中查询的具体属性内容。能够在数据库无法提供直接查询具体属性内容的情况下,对直接查询得到的统计值进行分析,仍然可以得到具体属性内容,能够满足实际应用场景需要。
相应于上面的方法实施例,本发明实施例还提供了一种跨模态面向本质计算与推理的内容查询装置,下文描述的跨模态面向本质计算与推理的内容查询装置与上文描述的跨模态面向本质计算与推理的内容查询方法可相互对应参照。
参见图2所示,该装置包括以下模块:
请求接收模块101,用于接收并解析查询请求,确定待查询的目标属性;
数据查询模块102,用于查询数据库,得到目标属性的统计值;
数据分析模块103,用于解析统计值,得到目标属性的具体属性内容;
内容输出模块104,用于输出具体属性内容。
应用本发明实施例所提供的装置,接收并解析查询请求,确定待查询的目标属性;查询数据库,得到目标属性的统计值;解析统计值,得到目标属性的具体属性内容;输出具体属性内容。
在本装置中,在接收到查询请求后,首先确定出待查询的目标属性。对于不支持直接查询具体属性内容的数据库,转变为查询数据库中关于目标属性的统计值,然后,再对统计值进行解析,可得到该目标属性的具体属性内容。最终将具体属性内容输出。可见,在本装置中,对可直接从数据库中查询得到的统计值进行解析,便可得到无法直接从数据库中查询的具体属性内容。能够在数据库无法提供直接查询具体属性内容的情况下,对直接查询得到的统计值进行分析,仍然可以得到具体属性内容,能够满足实际应用场景需要。
在本发明的一种具体实施方式中,数据查询模块102,具体用于查询数据库中数据表内特定列关于特定若干行部分的属性值总和,并将属性值总和确定为统计值。
在本发明的一种具体实施方式中,数据查询模块102,具体用于查询数据库中数据表内指定行、列部分的属性值总和,并将属性值总和确定为统计值。
在本发明的一种具体实施方式中,数据分析模块103,具体用于确定目标属性的属性类型;属性类型为布尔值属性或数值属性;按照与属性类型对应的数据解析规则,解析属性值总和,得到具体属性内容。
在本发明的一种具体实施方式中,数据查询模块102,具体用于查询数据库中数据表内指定行、列中属性值相同的记录总数,并将记录总数确定为统计值;
或,查询数据表内指定列中与指定属性值相同的记录总数,并将记录总数确定为统计值。
在本发明的一种具体实施方式中,数据分析模块103,具体用于确定目标属性的具体类型;具体类型为布尔值属性,数值属性、字符串属性或代号代码属性;按照具体类型对应的数据解析规则,解析记录总数,得到具体属性内容。
在本发明的一种具体实施方式中,数据查询模块102,在接收并解析查询请求,确定待查询的目标属性之后,在查询数据库,得到目标属性的统计值之前,判断数据库是否支持直接查询目标属性的具体属性内容;如果是,则直接查询数据库,得到具体属性内容;如果否,则执行查询数据库,得到目标属性的统计值的步骤。
相应于上面的方法实施例,本发明实施例还提供了一种电子设备,下文描述的一种电子设备与上文描述的一种跨模态面向本质计算与推理的内容查询方法可相互对应参照。
参见图3所示,该电子设备包括:
存储器332,用于存储计算机程序;
处理器322,用于执行计算机程序时实现上述方法实施例的跨模态面向本质计算与推理的内容查询方法的步骤。
具体的,请参考图4,图4为本实施例提供的一种电子设备的具体结构示意图,该电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)322(例如,一个或一个以上处理器)和存储器332,存储器332存储有一个或一个以上的计算机应用程序342或数据344。其中,存储器332可以是短暂存储或持久存储。存储在存储器332的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储器332通信,在电子设备301上执行存储器332中的一系列指令操作。
电子设备301还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341。
上文所描述的跨模态面向本质计算与推理的内容查询方法中的步骤可以由电子设备的结构实现。
相应于上面的方法实施例,本发明实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种跨模态面向本质计算与推理的内容查询方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的跨模态面向本质计算与推理的内容查询方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
本领域技术人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
Claims (10)
1.一种跨模态面向本质计算与推理的内容查询方法,其特征在于,包括:
接收并解析查询请求,确定待查询的目标属性;
查询数据库,得到所述目标属性的统计值;
解析所述统计值,得到所述目标属性的具体属性内容;
输出所述具体属性内容。
2.根据权利要求1所述的跨模态面向本质计算与推理的内容查询方法,其特征在于,所述查询数据库,得到所述目标属性的统计值,包括:
查询所述数据库中数据表内特定列关于特定若干行部分的属性值总和,并将所述属性值总和确定为所述统计值。
3.根据权利要求1所述的跨模态面向本质计算与推理的内容查询方法,其特征在于,所述查询数据库,得到所述目标属性的统计值,包括:
查询所述数据库中数据表内指定行、列部分的属性值总和,并将所述属性值总和确定为所述统计值。
4.根据权利要求2或3所述的跨模态面向本质计算与推理的内容查询方法,其特征在于,解析所述统计值,得到所述目标属性的具体属性内容,包括:
确定所述目标属性的属性类型;所述属性类型为布尔值属性或数值属性;
按照与所述属性类型对应的数据解析规则,解析所述属性值总和,得到所述具体属性内容。
5.根据权利要求1所述的跨模态面向本质计算与推理的内容查询方法,其特征在于,所述查询数据库,得到所述目标属性的统计值,包括:
查询所述数据库中数据表内指定行、列中属性值相同的记录总数,并将所述记录总数确定为所述统计值;
或,查询所述数据表内指定列中与指定属性值相同的记录总数,并将所述记录总数确定为所述统计值。
6.根据权利要求5所述的跨模态面向本质计算与推理的内容查询方法,其特征在于,解析所述统计值,得到所述目标属性的具体属性内容,包括:
确定所述目标属性的具体类型;所述具体类型为布尔值属性,数值属性、字符串属性或代号代码属性;
按照所述具体类型对应的数据解析规则,解析所述记录总数,得到所述具体属性内容。
7.根据权利要求1所述的跨模态面向本质计算与推理的内容查询方法,其特征在于,在所述接收并解析查询请求,确定待查询的目标属性之后,在所述查询数据库,得到所述目标属性的统计值之前,还包括:
判断所述数据库是否支持直接查询所述目标属性的所述具体属性内容;
如果是,则直接查询所述数据库,得到所述具体属性内容;
如果否,则执行所述查询数据库,得到所述目标属性的统计值的步骤。
8.一种跨模态面向本质计算与推理的内容查询装置,其特征在于,包括:
请求接收模块,用于接收并解析查询请求,确定待查询的目标属性;
数据查询模块,用于查询数据库,得到所述目标属性的统计值;
数据分析模块,用于解析所述统计值,得到所述目标属性的具体属性内容;
内容输出模块,用于输出所述具体属性内容。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述跨模态面向本质计算与推理的内容查询方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述跨模态面向本质计算与推理的内容查询方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011405978.8A CN112527834A (zh) | 2020-12-04 | 2020-12-04 | 跨模态面向本质计算与推理的内容查询方法及组件 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011405978.8A CN112527834A (zh) | 2020-12-04 | 2020-12-04 | 跨模态面向本质计算与推理的内容查询方法及组件 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112527834A true CN112527834A (zh) | 2021-03-19 |
Family
ID=74996967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011405978.8A Pending CN112527834A (zh) | 2020-12-04 | 2020-12-04 | 跨模态面向本质计算与推理的内容查询方法及组件 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112527834A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021402A (zh) * | 2016-05-13 | 2016-10-12 | 河南师范大学 | 用于跨模态检索的多模态多类Boosting框架构建方法及装置 |
CN108920498A (zh) * | 2018-05-23 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 数据查询方法、装置及设备 |
CN109710655A (zh) * | 2018-11-09 | 2019-05-03 | 中国平安人寿保险股份有限公司 | 数据库查询方法、装置、终端设备及存储介质 |
US10303801B2 (en) * | 2010-10-21 | 2019-05-28 | International Business Machines Corporation | Visual meme tracking for social media analysis |
CN111723122A (zh) * | 2019-03-19 | 2020-09-29 | 北京京东尚科信息技术有限公司 | 数据间关联规则的确定方法、装置、设备及可读存储介质 |
CN112307028A (zh) * | 2020-10-31 | 2021-02-02 | 海南大学 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
-
2020
- 2020-12-04 CN CN202011405978.8A patent/CN112527834A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10303801B2 (en) * | 2010-10-21 | 2019-05-28 | International Business Machines Corporation | Visual meme tracking for social media analysis |
CN106021402A (zh) * | 2016-05-13 | 2016-10-12 | 河南师范大学 | 用于跨模态检索的多模态多类Boosting框架构建方法及装置 |
CN108920498A (zh) * | 2018-05-23 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 数据查询方法、装置及设备 |
CN109710655A (zh) * | 2018-11-09 | 2019-05-03 | 中国平安人寿保险股份有限公司 | 数据库查询方法、装置、终端设备及存储介质 |
CN111723122A (zh) * | 2019-03-19 | 2020-09-29 | 北京京东尚科信息技术有限公司 | 数据间关联规则的确定方法、装置、设备及可读存储介质 |
CN112307028A (zh) * | 2020-10-31 | 2021-02-02 | 海南大学 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yuvaraj et al. | Diabetes prediction in healthcare systems using machine learning algorithms on Hadoop cluster | |
Kumar et al. | Big data analytics for healthcare industry: impact, applications, and tools | |
Bashir et al. | BagMOOV: A novel ensemble for heart disease prediction bootstrap aggregation with multi-objective optimized voting | |
CN113707297B (zh) | 医疗数据的处理方法、装置、设备及存储介质 | |
US9378271B2 (en) | Database system for analysis of longitudinal data sets | |
WO2022116430A1 (zh) | 基于大数据挖掘的模型部署方法、装置、设备及存储介质 | |
Abdel-Fattah et al. | Predicting chronic kidney disease using hybrid machine learning based on apache spark | |
US11593665B2 (en) | Systems and methods driven by link-specific numeric information for predicting associations based on predicate types | |
CN110910991B (zh) | 一种医用自动图像处理系统 | |
Choi et al. | Knowledge process of health big data using MapReduce-based associative mining | |
CN115497631A (zh) | 一种临床科研大数据分析系统 | |
CN114153995B (zh) | 医学术语的处理方法、装置、计算机设备和存储介质 | |
Gencturk et al. | Bofrf: A novel boosting-based federated random forest algorithm on horizontally partitioned data | |
CN112307028B (zh) | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 | |
Abed et al. | Diabetes disease detection through data mining techniques | |
CN117370565A (zh) | 一种信息检索方法及系统 | |
US20130253892A1 (en) | Creating synthetic events using genetic surprisal data representing a genetic sequence of an organism with an addition of context | |
Ebada et al. | Applying cloud based machine learning on biosensors streaming data for health status prediction | |
Abdulkadium et al. | Application of Data Mining and Knowledge Discovery in Medical Databases | |
CN112527834A (zh) | 跨模态面向本质计算与推理的内容查询方法及组件 | |
CN112732690B (zh) | 一种用于慢病检测及风险评估的稳定系统及方法 | |
CN114121217A (zh) | 一种手术室调度方法、装置、设备及存储介质 | |
Mune et al. | TUMKFCM-ELM: An Unsupervised Multiple Kernelized Fuzzy C-Means Extreme Learning Machine Approach for Heterogeneous Datasets | |
Samra et al. | Design of a clinical database to support research purposes: Challenges and solutions | |
Tiwari et al. | Data Mining Principles, Process Model and Applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210319 |