CN112307028B - 跨数据信息知识模态的面向本质计算的差分内容推荐方法 - Google Patents
跨数据信息知识模态的面向本质计算的差分内容推荐方法 Download PDFInfo
- Publication number
- CN112307028B CN112307028B CN202011198393.3A CN202011198393A CN112307028B CN 112307028 B CN112307028 B CN 112307028B CN 202011198393 A CN202011198393 A CN 202011198393A CN 112307028 B CN112307028 B CN 112307028B
- Authority
- CN
- China
- Prior art keywords
- information
- data
- query
- value
- resources
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Automation & Control Theory (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,该方法包括以下步骤:S1、获取目标用户基本信息,连接存储有目标用户隐私信息的数据库;S2、根据数据库公开统计内容构造查询函数查询目标用户个人信息数据表,获取数据资源和信息资源;S3、对数据资源和信息资源进行分析获得新信息资源,根据目标用户的新信息资源匹配推送内容并向目标用户进行推送。本发明能够在隐私数据库公开数据不完全的情况下实现差分内容推送,提高推送内容的准确率。
Description
技术领域
本发明涉及内容推荐技术领域,尤其涉及一种跨数据信息知识模态的面向本质计算的差分内容推荐方法。
背景技术
数据库是长期存储在计算机内、有组织的、可共享的数据集合,是数据资源的重要组成部分,对其中存在的数据可由统一软件进行增、删、改、查等管理和控制行为。数据库由多个数据集构成。数据集是一种由数据所组成的集合,是数据资源的重要组成部分,通常以表格形式出现,每一列代表一个特定变量,表示不同属性,每一行都代表某一成员对应于不同特定变量的值,表格中的每一个值都属于数据资源,若对表格中的内容进行对应理解,即对表格内容所在的行与列进行关联分析,能够表达丰富的语义,描述出现实世界的实体以及实体的不同属性值,此时数据资源转化成为信息资源。对应于行数,数据集的数据可能包括一个或多个成员。当一个受信任机构作为数据持有方持有多个用户的敏感个人信息数据集,例如医疗记录、购买记录、通话记录等,为了保护隐私,数据持有方规定第三方无法直接获取数据表上的数据资源,第三方只能通过数据库提供的查询算法获取一些全局性统计数据,使得数据查询的准确性最大化,同时减少识别数据表上具体记录的机会,目前的推荐系统难以基于此类数据库对用户进行需求分析从而进行内容推荐,导致推荐准确率较低。
发明内容
本发明的目的在于提供一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,以克服或至少部分解决现有技术所存在的上述问题。
一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,包括以下步骤:
S1、获取目标用户基本信息,连接存储有目标用户隐私信息的数据库;
S2、根据数据库公开统计内容构造查询函数查询目标用户个人信息数据表,获取数据资源和信息资源;
S3、对数据资源和信息资源进行分析获得新信息资源,根据目标用户的新信息资源匹配推送内容并向目标用户进行推送。
进一步的,所述步骤S2具体包括:
S21、获取数据库所提供查询函数和限制规则信息,所述查询函数包括Q1(i,j)、Q2{(i1,j1),(i2,j2),...}、Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”},Q1(i,j)用于查询用户个人信息数据表中第j列前i行的部分总和;Q2{(i1,j1),(i2,j2),...}用于查询用户个人信息数据表中第i行第j列的部分总和;Q3(i,j)用于查询用户个人信息数据表中与第i行第j列的属性值相同的记录总数;Q4用于查询用户个人信息数据表j列中与指定属性值相同的记录总数,若指定属性值有多个则顺序输出与各个指定属性值对应的记录总数;所述限制规则信息用于描述相应推送方式的查询限制;
S22、根据查询函数、限制规则信息和已知数据存储位置信息,设置查询函数参数并发送至数据库进行查询;
S23、根据查询结果获取数据资源和信息资源。
进一步的,当数据库所提供查询函数为Q1(i,j)时,所述步骤S22具体包括:
判断所查询数据是否为布尔型,若为布尔型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,则执行查询Q1(i-1,j)和Q1(i,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(i-1,j)和Q1(i,j)的差值并作为新信息资源属性值,新信息资源属性值为数据表中第i行第j列的具体属性值;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,则执行查询Q1(a-1,j)和Q1(b,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(a-1,j)和Q1(b,j)的差值并作为新信息资源属性值;
若已知数据存储位置信息为空,则将多行记录作为一个模块进行差值计算,通过多次进行差值计算获取所查询数据所在范围,确定所查询数据所在具体行数,联系属性值含义获取新信息资源。
进一步的,当数据库所提供查询函数为Q1(i,j)时,所述步骤S22具体包括:
判断所查询数据是否为数值型,若为数值型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,则执行查询Q1(i-1,j)和Q1(i,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(i-1,j)和Q1(i,j)的差值并作为新信息资源属性值,新信息资源属性值为数据表中第i行第j列的具体属性值;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,则执行查询Q1(a-1,j)和Q1(b,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(a-1,j)和Q1(b,j)的差值并作为新信息资源属性值;
若已知数据存储位置信息为空,则对用户个人信息数据表逐行进行单行差值计算,通过关联特定用户获取新信息资源。
进一步的,当数据库所提供查询函数为Q2{(i1,j1),(i2,j2),...}时,所述步骤S22具体包括:
判断所查询数据是否为布尔型或数值型,若为布尔型或数值型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,分析限制规则信息,若允许查询单条记录,则执行单行查询Q2(i,j),获取目标用户的新信息资源,
若不允许查询单条记录且仅能查询连续、固定行数的多行记录,则执行查询Q2{(i,j),n}和Q2{(i+1,j),n},对两次查询进行差值计算,将结果作为数据资源和信息资源,对数据资源和信息资源进行分析融合获得新信息资源,
若不允许直接查询单条记录且仅能查询固定行数的记录属性值之和,则将选取的行记录作为一个模块,模块内行不连续,执行Q2查询相应行的属性值之和,对属性值之和进行统计分析获得数据资源、信息资源,对数据资源和信息资源进行分析融合获得新信息资源;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,分析限制规则信息,若允许查询单条记录,则执行单行查询Q2(i,j)获取区间内所有用户的属性值,将区间内记录属性值相加求和,获取相关知识资源获得数据资源和信息资源,对数据资源和信息资源进行分析融合获得新信息资源,
若查询不允许直接查询单条记录且仅能查询连续、固定行数的多行记录,则执行查询Q2{(i,j),n}对行区间进行统计。
进一步的,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为布尔型,若为布尔型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,根据已知属性值信息进行查询,具体包括:若已知或未知目标用户具体属性值,则对j列每一行都执行Q3(i,j)查询,将目标用户所在行的Q3查询结果与其他行进行Q3查询结果进行对比,根据对比结果对所有记录属性值进行筛选,获得新信息资源;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据属性值信息进行查询,具体包括:若已知第j列中所有可能出现的属性值,则从Q3(a,j)开始逐行进行查询,直到i=b,将查询结果作为新信息资源,若已知具体属性值则进一步确定目标用户记录所在行。
进一步的,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为数值型,若为数值型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,判断所查询数据属性值是否离散;
若离散,根据已知属性值信息进行查询,具体包括:若已知第j列所有可能出现的离散属性值,执行Q3(i,j)查询获取数据资源和信息资源;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据已知属性值信息进行查询,具体包括:若已知第j列所有可能出现的离散属性值,则从Q3(a,j)开始逐行进行查询,直到i=b,将查询结果作为新信息资源,若已知具体属性值则执行Q4(j,“Value”)查询,将查询结果与多行记录进行Q3查询的结果相匹配获取数据资源和信息资源;
若已知数据存储位置为空,则先通过执行Q4{j,“Value1”,“Value2”,...,“Valuem”}查询不同属性值记录总数,再执行Q3(i,j)查询对结果进行分类以获取数据资源和信息资源。
进一步的,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为字符型,若为字符型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,根据已知属性值信息进行查询,具体包括:若已知第j列共有多个记录的属性值是第i行第j列显示的属性值,则先执行Q4{j,“Value1”,“Value2”,...,“Valuem”}获得不同属性值的记录总数,再执行Q3(i,j)查询对结果进行分类以获取数据资源和信息资源,若未知第j列所有可能出现的属性值且未知目标用户第i行第j列的具体属性值,则通过逐行执行Q3查询进行模糊分类获取新信息资源;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据已知属性值信息进行查询,具体包括:若属性值具有预设选项且未知目标用户具体属性值时,对第a行至第b行的第j列执行Q3(i,j)查询,根据查询结果进行模糊分类,若已知目标用户具体属性值则进一步执行Q4(j,“Value”)查询,并将查询结果与a行至b行的第j列进行Q3(i,j)查询得到的结果进行比对获取新信息资源。
进一步的,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为代码型,若为代码型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,根据已知属性值信息进行查询,具体包括:若属性值存在设定规则且未知具体属性值或未知命名规则,执行Q3(i,j)查询进行模糊分类,若已知目标用户特定属性值则执行Q4{j,“Value1”,“Value2”,...,“Valuem”}查询分析获取具体属性值;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据已知属性值信息进行查询,具体包括:若属性值存在设定规则且未知目标用户具体属性值时,对第a行至第b行的第j列执行Q3(i,j)查询,根据查询结果进行模糊分类,若已知目标用户具体属性值,则进一步执行Q4(j,“Value”)查询,将获得结果与执行Q3(i,j)查询结果进行比对,获取新信息资源。
进一步的,在根据已知数据存储位置信息和已知属性值信息只能进行模糊分类时,引入与相应数据资源相关的数据资源、信息资源或知识资源进行同模态或跨模态关联融合。
与现有技术相比,本发明的有益效果是:
本发明所提供的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,在数据库限制查询函数和可查询内容的情况下,能够基于不同的查询函数和数据库公开的统计信息内容获取目标用户的数据资源和信息资源,并基于数据资源和信息资源分析获取新信息资源,根据新信息资源匹配相应的推送数据向目标用户进行推送,从而在隐私数据库公开数据不完全的情况下实现差分内容推送,提高推送内容的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法整体流程示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所列举实施例只用于解释本发明,并非用于限定本发明的范围。
参照图1,本发明提供一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,所述方法包括以下步骤:
S1、获取目标用户基本信息,连接存储有目标用户隐私信息的数据库。
S2、根据数据库公开统计内容构造查询函数查询目标用户个人信息数据表,获取数据资源和信息资源。数据资源是由直接观察得到的离散元素,在没有上下文的情况下不具有任何意义,不与人类的某个特定目的相关联,数据资源表达单个实体的属性内容。信息资源记录人类的行为,用于挖掘、分析、表达两个实体之间的交互关系,实体既可以是另一个人,也可以是客观存在的事物,信息资源与人类的某个特定目的相关,透过目的去推断两个实体之间的关系。下文还将涉及到知识资源,知识资源由数据资源和信息资源经过结构化形式化的推导演绎得到,知识资源在信息资源的基础上对实体关系进行了抽象化的归纳总结。
S3、对数据资源和信息资源进行分析获得新信息资源,根据目标用户的新信息资源匹配推送内容并向目标用户进行推送。
其中所述步骤S2具体包括:
S21、获取数据库所提供查询函数和限制规则信息,所述查询函数包括Q1(i,j)、Q2{(i1,j1),(i2,j2),...}、Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”},Q1(i,j)用于查询用户个人信息数据表中第j列前i行的部分总和;Q2{(i1,j1),(i2,j2),...}用于查询用户个人信息数据表中第i行第j列的部分总和;Q3(i,j)用于查询用户个人信息数据表中与第i行第j列的属性值相同的记录总数;Q4用于查询用户个人信息数据表j列中与指定属性值相同的记录总数,若指定属性值有多个则顺序输出与各个指定属性值对应的记录总数;所述限制规则信息用于描述相应推送方式的查询限制。
S22、根据查询函数、限制规则信息和已知数据存储位置信息,设置查询函数参数并发送至数据库进行查询。
S23、根据查询结果获取数据资源和信息资源。
以下结合一示例以说明本发明技术方案:假设某医院拥有一个医疗记录数据库,数据库中的某一数据表中的每条记录表示为(Name,X,Y,Z,...),其中X、Y、Z为特定变量,X表示病人是否患有胃炎,属性值用布尔值表示,1表示有胃炎,0表示没有胃炎;Y表示病人身高,用数值表示大小;Z表示病人的主治医生,用字符串表示;P表示处方,用数字表示药品代码。部分数据表如表1所示。
表1医疗记录数据库部分数据表
Name | X(Yes/No) | Y | Z | P |
Emory | 0 | 180 | Dr.Chen | 1002 |
German | 1 | 173 | Dr.Chen | 2003 |
Marci | 0 | 159 | Dr.Li | 4001 |
Damion | 0 | 186 | Dr.Liu | 4006 |
Ronald | 1 | 177 | Dr.Chen | 2003 |
Karrie | 1 | 167 | Dr.Li | 4001 |
Dell | 1 | 181 | Dr.Shen | 2003 |
Vince | 0 | 170 | Dr.Chen | 1002 |
Aldo | 0 | 155 | Dr.Shen | 1004 |
Ryan | 0 | 180 | Dr.Li | 3008 |
该医院数据库不直接公布数据表的具体内容,规定推送方只能通过特定形式的查询函数查询数据表中的统计值,接下来基于该例子对步骤S21中的不同查询函数进行说明如何实现基于该数据表的差分内容推送。
当数据库所提供查询函数为Q1(i,j)时,所述步骤S22具体包括:
判断所查询数据是否为布尔型,若为布尔型则判断已知数据存储位置信息。所述已知数据存储位置信息为推送方已经知晓的数据表数据存储信息。若已知数据存储位置在用户个人信息数据表中第i行第j列,则执行查询Q1(i-1,j)和Q1(i,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(i-1,j)和Q1(i,j)的差值并作为新信息资源属性值,新信息资源属性值为数据表中第i行第j列的具体属性值。例如患者Dell的记录,计算两个查询的差别,即计算Q1(7,2)-Q1(6,2)=4-3=1,融合分析得到的新信息资源是患者Dell的肺炎患病情况,差值是1表示Dell是肺炎患者,若差值为0则表示患者不是肺炎患者,根据Dell的患病情况匹配肺炎治疗药物、用具或者预防用品,从而实现差分内容推荐。
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,则执行查询Q1(a-1,j)和Q1(b,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(a-1,j)和Q1(b,j)的差值并作为新信息资源属性值。例如推送方已知患者Dell的记录所属行数i∈[5,8],则推送方先执行两个查询Q1(4,2)和Q1(8,2),分别计算第二列前4行和前8行的总和,然后计算两个查询的差值,得到Q1(8,2)-Q1(4,2)=4-1=3,将已有的数据资源和信息资源融合,分析得到新信息资源为“第5行到第8行共4位患者中共有3人患有肺炎”,进行以上差值计算虽然无法直接得到特定个人信息,但可将个人信息的范围缩小,在此例中,推送方在未经相关操作时,认为患者Dell患胃炎的可能性是50%,进行多行差异的差值计算后,认为患者Dell患胃炎的可能性则会上升,据此同样可以进行推荐内容的匹配和推送。
若已知数据存储位置信息为空,即推送方并不知道目标用户的相关医疗记录在数据表中的位置时,则将多行记录作为一个模块进行差值计算,通过多次进行差值计算获取所查询数据所在范围,确定所查询数据所在具体行数,联系属性值含义获取新信息资源。例如数据表中存在大量记录,需要进行筛查的属性其取值是布尔值,且记录中0和1取值的数目差距很大,比如500条记录中只有10个记录的属性值为1,此时可从第一条记录、最后一条记录甚至是随意某一行记录开始,以50条记录为一个模块进行差值计算,若从第一条记录开始,则执行查询Q1(50,2)得到前50行共有几个属性值为1的记录,接下来执行查询Q1(100,2)、Q1(100,2)、Q1(50,2)可得51行至100行属性值为1的记录,继续进行多行差异的差值计算,可得到属性值为1的记录其大致所在范围,后期通过修改模块大小,可以确定属性值为1的记录的具体行数,最后联系属性值的具体含义,可以得到特定用户信息,从而根据特定用户信息进行推荐内容的匹配和推送。
当数据库所提供查询函数为Q1(i,j)时,所述步骤S22具体包括:
判断所查询数据是否为数值型,若为数值型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,则执行查询Q1(i-1,j)和Q1(i,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(i-1,j)和Q1(i,j)的差值并作为新信息资源属性值,新信息资源属性值为数据表中第i行第j列的具体属性值。例如患者Dell的记录在第七行,推送方想要知道Dell的具体身高数据,只需要执行两个查询Q1(6,3)和Q1(7,3),即分别计算第三列前6行和前7行的总和,然后计算两个查询的差别,即计算Q1(7,3)-Q1(6,3)=1223-1042=181,融合分析得到的新信息资源是患者Dell的具体身高为181厘米,从而据此进行推荐内容的匹配和推送。
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,则执行查询Q1(a-1,j)和Q1(b,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(a-1,j)和Q1(b,j)的差值并作为新信息资源属性值。例如推送方已知患者Dell的记录所属行数i∈[5,8],则推送方先执行两个查询Q1(4,3)和Q1(8,3),分别计算第二列前4行和前8行的总和,然后计算两个查询的差值,得到Q1(8,3)-Q1(4,3)=1393-698=695,将已有的数据资源和信息资源融合,分析得到新信息资源为“第5行到第8行共4位病人的身高数据总和为695厘米”。进行以上差值计算虽然无法直接得到特定个人信息,但可将个人信息的范围缩小,从而提高差分内容推荐的精确率。
若已知数据存储位置信息为空,则对用户个人信息数据表逐行进行单行差值计算,通过关联特定用户获取新信息资源。例如,在数据表中属性列Y中,从第一行开始进行求和计算,再与上一个求和结果相减,即得不同病人的具体身高数据。
当数据库所提供查询函数为Q2{(i1,j1),(i2,j2),...}时,所述步骤S22具体包括:
判断所查询数据是否为布尔型或数值型,若为布尔型或数值型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,分析限制规则信息,若允许查询单条记录,则执行单行查询Q2(i,j),获取目标用户的新信息资源。允许查询单条记录时,Q2(i,j)查询数据表中指定行、列的部分总和即为单条记录对应的属性值。推送方只需要执行单行查询Q2(i,j)获得数据表中该区间内所有用户的属性值,目标用户的属性值为其中之一,然后可将该区间内的记录进行属性值相加求和,结合统计等相关知识资源得到更多的数据资源、信息资源,不仅可以对目标用户的相关数据资源进行分析从而获得新信息资源,还可得到包括目标用户在内的某些群体的相关特征分析。
若不允许查询单条记录且仅能查询连续、固定行数的多行记录,则执行查询Q2{(i,j),n}和Q2{(i+1,j),n},对两次查询进行差值计算,将结果作为数据资源和信息资源,对数据资源和信息资源进行分析融合获得新信息资源。不允许查询单条记录且仅能查询连续、固定行数的多行记录时,Q2{(i,j),n}查询数据表中指定列为j、起始行为i的固定数量行数为n的属性值总和。
若不允许直接查询单条记录且仅能查询固定行数的记录属性值之和,则将选取的行记录作为一个模块,模块内行不连续,执行Q2查询相应行的属性值之和,对属性值之和进行统计分析获得数据资源、信息资源,对数据资源和信息资源进行分析融合获得新信息资源。不允许直接查询单条记录且仅能查询固定行数的记录属性值之和,总行数固定时,记为Q2(j,n,F(x,t)),F(x,t)是能计算出所选行序的循环算法,x表示算法选出的第几个行记录,t表示当前循环次数,结束循环的条件是选取的行记录为空,n表示进行一轮循环得到的行序数量,F(0)表示循环算法从第几行开始,可随意选取,每一轮循环选出的n行作为一个模块进行求和,每个模块的和单独显示。若已知目标用户在数据表中所在行序为4,推送方查询Q2(2,4,F(x,t)),表示利用F(x,t)进行模块内行数为4的循环,对每个模块内选取的不同行记录进行求和,已知选取不同行的算法为F(x,t)=F(0)+2x,x=n(t-1)+i,i=1,2,...,n,F(0)=1表示第一轮循环从第一行之后开始计算行序。则推送方进行计算F(x,t)=F(0)+2x=4,推出当F(0)=0时,x=2=4(1-1)+2,即t=1,i=2,F(2,1)=4,表示从第一行开始选取,进行第一轮循环第二个被选的行即为数据表中第四行,第一个模块中选取行序为2,4,6,8,和为2。除此外根据不同F(0)还有其他推送方式,得到的求和结果也不同。此时Q2查询得到包括目标用户所在行以及其他人的属性值之和,虽然无法直接识别特定数据资源,但可确定一个范围,完成模糊识别,提高推送准确率。
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,分析限制规则信息,若允许查询单条记录,则执行单行查询Q2(i,j)获取区间内所有用户的属性值,将区间内记录属性值相加求和,获取相关知识资源获得数据资源和信息资源,对数据资源和信息资源进行分析融合获得新信息资源。
若查询不允许直接查询单条记录且仅能查询连续、固定行数的多行记录,则执行查询Q2{(i,j),n}对行区间进行统计。此情况下,推送方执行Q2{(i,j),n}查询对行区间进行统计分析,可分为两种情形:一是Q2查询连续多行记录包含特定行区间,即进行Q2{(a,j),n}查询的行区间为[a,a+n-1],总共有n行,且a+n-1≥b,即使用Q2查询到的行数大于等于目标用户所在区间的行数,则进行一次Q2查询得到的统计求和值大于或等于特定行区间统计求和值,结合已有知识资源能解释说明多行连续记录这一群体的某些特征,缩小识别目标用户数据资源的范围;二是Q2查询连续多行记录包含部分特定行区间,即进行Q2{(a,j),n}查询的行区间为[a,a+n-1],且a+n-1<b,即使用Q2查询到的行数小于目标用户所在区间的行数,则要获取行区间[a,b]内所有记录,需要进行多次Q2查询,直到通过Q2查询可以获取行区间[a,b]内所有记录。例如推送方已知目标用户的相关医疗记录在行区间[2,5],多行模块查询Q2{(i,j),n}规定n=5,此种情形区间总行数小于n,因此只需要进行一次Q2查询,即Q2{(2,2),5}=3,得到的属性值总和虽然不能恰好表现行区间的总和值,但也为识别行区间提供一些数据资源、信息资源,缩小了识别范围。若推送方已知目标用户的相关医疗记录在行区间[2,7],执行查询Q2{(i,j),n}规定n=4,此种情形区间总行数大于n,因此需要进行两次Q2查询才能包含区间内所有行记录,即Q2{(2,2),4}=2,Q2{(6,2),4}=2,将两次查询结果相加得到包含行区间和其他所有记录的总和值,缩小行区间的识别范围。
若已知数据存储位置为空,即推送方不知道目标用户相应记录在数据表中位置时,若Q2查询允许查询单条记录,则推送方只需要不断执行单行查询Q2(i,j),就可得到数据表中所有行的属性值。
若Q2查询不允许直接查询单条记录,只能查询连续的多行记录且行数固定,则推送方可从第一条记录开始逐模块查询,直到最后一行,得到不同模块的属性值之和,模块的属性值之和可以表示该模块多条记录的某些性质和特征。将所有模块的属性值之和相加得到全部记录的属性值之和,可以表示一个大规模集体的某些性质和特征,提供更多相关资源。
若Q2查询不允许直接查询单条记录,只能通过某种算法查询不连续的多行记录的j列属性值之和且总行数固定,若不知道所要识别的病人所在行序,例如推送方进行Q2(2,4,F(x,t))查询,选取不同行的算法F(x,t)=F(0)+2x,x=n(t-1)+i。若不知目标用户所在行序,则推送方进行查询Q2(2,4,F(x,t)),得到F(1,1)=3,F(2,1)=5,F(3,1)=7,F(4,1)=9,即第一轮循环所选行序为3,5,7,9,将其作为第一模块,其属性值之和为2,说明这四位病人中有两位患有胃炎,同理第二模块所选序列为11,13,15,17,直到筛选完整个数据表。查询结果虽然无法直接识别出特定人员的数据资源,但也缩小了识别范围,为得到真实数据资源提供了相应支持。
若Q2查询不允许直接查询单条记录,只允许随机选取n个不同行进行求和,则将求和结果再关联融合数据资源、信息资源,在统计知识资源等的支持下进行相关分析,得到关于整个群体的一些性质特征。
作为一个示例,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为布尔型,若为布尔型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,根据已知属性值信息进行查询,具体包括:若已知或未知目标用户具体属性值,则对j列每一行都执行Q3(i,j)查询,将目标用户所在行的Q3查询结果与其他行进行Q3查询结果进行对比,根据对比结果对所有记录属性值进行筛选,获得新信息资源。无论已知还是不知目标用户的具体属性值,若对布尔值属性j列的每一行都进行Q3(i,j)查询,将目标用户所在行进行Q3查询得到的结果与其他行进行Q3查询得到的结果进行对比,若结果相同则表示该行与目标用户有相同属性值,由此可将所有记录的属性值分开,再加上其他信息资源补充,就可得到全部记录对应的属性值,据此可以获得关于不同用户的新信息资源,从而进行推荐内容的匹配和推送。
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据属性值信息进行查询,具体包括:若已知第j列中所有可能出现的属性值,则从Q3(a,j)开始逐行进行查询,直到i=b,将查询结果作为新信息资源,例如布尔值属性的属性值只有两种,则进行Q3查询后的结果也只有两种或一种;结果有两种时可以按属性值将不同记录分开,结果有一种时表示数据表中不同属性值的记录个数相同,可将其作为新信息资源。若已知具体属性值则进一步确定目标用户记录所在行。
作为一个示例,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为数值型,若为数值型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,判断所查询数据属性值是否离散,离散表示属性值是提前设定过的,每一行记录在录入属性值时都只能从这些被设定好的数据值中选取;
若离散,根据已知属性值信息进行查询,具体包括:若已知第j列所有可能出现的离散属性值,执行Q3(i,j)查询获取数据资源和信息资源,具体包括:若推送方已知第j列中所有可能出现的离散属性值,此时使用特定的Q3(i,j)查询,得到的结果表示在整个数据表的第j列共有多少个记录的属性值是第i行第j列显示的属性值,若从第一行记录开始逐行进行Q3(i,j)查询直到最后一行,若不同结果的数量等于不同设定属性值的数量,则可知全部属性值对应的记录个数,并且可将数据表的记录按Q3查询结果进行分类,结果相同的记录属于一类,但无法确定这一类记录对应的属性值,此时虽然无法得到所有记录的对应属性值,但也为匹配属性值提供了帮助;若不同结果的数量小于设定属性值的数量,则可能情形有:a.数据表存在没有被选择的设定属性值,即该属性值经过Q3查询得到的值为0;存在某些属性值的出现次数相同,被误归为一类;c.以上两种情况同时存在,此时可大致进行属性值分类,但准确度不高。若推送方还知道目标用户的具体属性值,即第i行第j列显示的属性值,则推送方通过Q3(i,j)查询就可确定该类属性值,缩小其他属性值的确认范围。若推送方不知第j列中所有可能出现的离散属性值,此时使用特定的Q3(i,j)查询,得到的结果表示在整个数据表的第j列共有多少个记录的属性值是第i行第j列显示的属性值,若从第一行逐行进行Q3查询,按查询结果对记录进行分类,设定属性值的数量大于或等于查询结果的种类数量,为识别属性值提供支持。
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据已知属性值信息进行查询,具体包括:若已知第j列所有可能出现的离散属性值,则从Q3(a,j)开始逐行进行查询,直到i=b,将查询结果作为新信息资源,若已知具体属性值则执行Q4(j,“Value”)查询,将查询结果与多行记录进行Q3查询的结果相匹配获取数据资源和信息资源。
若已知数据存储位置为空,则先通过执行Q4{j,“Value1”,“Value2”,...,“Valuem”}查询不同属性值记录总数,再执行Q3(i,j)查询对结果进行分类以获取数据资源和信息资源,这要求推送方已知第j列中所有可能出现的离散属性值。上述方法对于数据属性值连续或离散的情形均可用于缩小识别范围。
作为一个示例,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为字符型,若为字符型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,根据已知属性值信息进行查询,具体包括:若已知第j列共有多个记录的属性值是第i行第j列显示的属性值,则先执行Q4{j,“Value1”,“Value2”,...,“Valuem”}获得不同属性值的记录总数,再执行Q3(i,j)查询对结果进行分类以获取数据资源和信息资源,若未知第j列所有可能出现的属性值且未知目标用户第i行第j列的具体属性值,则通过逐行执行Q3查询进行模糊分类获取新信息资源。
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据已知属性值信息进行查询,具体包括:若属性值具有预设选项且未知目标用户具体属性值时,对第a行至第b行的第j列执行Q3(i,j)查询,根据查询结果进行模糊分类,若已知目标用户具体属性值则进一步执行Q4(j,“Value”)查询,并将查询结果与a行至b行的第j列进行Q3(i,j)查询得到的结果进行比对获取新信息资源,得到的结果与a行至b行的第j列进行Q3(i,j)查询得到的结果进行比对,可缩小识别目标用户记录所在行序的范围。
若已知数据存储位置信息为空,根据已知属性值信息进行查询,具体包括:若字符串属性的属性值是提前设定好的,当推送方不知目标用户的具体属性值时,对数据表的全体记录进行Q3(i,j)查询,得到对应属性值的记录总数以及模糊分类;进一步地,若推送方已知目标用户的具体属性值,则再进行Q4(j,“Value”)查询,得到的结果与之前计算得到的结果进行Q3(i,j)查询得到的结果进行比对,可缩小属性值匹配和识别目标用户记录所在行序的范围,同时缩小其他属性值匹配的范围。
若字符串属性的属性值不是提前设定好的,当推送方不知目标用户的具体属性值时,不可使用Q4{j,“Value1”,“Value2”,...,“Valuem”}进行查询,只能使用Q3(i,j)查询全体记录,得到对应属性值出现次数,无法确定目标用户记录的行序和其他相关信息。当推送方已知目标用户的具体属性值时,采用Q4(j,“Value”)查询,将结果与使用Q3(i,j)查询得到的结果进行对比,相同值所在的行序可能就是该目标用户的记录行序,由此得到模糊识别并缩小识别的有效范围。
作为一个示例,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为代码型,若为代码型则判断已知数据存储位置信息。
若已知数据存储位置在用户个人信息数据表中第i行第j列,根据已知属性值信息进行查询,具体包括:若属性值存在设定规则且未知具体属性值或未知命名规则,执行Q3(i,j)查询进行模糊分类,若已知目标用户特定属性值则执行Q4{j,“Value1”,“Value2”,...,“Valuem”}查询分析获取具体属性值。
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据已知属性值信息进行查询,具体包括:若属性值存在设定规则且未知目标用户具体属性值时,对第a行至第b行的第j列执行Q3(i,j)查询,根据查询结果进行模糊分类,若已知目标用户具体属性值,则进一步执行Q4(j,“Value”)查询,将获得结果与执行Q3(i,j)查询结果进行比对,获取新信息资源。
若已知数据存储位置信息为空,同样可以参考上述方法缩小识别范围。
在前述实施例的基础上,在根据已知数据存储位置信息和已知属性值信息只能进行模糊分类时,若只依靠原有的数据资源则无法难以基于有效的各模态资源来实现差分内容推荐,此时可引入与相应数据资源相关的数据资源、信息资源或知识资源进行同模态或跨模态关联融合,从而使差分内容的匹配和推送更加准确,效率更高。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,其特征在于,所述方法包括以下步骤:
S1、获取目标用户基本信息,连接存储有目标用户隐私信息的数据库;
S2、根据数据库公开统计内容构造查询函数查询目标用户个人信息数据表,获取数据资源和信息资源;
S3、对数据资源和信息资源进行分析获得新信息资源,根据目标用户的新信息资源匹配推送内容并向目标用户进行推送,所述推送内容为差分内容,
所述步骤S2具体包括:
S21、获取数据库所提供查询函数和限制规则信息,所述查询函数包括Q1(i,j)、Q2{(i1,j1),(i2,j2),...}、Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”},Q1(i,j)用于查询用户个人信息数据表中第j列前i行的部分总和;Q2{(i1,j1),(i2,j2),...}用于查询用户个人信息数据表中第i行第j列的部分总和;Q3(i,j)用于查询用户个人信息数据表中与第i行第j列的属性值相同的记录总数;Q4用于查询用户个人信息数据表j列中与指定属性值相同的记录总数,若指定属性值有多个则顺序输出与各个指定属性值对应的记录总数;所述限制规则信息用于描述相应推送方式的查询限制;
S22、根据查询函数、限制规则信息和已知数据存储位置信息,设置查询函数参数并发送至数据库进行查询;
S23、根据查询结果获取数据资源和信息资源。
2.根据权利要求1所述的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,其特征在于,当数据库所提供查询函数为Q1(i,j)时,所述步骤S22具体包括:
判断所查询数据是否为布尔型,若为布尔型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,则执行查询Q1(i-1,j)和Q1(i,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(i-1,j)和Q1(i,j)的差值并作为新信息资源属性值,新信息资源属性值为数据表中第i行第j列的具体属性值;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,则执行查询Q1(a-1,j)和Q1(b,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(a-1,j)和Q1(b,j)的差值并作为新信息资源属性值;
若已知数据存储位置信息为空,则将多行记录作为一个模块进行差值计算,通过多次进行差值计算获取所查询数据所在范围,确定所查询数据所在具体行数,联系属性值含义获取新信息资源。
3.根据权利要求1所述的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,其特征在于,当数据库所提供查询函数为Q1(i,j)时,所述步骤S22具体包括:
判断所查询数据是否为数值型,若为数值型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,则执行查询Q1(i-1,j)和Q1(i,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(i-1,j)和Q1(i,j)的差值并作为新信息资源属性值,新信息资源属性值为数据表中第i行第j列的具体属性值;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,则执行查询Q1(a-1,j)和Q1(b,j),将查询结果作为数据资源和信息资源,将数据资源和信息资源融合获得新信息资源,计算Q1(a-1,j)和Q1(b,j)的差值并作为新信息资源属性值;
若已知数据存储位置信息为空,则对用户个人信息数据表逐行进行单行差值计算,通过关联特定用户获取新信息资源。
4.根据权利要求1所述的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,其特征在于,当数据库所提供查询函数为Q2{(i1,j1),(i2,j2),...}时,所述步骤S22具体包括:
判断所查询数据是否为布尔型或数值型,若为布尔型或数值型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,分析限制规则信息,若允许查询单条记录,则执行单行查询Q2(i,j),获取目标用户的新信息资源,
若不允许查询单条记录且仅能查询连续、固定行数的多行记录,则执行查询Q2{(i,j),n}和Q2{(i+1,j),n},对两次查询进行差值计算,将结果作为数据资源和信息资源,对数据资源和信息资源进行分析融合获得新信息资源,n表示行数,
若不允许直接查询单条记录且仅能查询固定行数的记录属性值之和,则将选取的行记录作为一个模块,模块内行不连续,执行Q2查询相应行的属性值之和,对属性值之和进行统计分析获得数据资源、信息资源,对数据资源和信息资源进行分析融合获得新信息资源;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,分析限制规则信息,若允许查询单条记录,则执行单行查询Q2(i,j)获取区间内所有用户的属性值,将区间内记录属性值相加求和,获取相关知识资源获得数据资源和信息资源,对数据资源和信息资源进行分析融合获得新信息资源,
若查询不允许直接查询单条记录且仅能查询连续、固定行数的多行记录,则执行查询Q2{(i,j),n}对行区间进行统计。
5.根据权利要求1所述的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,其特征在于,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为布尔型,若为布尔型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,根据已知属性值信息进行查询,具体包括:若已知或未知目标用户具体属性值,则对j列每一行都执行Q3(i,j)查询,将目标用户所在行的Q3查询结果与其他行进行Q3查询结果进行对比,根据对比结果对所有记录属性值进行筛选,获得新信息资源;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据属性值信息进行查询,具体包括:若已知第j列中所有可能出现的属性值,则从Q3(a,j)开始逐行进行查询,直到i=b,将查询结果作为新信息资源,若已知具体属性值则进一步确定目标用户记录所在行。
6.根据权利要求1所述的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,其特征在于,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为数值型,若为数值型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,判断所查询数据属性值是否离散;
若离散,根据已知属性值信息进行查询,具体包括:若已知第j列所有可能出现的离散属性值,执行Q3(i,j)查询获取数据资源和信息资源;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据已知属性值信息进行查询,具体包括:若已知第j列所有可能出现的离散属性值,则从Q3(a,j)开始逐行进行查询,直到i=b,将查询结果作为新信息资源,若已知具体属性值则执行Q4(j,“Value”)查询,将查询结果与多行记录进行Q3查询的结果相匹配获取数据资源和信息资源;
若已知数据存储位置为空,则先通过执行Q4{j,“Value1”,“Value2”,...,“Valuem”}查询不同属性值记录总数,再执行Q3(i,j)查询对结果进行分类以获取数据资源和信息资源。
7.根据权利要求1所述的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,其特征在于,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为字符型,若为字符型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,根据已知属性值信息进行查询,具体包括:若已知第j列共有多个记录的属性值是第i行第j列显示的属性值,则先执行Q4{j,“Value1”,“Value2”,...,“Valuem”}获得不同属性值的记录总数,再执行Q3(i,j)查询对结果进行分类以获取数据资源和信息资源,若未知第j列所有可能出现的属性值且未知目标用户第i行第j列的具体属性值,则通过逐行执行Q3查询进行模糊分类获取新信息资源;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据已知属性值信息进行查询,具体包括:若属性值具有预设选项且未知目标用户具体属性值时,对第a行至第b行的第j列执行Q3(i,j)查询,根据查询结果进行模糊分类,若已知目标用户具体属性值则进一步执行Q4(j,“Value”)查询,并将查询结果与a行至b行的第j列进行Q3(i,j)查询得到的结果进行比对获取新信息资源。
8.根据权利要求1所述的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,其特征在于,当数据库所提供查询函数为Q3(i,j)和Q4{j,“Value1”,“Value2”,...,“Valuem”}时,所述步骤S22具体包括:
判断所查询数据是否为代码型,若为代码型则判断已知数据存储位置信息;
若已知数据存储位置在用户个人信息数据表中第i行第j列,根据已知属性值信息进行查询,具体包括:若属性值存在设定规则且未知具体属性值或未知命名规则,执行Q3(i,j)查询进行模糊分类,若已知目标用户特定属性值则执行Q4{j,“Value1”,“Value2”,...,“Valuem”}查询分析获取具体属性值;
若已知数据存储位置在用户个人信息数据表中第i行,i∈[a,b],a、b表示行数且|a-b|≥2,所查询数据在第j列,根据已知属性值信息进行查询,具体包括:若属性值存在设定规则且未知目标用户具体属性值时,对第a行至第b行的第j列执行Q3(i,j)查询,根据查询结果进行模糊分类,若已知目标用户具体属性值,则进一步执行Q4(j,“Value”)查询,将获得结果与执行Q3(i,j)查询结果进行比对,获取新信息资源。
9.根据权利要求7或8所述的一种跨数据信息知识模态的面向本质计算的差分内容推荐方法,其特征在于,在根据已知数据存储位置信息和已知属性值信息只能进行模糊分类时,引入与相应数据资源相关的数据资源、信息资源或知识资源进行同模态或跨模态关联融合。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011198393.3A CN112307028B (zh) | 2020-10-31 | 2020-10-31 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
PCT/CN2021/097477 WO2022088674A1 (zh) | 2020-10-31 | 2021-05-31 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011198393.3A CN112307028B (zh) | 2020-10-31 | 2020-10-31 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112307028A CN112307028A (zh) | 2021-02-02 |
CN112307028B true CN112307028B (zh) | 2021-11-12 |
Family
ID=74332303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011198393.3A Active CN112307028B (zh) | 2020-10-31 | 2020-10-31 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112307028B (zh) |
WO (1) | WO2022088674A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112307028B (zh) * | 2020-10-31 | 2021-11-12 | 海南大学 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
CN112527834A (zh) * | 2020-12-04 | 2021-03-19 | 海南大学 | 跨模态面向本质计算与推理的内容查询方法及组件 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110074167A (ko) * | 2009-12-24 | 2011-06-30 | 성균관대학교산학협력단 | 차이 확률 변수의 원점 모멘트를 이용한 유사성 척도에 기반한 협업 필터링 추천 시스템 및 유사도 테이블 구축방법 |
CN103279499A (zh) * | 2013-05-09 | 2013-09-04 | 北京信息科技大学 | 个性化信息检索中用户隐私保护方法 |
CN104050267A (zh) * | 2014-06-23 | 2014-09-17 | 中国科学院软件研究所 | 基于关联规则满足用户隐私保护的个性化推荐方法及系统 |
CN106202331A (zh) * | 2016-07-01 | 2016-12-07 | 中国传媒大学 | 分层次隐私保护的推荐系统及基于该推荐系统的作业方法 |
CN110765169A (zh) * | 2019-09-06 | 2020-02-07 | 平安普惠企业管理有限公司 | 信息推荐方法、装置、计算机设备及存储介质 |
CN111666308A (zh) * | 2020-06-03 | 2020-09-15 | 国家计算机网络与信息安全管理中心 | 一种基于行为分析的大数据智能推荐查询方法和系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8619984B2 (en) * | 2009-09-11 | 2013-12-31 | Microsoft Corporation | Differential privacy preserving recommendation |
US10521824B1 (en) * | 2014-01-02 | 2019-12-31 | Outbrain Inc. | System and method for personalized content recommendations |
CN108256000B (zh) * | 2017-12-29 | 2021-06-15 | 武汉大学 | 一种基于局部聚类的个性化差分隐私推荐方法 |
CN109784092A (zh) * | 2019-01-23 | 2019-05-21 | 北京工业大学 | 一种基于标签和差分隐私保护的推荐方法 |
CN109885769A (zh) * | 2019-02-22 | 2019-06-14 | 内蒙古大学 | 一种基于差分隐私算法的主动推荐系统及装置 |
CN110727959A (zh) * | 2019-10-15 | 2020-01-24 | 南京航空航天大学 | 一种基于聚类的差分隐私轨迹数据保护方法 |
CN111556437B (zh) * | 2020-05-12 | 2021-11-16 | 重庆邮电大学 | 一种基于差分隐私的个性化位置隐私保护方法 |
CN112307028B (zh) * | 2020-10-31 | 2021-11-12 | 海南大学 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
-
2020
- 2020-10-31 CN CN202011198393.3A patent/CN112307028B/zh active Active
-
2021
- 2021-05-31 WO PCT/CN2021/097477 patent/WO2022088674A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110074167A (ko) * | 2009-12-24 | 2011-06-30 | 성균관대학교산학협력단 | 차이 확률 변수의 원점 모멘트를 이용한 유사성 척도에 기반한 협업 필터링 추천 시스템 및 유사도 테이블 구축방법 |
CN103279499A (zh) * | 2013-05-09 | 2013-09-04 | 北京信息科技大学 | 个性化信息检索中用户隐私保护方法 |
CN104050267A (zh) * | 2014-06-23 | 2014-09-17 | 中国科学院软件研究所 | 基于关联规则满足用户隐私保护的个性化推荐方法及系统 |
CN106202331A (zh) * | 2016-07-01 | 2016-12-07 | 中国传媒大学 | 分层次隐私保护的推荐系统及基于该推荐系统的作业方法 |
CN110765169A (zh) * | 2019-09-06 | 2020-02-07 | 平安普惠企业管理有限公司 | 信息推荐方法、装置、计算机设备及存储介质 |
CN111666308A (zh) * | 2020-06-03 | 2020-09-15 | 国家计算机网络与信息安全管理中心 | 一种基于行为分析的大数据智能推荐查询方法和系统 |
Non-Patent Citations (2)
Title |
---|
An approach to Privacy on Recommended Systems;Artan Luma 等;《IEEE》;20191216;第1-5页 * |
个性化推荐系统中差分隐私保护方法研究与应用;邵荣敏;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180215;I138-161 * |
Also Published As
Publication number | Publication date |
---|---|
CN112307028A (zh) | 2021-02-02 |
WO2022088674A1 (zh) | 2022-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mardani et al. | A novel extended approach under hesitant fuzzy sets to design a framework for assessing the key challenges of digital health interventions adoption during the COVID-19 outbreak | |
Tomar et al. | A survey on Data Mining approaches for Healthcare | |
US8055603B2 (en) | Automatic generation of new rules for processing synthetic events using computer-based learning processes | |
Kusiak | Data mining: manufacturing and service applications | |
US8145582B2 (en) | Synthetic events for real time patient analysis | |
US7917377B2 (en) | Patient data mining for automated compliance | |
Sun et al. | Organizing and querying the big sensing data with event-linked network in the internet of things | |
US20090287503A1 (en) | Analysis of individual and group healthcare data in order to provide real time healthcare recommendations | |
Mohammed et al. | Privacy-preserving heterogeneous health data sharing | |
Farrelly | Choosing the right method for a quantitative study | |
CN112307028B (zh) | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 | |
Khan et al. | Development of national health data warehouse for data mining. | |
Tseng et al. | Rough set based rule induction in decision making using credible classification and preference from medical application perspective | |
Motiwalla et al. | Developing privacy solutions for sharing and analysing healthcare data | |
Adebayo | Predictive model for the classification of hypertension risk using decision trees algorithm | |
US20130253892A1 (en) | Creating synthetic events using genetic surprisal data representing a genetic sequence of an organism with an addition of context | |
Hart et al. | Meeting health care research needs in a kimball integrated data warehouse | |
Sanaeifar et al. | SEPHYRES 1: a symptom checker based on semantic pain descriptors and weight spreading. | |
Wassan | Big data paradigm for healthcare sector | |
Haque et al. | Doctor Recommendation Based on Patient Syndrome Using Convolutional Neural Network | |
Konijn | Detecting interesting differences: Data mining in health insurance data using outlier detection and subgroup discovery | |
Wassan | Modeling stack framework for accessing electronic health records with big data needs | |
CN112527834A (zh) | 跨模态面向本质计算与推理的内容查询方法及组件 | |
Ghoniemy et al. | A Framework for Social Network-Based Dynamic Modeling and Prediction of Communicable Diseases | |
Mansi et al. | Predictive Protection of Heterogeneous Sensitive Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |