CN112819171A - 一种基于表函数的数据搜索方法、系统及计算机存储介质 - Google Patents
一种基于表函数的数据搜索方法、系统及计算机存储介质 Download PDFInfo
- Publication number
- CN112819171A CN112819171A CN202110157814.6A CN202110157814A CN112819171A CN 112819171 A CN112819171 A CN 112819171A CN 202110157814 A CN202110157814 A CN 202110157814A CN 112819171 A CN112819171 A CN 112819171A
- Authority
- CN
- China
- Prior art keywords
- result
- search
- calculation
- classification
- external information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013507 mapping Methods 0.000 claims abstract description 46
- 238000007781 pre-processing Methods 0.000 claims abstract description 22
- 238000004364 calculation method Methods 0.000 claims description 93
- 230000006870 function Effects 0.000 claims description 48
- 210000004556 brain Anatomy 0.000 claims description 24
- 238000005192 partition Methods 0.000 claims description 16
- 238000005381 potential energy Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000003920 cognitive function Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 description 32
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 238000007906 compression Methods 0.000 description 9
- 230000006835 compression Effects 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 7
- 238000013144 data compression Methods 0.000 description 6
- 230000010365 information processing Effects 0.000 description 6
- 102100024405 GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Human genes 0.000 description 4
- 101000981252 Homo sapiens GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 4
- 239000003086 colorant Substances 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 102100032384 Ecto-ADP-ribosyltransferase 3 Human genes 0.000 description 3
- 101000589618 Homo sapiens Ecto-ADP-ribosyltransferase 3 Proteins 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000005428 wave function Effects 0.000 description 3
- APHFXDBDLKPMTA-UHFFFAOYSA-N 2-(3-decanoyl-4,5,7-trihydroxynaphthalen-2-yl)acetic acid Chemical compound CCCCCCCCCC(=O)c1c(CC(O)=O)cc2cc(O)cc(O)c2c1O APHFXDBDLKPMTA-UHFFFAOYSA-N 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000005610 quantum mechanics Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 210000003710 cerebral cortex Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000009012 visual motion Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
Landscapes
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于表函数的数据搜索方法、系统及计算机存储介质。该基于表函数的数据搜索方法包括:将外部信息基于预设规则进行分类;根据分类结果对所述外部信息进行特征表达;对所述特征表达的结果进行预处理;基于预处理结果生成搜索资源的目标映射关系表;通过所述目标映射关系表输出搜索问题的结果。本发明能够在保障搜索准确度的基础上,达到提高搜索效率,使得搜索结果能够得到实时反馈,满足实际运算需求的目的。
Description
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于表函数的数据搜索方法、系统及计算机存储介质。
背景技术
量子计算是计算机科学、数学和物理学交叉的新领域,是一种遵循量子力学规律调控量子信息单元进行计算的新型计算模式,作为一种新的计算模型,从计算的效率上,由于量子力学叠加性的存在,量子的叠加性是量子计算的一个很重要的特性,以输入n个量子比特为例,量子计算可以一次计算2n个数据,每个计算结果以一定的概率幅值给出,由于量子的这种特性在信息处理过程中有着特殊的性质,因而在信息的处理、信息的传输、信息的存储和信息处理的精准度等这几个方面,量子计算比经典计算要快得多。因此,将量子计算应用到国家安全、军事和产业等领域有着颠覆性影响。
目前,在整个搜索过程中,首先需要对输入的外界信息进行分析、计算,然后基于计算的结果进行问题的搜索,从庞大、无序的数据库中找到目标数据,将获取到的目标数据作为搜索问题解。通常基于问题在数据库中进行搜索时,经典算法需经过N次运算才能找到这个目标数据,在1996年的时候,Grover提出了运算速度得到平方增长的量子搜索方法,即Grover算法,Grover算法通过反复使用G算子,放大目标状态的概率幅,减小非目标状态的概率幅,以接近1的概率找到目标状态,该算法将oracle调用次数从经典算法的N降低到还有就是使用一些智能优化算法,如遗传算法、峰群算法、粒子群算法、蚁群算法等。
虽然,Grover算法能以高概率测量到搜索问题解的状态,但是应用了更多次的G量子线路,使得整个算法的量子线路相较于经典算法更为复杂,提高了计算的复杂度,从而引起整个计算的交互延时,降低了搜索的效率,再者,基于智能优化算法的搜索方法往往迭代复杂,整个计算任务的规划以及分配速度慢且分配过程容易出错,无法应对越来越复杂的问题搜索,进而满足不了实际复杂的量子运算需求。
综上所述,如何设计一种能够在保障搜索效率的基础上,提高搜索的准确度,以满足实际复杂计算需求的基于表函数的数据搜索方法是个亟待解决的问题。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于表函数的数据搜索方法、系统及计算机存储介质,能够在保障搜索准确度的基础上,达到提高搜索效率,使得搜索结果能够得到实时反馈,满足实际运算需求的目的。
本发明解决其技术问题所采用的技术方案是:构造一种基于表函数的数据搜索方法,所述方法包括:
S1、将外部信息基于预设规则进行分类;
S2、根据分类结果对所述外部信息进行特征表达;
S3、对所述特征表达的结果进行预处理;
S4、基于预处理结果生成搜索资源的目标映射关系表;
S5、通过所述目标映射关系表输出搜索问题的结果。
进一步地,所述步骤S1进一步包括:基于人脑的认知功能结构,按照学科分类表将外界信息进行不同学科的基础分类。
进一步地,所述步骤S2进一步包括:根据所述分类结果的属性进行脑分区,并采用不同形式的描述方法对所述脑分区内不同属性的特征进行表达。
进一步地,所述步骤S3进一步包括:
S31、根据所述特征表达的结果对脑分区中的每类特征对应的数据结构进行编码,不同特征的数据结构对应不同的编码;
S32、基于编码结果利用对应的计算模型进行分类计算。
进一步地,所述步骤S4进一步包括:
S41、根据所述分类计算的结果对所述特征表达的结果按照所述分类结果的属性利用量子势能模型进行存储;
S42、根据存储结果生成所述外部信息对应的搜索资源,所述搜索资源为基于所述分类结果的属性所确定的资源,所述搜索资源包括所述外部信息的计算规则、存储规则和计算结果;
S43、根据所述计算规则、所述存储规则和所述计算结果的对应关系形成所述目标映射关系表。
进一步地,所述步骤S5进一步包括:
S51、通过预设的搜索模型对获取到的外部信息进行搜索问题的提取,
S52、在确定所述搜索问题存在于所述目标映射关系表后,将所述计算结果作为所述搜索问题的搜索结果,并输出所述计算结果。
进一步地,所述步骤S51进一步包括:
S511、将获取到的外部信息作为一个计算任务,并将该计算任务分解成多个子计算任务运行,再分别采用自适应共振网络模型进行搜索问题的查找;
S512、利用匹配相似度计算方法,将新计算任务对应的输入值与所述目标映射关系表中存在的输入值进行匹配,如果匹配一致,则将新计算任务对应的输入值作为需要进行搜索问题的输入值。
进一步地,所述步骤S52进一步包括:在确定所述需要进行搜索问题的输入值存在于所述目标映射关系表后,将其在所述目标映射关系表中对应的输出值作为所述新计算任务的搜索结果。
本发明解决其技术问题所采用的另一技术方案是:构造一种基于表函数的数据搜索系统,包括:
分类模块,用于将外部信息基于预设规则进行分类;
特征表达模块,用于根据分类结果对所述外部信息进行特征表达;
预处理模块,用于对所述特征表达的结果进行预处理;
搜索模块,用于基于预处理结果生成搜索资源的目标映射关系表和通过所述目标映射关系表输出搜索问题的结果。
本发明解决其技术问题所采用的再一技术方案是:构造一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行所述的基于表函数的数据搜索方法。
实施本发明的一种基于表函数的数据搜索方法、系统及计算机存储介质,能够在保障搜索准确度的基础上,达到提高搜索效率,使得搜索结果能够得到实时反馈,满足实际运算需求的目的。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明实施例提供的一种基于表函数的数据搜索方法的流程图;
图2为本发明实施例提供的基于脑认知的信息表征示意图;
图3为本发明实施例提供的无限深势阱的示意图;
图4为本发明第一实施例提供的一种基于表函数的数据搜索系统的原理框图;
图5为本发明第二实施例提供的一种基于表函数的数据搜索系统的原理框图;
图6为本发明实施例提供的电子设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例描述的结构或构造以及业务场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着设备结构或构造的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
另外,本发明中的电子设备可以是计算机、膝上型计算机、个人数字助理(PDA)、双模式智能电话、iPod、iPad、平板电脑、手机或者具有输入、输出、显示器和存储并且能够与无线网络通信或交互的任何其他终端,可以包括打印能力或者可以不包括打印能力,这里不做具体限定。
此外,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本发明实施例提供了一种基于表函数的数据搜索方法、系统及计算机存储介质,解决了现有搜索体系由于其复杂的设计所容易引起的交互延时,搜索效率不高,满足不了复杂信息处理的实时性要求的问题,基于人脑的认知功能结构,通过对外界信息进行分类表征,其次对表征结果进行编码,基于编码结果进行分类计算,然后根据分类计算的结果对表征结果进行存储,之后基于存储结果生成目标映射关系表,最后利用表函数进行搜索匹配,以便在保障搜索准确度的基础上,达到提高搜索效率,使得搜索结果能够得到实时反馈,满足实际运算需求的目的。
图1是本发明的基于表函数的数据搜索方法的优选实施例的流程图。如图1所示,在步骤S1中,将外部信息基于预设规则进行分类。
在本步骤中,基于人脑的认知功能结构,按照学科分类表将外界信息(如实体物或者虚拟物、实体操作或虚拟操作、实体对象或虚拟对象等)进行不同学科的基础分类。如将涉及到计算、推理计算问题归为逻辑学;将描述大气的天气情况和变化规律归为气象学、将反应人类语言的性质、功能等归为语言学;将涉及推理对象本质的描述手段归为统计学等,从而搭建信息分类的基础库。
在步骤S2、根据分类结果对所述外部信息进行特征表达。其中,根据所述分类结果的属性进行脑分区,并采用不同形式的描述方法对所述脑分区内不同属性的特征进行表达。
结合图4可知,在本步骤中,将基础库中每类信息的属性(如西方哲学中属性一般指属于实体的本质方面的特性,如事物的形状、颜色、气味、用途等,逻辑学上属性是指对象的性质和对象间的关系,如状态、动作等)进行分类。由于任何属性都是属于某种对象(事物)的,任何属性都有其自有的特征(如大小、结构、形状、亮度等)以及特征间的关联性,并且对象(事物)的属性有的是特有属性,有的是共有属性,共有属性之间的特征具有一致性,特有属性之间的特征具有相互关联关系(如文字、文学、艺术之间虽然归属于不同的学科,但是他们可能涉及共同的属性并且共同属性中的特征大体是一致的如字体大小,对于特有属性,如文学和艺术之间即使涉及到的属性可能不一致,但是也可能具有相互的关联性,如文字排版),因此可以将共有属性以及特有属性按照人脑的结构以及每个结构对应的功能进行分区,每个属性由相应的结构(即执行节点)按照其对应的功能执行对应的操作,以获得对应的结果(如人的眼连接于大脑的视觉-运动协调联合皮层区从而能够将观察到的图片中的内容描述出来),进而按照人脑结构及功能构建属性-特征-结构-功能的相互对应关系,从而形成一种大脑的分区结果,然后基于不同属性的特征的分区结果构建属性特征间的连接关系。
然后,采用不同形式的描述方法对脑分区内不同属性的特征进行表达,如天气状况可用温度的高低和光线的明暗进行表示,对于温度的高、低可采用摄氏温度℃或者华氏温标℉等形式进行描述,光线的明暗可采用灰度值或者灰度级别等形式进行描述,不同程度的温度对应不同大小的温度值,不同程度的温度对应不同程度的光线强度,不同的明亮程度对应不同大小的灰度值或者灰度级别,将描述结果作为每类信息特征的表达,进而形成基于不同单位的描述形式的特征表达结果。
在步骤S3中、对所述特征表达的结果进行预处理。优选地,所述对所述特征表达的结果进行预处理,包括:根据所述特征表达的结果对脑分区中的每类特征对应的数据结构进行编码,不同特征的数据结构对应不同的编码;基于编码结果利用对应的计算模型进行分类计算。
结合图2可知,在本步骤中,根据步骤S2中特征表达的结果定义不同特征的数据结构,如对于形状类的特征可采用空间拓扑结构的数据结构(如几何学中的点、线、面及其组合来表示实体空间分布的一种数据组织方式,包括简单数据结构、拓扑数据结构、曲面数据结构等矢量模型的数据结构),对于算法类的特征可采用计算机语言的数据结构(如线性表,包括顺序表、链表、栈和队列,树结构,包括普通树,二叉树,线索二叉树等,图存储结构等),对于音频类的特征可采用声音的数据结构(如声波的长度、振幅、频率等)等,形成脑分区中的每类特征对应的数据结构(如图像类的特征可基于图片体素的灰度值来进行描述,对于灰度值的运算类型数据具体有两种方法uint8类型、double类型。其中,uint8类型数据的取值范围为[0,255],而double类型数据的取值范围为[0,1],对于double类型数据,在取值为0时对应的颜色特征为黑色,此时黑色对应的运算数据结构为黑色情况下的数据结构,在取值为1时对应的颜色特征为白色,此时白色对应的运算数据结构为白色情况下的数据结构)。
然后,对每类特征对应的数据结构进行编码,不同的编码对应不同特征的数据结构,将数据结构中连续空间网格化的晶格和表示每个晶格索引处的状态空间运用置换运算符进行置换编码,,然后再转换成可视化的输出内容,如转换成数值、符号、图片、语音、视频等不同格式的内容,如对于double类型数据,在取值为1时对应的颜色特征为白色,将白色情况下的数据结构按照图片格式转换成带有JPG或者PNG后缀的白色图片,将黑色情况下的数据结构按照图片格式转换成带有JPG或者PNG后缀的黑色图片。
之后,根据不同特征的编码数据,构建相应的编码处理算法库(即编码的计算规则,如数值类的处理算法、符号类的处理算法、语音类的处理算法、图片类处理算法等),从构建的编码处理算法库中调用与编码类型相对应的算法,以便对不同编码类别的数据分别进行计算,如为了将白色情况下的数据结构按照图片格式转换成带有JPG或者PNG后缀的白色图片,则需要构建图片类处理算法的编码处理算法库,然后再从构建的编码处理算法库中调用相应的图片处理算法对JPG或者PNG的图片数据进行计算,如将白色情况下的数据结构转换为二维矩阵形式M,其中,行数等于记录的所有色彩的总体素数,列数为待处理色彩的数量;每一行代表一个体素,每一列分别代表体素的x、y、z轴位置坐标及体素的灰度值,具体地,将不同色彩的数据结构按照每个体素的x、y、z轴位置坐标以及体素的灰度值依次转化成M1行M2列的二维矩阵形式,每一行对应一个体素,每一列对应体素的x、y、z轴位置坐标和体素的灰度值,将该M1行M2列二维矩阵记为M,对二维矩阵M进行分析后形成的矩阵的每一列的值作为量子势能模型(如薛定谔方程)的输入值,构建量子波函数,进而将所有色彩的体素位置坐标及灰度值转换为量子体系的粒子分布,其中,量子波函数为:
其中xi=[β1,β2,…,βn],β1,β2,…βn分别为第i个体素对应的n个主成分的值,为对二维矩阵M进行分析后形成的矩阵,即矩阵M的第i行的n个元素,x为根据输入值构建的n维列向量空间,σ为波函数的宽度参数,σ的大小与数据结构数目相关。
在步骤S4中,基于预处理结果生成搜索资源的目标映射关系表。其中,所述基于预处理结果生成搜索资源的目标映射关系表,包括:根据所述分类计算的结果对所述特征表达的结果按照所述分类结果的属性利用量子势能模型进行存储;根据存储结果生成所述外部信息对应的搜索资源,所述搜索资源为基于所述分类结果的属性所确定的资源,所述搜索资源包括所述外部信息的计算规则、存储规则和计算结果;根据所述计算规则、所述存储规则和所述计算结果的对应关系形成所述目标映射关系表。
结合步骤S3在本步骤中,根据上述得到的分类计算的结果,采用可扩展存储模型,如一维无限深势阱模型,对上述分类计算的结果分别建立对应的数据存储模型,其中,数据存储模型满足离散化的薛定谔方程的高压缩比指数存储模型,如下图3所示,U表示势能,区域II为一无限深势阱,底部势能为0,顶部势能可以无限扩展,以该数据存储模型存储数据,不同的势能层面表示了不同编码类型的数据库表,总体可存储的数据类型和规模是可以根据实际的计算需求进行动态调整的,此处不做具体限定。
然后将不同特征的表达结果所对应的计算结果,采用不同的数据压缩方式进行压缩。其中,数据压缩方式主要包括文本数据压缩、图像数据压缩、音频数据压缩、视频数据压缩算法等,均采用无损压缩算法,不采用有损压缩算法。所谓的有损压缩,也叫有失真压缩,这种压缩使得压缩后部分信息丢失,即还原的数据与原始数据存在误差,它的特点是压缩比大,而且压缩比是可调节的,可从几倍到几百倍,进而再利用上述离散化的薛定谔方程的高压缩比指数存储模型进行存储(即存储规则)。
之后,基于存储结果生成目标映射关系表,具体的,首先,采用网格化方法,对网格划分的每一个输入值,将属性-特征表达结果-编码结果-存储结果形成对应关系,并离线计算后生成对应的输出信息结果值(即计算结果),使得一个属性对应一个或者多个特征,每个特征可以用不同的形式进行特征表达,每个特征表达对应一种或者多种编码的计算规则,每种编码对应一种或者多种存储规则,并输出对应的计算结果,进而形成一种搜索资源,基于此可以将特征表达结果中的信息集作为输入集,遍历整个输入集的网格输入值,生成对应的结果值输出集,并基于预设的表函数模板,如采用一一映射模板,以一个输入对应一个输出的方式,或者采用一对多、多对一的方式,根据输入值与输出值的对应关系,建立基于属性-特征表达结果-编码的计算结果-存储规则-计算结果的映射关系表,将其作为搜索问题求解的目标映射关系表,其中,所述表函数模板可用二维表实现或多维表实现,可根据实际情况进行设置,此处不做具体限定。
步骤S5、通过所述目标映射表输出搜索问题的结果。优选地,该步骤包括通过预设的搜索模型对获取到的外部信息进行搜索问题的提取,在确定所述搜索问题存在于所述目标映射关系表后,将所述计算结果作为所述搜索问题的搜索结果,并输出所述计算结果。
在本发明的进一步的优选实施例中,结合步骤S4在本步骤中,通过调用表函数进行问题搜索的匹配,如采用自适应共振网络模型(Adaptive Resonance Theory,ART)进行搜索。其中,ART模型是由Carpenter和Grossberg提出的自组织神经网络模型,由比较层、识别层、识别阈值和重置模块,比较层负责接收输入样本,并将其传递给识别层神经元,识别层每个神经元对应一个模式类,神经元数目可以在训练过程中动态增长以增加新的模式类,属于无教师的学习网络,初始不需要确定有多少个神经元。共有3种形式,分别为ART1、ART2和ART3,ART1含有并行架构的主-从式算法(leader-follower algorithm),在算法的激活及匹配函数中运用了集合运算,主要处理只含0与1的影像(即黑白)识别问题/二进制信号,ART2可以处理灰度(即模拟值)输入,用于处理连续模拟信号,ART3为多级搜索模式,它融合了前两种结构的功能并将两层神经网络扩展为任意多层的神经元网络,为能适应计算庞大的数据计算量,在本发明实施例中优选ART3多级搜索模式,同时结合并行分发的方式,将获取到的外部信息作为一个计算任务,将该计算任务分解为多个子计算任务运行,然后再分别调用表函数进行求解问题(即搜索问题)的查找,利用模式相似度计算方法,将新计算任务对应的输入值与目标映射关系表中存在的输入值进行匹配,若匹配一致,则将新计算任务对应的输入值作为需要求解问题的输入值。其中,所述模式相似度计算方法主要包括文本相似度计算方法及向量空间余弦的相似度计算方法,文本相似度计算方法主采用SIF(Smooth Inverse Frequency)来进行计算,过程如下:
加权:SIF取句中词嵌入的平均权重。每个词嵌入都由a/(a+p(w))进行加权,其中a的值经常被设置为0.01,而p(w)是词语在语料中预计出现的频率。
常见元素删除:接下来,SIF计算了句子的嵌入中最重要的元素。然后它减去这些句子嵌入中的主要成分,可以删除与频率和句法有关的变量。
SIF使一些不重要的词语的权重下降,例如but、just等,同时保留对语义贡献较大的信息。
所述向量空间余弦的相似度计算方法用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小,余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。其中,给定两个属性向量x和y,xi和yi分别代表向量x和y的各分量,n维向量的夹角余弦公式如下:
最后,根据表函数中得到的新求解问题的计算任务输入值,在目标映射关系表中进行查询。由于新计算任务对应的输入值在目标映射关系表中是可以查询到的,此时,便可以直接输出与输入值对应的表中的输出值,即为新计算任务的搜索结果。
本发明的一种基于表函数的数据搜索方法,包括:基于人脑的认知功能结构,通过对外界信息按照学科分类进行表征,然后对表征结果进行编码,基于编码结果利用计算原理进行分类计算,再根据分类计算的结果对表征结果进行存储,之后基于存储结果生成目标映射关系表,最后利用目标表函数进行搜索匹配。整个过程利用计算原理进行并行处理并构建外界信息的目标关系映射表,将获取到外界信息通过预设搜索模型提取出其中的关键输入值与构建的目标映射关系表中的输入值进行匹配,如匹配一致,则将其作为外界信息的搜索问题,调用表函数直接便可以输出该搜索问题对应的输入值,通过上述构建的目标映射关系表从而能够在保障搜索结果的准确度的基础上,缩短搜索问题解的整个计算交互时延,能够进行快速、准确的结果查找以及输出,保障了搜索效率,使得搜索结果能够得到实时反馈,满足实际复杂计算的运算需求。
图4为本发明第一实施例提供的一种基于表函数的数据搜索系统的原理框图。如图4所示,本发明的基于表函数的数据搜索系统包括分类模块210、特征表达模块220、预处理模块230和搜索模块240。所述分类模块210用于将外部信息基于预设规则进行分类。所述特征表达模块220用于根据分类结果对所述外部信息进行特征表达。所述预处理模块230用于对所述特征表达的结果进行预处理。所述搜索模块240用于基于预处理结果生成搜索资源的目标映射关系表和通过所述目标映射关系表输出搜索问题的结果。
本领域技术人员知悉,所述分类模块210、特征表达模块220、预处理模块230和搜索模块240可以是任何硬件模块,软件模块,或者软硬件模块,其可以一一对应地执行前述基于表函数的数据搜索方法的对应步骤。
图5为本发明第二实施例提供的一种基于表函数的数据搜索系统的原理框图。如图5所示,本发明的基于表函数的数据搜索系统包括分类模块210、特征表达模块220、预处理模块230和搜索模块240。
在本实施例中,所述分类模块210进一步用于基于人脑的认知功能结构,按照学科分类表将外界信息进行不同学科的基础分类。所述特征表达模块220进一步用于根据所述分类结果的属性进行脑分区,并采用不同形式的描述方法对所述脑分区内不同属性的特征进行表达。
在本实施例中,所述预处理模块230包括编码单元231和计算单元232。所述编码单元231进一步用于根据所述特征表达的结果对脑分区中的每类特征对应的数据结构进行编码,不同特征的数据结构对应不同的编码。所述计算单元232进一步用于基于编码结果利用对应的计算模型进行分类计算。
在本实施例中,所述搜索模块240进一步包括存储单元241、资源获取单元242、映射表生成单元243和结果输出单元244。所述存储单元241用于根据所述分类计算的结果对所述特征表达的结果按照所述分类结果的属性利用量子势能模型进行存储。所述资源获取单元242用于根据存储结果生成所述外部信息对应的搜索资源,所述搜索资源为基于所述分类结果的属性所确定的资源,所述搜索资源包括所述外部信息的计算规则、存储规则和计算结果。所述映射表生成单元243用于根据所述计算规则、所述存储规则和所述计算结果的对应关系形成所述目标映射关系表。所述结果输出单元244用于通过预设的搜索模型对获取到的外部信息进行搜索问题的提取,在确定所述搜索问题存在于所述目标映射关系表后,将所述计算结果作为所述搜索问题的搜索结果,并输出所述计算结果。
本领域技术人员知悉,所述分类模块210、特征表达模块220、编码单元231、计算单元232、存储单元241、资源获取单元242、映射表生成单元243和结果输出单元244可以是任何硬件模块,软件模块,或者软硬件模块,其可以一一对应地执行前述基于表函数的数据搜索方法的对应步骤。
进一步地,本发明还涉及一种计算机可读存储介质,其上存储有计算机程序,该计算机程序包含能够实现本发明方法的全部特征,当其安装到计算机系统中时,可以实现本发明的方法。本文件中的计算机程序所指的是、可以采用任何程序语言、代码或符号编写的一组指令的任何表达式,该指令组使系统具有信息处理能力,以直接实现特定功能,或在进行下述一个或两个步骤之后实现特定功能、a)转换成其它语言、编码或符号;b)以不同的格式再现。
该计算机可读介质包括但不限于U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、磁碟或者光盘等各种可以存储程序代码的介质。
图6为本发明实施例提供的一种电子设备300,包括:存储器301、处理器302及存储在所述存储器上并可在所述处理器302上运行的计算机程序,所述处理器302执行所述计算机程序时,执行如图1所示任一实施方式所述的基于表函数的数据搜索方法。进一步的,该电子设备300还包括:至少一个输入设备303以及至少一个输出设备304。其中,上述存储器301、处理器302、输入设备303以及输出设备304,通过总线305连接。进一步的,输入设备303具体可为摄像头、触控面板、物理按键或者鼠标等等,输出设备304具体可为显示屏。存储器301可以是高速随机存取记忆体(RAM,Random Access Memory)存储器,也可为非不稳定的存储器(non-volatile memory),例如磁盘存储器。存储器301用于存储一组可执行程序代码,处理器302与存储器301耦合。
本发明实施例所提供的一种电子设备300,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,相应的产品实施例部分未提及之处,可参考如图1方法实施例中相应内容,此处不再赘述。
此外,在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
虽然本发明是通过具体实施例进行说明的,本领域技术人员应当明白,在不脱离本发明范围的情况下,还可以对本发明进行各种变换及等同替代。另外,针对特定情形或材料,可以对本发明做各种修改,而不脱离本发明的范围。因此,本发明不局限于所公开的具体实施例,而应当包括落入本发明权利要求范围内的全部实施方式。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于表函数的数据搜索方法,其特征在于,包括:
S1、将外部信息基于预设规则进行分类;
S2、根据分类结果对所述外部信息进行特征表达;
S3、对所述特征表达的结果进行预处理;
S4、基于预处理结果生成搜索资源的目标映射关系表;
S5、通过所述目标映射关系表输出搜索问题的结果。
2.如权利要求1所述的基于表函数的数据搜索方法,其特征在于,所述步骤S1进一步包括:基于人脑的认知功能结构,按照学科分类表将外界信息进行不同学科的基础分类。
3.如权利要求1所述的基于表函数的数据搜索方法,其特征在于,所述步骤S2进一步包括:根据所述分类结果的属性进行脑分区,并采用不同形式的描述方法对所述脑分区内不同属性的特征进行表达。
4.如权利要求1所述的基于表函数的数据搜索方法,其特征在于,所述步骤S3进一步包括:
S31、根据所述特征表达的结果对脑分区中的每类特征对应的数据结构进行编码,不同特征的数据结构对应不同的编码;
S32、基于编码结果利用对应的计算模型进行分类计算。
5.如权利要求1所述的基于表函数的数据搜索方法,其特征在于,所述步骤S4进一步包括:
S41、根据所述分类计算的结果对所述特征表达的结果按照所述分类结果的属性利用量子势能模型进行存储;
S42、根据存储结果生成所述外部信息对应的搜索资源,所述搜索资源为基于所述分类结果的属性所确定的资源,所述搜索资源包括所述外部信息的计算规则、存储规则和计算结果;
S43、根据所述计算规则、所述存储规则和所述计算结果的对应关系形成所述目标映射关系表。
6.如权利要求1-5任一项所述的基于表函数的数据搜索方法,其特征在于,所述步骤S5进一步包括:
S51、通过预设的搜索模型对获取到的外部信息进行搜索问题的提取,
S52、在确定所述搜索问题存在于所述目标映射关系表后,将所述计算结果作为所述搜索问题的搜索结果,并输出所述计算结果。
7.如权利要求6所述的基于表函数的数据搜索方法,其特征在于,所述步骤S51进一步包括:
S511、将获取到的外部信息作为一个计算任务,并将该计算任务分解成多个子计算任务运行,再分别采用自适应共振网络模型进行搜索问题的查找;
S512、利用匹配相似度计算方法,将新计算任务对应的输入值与所述目标映射关系表中存在的输入值进行匹配,如果匹配一致,则将新计算任务对应的输入值作为需要进行搜索问题的输入值。
8.如权利要求7所述的基于表函数的数据搜索方法,其特征在于,所述步骤S52进一步包括:在确定所述需要进行搜索问题的输入值存在于所述目标映射关系表后,将其在所述目标映射关系表中对应的输出值作为所述新计算任务的搜索结果。
9.一种基于表函数的数据搜索系统,其特征在于,包括:
分类模块,用于将外部信息基于预设规则进行分类;
特征表达模块,用于根据分类结果对所述外部信息进行特征表达;
预处理模块,用于对所述特征表达的结果进行预处理;
搜索模块,用于基于预处理结果生成搜索资源的目标映射关系表和通过所述目标映射关系表输出搜索问题的结果。
10.一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-8中任意一项所述的基于表函数的数据搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110157814.6A CN112819171B (zh) | 2021-02-04 | 2021-02-04 | 一种基于表函数的数据搜索方法、系统及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110157814.6A CN112819171B (zh) | 2021-02-04 | 2021-02-04 | 一种基于表函数的数据搜索方法、系统及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112819171A true CN112819171A (zh) | 2021-05-18 |
CN112819171B CN112819171B (zh) | 2024-04-09 |
Family
ID=75861505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110157814.6A Active CN112819171B (zh) | 2021-02-04 | 2021-02-04 | 一种基于表函数的数据搜索方法、系统及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112819171B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113239247A (zh) * | 2021-07-12 | 2021-08-10 | 深圳市永达电子信息股份有限公司 | 基于脑功能分区的多维数据搜索方法、系统和存储介质 |
CN113238821A (zh) * | 2021-05-31 | 2021-08-10 | 深圳市商汤科技有限公司 | 数据处理的加速方法、装置、电子设备及存储介质 |
CN114048848A (zh) * | 2022-01-13 | 2022-02-15 | 深圳市永达电子信息股份有限公司 | 一种基于记忆机制的类脑计算方法和系统 |
CN114741426A (zh) * | 2022-06-08 | 2022-07-12 | 深圳市永达电子信息股份有限公司 | 一种基于类脑存算一体的业务行为检测方法及装置 |
CN116229794A (zh) * | 2023-05-09 | 2023-06-06 | 国开启科量子技术(北京)有限公司 | 用于模拟量子算法的演示装置及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090164435A1 (en) * | 2007-12-20 | 2009-06-25 | Routt Thomas J | Methods and systems for quantum search, computation and memory |
WO2012046904A1 (ko) * | 2010-10-07 | 2012-04-12 | 한국과학기술정보연구원 | 다중 자원 기반 검색정보 제공 장치 및 방법 |
CN107679157A (zh) * | 2017-09-27 | 2018-02-09 | 杨建民 | 自动编码方法和系统 |
CN110457285A (zh) * | 2019-06-06 | 2019-11-15 | 福建奇点时空数字科技有限公司 | 一种基于直接映射标准的结构化信息数据映射方法 |
-
2021
- 2021-02-04 CN CN202110157814.6A patent/CN112819171B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090164435A1 (en) * | 2007-12-20 | 2009-06-25 | Routt Thomas J | Methods and systems for quantum search, computation and memory |
WO2012046904A1 (ko) * | 2010-10-07 | 2012-04-12 | 한국과학기술정보연구원 | 다중 자원 기반 검색정보 제공 장치 및 방법 |
CN107679157A (zh) * | 2017-09-27 | 2018-02-09 | 杨建民 | 自动编码方法和系统 |
CN110457285A (zh) * | 2019-06-06 | 2019-11-15 | 福建奇点时空数字科技有限公司 | 一种基于直接映射标准的结构化信息数据映射方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113238821A (zh) * | 2021-05-31 | 2021-08-10 | 深圳市商汤科技有限公司 | 数据处理的加速方法、装置、电子设备及存储介质 |
CN113239247A (zh) * | 2021-07-12 | 2021-08-10 | 深圳市永达电子信息股份有限公司 | 基于脑功能分区的多维数据搜索方法、系统和存储介质 |
CN113239247B (zh) * | 2021-07-12 | 2021-10-26 | 深圳市永达电子信息股份有限公司 | 基于脑功能分区的多维数据搜索方法、系统和存储介质 |
CN114048848A (zh) * | 2022-01-13 | 2022-02-15 | 深圳市永达电子信息股份有限公司 | 一种基于记忆机制的类脑计算方法和系统 |
CN114741426A (zh) * | 2022-06-08 | 2022-07-12 | 深圳市永达电子信息股份有限公司 | 一种基于类脑存算一体的业务行为检测方法及装置 |
CN114741426B (zh) * | 2022-06-08 | 2022-11-15 | 深圳市永达电子信息股份有限公司 | 一种基于类脑存算一体的业务行为检测方法及装置 |
CN116229794A (zh) * | 2023-05-09 | 2023-06-06 | 国开启科量子技术(北京)有限公司 | 用于模拟量子算法的演示装置及方法 |
CN116229794B (zh) * | 2023-05-09 | 2023-08-18 | 国开启科量子技术(北京)有限公司 | 用于模拟量子算法的演示装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112819171B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112819171B (zh) | 一种基于表函数的数据搜索方法、系统及计算机存储介质 | |
CN110084281B (zh) | 图像生成方法、神经网络的压缩方法及相关装置、设备 | |
Zhou et al. | Stacked extreme learning machines | |
Wang et al. | PC-GAIN: Pseudo-label conditional generative adversarial imputation networks for incomplete data | |
CN113658100B (zh) | 三维目标物体检测方法、装置、电子设备及存储介质 | |
CN107220506A (zh) | 基于深度卷积神经网络的乳腺癌风险评估分析系统 | |
Liu et al. | Broad learning system: Feature extraction based on K-means clustering algorithm | |
CN112905862A (zh) | 一种基于表函数的数据处理方法、装置以及计算机存储介质 | |
US20110293173A1 (en) | Object Detection Using Combinations of Relational Features in Images | |
CN114821169B (zh) | 微服务架构下的方法级无侵入调用链路追踪方法 | |
Han et al. | Generalizing long short-term memory network for deep learning from generic data | |
CN115423105A (zh) | 一种预训练语言模型构建方法、系统及装置 | |
JPWO2019167240A1 (ja) | 情報処理装置、制御方法、及びプログラム | |
Varlik et al. | Filtering airborne LIDAR data by using fully convolutional networks | |
CN113590691B (zh) | 目标对象处理方法以及装置 | |
CN111768214A (zh) | 产品属性的预测方法、系统、设备和存储介质 | |
CN114398980A (zh) | 跨模态哈希模型的训练方法、编码方法、装置及电子设备 | |
CN114726870A (zh) | 基于可视化拖拽的混合云资源编排方法、系统和电子设备 | |
Shi et al. | A scalable convolutional neural network for task-specified scenarios via knowledge distillation | |
Cheng et al. | Deepeye: A compact and accurate video comprehension at terminal devices compressed with quantization and tensorization | |
Du Plessis et al. | Reducing dimensionality of hyperspectral data with diffusion maps and clustering with k-means and Fuzzy ART | |
CN113239247A (zh) | 基于脑功能分区的多维数据搜索方法、系统和存储介质 | |
WO2015029158A1 (ja) | データ変換装置およびデータ変換方法ならびにデータ変換プログラム | |
Liu | Hardware-friendly model compression technique of DNN for edge computing | |
US11837000B1 (en) | OCR using 3-dimensional interpolation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |