CN113836332A - 存储设备 - Google Patents
存储设备 Download PDFInfo
- Publication number
- CN113836332A CN113836332A CN202111050484.7A CN202111050484A CN113836332A CN 113836332 A CN113836332 A CN 113836332A CN 202111050484 A CN202111050484 A CN 202111050484A CN 113836332 A CN113836332 A CN 113836332A
- Authority
- CN
- China
- Prior art keywords
- storage
- characteristic information
- information
- data
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 30
- 238000000034 method Methods 0.000 description 33
- 238000004364 calculation method Methods 0.000 description 16
- 238000013500 data storage Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/0647—Migration mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0679—Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
公开了一种存储设备,包括存储器和计算单元,其中,所述存储器用于存储至少一个存储对象的第一特征信息、每个存储对象对应的至少一份存储数据以及所述至少一份存储数据的存储信息,所述存储对象的第一特征信息与所述至少一份存储数据的存储信息相关联;所述计算单元用于获取检索数据的第二特征信息,根据所述第二特征信息与所述存储器中的第一特征信息的比较结果确定目标特征信息,并根据所述目标特征信息相关联的存储信息,得到所述存储信息对应的目标检索数据。所述存储设备可以实现以第一特征信息作为索引访问相应的存储数据,将所述存储对象的第一特征信息与存储数据存储在不同的区域,减少数据搬运、提升数据检索的速度。
Description
技术领域
本公开的实施方式涉及数据存储技术领域,更具体地,本公开的实施方式涉及一种存储设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在数据检索应用中,存储系统中所存储的待比对数据量通常是非常庞大的,例如进行人脸检索或者指纹检索等等。
传统的数据检索方式通常是通过CPU或处理芯片将存储系统中所包含的待比对数据依次搬运至内存中,将检索对象与待比对数据进行比较计算,以得到目标数据。然而这种方式中,数据搬运过程中消耗大量设备功耗,并且由于数据接口限制了搬运速度,使得检索效率难以提高。
发明内容
有鉴于此,本公开实施例至少提供一种存储设备,以在数据检索应用中减少数据搬运,提升检索效率。
在本公开提供了一种存储设备,包括存储器和计算单元,其中,所述存储器用于存储至少一个存储对象的第一特征信息、每个存储对象对应的至少一份存储数据以及所述至少一份存储数据的存储信息,其中,所述第一特征信息是对所述存储对象对应的至少一份存储数据进行特征提取得到的,所述存储对象的第一特征信息与所述至少一份存储数据的存储信息相关联;所述计算单元用于获取检索数据的第二特征信息,根据所述第二特征信息与所述存储器中的第一特征信息的比较结果确定目标特征信息,并根据所述目标特征信息相关联的存储信息,得到所述存储信息对应的目标检索数据。
在一些实施方式中,所述计算单元在用于根据所述第二特征信息与所述存储器中的第一特征信息的比较结果确定目标特征信息时,具体用于:将所述第二特征信息与所述存储器中的第一特征信息进行比较,确定与所述第二特征信息相似度最高的至少一个第一特征信息作为所述目标特征信息。
在一些实施方式中,所述存储器还用于在设定存储区域中存储所述第一特征信息,所述设定存储区域根据所述存储对象的第一特征信息划分多个存储块,其中,每个所述存储块对应于至少一个存储对象。
在一些实施方式中,所述多个存储块是基于目标排序结果对所述设定存储区域进行划分得到的,其中,所述目标排序结果是基于预设规则对所述设定存储区域中存储的多个存储对象的第一特征信息进行排序得到的。
在一些实施方式中,所述多个存储块是通过获取所述设定存储区域中存储的多个存储对象中,每两个存储对象之间的第一特征信息的相似度,并将相似度高于设定阈值的至少两个存储对象的第一特征信息存储至同一个存储块中得到的。
在一些实施方式中,所述计算单元还用于:将所述第二特征信息,与所述设定存储区域中各个存储块对应的第三特征信息进行比较,其中,所述存储块对应的第三特征信息根据所述存储块中存储的第一特征信息确定;确定与所述第二特征信息相似度最高的第三特征信息对应存储块,作为目标存储块;将所述第二特征信息与所述目标存储块中的第一特征信息进行比较,确定与所述第二特征相似度最高的至少一个特征信息作为目标特征信息。
在一些实施方式中,所述存储信息包括起始地址和存储长度,其中,所述存储长度根据所述存储对象对应的至少一份存储数据的大小确定。
在一些实施方式中,所述存储设备与第一处理设备连接,所述第一特征信息通过以下方式得到:所述第一处理设备利用预先训练的第一特征提取网络,对所述存储对象对应的其中一份存储数据进行特征提取,得到子特征信息,其中,所述第一特征提取网络设置在所述存储设备之外的存储装置中;根据所述存储对象对应的至少一份存储数据的子特征信息,得到所述存储对象的第一特征信息;将所述第一特征信息发送至所述存储设备。
在一些实施方式中,所述存储设备与第二处理设备连接,所述第二特征信息通过以下方式得到:所述第二处理设备利用预先训练的第二特征提取网络对所述检索数据进行特征提取,得到所述第二特征信息,其中,所述第二特征提取网络设置在所述存储设备之外的存储装置中;将所述第二特征信息发送至所述存储设备。
在一些实施方式中,所述存储设备与第三处理设备连接,所述存储设备还用于将所述目标检索数据发送到所述第三处理设备。
在本公开实施例中,存储设备包括存储器和计算单元,其中所述存储器用于存储至少一个存储对象的第一特征信息、每个存储对象对应的至少一份存储数据以及所述至少一份存储数据的存储信息,所述存储对象的第一特征信息与所述至少一份存储数据的存储信息相关联,所述计算单元用于获取检索数据的第二特征信息,根据所述第二特征信息与所述存储器中的第一特征信息的比较结果确定目标特征信息,并根据所述目标特征信息相关联的存储信息,得到所述存储信息对应的目标检索数据。所述存储设备可以用于实现以第一特征信息作为索引访问相应的存储数据,将所述存储对象的第一特征信息与存储数据存储在不同的区域,减少了数据搬运;并且通过利用设置在存储设备本地中的计算单元进行比对并获取目标检索数据,可以进一步减少数据搬运,提高检索速度。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示意性地示出了根据本公开实施方式提出的存储设备的结构示意图;
图2示意性地示出了根据本公开实施方式提出的数据存储系统的结构示意图;
图3A和图3B分别示意性地示出了根据本公开实施方式提出的固态硬盘的结构示意图;
图4A和图4B分别示意性地示出了根据本公开实施方式提出的闪存的结构示意图;
图5示意性地示出了根据本公开实施方式提出的双倍速率同步动态随机存储器的结构示意图;
图6示意性地示出了根据本公开实施方式的数据检索系统的结构示意图;
图7示意性地示出了根据本公开实施方式提出的数据存储方法的流程图;
图8示意性地示出了根据本公开实施方式提出的数据检索方法的流程图;
图9示意性地示出了根据本公开实施方式的数据存储装置的结构示意图;
图10示意性地示出了根据本公开实施方式的数据检索装置的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
在数据检索应用中,存储系统中所存储的待比对数据量通常是非常大的,例如进行人脸检索或者指纹检索等等,数据量可能在10G以上。
传统的数据检索方式通常是通过CPU或处理芯片将存储系统中的待比对数据依次搬运至内存中,将检索对象与待比对数据进行比较计算,以得到目标数据。例如,在以图搜图场景中,CPU或AI芯片需要将存储系统中的待比图像依次搬运至内存中,将检索图像与待比对图像进行比较计算,得到与所述检索图像对应的关联图像。例如,基于目标人物的照片、画像,从数据库中查找对应或相以的照片、属性信息等。
然而这种方式中,数据搬运过程中消耗大量设备功耗,并且由于数据接口限制了搬运速度,使得检索效率难以提高。
因此,本公开实施例提出了一种存储设备,旨在在数据检索应用中减少数据搬运以降低设备功耗、提升搜索效率。
图1示意性地示出了根据本公开实施方式提出的存储设备的结构示意图,如图1所示,存储设备100可以包括计算单元110和存储器120。
其中,存储器120用于存储至少一个存储对象的第一特征信息、每个存储对象对应的至少一份存储数据以及所述至少一份存储数据的存储信息。
在本公开实施例中,是以存储对象为单位进行数据存储的。所述存储对象可以包括人、动物、物体、虚拟对象等各种类型,本公开对于存储对象的具体类型不进行限制。
其中,所述第一特征信息是对所述存储对象对应的至少一份存储数据进行特征提取得到的。
例如,存储对象的存储数据可以是人的图像,每个人对应于一张或多张图像。通过对每个人对应的一张或多张图像进行特征提取,则可以得到该存储对象所对应的第一特征信息。
又例如,存储对象的存储数据可以是人的音频文件,每个人对应于一个或多个音频文件。通过对每个人对应的一个或多个音频文件进行特征提取,则可以得到该存储对象所对应的第一特征信息。
也即,在本公开实施例中,同一个存储对象的不同的存储数据,所对应的第一特征信息可以是相同的。例如,同一个人多张不同的图像,可以对应于相同的第一特征信息;又例如,同一个人穿不同衣服的图像,或者同一个人不同角度的图像,可以对应于相同的第一特征信息;再如,长相相似的多个人的图像,例如双胞胎或者多胞胎的图像,可以对应于相同的第一特征值。
在所述存储设备中,所述存储对象的第一特征信息与所述存储对象的至少一份存储数据的存储信息相关联,也即,在所述存储器中所存储的每一个存储对象对应着存储第一特征信息以及存储信息,该存储信息指示所述存储对象的存储数据的存储地址。
例如,在存储器中存储了一个人的多张图像的情况下,该存储器中存储了该人的多张图像的第一特征信息,并且所述第一特征信息与这多张图像的存储信息相关联。
通过将所述存储对象的第一特征信息与存储数据存储在不同的区域,同时又相关联,可以实现以所述第一特征信息作为索引来访问存储数据。在数据检索场景下,在存储设备为固态硬盘(Solid State Disk,SSD)或闪存(flash memory)的情况下,通过利用第一特征信息作为索引,可以基于本地AI计算单元筛选出部分存储数据搬运至内存中进行比较处理,再将经处理的部分存储数据发送至存储设备之外的CPU或AI芯片进行进一步比较处理,得到最终的检索结果;相较于将所有存储数据搬运至内存中进行比较处理,减少了数据搬运、降低了设备功耗。同时,将所述存储对象的第一特征信息与存储数据存储在不同的区域,又能够实现第一特征信息与存储数据的分离,使得所述第一特征信息的变化不影响所述存储数据。
举例来说,在用于获取所述存储对象的第一特征信息的方法发生变化的情况下,比如特征提取算法进行了改进,使得第一特征信息中所包含的特征图尺寸增加,然而由于第一特征信息与存储数据是分开存储的,所以实际存储的数据并不会产生变动。
在进行数据检索的场景下,计算单元110用于获取检索数据的第二特征信息,根据所述第二特征信息与所述存储器中的第一特征信息的比较结果确定目标特征信息,并根据所述目标特征信息相关联的存储信息,得到所述存储信息对应的目标检索数据。
其中,可以通过计算所述第一特征信息与所述第二特征信息之间的相似度,也即计算所述第一特征信息对应的特征向量与所述第二特征信息对应的特征向量之间的欧氏距离,来进行比较,并根据比较结果确定所述目标特征信息。
在本公开实施例中,存储设备包括存储器和计算单元,其中所述存储器用于存储至少一个存储对象的第一特征信息、每个存储对象对应的至少一份存储数据以及所述至少一份存储数据的存储信息,所述存储对象的第一特征信息与所述至少一份存储数据的存储信息相关联,所述计算单元用于获取检索数据的第二特征信息,根据所述第二特征信息与所述存储器中的第一特征信息的比较结果确定目标特征信息,并根据所述目标特征信息相关联的存储信息,得到所述存储信息对应的目标检索数据。
所述存储设备可以用于实现以第一特征信息作为索引访问相应的存储数据,将所述存储对象的第一特征信息与存储数据存储在不同的区域,减少了数据搬运;并且通过利用设置在存储设备本地中的计算单元进行比对并获取目标检索数据,可以进一步减少数据搬运,提高检索速度。
在一些实施例中,可以将所述第二特征信息与所述存储器中的第一特征信息进行比较,确定与所述第二特征信息相似度最高的至少一个第一特征信息作为所述目标特征信息。
在一些实施例中,所述存储对象的第一特征信息可以存储在存储器的设定存储区域中。例如,可以将所述存储器中一设定地址段作为设定存储区域,以用于存储所述存储对象的第一特征信息。也即,对于所获取的多个存储对象的第一特征信息,将这些存储对象的第一特征信息共同存储在所述设定存储区域中。
所述存储对象对应的至少一份存储数据可以存储在所述设定存储区域以外的区域。所述存储数据的存储信息,包括所述存储对象对应的至少一个存储数据所存储的起始地址以及存储长度。其中,所述存储长度根据所述存储对象对应的至少一份存储数据的大小确定。
在一些实施方式中,可以根据所述存储对象的第一特征信息,将所述存储器的设定存储区域划分为多个存储块,以实现对所述设定存储区域的区域划分,其中,每个所述存储块对应于至少一个存储对象。
其中,可以以多层级的方式对所述设定存储区域进行区域划分。例如,在所述存储器的设定存储区域中存储了多个存储对象的第一特征信息的情况下,可以将所述多个存储对象中一个或多个划分至同一个存储块中,得到第一层级的多个存储块。在所述第一层级的任一存储块中仍包含多个存储对象的情况下,还可以依据相似的方式进一步进行划分,得到第二层级的多个存储块,以此类推。
在一个示例中,可以通过以下方式对所述设定存储区域进行区域划分。
首先,基于预设规则,对所述设定存储区域中存储的多个存储对象的第一特征信息进行排序。
所述预设规则可以是根据存储对象自身的特征设置的。例如,在所述存储器中存储了多个人的图像时,可以根据人的年龄进行排序。举例来说,年龄越小的人对应的第一特征信息,则存储在越靠前。
还可以根据其他的规则来进行排序,例如,可以根据第一特征信息被查找的次数进行排序。举例来说,一个存储对象的第一特征信息被查找的次数越多,则所述存储对象的第一特征信息排列越靠前。那么在应用于数据检索场景时,该第一特征信息会更早被进行比对。
接下来,根据排序结果将存储器的设定存储划分为多个存储块。
对于排序结果相近的第一特征信息,可以将其存储在相同的存储块中。例如,在所述设定存储区域包括多个存储对象的第一特征信息的情况下,可以根据第一特征信息的排序结果,将每n个存储对象的第一特征信息存储在相同的存储块中。
在本公开实施例中,通过根据第一特征信息的排序结果对设定存储区域进行区域划分,可以使第一特征信息排名相近的存储对象存储在相同的数据块中。
在一些实施方式中,还可以根据以下方式对所述设定存储区域进行区域划分。
首先,获取所述设定存储区域中存储的多个存储对象中,每两个存储对象之间的第一特征信息的相似度。
其中,两个存储对象之间的第一特征信息的相似度,可以根据两个第一特征信息对应的特征向量之间的欧氏距离来确定,也可以利用其他方式进行计算,本公开对于相似度的计算方式不进行限定。
接下来,将相似度高于设定阈值的至少两个存储对象的第一特征信息存储至同一个存储块中。
其中,对于存储在同一个存储块中的存储对象,可以是每两个存储对象之间的第一特征信息的相似度都高于所述设定阈值,或者可以是其中一个存储对象与至少一个其他存储对象之间的第一特征信息的相似度高于所述设定阈值。
在本公开实施例中,通过根据存储对象之间的第一特征信息的相似度来进行区域划分,可以使第一特征信息相近的存储对象存储在相同的数据块中。
图2示意性地示出了根据本公开实施例方式的存储设备的存储方法示意图,如图2所示,存储器中的设定存储区域20中存储有多个存储对象的第一特征信息,以及各个存储对象的存储数据,并且所述存储对象的第一特征信息与所述对象的存储数据的存储信息相关联。其中,存储对象1的第一特征信息为特征值1,所述存储对象1的存储数据为图片1,且特征值1与图片1的存储地址1相关联;存储对象2的第一特征信息为特征值2,所述存储对象2的存储数据为图片2a和图片2b,且特征值2与图片2a和图片2b的存储地址2相关联;存储对象3的第一特征信息为特征值3,所述存储对象3的存储数据为图片3,且特征值3与图片3的存储地址3相关联。设定存储区域20被划分为多个存储块,也可以称为特征值块,如图2所示,存储对象1的特征值1存储在特征值块A中,存储对象2的特征值2以及存储对象3的特征值3共同存储在特征值块B中。
在一些实施例中,可以通过以下方法获得所述存储对象的第一特征信息。
首先,利用预先训练的第一特征提取网络,对所述存储对象对应的其中一份存储数据进行特征提取,得到子特征信息。
以所述存储数据为图像为例,可以利用例如卷积神经网络来提取所述图像的子特征信息。
之后,根据所述存储对象对应的至少一份存储数据的子特征信息,得到所述存储对象的第一特征信息。
例如,可以通过将各个存储数据的子特征信息进行级联的方式,得到所述存储对象的第一特征信息;又例如,可以通过将各个存储数据的子特征信息进行平均,或者平均加权的方式,得到所述存储对象的第一特征信息。
在所述存储设备用于存储AI数据的情况下,所述存储设备的计算单元是具有AI计算能力的AI计算单元。
在所述存储设备为固态硬盘(Solid State Disk,SSD)的情况下,所述AI计算单元可以设置在所述控制器中,如图3A所示;还可以设置在所述存储单元中,并与所述控制器连接,如图3B所示。
在所述存储设备为闪存(flash memory)的情况下,所述AI计算单元可以直接与存储器、控制器连接,如图4A所示;还可以设置为通过所述控制器与存储器连接,如图4B所示。
在所述存储器为双倍速率(Double DataRate,DDR)同步动态随机存储器的情况下,所述AI计算单元可以直接与存储器、控制器连接,如图5所示。
在一些实施方式中,在所述存储器的设定存储区域根据所述存储对象的第一特征信息划分多个存储块的情况下,计算单元110可以通过以下方式进行第二特征信息与第一特征信息的比较。
首先,将所述第二特征信息,与所述设定存储区域中各个存储块对应的第三特征信息进行比较。
其中,所述存储块对应的第三特征信息根据所述存储块中存储的第一特征信息确定。例如,可以通过对所述存储块中所存储的多个第一特征信息进行平均,得到所述第三特征信息。
接下来,确定与所述第二特征信息相似度最高的至少一个第三特征信息对应存储块,作为目标存储块。也即确定了在各个存储块中,所存储的存储对象与检索数据最相似的存储块。
最后,将所述第二特征信息与所述目标存储块中的第一特征信息进行比较。
通过在与所述检索数据的第二特征信息最为接近的一个或多个存储块中,进一步进行第二特征信息的比较,可以缩小进行比较的范围,减少了处理的数据量,提高检索速度。
以下以以图搜图场景为例,对本公开实施例提出的数据检索方法进行说明。所述方法所应用的系统构架如图6所示,所述存储设备包括AI计算单元以及存储器,其中,所述存储器中的数据存储方式可以参见针对图2进行的描述,此时不再赘述;AI计算单元与所述存储设备外部的CPU或AI芯片连接,可以获取CPU或AI芯片进行处理后的数据。
首先,利用CPU或AI芯片对所述检索图像进行特征提取,得到设定大小的特征数据作为搜索图像的目标特征值。例如,可以得到1*512的特征数据,或2*512的特征数据作为目标特征值。
接下来,将所述特征值发送至所述存储设备。所述存储设备可以是在内部设置AI计算单元的DDR、SSD、闪存等。
所述计算单元在接收到所述目标特征值后,将所述目标特征值与所述设定存储区域中存储的多个特征值进行一一比较,确定最接近的一个或多个特征值,并将这些特征值所对应的存储数据,发送至所述存储设备外部的CPU、AI芯片、显示设备等。
或者,所述AI计算单元在接收到目标特征值后,将所述目标特征值与各个特征值块进行一一比较,在确定最接近的一个特征值块后,在所述特征值块中进一步进行比较,以确定最接近的一个或多个特征值。
如图6所示,在所述AI计算单元确定与目标特征值最接近的特征值块为特征值块B的情况下,可以不再对特征值块A中进行检索,而是将目标特征值与特征值块B中的特征值一一进行比较,以确定最接近的一个或多个特征值。例如,在特征值2是最接收的一个特征值的情况下,则获取所述特征值2相关联的图片2a和图片2b,并将图片2a和图片2b发送至CPU、AI芯片、显示设备等。
CPU或AI芯片可以进一步对目标检索数据进行比对,以确定最终的目标数据,通过只比对存储设备确定的数据,减少了CPU或AI芯片的计算消耗;显示设备可以直接对目标检索数据进行显示,以由用户自行确定最终的目标数据。
图7示意性地示出了根据本公开实施方式的一种数据存储方法的流程。如图7所示,该方法可以包括步骤701~704。
在步骤701中,获得存储对象的第一特征信息。
其中,所述第一特征信息是对所述存储对象对应的至少一份存储数据进行特征提取得到的。
在步骤702中,将所述存储对象的第一特征信息存储在存储器的设定存储区域中。
在步骤703中,将所述存储对象对应的至少一份存储数据存储在所述存储器中,并获取所述至少一份存储数据的存储信息。
在步骤704中,将所述存储对象的第一特征信息与所述至少一份存储数据的存储信息相关联。
在本公开实施例中,获得存储对象的第一特征信息,将所述存储对象的第一特征信息存储在存储器的设定存储区域中;将所述存储对象对应的至少一份存储数据存储在所述存储器中,并获取所述至少一份存储数据的存储信息;将所述存储对象的第一特征信息与所述至少一份存储数据的存储信息相关联。通过上述存储方式,可以实现以第一特征信息作为索引访问相应的存储数据,避免了将全部存储数据搬运至内存中进行比较处理,减少数据搬运、提升数据检索的速度。
图8示意性地示出了根据本公开实施方式的数据检索方法的流程图,所述方法应用于图1所示的存储设备中的计算单元。所述方法可以包括步骤801~804。
在步骤801中,获取检索数据的第二特征信息。
在本步骤中,可以利用所述存储设备之外的CPU或AI处理芯片对所述检索数据进行特征提取。与存储对象的存储数据相似,所述检索数据可以包括图像、音频文件等。例如,在以图搜图的场景下,可以利用预先训练的第二特征提取网络对所述检索图像进行特征提取。其中,所述第二特征提取网络可以与所述第一特征提取网络相同是同一个网络,也可以是不同的网络。
在步骤802中,将所述第二特征信息,与所述存储器中的设定存储区域中的第一特征信息进行比较。
其中,所述第一特征信息是对存储对象对应的至少一份存储数据进行特征提取得到的,所述存储器中还存储有所述存储对象对应的至少一份存储数据,所述第一特征信息与所述至少一份存储数据的存储信息相关联。
在步骤803中,确定与所述第二特征信息相似度最高的至少一个第一特征信息作为目标特征信息。也即确定出与所述检索图像最相似的一个或多个存储对象。
在步骤804中,根据所述目标特征信息相关联的存储信息,得到所述存储信息指示的存储地址中的目标检索数据。
在本公开实施例中,通过将所述检索数据的第二特征信息与所述设定存储区域中的第一特征信息进行比较,以相似度最高的第一特征信息作为索引,获取相关联的存储地址中的目标检索数据,相较于将第一检索对象的数据直接与第一对象的存储数据进行一一比对,在所述存储设备中进行大规模检索,减少了处理的数据量,提高了检索速度;并且,通过利用设置在存储设备本地中的AI计算单元进行比对并获取目标检索数据,可以减少数据搬运,进一步提高检索速度。
为了实现本公开任一实施例的数据存储方法,本公开实施例还提供了一种数据存储装置。
图9示意性地示出了根据本公开一实施例的数据存储装置的结构示意图,例如,该装置可以应用于电子设备。如下的描述中,将简单描述该装置的各个模块的功能,其详细的处理可以结合参见前述的本公开任一实施例的数据存储方法的描述。
如图9所示,所述数据存储装置包括:第一获取单元901,用于获得存储对象的第一特征信息,其中,所述第一特征信息是对所述存储对象对应的至少一份存储数据进行特征提取得到的;存储单元902,用于将所述存储对象的第一特征信息存储在存储器的设定存储区域中;第二获取单元903,用于将所述存储对象对应的至少一份存储数据存储在所述存储器中,并获取所述至少一份存储数据的存储信息;关联单元904,用于将所述存储对象的第一特征信息与所述至少一份存储数据的存储信息相关联。
在一些实施方式中,所述装置还包括划分单元,用于根据所述存储对象的第一特征信息,将所述存储器的设定存储区域划分多个存储块,其中,每个所述存储块对应于至少一个存储对象。
在一些实施方式中,所述划分单元在用于根据所述存储对象的第一特征信息,将所述存储器的设定存储区域划分多个存储块时,具体用于:基于预设规则,对所述设定存储区域中存储的多个存储对象的第一特征信息进行排序;根据排序结果将存储器的设定存储划分为多个存储块。
在一些实施方式中,所述划分单元在用于根据所述存储对象的第一特征信息,将所述存储器的设定存储区域划分多个存储块时,具体用于:获取所述设定存储区域中存储的多个存储对象中,每两个存储对象之间的第一特征信息的相似度;将相似度高于设定阈值的至少两个存储对象的第一特征信息存储至同一个存储块中。
在一些实施方式中,所述装置还包括特征提取单元,用于利用预先训练的第一特征提取网络,对所述存储对象对应的其中一份存储数据进行特征提取,得到子特征信息;根据所述存储对象对应的至少一份存储数据的子特征信息,得到所述存储对象的第一特征信息。
在一些实施方式中,所述存储信息包括起始地址和存储长度,其中,所述存储长度根据所述存储对象对应的至少一份存储数据的大小确定。
为了实现本公开任一实施例的检索方法,本公开实施例还提供了一种数据检索装置。图10示意性地示出了根据本公开一实施例的数据检索装置的结构示意图,例如,该装置可以应用于电子设备。如下的描述中,将简单描述该装置的各个模块的功能,其详细的处理可以结合参见前述的本公开任一实施例的数据存储方法的描述。
如图10所示,所述数据检索装置包括:第三获取单元,用于获取检索数据的第二特征信息;比较单元,用于将所述第二特征信息,与所述存储器中的设定存储区域中的第一特征信息进行比较,其中,所述第一特征信息是对存储对象对应的至少一份存储数据进行特征提取得到的,所述存储器中还存储有所述存储对象对应的至少一份存储数据,所述第一特征信息与所述至少一份存储数据的存储信息相关联;确定单元,用于确定与所述第二特征信息相似度最高的至少一个第一特征信息作为目标特征信息;得到单元,用于根据所述目标特征信息相关联的存储信息,得到所述存储信息指示的存储地址中的目标检索数据。
在一些实施方式中,所述装置还包括第一发送单元,用于使第一处理设备利用预先训练的第二特征提取网络对所述检索数据进行特征提取,得到所述第二特征信息;将所述第二特征信息发送至所述存储设备。
在一些实施方式中,所述存储器的设定存储区域根据所述存储对象的第一特征信息划分多个存储块,其中,每个所述存储块对应于至少一个存储对象;所述比较单元用于:将所述第二特征信息,与所述设定存储区域中各个存储块对应的第三特征信息进行比较,其中,所述存储块对应的第三特征信息根据所述存储块中存储的第一特征信息确定;确定与所述第二特征信息相似度最高的第三特征信息对应存储块,作为目标存储块;将所述第二特征信息与所述目标存储块中的第一特征信息进行比较。
在一些实施方式中,所述装置还包括第二发送单元,用于使所述存储设备将所述目标检索数据发送到第二处理设备。
本说明书至少一个实施例还提供了一种电子设备,包括存储器和处理器,所述存储器用于存储可在所述处理器上运行的计算机指令,所述处理器用于执行所述计算机指令以实现本说明书任一实施例所述的数据检索方法。
本说明书至少一个实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本说明书任一实施例所述的数据检索方法。
应当注意,尽管在上文详细描述中提及了数据存储装置和数据检索装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
本领域技术人员应明白,本说明书一个或多个实施例可提供为方法、设备或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于数据信息处理装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的行为或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中描述的主题及功能操作的实施例可以在以下中实现:数字电子电路、有形体现的计算机软件或固件、包括本说明书中公开的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本说明书中描述的主题的实施例可以实现为一个或多个计算机程序,即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或它们中的一个或多个的组合。
本说明书中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程计算机执行,以通过根据输入数据进行操作并生成输出来执行相应的功能。所述处理及逻辑流程还可以由专用逻辑电路—例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)来执行,并且装置也可以实现为专用逻辑电路。
适合用于执行计算机程序的计算机包括,例如通用和/或专用微处理器,或任何其他类型的中央处理单元。通常,中央处理单元将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件包括用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘等,或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据,抑或两种情况兼而有之。然而,计算机不是必须具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏操纵台、全球定位设备(GPS)接收机、或例如通用串行总线(USB)闪存驱动器的便携式存储设备,仅举几例。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。
虽然本说明书包含许多具体实施细节,但是这些不应被解释为限制任何发明的范围或所要求保护的范围,而是主要用于描述特定发明的具体实施例的特征。本说明书内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种设备模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和设备通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。
Claims (10)
1.一种存储设备,其特征在于,包括存储器和计算单元,其中,
所述存储器用于存储至少一个存储对象的第一特征信息、每个存储对象对应的至少一份存储数据以及所述至少一份存储数据的存储信息,其中,所述第一特征信息是对所述存储对象对应的至少一份存储数据进行特征提取得到的,所述存储对象的第一特征信息与所述至少一份存储数据的存储信息相关联;
所述计算单元用于获取检索数据的第二特征信息,根据所述第二特征信息与所述存储器中的第一特征信息的比较结果确定目标特征信息,并根据所述目标特征信息相关联的存储信息,得到所述存储信息对应的目标检索数据。
2.根据权利要求1所述的设备,其特征在于,所述计算单元在用于根据所述第二特征信息与所述存储器中的第一特征信息的比较结果确定目标特征信息时,具体用于:
将所述第二特征信息与所述存储器中的第一特征信息进行比较,确定与所述第二特征信息相似度最高的至少一个第一特征信息作为所述目标特征信息。
3.根据权利要求1所述的设备,其特征在于,所述存储器还用于在设定存储区域中存储所述第一特征信息,所述设定存储区域根据所述存储对象的第一特征信息划分多个存储块,其中,每个所述存储块对应于至少一个存储对象。
4.根据权利要求3所述的设备,其特征在于,所述多个存储块是基于目标排序结果对所述设定存储区域进行划分得到的,其中,所述目标排序结果是基于预设规则对所述设定存储区域中存储的多个存储对象的第一特征信息进行排序得到的。
5.根据权利要求3所述的设备,其特征在于,所述多个存储块是通过获取所述设定存储区域中存储的多个存储对象中,每两个存储对象之间的第一特征信息的相似度,并将相似度高于设定阈值的至少两个存储对象的第一特征信息存储至同一个存储块中得到的。
6.根据权利要求5所述的设备,其特征在于,所述计算单元还用于:
将所述第二特征信息,与所述设定存储区域中各个存储块对应的第三特征信息进行比较,其中,所述存储块对应的第三特征信息根据所述存储块中存储的第一特征信息确定;
确定与所述第二特征信息相似度最高的第三特征信息对应存储块,作为目标存储块;
将所述第二特征信息与所述目标存储块中的第一特征信息进行比较,确定与所述第二特征相似度最高的至少一个特征信息作为目标特征信息。
7.根据权利要求1至6任一项所述的设备,其特征在于,所述存储信息包括起始地址和存储长度,其中,所述存储长度根据所述存储对象对应的至少一份存储数据的大小确定。
8.根据权利要求1至6任一项所述的设备,其特征在于,所述存储设备与第一处理设备连接,所述第一特征信息通过以下方式得到:
所述第一处理设备利用预先训练的第一特征提取网络,对所述存储对象对应的其中一份存储数据进行特征提取,得到子特征信息,其中,所述第一特征提取网络设置在所述存储设备之外的存储装置中;
根据所述存储对象对应的至少一份存储数据的子特征信息,得到所述存储对象的第一特征信息;
将所述第一特征信息发送至所述存储设备。
9.根据权利要求1至6任一项所述的设备,其特征在于,所述存储设备与第二处理设备连接,所述第二特征信息通过以下方式得到:
所述第二处理设备利用预先训练的第二特征提取网络对所述检索数据进行特征提取,得到所述第二特征信息,其中,所述第二特征提取网络设置在所述存储设备之外的存储装置中;
将所述第二特征信息发送至所述存储设备。
10.根据权利要求1至6任一项所述的设备,其特征在于,所述存储设备与第三处理设备连接,所述存储设备还用于将所述目标检索数据发送到所述第三处理设备。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111050484.7A CN113836332A (zh) | 2021-09-08 | 2021-09-08 | 存储设备 |
PCT/CN2022/115723 WO2023036009A1 (zh) | 2021-09-08 | 2022-08-30 | 计算系统、存储设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111050484.7A CN113836332A (zh) | 2021-09-08 | 2021-09-08 | 存储设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113836332A true CN113836332A (zh) | 2021-12-24 |
Family
ID=78958796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111050484.7A Pending CN113836332A (zh) | 2021-09-08 | 2021-09-08 | 存储设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113836332A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023036009A1 (zh) * | 2021-09-08 | 2023-03-16 | 北京灵汐科技有限公司 | 计算系统、存储设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111224793A (zh) * | 2018-11-27 | 2020-06-02 | 华为技术有限公司 | 数据存储方法、装置、计算机设备及可读存储介质 |
CN111611418A (zh) * | 2019-02-25 | 2020-09-01 | 阿里巴巴集团控股有限公司 | 数据存储方法及数据查询方法 |
-
2021
- 2021-09-08 CN CN202111050484.7A patent/CN113836332A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111224793A (zh) * | 2018-11-27 | 2020-06-02 | 华为技术有限公司 | 数据存储方法、装置、计算机设备及可读存储介质 |
CN111611418A (zh) * | 2019-02-25 | 2020-09-01 | 阿里巴巴集团控股有限公司 | 数据存储方法及数据查询方法 |
Non-Patent Citations (1)
Title |
---|
崔奇明主编: "大数据概论", 30 September 2016, 东北大学出版社, pages: 33 - 34 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023036009A1 (zh) * | 2021-09-08 | 2023-03-16 | 北京灵汐科技有限公司 | 计算系统、存储设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11132575B2 (en) | Combinatorial shape regression for face alignment in images | |
WO2019137216A1 (zh) | 一种图像筛选方法及装置 | |
KR101889451B1 (ko) | 트레이닝 데이터를 위한 가중치 이득 평가기 | |
US20130254191A1 (en) | Systems and methods for mobile search using bag of hash bits and boundary reranking | |
CN106557521B (zh) | 对象索引方法、对象搜索方法及对象索引系统 | |
US9613287B2 (en) | Local feature descriptor extracting apparatus, method for extracting local feature descriptor, and program | |
CN108875487B (zh) | 行人重识别网络的训练及基于其的行人重识别 | |
CN109165307B (zh) | 一种特征检索方法、装置和存储介质 | |
CN109902547B (zh) | 动作识别方法和装置 | |
CN108804617B (zh) | 领域术语抽取方法、装置、终端设备及存储介质 | |
CN104731882B (zh) | 一种基于哈希编码加权排序的自适应查询方法 | |
TWI747114B (zh) | 圖像特徵提取及網路的訓練方法、電子設備和電腦可讀儲存媒體 | |
JP2015079308A (ja) | 認識システム | |
US20200175259A1 (en) | Face recognition method and apparatus capable of face search using vector | |
US20220139085A1 (en) | Method and apparatus for video frame processing | |
CN111626340A (zh) | 一种分类方法、装置、终端及计算机存储介质 | |
CN110909817B (zh) | 分布式聚类方法及系统、处理器、电子设备及存储介质 | |
CN113836332A (zh) | 存储设备 | |
CN113849454A (zh) | 计算系统 | |
Yin et al. | A configurable parallel hardware architecture for efficient integral histogram image computing | |
CN113343033B (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
CN115713769A (zh) | 文本检测模型的训练方法、装置、计算机设备和存储介质 | |
CN112989093A (zh) | 检索方法、装置和电子设备 | |
CN114566160A (zh) | 语音处理方法、装置、计算机设备、存储介质 | |
CN113836077A (zh) | 众核设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |