CN105900085A - 具备信息检索功能的存储器及其利用方法、装置、信息处理方法 - Google Patents

具备信息检索功能的存储器及其利用方法、装置、信息处理方法 Download PDF

Info

Publication number
CN105900085A
CN105900085A CN201480070692.5A CN201480070692A CN105900085A CN 105900085 A CN105900085 A CN 105900085A CN 201480070692 A CN201480070692 A CN 201480070692A CN 105900085 A CN105900085 A CN 105900085A
Authority
CN
China
Prior art keywords
memorizer
information
logic
logical
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480070692.5A
Other languages
English (en)
Other versions
CN105900085B (zh
Inventor
井上克己
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN105900085A publication Critical patent/CN105900085A/zh
Application granted granted Critical
Publication of CN105900085B publication Critical patent/CN105900085B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90339Query processing by using parallel associative memories or content-addressable memories
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C15/00Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C15/00Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores
    • G11C15/04Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores using semiconductor elements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • G11C7/10Input/output [I/O] data interface arrangements, e.g. I/O data control circuits, I/O data buffers
    • G11C7/1006Data managing, e.g. manipulating data before writing or reading out, data bus switches or control circuits therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C15/00Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores
    • G11C15/04Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores using semiconductor elements
    • G11C15/043Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores using semiconductor elements using capacitive charge storage elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Memory System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

CPU不擅长对存储器上的信息进行搜索的处理,而擅长对信息进行搜索的相联存储器(CAM)难以构建能够应对大数据的大容量的存储器。通过在一般的存储器中加入电路规模极小的1比特并行逻辑运算器,从而使大容量存储器变身为具有与相联存储器(CAM)匹敌的信息检索能力的能动型的存储器,通过该存储器,能够实现完全并行检索的超高速内存数据库。

Description

具备信息检索功能的存储器及其利用方法、装置、信息处理方法
技术领域
本发明涉及一种具备信息检索功能的存储器及其利用方法、装置、信息处理方法。
背景技术
进入了能够利用低价格且大容量的半导体存储器的时代,内存数据库(In-Memory Database)技术作为对大数据高速地进行处理的技术而备受瞩目。其中之一是数据挖掘等使大量的数据常驻于半导体存储器(内存数据库),加速数据的访问而高速地搜索出目的信息的技术。但是,通过使信息数据从硬盘装置常驻于半导体存储器,是能够期待1个数量级至2个数量级程度的加速的程度。
在从本质上思考大数据的灵活运用的情况下,当前的罗曼型计算机的课题需要事先予以明确。
由于当前的计算机是由CPU进行所有信息处理的计算机,因此CPU不得不全盘接管CPU所擅长的处理以及不擅长的处理。例如,对于CPU来说,存储器上的数据仿佛是翻转后的扑克牌那样的存在,只能一张一张(1个地址、1个地址)地进行排查(访问)而对信息进行搜索。在CPU进行对存储器上的信息依次进行检索而搜索出特定的信息这种信息处理的情况下,信息处理量极大,等待时间增多。这就是罗曼型计算机的宿命、即总线瓶颈。
虽然利用硬件解决上述课题的是CPU的并行处理(分散处理),但是存在如下课题,即,周边电路变得复杂,系统臃肿化。
基于上述背景,当前,为了减轻具有总线瓶颈的当前的计算机的CPU的负担、减少信息处理的次数,不断提出并利用各种应用技术(软件算法)。
例如,作为为了搜索出信息而利用的代表性的算法,存在哈希表(Hash table)、索引(index)、树构造、二分查找(binary search)、聚类(clustering),另外,如果考虑它们的组合等,则存在无数的算法。这些应用技术(软件算法)只是用于减轻CPU的负担、减少信息处理的次数的方法、使背负着宿命而诞生的CPU灵活运用的应用技术。即,上述算法均是如下等方法,即,事先对在存储器上何处存在怎样的信息进行整理,创建CPU容易查找信息的标题及其路径,以从小到大的顺序秩序井然地对数据进行排列。
根据上述算法,虽然能够消除检索时CPU的负担,但是在前处理、后处理中不得不进行复杂的信息处理,例如以数据的插入、删除为代表,每当追加或者删除信息数据时,需要数组的排序、顺序的变更等用于上述算法的前处理、后处理的信息处理。
另外,对于以上的软件算法,需要根据数据库的种类、规模选择几个适当的软件算法而构建最优化系统,除了具有知识和经验的专业人士以外不能胜任。
由于当前的计算机由CPU进行所有的信息处理,因此虽然存在以上的宿命,但是如果改变思路,能够使存储器自身搜索出特定的信息,则以上的信息处理会完全改变。
以往,相联存储器(CAM)作为消除以上课题的技术而存在。但是,相联存储器(CAM)存在如下课题,即,需要完全并行的比较电路,电路尺寸大型化,而且构成比较电路的并行电路消耗大电流。因此,当前相联存储器(CAM)不过是限定地利用于如通信路由器那样超高速检索不可或缺的特殊的领域。
本发明就是鉴于上述情况而提出的,其目的在于实现具有如下新思路的存储器,即,在一般的存储器中仅加入极少量的电路,以与相联存储器(CAM)匹敌的速度实现大数据的检索。
为了实现该目的,本发明人进行了各种发明。例如,由本发明人所作出的日本发明专利第4588114号具备信息筛选检测功能的存储器是擅长模式匹配等逻辑与运算的存储器。另外PCT/JP2013/059260号具备集合运算功能的存储器是扩大发展了具有以上信息筛选检测功能的存储器的概念,能够自由地进行逻辑与运算、逻辑或运算、逻辑非运算等的存储器。通过该参照,将该2份申请的公开内容作为整体而包含于本发明书的公开内容中。
本发明的存储器101能够应用于以上两个在先发明。
另外,日本特愿平10-232531号、带运算功能的存储器是如图所示按照模块单位设置运算电路、以匹配效率的提高为目的的存储器。与在所有存储器均分别具有运算电路相比,虽然运算电路的尺寸变小,但存在运算效率变差、而且匹配的效率差、成本上的问题。
另外,其他专利文献的具有运算功能的存储器也是同样的,未发现如本发明那样仅通过最小结构的1组运算功能对存储器内的数据并行地进行信息处理的在先申请。
发明内容
本发明从根本上消除由CPU进行的信息处理的最大课题,即,信息检索、也就是信息处理变得复杂、除专业人士以外不能胜任、而且CPU的负担大、周边电路也复杂化而消耗电力大的情况,实现具有如下信息检索功能的存储器,即,该信息检索功能基于还能够利用于大数据的、全新的信息处理的思路。
具体地说,提供如下在以往的信息处理的概念中没有的新概念的存储器元件,即,灵活运用能够进行并行信息检索的相联存储器(CAM)的思路,抑制相联存储器(CAM)的课题、即电路尺寸、消耗电力的增大,还能够应对大数据。
为了解决上述课题,根据本发明的主要观点,提供以下方案。
在技术方案1中,
一种具有信息检索功能的存储器,其能够进行信息的读取、写入,该具有信息检索功能的存储器的特征在于,
(1)该存储器作为1个字的比特宽度为n且N个字地址、即N×n比特的存储单元构造,
(2)在该存储器整体中1组n个比特的逻辑运算器具备如下功能,即:
(3)将从所述N个字地址中反复选择指定的所述1个字的比特宽度为n的存储单元信息并行地输入(代入)至所述1组n个比特的所述逻辑运算器而进行逻辑运算;以及
(4)输出所述逻辑运算器的内容。
在技术方案2中,
根据技术方案1所记载的具有信息检索功能的存储器,其特征在于,
所述逻辑运算器是如下结构,即,能够实现针对所述输入(代入)的所述1个字的比特宽度为n的存储器存储单元信息彼此的每一比特的逻辑存储、逻辑与、逻辑或、逻辑非、互斥逻辑及其任意的组合运算。
在技术方案3中,
根据技术方案1所记载的具有信息检索功能的存储器,其特征在于,
所述逻辑运算器具备移位寄存器功能。
在技术方案4中,
根据技术方案1所记载的具有信息检索功能的存储器,其特征在于,
通过所述逻辑存储、逻辑与、逻辑或、逻辑非、互斥逻辑及其任意的组合运算,从而进行数据值的完全一致以及数据值的范围检索。
在技术方案5中,
根据技术方案1所记载的具有信息检索功能的存储器,其特征在于,
通过所述逻辑存储、逻辑与、逻辑或、逻辑非、互斥逻辑及其任意的组合运算,从而进行数据值的加减运算。
在技术方案6中,
根据技术方案1所记载的具有信息检索功能的存储器,其特征在于,
与CPU等其他种类的半导体器件一体化。
在技术方案7中,
根据技术方案1所记载的具有信息检索功能的存储器,其特征在于,
安装于FPGA。
在技术方案8中,
技术方案1所记载的具有信息检索功能的存储器的使用方法,其特征在于,
构成为如下数据库,即,将数据库的记录分配给所述1个字的比特宽度为n的某一列,将1条记录的字段总比特数设为所述字地址数N。
在技术方案9中,
技术方案1所记载的具有信息检索功能的存储器的使用方法,其特征在于,
将所述具有信息检索功能的存储器以(1)或者(2)的连接进行使用,
(1)串行、并行、或者串并行连接
(2)阶层式连接。
在技术方案10中,
一种装置,其中,
包含权利要求1所记载的存储器。
在技术方案11中,
一种信息处理方法,其特征在于,
在存储器内部反复进行存储器存储单元信息的1个比特彼此的信息的逻辑与、逻辑或、逻辑非、互斥逻辑、及其组合的逻辑运算而得到规定的运算结果。
在技术方案12中,
根据技术方案11所记载的信息处理方法,其特征在于,
对所述1个比特彼此的信息并行地进行所述逻辑运算。
附图说明
图1是一般存储器的结构图。
图2是具有信息检索功能的存储器的结构图。
图3是由具有信息检索功能的存储器所进行的文献检索的例子(实施例1)。
图4是由具有信息检索功能的存储器所进行的完全一致数据的检索的例子(实施例2)。
图5是由具有信息检索功能的存储器所进行的范围数据的检索的例子(实施例3)。
图6是具有信息检索功能的存储器的串并行连接的例子(实施例4)。
图7是具有信息检索功能的存储器的阶层化连接的例子(实施例5)。
具体实施方式
下面,参照附图,对本发明的一个实施方式进行说明。
图1是表示一个实施方式所涉及的一般存储器的结构图。
图1的存储器100省略了地址解码器、数据总线等功能电路,该存储器是能够自由地对信息数据进行写入、读取的结构,在该结构中,具有1个字为n比特的宽度103、N个字地址104,通过由N×n比特的单元构成的存储单元102构成,该存储器通常通过地址解码器等方法而能够从外部对从1至N为止的字地址进行选择指定。
当前由CPU所实现的信息处理以如下方式进行,即,按照存储器100的数据宽度103为8比特、16比特、32比特等恒定的数据宽度,在信息数据的检索的情况下由CPU针对赋予了地址数量为1M地址、1G地址等的存储器的地址空间依次对地址进行访问,读入数据,依次进行处理。
由本发明的存储器所进行的信息处理是对以上的一般存储器构造、数据库表格构造的数据宽度和地址的概念的常识进行逆向思维而得到的,另外假设以1比特单位的并行逻辑运算为基础。
图2是表示具有本实施方式的信息检索功能的存储器结构的一个例子的图。
与图1同样,在图2中省略地址解码器、数据总线等功能电路,该存储器101是能够自由地对信息数据进行写入、读取的结构,在该结构中,具有1个字为n比特的宽度103、N个字地址104,通过由N×n比特的单元构成的存储单元102构成,该存储器101能够从外部对从1至N为止的字地址进行选择指定110。如果考虑为1个字为n比特的宽度103相当于数据库的记录数量(n)、1条记录纵向排列、字地址104的N相当于1条记录的字段的构造,则容易理解。
即,该存储器是1条记录为N比特、且n条记录的数据表格。在该存储器的行方向(在本图中是横向)上以字地址104被进行选择指定110的、与n比特的存储单元102并行设置的逻辑运算器105,是针对被选择指定110的字地址104的每个存储单元102比特而能够进行逻辑存储116的电路,是能够自由地对逻辑与112、逻辑或113、逻辑非(NOT)114、互斥逻辑116及其组合进行指定的结构。
另外,为了输出该逻辑运算器105的运算结果,而具有优先级地址编码器输出电路等运算结果输出106功能。由于该存储器的大半部分是存储器单元本身,其仅极少一部分是逻辑运算器105以及运算结果输出106功能,因此通过将这些功能加入一般存储器的微小区域,从而能够作为可利用于数据库的大容量的存储器。
当然,为了高速化,也可以使得能够同时对多个字地址进行选择指定110而准备多组逻辑运算器105。
下面,考虑由DRAM实现本发明的情况下的例子。当前时刻的每个半导体芯片(die)的存储器容量为8G比特左右。
如果认为是可忽略逻辑运算器105、运算结果输出106等功能的程度的电路规模,则能够实现在字地址为1M情况下8K比特的字宽的本存储器101、在字地址为8K的情况下1M比特的字宽的本存储器101等纵横任意的组合的存储器101。该存储器101在所有信息搜索、特别是大数据的检索、数据挖掘、基因组解析等方面是有效的,利用几个例子来说明本存储器的应用例子。
我们大家进行日常信息检索的例子是互联网检索,其概念是通过由关键词进行的信息的筛选而实现的。它是如下机制,即,通过赋予例如“信息处理”、“信息检索”、“CPU”等关键词,从而进行筛选,搜索出适当的互联网站点。
说明将该存储器利用于文献检索的情况下的实施例。
实施例1
图3是由具有信息检索功能的存储器所进行的文献检索的例子。
在本例的情况下,将从1至N为止的字地址设为“信息处理”、“信息检索”、“专利”、“CPU”等词汇,使字宽为n的任意的纵向1列作为1条记录而与1个文献相对应。另外,构成1条记录的字地址1至N相当于字段。即,在1个文献中,“信息处理”、“信息检索”、“专利”、“CPU”等文字即便只有1个,也将“1”写入相对应的存储器单元(字段)(省略“0”,下同)。因此,在本例的情况下,N个词汇、和n本文献(n条记录)作为数据库而被登记。
介绍从将这些存储后的数据库中搜索出特定的文献的例子。
假设数据库的关键词的登记字地址18为“信息处理”、字地址5为“信息检索”、字地址24为“专利”、字地址10为“CPU”,在运算式为(包含“信息处理”或者“信息检索”中任意者的词汇在内的文献)×(不包含词汇“专利”在内的文献)×(包含词汇“CPU”在内的文献)的情况下进行说明。
在图3的下方示出以上的关键词检索的运算过程。
包含字地址18的“信息处理”和字地址5的“信息检索”中任意者的(逻辑或(OR))的词汇在内的文献的记录是3、4、5、13、14、16、19、21、25。然后,字地址24为“专利”,不包含词汇“专利”在内的文献为4、8.11、16、22、25,先前的运算结果、即文献记录3、4、5、13、14、16、19、21、25和该逻辑非运算114进行逻辑与运算后的结果、即逻辑与(AND)运算的交集文献为4、16、25。最后,通过对包含字地址10的“CPU”在内的文献记录3、7、9、12、15、16、22和先前的交集文献进行逻辑与(AND)运算,从而最终交集文献107为记录16。
通过以上的说明可知,未进行选择指定110的字地址成为运算可忽略(Don’t care)的结果,具有与相联存储器(CAM)的3值存储器相同的效果。即,文献16是(包含“信息处理”或“信息检索中任意者的词汇在内的文献)×(不包含词汇“专利”在内的文献)×(包含词汇“CPU”在内的文献)。
将以上结果从优先级地址编码器输出电路等的运算结果输出106中依次读取即可。
CPU如果对该存储器101进行字地址选择指定110,进行运算指定111,则能够从该存储器中对目的信息进行检测,而不搜遍所有存储器空间的信息。
以上的说明是全文检索的例子,但如果将记录设为URL,则能够利用于网络检索用的数据库。
以上的全文检索全部是由1个比特构成的数据,但在下面的实施例中,说明以值对数据进行存储的情况下的信息检索。
实施例2
图4是由具有信息检索功能的存储器所进行的完全一致数据的检索的例子。
例如,考虑将字地址10作为最高位比特(MSB)、将字地址17作为最低位比特(LSB)的8比特的数据分配给字段的情况。由于是8比特的数据,因此能够存储256个数据,通过适当地选择从字地址10起至字地址17的8个字地址,从而能够进行从256个数据的完全一致至大小判别为止的任意的检索。例如,在按照完全一致对数据值“10”、即2进制数“00001010”进行搜索的情况下,将字地址10作为最高位比特(MSB),直至字地址17为最低位比特(LSB)为止进行8次运算而对数据“00001010”进行检测。
如图4的下方所示,在本例中,从MSB的字地址10起依次进行运算,此时,在“00001010”的数值为“0”的情况下进行逻辑非,在数值为“1”的情况下进行正逻辑,反复进行8次逻辑与运算(交集运算),取交集而得到的13及25这2条记录为数据值“10”。如果将加法功能、减法功能加入逻辑运算器105而进行并行运算,则还能够进行记录数据的四则运算。
实施例3
图5是由具有信息检索功能的存储器所进行的范围数据的检索的例子。
以上的说明是求取数据值“10”的完全一致的说明,在搜索大于或等于数据值“10”的情况下,如图所示,通过取得从MSB的字地址10起至字地址13为止这4个字地址的逻辑或,从而能够对数据值大于或等于“16”的记录进行检测。并且,通过对更低位4比特的字地址15和16的逻辑或、和字地址14进行逻辑与运算,从而求出大于或等于数据值“10”且小于“16”,并与先前的数据值大于或等于“16”的记录取得逻辑或,从而能够搜索出数据值大于或等于“10”的记录。并且,如果对数据值大于或等于“10”的记录取非,则能够检测出小于“10”、即小于或等于“9”的记录。对于其他数据值、范围检索,也反复进行和以上同样的1比特运算即可。
如果以上的运算以10次左右针对所有记录并行地进行处理后的结果的数据值大于或等于16比特,则变为以上的2倍、如果大于或等于32比特,则变为以上的4倍,从而能够根据完全一致而实现范围检索。另外,即使在将数据宽度从8比特增加到9比特、10比特的情况下,也是极度简单的,也不需要字地址必须连续,即使将数据宽度设为17比特、33比特等,也能够实现而不会有不协调感。
即,对于该存储器,根据有/无这1个比特数据,利用任意数据宽度的范围检索而能够自由地进行字段内的分配。
例如在个人信息等的情况下,大的特征在于,通过进行“住所在千叶县、工作地址在东京都、身高170cm至175cm、50岁至60岁的、男性”等检索,从而能够对信息进行筛选,仅对所需的记录进行检测。考虑到对海量的记录进行检索的情况,还能够构成为,能够将优先级地址编码器输出电路等的运算结果输出106分割为几个模块而按照模块单位进行读取。
对于数据的写入,除了利用恒定宽度的数据总线进行写入、读取之外,能够设为在纵横方向上利用先入先出(FIFO)接口而串行地进行写入、读取的结构,此时还能够使几个进行并行处理。
实施例4
图6是将本存储器串并行地连接后的情况的例子。
作为完全独立的存储器,由于还能够在纵向(字地址方向)和横向(数据宽度方向)上进行扩展,因此系统的扩展极为简单,能够使系统具有持久性。根据数据的种类的不同,在纵向(字地址方向)也设定横向(数据宽度方向)所需的容量。如果是先前的全文检索,则字地址多达数十万,但是如果是个人信息,则每人具有数K至数十K的字地址就足够。
通常,在1个CPU从完全没有数组的定义、索引的存储器中对特定的信息进行查找的情况下,即使以例如平均10纳秒对存储器进行访问并进行对照,在1M字地址的情况下需要10毫秒左右、在1G的情况下需要10秒、在1T的情况下需要10000秒(3小时左右)的时间。如果并行地使用CPU而进行分散处理,则原则上能够与CPU的数量成正比地削减处理时间。但是对大容量的数据库实时(例如1秒以内)地进行检索是困难的。
在本存储器的情况下,不论以何种方式串并行,即使是例如10TB的数据,也能够实现所有存储器的并行处理,将字地址指定110和运算指定111反复进行数次至数十次、数百次即可。
根据存储元件的不同,访问速度各异,但如果将例如一次逻辑运算的速度设为10纳秒,假如对信息进行搜索的时间为数百纳秒至微秒、1毫秒,则能够实现100000次的运算,能够进行完全并行处理,因此该技术的最大特征在于,不论是怎样的大数据,也能够以数百纳秒至微秒、1毫秒左右的固定时间而搜索到目的信息。
将该发明的存储器构造和数据的纵横关系逆转的思路如实地显示出,大幅度地削减信息处理的次数、大幅度地削减处理时间。该情况对于需要基于各种假定反复进行检索的、大数据的数据挖掘极其有效。
实施例5
图7是具有信息检索功能的存储器的阶层化连接的例子。
在图7的例子中构成为,能够使图的最上段所示的具有信息检索功能的存储器101作为主机而与那些各条记录相对应,对针对每条记录而储存了更详细的数据的、具有辅助信息检索功能的存储器101进行检索,特别地,如果是大数据,则通过利用上述阶层化数据库,不论是怎样规模的数据库,都能够应对。
在利用该存储器101构建数据库时,仅通过记录和字段的分配,之后能够利用是怎样地对逻辑运算器105进行运算指定111,因此通过利用该存储器101,不需要当前通常的检索算法、例如SQL等数据库概念本身。作为使用CPU的信息搜索,为了减轻CPU的负担而存在各种利用上的技巧,二分查找就是其典型的例子。
该算法作为能够使信息数据的检索次数极少的技术,是信息处理的常规技术,但在将数据值写入至存储器上的数据表格时,需要例如从小数据起至大数据依次排列那样的事先准备,每当数据增加、或者减少时,需要对存储器上的数据进行排序(数据维护)。即,根据该算法,CPU对特定的数据值进行搜索时的负担缩小,但在此之前的事先处理、数据维护所涉及的负担绝不会少。
以上是二分查找的例子,但哈希表等其他算法也完全相同。
如果利用本发明,则由于不需要使用如上述那样的算法,因此完全不需要事先准备、维护等信息处理,指定记录的某处、字段的某处而将数据登记或者清除即可,繁琐的数组变更、数据的排序等数据维护概不需要。因此,由于对本存储器101进行控制而对信息处理整体进行控制的CPU不需要是高速的,因此能够大幅度地削减与信息处理、特别是信息检索相关的电力。由此,其结果,将CPU的负担的消除和周边电路、信息检索的应用技术简化。
本发明人迄今为止进行了各种存储器设备的研究而得到的、日本专利第4588114号信息筛选检测功能的存储器是擅长于模式匹配等逻辑与运算的存储器。
另外,PCT/JP2013/059260号具有集合运算功能的存储器是扩大发展了具有以上信息筛选检测功能的存储器的概念,能够自由地进行逻辑与运算、逻辑或运算、逻辑非运算等的存储器。
以上的发明均为相联存储器(CAM)的应用技术,能够利用本发明。
作为一个例子,通过在逻辑运算器105中加入移位寄存器功能,从而能够实现具有信息筛选检测功能的存储器、具有集合运算功能的存储器。
如果将本方式与通常的相联存储器(CAM)进行比较,则虽然并行运算本身的速度略微降低,但由于能够实现大型的等价相联存储器(CAM),因此能够压倒性地缩短作为信息检索整体的处理时间。
上述存储器101在基因组解析中极其有效。人类的DNA等是具有数G的碱基信息的大数据,这样的大数据的解析需要非常长的时间。如果将数G的碱基信息集中地存储于该存储器101,则DNA解析比超级计算机更高速且精确。当前的信息处理以如下方式进行,即,按照存储器100的数据宽度为32比特、64比特、128比特等恒定的数据宽度,CPU依次对地址进行访问,读入数据,依次进行信息处理。数据宽度(总线宽度)越宽,则信息处理的效率越高,但由于设备的输入输出引脚的数量增加、和对设备进行安装的印刷基板的配线负担大等原因,数据的总线宽度的扩大存在极限。
本发明的存储器101的特征在于,将迄今为止的存储器构造、数据库的信息处理的思路纵横逆转,如果对于在存储器内设为进行每1比特的并行运算时的、即使每1比特的运算,也能够对大量的存储单元102信息并行地进行信息处理,则信息处理的运算次数变得极少并且高效,而且灵活利用存储器设备的特征,即,不需要将信息发送至外部,能够在存储器芯片内部并行地驱动大量的存储器单元并输入(代入)并行逻辑运算器而进行并行运算。
通常的DRAM、SPAM、FLASH、另外最近预期能够实现非易失、省电力的磁存储型的存储器单元也被大量研究,它们也能够共通地利用于上述存储器,由于本存储器仅对芯片的极少一部分添加逻辑运算功能,因此能够以极大容量且超高速地进行简便的信息处理。
还能够将该存储器101的算法容易地安装于FPGA。
该存储器是不依赖于内存数据库而且也不依赖于CPU的具有自检索功能的存储器,将该存储器和CPU一体化后的设备结构也是有效的。
工业实用性
以往,相联存储器(CAM)作为具有高速的运算功能的设备而已知,虽然研究了包含各种知识处理在内的各种应用例,但由于不能具有大型的存储容量、消耗电力大等理由,仅利用于通信路由器等极少一部分目的。
由于本发明是大容量且具有与相联存储器(CAM)匹敌的信息检索速度的新类型的信息处理存储器,因此能够广泛利用于各种数据库、大数据的数据挖掘、数据解析并且知识处理。
另外,由于该技术能够大幅度地抑制信息处理的电力,因此对于消除ICT仪器的环境问题具有重大的意义,该技术是新的信息处理方法之一。
标号的说明
100 存储器
101 具有信息检索功能的存储器
102 存储单元
103 字宽
104 字地址
105 逻辑运算器
106 运算结果输出
107 运算结果
110 (字地址)选择指定
111 运算指定
112 逻辑与
113 逻辑或
114 逻辑非
115 互斥逻辑
116 逻辑存储

Claims (12)

1.一种具有信息检索功能的存储器,其能够进行信息的读取、写入,
该具有信息检索功能的存储器的特征在于,
(1)该存储器作为1个字的比特宽度为n且N个字地址、即N×n比特的存储单元构造,
(2)在该存储器整体中1组n个比特的逻辑运算器具备如下功能,即:
(3)将从所述N个字地址中反复选择指定的所述1个字的比特宽度为n的存储单元信息并行地输入(代入)至所述1组n个比特的所述逻辑运算器而进行逻辑运算;以及
(4)输出所述逻辑运算器的内容。
2.根据权利要求1所述的具有信息检索功能的存储器,其特征在于,
所述逻辑运算器是如下结构,即,能够实现针对所述输入(代入)的所述1个字的比特宽度为n的存储器存储单元信息彼此的每一比特的逻辑存储、逻辑与、逻辑或、逻辑非、互斥逻辑及其任意的组合运算。
3.根据权利要求1所述的具有信息检索功能的存储器,其特征在于,
所述逻辑运算器具备移位寄存器功能。
4.根据权利要求1所述的具有信息检索功能的存储器,其特征在于,
通过所述逻辑存储、逻辑与、逻辑或、逻辑非、互斥逻辑及其任意的组合运算,从而进行数据值的完全一致以及数据值的范围检索。
5.根据权利要求1所述的具有信息检索功能的存储器,其特征在于,
通过所述逻辑存储、逻辑与、逻辑或、逻辑非、互斥逻辑及其任意的组合运算,从而进行数据值的加减运算。
6.根据权利要求1所述的具有信息检索功能的存储器,其特征在于,
与CPU等其他种类的半导体器件一体化。
7.根据权利要求1所述的具有信息检索功能的存储器,其特征在于,
安装于FPGA。
8.一种存储器的使用方法,该存储器是权利要求1所记载的具有信息检索功能的存储器,该存储器的使用方法的特征在于,
构成为如下数据库,即,将数据库的记录分配给所述1个字的比特宽度为n的某一列,将1条记录的字段总比特数设为所述字地址数N。
9.一种存储器的使用方法,该存储器是权利要求1所记载的具有信息检索功能的存储器,该存储器的使用方法的特征在于,
将所述具有信息检索功能的存储器以(1)或者(2)的连接进行使用,
(1)串行、并行、或者串并行连接
(2)阶层式连接。
10.一种装置,其包含权利要求1所记载的存储器。
11.一种信息处理方法,其特征在于,
在存储器内部反复进行存储器存储单元信息的1个比特彼此的信息的逻辑与、逻辑或、逻辑非、互斥逻辑、及其组合的逻辑运算而得到规定的运算结果。
12.根据权利要求11所述的信息处理方法,其特征在于,
对所述1个比特彼此的信息并行地进行所述逻辑运算。
CN201480070692.5A 2013-12-23 2014-12-18 具备信息检索功能的存储器及其利用方法、装置、信息处理方法 Active CN105900085B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013264763 2013-12-23
JP2013-264763 2013-12-23
PCT/JP2014/083607 WO2015098707A1 (ja) 2013-12-23 2014-12-18 情報検索機能を備えたメモリ、その利用方法、装置、情報処理方法。

Publications (2)

Publication Number Publication Date
CN105900085A true CN105900085A (zh) 2016-08-24
CN105900085B CN105900085B (zh) 2019-08-09

Family

ID=53478566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480070692.5A Active CN105900085B (zh) 2013-12-23 2014-12-18 具备信息检索功能的存储器及其利用方法、装置、信息处理方法

Country Status (5)

Country Link
US (2) US9627065B2 (zh)
EP (1) EP3091448A4 (zh)
JP (2) JP5981666B2 (zh)
CN (1) CN105900085B (zh)
WO (1) WO2015098707A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018169636A (ja) * 2015-07-23 2018-11-01 井上 克己 データ検索装置、データ検索lsi。
WO2018097317A1 (ja) * 2016-11-28 2018-05-31 井上 克己 データ比較演算プロセッサ及びそれを用いた演算方法
RU2652501C1 (ru) * 2017-06-14 2018-04-26 Виктория Владимировна Олевская Модуль поиска блока информации по входным данным
KR102631380B1 (ko) * 2018-05-17 2024-02-01 에스케이하이닉스 주식회사 데이터 연산을 수행할 수 있는 다양한 메모리 장치를 포함하는 반도체 시스템
JP6986309B1 (ja) * 2021-09-22 2021-12-22 明男 三水 データ処理装置、データ処理方法、及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101577757A (zh) * 2009-03-05 2009-11-11 上海闻泰电子科技有限公司 实现短信检索功能的方法
US20100164972A1 (en) * 2008-04-02 2010-07-01 Avidan Akerib System, method and apparatus for memory with embedded associative section for computations
CN102906739A (zh) * 2010-02-18 2013-01-30 井上克己 具备信息过滤检测功能的存储器、使用该存储器的信息检测方法、含有该存储器的装置、信息检测方法、存储器使用方法及存储器地址比较电路

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2718062B2 (ja) * 1988-05-25 1998-02-25 日本電気株式会社 学習型文字列検索装置と同装置の制御方式
US5325500A (en) * 1990-12-14 1994-06-28 Xerox Corporation Parallel processing units on a substrate, each including a column of memory
JP3595565B2 (ja) * 1993-12-24 2004-12-02 シャープ株式会社 半導体メモリセル回路およびメモリセルアレイ
JP2000067573A (ja) 1998-08-19 2000-03-03 Mitsubishi Electric Corp 演算機能付きメモリ
EP1182577A1 (en) * 2000-08-18 2002-02-27 SER Systeme AG Produkte und Anwendungen der Datenverarbeitung Associative memory
JP2006127460A (ja) * 2004-06-09 2006-05-18 Renesas Technology Corp 半導体装置、半導体信号処理装置、およびクロスバースイッチ
EP2467852B1 (en) * 2009-08-20 2019-05-22 Rambus Inc. Atomic memory device
JP4588114B1 (ja) 2010-02-18 2010-11-24 克己 井上 情報絞り込み検出機能を備えたメモリ、その使用方法、このメモリを含む装置。
US20150154317A1 (en) 2012-03-28 2015-06-04 Katsumi Inoue Memory provided with set operation function, and method for processing set operation processing using same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100164972A1 (en) * 2008-04-02 2010-07-01 Avidan Akerib System, method and apparatus for memory with embedded associative section for computations
CN101577757A (zh) * 2009-03-05 2009-11-11 上海闻泰电子科技有限公司 实现短信检索功能的方法
CN102906739A (zh) * 2010-02-18 2013-01-30 井上克己 具备信息过滤检测功能的存储器、使用该存储器的信息检测方法、含有该存储器的装置、信息检测方法、存储器使用方法及存储器地址比较电路

Also Published As

Publication number Publication date
JP6229024B2 (ja) 2017-11-08
WO2015098707A1 (ja) 2015-07-02
CN105900085B (zh) 2019-08-09
US20160322105A1 (en) 2016-11-03
EP3091448A4 (en) 2017-12-06
JP5981666B2 (ja) 2016-08-31
JP2017016668A (ja) 2017-01-19
JPWO2015098707A1 (ja) 2017-03-23
US9627065B2 (en) 2017-04-18
EP3091448A1 (en) 2016-11-09
US20170147712A1 (en) 2017-05-25

Similar Documents

Publication Publication Date Title
Shao et al. Managing and mining large graphs: systems and implementations
CN105900085A (zh) 具备信息检索功能的存储器及其利用方法、装置、信息处理方法
Canny et al. Big data analytics with small footprint: Squaring the cloud
Teubner et al. FPGA acceleration for the frequent item problem
CN107357843B (zh) 基于数据流结构的海量网络数据查找方法
Huang et al. Effective data co-reduction for multimedia similarity search
CN106528898A (zh) 将非关系型数据库数据转换到关系型数据库的方法及装置
Adamu et al. A survey on big data indexing strategies
KR102465391B1 (ko) 실시간으로 데이터의 증가 속도에 따라 데이터 처리 주기를 설정하는 시스템의 분석 방법
Huang et al. A scalable, high-performance customized priority queue
Ciarelli et al. Agglomeration and elimination of terms for dimensionality reduction
CN108052535B (zh) 基于多处理器平台的视觉特征并行快速匹配方法和系统
Nguyen et al. An FPGA-based hardware accelerator for energy-efficient bitmap index creation
Lee et al. Similarity search on automata processors
US20200410039A1 (en) Data comparison arithmetic processor and method of computation using same
Bustio-Martínez et al. Approximate frequent itemsets mining on data streams using hashing and lexicographie order in hardware
Rasel et al. Summarized bit batch-based triangle listing in massive graphs
Yufeng et al. Design and implementation of music recommendation system based on hadoop
Tripathy et al. Optimizing a semantic comparator using cuda-enabled graphics hardware
Blochwitz et al. Hardware-Accelerated radix-tree based string sorting for big data applications
US20050055364A1 (en) Hardware assisted pruned inverted index component
Rasel et al. Exploiting CPU parallelism for triangle listing using hybrid summarized bit batch vector
Khatai et al. An implementation of text mining decision feedback model using Hadoop MapReduce
Saurabh et al. A Mathematical Appraisal: Evolution of Distributed File System and Hadoop
Woo et al. MapReduce example with HBase for association rule

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant