JP5871698B2 - 情報蓄積検索装置 - Google Patents

情報蓄積検索装置 Download PDF

Info

Publication number
JP5871698B2
JP5871698B2 JP2012087795A JP2012087795A JP5871698B2 JP 5871698 B2 JP5871698 B2 JP 5871698B2 JP 2012087795 A JP2012087795 A JP 2012087795A JP 2012087795 A JP2012087795 A JP 2012087795A JP 5871698 B2 JP5871698 B2 JP 5871698B2
Authority
JP
Japan
Prior art keywords
search
retrieval
data value
formula
information storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012087795A
Other languages
English (en)
Other versions
JP2013218490A (ja
Inventor
中村 隆幸
隆幸 中村
豊 荒川
豊 荒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012087795A priority Critical patent/JP5871698B2/ja
Publication of JP2013218490A publication Critical patent/JP2013218490A/ja
Application granted granted Critical
Publication of JP5871698B2 publication Critical patent/JP5871698B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、センサ情報を扱うデータベースの構成法に関する。
従来、センサの計測データのような情報すなわちセンサ情報を扱う情報管理システムとして、uTupleSpace(非特許文献1および特許文献1)があった。uTupleSpaceの特徴の一つに、センサ情報をuTuple形式という、「キー=値」の並びにより自由に表現できる点がある。
さらに、uTupleSpaceのもう一つの特徴に、計測されたデータ値を先に蓄積しておき後から検索式を投入することでマッチするデータ値を検索して検索式の投入元に返却するような通常のデータベース管理システムのようなデータ値蓄積型の検索処理だけでなく、検索式を先に蓄積しておき後からデータ値を登録することでマッチするデータ値を検索式の蓄積元に返却するような検索式待ち受け型の検索処理もサポートしており、これらを区別なく扱える点がある。なお、uTupleSpaceの用語では、データ値を示すuTupleをEventActual(EA)と呼び、また、検索式を表すuTupleをEventFormal(EF)と呼ぶ。
また従来、uTuple形式のように複数の値を持つデータ値をまとめて索引づけするデータ構造として、多次元検索木UBI−Tree(特許文献2および特許文献3)があった。
これらの文献に開示されているUBI−Treeを蓄積検索の中心的な処理方式として用いることで、uTuple形式のデータ値を蓄積しておき検索式に従って取り出すといった、通常のデータベース管理システムのようなデータ値蓄積型の基本的動作を効率的かつ容易に実現することができる。
特開2012−003490号公報 特開2011−170460号公報 特開2011−170461号公報
「Design and Implementation of New uTupleSpace Enabling Storage and Retrieval of Large Amount of Schema−less Sensor Data」、Takayuki Nakamura, Keiichiro Kashiwagi, Yutaka Arakawa, Motonori Nakamura著、Second International Workshop on Enablers for Ubiquitous and Context−Aware Services on Sensor Networks (EUCASS 2011)、2011年7月
従来、データ値蓄積型の検索処理にはUBI−Treeによる効率的処理が可能である反面、uTupleSpaceの特徴である検索式待ち受け型の検索処理には、UBI−Treeのような効率的なアルゴリズムを用いることができないという問題があった。これは、一般にUBI−Treeのような木構造アルゴリズムは、データを蓄積しておき、それらを検索式で取り出す処理を前提として考案・設計されているためである。
このため、uTupleSpaceを実現する際には、事前に登録された検索式を線形検索のような初歩的な方式で蓄積・検索することによって検索式待ち受け型の検索処理を実現せざるを得ず、効率的な装置を実現できなかった。
本願発明の情報蓄積検索方法は、検索式蓄積手段と検索式検索手段とを備える情報蓄積検索装置が、次元及び値を少なくとも含む情報を蓄積し検索する情報蓄積検索方法において、前記検索式蓄積手段が、同時に複数次元の値による範囲検索が可能でかつ木構造のデータエントリとして、値の範囲を持つエントリを登録可能な検索式用木構造を用いて、前記情報に含まれる複数の次元の値範囲を少なくとも条件に含む与えられた検索式を蓄積する検索式蓄積手順と、前記検索式検索手段が、複数の次元の値または値範囲を少なくとも含む与えられた情報のデータ値を木構造の検索条件として、該検索式用木構造から該検索条件にマッチする登録されたエントリ群を検索する検索式検索手順と、を順に実行することを特徴とする。
本願発明の情報蓄積検索方法では、前記情報蓄積検索装置は、データ値蓄積手段とデータ値検索手段とをさらに備え、前記情報蓄積検索装置が、前記情報のデータ値の登録要求を受け付けると前記検索式検索手段が、該データ値に対して前記検索式検索手順を行うことによって前記検索式用木構造から検索式を検索するとともに、前記データ値蓄積手段が、同時に複数次元の値による範囲検索が可能なデータ値用木構造に、該データ値を蓄積し前記情報蓄積検索装置が、検索式の登録要求を受け付けると、前記データ値検索手段が、登録要求のあった検索式にマッチするデータ値を、該データ値用木構造から検索するとともに、前記検索式蓄積手段が、前記検索式蓄積手順において、該検索式を前記検索式用木構造に蓄積してもよい。
本願発明の情報蓄積検索方法では、前記検索式検索手順におけるマッチするか否かの判定には、判定対象の該登録されたエントリが含む全ての次元が判定対象の該検索式用木構造の検索条件にも全て含まれており、かつ、両者の該次元の値範囲と値範囲の積集合が空集合とならないことを少なくとも条件としてもよい。
本願発明の情報蓄積検索方法では、前記検索式用木構造は、UBI−Treeアルゴリズムであってもよい。
本願発明の情報蓄積検索装置は、次元及び値を少なくとも含む情報を蓄積し検索する情報蓄積検索装置であって、同時に複数次元の値による範囲検索が可能でかつ木構造のデータエントリとして、値の範囲を持つエントリを登録可能な検索式用木構造を用いて、前記情報に含まれる複数の次元の値範囲を少なくとも条件に含む与えられた検索式を蓄積する検索式蓄積手段と、複数の次元の値または値範囲を少なくとも含む与えられた情報のデータ値を木構造の検索条件として、該検索式用木構造から該検索条件にマッチする登録されたエントリ群を検索する検索式検索手段と、を備えることを特徴とする。
本願発明の情報蓄積検索装置では、えられた情報のデータ値を、同時に複数次元の値による範囲検索が可能なデータ値用木構造に蓄積するデータ値蓄積手段と、与えられた検索式によってマッチするデータ値を検索するデータ値検索手段と、をさらに備え、前記情報のデータ値の登録要求を受け付けると、該データ値に対して前記検索式検索手段を用いて前記検索式用木構造から検索式を検索するとともに、該データ値蓄積手段を用いて該データ値を該データ値用木構造に蓄積し、検索式の登録要求を受け付けると、該検索式に対して該データ値検索手段を用いて該データ値用木構造からデータ値を検索するとともに、前記検索式蓄積手段を用いて該検索式を前記検索式用木構造に蓄積してもよい。
本願発明の情報蓄積検索装置では、前記検索式検索手段におけるマッチするか否かの判定には、判定対象の該登録されたエントリが含む全ての次元が判定対象の該検索式用木構造の検索条件にも全て含まれており、かつ、両者の該次元の値範囲と値範囲の積集合が空集合とならないことを少なくとも条件としてもよい。
本願発明の情報蓄積検索装置では、前記検索式用木構造はUBI−Treeアルゴリズムであってもよい。
本願発明の情報蓄積検索プログラムは、コンピュータを、前記検索式蓄積手段及び前記検索式検索手段又は前記検索式蓄積手段、前記検索式検索手段、前記データ値蓄積手段及び前記データ値検索手段として機能させるためのプログラムである。
本発明によれば、従来同様にデータ値蓄積型の検索処理にUBI−Treeによる効率的処理が可能であることに加え、検索式待ち受け型の検索処理にも改良したUBI−Treeによる効率的処理が可能となる。これによって、uTupleSpaceの特徴であるデータ値蓄積型の検索処理と検索式待ち受け型の検索処理とを区別なく扱える点に対して、双方の検索処理ともに効率的な実現が可能となる。
本実施の形態における装置構成を示す。 EA用UBI−Tree(111)が保持するEAの一覧を示す。 EA用UBI−Tree(111)の構造を示す。 EAとEFのマッチング規則を示す。 EF用UBI−Tree(113)が保持するEFの一覧を示す。 EF用UBI−Tree(113)の構造を示す。 IPアドレス表(114)の内容を示す。 新たに登録するEFの内容を示す。 EF登録処理の手順を示す。 EF登録の結果として検索表示装置(103)に返却されるEAの一覧を示す。 EF登録処理後のEF用UBI−Tree(113)が保持するEFの一覧を示す。 EF登録処理後のEF用UBI−Tree(113)の構造を示す。 EF登録処理後のIPアドレス表(114)の内容を示す。 新たに登録するEAの内容を示す。 EA登録処理の手順を示す。 センサ装置(102)からのEA登録の結果として検索表示装置(103)に返却されるEAを示す。 EA登録処理後のEA用UBI−Tree(111)が保持するEAの一覧を示す。 EA登録処理後のEA用UBI−Tree(111)の構造を示す。 CAとCFのマッチング規則を示す。
本発明の実施の形態の一つを以下に示す。
第1図は本実施の形態における装置構成を示す。情報蓄積検索装置(101)はuTupleSpaceを実現したサーバであり、ネットワーク(104)に接続され、データ値用木構造であるEA用UBI−Tree(111)と検索式用木構造であるEF用UBI−Tree(113)と要求受付処理部(115)とIPアドレス表(114)を具備する。ネットワーク(104)にはその他に、センサ装置(102)と検索表示装置(103)が接続される。それぞれの装置のIPアドレスは、情報蓄積検索装置(101)が192.168.0.1、センサ装置(102)が192.168.0.2、検索表示装置(103)が192.168.0.3である。
EA用UBI−Tree(111)はセンサ値を蓄積する機能を有するが、これは通常のUBI−Treeの使用法であり、以前から従来技術により実現可能であった部分である。以下ではまず、この従来技術の動作をEF登録処理を通じて詳細に説明することで、本発明の前提となる動作について明確に示す。その次にEA登録処理を通じて詳細説明するEF用UBI−Tree(113)は、検索式を蓄積する機能を有するが、これは本発明に特有の動作を行うものであり、このため本発明における動作の差異を以下で明確に示していくこととする。
第2図はEA用UBI−Tree(111)が保持するEAの一覧を示す。ここでは、以下に順次示していくEF登録処理およびEA登録処理に先立って、(221)〜(225)の5個のEAすなわちセンサ情報のデータ値が既にuTupleSpaceに登録されているものと仮定する。なお、これらのEAの表す意味は、例えばEA1(221)であれば、「登録日時が2012年1月31日11時30分、温度が摂氏16.2度、湿度が60%」というセンサの測定値であることを示す。また、例えばEA2(222)であれば、「登録日時が2012年1月31日13時30分、温度が摂氏15.4度」というセンサの測定値であることを示し、かつ、このデータ値には湿度に関する測定情報が含まれていないことを示す。
第3図はEA用UBI−Tree(111)の構造を示す。この木構造は、第2図で示した5個のEAを保持しつつ索引を管理している。UBI−Treeは多次元データをデータエントリとして階層構造で保持することを特徴とする木構造である。EA用UBI−Tree(111)は従来技術のUBI−Treeの動作そのままであり、具体的には以下に示す動作を行う。
UBI−Treeのそれぞれのノードは、該ノードが含む全データを包み込む多次元直方体の情報を保持する。例えば、ノード(232)は、EA1〜EA3までのデータエントリ群を保持している。該データエントリ群について、次元「日時」の最小値は「201201311130」かつ最大値は「201201311530」であり、次元「温度」の最小値は「15.4」かつ最大値は「21.8」であり、次元「湿度」の最小値は「35」かつ最大値は「60」である。これらは該多次元直方体を確定する多次元座標空間中の2つの点を表していると考えることができ、従って該ノード(232)はこれらの情報を表形式で保持する。同様に、ルートノード(231)は、ノード(232)およびノード(233)を保持しており、これらを包み込む多次元直方体の情報を表形式で保持する。
なおこの際、データエントリに存在しない次元(例えばEA2における「湿度」)があったとしても、それは無視して多次元直方体を算出することに注意されたい。また、ノード(233)が保持する情報について、次元「湿度」が記号「φ」となっている。これは、該ノードが保持するデータエントリは全て次元「湿度」を含まない(「値が『φ』である」と表現することにする)ということを意味する。
ここではさらに、従来技術であるEA用UBI−Tree(111)に対する検索動作であるEA検索処理についても示しておく。例として、この木構造に対して、「日時」が「−∞〜+∞」かつ「湿度」が「0〜40」なる検索条件で検索を行うとする。
一般に、木構造の検索操作はルートノードからの再帰的処理により規定される。すなわち、まずルートノード(231)の保持する情報が該検索条件に合致するかを調べる。この場合には、「日時」という次元に対して両者の値範囲の積集合が空集合ではないことをチェックし、さらに「湿度」という次元に対して両者の値範囲の積集合が空集合でないことをチェックし、両者ともにチェックOKとなるため、このノードは該検索条件に合致すると確認できる。
次に、再帰的にノード(232)とノード(233)を順に、同様に調べる。この場合、ノード(232)は該検索条件に合致すると確認できるため、さらに再帰的に、EA1〜EA3を順に、同様に調べる。その結果、EA3のみが該検索条件に合致すると確認できるため、EA3は少なくとも該検索の結果であることが分かる。なお、EA2は「湿度」という次元を含まないため、検索には合致しない。
次に再帰的処理として、ノード(233)を調べることになるが、このノードは「湿度」という次元を含まない(値が「φ」である)ため、検索には合致しない。よって、ノード(233)が保持するEA4〜EA5については再帰的に確認する必要はなく、この枝についてはここで検索処理を打ち切りしてよい。
以上述べた再帰的処理の結果として、検索結果EA3を得る。なお、UBI−Treeに対するこのような基本的処理は、データエントリの挿入操作なども含めて、特許文献2および特許文献3に詳細に開示されており実施方法は明らかである。
第4図はEAとEFのマッチング規則を示す。本図は、上記述べた、データ値すなわちEAと検索式すなわちEFとの間の合致するしないに関する判定規則のうち、特に次元が存在しない場合の扱いに着目して表形式に整理したものである。EF内に存在する次元については(囲み符号241)、EAに存在しない場合は合致しない(reject)であり、存在する場合には両者の値範囲の積集合が空集合でないことをチェックする。一方、EF内に存在しない次元については、EAに存在してもしなくても構わない。このような判断をEF内に存在するすべての次元に対して行い、全てOKの場合のみ、EAとEF全体のマッチングが「合致」と判定される。また上記述べたように、再帰的な検索処理の途中でrejectがあった場合、その下に保持されるノードおよびデータエントリは全てrejectであることは明らかであるから、従来技術であるEA用UBI−Tree(111)に対する検索動作に関しては、再帰的検索処理を打ち切りしてよい。
第5図はEF用UBI−Tree(113)が保持するEFの一覧を示す。ここでは、以下に順次示していくEF登録処理に先立って、(251)〜(254)の4個のEFすなわち検索式が既にuTupleSpaceに登録されているものと仮定する。なお、これらのEFの表す意味は、例えばEF1(251)であれば、「登録日時が−∞〜+∞、湿度が40%〜100%」という条件であることを示す。
第6図はEF用UBI−Tree(113)の構造を示す。この木構造は、第5図で示した4個のEFを保持しつつ索引を管理している。ここでのポイントは、UBI−Treeに登録するデータエントリとして、(EA用UBI−Tree(111)が値を登録していたのとは異なり)値範囲を登録しているところである。特許文献2に開示されているように、UBI−Treeは値だけでなく値範囲もデータエントリとして登録することを可能とするアルゴリズムであり、このようなデータエントリに対する一連の木構造の基本的処理は明らかである。このEF用UBI−Tree(113)に対する挿入操作は、従来技術のUBI−Treeの動作そのままである。一方、検索操作は、本実施の形態の後半で詳細に示す、特徴的な動作を行う。
第7図はIPアドレス表(114)の内容を示す。これは、uTupleSpaceに登録されているそれぞれのEFが、どの検索表示装置から登録されたものかを記録している。もし、登録されたEFにマッチする新たなEAがuTupleSpaceに登録された場合、このIPアドレス表(114)に記されたホストに対して該EAが返却されることを表す。ここでは全てのEFが、検索表示装置(103)のIPアドレス「192.168.0.3」から登録されたことを表している。
情報蓄積検索装置(101)はEFの登録要求およびEAの登録要求を受け付け、下記に詳述する動作を行う。EFの登録要求があったときにEF登録処理を行う。該EF登録処理の中ではEA検索処理(EAの検索操作)と検索式蓄積手順としてEFを挿入する操作とを行う。EAの登録要求があったときにEA登録処理を行う。該EA登録処理の中では検索式検索手順としてEF検索処理(EFの検索操作)とデータ値蓄積手順としてEAを挿入する操作とを行う。これら登録要求はいずれが先に要求されてもよく、EF登録処理の次にEA登録処理を行ってもよいし、EA登録処理の次にEF登録処理を行ってもよい。
まず、段落0033〜0039では、一連のEF登録処理について示す。
第8図は新たに登録するEFの内容を示す。該EFの中でも特に、次元「日時」の値範囲「−∞〜+∞」は、過去に蓄積された全てのEAを検索対象として蓄積型検索を行い、かつ、該EFを蓄積しておき将来登録されるEAに対して検索を行う待ち受け型検索を同時に行うことを表している。
検索表示装置(103)は該EFの登録要求を、ネットワーク(104)経由で情報蓄積検索装置(101)に送信する。情報蓄積検索装置(101)の要求受付処理部(115)が該登録要求を受け付け、次に示す手順で処理を行う。
第9図はEF登録処理の手順を示す。
まず、要求受付処理部(115)は、データ値検索手段として、EA検索処理を行う。例えば、要求受付処理部(115)は、EA用UBI−Tree(111)に対して、該EFを検索条件として、検索操作を行う(手順291)。検索操作の詳細は段落0027に例示した通りであり、検索結果としてEA3を得る。次に、検索結果を要求元である検索表示装置(103)に返却する(手順292)。
次に、要求受付処理部(115)は、検索式蓄積手段として、該EFが待ち受け型検索を行うかどうかを、次元「日時」の終値「+∞」が現在時刻より大であるかどうか比較することによって、判定する(手順293)。ここでは真であるため、要求受付処理部(115)は、検索式蓄積手段として、次の処理として、EF用UBI−Tree(113)に対して該EFを挿入する操作を行う(手順294)。既に示したように、この挿入操作は、従来のUBI−Treeと何ら変わるところはない。
以上でEF登録処理を終了する。
第10図はEF登録の結果として検索表示装置(103)に返却されるEAの一覧を示す。ここでは既に示したように、EA3の内容が返却される。
第11図はEF登録処理後のEF用UBI−Tree(113)が保持するEFの一覧を示す。手順294においてEF用UBI−Tree(113)に登録されたEFは、本図におけるEF5(315)として、追加で保持される。
第12図はEF登録処理後のEF用UBI−Tree(113)の構造を示す。ここでは、EF5がUBI−Treeアルゴリズムによって、ノード(323)に追加された様子を表している。
第13図はEF登録処理後のIPアドレス表(114)の内容を示す。EF5に対応するホストとして、検索表示装置(103)のIPアドレス「192.168.0.3」が追加された様子を表している。これは、もし将来、EF5にマッチする新たなEAがuTupleSpaceに登録された場合、該IPアドレスに該EAが返却されることを示す。該EAを受け取った検索表示装置(103)は、その内容を画面に表示する。
次に、段落0040〜0048では、本発明に極めて特有の動作を含む一連のEA登録処理について示す。
第14図は新たに登録するEAの内容を示す。センサ装置(102)は、「日時」が「2012年1月31日21時30分」に、「温度」が「−1.5度」である値を計測したものとする。該センサ装置(102)は該EAの登録要求を、ネットワーク(104)経由で情報蓄積検索装置(101)に送信する。情報蓄積検索装置(101)の要求受付処理部(115)が該登録要求を受け付け、次に示す手順で処理を行う。
第15図はEA登録処理の手順を示す。
まず、要求受付処理部(115)は、検索式検索手段として、EF検索処理を行う。例えば、要求受付処理部(115)は、EF用UBI−Tree(113)に対して、該EAを検索条件として、検索操作を行う(手順351)。この際、通常のUBI−Treeが木構造のデータエントリとしてデータ値を登録し木構造の検索条件として検索式を用いるのと比較し、該手順においては木構造のデータエントリとして検索式を登録し木構造の検索条件としてデータ値を用いるということに注意されたい。具体的な手順は次の通りである。
基本的な検索操作は従来のUBI−Treeに倣う。すなわち、まずルートノード(321)の保持する情報が該検索条件に合致するかを調べる。この場合には、「日時」という次元に対して両者の値範囲の積集合が空集合ではないことをチェックし、さらに「温度」という次元に対して両者の値範囲の積集合が空集合でないことをチェックし、両者ともにチェックOKとなるため、このノードは該検索条件に合致すると確認できる。
次に、再帰的にノード(322)とノード(323)を順に、同様に調べる。この場合、ノード(322)は、「日時」という次元に対して両者の値範囲の積集合が空集合ではないことはチェックしOKとなるが、「温度」という次元は持っておらず、これをチェックOKとして扱う。その結果、ノード(322)は該検索条件に合致すると確認できるため、さらに再帰的に、EF1〜EF2を順に調べる。これらは中間ノードではなくデータエントリであるため、既に示した本来のEAとEFとの間のマッチング規則に従って判定を行い、その結果、EF2のみが該検索条件に合致すると確認できるため、EF2は少なくとも該検索の結果であることが分かる。
次に再帰的処理として、ノード(323)を調べ、「日時」という次元に対しても「温度」という次元に対してもチェックOKとなる。その結果、ノード(323)は該検索条件に合致すると確認できるため、さらに再帰的に、EF3〜EF5を順に調べる。先に述べた場合と同様に、これらはデータエントリであるため本来のマッチング規則に従って判定を行い、その結果、EF4のみが該検索条件に合致すると確認できるため、EF4は少なくとも該検索の結果であることが分かる。以上述べた再帰的処理の結果として、要求受付処理部(115)は、検索結果EF2とEF4を得る。
以上の規則を、第4図に示したEAとEFのマッチング規則で再度確認する。EA内に存在する次元については(囲み符号242)、EF内に含まなくてもOKであることから、再帰的処理の途中でreject判定にならないことが分かる。従って、既に示した従来技術におけるEA用UBI−Tree(111)に対する検索操作とは異なり、再帰的処理を途中で打ち切ることができないことに注意されたい。
このことはノード(322)とEF2の例で考えると分かりやすい。EF2は「日時=2012年1月31日20時00分〜22時00分」を満たす全てのEAにマッチするのであるから、当然、現在登録しようとしている第14図のEAにもマッチする。このため該検索処理においては、ノード(322)が保持する下位のデータエントリに対する再帰的処理を、省略することができない。このように、EAとEFとのマッチング規則の特徴に基づき、EF用UBI−Tree(113)の検索操作は通常のUBI−Treeから上記述べたような若干の処理規則の変更を加えたものとなっている。
該EA登録処理の手順の続きを示す。
次に、要求受付処理部(115)は、検索結果を対応する検索式の登録元に返却する(手順352)。この例では、手順351によってEF2とEF4が検索結果であることが分かるので、IPアドレス表(114)から該EFに対応するIPアドレスを検索する。ここではいずれのEFに関してもIPアドレス「192.168.0.3」が登録元であることが分かるので、該IPアドレスすなわち検索表示装置(103)に対して、該EAの内容をネットワーク(104)を経由して返却する。
次に、要求受付処理部(115)は、データ値蓄積手段として、EA用UBI−Tree(111)に対して該EAを挿入する操作を行う(手順353)。既に示したように、この挿入操作は、従来のUBI−Treeそのものである。以上でEA登録処理を終了する。なお、EF登録処理の際にはEFが待ち受け検索を行う場合と行わない場合があるため判定処理(手順293)が必要であったが、EA登録処理の際には全てのEAは蓄積対象となるため判定処理は必要ないことに注意されたい。
第16図はセンサ装置(102)からのEA登録の結果として検索表示装置(103)に返却されるEAを示す。これは該EA登録処理の契機となったEA登録要求の内容と同じである。該EAを受け取った検索表示装置(103)は、その内容を画面に表示する。
第17図はEA登録処理後のEA用UBI−Tree(111)が保持するEAの一覧を示す。登録されたEAは、本図におけるEA6(376)として、追加で保持される。
第18図はEA登録処理後のEA用UBI−Tree(111)の構造を示す。ここでは、EA6がUBI−Treeアルゴリズムによって、ノード(383)に追加された様子を表している。なお、このようにして登録されたEAが、将来、別のEF登録処理の際に検索対象となることは言うまでもない。
以上で、EAとEFに対して、蓄積型検索と待ち受け型検索、すなわちEAとEFのどちらが先に到着しても正しく動作するuTupleSpaceのセンサ情報のデータ値に対する一連の処理手順を示した。本発明は、EAとEF間の処理に限らず、uTupleSpaceのもう一つの特徴であるコマンド型の通信すなわちCommandActual(CA)とCommandFormal(CF)との間の順不同のマッチング処理にもそのまま適用できる。
第19図はCAとCFのマッチング規則を示す。この規則を、第4図に示したEAとEFのマッチング規則と比較すると、まったく同じであることが分かる。uTupleSpaceにおけるCAとCFのマッチング規則は特許文献1に開示されているが、その特徴はどちらに単一の値を記載しどちらに値範囲を記載するかの規則を巧妙に入れ替えている点にある。一方、本発明で特徴的な動作となっている、特定の次元が存在しなかった(「φ」)場合の扱いについて、CAとCF間のマッチング規則には何ら特別な点は無い。このため、以上示した一連の処理手順は、「EAとEF」を「CAとCF」にそのまま読み替えることによって、基本的にそのまま適用可能である。
なお本発明では、データエントリを索引づける木構造としてUBI−Treeアルゴリズムを用いた。本発明の範囲はこれに限るものではなく、同時に複数次元の値による範囲検索が可能で(例えばR−Treeやその拡張アルゴリズム等)、かつ、データエントリとして値の範囲を持つエントリを登録可能で(例えばR−Treeの自明な拡張で対応可能)、かつ、次元が存在しない(ある次元の値が「φ」)場合にも対応可能(例えばR−Treeで「φ」を示す特別な数値を登録する等)といった特徴を満たす索引付け技術であれば、同様に適用可能である。一方で、UBI−Treeは上記の条件を満たす上に、取り扱うデータエントリがuTupleSpaceにおけるuTuple形式の要件と良く一致すること、さらに上記の条件を満たしたデータエントリの蓄積型検索処理が特に効率的に行えることなどから、本実施の形態で例示した手順との相乗効果は顕著である。
なお、本発明のいうセンサ情報とは、本実施の形態に示したセンサ装置によって得られる温度や湿度の情報に限らず、その他次元及び値を少なくとも含む様々な情報も対象とすることができる。具体的に一例を挙げると、電流あるいは電圧値、流体の流量、物質の濃度、明度、騒音、位置、加速度などを含むセンサデバイスが計測した値を取り扱ってよく、またそれに限らず、センサ以外の例えばWebやインターネットを経由して取得した情報であってもよい。さらに、それら値に加えて、センサの特性や状態、計測日時等を示すメタデータを含む情報であってもよい。
一般にTree(=木)データ構造を用いて多数のデータを管理すると、検索速度が向上するというメリットが得られる。木構造による検索速度の向上の本質的な理由は、木構造にデータエントリを挿入する際に、「似たデータが近い部分に寄り集まるように、うまく規則的に入れる先を選択する」という動作を行っていることにある。例えば、最も単純な検索木である2分木アルゴリズムでは、各ノードがデータ値と左右2本の子孫への枝を持ち、左には自身より小さい値が、右には自身より大きい値が入るように、挿入先を決めていく。そうするとできあがるデータ構造は、X軸だけに着目して左から右に眺めていくと、ちょうど昇順にきれいに並んだ形になる。このように、値が似たデータが近い位置に整理されるため、目的とする値を探す際に、左右どちらの枝をたどれば目標にたどりつけるかが容易かつ高速に決定できる。
本発明におけるEA用UBI−TreeおよびEF用UBI−Treeにおいても、基本的な考え方は同様であり、「似た種類の項目を含むデータエントリ」、「項目種類が同じなら、近い値を持つデータエントリ」がある方へと新規データエントリの挿入先を決定するので、似た値が自動的に集まって管理される。従って、検索の際には、どの枝をたどればよいかの候補を絞り込むことができるため、高速な検索が行える。
ここで、EA用UBI−Treeにおける再帰的処理の打ち切り動作は、検索効率をさらに向上させる工夫ではあるが、再帰的処理の打ち切り動作ができない場合があるEF用UBI−Treeにおいても、上述した本質的な検索高速化のメリットは無くならない。別の言い方をすると、値の範囲が外れているかどうかに基づく打ち切り(枝刈り)の動作は、EA用/EF用いずれのUBI−Treeであっても問題なく行うことができる。
本発明の装置はコンピュータとプログラムによっても実現でき、プログラムを記録媒体に記録することも、ネットワークを通して提供することも可能である。
本発明は情報通信産業に適用することができる。
101:情報蓄積検索装置
102:センサ装置
103:検索表示装置
104:ネットワーク
111:EA用UBI−Tree
113:EF用UBI−Tree
114:IPアドレス表
115:要求受付処理部
231、261、321、381:ルートノード
232、233、262、263、322、323、382、383:ノード

Claims (9)

  1. 検索式蓄積手段と検索式検索手段とを備える情報蓄積検索装置が、次元及び値を少なくとも含む情報を蓄積し検索する情報蓄積検索方法において、
    前記検索式蓄積手段が、同時に複数次元の値による範囲検索が可能でかつ木構造のデータエントリとして、値の範囲を持つエントリを登録可能な検索式用木構造を用いて、前記情報に含まれる複数の次元の値範囲を少なくとも条件に含む与えられた検索式を蓄積する検索式蓄積手順と、
    前記検索式検索手段が、複数の次元の値または値範囲を少なくとも含む与えられた情報のデータ値を木構造の検索条件として、該検索式用木構造から該検索条件にマッチする登録されたエントリ群を検索する検索式検索手順と、
    を順に実行することを特徴とする情報蓄積検索方法。
  2. 請求項1に記載の情報蓄積検索方法であって、
    前記情報蓄積検索装置は、データ値蓄積手段とデータ値検索手段とをさらに備え、
    前記情報蓄積検索装置が、前記情報のデータ値の登録要求を受け付けると
    前記検索式検索手段が、該データ値に対して前記検索式検索手順を行うことによって前記検索式用木構造から検索式を検索するとともに、
    前記データ値蓄積手段が、同時に複数次元の値による範囲検索が可能なデータ値用木構造に、該データ値を蓄積し、
    前記情報蓄積検索装置が、検索式の登録要求を受け付けると、
    前記データ値検索手段が、登録要求のあった検索式にマッチするデータ値を、該データ値用木構造から検索するとともに、
    前記検索式蓄積手段が、前記検索式蓄積手順において、該検索式を前記検索式用木構造に蓄積する
    ことを特徴とする情報蓄積検索方法。
  3. 請求項1又は2に記載の情報蓄積検索方法であって、
    前記検索式検索手順におけるマッチするか否かの判定には、
    判定対象の該登録されたエントリが含む全ての次元が判定対象の該検索式用木構造の検索条件にも全て含まれており、かつ、
    両者の該次元の値範囲と値範囲の積集合が空集合とならないことを少なくとも条件とすることを特徴とする情報蓄積検索方法。
  4. 請求項1から3のいずれかに記載の情報蓄積検索方法であって、
    前記検索式用木構造は、UBI−Treeアルゴリズムであることを特徴とする情報蓄積検索方法。
  5. 次元及び値を少なくとも含む情報を蓄積し検索する情報蓄積検索装置であって、
    同時に複数次元の値による範囲検索が可能でかつ木構造のデータエントリとして、値の範囲を持つエントリを登録可能な検索式用木構造を用いて、前記情報に含まれる複数の次元の値範囲を少なくとも条件に含む与えられた検索式を蓄積する検索式蓄積手段と、
    複数の次元の値または値範囲を少なくとも含む与えられた情報のデータ値を木構造の検索条件として、該検索式用木構造から該検索条件にマッチする登録されたエントリ群を検索する検索式検索手段と、
    を備えることを特徴とする情報蓄積検索装置。
  6. 請求項5に記載の情報蓄積検索装置であって、
    えられた情報のデータ値を、同時に複数次元の値による範囲検索が可能なデータ値用木構造に蓄積するデータ値蓄積手段と、
    与えられた検索式によってマッチするデータ値を検索するデータ値検索手段と、
    をさらに備え、
    記情報のデータ値の登録要求を受け付けると
    該データ値に対して前記検索式検索手段を用いて前記検索式用木構造から検索式を検索するとともに、
    該データ値蓄積手段を用いて該データ値を該データ値用木構造に蓄積し
    索式の登録要求を受け付けると
    該検索式に対して該データ値検索手段を用いて該データ値用木構造からデータ値を検索するとともに、
    前記検索式蓄積手段を用いて該検索式を前記検索式用木構造に蓄積する
    ことを特徴とする情報蓄積検索装置。
  7. 請求項5又は6に記載の情報蓄積検索装置であって、
    前記検索式検索手段におけるマッチするか否かの判定には、
    判定対象の該登録されたエントリが含む全ての次元が判定対象の該検索式用木構造の検索条件にも全て含まれており、かつ、
    両者の該次元の値範囲と値範囲の積集合が空集合とならないことを少なくとも条件とすることを特徴とする情報蓄積検索装置。
  8. 請求項5から7のいずれかに記載の情報蓄積検索装置であって、
    前記検索式用木構造はUBI−Treeアルゴリズムであることを特徴とする情報蓄積検索装置。
  9. コンピュータを、請求項5から8のいずれかに記載の
    前記検索式蓄積手段及び前記検索式検索手段
    又は
    前記検索式蓄積手段、前記検索式検索手段、前記データ値蓄積手段及び前記データ値検索手段
    として機能させるための情報蓄積検索プログラム。
JP2012087795A 2012-04-06 2012-04-06 情報蓄積検索装置 Expired - Fee Related JP5871698B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012087795A JP5871698B2 (ja) 2012-04-06 2012-04-06 情報蓄積検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012087795A JP5871698B2 (ja) 2012-04-06 2012-04-06 情報蓄積検索装置

Publications (2)

Publication Number Publication Date
JP2013218490A JP2013218490A (ja) 2013-10-24
JP5871698B2 true JP5871698B2 (ja) 2016-03-01

Family

ID=49590523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012087795A Expired - Fee Related JP5871698B2 (ja) 2012-04-06 2012-04-06 情報蓄積検索装置

Country Status (1)

Country Link
JP (1) JP5871698B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5948399B2 (ja) * 2014-12-04 2016-07-06 日本電信電話株式会社 情報記録装置、方法およびプログラム
EP3376407B1 (en) * 2017-03-15 2020-09-16 censhare AG Efficient use of trie data structure in databases

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323457A (ja) * 2002-02-28 2003-11-14 Ricoh Co Ltd 文書検索装置、文書検索方法、プログラム及び記録媒体
JP5430436B2 (ja) * 2010-02-16 2014-02-26 日本電信電話株式会社 情報蓄積検索方法及び情報蓄積検索プログラム
JP5467002B2 (ja) * 2010-06-16 2014-04-09 日本電信電話株式会社 間接通信装置、通信システム、通信方法および通信プログラム

Also Published As

Publication number Publication date
JP2013218490A (ja) 2013-10-24

Similar Documents

Publication Publication Date Title
US8825581B2 (en) Simplifying a graph of correlation rules while preserving semantic coverage
US9448999B2 (en) Method and device to detect similar documents
CN104679778B (zh) 一种搜索结果的生成方法及装置
US8117215B2 (en) Distributing content indices
JP5875711B2 (ja) ウェブページ検索の方法及び装置
EP2804114A1 (en) Database controller, method, and program for managing a distributed data store
CN104298736B (zh) 数据集合连接方法、装置及数据库系统
JP2009259284A (ja) 圧縮データの構造を問い合わせる方法
CN104462396B (zh) 字符串处理方法和装置
US10462062B2 (en) Memory efficient packet classification method
CN105677904B (zh) 基于分布式文件系统的小文件存储方法及装置
JP2014232532A (ja) 範囲クエリを処理するデータベース制御部、方法及びプログラム
CN109753504A (zh) 数据查询方法及装置
JP5871698B2 (ja) 情報蓄積検索装置
CN105447135B (zh) 数据查找方法和装置
CN109446301A (zh) 一种相似文章的查找方法及装置
CN103995831B (zh) 基于物品间相似度的物品处理方法、系统和装置
CN107590233B (zh) 一种文件管理方法及装置
CN107239568A (zh) 分布式索引实现方法及装置
CN105740274B (zh) 基于无向图的用户账号查找方法及装置
US7849051B2 (en) Extraction of logical events from network data
CN104679808A (zh) 用于使用和建立块级别索引进行搜索询问的方法和系统
CN104572880B (zh) 基于用户的协同过滤的并行实现方法及系统
US10430775B1 (en) Validation and lookup techniques for rule-based data categorization
US9646094B2 (en) System and method for performing a multiple pass search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140730

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160112

R150 Certificate of patent or registration of utility model

Ref document number: 5871698

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees