JP2013016112A - チャンク生成装置、チャンク読み取り装置、チャンク生成方法及びプログラム - Google Patents
チャンク生成装置、チャンク読み取り装置、チャンク生成方法及びプログラム Download PDFInfo
- Publication number
- JP2013016112A JP2013016112A JP2011150059A JP2011150059A JP2013016112A JP 2013016112 A JP2013016112 A JP 2013016112A JP 2011150059 A JP2011150059 A JP 2011150059A JP 2011150059 A JP2011150059 A JP 2011150059A JP 2013016112 A JP2013016112 A JP 2013016112A
- Authority
- JP
- Japan
- Prior art keywords
- chunk
- information
- pool
- file
- tree structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明に係るチャンク生成装置は、複数の情報を列挙したファイルであるチャンクを生成する装置であって、情報を一時プール101に登録する機能と、一時プール101から木構造で近傍の情報群を取り出しSチャンク104を作成する機能と、Sチャンク104の荷札情報を生成してSチャンクプール105に登録する機能と、Sチャンクプール105から木構造で近傍の荷札情報群を取り出しそれらの荷札情報が示すSチャンク104の含む情報を少なくとも含むLチャンク108を作成する機能と、を少なくとも有する。
【選択図】図1
Description
第1図は本実施の形態における装置構成を示す。
チャンク生成装置(100)は、ネットワーク(109)に接続され、一時プール登録部(110)とSチャンク作成部(111)とSチャンクプール登録部(112)とLチャンク作成部(113)を具備する。Sチャンクが第1チャンク、Lチャンクが第2チャンクに相当する。
本図の例では6つのセンサ情報を保持している。例えば「35:(ア)」という記載は、木の当該ノードが第3図で示す(ア)の情報本体を保持するとともに、該情報本体が含む「35」という特定の値を主キーとして木構造により管理されることを表す。
本実施形態におけるセンサ情報とは、個々の情報のデータサイズが比較的小さく、かつ、その内部に複数の値を含むような情報である。そのような特徴を持つセンサ情報に対して本発明は効果的に機能する。特に、本実施の形態においては、それぞれのセンサ情報は「キー=値」の任意個の並びから構成されるuTupleデータ形式によって記述することとする。
本実施の形態では、本図に示される(キ)というセンサ情報が、ネットワーク(109)を通じて新たに一時プール登録部(101)に到着し、該情報の登録処理を行う様子を以下に詳述する。
ここで、チャンク生成装置(100)は、一時プールからSチャンクの作成を行う以下の一連の動作を起動する。なお、起動の契機は、前述の一時プール登録部(110)によるセンサ情報(102)の一時プール(101)への登録処理の完了であってもよく、あるいは、該登録処理の完了とは非同期的に、タイマー等の手段によって該動作を起動してもよい。
Sチャンク作成部(111)が特定のノードを注目点(261)として選択し、その近傍にあるデータを選択してそれを取り出し範囲(262)と定める。ここでは木構造のデータ数7個に対して、取り出し範囲の含むデータ数を3個とという定数にて動作するものとし、注目点(261)として(ア)を選択し、注目点のデータ(ア)およびその部分木を構成するデータ(オ)(キ)を取り出し範囲としている。
取り出し範囲(262)が含むセンサ情報(オ)(ア)(キ)のuTupleデータ形式
による記述を、主キー(本実施例では「A」)の値順に、テキスト形式で書き出したものとなっている。
本図の例では6つの荷札情報を保持している。例えば「50〜85:S1」という記載が荷札情報の一例であり、木の当該ノードが第9図で示すS1というファイル名の情報本体に対応する荷札情報であることを表す。このように荷札情報には情報本体を含んでおらず、対応する情報本体へのポインタ(ここではファイル名「S1」)と、検索に用いる主キーの値(ここでは「50〜85」)という情報のみが含まれている。
例えばS1というファイル名のSチャンク(104)に関しては、キー「A」の値のファイル内での最小値が50、最大値が85である。そこで、このSチャンクに対応する荷札情報(106)は、上記の値範囲「50〜85」と、該ファイル名「S1」を値として有する。同様にS2というファイル名のSチャンク(104)に関しては、対応する荷札情報(106)は値範囲「45〜65」とファイル名「S2」を値として有する。
ここで、チャンク生成装置(100)は、SチャンクプールからLチャンクの作成を行う以下の一連の動作を起動する。なお、起動の契機は、前述のSチャンクプール登録部(112)による荷札情報(106)のSチャンクプール(105)への登録処理の完了であってもよく、あるいは、該登録処理の完了とは非同期的に、タイマー等の手段によって該動作を起動してもよい。
Lチャンク作成部(113)が特定のノードを注目点(321)として選択し、その近傍にあるデータを選択してそれを取り出し範囲(322)と定める。ここでは木構造のデータ数7個に対して、取り出し範囲の含むデータ数を3個という定数にて動作するものとし、注目点(321)およびその部分木を構成するデータを取り出し範囲としている。
該ファイルは4つのブロックから構成され、第2〜第4ブロックは、上記手順において読み出したSチャンク(104)のファイル内容をそのまま写し書きしたものである。本例では、取り出し範囲(322)はS7、S2、S1の3つのSチャンクに対応する荷札情報を示しているので、これらのSチャンクのファイル内容を順に写し書きし、区切り符号「[EOB]」を末尾に付加する。これらのブロックは、センサ情報の情報本体が格納されている。
次に、以下の手順によって該ファイルの内容を読み取り、探索を行う。
まず、該装置は該ファイルのうち、先頭ブロックのみをメモリ上に読み出す。
次に該装置は、先頭ブロックのそれぞれの行に記載される荷札情報について、主キーの値の範囲と上記調査範囲との重なり集合が空集合でない行を抽出する。この例では、「A=0〜45」という範囲の情報と「10〜40」という調査範囲とは、重なり集合が10〜40という空でない範囲を持つので、この行が抽出される。その他の行は、重なりが空集合になるので、抽出されない。
この例では、1行目の「_offset=」という部分に続く16進数数値が、対応する情報本体が格納されている第2ブロックに対する当該ファイル内での先頭からのオフセット情報である。
この例では、第2ブロックには3行分のセンサ情報が記載されており、その中で高度が10〜40という調査範囲に合致するのは「A=35,D=201110611,T=23.5」という行のみなので、この行が抽出される。これが探索結果となるので、結論として調査したい気温は「摂氏23.5度」であるという結果を得る。
101:一時プール
102:センサ情報
103:Sチャンク記憶装置
104:Sチャンク
105:Sチャンクプール
106:荷札情報
107:Lチャンク記憶装置
108:Lチャンク
111:Sチャンク作成部
112:Sチャンクプール登録部
113:Lチャンク作成部
261、321:注目点
262、322:取り出し範囲
301:S7の荷札情報
Claims (8)
- 複数の情報を列挙したファイルであるチャンクを生成する装置であって、
前記装置は一時プールと第1チャンクとチャンクプールを保持し、
前記一時プールは情報を木構造で管理し、
前記第1チャンクは前記装置が生成しようとするチャンクが含むべき情報の列挙数よりは少ない数の情報を列挙したファイルであり、
前記チャンクプールは個々の前記第1チャンクのデータ範囲と前記第1チャンクの識別情報を示す荷札情報を木構造で管理し、
情報を前記一時プールに登録する機能と、
前記一時プールから木構造で近傍の情報群を取り出し前記第1チャンクを作成する機能と、
前記第1チャンクの荷札情報を生成して前記チャンクプールに登録する機能と、
前記チャンクプールから木構造で近傍の荷札情報群を取り出しそれらの荷札情報が示す前記第1チャンクの含む情報を少なくとも含む第2チャンクを作成する機能と、
を少なくとも有することを特徴とするチャンク生成装置。 - 請求項1に記載のチャンク生成装置であって、
前記第2チャンクを作成する機能は、
k個の前記第1チャンクの含む情報から前記第2チャンクを作成する際に、
前記第2チャンクは前記k個の第1チャンク内容のファイル内位置を検索するための索引情報と前記k個の第1チャンク内容の並びをその構成要素として少なくとも含む
ことを特徴とするチャンク生成装置。 - 請求項1ないし2に記載のチャンク生成装置であって、
前記一時プール及び前記チャンクプールは、前記木構造としてUBI−Tree検索木アルゴリズムを用い、
前記第1チャンクの前記荷札情報が示す前記第1チャンクのデータ範囲は複数のキーに対する値の集合として表現し、
前記第2チャンクの前記索引情報は複数のキーに対する値の集合から前記第1チャンク内容のファイル内位置を検索するための索引情報である
ことを特徴とするチャンク生成装置。 - チャンクを読み取る装置であって、
請求項2ないし3に記載のチャンク生成装置で作成されたチャンクを入力とし、索引情報を読み取る機能と、
検索条件に合致する索引情報を選択する機能と、
ファイル読み取り位置を索引情報が示すファイル内位置に移動する機能と、
前記移動したファイル内位置から前記第1チャンク内容を読み取る機能と、
を少なくとも有することを特徴とするチャンク読み取り装置。 - 複数の情報を列挙したファイルであるチャンクを生成する方法であって、
情報を一時プールに登録し、登録した情報を木構造で管理する手順と、
前記一時プールから木構造で近傍の情報群を取り出し、生成しようとするチャンクが含むべき情報の列挙数よりは少ない数の情報を列挙した第1チャンクを作成し、前記第1チャンクの荷札情報を生成してチャンクプールに登録するとともに、前記チャンクプールから木構造で近傍の荷札情報群を取り出しそれらの荷札情報が示す前記第1チャンクの含む情報を少なくとも含む第2チャンクを作成する手順と、
を順に有するチャンク生成方法。 - 請求項5に記載のチャンク生成方法であって、
k個の前記第1チャンクの含む情報から前記第2チャンクを作成する際に、
前記第2チャンクは前記k個の第1チャンク内容のファイル内位置を検索するための索引情報と前記k個の第1チャンク内容の並びをその構成要素として少なくとも含む
ことを特徴とするチャンク生成方法。 - 請求項5ないし6に記載のチャンク生成方法であって、
前記一時プール及び前記チャンクプールは、前記木構造としてUBI−Tree検索木アルゴリズムを用い、
前記第1チャンクの前記荷札情報が示す前記第1チャンクのデータ範囲は複数のキーに対する値の集合として表現し、
前記第2チャンクの前記索引情報は複数のキーに対する値の集合から前記第1チャンク内容のファイル内位置を検索するための索引情報である
ことを特徴とするチャンク生成方法。 - 請求項5ないし7のいずれかに記載の各手順をコンピュータに実行させるためのチャンク生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011150059A JP5517263B2 (ja) | 2011-07-06 | 2011-07-06 | チャンク生成装置、チャンク読み取り装置、チャンク生成方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011150059A JP5517263B2 (ja) | 2011-07-06 | 2011-07-06 | チャンク生成装置、チャンク読み取り装置、チャンク生成方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013016112A true JP2013016112A (ja) | 2013-01-24 |
JP5517263B2 JP5517263B2 (ja) | 2014-06-11 |
Family
ID=47688728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011150059A Active JP5517263B2 (ja) | 2011-07-06 | 2011-07-06 | チャンク生成装置、チャンク読み取り装置、チャンク生成方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5517263B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014170410A (ja) * | 2013-03-04 | 2014-09-18 | Nippon Telegr & Teleph Corp <Ntt> | 情報可視化装置、方法及びプログラム |
JP2015043191A (ja) * | 2013-08-26 | 2015-03-05 | 日本電信電話株式会社 | アクセス制御方法、データ蓄積方法、アクセス制御システム、データ蓄積装置及びプログラム |
JP2015043190A (ja) * | 2013-08-26 | 2015-03-05 | 日本電信電話株式会社 | 情報記録方法、及び情報記録装置、及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11184168B2 (en) * | 2016-02-19 | 2021-11-23 | Nec Corporation | Method for storing data on a storage entity |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02212972A (ja) * | 1988-12-19 | 1990-08-24 | Hewlett Packard Co <Hp> | データベース操作方法 |
JPH11232283A (ja) * | 1998-02-10 | 1999-08-27 | Hitachi Ltd | 情報検索方法 |
JP2000348038A (ja) * | 1999-06-02 | 2000-12-15 | Fujitsu Ltd | 半構造データベースのためのデータ格納装置および方法 |
JP2007011548A (ja) * | 2005-06-29 | 2007-01-18 | Fujitsu Ltd | データ集合分割プログラム、データ集合分割装置、およびデータ集合分割方法 |
JP2011008525A (ja) * | 2009-06-25 | 2011-01-13 | Toshiba Corp | 情報処理装置及び映像処理方法 |
JP2011044083A (ja) * | 2009-08-24 | 2011-03-03 | Nippon Telegr & Teleph Corp <Ntt> | 情報蓄積検索方法、情報蓄積検索装置、およびプログラム |
-
2011
- 2011-07-06 JP JP2011150059A patent/JP5517263B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02212972A (ja) * | 1988-12-19 | 1990-08-24 | Hewlett Packard Co <Hp> | データベース操作方法 |
JPH11232283A (ja) * | 1998-02-10 | 1999-08-27 | Hitachi Ltd | 情報検索方法 |
JP2000348038A (ja) * | 1999-06-02 | 2000-12-15 | Fujitsu Ltd | 半構造データベースのためのデータ格納装置および方法 |
JP2007011548A (ja) * | 2005-06-29 | 2007-01-18 | Fujitsu Ltd | データ集合分割プログラム、データ集合分割装置、およびデータ集合分割方法 |
JP2011008525A (ja) * | 2009-06-25 | 2011-01-13 | Toshiba Corp | 情報処理装置及び映像処理方法 |
JP2011044083A (ja) * | 2009-08-24 | 2011-03-03 | Nippon Telegr & Teleph Corp <Ntt> | 情報蓄積検索方法、情報蓄積検索装置、およびプログラム |
Non-Patent Citations (8)
Title |
---|
CSNG201000638011; 柏木 啓一郎 他: '大量スキーマレスデータの蓄積・検索を実現する新しいuTupleSpaceの設計と実装' マルチメディア,分散,協調とモバイル(DICOMO2010)シンポジウム論文集 Vol.2010,No.1, 20100707, pp.76-82., 社団法人情報処理学会 * |
CSNG201000750007; 荒川 豊 他: 'ユビキタスデータのためのインデキシング技術UBI-treeの改良' 電子情報通信学会技術研究報告 Vol.110 No.162(DE2010-22), 20100728, pp.47-52., 社団法人電子情報通信学会 * |
CSNJ201010047297; 荒川 豊 他: 'UBI-tree:ユビキタスデータのためのインデキシング技術' 情報処理学会 第72回(平成22年)全国大会講演論文集 Vol.1,No.5C-1, 20100308, pp.1-615〜1-616., 社団法人情報処理学会 * |
CSNJ201110053441; 中村 隆幸 他: 'ユビキタスデータ共有機構uTupleSpaceにおける新しいチャンク形式と高速探索' 電子情報通信学会2011年通信ソサイエティ大会講演論文集 Vol.2,No.B-19-23, 20110830, p.441., 社団法人電子情報通信学会 * |
JPN6013063866; 荒川 豊 他: 'UBI-tree:ユビキタスデータのためのインデキシング技術' 情報処理学会 第72回(平成22年)全国大会講演論文集 Vol.1,No.5C-1, 20100308, pp.1-615〜1-616., 社団法人情報処理学会 * |
JPN6013063867; 柏木 啓一郎 他: '大量スキーマレスデータの蓄積・検索を実現する新しいuTupleSpaceの設計と実装' マルチメディア,分散,協調とモバイル(DICOMO2010)シンポジウム論文集 Vol.2010,No.1, 20100707, pp.76-82., 社団法人情報処理学会 * |
JPN6013063869; 荒川 豊 他: 'ユビキタスデータのためのインデキシング技術UBI-treeの改良' 電子情報通信学会技術研究報告 Vol.110 No.162(DE2010-22), 20100728, pp.47-52., 社団法人電子情報通信学会 * |
JPN6013063870; 中村 隆幸 他: 'ユビキタスデータ共有機構uTupleSpaceにおける新しいチャンク形式と高速探索' 電子情報通信学会2011年通信ソサイエティ大会講演論文集 Vol.2,No.B-19-23, 20110830, p.441., 社団法人電子情報通信学会 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014170410A (ja) * | 2013-03-04 | 2014-09-18 | Nippon Telegr & Teleph Corp <Ntt> | 情報可視化装置、方法及びプログラム |
JP2015043191A (ja) * | 2013-08-26 | 2015-03-05 | 日本電信電話株式会社 | アクセス制御方法、データ蓄積方法、アクセス制御システム、データ蓄積装置及びプログラム |
JP2015043190A (ja) * | 2013-08-26 | 2015-03-05 | 日本電信電話株式会社 | 情報記録方法、及び情報記録装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5517263B2 (ja) | 2014-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200334295A1 (en) | Merge tree garbage metrics | |
TWI682274B (zh) | 鍵值儲存樹 | |
US20200334294A1 (en) | Merge tree modifications for maintenance operations | |
TWI719281B (zh) | 用於串流選擇之系統、機器可讀媒體、及機器實施之方法 | |
US10642515B2 (en) | Data storage method, electronic device, and computer non-volatile storage medium | |
US10783186B2 (en) | Heterogenous key-value sets in tree database | |
CN103678491A (zh) | 一种基于Hadoop中小文件优化和倒排索引的方法 | |
CN103914483B (zh) | 文件存储方法、装置及文件读取方法、装置 | |
CN107357843B (zh) | 基于数据流结构的海量网络数据查找方法 | |
JP5517263B2 (ja) | チャンク生成装置、チャンク読み取り装置、チャンク生成方法及びプログラム | |
CN104915148A (zh) | 用于串流存储装置中的高效内容高速缓冲存储的系统和方法 | |
JP4491480B2 (ja) | インデクス構築方法、文書検索装置及びインデクス構築プログラム | |
KR101218087B1 (ko) | 하둡 맵리듀스에서 바이너리 형태의 데이터 분석을 위한 입력포맷 추출방법 및 이를 이용한 바이너리 데이터의 분석방법 | |
CN111045994A (zh) | 一种基于kv数据库的文件分类检索方法及系统 | |
JP2015176407A (ja) | 検索装置、検索方法、検索用プログラムおよび検索用データ構造 | |
CN105930534B (zh) | 一种基于云存储服务价格的数据碎片减少方法 | |
JP5871698B2 (ja) | 情報蓄積検索装置 | |
CN109408462A (zh) | 一种基于教育系统的文件存储管理方法及电子设备 | |
WO2014061305A1 (ja) | エントリ挿入装置、方法、及びプログラム | |
KR100908301B1 (ko) | 리스트 기반 최대빈번 서브트리 추출 방법 및 장치 | |
CN111566627A (zh) | 信息蓄积装置、数据处理系统及程序 | |
JP5687219B2 (ja) | データ検索システム、データ検索方法及びデータ検索プログラム | |
JP2022522214A (ja) | 移動中のデータの処理技術 | |
CN115238131A (zh) | 基于映射表与链表相结合的信令超时会话检索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130712 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140107 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140327 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5517263 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |