JP7105982B2 - 構造化レコード取得 - Google Patents
構造化レコード取得 Download PDFInfo
- Publication number
- JP7105982B2 JP7105982B2 JP2021500940A JP2021500940A JP7105982B2 JP 7105982 B2 JP7105982 B2 JP 7105982B2 JP 2021500940 A JP2021500940 A JP 2021500940A JP 2021500940 A JP2021500940 A JP 2021500940A JP 7105982 B2 JP7105982 B2 JP 7105982B2
- Authority
- JP
- Japan
- Prior art keywords
- index
- records
- segments
- query
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/81—Indexing, e.g. XML tags; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/83—Querying
- G06F16/835—Query processing
Description
本願は、2018年7月25日に出願された米国仮出願第62/702,992号の利益を主張するものであり、この出願を、参照により本明細書に組み込む。
Claims (17)
- 複数の構造化レコードを保存するデータストアにおけるレコードを見つけるための、ソフトウェア命令及びデータレコードを保存するために少なくとも1つのストレージデバイスに接続された少なくとも1つのプロセッサを備えるプログラム可能なコンピューティングシステムで実行される方法であって、
前記ソフトウェア命令を実行する前記プログラム可能なコンピューティングシステムによって、前記データストアに保存されている前記複数の構造化レコードにアクセスするステップであって、前記複数の構造化レコードの少なくともいくつかのレコードがそれぞれ、それぞれのレコードの複数のセグメントを含み、それぞれのレコードの前記複数のセグメントの各セグメントが、セグメントのネスト化階層における位置を有し、それぞれのレコードの前記複数のセグメントの少なくともいくつかのセグメントが、1又は2以上の対応する値に関連付けられている、前記複数の構造化レコードにアクセスするステップと、
前記ソフトウェア命令を実行する前記プログラム可能なコンピューティングシステムによって、前記複数の構造化レコードをインデックス化するステップであって、
前記ソフトウェア命令を実行する前記プログラム可能なコンピューティングシステムによって、インデックスデータ構造を形成するステップであって、前記インデックスデータ構造が、前記複数の構造化レコードのレコードを複数のキーに関連付け、各キーが、セグメント及びセグメントの前記ネスト化階層における前記セグメントの位置に対応する値を含み、各キーが、前記キーを関連するレコードに関連付ける対応する指標に関連付けられている、前記インデックスデータ構造を形成するステップと、
前記インデックスデータ構造において、前記ソフトウェア命令を実行する前記プログラム可能なコンピューティングシステムによって、前記複数の構造化レコードの少なくともいくつかの各レコードを対応する1又は2以上のキーに関連付けるステップであって、第1のレコードを第1のキーに関連付けるステップが、前記第1のレコードを解析して、前記第1のレコードの第1のセグメントに対応するとともにセグメントの前記ネスト化階層における前記第1のセグメントの第1の位置に対応する第1の値を識別するステップと、前記第1の値及び前記第1の位置を含む前記第1のキーに関連付けられた前記インデックスデータ構造における特定の指標を更新して、前記第1のレコードを識別するステップと、を含む、前記複数の構造化レコードの少なくともいくつかの各レコードを対応する1又は2以上のキーに関連付けるステップと、
を含む、前記複数の構造化レコードをインデックス化するステップと、
前記ソフトウェア命令を実行する前記プログラム可能なコンピューティングシステムによって、クエリを処理して、前記インデックスデータ構造を用いて前記クエリに一致する前記複数の構造化レコードのレコードを取得するステップであって、
第1のクエリ位置及び第1のクエリ値を表す少なくとも第1のキーを含む1又は2以上のキーのセットを決定するステップを含む、前記ソフトウェア命令を実行する前記プログラム可能なコンピューティングシステムによって、前記クエリを処理するステップと、
前記ソフトウェア命令を実行する前記プログラム可能なコンピューティングシステムによって、前記クエリに一致する前記複数の構造化レコードの指標を決定するステップであって、前記第1のキーに基づいて前記インデックスデータ構造から第1の指標を取得するステップと、前記第1の指標に基づいて前記複数の構造化レコードの前記指標を決定するステップと、を含む、前記複数の構造化レコードの指標を決定するステップと、
前記ソフトウェア命令を実行する前記プログラム可能なコンピューティングシステムによって、前記指標に従って前記データストアから前記複数の構造化レコードのサブセットを取得するステップと
を含む、前記複数の構造化レコードのレコードを取得するステップと
を含む、前記方法。 - 前記構造化レコードにアクセスするステップが、前記データストアから前記構造化レコードを受信するステップを含み、
前記構造化レコードをインデックス化するステップが、インデックス化後に前記データストアのコピーを維持することなく実行される、請求項1に記載の方法。 - 前記構造化レコードにアクセスするステップが、
前記構造化レコードを受信するステップと、
前記構造化レコードを、受信されたレコードのフォーマットで、又は圧縮フォーマットで、前記データストアに保存するステップと
を含み、
前記構造化レコードの前記インデックス化は、前記データストアの表形式表現を形成することを必要としない、請求項1に記載の方法。 - セグメントの前記ネスト化階層が、セグメントの文法を用いて表され、
前記第1のレコードを解析するステップが、前記文法を用いて、前記第1のレコード内のセグメントのネスティングに従って前記第1の位置を識別するステップを含む、請求項1~3のいずれかに記載の方法。 - セグメントのネスト化階層におけるセグメントの各個別の位置が、異なる番号によって表される、請求項1~4のいずれかに記載の方法。
- 各指標が、対応するキーに関連付けられ、前記キーに関連付けられた前記複数のレコードの1又は2以上のレコードのビットベクトル表現を含む、請求項1~5のいずれかに記載の方法。
- 前記複数のキーの各キーについて、前記ネスト化階層における位置が、前記ネスト化階層におけるパスとして表される、請求項1~6のいずれかに記載の方法。
- 前記複数のキーの各キーについて、前記ネスト化階層における位置が数値識別子として表される、請求項1~6のいずれかに記載の方法。
- 1又は2以上のキーの前記セットが、第2のクエリ値及び第2のクエリ位置を含む第2のキーを含み、
前記複数の構造化レコードの前記指標を決定するステップが、前記第2のキーに基づいて前記インデックスデータ構造から第2の指標を取得するステップをさらに含み、
前記複数のレコードの前記サブセットの前記指標を決定するステップがさらに前記第2の指標に基づく、請求項1~8のいずれかに記載の方法。 - 前記クエリが、前記第1のキーに関連付けられた第1の用語及び前記第2のキーに関連付けられた第2の用語を含む、用語のブーリアン結合を定義し、
前記複数のレコードの前記サブセットの前記指標を決定するステップが、前記第1の指標と前記第2の指標のブーリアン結合に基づく、請求項9に記載の方法。 - レコードの少なくともいくつかのセグメントが、1より多くの対応する値に関連付けられ、各値がセグメントにおいて異なるオフセットを有し、前記クエリが、セグメントに関連付けられた複数の値内のオフセットを表すオフセットをさらに含む、請求項1~10のいずれかに記載の方法。
- 前記オフセットが前記セグメントの成分を識別する、請求項11に記載の方法。
- 前記オフセットが前記セグメント内の値をさらに識別する、請求項12に記載の方法。
- 前記オフセットが、前記セグメントの成分の列挙への数値参照として前記成分を識別し、前記オフセットが、前記成分における値の列挙への数値参照として前記セグメント内の前記値を識別する、請求項13に記載の方法。
- 前記構造化レコードが、許容されるレコードのセット及びセグメントの前記ネスト化階層を定義する仕様に準拠し、
前記仕様が、事前定義されたセグメントのネスト化階層における、個別のネスト化コンテキストのそれぞれの識別子を含み;かつ
前記クエリを処理するステップが、
クエリセグメント、及びセグメントの前記ネスト化階層の他のセグメント内の前記クエリセグメントのネスティングを指定する第1のクエリコンテキストを識別する少なくとも前記第1のキーを含み、かつ第1のクエリ値を含む、前記1又は2以上のキーのセットを決定することを含む、前記クエリを処理することを含む、請求項1に記載の方法。 - コンピュータ可読媒体上に非一時的な形式で保存されたソフトウェアであって、請求項1~15のいずれかのすべてのステップをコンピューティングシステムに実行させるための命令を含む、ソフトウェア。
- クエリに一致するデータストアにおける複数の構造化レコードのレコードを見つけるためのコンピューティングシステムであって、請求項1~15のいずれかのすべてのステップを実行するように構成されている、コンピューティングシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862702992P | 2018-07-25 | 2018-07-25 | |
US62/702,992 | 2018-07-25 | ||
PCT/US2019/043387 WO2020023719A1 (en) | 2018-07-25 | 2019-07-25 | Structured record retrieval |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022503456A JP2022503456A (ja) | 2022-01-12 |
JP7105982B2 true JP7105982B2 (ja) | 2022-07-25 |
Family
ID=67620527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021500940A Active JP7105982B2 (ja) | 2018-07-25 | 2019-07-25 | 構造化レコード取得 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11294874B2 (ja) |
EP (1) | EP3827360A1 (ja) |
JP (1) | JP7105982B2 (ja) |
CN (1) | CN112513836B (ja) |
AU (1) | AU2019309856B2 (ja) |
CA (1) | CA3105818C (ja) |
SG (1) | SG11202012876SA (ja) |
WO (1) | WO2020023719A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11449495B2 (en) * | 2017-02-01 | 2022-09-20 | United Parcel Service Of America, Inc. | Indexable database profiles comprising multi-language encoding data and methods for generating the same |
US11032078B2 (en) * | 2019-02-04 | 2021-06-08 | Mastercard International Incorporated | Method and system for blockchain wallet dynamic private key |
US20210182785A1 (en) * | 2020-02-16 | 2021-06-17 | Michael Anburaj | Apparatus for secure delivery of a package |
US20220269732A1 (en) * | 2021-02-24 | 2022-08-25 | Vmware, Inc. | Generation of a recommendation for automatic transformation of times series data at ingestion |
CN114579573B (zh) * | 2022-03-03 | 2022-12-09 | 北京百度网讯科技有限公司 | 信息检索方法、装置、电子设备以及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020010714A1 (en) | 1997-04-22 | 2002-01-24 | Greg Hetherington | Method and apparatus for processing free-format data |
US20180046655A1 (en) | 2016-08-10 | 2018-02-15 | Moonshadow Mobile, Inc. | Systems, methods, and data structures for high-speed searching or filtering of large datasets |
JP2018045285A (ja) | 2016-09-12 | 2018-03-22 | 富士通株式会社 | 情報処理システム、制御装置、処理プログラム、及び処理方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5657437A (en) * | 1993-12-10 | 1997-08-12 | Lucent Technologies Inc. | Data processing apparatus and method including proportional updating of data |
US6208993B1 (en) * | 1996-07-26 | 2001-03-27 | Ori Software Development Ltd. | Method for organizing directories |
JP3692764B2 (ja) * | 1998-02-25 | 2005-09-07 | 株式会社日立製作所 | 構造化文書登録方法、検索方法、およびそれに用いられる可搬型媒体 |
US6912529B1 (en) * | 1998-04-01 | 2005-06-28 | Multex Systems, Inc. | Method and system for storing and retrieving documents |
US6070164A (en) * | 1998-05-09 | 2000-05-30 | Information Systems Corporation | Database method and apparatus using hierarchical bit vector index structure |
US6421662B1 (en) * | 1999-06-04 | 2002-07-16 | Oracle Corporation | Generating and implementing indexes based on criteria set forth in queries |
CN1293502C (zh) * | 1999-06-30 | 2007-01-03 | 倾向探测公司 | 用于监控网络流量的方法和设备 |
US6560610B1 (en) | 1999-08-10 | 2003-05-06 | Washington University | Data structure using a tree bitmap and method for rapid classification of data in a database |
US7634498B2 (en) | 2003-10-24 | 2009-12-15 | Microsoft Corporation | Indexing XML datatype content system and method |
US7885980B2 (en) * | 2004-07-02 | 2011-02-08 | Oracle International Corporation | Mechanism for improving performance on XML over XML data using path subsetting |
NO20085365A (no) * | 2008-12-22 | 2010-04-19 | Fast Search & Transfer As | Invertert indeks for kontekstuell søk |
RU2013124949A (ru) * | 2010-10-30 | 2014-12-10 | БЛЕККО, Инк. | Динамическое отображение результатов поиска |
US10061562B2 (en) | 2012-09-29 | 2018-08-28 | Pivotal Software, Inc. | Random number generator in a parallel processing database |
CA2939915C (en) * | 2014-03-07 | 2021-02-16 | Ab Initio Technology Llc | Managing data profiling operations related to data type |
US10579627B2 (en) * | 2016-01-08 | 2020-03-03 | Microsoft Technology Licensing, Llc | Database operation using metadata of data sources |
US10498683B2 (en) * | 2016-07-20 | 2019-12-03 | At&T Intellectual Property I, L.P. | Compressed message sets for storage efficiency |
US10885081B2 (en) * | 2018-07-02 | 2021-01-05 | Optum Technology, Inc. | Systems and methods for contextual ranking of search results |
-
2019
- 2019-07-25 AU AU2019309856A patent/AU2019309856B2/en active Active
- 2019-07-25 WO PCT/US2019/043387 patent/WO2020023719A1/en active Application Filing
- 2019-07-25 CA CA3105818A patent/CA3105818C/en active Active
- 2019-07-25 SG SG11202012876SA patent/SG11202012876SA/en unknown
- 2019-07-25 EP EP19753222.9A patent/EP3827360A1/en active Pending
- 2019-07-25 JP JP2021500940A patent/JP7105982B2/ja active Active
- 2019-07-25 CN CN201980049550.3A patent/CN112513836B/zh active Active
- 2019-07-25 US US16/521,934 patent/US11294874B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020010714A1 (en) | 1997-04-22 | 2002-01-24 | Greg Hetherington | Method and apparatus for processing free-format data |
US20180046655A1 (en) | 2016-08-10 | 2018-02-15 | Moonshadow Mobile, Inc. | Systems, methods, and data structures for high-speed searching or filtering of large datasets |
JP2018045285A (ja) | 2016-09-12 | 2018-03-22 | 富士通株式会社 | 情報処理システム、制御装置、処理プログラム、及び処理方法 |
Also Published As
Publication number | Publication date |
---|---|
CA3105818C (en) | 2023-08-22 |
JP2022503456A (ja) | 2022-01-12 |
AU2019309856B2 (en) | 2022-05-26 |
US11294874B2 (en) | 2022-04-05 |
US20200034345A1 (en) | 2020-01-30 |
AU2019309856A1 (en) | 2021-01-21 |
SG11202012876SA (en) | 2021-01-28 |
WO2020023719A1 (en) | 2020-01-30 |
CN112513836B (zh) | 2024-03-26 |
CN112513836A (zh) | 2021-03-16 |
CA3105818A1 (en) | 2020-01-30 |
EP3827360A1 (en) | 2021-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7105982B2 (ja) | 構造化レコード取得 | |
US11475034B2 (en) | Schemaless to relational representation conversion | |
US10659467B1 (en) | Distributed storage and distributed processing query statement reconstruction in accordance with a policy | |
EP3066585B1 (en) | Generic indexing for efficiently supporting ad-hoc query over hierarchically marked-up data | |
JP4688111B2 (ja) | 情報処理装置、データベース・システム、情報処理方法、およびプログラム | |
US6742001B2 (en) | System and method for sharing data between hierarchical databases | |
CN103902698B (zh) | 一种数据存储系统和存储方法 | |
US9870382B2 (en) | Data encoding and corresponding data structure | |
US7577637B2 (en) | Communication optimization for parallel execution of user-defined table functions | |
US10733172B2 (en) | Method and computing device for minimizing accesses to data storage in conjunction with maintaining a B-tree | |
US20170147674A1 (en) | Storing and retrieving data of a data cube | |
US20060200438A1 (en) | System and method for retrieving data from a relational database management system | |
US20130006968A1 (en) | Data integration system | |
WO2011142134A1 (ja) | 情報検索装置、情報検索方法、コンピュータ・プログラムおよびデータ構造 | |
WO2015010509A1 (zh) | 一种基于一维线性空间实现Trie树的词典检索方法 | |
GB2537670A (en) | A query mediator, a method of querying a polyglot data tier and a computer program executable to carry out a method of querying a polyglot data tier | |
US20080270352A1 (en) | Modifying entry names in directory server | |
US9053207B2 (en) | Adaptive query expression builder for an on-demand data service | |
US8756246B2 (en) | Method and system for caching lexical mappings for RDF data | |
US9747363B1 (en) | Efficient storage and retrieval of sparse arrays of identifier-value pairs | |
CN109376154A (zh) | 数据读取、写入方法及数据读取、写入系统 | |
US10185742B2 (en) | Flexible text searching for data objects of object notation | |
JP2006092409A (ja) | 複合データベース検索システムおよび複合データベース検索方法ならびにそのためのプログラム | |
JP5374456B2 (ja) | 文書検索装置の動作方法およびこれをコンピュータに実行させるためのコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220613 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220712 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7105982 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |