JP2021501427A - コンテンツ非依存のファイルインデックス化の方法及びシステム - Google Patents
コンテンツ非依存のファイルインデックス化の方法及びシステム Download PDFInfo
- Publication number
- JP2021501427A JP2021501427A JP2020541645A JP2020541645A JP2021501427A JP 2021501427 A JP2021501427 A JP 2021501427A JP 2020541645 A JP2020541645 A JP 2020541645A JP 2020541645 A JP2020541645 A JP 2020541645A JP 2021501427 A JP2021501427 A JP 2021501427A
- Authority
- JP
- Japan
- Prior art keywords
- index
- data file
- length
- data
- transmitting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1744—Redundancy elimination performed by the file system using compression, e.g. sparse files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2237—Vectors, bitmaps or matrices
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3068—Precoding preceding compression, e.g. Burrows-Wheeler transformation
- H03M7/3077—Sorting
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/55—Compression Theory, e.g. compression of random number, repeated compression
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
01
{00} {01} {10} {11}
が生成される。
{00} {01} {10} {11}
d^n=p(i)
(d^n)n=p(f)
d=システムの次数(order)
n=システムの次数に対して適切なn値単位(n-ary units)それぞれにおける長さ
p(i)=初期インデックス
p(f)=最終インデックス
Claims (20)
- バイナリデータファイルのコンテンツ非依存の参照のための、コンピュータにより実現される方法であって、
前記バイナリデータファイルの長さを決定するステップであり、前記長さは前記バイナリデータファイルのビット数を含む、ステップと、
前記決定された長さについて、前記決定された長さのデータの全ての順列を生成するステップと、
前記生成された順列内においてインデックスの位置を特定するステップであり、前記インデックスは前記生成された順列内における前記バイナリデータファイルの開始位置である、ステップと、
前記長さ及び前記インデックスを使用して前記バイナリデータファイルを示すステップと、
を含む方法。 - 前記長さ及び前記インデックスを使用して前記バイナリデータファイルを示すステップは、
記憶デバイスに前記バイナリデータファイルの代わりに前記長さ及び前記インデックスを持続するステップを含む、請求項1に記載の方法。 - 前記長さ及び前記インデックスを使用して前記バイナリデータファイルを示すステップは、
前記データファイルの代わりに前記長さ及び前記インデックスを送信するステップを含む、請求項1に記載の方法。 - 送信するステップは、前記長さ及びインデックスをネットワーク上で送信する、請求項3に記載の方法。
- 送信するステップは、前記長さ及びインデックスをバス上で送信する、請求項3に記載の方法。
- データ長さ及びインデックスに基づいてデータを取り出す方法であって、
前記長さのデータの全ての順列を生成するステップと、
前記インデックスに位置するデータの順列を返すステップと、
を含む方法。 - バイトのシーケンスを含むデータファイルを圧縮する方法であって、
前記データファイル内のバイト数を算出するステップと、
前記算出されたバイト数のサイズのデータの全ての可能な順列を生成するステップと、
前記生成された順列を検索して、前記データファイルにマッチする順列の位置を特定するステップと、
前記位置を特定された順列のインデックスを決定するステップと、
前記バイト数及びインデックスを使用して前記データファイルを示すステップと、
を含む方法。 - 前記バイト数及びインデックスを使用して前記データファイルを示すステップは、前記バイト数及びインデックスを記憶デバイスに持続するステップを含む、請求項7に記載の方法。
- 前記記憶デバイスはディスクである、請求項8に記載の方法。
- 前記バイト数及びインデックスを使用して前記データファイルを示すステップは、前記データファイルの代わりに前記バイト数及びインデックスを送信するステップを含む、請求項9に記載の方法。
- 送信するステップは、前記バイト及びインデックスをネットワークを通じて送信する、請求項10に記載の方法。
- 送信するステップは、前記バイト及びインデックスをバスを介して送信する、請求項10に記載の方法。
- データファイルを圧縮する方法であって、
前記データファイルのサイズを算出するステップと、
前記サイズのデータファイルのデータの全ての可能な順列を生成するステップと、
前記生成された順列を検索して、前記データファイルにマッチする順列の位置を特定するステップと、
前記位置を特定された順列のインデックスを決定するステップと、
前記サイズ及びインデックスを使用して前記データファイルを示すステップと、
を含む方法。 - 前記データファイルはバイナリデータである、請求項13に記載の方法。
- 前記データファイルはn値データのデータである、請求項13に記載の方法。
- 前記インデックスは整数である、請求項13に記載の方法。
- 前記サイズ及びインデックスを使用して前記データファイルを示すステップは、前記サイズ及びインデックスを送信するステップを含む、請求項13に記載の方法。
- 送信するステップは、ネットワーク上で送信するステップを含む、請求項17に記載の方法。
- 送信するステップは、バス上で送信するステップを含む、請求項17に記載の方法。
- 前記サイズ及びインデックスを使用して前記データファイルを示すステップは、前記サイズ及びインデックスを記憶するステップを含む、請求項13に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/730,043 US10963429B2 (en) | 2017-10-11 | 2017-10-11 | Method and system for content agnostic file indexing |
US15/730,043 | 2017-10-11 | ||
PCT/US2018/055366 WO2019075175A1 (en) | 2017-10-11 | 2018-10-11 | METHOD AND SYSTEM FOR INDEXING FILE NOT BASED ON CONTENT |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021501427A true JP2021501427A (ja) | 2021-01-14 |
JP7047110B2 JP7047110B2 (ja) | 2022-04-04 |
Family
ID=65992536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020541645A Active JP7047110B2 (ja) | 2017-10-11 | 2018-10-11 | コンテンツ非依存のファイルインデックス化の方法及びシステム |
Country Status (5)
Country | Link |
---|---|
US (2) | US10963429B2 (ja) |
EP (1) | EP3695308A4 (ja) |
JP (1) | JP7047110B2 (ja) |
CN (1) | CN111465929B (ja) |
WO (1) | WO2019075175A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10963429B2 (en) | 2017-10-11 | 2021-03-30 | Lognovations Holdings, Llc | Method and system for content agnostic file indexing |
US11138152B2 (en) | 2017-10-11 | 2021-10-05 | Lognovations Holdings, Llc | Method and system for content agnostic file indexing |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0563583A (ja) * | 1991-08-30 | 1993-03-12 | Nec Corp | データ圧縮及び復元方法並びにこれらの方法を使用した電子交換機におけるバツクアツプ方法 |
US20060244639A1 (en) * | 2003-10-17 | 2006-11-02 | Bruce Parker | Data compression system and method |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4168513A (en) | 1977-09-12 | 1979-09-18 | Xerox Corporation | Regenerative decoding of binary data using minimum redundancy codes |
US5003597A (en) | 1989-12-21 | 1991-03-26 | Xerox Corporation | Method and apparatus for data encryption |
US5442350A (en) | 1992-10-29 | 1995-08-15 | International Business Machines Corporation | Method and means providing static dictionary structures for compressing character data and expanding compressed data |
JP3397431B2 (ja) | 1994-03-16 | 2003-04-14 | 富士通株式会社 | データ圧縮方法および装置ならびにデータ復元方法および装置 |
US5486826A (en) | 1994-05-19 | 1996-01-23 | Ps Venture 1 Llc | Method and apparatus for iterative compression of digital data |
US5594435A (en) | 1995-09-13 | 1997-01-14 | Philosophers' Stone Llc | Permutation-based data compression |
US5937183A (en) | 1996-11-05 | 1999-08-10 | Nec Usa, Inc. | Enhanced binary decision diagram-based functional simulation |
CN1437738A (zh) | 2000-01-03 | 2003-08-20 | 埃菲克塔技术股份有限公司 | 数据发送和存储的有效且无损耗转换 |
US6785859B2 (en) | 2000-08-04 | 2004-08-31 | Texas Instruments Incorporated | Interleaver for variable block size |
US7636724B2 (en) | 2001-08-31 | 2009-12-22 | Peerify Technologies LLC | Data storage system and method by shredding and deshredding |
US7882139B2 (en) | 2003-09-29 | 2011-02-01 | Xunlei Networking Technologies, Ltd | Content oriented index and search method and system |
CN100571389C (zh) | 2004-06-29 | 2009-12-16 | 奥林巴斯株式会社 | 用于图像编码/解码和扩展图像压缩解压缩的方法和设备 |
WO2007088870A1 (ja) | 2006-02-02 | 2007-08-09 | Mitsubishi Electric Corporation | 検査行列生成方法、符号化方法、復号方法、通信装置、符号化器および復号器 |
JP2010503257A (ja) | 2006-09-01 | 2010-01-28 | パクバイト ソフトウエア プロプライアタリー リミティド | データネットワーク上においてデータファイルを伝送する方法及びシステム |
US8521540B2 (en) | 2007-08-17 | 2013-08-27 | Qualcomm Incorporated | Encoding and/or decoding digital signals using a permutation value |
US7809765B2 (en) | 2007-08-24 | 2010-10-05 | General Electric Company | Sequence identification and analysis |
US7868788B2 (en) | 2008-06-17 | 2011-01-11 | The Hong Kong University Of Science And Technology | System and method for encoding data based on a compression technique with security features |
US8533166B1 (en) | 2010-08-20 | 2013-09-10 | Brevity Ventures LLC | Methods and systems for encoding/decoding files and transmission thereof |
JP5412414B2 (ja) | 2010-12-08 | 2014-02-12 | 株式会社日立製作所 | 検索可能暗号処理システム |
US9639543B2 (en) | 2010-12-28 | 2017-05-02 | Microsoft Technology Licensing, Llc | Adaptive index for data deduplication |
FR2979043B1 (fr) | 2011-08-12 | 2016-02-12 | Gratzer And Partners | Dispositif et procede de compression de cles publiques pour algorithme de chiffrement pleinement homomorphique |
WO2013134735A1 (en) | 2012-03-08 | 2013-09-12 | California Institute Of Technology | Rank-modulation rewriting codes for flash memories |
WO2013159112A1 (en) | 2012-04-20 | 2013-10-24 | The Board Of Regents Of The University Of Texas System | Systems and methods for simultaneous compression and encryption |
US10135462B1 (en) | 2012-06-13 | 2018-11-20 | EMC IP Holding Company LLC | Deduplication using sub-chunk fingerprints |
KR101795771B1 (ko) | 2013-03-18 | 2017-11-09 | 한국전자통신연구원 | 정수 기반 준동형 암호 기법에서 압축 암복호화를 제공하는 시스템 및 방법 |
US9124295B2 (en) * | 2013-11-14 | 2015-09-01 | Nicolas Thomas Mathieu Dupont | System and method for data compression and transmission |
KR102019159B1 (ko) | 2013-12-23 | 2019-09-09 | 한국전자통신연구원 | 정수 기반 준동형 암호 기법에 일반적으로 적용 가능한 압축 암복호화 장치 및 방법 |
GB2542707B (en) | 2015-07-03 | 2020-02-12 | Sisp Tech Ltd | Data processing method and apparatus |
GB2543492B (en) | 2015-10-16 | 2021-11-10 | Digital Barriers Services Ltd | Data Compression |
JP2017122951A (ja) * | 2016-01-04 | 2017-07-13 | 富士通株式会社 | 情報処理装置、十進数変換方法および十進数変換プログラム |
CN108667595B (zh) | 2017-03-28 | 2021-05-14 | 吉林化工学院 | 一种大数据文件的压缩加密方法 |
CN107135062B (zh) | 2017-05-08 | 2020-10-30 | 桂林电子科技大学 | 一种改进的大文件的加密方法 |
CN109300508B (zh) * | 2017-07-25 | 2020-08-11 | 南京金斯瑞生物科技有限公司 | 一种dna数据存储编码解码方法 |
US11138152B2 (en) | 2017-10-11 | 2021-10-05 | Lognovations Holdings, Llc | Method and system for content agnostic file indexing |
US10963429B2 (en) | 2017-10-11 | 2021-03-30 | Lognovations Holdings, Llc | Method and system for content agnostic file indexing |
US11032769B2 (en) | 2017-12-18 | 2021-06-08 | Silicon Laboratories Inc. | Hierarchical wakeup apparatus and method |
CN108924552B (zh) | 2018-08-07 | 2019-11-22 | 华中科技大学 | 基于同态加密的jpeg图像密文下解压缩方法及系统 |
-
2017
- 2017-10-11 US US15/730,043 patent/US10963429B2/en active Active
-
2018
- 2018-10-11 JP JP2020541645A patent/JP7047110B2/ja active Active
- 2018-10-11 EP EP18866530.1A patent/EP3695308A4/en not_active Withdrawn
- 2018-10-11 CN CN201880079726.5A patent/CN111465929B/zh active Active
- 2018-10-11 WO PCT/US2018/055366 patent/WO2019075175A1/en unknown
-
2021
- 2021-02-23 US US17/183,178 patent/US11544225B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0563583A (ja) * | 1991-08-30 | 1993-03-12 | Nec Corp | データ圧縮及び復元方法並びにこれらの方法を使用した電子交換機におけるバツクアツプ方法 |
US20060244639A1 (en) * | 2003-10-17 | 2006-11-02 | Bruce Parker | Data compression system and method |
JP2007508753A (ja) * | 2003-10-17 | 2007-04-05 | パクバイト ソフトウエア プロプライアタリー リミティド | データ圧縮システム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3695308A4 (en) | 2021-07-07 |
CN111465929A (zh) | 2020-07-28 |
US10963429B2 (en) | 2021-03-30 |
US11544225B2 (en) | 2023-01-03 |
WO2019075175A1 (en) | 2019-04-18 |
CN111465929B (zh) | 2023-11-17 |
JP7047110B2 (ja) | 2022-04-04 |
US20190108237A1 (en) | 2019-04-11 |
EP3695308A1 (en) | 2020-08-19 |
US20210173816A1 (en) | 2021-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11853389B2 (en) | Methods and apparatus for sorting data | |
US20180196609A1 (en) | Data Deduplication Using Multi-Chunk Predictive Encoding | |
US10025773B2 (en) | System and method for natural language processing using synthetic text | |
US10680645B2 (en) | System and method for data storage, transfer, synchronization, and security using codeword probability estimation | |
US10698912B2 (en) | Method for processing a database query | |
CN105719001A (zh) | 使用散列的神经网络中的大规模分类 | |
JP2018081702A (ja) | 文抽出方法及びシステム | |
KR20130062889A (ko) | 데이터 압축 방법 및 시스템 | |
CN106156070B (zh) | 一种查询方法、文件合并方法与相关装置 | |
US20150293968A1 (en) | Group-by processing for data containing singleton groups | |
CN111078672B (zh) | 数据库的数据对比方法及装置 | |
EP3356951A1 (en) | Managing a database of patterns used to identify subsequences in logs | |
JP7047110B2 (ja) | コンテンツ非依存のファイルインデックス化の方法及びシステム | |
Behera et al. | KmerEstimate: a streaming algorithm for estimating k-mer counts with optimal space usage | |
US20240113728A1 (en) | System and method for data compaction and security with extended functionality | |
JP7529673B2 (ja) | コンテンツ不可知ファイルインデキシングの方法及びシステム | |
US20220206699A1 (en) | Method, electronic device and computer program product for managing data blocks | |
US20090077133A1 (en) | System and method for efficient rule updates in policy based data management | |
US11500590B2 (en) | Method, device and computer program product for data writing | |
US11809709B2 (en) | Metadata size reduction for data objects in cloud storage systems | |
CN111859028B (zh) | 创建用于流式存储的索引的方法、设备和计算机程序产品 | |
CN116680275A (zh) | 基于跳跃表的数据读写方法、系统、设备及存储介质 | |
CN112883060A (zh) | 数据校验方法、装置和电子设备 | |
Zynda et al. | Feature frequency profiles for automatic sample identification using pyspark | |
CN115982206A (zh) | 一种处理数据的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210511 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220323 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7047110 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |