JP2014517426A - 反復データの処理 - Google Patents
反復データの処理 Download PDFInfo
- Publication number
- JP2014517426A JP2014517426A JP2014515997A JP2014515997A JP2014517426A JP 2014517426 A JP2014517426 A JP 2014517426A JP 2014515997 A JP2014515997 A JP 2014515997A JP 2014515997 A JP2014515997 A JP 2014515997A JP 2014517426 A JP2014517426 A JP 2014517426A
- Authority
- JP
- Japan
- Prior art keywords
- data
- comparison
- information
- database
- comparison data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
Abstract
Description
本願は、参照することによりその全体として本明細書に組み込まれる、「Method, Apparatus and System of Processing Repetitive Data」と題された、2011年6月17日出願の中国特許出願第201110164850.1号への外国優先権を主張するものである。
a)IF A.MD5!=B.MD5=>A and B intersect
b)ELSEIF!Similar(A,B)=>A and B intersect
c)ELSEIF A.Pic1!=B.Pic1=>A and B intersect
d)ELSEIF A.PicSet.equals(B.PicSet)=>A==B
e)ELSEIF A.PicSet.contains(B.PicSet)=>A includes B
f)ELSEIF B.PicSet.contains(A.PicSet)=>B includes A
g)ELSE A and B intersect
a)IF A includes B
i.IF A is NEW/MOD=>[A,A]
ii.ELSEIF A is APP/PUB=>[〜A,A]
iii.ELSE A is TBD/DEL/EXP=>[A〜B,B]
b)ELSEIF A==B
i.IF A is NEW/MOD=>[B,B]
ii.ELSE IF A is APP/PUB=>[〜A,A]
iii.ELSE A is TBD/DEL/EXP=>[AB,B]
c)ELSE A and B intersect=>[AB,AB]
Claims (20)
- コンピュータ実行可能命令を伴って構成される1つ以上のプロセッサによって行われる方法であって、
反復データベースであって、データベースの中のデータが事前設定されたデータ構造に従って処理された後に内部メモリマッピングによって形成される、反復データベースの中のデータのデータ構造と同一または実質的に同一となるように、比較データのデータ構造を処理することと、
前記比較データが反復データであるかどうかを判定するように、前記比較データを前記反復データベースの中の前記データと比較することと、
前記比較データが反復データではないという結果に応答して、前記データベースの中に前記比較データを記憶することと、
を含む、方法。 - 前記処理された比較データは、完全マッチングのための第1の情報と、類似度マッチングのための第2の情報とを含む、請求項1に記載の方法。
- 前記比較データが反復データであるかどうかを判定するように、前記比較データを前記反復データベースの中の前記データと比較することは、
前記比較データの前記第1の情報が、前記反復データベースの中の前記データの第1の情報と同一または実質的に同一であり、前記比較データの前記第2の情報と前記反復データの中の前記データの第2の情報との間の類似度が、閾値よりも高い場合、前記比較データが反復データであると判定することを含む、
請求項2に記載の方法。 - 前記比較データが反復データであるかどうかを判定するように、前記比較データを前記反復データベースの中の前記データと比較することは、
前記比較データの前記第1の情報が、前記反復データベースの中の前記データの第1の情報と同一または実質的に同一であり、前記比較データの前記第2の情報と前記反復データの中の前記データの第2の情報との間の類似度が、閾値よりも高い場合、前記比較データの中の1つ以上の画像のサイズと前記反復データベースの中の前記データの中の1つ以上の画像のサイズとの間の関係に従って、前記比較データと前記反復データベースの中の前記データとの間の関係の形態を判定することを含む、
請求項2に記載の方法。 - 前記比較データと前記反復データベースの中の前記データとの間の前記関係の形態は、
前記比較データが、前記反復データベースの中の前記データと同一である、
前記比較データが、前記反復データベースの中の前記データを含有する、
前記反復データベースの中の前記データが、前記比較データを含有する、
のうちの1つを含む、
請求項5に記載の方法。 - 前記第1の情報は、少なくとも、完全マッチングを必要とする前記比較データの中の1つ以上の項目によって形成される組み合わせと、前記組み合わせがハッシングアルゴリズムまたは暗号化アルゴリズムによって処理された後の前記組み合わせの値とを含み、
前記第2の情報は、前記比較データの中の一部分が圧縮アルゴリズムによって処理された後に、類似度マッチングを必要とする、少なくとも前記一部分の値を含む、
請求項2に記載の方法。 - 前記組み合わせを形成する前記1つ以上の項目は、事前設定される、請求項6に記載の方法。
- 前記反復データベースの中の前記データは、完全マッチングのための第1の情報と、類似度マッチングのための第2の情報とを含み、前記第1の情報および前記第2の情報は、キー値ペアの形態で前記反復データベースの中に記憶される、請求項2に記載の方法。
- 前記比較データが反復データであるかどうかを判定するように、前記比較データを前記反復データベースの中の前記データと比較する前に、前記比較データを前処理することをさらに含む、請求項1に記載の方法。
- 前記前処理するステップは、
大文字および小文字変換、
全角および半角変換、
特殊文字フィルタリング、
頭音標語置換、
単純および無意味語置換、
キーワード抽出、
HTMLタグの除去、
のうちの少なくとも1つを含む、
請求項9に記載の方法。 - 前記比較データが反復データであるかどうかを判定するように、前記比較データを前記反復データベースの中の前記データと比較する前に、負荷バランシングの処理を通して前記比較データを受信することをさらに含む、請求項1に記載の方法。
- 反復データベースの中のデータのデータ構造と同一または実質的に同一となるように、比較データのデータ構造を処理する、処理モジュールであって、前記反復データベースは、データベースの中のデータが事前設定されたデータ構造に従って処理された後に内部メモリマッピングによって形成される、処理モジュールと、
前記比較データが反復データであるかどうかを判定するように、前記比較データを前記反復データベースの中の前記データと比較する、比較モジュールと、
前記比較データが反復データではないという結果に応答して、前記データベースの中に前記比較データを記憶する、書き込みモジュールと、
を備える、装置。 - 前記処理された比較データは、完全マッチングのための第1の情報と、類似度マッチングのための第2の情報とを含み、前記比較モジュールは、前記比較データの前記第1の情報が、前記反復データベースの中の前記データの第1の情報と同一または実質的に同一であり、前記比較データの前記第2の情報と前記反復データの中の前記データの第2の情報との間の類似度が、閾値よりも高いと判定した後に、前記比較データが反復データであると判定する、請求項12に記載の装置。
- 前記比較データは、1つ以上の画像を含み、前記比較モジュールは、前記比較データの前記第1の情報が、前記反復データベースの中の前記データの第1の情報と同一または実質的に同一であり、前記比較データの前記第2の情報と前記反復データの中の前記データの第2の情報との間の類似度が、閾値よりも高いと判定した後に、前記比較データの中の1つ以上の画像のサイズと前記反復データベースの中の前記データの中の1つ以上の画像のサイズとの間の関係に従って、前記比較データと前記反復データベースの中の前記データとの間の関係の形態を判定し、前記比較データと前記反復データベースの中の前記データとの間の前記関係の形態は、
前記比較データが、前記反復データベースの中の前記データと同一である、
前記比較データが、前記反復データベースの中の前記データを含有する、
前記反復データベースの中の前記データが、前記比較データを含有する、
のうちの1つを含む、
請求項13に記載の装置。 - 前記第1の情報は、少なくとも、完全マッチングを必要とする前記比較データの中の1つ以上の項目によって形成される組み合わせと、前記組み合わせがハッシングアルゴリズムまたは暗号化アルゴリズムによって処理された後の前記組み合わせの値とを含み、
前記第2の情報は、前記比較データの中の一部分が圧縮アルゴリズムによって処理された後に、類似度マッチングを必要とする、少なくとも前記一部分の値を含む、
請求項13に記載の装置。 - 前記反復データベースの中の前記データは、完全マッチングのための第1の情報と、類似度マッチングのための第2の情報とを含み、前記第1の情報および前記第2の情報は、キー値ペアの形態で前記反復データベースの中に記憶される、請求項13に記載の装置。
- 前記比較データが反復データであるかどうかを判定するように、前記比較データを前記反復データベースの中の前記データと比較する前に、前記比較データを前処理することをさらに含み、前記前処理は、
大文字および小文字変換、
全角および半角変換、
特殊文字フィルタリング、
頭音標語置換、
単純および無意味語置換、
キーワード抽出、
HTMLタグの除去、
のうちの少なくとも1つを含む、
請求項12に記載の装置。 - 前記比較データが反復データであるかどうかを判定するように、前記比較データを前記反復データベースの中の前記データと比較する前に、負荷バランシングの処理を通して前記比較データを受信することをさらに含む、請求項12に記載の装置。
- 反復データを処理するための1つ以上の装置の負荷平衡に基づいて、反復データを処理にするための前記1つ以上の装置に比較データを送信する、配信デバイスと、
反復データベースの中のデータのデータ構造と同一または実質的に同一となるように、比較データのデータ構造を処理する、処理モジュールであって、前記反復データベースは、データベースの中のデータが事前設定されたデータ構造に従って処理された後に内部メモリマッピングによって形成される、処理モジュールと、
前記比較データの第1の情報が、前記反復データベースの中の前記データの第1の情報と同一または実質的に同一であり、前記比較データの前記第2の情報と前記反復データの中の前記データの第2の情報との間の類似度が、閾値よりも高いと判定した後に、前記比較データが反復データであることを判定するように、前記比較データを前記反復データベースの中の前記データと比較する、比較モジュールであって、前記第1の情報は、少なくとも、完全マッチングを必要とする前記比較データの中の1つ以上の項目によって形成される組み合わせと、前記組み合わせがハッシングアルゴリズムまたは暗号化アルゴリズムによって処理された後の前記組み合わせの値とを含み、前記第2の情報は、前記比較データの中の一部分が圧縮アルゴリズムによって処理された後に類似度マッチングを必要とする、少なくとも前記一部分の値を含む、比較モジュールと、
前記比較データが反復データではないという結果に応答して、前記データベースの中に前記比較データを記憶する、書き込みモジュールと、
を含む、反復データを処理するための前記1つ以上の装置のうちの少なくとも1つと、
を備える、システム。 - 前記比較データは、1つ以上の画像を含み、前記比較モジュールは、前記比較データの前記第1の情報が、前記反復データベースの中の前記データの第1の情報と同一または実質的に同一であり、前記比較データの前記第2の情報と前記反復データの中の前記データの第2の情報との間の類似度が、閾値よりも高いと判定した後に、前記比較データの中の1つ以上の画像のサイズと前記反復データベースの中の前記データの中の1つ以上の画像のサイズとの間の関係に従って、前記比較データと前記反復データベースの中の前記データとの間の関係の形態を判定し、前記比較データと前記反復データベースの中の前記データとの間の前記関係の形態は、
前記比較データが、前記反復データベースの中の前記データと同一である、
前記比較データが、前記反復データベースの中の前記データを含有する、
前記反復データベースの中の前記データが、前記比較データを含有する、
のうちの1つを含む、
請求項19に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110164850.1 | 2011-06-17 | ||
CN201110164850.1A CN102831127B (zh) | 2011-06-17 | 2011-06-17 | 重复数据处理方法、装置及系统 |
PCT/US2012/042498 WO2012174268A1 (en) | 2011-06-17 | 2012-06-14 | Processing repetitive data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014517426A true JP2014517426A (ja) | 2014-07-17 |
JP6051212B2 JP6051212B2 (ja) | 2016-12-27 |
Family
ID=47334270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014515997A Expired - Fee Related JP6051212B2 (ja) | 2011-06-17 | 2012-06-14 | 反復データの処理 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20130013597A1 (ja) |
EP (1) | EP2721477A4 (ja) |
JP (1) | JP6051212B2 (ja) |
CN (1) | CN102831127B (ja) |
HK (1) | HK1173540A1 (ja) |
TW (1) | TWI518530B (ja) |
WO (1) | WO2012174268A1 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140023227A1 (en) * | 2012-07-17 | 2014-01-23 | Cubic Corporation | Broken mag ticket authenticator |
CN104239301B (zh) * | 2013-06-06 | 2018-02-13 | 阿里巴巴集团控股有限公司 | 一种数据比对方法和装置 |
CN104077338B (zh) * | 2013-06-25 | 2016-02-17 | 腾讯科技(深圳)有限公司 | 一种数据处理的方法及装置 |
CN104714956A (zh) * | 2013-12-13 | 2015-06-17 | 国家电网公司 | 一种异构记录集对比方法及装置 |
CN104361050A (zh) * | 2014-10-29 | 2015-02-18 | 中国建设银行股份有限公司 | 一种数据转化比对方法及装置 |
CN104391894A (zh) * | 2014-11-11 | 2015-03-04 | 广州科腾信息技术有限公司 | 一种重复数据的检查处理方法 |
CN105677645B (zh) * | 2014-11-17 | 2018-12-21 | 阿里巴巴集团控股有限公司 | 一种数据表比对方法和装置 |
CN105095367B (zh) * | 2015-06-26 | 2018-12-28 | 北京奇虎科技有限公司 | 一种客户端数据的采集方法和装置 |
EP3115906A1 (en) | 2015-07-07 | 2017-01-11 | Toedt, Dr. Selk & Coll. GmbH | Finding doublets in a database |
CN105183835B (zh) * | 2015-08-31 | 2018-09-04 | 小米科技有限责任公司 | 社交软件中信息标记的方法及装置 |
CN105787083A (zh) * | 2016-03-02 | 2016-07-20 | 深圳市元征科技股份有限公司 | 数据处理方法及装置 |
CN105787130B (zh) * | 2016-03-30 | 2019-09-27 | 北京金山安全软件有限公司 | 图片清理方法、装置和移动终端 |
CN106209840A (zh) * | 2016-07-12 | 2016-12-07 | 中国银联股份有限公司 | 一种网络包去重方法及装置 |
CN106250424B (zh) * | 2016-07-22 | 2019-12-03 | 杭州朗和科技有限公司 | 一种日志上下文内容的搜索方法、装置及系统 |
CN107688978B (zh) * | 2016-08-05 | 2021-05-25 | 北京京东尚科信息技术有限公司 | 用于检测重复订单信息的方法及装置 |
CN107784022B (zh) * | 2016-08-31 | 2020-09-15 | 北京国双科技有限公司 | 检测法律文书是否重复的方法及装置 |
CN108073521B (zh) * | 2016-11-11 | 2021-10-08 | 深圳市创梦天地科技有限公司 | 一种数据去重的方法和系统 |
CN108153793A (zh) * | 2016-12-02 | 2018-06-12 | 航天星图科技(北京)有限公司 | 一种原始数据处理方法 |
CN106503268B (zh) * | 2016-12-07 | 2019-08-23 | 广东神马搜索科技有限公司 | 数据对比方法、装置和系统 |
CN108241615A (zh) * | 2016-12-23 | 2018-07-03 | 中国电信股份有限公司 | 数据去重方法和装置 |
CN108280048B (zh) * | 2017-01-05 | 2021-06-15 | 腾讯科技(深圳)有限公司 | 信息处理方法和装置 |
CN107084989B (zh) * | 2017-03-27 | 2020-06-30 | 广州视源电子科技股份有限公司 | 一种aoi器件数据库的添加方法与系统 |
CN107025218B (zh) * | 2017-04-07 | 2021-03-02 | 腾讯科技(深圳)有限公司 | 一种文本去重方法和装置 |
CN108460098B (zh) * | 2018-02-01 | 2023-04-07 | 北京百度网讯科技有限公司 | 信息推荐方法、装置和计算机设备 |
CN108921510A (zh) * | 2018-06-27 | 2018-11-30 | 中国建设银行股份有限公司 | 银行业务远程自动审核方法及系统 |
CN109446190B (zh) * | 2018-11-07 | 2022-11-01 | 湖北省标准化与质量研究院 | 一种标准元数据的数据处理方法 |
CN109885555B (zh) * | 2019-01-07 | 2021-12-07 | 中国联合网络通信集团有限公司 | 一种用户信息管理方法及装置 |
CN109918518A (zh) * | 2019-01-31 | 2019-06-21 | 平安科技(深圳)有限公司 | 图片查重方法、装置、计算机设备和存储介质 |
CN110012150B (zh) * | 2019-02-20 | 2021-07-30 | 维沃移动通信有限公司 | 一种消息显示方法及终端设备 |
US11888935B2 (en) * | 2019-04-30 | 2024-01-30 | Clumio, Inc. | Post-processing in a cloud-based data protection service |
CN110555036A (zh) * | 2019-08-21 | 2019-12-10 | 上海易点时空网络有限公司 | 基于异步处理的数据排重方法及装置 |
CN111158643A (zh) * | 2019-11-29 | 2020-05-15 | 石化盈科信息技术有限责任公司 | 数据处理系统及方法 |
CN111651438A (zh) * | 2020-04-28 | 2020-09-11 | 银江股份有限公司 | 基于MapDB的结构化数据去重方法、装置、设备及介质 |
CN111597178A (zh) * | 2020-05-18 | 2020-08-28 | 山东浪潮通软信息科技有限公司 | 一种清洗重复数据的方法、系统、设备及介质 |
CN113259256B (zh) * | 2021-07-15 | 2021-09-21 | 全时云商务服务股份有限公司 | 一种重复数据包过滤方法、系统及可读存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003085946A (ja) * | 2001-09-14 | 2003-03-20 | Columbia Music Entertainment Inc | データ記録装置およびデータ記録再生装置 |
JP2003122758A (ja) * | 2001-10-11 | 2003-04-25 | Canon Inc | 画像検索方法及び装置 |
JP2003141447A (ja) * | 2001-11-06 | 2003-05-16 | Canon Inc | 帳票検索システム |
WO2003046764A1 (fr) * | 2001-11-26 | 2003-06-05 | Fujitsu Limited | Procede et appareil d'analyse d'informations |
JP2006134041A (ja) * | 2004-11-05 | 2006-05-25 | Canon Inc | データ管理装置 |
JP2007156845A (ja) * | 2005-12-05 | 2007-06-21 | Toshiba Corp | データ検索装置、データ検索方法、およびプログラム |
US20100036862A1 (en) * | 2008-08-08 | 2010-02-11 | Oracle International Corporation | Representing and manipulating RDF data in a relational database management system |
JP2010050600A (ja) * | 2008-08-20 | 2010-03-04 | Fujitsu Ltd | 情報検索装置 |
JP2010191621A (ja) * | 2009-02-17 | 2010-09-02 | Fujitsu Ltd | 電子カルテ管理システム、その方法、及びプログラム |
JP2010257019A (ja) * | 2009-04-22 | 2010-11-11 | Fujitsu Ltd | 文書管理装置、文書管理方法およびそのプログラム |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5915250A (en) * | 1996-03-29 | 1999-06-22 | Virage, Inc. | Threshold-based comparison |
US6493709B1 (en) * | 1998-07-31 | 2002-12-10 | The Regents Of The University Of California | Method and apparatus for digitally shredding similar documents within large document sets in a data processing environment |
US6772196B1 (en) * | 2000-07-27 | 2004-08-03 | Propel Software Corp. | Electronic mail filtering system and methods |
US7660819B1 (en) * | 2000-07-31 | 2010-02-09 | Alion Science And Technology Corporation | System for similar document detection |
US20040107205A1 (en) * | 2002-12-03 | 2004-06-03 | Lockheed Martin Corporation | Boolean rule-based system for clustering similar records |
US7702673B2 (en) * | 2004-10-01 | 2010-04-20 | Ricoh Co., Ltd. | System and methods for creation and use of a mixed media environment |
US7873782B2 (en) * | 2004-11-05 | 2011-01-18 | Data Robotics, Inc. | Filesystem-aware block storage system, apparatus, and method |
WO2006052242A1 (en) * | 2004-11-08 | 2006-05-18 | Seirad, Inc. | Methods and systems for compressing and comparing genomic data |
CA2545232A1 (en) * | 2005-07-29 | 2007-01-29 | Cognos Incorporated | Method and system for creating a taxonomy from business-oriented metadata content |
US20070073592A1 (en) * | 2005-09-28 | 2007-03-29 | Redcarpet, Inc. | Method and system for network-based comparision shopping |
JP5105894B2 (ja) * | 2006-03-14 | 2012-12-26 | キヤノン株式会社 | 文書検索システム、文書検索装置及びその方法とプログラム、記憶媒体 |
US7478113B1 (en) * | 2006-04-13 | 2009-01-13 | Symantec Operating Corporation | Boundaries |
US20100095009A1 (en) * | 2006-10-02 | 2010-04-15 | Nokia Corporation | Method, System, and Devices for Network Sharing or Searching Of Resources |
EP2245554A1 (en) * | 2007-12-21 | 2010-11-03 | Thomson Reuters Global Resources | Systems, methods, and software for entity relationship resolution |
EP2271981B1 (en) * | 2008-03-31 | 2020-06-10 | Sony Corporation | Binding unit manifest file |
US8838549B2 (en) * | 2008-07-07 | 2014-09-16 | Chandra Bodapati | Detecting duplicate records |
US8527522B2 (en) * | 2008-09-05 | 2013-09-03 | Ramp Holdings, Inc. | Confidence links between name entities in disparate documents |
CN102378969B (zh) * | 2009-03-30 | 2015-08-05 | 惠普开发有限公司 | 拷贝卷中存储的数据的去重复 |
US8073865B2 (en) * | 2009-09-14 | 2011-12-06 | Etsy, Inc. | System and method for content extraction from unstructured sources |
US8732473B2 (en) * | 2010-06-01 | 2014-05-20 | Microsoft Corporation | Claim based content reputation service |
US20110295722A1 (en) * | 2010-06-09 | 2011-12-01 | Reisman Richard R | Methods, Apparatus, and Systems for Enabling Feedback-Dependent Transactions |
-
2011
- 2011-06-17 CN CN201110164850.1A patent/CN102831127B/zh not_active Expired - Fee Related
- 2011-08-11 TW TW100128694A patent/TWI518530B/zh active
-
2012
- 2012-06-14 US US13/522,579 patent/US20130013597A1/en not_active Abandoned
- 2012-06-14 EP EP12800402.5A patent/EP2721477A4/en not_active Withdrawn
- 2012-06-14 WO PCT/US2012/042498 patent/WO2012174268A1/en active Application Filing
- 2012-06-14 JP JP2014515997A patent/JP6051212B2/ja not_active Expired - Fee Related
-
2013
- 2013-01-18 HK HK13100790.7A patent/HK1173540A1/xx not_active IP Right Cessation
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003085946A (ja) * | 2001-09-14 | 2003-03-20 | Columbia Music Entertainment Inc | データ記録装置およびデータ記録再生装置 |
JP2003122758A (ja) * | 2001-10-11 | 2003-04-25 | Canon Inc | 画像検索方法及び装置 |
JP2003141447A (ja) * | 2001-11-06 | 2003-05-16 | Canon Inc | 帳票検索システム |
WO2003046764A1 (fr) * | 2001-11-26 | 2003-06-05 | Fujitsu Limited | Procede et appareil d'analyse d'informations |
JP2006134041A (ja) * | 2004-11-05 | 2006-05-25 | Canon Inc | データ管理装置 |
JP2007156845A (ja) * | 2005-12-05 | 2007-06-21 | Toshiba Corp | データ検索装置、データ検索方法、およびプログラム |
US20100036862A1 (en) * | 2008-08-08 | 2010-02-11 | Oracle International Corporation | Representing and manipulating RDF data in a relational database management system |
JP2010050600A (ja) * | 2008-08-20 | 2010-03-04 | Fujitsu Ltd | 情報検索装置 |
JP2010191621A (ja) * | 2009-02-17 | 2010-09-02 | Fujitsu Ltd | 電子カルテ管理システム、その方法、及びプログラム |
JP2010257019A (ja) * | 2009-04-22 | 2010-11-11 | Fujitsu Ltd | 文書管理装置、文書管理方法およびそのプログラム |
Non-Patent Citations (1)
Title |
---|
山田 祥寛: "データベースはじめの一歩 基礎の基礎からよくわかる", DB MAGAZINE, vol. 第18巻,第7号, JPN6016008717, 1 November 2008 (2008-11-01), JP, pages 60 - 65, ISSN: 0003432393 * |
Also Published As
Publication number | Publication date |
---|---|
CN102831127B (zh) | 2015-04-22 |
HK1173540A1 (en) | 2013-05-16 |
CN102831127A (zh) | 2012-12-19 |
TWI518530B (zh) | 2016-01-21 |
WO2012174268A1 (en) | 2012-12-20 |
EP2721477A4 (en) | 2015-09-16 |
US20130013597A1 (en) | 2013-01-10 |
JP6051212B2 (ja) | 2016-12-27 |
TW201301063A (zh) | 2013-01-01 |
EP2721477A1 (en) | 2014-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6051212B2 (ja) | 反復データの処理 | |
CN107608750B (zh) | 用于型式辨识的装置 | |
US9195738B2 (en) | Tokenization platform | |
US8281395B2 (en) | Pattern-recognition processor with matching-data reporting module | |
CN107038206B (zh) | Lsm树的建立方法、lsm树的数据读取方法和服务器 | |
CN107305586B (zh) | 索引生成方法、索引生成装置及搜索方法 | |
CN111258966A (zh) | 一种数据去重方法、装置、设备及存储介质 | |
US20150081717A1 (en) | Systems and methods for generating and using aggregated search indices and non-aggregated value storage | |
US9971809B1 (en) | Systems and methods for searching unstructured documents for structured data | |
CN107357895B (zh) | 一种基于词袋模型的文本表示的处理方法 | |
JP5686893B2 (ja) | データベース管理システム、装置及び方法 | |
CN105830160A (zh) | 用于将经屏蔽数据写入到缓冲器的设备及方法 | |
US9286349B2 (en) | Dynamic search system | |
US20160350443A1 (en) | Mining Relevant Approximate Subgraphs from Multigraphs | |
CN113779200A (zh) | 目标行业词库的生成方法、处理器及装置 | |
WO2014168199A1 (ja) | 論理演算方法および情報処理装置 | |
CN114185890B (zh) | 一种数据库检索方法、装置、存储介质及电子设备 | |
US20240126817A1 (en) | Graph data query | |
EP3940571A1 (en) | Data substitution device, data substitution method, and program | |
US20230385240A1 (en) | Optimizations for data deduplication operations | |
WO2018179729A1 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
JP6631139B2 (ja) | 検索制御プログラム、検索制御方法および検索サーバ装置 | |
CN105488022A (zh) | 一种文本特征提取系统和方法 | |
Alp | Comparison of baseline inverted index compression techniques by using a new document similarity removal method | |
CN113988282A (zh) | 用于图神经网络和图应用的可编程访问引擎架构 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150521 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160229 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160531 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161101 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6051212 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |