JP5372853B2 - デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 - Google Patents
デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 Download PDFInfo
- Publication number
- JP5372853B2 JP5372853B2 JP2010155333A JP2010155333A JP5372853B2 JP 5372853 B2 JP5372853 B2 JP 5372853B2 JP 2010155333 A JP2010155333 A JP 2010155333A JP 2010155333 A JP2010155333 A JP 2010155333A JP 5372853 B2 JP5372853 B2 JP 5372853B2
- Authority
- JP
- Japan
- Prior art keywords
- distance
- file
- feature amount
- feature
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
- G06F16/152—File search processing using file content signatures, e.g. hash values
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/174—Redundancy elimination performed by the file system
- G06F16/1748—De-duplication implemented within the file system, e.g. based on file segments
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Library & Information Science (AREA)
- Automation & Control Theory (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
さて、従来技術では、走査点300ごとに攪拌値34を計算し、攪拌値から所定の区分数を導出できるようにしきい値を調整した。非特許文献1に記載の方法に基づき具体的に説明すると、t_maxビットの攪拌値34から下位tビット340を取り出して、これがすべて0だったときに分割点と見なす。ここでt_maxとは、攪拌値34が取り得る最大値を表現するため必要なビット数である。非特許文献1のローリングハッシュは32ビットの攪拌値34を出力するので、t_maxは32となる。
実際には攪拌関数32によって元のデジタルシーケンス30をある程度ランダム化できるに過ぎないので、tの値は上式から算出される値とずれる場合が多い。そこで非特許文献1では、区分数が出力区分数にほぼ一致するまでtを変動させる。
区分ハッシュ計算部208は、各分割データについて計算した区分ハッシュの集合をメモリ140に一時的に保存し、ファジィハッシュ出力部210を呼び出す。
ファジィハッシュ出力部210は、切り捨て、切り捨てずに出力、もしくはブルームフィルタによって得られたる、ファジィハッシュをファジィハッシュ格納部104または/および入出力IF160へ出力する。ただし、後で図8を用いて説明するように、ファジィハッシュ間では各レベルについて共通する区分ハッシュを見いだす必要があるため、区分ハッシュがどのレベルに属するか明らかになる態様で出力する。切り捨て、切り捨てずに出力、ブルームフィルタ等どの方法を採用するかについて、初期設定部200を介してユーザに選択させることも可能である。
図8の例では、レベルt_max-2におけるファイル80の区分ハッシュの総数は12個、ファイル82の区分ハッシュの総数は11個となった。ちなみに出力区分数はともに19である。また、ファイル80の区分ハッシュ802はファイル82の区分ハッシュ822と、区分ハッシュ804は824とそれぞれ一致した。レベルt_max-1の段階で等しいものと見なされた区分ハッシュの集合800、820は4個の区分ハッシュを備えることから、共通する区分ハッシュの個数は計6個となる。従って、ファイル80から見てファイル82と異なる区分ハッシュの個数は6個、ファイル82から見てファイル80と異なる区分ハッシュの個数は5個となる。距離出力部708は、ファイル80からファイル82への距離を6、ファイル82からファイル80への距離を5として出力して、処理が完了する。この例のように、一般に距離は非対称となることに注意する。
図6のファジィハッシュ管理テーブル62を使って具体的に説明すると、例えばファイル「C:\aaa.txt」のファジィハッシュ「t_max:(231d,3412), t_max-1:(14f3,90aa;56b2,9563,744c)」とファイル「C:\bbb.doc」のファジィハッシュt_max:(d794,590c), t_max-1:(3245,e0f9;ff29;c908,eeab)」をレベルt_max-1でエディットグラフを用いて距離を計算する場合、区分ハッシュ「14f3」「90aa」「56b2」「9563」「744c」を5文字からなる文字列、および区分ハッシュ「3245」「e0f9」「ff29」「c908」「eeab」を5文字からなる文字列と見なして、これらの文字列をエディットグラフの方法で照合して、距離を求めるのである。
エディットグラフ、ブルームフィルタのような方法を用いて距離を計算したとしても、区分ハッシュの個数に依存して計算量が増大する。そこで本実施例では、レベルが高いほど分割点が現れる確率が低いことに着目し、区分数が少ない上位のレベルから順番に一致部分を見つけ出し、低レベルでの比較しなければならない区分ハッシュの個数を極力少なくすることで計算量を削減するという方法を開示される。これが本実施例の第二の特徴である。
ファジィハッシュ読込部702がファジィハッシュを2つ読み込みメモリ140に格納したとき、ステップ1004へ進む。
t = max(t0_max, t_min)
に置き換わる。もし共通最下位レベルt_minがt0_maxより大きければ、直接レベルt_minにおいて一致する区分ハッシュを見つけ出すことになる。
一般に、上記検索を高速に行うためには、距離テーブル1100は対称行列であることが好ましいことが知られている。前に図8を用いて説明したとおり、距離テーブル1100を対称行列にする方法として、共通最下位レベルだけから距離を計算するのではなく、最上位レベルから共通最下位レベルで異なる部分の総数を求める方法を採ってもよい。
なお、ファジィハッシュ管理テーブル1120は図6で説明したテーブル62と同様であり、ファイル名とファジィハッシュの一覧を管理する。従って、距離格納部106は、ファジィハッシュ管理テーブル1120の代わりにファジィハッシュ格納部104にあるテーブル62を参照してもよい。ただし、テーブル62をファイル属性と一緒に各フォルダで管理した場合、または、ファジィハッシュを計算したファイル64の拡張領域640にファジィハッシュを書き込んだ場合は、ファジィハッシュ管理テーブル62は存在しないため、距離格納部106はファジィハッシュ管理テーブル1120を具備する必要がある。
実施例1と異なり、可変ファジィハッシュは単一のレベル(出力レベル)で構成されるため、距離計算部124は比較対象外判断部706を具備する必要がない。
Claims (17)
- デジタルシーケンスの特徴量を求める方法であって、
前記デジタルシーケンスの分割可否を判断するレベルを設定するステップと、
前記デジタルシーケンスの一部分である部分シーケンスを第一の関数に入力するステップと、
前記第一の関数の出力値について、設定した前記レベルに基づき、前記部分シーケンスの位置での前記デジタルシーケンスの分割可否を判断し、分割可であれば分割点を求めるステップと、
求めた分割点の個数があらかじめ定めた数を超えるまで、前記レベルを設定するステップと、前記部分シーケンスを第一の関数に入力するステップと、前記分割点を求めるステップと、を繰り返すステップと、
前記分割点を求めるステップにおいて求めた各レベルにおける分割点で、前記デジタルシーケンスを分割するステップと、
前記分割するステップにより得られた複数の分割データそれぞれを第二の関数に入力し、出力値の集合を特徴量として出力するステップと、を備える
ことを特徴とするデジタルシーケンスの特徴量を求める方法。 - 請求項1に記載のデジタルシーケンスの特徴量を求める方法において、
前記分割点を求める前記ステップは、
前記第一の関数の出力値から前記レベルによって定まる長さのビット列を抽出し、抽出した前記ビット列があらかじめ定めたビット列に一致していた場合、前記デジタルシーケンスは、前記部分シーケンスの位置で分割可と判断し、前記部分シーケンスの先頭を分割点とするステップを備える
ことを特徴とするデジタルシーケンスの特徴量を求める方法。 - 請求項2に記載のデジタルシーケンスの特徴量を求める方法において、
前記分割点を求めるステップは、
前記分割点を求めるステップで求めた他の分割点との間隔があらかじめ定めた値よりも小さい場合は、前記部分シーケンスの先頭を分割点としないステップを備える
ことを特徴とするデジタルシーケンスの特徴量を求める方法。 - 請求項1から3のいずれか一に記載のデジタルシーケンスの特徴量を求める方法において、
前記分割点を求める前記ステップは、
前記第一の関数の出力値に含まれる、前記レベルによって定まる個数のビット列があらかじめ定めたビット列に一致していない場合、前記デジタルシーケンスは、前記部分シーケンスの位置では分割できないと判断するステップを備える
ことを特徴とするデジタルシーケンスの特徴量を求める方法。 - 請求項1に記載のデジタルシーケンスの特徴量を求める方法において、
前記第二の関数の出力値の集合を特徴量として出力する前記ステップは、
当該第二の関数の出力値の集合から、各々の前記レベルにおけるブルームフィルタを生成し、
生成した前記ブルームフィルタの集合を前記特徴量とするステップを備える
ことを特徴とするデジタルシーケンスの特徴量を求める方法。 - 請求項2に記載のデジタルシーケンスの特徴量を求める方法において、
前記レベルによって定まる長さのビット列が、前記第一の関数の出力値の長さより長い場合、前記繰り返すステップは、前記部分シーケンスを第一の関数に入力せずに、当該レベルにおける分割点がない旨を出力するステップを備える
ことを特徴とするデジタルシーケンスの特徴量を求める方法。 - デジタルシーケンスの特徴量同士の距離を計算する方法において、
各々の前記特徴量は、木構造を持ち、
当該2つの特徴量のレベルの積集合のうち最下位にあるレベルを求めるステップと、
距離計算を開始するレベルを設定するステップと、
前記2つの特徴量のうち、あるレベルに属し、かつ一致するか否かが不明な要素を備える集合について、比較して一致部分を特定するステップと、
当該一致部分から、当該レベルよりも下位レベルに属する前記特徴量において一致部分を決定する比較対象外決定ステップと、
前記最下位レベルまでレベルを下げつつ前記一致部分を特定するステップおよび比較対象外決定ステップを繰り返すステップと、
前記2つの特徴量の不一致部分の要素数から距離を計算するステップと、を備える
ことを特徴とする、特徴量同士の距離を計算する方法。 - 請求項7に記載の特徴量同士の距離を計算する方法において、
一致部分を特定する前記ステップは、
特徴量を構成する要素を文字とみなして文字列照合アルゴリズムを適用することで一致部分を特定するステップを備える
ことを特徴とする特徴量同士の距離を計算する方法。 - 請求項7または8に記載の特徴量同士の距離を計算する方法において、
距離を計算する前記ステップは、
各特徴量について、前記最下位レベルでの特徴量の要素数と一致部分の要素数の差を距離として出力するステップを備える
ことを特徴とする特徴量同士の距離を計算する方法。 - 請求項7または8に記載の特徴量同士の距離を計算する方法において、
距離を計算する前記ステップは、
各特徴量について、前記距離計算を開始するレベルから前記最下位レベルまでの特徴量の全要素数と一致部分の要素数の差を距離として出力するステップを備える
ことを特徴とする特徴量同士の距離を計算する方法。 - 請求項7から10のいずれか一に記載の特徴量同士の距離を計算する方法において、
距離計算を開始するレベルを設定する前記ステップは、
前記2つの特徴量のレベルの積集合のうち最上位にあるレベルを開始レベルに設定するステップを備える
ことを特徴とする特徴量同士の距離を計算する方法。 - 請求項1に記載のデジタルシーケンスの特徴量を求める方法において、
前記出力値の集合を特徴量として出力するステップは、
前記第二の関数を適用して得られた値とともに、当該第二の関数を適用した分割データの、前記デジタルシーケンスにおける所在に関する情報も出力するステップを備える
ことを特徴とするデジタルシーケンスの特徴量を求める方法。 - 請求項7に記載の特徴量同士の距離を計算する方法において、
各々の前記特徴量が、前記デジタルシーケンスにおける所在に関する情報を備えている場合、
距離を計算する前記ステップは、
一致部分に対応する前記所在に関する情報から一致部分の長さを計算し、前記デジタルシーケンスの長さと当該一致部分の長さから距離を求める
ことを特徴とする特徴量同士の距離を計算する方法。 - ファイルを格納するファイル格納部と、
請求項1に記載の方法によりファイルの特徴量を算出する特徴量計算部と、
前記特徴量と、前記特徴量に対応するファイル名とを格納する特徴量格納部と、
請求項7に記載の方法により前記特徴量同士の距離を計算する距離計算部と、
計算された前記距離ならびに、前記距離に対応する特徴量およびファイル名を格納する距離格納部と、
前記ファイル格納部に格納されたファイルを前記特徴量計算部に送り、得られた特徴量を前記特徴量格納部に格納し、当該特徴量格納部に格納された特徴量を順次前記距離計算部に送り、得られた距離を前記距離格納部に格納する統制部と、
類似するファイルを検索するファイル検索部と、を備え、
前記ファイル検索部は、
検索対象ファイルを前記特徴量計算部に送るファイル読込部と、
得られた特徴量を前記距離格納部に送り、当該特徴量との距離が最も短いあらかじめ定めた個数の特徴量を特定し、当該特徴量の集合それぞれに対応するファイル名を求める距離索引部と、
当該ファイル名を検索結果として出力する類似ファイル出力部と、を備える
ことを特徴とするデジタルシーケンス特徴量算出装置。 - ファイルを格納するファイル格納部と、
請求項1に記載の方法によりファイルの特徴量を算出する特徴量計算部と、
前記特徴量と、前記特徴量に対応するファイル名を格納する特徴量格納部と、
前記ファイル格納部に格納されたファイルを前記特徴量計算部に送り、得られた特徴量を前記特徴量格納部に格納する統制部と、
類似するファイルを検索するファイル検索部と、を備え、
前記ファイル検索部は、
検索対象ファイルを前記特徴量計算部に送るファイル読込部と、
得られた特徴量と前記特徴量格納部に格納されている特徴量との距離を請求項7の方法により計算し、当該得られた特徴量との距離が最も短いあらかじめ定めた個数の特徴量を特定し、当該特徴量の集合それぞれに対応するファイル名を求める距離計算部と、
当該ファイル名を検索結果として出力する類似ファイル出力部と、を備える
ことを特徴とするデジタルシーケンス特徴量算出装置。 - ファイルを格納するファイル格納部と、
請求項12に記載の方法によりファイルの特徴量を算出する特徴量計算部と、
前記特徴量と、前記特徴量に対応するファイル名と、請求項12に記載の分割データの所在に関する情報と、を格納する特徴量格納部と、
前記ファイル格納部に格納されたファイルを前記特徴量計算部に送り、得られた特徴量を前記特徴量格納部に格納する統制部と、
類似するファイルを検索するファイル検索部と、を備え、
前記ファイル検索部は、
検索対象ファイルを前記特徴量計算部に送るファイル読込部と、
得られた特徴量と前記特徴量格納部に格納されている特徴量との距離を請求項13の方法により計算し、当該得られた特徴量との距離が最も短いあらかじめ定めた個数の特徴量を特定し、当該特徴量の集合それぞれに対応するファイル名を求める距離計算部-と、
前記ファイル名と、前記ファイルと請求項15に記載の前記検索対象ファイルの一致部分と、を検索結果として出力する類似ファイル出力部と、を備える
ことを特徴とするデジタルシーケンス特徴量算出装置。 - デジタルシーケンスに対して、
あらかじめ設定したレベルにおいて、前記デジタルシーケンスの一部を第一の関数に入力するステップと、
前記第一の関数の出力値に基づき、前記設定したレベルにおける前記デジタルシーケンスの分割点を求めるステップと、
前記分割点を求めるステップにおいて設定したレベルにおいて求めた前記分割点にて前記デジタルシーケンスを分割するステップと、
前記分割するステップにより得られた前記設定したレベルの分割データそれぞれを第二の関数に入力し、出力値を出力するステップと、を備える
ことを特徴とするデジタルシーケンスの特徴量を求める方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010155333A JP5372853B2 (ja) | 2010-07-08 | 2010-07-08 | デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 |
US13/805,914 US20130151562A1 (en) | 2010-07-08 | 2011-02-02 | Method of calculating feature-amount of digital sequence, and apparatus for calculating feature-amount of digital sequence |
PCT/JP2011/052097 WO2012005016A1 (ja) | 2010-07-08 | 2011-02-02 | デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 |
EP11803352.1A EP2592559A1 (en) | 2010-07-08 | 2011-02-02 | Method of calculating feature-amount of digital sequence, and apparatus for calculating feature-amount of digital sequence |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010155333A JP5372853B2 (ja) | 2010-07-08 | 2010-07-08 | デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012018549A JP2012018549A (ja) | 2012-01-26 |
JP5372853B2 true JP5372853B2 (ja) | 2013-12-18 |
Family
ID=45441004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010155333A Expired - Fee Related JP5372853B2 (ja) | 2010-07-08 | 2010-07-08 | デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20130151562A1 (ja) |
EP (1) | EP2592559A1 (ja) |
JP (1) | JP5372853B2 (ja) |
WO (1) | WO2012005016A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7137086B2 (ja) | 2020-12-01 | 2022-09-14 | 三菱重工冷熱株式会社 | スポットエアコン |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013190891A (ja) * | 2012-03-13 | 2013-09-26 | Hitachi Ltd | データ転送システム |
JP5806651B2 (ja) * | 2012-09-11 | 2015-11-10 | 日本電信電話株式会社 | コピー追跡システム |
JP2014191651A (ja) * | 2013-03-27 | 2014-10-06 | Fujitsu Ltd | ストレージシステム、ストレージ装置、ストレージシステムの制御方法、およびストレージ装置の制御プログラム |
US9239841B2 (en) * | 2013-07-16 | 2016-01-19 | Vmware, Inc. | Hash-based snapshots |
CN103761292B (zh) * | 2014-01-16 | 2017-01-18 | 北京理工大学 | 基于用户转发行为的微博阅读概率计算方法 |
US20150381736A1 (en) * | 2014-06-30 | 2015-12-31 | Chris Timothy Seltzer | Distributed cloud storage |
WO2016081880A1 (en) * | 2014-11-21 | 2016-05-26 | Trustees Of Boston University | Large scale video search using queries that define relationships between objects |
WO2016105585A1 (en) * | 2014-12-23 | 2016-06-30 | Hewlett Packard Enterprise Development Lp | Data deduplication |
US20160284035A1 (en) * | 2015-03-27 | 2016-09-29 | Igor Muttik | Crowd-sourced analysis of end user license agreements |
US9594906B1 (en) * | 2015-03-31 | 2017-03-14 | Juniper Networks, Inc. | Confirming a malware infection on a client device using a remote access connection tool to identify a malicious file based on fuzzy hashes |
US20170177863A1 (en) * | 2015-12-16 | 2017-06-22 | Wind River Systems, Inc. | Device, System, and Method for Detecting Malicious Software in Unallocated Memory |
US10289861B2 (en) * | 2016-07-01 | 2019-05-14 | Intel Corporation | Permission-based secure media content sharing |
US10891307B2 (en) * | 2018-05-31 | 2021-01-12 | Microsoft Technology Licensing, Llc | Distributed data synchronization in a distributed computing system |
US20200004882A1 (en) * | 2018-06-27 | 2020-01-02 | Microsoft Technology Licensing, Llc | Misinformation detection in online content |
US11010337B2 (en) * | 2018-08-31 | 2021-05-18 | Mcafee, Llc | Fuzzy hash algorithms to calculate file similarity |
US11463264B2 (en) * | 2019-05-08 | 2022-10-04 | Commvault Systems, Inc. | Use of data block signatures for monitoring in an information management system |
JP7295422B2 (ja) * | 2019-09-10 | 2023-06-21 | 富士通株式会社 | 情報処理装置および情報処理プログラム |
US11321278B2 (en) * | 2020-04-29 | 2022-05-03 | Rubrik, Inc. | Light-weight index deduplication and hierarchical snapshot replication |
US11687424B2 (en) | 2020-05-28 | 2023-06-27 | Commvault Systems, Inc. | Automated media agent state management |
CN113780295B (zh) * | 2021-09-13 | 2024-02-20 | 东北大学 | 一种基于lac-floss算法和ier算法的时间序列分割方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996025801A1 (en) * | 1995-02-17 | 1996-08-22 | Trustus Pty. Ltd. | Method for partitioning a block of data into subblocks and for storing and communicating such subblocks |
US6810398B2 (en) | 2000-11-06 | 2004-10-26 | Avamar Technologies, Inc. | System and method for unorchestrated determination of data sequences using sticky byte factoring to determine breakpoints in digital sequences |
JP2002259216A (ja) * | 2001-02-28 | 2002-09-13 | Mitsubishi Electric Corp | 電子ファイルの改ざん検出方法、そのための電子ファイルの記述方法および通信装置 |
US6826568B2 (en) * | 2001-12-20 | 2004-11-30 | Microsoft Corporation | Methods and system for model matching |
US7290012B2 (en) * | 2004-01-16 | 2007-10-30 | International Business Machines Corporation | Apparatus, system, and method for passing data between an extensible markup language document and a hierarchical database |
US7562077B2 (en) * | 2005-03-28 | 2009-07-14 | Netapp, Inc. | Method and apparatus for generating and describing block-level difference information about two snapshots |
JP5072832B2 (ja) | 2005-05-09 | 2012-11-14 | トレンド マイクロ インコーポレイテッド | 署名生成および関連性を有するマッチングエンジン |
US7814078B1 (en) * | 2005-06-20 | 2010-10-12 | Hewlett-Packard Development Company, L.P. | Identification of files with similar content |
US7403951B2 (en) * | 2005-10-07 | 2008-07-22 | Nokia Corporation | System and method for measuring SVG document similarity |
JP2007272540A (ja) * | 2006-03-31 | 2007-10-18 | Pfu Ltd | データ配信方法及びデータ配信システム |
US7844581B2 (en) * | 2006-12-01 | 2010-11-30 | Nec Laboratories America, Inc. | Methods and systems for data management using multiple selection criteria |
US7443321B1 (en) * | 2007-02-13 | 2008-10-28 | Packeteer, Inc. | Compression of stream data using a hierarchically-indexed database |
JP5098504B2 (ja) * | 2007-08-09 | 2012-12-12 | 富士通株式会社 | 文字認識プログラム、文字認識装置および文字認識方法 |
JP2010026790A (ja) * | 2008-07-18 | 2010-02-04 | Nec Corp | 仮想マシン向けデータ格納システム、データ格納方法及びデータ格納プログラム |
-
2010
- 2010-07-08 JP JP2010155333A patent/JP5372853B2/ja not_active Expired - Fee Related
-
2011
- 2011-02-02 EP EP11803352.1A patent/EP2592559A1/en not_active Withdrawn
- 2011-02-02 US US13/805,914 patent/US20130151562A1/en not_active Abandoned
- 2011-02-02 WO PCT/JP2011/052097 patent/WO2012005016A1/ja active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7137086B2 (ja) | 2020-12-01 | 2022-09-14 | 三菱重工冷熱株式会社 | スポットエアコン |
Also Published As
Publication number | Publication date |
---|---|
WO2012005016A1 (ja) | 2012-01-12 |
US20130151562A1 (en) | 2013-06-13 |
JP2012018549A (ja) | 2012-01-26 |
EP2592559A1 (en) | 2013-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5372853B2 (ja) | デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 | |
CN110168523B (zh) | 改变监测跨图查询 | |
JP3566111B2 (ja) | 記号辞書作成方法及び記号辞書検索方法 | |
US11023452B2 (en) | Data dictionary with a reduced need for rebuilding | |
NL2011817C2 (en) | A method of generating a reference index data structure and method for finding a position of a data pattern in a reference data structure. | |
US10915533B2 (en) | Extreme value computation | |
JP2010506247A (ja) | 迷惑情報をフィルタリングするネットワークベースの方法および装置 | |
US8793224B2 (en) | Linear sweep filesystem checking | |
CN113190720B (zh) | 一种基于图压缩的图数据库构建方法、装置及相关组件 | |
Kociumaka et al. | Pattern matching and consensus problems on weighted sequences and profiles | |
CN109992603B (zh) | 一种数据搜索方法、装置、电子设备和计算机可读介质 | |
CN114328632A (zh) | 基于位图的用户数据分析方法、装置及计算机设备 | |
US20120124060A1 (en) | Method and system of identifying adjacency data, method and system of generating a dataset for mapping adjacency data, and an adjacency data set | |
JP6976178B2 (ja) | 抽出装置、抽出方法、及び抽出プログラム | |
JP2020086662A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
Lin et al. | Probabilistic suffix array: efficient modeling and prediction of protein families | |
CN116911253A (zh) | 基于相似性度量的字符串匹配方法、设备及存储介质 | |
US20220171815A1 (en) | System and method for generating filters for k-mismatch search | |
US11482304B2 (en) | Alignment methods, devices and systems | |
JP5149063B2 (ja) | データ比較装置およびプログラム | |
Chen et al. | CGAP-align: a high performance DNA short read alignment tool | |
Liu et al. | WITCH-NG: efficient and accurate alignment of datasets with sequence length heterogeneity | |
Park et al. | HMMerge: an ensemble method for multiple sequence alignment | |
Kotsifakos et al. | DRESS: dimensionality reduction for efficient sequence search | |
Wandelt et al. | Sequence factorization with multiple references |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120517 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130918 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5372853 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |