JP5416659B2 - 情報格納検索装置、情報格納方法、および情報格納プログラム - Google Patents

情報格納検索装置、情報格納方法、および情報格納プログラム Download PDF

Info

Publication number
JP5416659B2
JP5416659B2 JP2010133935A JP2010133935A JP5416659B2 JP 5416659 B2 JP5416659 B2 JP 5416659B2 JP 2010133935 A JP2010133935 A JP 2010133935A JP 2010133935 A JP2010133935 A JP 2010133935A JP 5416659 B2 JP5416659 B2 JP 5416659B2
Authority
JP
Japan
Prior art keywords
search key
hash value
storage unit
storage
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010133935A
Other languages
English (en)
Other versions
JP2011258115A (ja
Inventor
宜仁 安田
由美子 松浦
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010133935A priority Critical patent/JP5416659B2/ja
Publication of JP2011258115A publication Critical patent/JP2011258115A/ja
Application granted granted Critical
Publication of JP5416659B2 publication Critical patent/JP5416659B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、文字列を検索キーとし、その検索キーに対応する情報(例えば、値)を格納,検索する情報格納検索装置に関する。
従来から、文字列を検索キーとし、検索キーとその検索キーに対応する情報(例えば、値)とを格納する連想配列の技術として、ハッシュや木構造による方法が知られている。
しかしながら、多数の検索キーを格納する場合、単一の記憶部には収まりきらないため、複数の記憶部を用いて格納することになる。このように、複数の記憶部を用いた場合には、各検索キーをどの記憶部に格納するかの選択が行われる。この選択方法としては、検索キーとなる文字列を数値化し、その数値を記憶部の総数で除した際の剰余(以下、剰余演算と称する)により決定する方法が一般的である。
しかし、格納すべき検索キーの総数が増え、記憶容量が足りなくなった場合には記憶部を増やす必要がある。この場合、前記剰余演算によって検索キーを格納する記憶部を選択する方法では、概ねすべての検索キーの格納箇所が変更になってしまい、効率が非常に悪いという問題点があった。
この問題を解決する方法として、コンシステントハッシュ(例えば、非特許文献1参照)が知られている。このコンシステントハッシュは、検索キーに対応する数値(ハッシュ値)と同じ範囲に、各記憶部に対応する数値を割り当て、検索キーに対応する数値(ハッシュ値)の直近の値を持つ記憶部に検索キーを格納する方法である。これにより、記憶部の追加や削減があった場合においても、検索キーの格納箇所の変更を最小限に留めることが可能となる。
一方、文字列の検索においては、前方一致検索の需要が多い。この前方一致検索は、通常、二分木やパトリシア(例えば、非特許文献2参照)といったような木表現によって文字列の集合を格納することにより実現可能である。
David Karger,Eric Lehman,Tom Leighton,mathhew Levine,Daniel Lewin and Rina Panigrahy"Consistent Hashing and Random Tree:Distributed Caching Protocols for Relieving Hot Spots on the World Wide Web".In ACM Symposium on Theory of Computing,1997,pp.654−663. R.セジウィック著(野下浩平,星守,佐藤創,田口東 共訳),「アルゴリズム」,第2巻,近代科学社,1996,pp.68−72。
しかしながら、前記コンシステントハッシュによる情報格納方法は、以下に示すような問題点があった。
前記コンシステントハッシュによる情報格納方法は、各記憶部(格納ノード)が木構造の場合、木構造のメリットである前方一致検索を行うことができなかった。
すなわち、検索キーのハッシュ値に応じて、検索キーを格納する記憶部を決定することにより、少しでも違う検索キー(文字列)に対しても異なる記憶部が選択されることになる。そのため、例えば、接頭辞を共有するような検索キー(文字列)同士も異なる記憶部に格納されてしまい、前方一致検索を行うことができなかった。
本発明は、上記の課題を解決するためのものであり、記憶部の追加や削減があった場合においても情報の格納箇所の変更を最小限に抑制すると共に、個々の記憶部において前方一致検索が可能な情報格納検索装置を提供することが主な課題となる。
本発明の一態様は、検索キーからハッシュ値を計算し、検索キーのハッシュ値と同一の範囲の値が割り当てられた複数の記憶部のうち、前記検索キーのハッシュ値に対応する値を持つ記憶部に、前記検索キーと検索キーに対応する情報とを格納し、格納された検索キーを情報検索に利用する情報格納検索装置であって、前記検索キーの前方のみを用いて該検索キーのハッシュ値を計算し、複数の記憶部の中から、前記検索キーのハッシュ値に対して直近の値が割り当てられた記憶部を、前記検索キーと検索キーに対応する情報とを格納する記憶部として選択する記憶部選択部を設け、前記選択された記憶部に、前記検索キーと検索キーに対応する情報とを木表現で格納することを特徴とする。
また、本発明の別の態様は、検索キーからハッシュ値を計算し、検索キーのハッシュ値と同一の範囲の値が割り当てられた複数の記憶部のうち、前記検索キーのハッシュ値に対応する値を持つ記憶部に、前記検索キーと検索キーに対応する情報とを格納し、格納された検索キーを情報検索に利用する情報格納検索装置の情報格納方法であって、記憶部選択部が、前記文字列の前方のみを用いて検索キーのハッシュ値を計算し、複数の記憶部の中から、前記検索キーのハッシュ値に対して直近の値が割り当てられた記憶部を選択する記憶部選択ステップと、前記選択された記憶部に、前記検索キーと検索キーに対応する情報とを、木表現によって格納する記憶ステップと、を有することを特徴とする。
なお、本発明は、前記情報格納検索装置を構成する各手段としてコンピュータを機能させるためのプログラムとしても構成することができる。このプログラムはネットワークを通じた態様で提供してもよく、記録媒体に格納した状態でもよい。
本発明によれば、記憶部の追加や削減があった場合においても、情報の格納箇所の変更を最小限に抑制すると共に、個々の記憶部において前方一致検索が可能な情報格納検索装置を提供することが可能となる。
実施形態の情報格納検索装置における情報格納時の処理内容の一例を示すフローチャートである。 実施形態における情報格納検索装置の構成の一例を示すブロック図である。 実施形態における情報格納検索装置の一例を示すハードウェア構成図である。 実施形態で算出されたハッシュ値Hを数直線上の動きとして見た場合の説明図である。 実施形態で算出されたハッシュ値Hを円上の動きとして見た場合の説明図である。
本実施形態は、複数の記憶部の中から情報を格納すべき記憶部を選択する際に、検索キー(文字列)すべてを用いてハッシュ値Hを計算するのではなく、検索キーの前方のみを用いてハッシュ値Hを計算するものである。そして、情報検索時には、ハッシュ値Hの計算に用いられなかった範囲(検索キーの後方)を用いて、前方一致検索を行う。
すなわち、検索キーの前方のみを用いてハッシュ値Hの計算を行い、情報を格納すべき記憶部を選択する。これにより、前方部分(例えば、接頭辞)を共有する検索キーは同一の記憶部に格納されることとなる。そこで、情報検索時には、検索キーの前方を用いてハッシュ値Hを計算して記憶部を特定し、その記憶部内で、情報格納時にハッシュ値Hの計算に用いなかった検索キーの後方部分を用いて前方一致検索を行うものである。
しかしながら、情報格納時におけるハッシュ値Hの計算に、検索キーの前方の短い部分のみを用いた場合は、記憶部に格納すべき情報が増加した際に、データが複数の記憶部に分散されず偏ってしまう恐れがある。
一方、情報格納時におけるハッシュ値Hの計算に、検索キーの前方の長い部分を用いた場合は、前方一致検索が可能な範囲(ハッシュ値Hの計算に用いられなかった検索キーの後方部分)が限定されてしまうという問題がある。
また、格納する情報の増減に伴う記憶部の追加,削減に合わせて、単純に、前記ハッシュ値Hの計算に用いる文字数の長さを調整した場合には、算出されたハッシュ値Hが大幅に変わってしまい、多数の情報の格納場所を変更することになってしまう。
そこで、本実施形態では、検索キーの先頭側の文字ほど重み付けを大きくしてハッシュ値Hの計算を行い、ハッシュ値Hの計算に用いる検索キーの範囲(前方からの長さ)を柔軟に変更できるようにしたものである。
[実施形態]
≪構成例≫
図1〜図5に基づき本発明の実施形態に係る情報格納検索装置1を説明する。
この情報格納検索装置1は、検索キーと、その検索キーに対応する情報(例えば、値)と、の対を格納するものである。そして、検索時には、検索キーからハッシュ値Hを計算して、そのハッシュ値Hに対応する記憶部内において、検索キーに対応する情報を取り出すものである。例えば、頻繁に問い合わせられる検索キーに対する検索結果を応答性の高い場所に格納しておくキャッシュ等に用いられる。
この情報格納検索装置1は、図3に示すように、コンピュータにより構成され、通常のコンピュータのハードウェアリソース、即ち、ROM11,RAM12,CPU13,通信インターフェイス(I/F)14,ハードディスクドライブ装置15,記憶媒体読取装置16,記憶媒体17などを備えている。
このハードウェアリソースとソフトウェアリソースとの協同の結果、前記情報格納検索装置1は、図2に示すように、情報を格納する複数の記憶部a,b,c,…,sと、入力された検索キーに基づいて、情報を格納すべき記憶部を選択する記憶部選択部2と、を備える。
前記記憶部a,b,c,…,sは検索キーのハッシュ値Hと同一の範囲の値が割り当てられている。また、個々の記憶部での格納方法は、木表現である。複数の記憶部a,b,c,…,sそれぞれは、例えば、1台のコンピュータ等のメモリやハードディスクが想定される。
前記記憶部選択部2は、検索キー(文字列)の前方のみを用いてハッシュ値Hを計算する。そして、複数の記憶部a,b,c,…,sの中から、検索キーに対応するハッシュ値Hの直近の値を持つ記憶部を選択する。
≪情報格納処理≫
図1のフローチャートに基づき、本実施形態の情報格納検索装置1における情報格納処理の処理ステップ(S1〜S6)を説明する。
前処理:情報格納処理のS1〜S6を行う前に、ユーザは記憶部選択部2に、情報格納時にハッシュ値Hの計算に用いる文字数kの設定を行う。この文字数kは記憶部に格納される情報の数、および記憶部a,b,c,…,sの数によって設定される。例えば、記憶部に格納される情報の数,記憶部a,b,c,…,sの数が多い場合は前記文字数kに大きな値が設定され、一方、記憶部に格納される情報の数,記憶部a,b,c,…,sの数が少ない場合は文字数kに小さな値が設定される。
なお、記憶部選択部2が文字数kを自動設定するようにしても良い。また、格納される情報の増減に伴い、記憶部a,b,c,…,sを追加,削減した場合には、前記文字数kを変更しても良い。
次に、S1〜S5の処理によって、記憶部選択部2が、複数の記憶部a,b,c,…,sの中から、ユーザから与えられた検索キーおよび検索キーに対応する情報を格納すべき記憶部を選択する。
まず、S1〜S4の処理によって、検索キーのハッシュ値Hを計算する。S1〜S4の処理では文字列の先頭から1文字ずつハッシュ値Hを計算して、順次算出されたハッシュ値Hを加算していく。ハッシュ値Hの計算には検索キーの文字列のうち、前処理で設定された前方k文字目までを用いる(ただし、検索キーの文字数がk文字未満の場合は、kは検索キーの文字数となる)。
S1;ハッシュ値H=0,カウンタI=0に設定する。ここで、カウンタIの値は、検索キー中における文字の位置(例えば、カウンタI=2の時は、検索キー中の先頭から2番目の文字)を示す。
S2;カウンタIの値を1増加させる。
S3;カウンタI(先頭からI番目の文字)におけるハッシュ値Hを、下記(1)式により算出する。
Figure 0005416659
S4;カウンタI=kか否か判定する。すなわち、k文字目まで、ハッシュ値Hの計算が終了しているか否かを判定する。カウンタI=kでない場合はk文字目までハッシュ値Hの計算が終了していないと判断し、S2の処理に戻り、S2〜S4の処理を繰り返す。カウンタI=kの場合は、k文字目まで、ハッシュ値Hの計算が終了していると判断し、S5の処理へ移行する。
なお、カウンタI=kの時の前記(1)式は、下記(2)式に置換することができる。そのため、S1〜S4の処理の代わりに、下記(2)式を用いて検索キーのハッシュ値Hを算出することも可能である。
Figure 0005416659
この(1),(2)式は、検索キー中の文字が後方に進むに連れてハッシュ値Hへの影響が単調に減少するような関数である。すなわち、検索キー(文字列)の先頭側ほど、重み付けを大きくしてハッシュ値Hの計算が行われる。
なお、前記(1)式,(2)式中の低減項dは、−1<d<0を満たすような負の数とする。また、iは検索キー中における文字の位置(例えば、i=2の時は、検索キー中において先頭から2番目の文字)を示す。diとはdのi乗(dを先頭からの文字順iで累乗した値)を示す。
また、rvはハッシュ値Hの最大値を示す。なお、ハッシュ値Hの最小値は0である。例えば、語長が32ビットの計算機においてはrv=232−1などが想定される。
rcは検索キーに用いられる各文字に対応する値の最大値である。なお、検索キーに用いられる各文字に対応する値の最小値は0である。例えば、アスキー文字コードに対応する値を用いる場合は、rc=255が想定される。
vciは、検索キーのi文字目の文字に対応する値(0≦vci≦rc)である。
ここで、検索キーの先頭の文字から1文字ずつハッシュ値を計算し、順次算出されたハッシュ値を加算した時のハッシュ値Hの変動について説明する。図4は、ハッシュ値Hの変動を数直線状の動きとしてみた場合の説明図である。前記(1)式,(2)式で算出されるハッシュ値Hは、−1以上0以下の値であるdの累乗を含む。そのため、検索キーの先頭から1文字ずつハッシュ値を計算し、順次算出されたハッシュ値を加算していくことにより、ハッシュ値Hは図4に示すように変動していく。
ただし、前記(1)式,(2)式は剰余演算を含むため、ハッシュ値Hの範囲は一周する。そのため、(1)式,(2)式で算出されるハッシュ値Hの値は図5に示すように円上の動きとしてみることもできる。
このように、前記(1)式,(2)式では、検索キー中の先頭側の文字ほど重み付けが大きく計算されるため、後方の文字ほどハッシュ値Hへの影響は小さくなる。
S5;次に、記憶部選択部2において、複数の記憶部a,b,c,…,sの中から、上記のように算出された検索キーのハッシュ値Hと、最も近い値を持つ記憶部を特定する。
S6;記憶部選択部2で選択された記憶部が、検索キーと、その検索キーに対応する情報を格納する。なお、本実施形態では、個々の記憶部では、木表現によって検索キーとその検索キーに対応する情報とを格納することとする。
≪情報検索処理≫
情報検索時における情報格納検索装置1の処理内容を以下に示す。
情報検索時には、まず、記憶部選択部2において、前記S1〜S4の処理または前記(2)式により、入力された検索キーのハッシュ値Hを計算する。本実施形態では、検索キーのハッシュ値Hを計算する際、前処理で設定されたk文字目まで用いるが、検索キーの文字列すべてを用いても良い。次に、記憶部選択部2において、複数の記憶部a,b,c,…,sの中から、計算されたハッシュ値Hと最も近いハッシュ値を持つ記憶部を選択する。そして、特定された記憶部において、情報格納時にハッシュ値Hの計算に用いなかった文字列の後方部分を用いて、前方一致検索により、検索キーを検索する。前記特定された記憶部内から入力された検索キーと同一の検索キーが見つかったら、記憶部選択部2に入力された検索キーに対応する情報を出力し、記憶部選択部2からユーザにその情報が提示される。
以下、本実施形態おける情報格納検索装置1の効果を説明する。
本実施形態では、格納すべき記憶部を選択する際に、検索キーとなる文字列すべてによってハッシュ値Hを計算するのではなく、文字列の前方のみを用いてハッシュ値Hを計算することにより、コンシステントハッシュの良い点を保ちつつ、前方一致検索が可能となる。
すなわち、格納する検索キーの数の増減によって記憶部の追加や削減があった場合においても、複数の記憶部a,b,c,…,sは検索キーに対応するハッシュ値Hと同一の範囲の値が割り当てられているため、検索キーの格納箇所の変更を最小限に抑制することが可能となる。加えて、個々の記憶部での格納方法が木表現であるため、前方部分(例えば、接頭辞)を共有する検索キーは同一の記憶部に格納されることになる。そのため、情報検索時には、検索キーの前方のみを用いてハッシュ値Hを計算して検索キーが格納された記憶部を特定し、その記憶部内で情報格納時にハッシュ値Hの計算に用いられなかった範囲(文字列の後方部部分)を用いて前方一致検索を行うことが可能となる。
また、本実施形態では、検索キーの先頭側ほど重み付けを大きくして、ハッシュ値Hの計算(負の低減項を持つハッシュ値Hの計算)を行うため、ハッシュ値Hの計算に用いる文字数kを変更したとしても、検索キーの格納箇所の変更を最小限に抑制することが可能となる。
すなわち、前記文字数kが短い場合は、情報が複数の記憶部a,b,c,…,sに分散されず偏ってしまう恐れがあり、前記文字数kが長い場合には前方一致検索に用いる検索キーの範囲(検索キーの前方文字数k以外の後方部分)が限定されてしまう。この文字数kと文字数k以外の範囲のバランスを調整するために、文字数kの値を変更したとしても、ハッシュ値Hは検索キーの後方ほどハッシュ値Hへの影響が小さくなるように計算されるため、ハッシュ値Hの値の大幅な変更が抑制される。その結果、検索キーの格納箇所の変更を最小限に抑制することが可能となる。
≪プログラムなど≫
本発明は、前記情報検索装置1を構成する記憶部選択部2および記憶部a〜sの一部若しくは全部として、コンピュータを機能させるためのプログラムとして構成することもできる。このプログラムでは、S1〜S6の全ステップあるいは一部のステップをコンピュータに実行させることが可能である。
このプログラムは、Webサイトや電子メールなどネットワークを通じて提供することができる。また、前記プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,Blu−ray Disk(登録商標)などの記録媒体に記録して、保存・配布することも可能である。この記録媒体は、記録媒体駆動装置を利用して読み出され、そのプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。
以上、本発明において、記載された具体例に対してのみ詳細に説明したが、本発明の技術思想の範囲で多彩な変形および修正が可能であることは、当業者にとって明白なことであり、このような変形および修正が特許請求の範囲に属することは当然のことである。
例えば、本実施形態では、情報格納時における検索キーのハッシュ値Hの計算に、前記(1)式,(2)式を用いたが、検索キーのハッシュ値Hの計算は、検索キーの先頭側の文字ほど重み付けを大きくして計算を行えば、他の計算方法でもよい。
1…情報格納検索装置
2…記憶部選択部
a,b,c,s…記憶部

Claims (5)

  1. 検索キーからハッシュ値を計算し、検索キーのハッシュ値と同一の範囲の値が割り当てられた複数の記憶部のうち、前記検索キーのハッシュ値に対応する値を持つ記憶部に、前記検索キーと検索キーに対応する情報とを格納し、格納された検索キーを情報検索に利用する情報格納検索装置であって、
    前記検索キーの前方のみを用いて該検索キーのハッシュ値を計算し、複数の記憶部の中から、前記検索キーのハッシュ値に対して直近の値が割り当てられた記憶部を、前記検索キーと検索キーに対応する情報とを格納する記憶部として選択する記憶部選択部を設け、前記選択された記憶部に、前記検索キーと検索キーに対応する情報とを木表現で格納し、
    前記記憶部選択部は、
    検索キーの先頭側の文字の値ほど重み付けを大きくしてハッシュ値の計算を行うことを特徴とする情報格納検索装置。
  2. 前記記憶部選択部は、
    ハッシュ値の計算に用いられる検索キー中の各文字の値に、−1以上0未満のdの値を先頭からの文字順iで累乗した値を乗算することにより、重み付けを行うことを特徴とする請求項1記載の情報格納検索装置。
  3. 検索キーからハッシュ値を計算し、検索キーのハッシュ値と同一の範囲の値が割り当てられた複数の記憶部のうち、前記検索キーのハッシュ値に対応する値を持つ記憶部に、前記検索キーと検索キーに対応する情報とを格納し、格納された検索キーを情報検索に利用する情報格納検索装置の情報格納方法であって、
    記憶部選択部が、前記検索キーの前方のみを用いて検索キーのハッシュ値を計算し、複数の記憶部の中から、前記検索キーのハッシュ値に対して直近の値が割り当てられた記憶部を選択する記憶部選択ステップと、
    前記選択された記憶部に、前記検索キーと検索キーに対応する情報とを、木表現によって格納する記憶ステップと、を有し、
    前記記憶部選択部は、
    検索キーの先頭側の文字の値ほど重み付けを大きくしてハッシュ値の計算を行うことを特徴とする情報格納検索装置の情報格納方法。
  4. 前記記憶部選択部は、
    ハッシュ値の計算に用いられる検索キー中の各文字の値に、−1以上0未満のdの値を先頭からの文字順iで累乗した値を乗算することにより、重み付けを行うことを特徴とする請求項3記載の情報格納検索装置の情報格納方法。
  5. 請求項1または2に記載の情報格納検索装置を構成する各手段として、コンピュータを機能させるためのプログラム。
JP2010133935A 2010-06-11 2010-06-11 情報格納検索装置、情報格納方法、および情報格納プログラム Expired - Fee Related JP5416659B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010133935A JP5416659B2 (ja) 2010-06-11 2010-06-11 情報格納検索装置、情報格納方法、および情報格納プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010133935A JP5416659B2 (ja) 2010-06-11 2010-06-11 情報格納検索装置、情報格納方法、および情報格納プログラム

Publications (2)

Publication Number Publication Date
JP2011258115A JP2011258115A (ja) 2011-12-22
JP5416659B2 true JP5416659B2 (ja) 2014-02-12

Family

ID=45474199

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010133935A Expired - Fee Related JP5416659B2 (ja) 2010-06-11 2010-06-11 情報格納検索装置、情報格納方法、および情報格納プログラム

Country Status (1)

Country Link
JP (1) JP5416659B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014041781A1 (ja) * 2012-09-11 2014-03-20 日本電気株式会社 オブジェクト移動判定装置、方法、及びプログラム、オブジェクト配置装置、並びにストレージシステム
CN109889891B (zh) * 2019-03-05 2023-03-24 腾讯科技(深圳)有限公司 获取目标媒体文件的方法、装置及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2683870B2 (ja) * 1994-05-23 1997-12-03 日本アイ・ビー・エム株式会社 文字列検索システム及び方法
JP3849279B2 (ja) * 1998-01-23 2006-11-22 富士ゼロックス株式会社 インデクス作成方法および検索方法
US20030084031A1 (en) * 2001-10-31 2003-05-01 Tarquini Richard P. System and method for searching a signature set for a target signature
US20070079004A1 (en) * 2005-09-30 2007-04-05 Junichi Tatemura Method and apparatus for distributed indexing
JP4891657B2 (ja) * 2006-05-29 2012-03-07 株式会社野村総合研究所 データ記憶システム、ファイル検索装置およびプログラム

Also Published As

Publication number Publication date
JP2011258115A (ja) 2011-12-22

Similar Documents

Publication Publication Date Title
CN102591985B (zh) 与搜索框关联的查询重构
KR102125119B1 (ko) 데이터 핸들링 방법 및 장치
US9535954B2 (en) Join processing device, data management device, and string similarity join system
US20100281022A1 (en) Estimating rank on graph streams
CN108399213B (zh) 一种面向用户个人文件的聚类方法及系统
US20120254173A1 (en) Grouping data
US8639643B2 (en) Classification of a document according to a weighted search tree created by genetic algorithms
US20130054566A1 (en) Acceleration of ranking algorithms using a graphics processing unit
CN102314491A (zh) 多核环境下基于海量日志的类似行为模式用户识别方法
CN106980900A (zh) 一种特征数据处理方法及设备
Ben-Shimon et al. An ensemble method for top-N recommendations from the SVD
JP5416659B2 (ja) 情報格納検索装置、情報格納方法、および情報格納プログラム
JP5432935B2 (ja) 予測器選択装置、予測器選択方法、予測器選択プログラム
KR102339723B1 (ko) Dna 저장 장치의 연성 정보 기반 복호화 방법, 프로그램 및 장치
CN117762515A (zh) 一种基于混合遗传算法的页面加载方法及系统
US20120317130A1 (en) Computer product, search method, search apparatus, and node
WO2022166676A1 (zh) 估计差分隐私保护数据中分词频度的方法及装置
Li et al. On mining webclick streams for path traversal patterns
WO2022134946A1 (zh) 模型训练方法、装置、存储介质及设备
JP2012173794A (ja) ランキングモデル選択機能を有する文書検索装置、ランキングモデル選択機能を有する文書検索方法およびランキングモデル選択機能を有する文書検索プログラム
JP5292336B2 (ja) 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム
JP5555238B2 (ja) ベイジアンネットワーク構造学習のための情報処理装置及びプログラム
CN114281989A (zh) 基于文本相似度的数据去重方法、装置及存储介质和服务器
JP5211000B2 (ja) ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム
Fu et al. Neurons merging layer: Towards progressive redundancy reduction for deep supervised hashing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120903

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131017

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131115

R150 Certificate of patent or registration of utility model

Ref document number: 5416659

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees