JP2010191624A - 情報検索方法とその装置、プログラム、記録媒体 - Google Patents

情報検索方法とその装置、プログラム、記録媒体 Download PDF

Info

Publication number
JP2010191624A
JP2010191624A JP2009034359A JP2009034359A JP2010191624A JP 2010191624 A JP2010191624 A JP 2010191624A JP 2009034359 A JP2009034359 A JP 2009034359A JP 2009034359 A JP2009034359 A JP 2009034359A JP 2010191624 A JP2010191624 A JP 2010191624A
Authority
JP
Japan
Prior art keywords
search
document
word
list
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009034359A
Other languages
English (en)
Inventor
Yoshihiko Kazuhara
良彦 数原
Yukio Uematsu
幸生 植松
Takashi Inoue
孝史 井上
Yoshihito Yasuda
宜仁 安田
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009034359A priority Critical patent/JP2010191624A/ja
Publication of JP2010191624A publication Critical patent/JP2010191624A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索語を構成する単語の連接処理を最適化させ、複数の単語からなる複合語の検索処理全体を高速化させる。
【解決手段】文書を検索する情報検索にあたり、併合処理選択手段31は、検索対象文書群4に含まれる全ての文書の識別子と前記文書の分割で得られた各単語の前記文書における位置情報とを有する転置リストを格納した検索インデックス5から引き出された検索語を構成する各単語の位置情報を有する各転置リストに係る情報に基づき、前記各転置リストに共通して出現する文書の識別子を取得する併合処理に係る探索法を選択する。照合処理選択手段32は、前記併合処理によって取得された識別子を有する転置リストにおける各単語の位置情報リストに係る情報に基づき、前記取得された識別子に対応した前記各単語の位置情報の照合により前記検索語を有する文書における当該検索語の位置情報を取得する照合処理に係る探索法を選択する。
【選択図】図1

Description

本発明は、蓄積された文書群に出現する単語の位置情報を用いて、フレーズ検索や複合語の検索を高速に行う検索インデックスに関する技術である。特に、位置情報を持つ検索インデックスが既に構築されている際に、複数の単語から成る複合語の検索を高速に行うための技術に関する。
一般的には、フレーズや複合語を検索するためには、フレーズや複合語を構成する単語がどの文書のどの位置に出現したかという情報を保持する必要がある。各単語に対応するこの情報を保持したデータ構造を転置リストと呼ぶ。この転置リストは例えば図1に示された情報検索装置1の検索インデックス5に格納されている。
転置リストの一例を図5に示した。図の左側に単語、矢印で接続された右側が対応する転置リストを現している。転置リストは文書の識別子(以下、文書ID)(DocID)、前記文書における各単語の出現位置(pos)の情報を保持している。この例においてterm1の転置リストは、term1が、文書ID1の3,65,69番目、文書ID144の1,5,6,8番目、文書ID170の2,6,68,70番目に出現するという情報を保持している。term2の転置リストは、term2が、文書ID1の2,6,7,9番目、文書ID3の2,5,8番目、文書ID144の2,56,80番目に出現するという情報を保持している。このように文書における単語の出現位置を保持しておくことで、複合語やフレーズの検索が可能となる。
図1、図4(a)及び図6を参照しながら、複合語(検索語)が入力された際の従来の情報検索処理について説明する。
(1)図6に例示したように「東京都」というクエリが情報検索装置1に入力されると、図1に示された検索結果集合特定部3の単語分割手段6は、前記クエリを各単語に分割して、「東京」「都」の単語を得る。
(2)転置リスト取得手段7は図1に示された検索インデックス5から「東京」「都」の転置リストを取得する。
(3)連接処理の過程では、先ず、併合処理手段9が併合対象転置リスト11である二つの転置リストに共通して出現する文書の識別子を共通文書IDとして取得する(図4(a))。次いで、照合処理手段10が、前記二つの転置リストに出現した共通文書IDについて、(2)で取得された各単語が連接して出現しているかを確認し、最終的に複合語「東京都」がどの文書のどの位置に出現するかを検出結果12として取得する(図4(a))。
ここで、前記二つの転置リストにおいて出現する文書IDのリストを生成する処理を併合処理と呼ぶ。そして、同一文書の中で単語が連接していることを確認するため、単語の出現位置が連接しているかを確認するために行う併合処理と同様の処理を、区別のため、照合処理と呼ぶ。本明細書では、このふたつの処理によって連接している単語の検索を行う処理を連接処理と呼ぶ。
照合処理では、同じ出現位置ではなく、次の位置に出現しているものを取得するが、基本的には併合処理と同じ問題を扱っており、同じアルゴリズムで解くことができる。これ以降、併合処理、照合処理を行うためのアルゴリズムを併合処理手法と呼ぶ。
図6の説明では併合処理が完了してから照合処理を行う処理を述べているが、実際には処理速度の高速化のため、併合処理においてふたつの転置リストに出現する文書IDが見つかる度に照合処理を行う。
3つ以上の単語から構成される複合語、フレーズの検索を行う場合、まず2つの単語について連接処理を行い、得られた結果リストと次の単語の転置リストの連接処理を行う。
併合処理は、ふたつのソート済み整数リストから共通集合を取得する操作と見なすことができる。併合処理のアルゴリズムには様々な従来手法があり、大きく分けて線形探索に基づく手法と二分探索に基づく手法の二手法に分類できる。以下、それぞれの手法について概略を述べる。
線形探索に基づく手法では、図7に示された事例のように、ふたつのリストA,Bを先頭から比較していき、同じ値を結果集合に追加してゆく。具体的な処理(ステップ001〜009)のフローチャートを図8に示した。
二分探索に基づく手法では、短い方の転置リストのそれぞれの文書IDについて、もう一方の転置リストを二分探索し、当該値が見つかった場合に結果集合に追加する。二分探索に基づく手法は、特に二つのリストの長さが大きく異なる場合に有効に働く。
二分探索法の具体的な処理(ステップ101〜115)のフローチャートを図10に示した。図9の事例では、まず転置リストCの文書ID3が転置リストDに含まれていないかを探索する。文書ID3を見つけることができなかった場合、次に探索を行う文書ID5は、先ほどの最終探索位置よりも右側にあることが保証されているため、より効率的に探索することができる。
具体的な併合処理手法については様々な手法が提案されており、非特許文献1などにおいて、線形探索に基づく手法、二分探索による最新手法の比較を行っている。
P.Sanders and F.Transier.Intersection in integer inverted indices.In Proc.7th Workshop on Algorithm Engineering and Experiments(ALENEX’07),pp.71−83,New Orleans,Louisiana,USA,January 6,2007.
従来技術では、文書IDのみを保持する転置リスト同士を高速に併合処理するアルゴリズムを提案しており、位置情報を持つ転置リストにおける併合処理・照合処理の組み合わせについては言及していない。また、従来技術の実装では位置情報を保持した転置リストの場合でもひとつの併合処理手法を用いて併合処理、照合処理を行っている。
実際には文書IDの転置リスト長の分布と、単語の位置情報リスト長の分布は大きく異なり、文書IDの転置リストにおける最適な併合処理手法が照合処理でも最適であるとは限らないという問題があった。
前記課題を解決するための発明は、連接処理を構成する併合処理、照合処理を行う際、処理対象の転置リストに対して適切な併合処理手法を選択する。
本発明の情報検索方法の態様としては、文書を検索する情報検索方法であって、併合処理選択手段が、検索対象文書群に含まれる全ての文書の識別子と前記文書の分割によって得られた各単語の前記文書における位置情報とを有する転置リストを格納した検索インデックスから引き出された検索語を構成する各単語の位置情報を有する各転置リスト係る情報に基づき、前記各転置リストに共通して出現する文書の識別子を取得する併合処理に係る探索法を選択するステップと、併合処理手段が前記選択された併合処理に係る探索法によって前記各転置リストに共通して出現する文書の識別子を取得するステップと、照合処理選択手段が、前記取得された識別子を有する転置リストにおける各単語の位置情報リストに係る情報に基づき、前記取得された識別子に対応した前記各単語の位置情報の照合により前記検索語を有する文書における当該検索語の位置情報を取得する照合処理に係る探索法を選択するステップと、照合処理手段が前記選択された照合処理に係る探索法によって前記検索語を有する文書における当該検索語の位置情報を取得するステップとを有する。
本発明の情報検索装置の態様としては、文書を検索する情報検索装置であって、検索対象文書群に含まれる全ての文書の識別子と前記文書の分割によって得られた各単語の前記文書における位置情報とを有する転置リストを格納した検索インデックスから引き出された検索語を構成する各単語の位置情報を有する各転置リストに係る情報に基づき、前記各転置リストに共通して出現する文書の識別子を取得する併合処理に係る探索法を選択する併合処理選択手段と、前記選択された併合処理に係る探索法によって前記各転置リストに共通して出現する文書の識別子を取得する併合処理手段と、前記取得された識別子を有する転置リストにおける各単語の位置情報リストに係る情報に基づき、前記取得された識別子に対応した前記各単語の位置情報の照合により前記検索語を有する文書における当該検索語の位置情報を取得する照合処理に係る探索法を選択する照合処理選択手段と、前記選択された照合処理に係る探索法によって前記検索語を有する文書における当該検索語の位置情報を取得する照合処理手段とを備える。
前記情報検索方法とその装置において、各転置リストに係る情報として各転置リストに有する文書の識別子の数に基づき、併合処理に係る探索法を選択するとよい。また、前記位置情報リストに係る情報として前記位置情報リストの長さに基づき照合処理に係る探索法を選択するとよい。
前記課題を解決するための発明は、前記情報検索装置を構成する各手段としてコンピュータを機能させるプログラムまたはこれを記録したコンピュータ読み取り可能な記録媒体の態様とすることもできる。
以上の発明によれば、検索語を構成する単語の連接処理が最適化されるので、複数の単語からなる複合語などの検索処理全体を高速化できる。
発明と従来技術に係る情報検索装置の構成の差異を説明した概略構成図。 インデックス作成部による検索インデックス作成のフローチャート。 発明に係る連接処理のフローチャート。 (a)従来技術に係る連接処理のブロックフロー図、(b)本発明に係る連接処理のブロックフロー図。 単語の出現位置情報を保持した転置リストの実現例。 具体的な連接処理の説明図。 線形探索に基づく併合処理、照合処理の説明図。 線形探索に基づく併合処理、照合処理のフローチャート。 二分探索に基づく併合処理、照合処理の説明図。 二分探索に基づく併合処理、照合処理のフローチャート。
以下に本発明の実施形態について図面を参照しながら説明するが、本発明はこの実施形態によって限定されるものではない。
本発明に係る情報検索装置は、検索対象となる文書群に対して検索インデックスを作成し、フレーズや複合語で高速に検索するため装置である。
図1に示された本発明の実施形態に係る情報検索装置1は、検索インデックス5を作成するインデックス作成部2と、作成した検索インデックス5を参照して検索結果集合を特定する検索結果集合特定部3とを備える。
本発明に係る情報検索装置1では、特に検索結果集合特定部3に着目している。すなわち、情報検索装置1は、図1に示されたように検索集合特定部3における連接処理モジュール(連接処理手段8)において、併合処理(併合処理手段9)と照合処理(照合処理手段10)を行う前に、それぞれの処理に適切な検索法を選択(併合処理選択手段31、照合処理選択手段32)することで連接処理全体の高速化を行う。
インデックス作成部2は、検索対象文書群4に含まれる全ての検索対象文書を構成する各単語の当該検索対象文書における出現位置情報を保持させた転置リストを作成し、これを更新可能に検索インデックス5に格納する。すなわち、インデック作成部2は、検索対象文書群4から処理対象の文書を取得する文書取得手段21と、前記取得した処理対象の文書を各単語に分割する単語分割手段22と、前記分割よって得られた各単語の前記文書における出現位置情報を保持させた転置リストを作成する転置リスト作成手段23とを備える。前記各単語の転置リストの態様としては、図5に例示したように、前記各単語を含んだ検索対象文書の識別子と前記各単語の前記検索対象文書における位置情報とを有する転置リストが挙げられる。前記分割処理には、例えば従来技術に係る形態素解析手段などを用いればよい。
検索結果集合特定部3は単語分割手段6と転置リスト取得手段7と連接処理手段8とを備える。本発明に係る連接処理手段8は、図4(b)に示されたように、従来技術(図4(a))に係る併合処理機能(併合処理手段9)及び照合処理機能(照合処理手段10)に加えて、併合処理選択機能(併合処理選択手段31)、照合処理選択機能(照合処理選択手段32)を備える。
単語分割手段6は入力された複合語(検索語)をその構成要素である各単語に分割する。単語分割手段6もインデックス作成部2の分割機能と同様に従来技術に係る周知の形態素解析手段などを用いればよい。
転置リスト取得手段7は前記各単語の転置リストを検索インデックス5から取得する。
連接処理手段8において、併合処理選択手段31は併合処理を行う併合対象転置リスト11に係る情報に基づき併合処理に係る探索手法を選択する。具体的には、併合処理選択手段31は、検索インデックス5から引き出された検索語を構成する各単語の位置情報を有する併合対象転置リスト11に係る情報に基づき、併合対象転置リスト11に共通して出現する文書の識別子(共通文書ID)を取得する併合処理に係る探索法を選択する。本実施形態では、併合処理選択手段31は、併合対象転置リスト11に係る情報として、併合対象転置リスト11に含まれる文書の識別子(ID)の数を採用している。
併合処理手段9は併合処理選択手段31が選択した併合処理に係る探索法によって併合対象転置リスト11に共通して出現する文書の識別子を取得する。
照合処理選択手段32は併合処理手段9によって得られた共通文書IDについて照合を行う位置情報のリストに基づき照合処理の探索手法を選択する。具体的には、照合処理選択手段32は、併合処理手段9で取得された識別子(共通文書ID)を有する転置リストにおける各単語の位置情報リストに係る情報に基づき、前記取得された識別子に対応した前記各単語の位置情報の照合により前記検索語を有する文書における当該検索語の位置情報を取得する照合処理に係る探索法を選択する。本実施形態では、照合処理選択手段32は、前記位置情報リストに係る情報として、照合を行う共通文書IDを有する転置リストの位置情報リストの長さを採用している。
照合処理手段10は照合処理選択手段32が選択した照合処理に係る探索法によって前記検索語を有する文書における当該検索語の位置情報を取得する。
また、情報検索装置1には、前記併合処理に係る探索手法として線形探索法に基づく手法を事前に設定するための併合処理設定手段33と、前記照合処理に係る探索手法として二分探索に基づく手法を事前に設定するための照合処理設定手段34が具備されている。
以上の情報検索装置1を構成する機能手段2〜10,21〜23,31〜34はコンピュータのハードウェアとプログラムの協働によって実現できる。検索対象文書群4、検索インデックス5はハードディスク装置等の格納手段に格納される。前記機能手段2〜10,21〜23,31〜34としてコンピュータを機能させるプログラムは既知の記録媒体(例えば、CD−ROM、DVD−ROM、CD−R、CD−RW、DVD−R、DVD−RW、MO、HDD、Blu−ray Disk(登録商標)等)に格納してまたはネットワークを通じて提供できる。
図2を参照しながらインデックス作成部2によって実行される検索インデックス5の作成の具体的な過程(ステップ201〜210)について説明する。
ステップ201:docidに0を代入する。
ステップ202:図1の検索対象文書群4に未処理の文書がある場合、ステップ203に進む。未処理の文書がない場合は処理を終了する。
ステップ203:文書取得手段21は検索対象文書群4から未処理のdocid番目の文書を取得し、この取得した文書をdとする。
ステップ204:単語分割手段22は前記取得した処理対象の文書dを単語に分割する。
ステップ205:転置リスト作成手段23は文書dにおける単語の出現位置posに0を代入する。そして、転置リスト作成手段23は以下のステップ206〜210を実行する。
ステップ206:処理中の文書dに未処理の単語がある場合、ステップ207に進む。未処理の単語がない場合、ステップ210に進む。
ステップ207:文書dにおける出現位置がpos番目の単語を取得し、tとする。
ステップ208:検索インデックス5から単語tに対応する転置リストを取得し、このリストに文書dにおける出現位置posを追加する。
ステップ209:文書dにおける単語の出現位置posにpos+1を代入する。ステップ206に戻る。
ステップ210:docidにdocid+1を代入し、ステップ202に戻る。そして、未処理のdocid+1番目の文書についてステップ203〜208の処理が実行される。
次に、連接処理手段8によって実行される連接処理の具体的な過程(ステップ301〜309)について図3を参照しながら述べる。
ステップ301:単語分割手段6は入力された検索クエリを単語に分割する。
ステップ302:転置リスト取得手段7は検索インデックス5から、前記分割で得た各単語に対応する転置リストを取得する。取得したk個の転置リストをL1,L2,…,Lkとする。
ステップ303:カウント変数iに1を代入する。
ステップ304:カウント変数i<kの場合、ステップ305に進む。一方、そうでない場合は処理を終了する。
ステップ305:併合処理選択手段31は転置リストLiと転置リストLi+1に基づき併合処理に係る探索手法を選択する。例えば転置リストLi,Li+1の文書IDの数に基づき最適な併合処理に係る探索手法を選択する。具体的には、「転置リストLiの文書IDの数」<「転置リストLi+1の文書IDの数」の場合はR=Li/Li+1、その他の場合はR=Li+1/Liとして文書ID数の比率Rを算出する。そして、予め設定した閾値Tに基づいてこの2つの文書IDリストに最適な併合処理に係る探索手法を選択する。例えば、閾値T<Rの場合、二分探索法を選択し、それ以外の場合、線形探索法を選択する。若しくは、併合処理設定手段33によって事前に設定された併合処理に係る探索手法(例えば線形探索法)を用いる。
ステップ306:併合処理手段9はステップ305で選択された探索法によって転置リストLi,Li+1における文書IDの併合処理を行う。尚、併合処理手法に線形探索法が併合処理設定手段33によって選択されている場合、例えば従来技術の線形探索に基づく手法(非特許文献1参照)などが用いられる。
ステップ307:照合処理選択手段32はステップ306で得られた共通文書IDの転置リストLi,Li+1の位置情報リストに基づき照合処理で使用する探索手法を選択する。例えば、ステップ305と同様に、転置リストLi,Li+1の位置情報リストの長さの比率に基づいて選択する。「転置リストLiの位置情報リストの長さ」<「転置リストLi+1の位置情報リストの長さ」の場合はR=Li/Li+1、その他の場合はR=Li+1/Liとし、予め設定した閾値Sに基づいてこの2つの文書IDリストに最適な照合処理に係る探索手法を選択する。例えばS<Rの場合、二分探索を選択し、それ以外の場合、線形探索を選択する。若しくは、照合処理設定手段34によって予め設定された照合処理に係る探索手法(例えば二分探索法)を用いる。
ステップ308:照合処理手段10は、ステップ306で得られた共通の文書IDについて、ステップ307で選択された探索手法によって位置情報の照合処理を行う。位置情報の照合処理に二分探索法が照合処理設定手段34によって選択されている場合、例えば従来技術の二分探索に基づく手法(非特許文献1参照)などを用いる。この照合処理の結果リスト(前記検索クエリを有する文書における当該検索クエリの位置情報のリスト)をLi+1とする。
ステップ309:iにi+1を代入してステップ304に戻る。
以上の処理によって得られた結果リストは図示省略の表示手段(ディスプレイ)によって適宜に表示される。
以上のように、情報検索装置1によれば、単語の位置情報を有する転置リストにおける連接処理を構成する併合処理、照合処理を行う際、処理対象の転置リストに対して適切な探索手法が選択される。したがって、連接処理が最適化され、連接処理を必要とする複合語などの検索処理全体を高速化できる。
また、二つの転置リストの長さが与えられると、その計算量の理論値から、最適な探索手法を選択できる。さらに、検索対象の文書のデータの特性に基づいて、適切な手法の組み合わせを選択することで、連接処理の処理速度が改善する。
1…情報検索装置
2…インデックス作成部
3…検索結果集合特定部
4…検索対象文書群
5…検索インデックス
8…連接処理手段
9…併合処理手段
10…照合処理手段
31…併合処理選択手段
32…照合処理選択手段
33…併合処理設定手段
34…照合処理設定手段

Claims (8)

  1. 文書を検索する情報検索方法であって、
    併合処理選択手段が、検索対象文書群に含まれる全ての文書の識別子と前記文書の分割によって得られた各単語の前記文書における位置情報とを有する転置リストを格納した検索インデックスから引き出された検索語を構成する各単語の位置情報を有する各転置リストに係る情報に基づき、前記各転置リストに共通して出現する文書の識別子を取得する併合処理に係る探索法を選択するステップと、
    併合処理手段が前記選択された併合処理に係る探索法によって前記各転置リストに共通して出現する文書の識別子を取得するステップと、
    照合処理選択手段が、前記取得された識別子を有する転置リストにおける各単語の位置情報リストに係る情報に基づき、前記取得された識別子に対応した前記各単語の位置情報の照合により前記検索語を有する文書における当該検索語の位置情報を取得する照合処理に係る探索法を選択するステップと、
    照合処理手段が前記選択された照合処理に係る探索法によって前記検索語を有する文書における当該検索語の位置情報を取得するステップと
    を有すること
    を特徴とする情報検索方法。
  2. 前記各転置リストに係る情報は当該各転置リストに有する文書の識別子の数であり、
    前記位置情報リストに係る情報は当該位置情報リストの長さであること
    を特徴とする請求項1に記載の情報検索方法。
  3. 併合処理設定手段が前記併合処理に係る探索法として線形探索法を事前に設定するステップと、
    照合処理設定手段が前記照合処理法に係る探索法として二分探索法を事前に設定するステップと
    をさらに有すること
    を特徴とする請求項1または2に記載の情報検索方法。
  4. 文書を検索する情報検索装置であって、
    検索対象文書群に含まれる全ての文書の識別子と前記文書の分割によって得られた各単語の前記文書における位置情報とを有する転置リストを格納した検索インデックスから引き出された検索語を構成する各単語の位置情報を有する各転置リストに係る情報に基づき、前記各転置リストに共通して出現する文書の識別子を取得する併合処理に係る探索法を選択する併合処理選択手段と、
    前記選択された併合処理に係る探索法によって前記各転置リストに共通して出現する文書の識別子を取得する併合処理手段と、
    前記取得された識別子を有する転置リストにおける各単語の位置情報リストに係る情報に基づき、前記取得された識別子に対応した前記各単語の位置情報の照合により前記検索語を有する文書における当該検索語の位置情報を取得する照合処理に係る探索法を選択する照合処理選択手段と、
    前記選択された照合処理に係る探索法によって前記検索語を有する文書における当該検索語の位置情報を取得する照合処理手段と
    を備えたこと
    を特徴とする情報検索装置。
  5. 前記各転置リストに係る情報は当該各転置リストに有する文書の識別子の数であり、
    前記位置情報リストに係る情報は当該位置情報リストの長さであること
    を特徴とする請求項4に記載の情報検索装置。
  6. 前記併合処理に係る探索法として線形探索法を事前に設定する併合処理設定手段と、
    前記照合処理に係る探索法として二分探索法を事前に設定する照合処理設定手段と
    をさらに備えたこと
    を特徴とする請求項4または5に記載の情報検索装置。
  7. 請求項4から6のいずれか1項に記載の情報検索装置を構成する各手段としてコンピュータを機能させるプログラム。
  8. 請求項7に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2009034359A 2009-02-17 2009-02-17 情報検索方法とその装置、プログラム、記録媒体 Pending JP2010191624A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009034359A JP2010191624A (ja) 2009-02-17 2009-02-17 情報検索方法とその装置、プログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009034359A JP2010191624A (ja) 2009-02-17 2009-02-17 情報検索方法とその装置、プログラム、記録媒体

Publications (1)

Publication Number Publication Date
JP2010191624A true JP2010191624A (ja) 2010-09-02

Family

ID=42817615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009034359A Pending JP2010191624A (ja) 2009-02-17 2009-02-17 情報検索方法とその装置、プログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP2010191624A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810220A (zh) * 2012-11-15 2014-05-21 腾讯科技(深圳)有限公司 一种微博搜索方法及装置
JP2018124633A (ja) * 2017-01-30 2018-08-09 株式会社デンソー 電子制御装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810220A (zh) * 2012-11-15 2014-05-21 腾讯科技(深圳)有限公司 一种微博搜索方法及装置
CN103810220B (zh) * 2012-11-15 2018-02-27 腾讯科技(深圳)有限公司 一种微博搜索方法及装置
JP2018124633A (ja) * 2017-01-30 2018-08-09 株式会社デンソー 電子制御装置

Similar Documents

Publication Publication Date Title
JP6028567B2 (ja) データ格納プログラム、データ検索プログラム、データ格納装置、データ検索装置、データ格納方法及びデータ検索方法
KR100739726B1 (ko) 문자열 매칭 방법 및 시스템과 그 방법을 기록한 컴퓨터판독 가능한 기록매체
CN107403075B (zh) 比对方法、装置及系统
CN106033416A (zh) 一种字符串处理方法及装置
JP4893624B2 (ja) データのクラスタリング装置、クラスタリング方法及びクラスタリング用プログラム
US20150261783A1 (en) Method and apparatus for storing and reading files
CN101021851B (zh) 文本检索装置和文本检索方法
JP2010061587A (ja) 類似文書判定装置、類似判定方法およびそのプログラム
CN101925898A (zh) 在数据库中组织媒体数据的方法和装置
KR100899930B1 (ko) 연관 데이터 클래스 생성 방법 및 시스템
CN103530311A (zh) 对元数据进行优先次序排序的方法和装置
JP2010191624A (ja) 情報検索方法とその装置、プログラム、記録媒体
JP5757551B2 (ja) 意味分類付与装置、意味分類付与方法、意味分類付与プログラム
CN108846039B (zh) 数据流向确定方法及装置
JP2009098811A (ja) 文書分類装置およびプログラム
KR101992631B1 (ko) 비동기 방식을 사용하는 파일 색인장치 및 그 방법
CN112148359B (zh) 一种基于子块过滤的分布式代码克隆检测与搜索方法、系统及介质
KR101679011B1 (ko) 데이터베이스에서 데이터 이동을 처리하는 방법 및 장치
CN110866088B (zh) 一种语料库之间的快速全文检索方法及系统
JP5954742B2 (ja) 文書を検索する装置及び方法
JP6753190B2 (ja) 文書検索装置及びプログラム
CN109710844A (zh) 基于搜索引擎的快速准确定位文件的方法和设备
CN110704645B (zh) 一种基于指纹的语料库全文检索方法及系统
JP2006126883A (ja) 情報検索装置及び情報検索方法
JP2006268545A (ja) ファイル結合装置及びファイル結合方法及びプログラム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100616