JP2013161371A - テキスト検索装置及びプログラム - Google Patents
テキスト検索装置及びプログラム Download PDFInfo
- Publication number
- JP2013161371A JP2013161371A JP2012024491A JP2012024491A JP2013161371A JP 2013161371 A JP2013161371 A JP 2013161371A JP 2012024491 A JP2012024491 A JP 2012024491A JP 2012024491 A JP2012024491 A JP 2012024491A JP 2013161371 A JP2013161371 A JP 2013161371A
- Authority
- JP
- Japan
- Prior art keywords
- search
- text
- character string
- keyword
- head
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Abstract
【解決手段】テキスト検索装置100は、検索対象となる文書に記載された文字等と、当該文字等の出現位置と、を対応付けた転置インデックスを複数記憶する情報記憶部110を備える。転置インデックスは、文書中の前方一致検索の対象となるテキストの先頭に先頭マークを挿入した文書について生成されたものである。テキスト検索装置100のインクリメント検索部1410は、検索キーワードの先頭に先頭マークを挿入して、転置インデックスを用いて前方一致検索を実行する。また、本検索部1420は、同じ転置インデックスを用いて部分一致検索を実行する。
【選択図】図4
Description
複数の文書カテゴリから構成される検索対象となる文書に含まれる文字列と、当該文字列の前記文書における出現位置と、を対応づけた索引情報を記憶する記憶手段と、
検索キーワードを取得する取得手段と、
前記文書のうち前方一致検索の対象となるカテゴリに属する文字列から、前記検索キーワードから始まる文字列を、前記索引情報を用いて検索する前方一致検索手段と、
前記索引情報を用いて、前記文書から前記検索キーワードを含む文字列を検索する部分一致検索手段と、
前記前方一致検索手段が検索した結果を示す情報と、前記部分一致検索手段が検索した結果を示す情報と、を出力する出力手段と、
を備えることを特徴とする。
また、辞書データのうち、見出語テキストが占める部分を見出部CE、本文テキストがしめる部分を本文部CBという。
解説テキストは、当該テキストで表される内容が解説であることを表す解説タグに囲まれており、用例テキストは、当該テキストで表される内容が用例であることを表す用例タグに囲まれている。
また、各見出部CEには、見出部CEを識別する見出語番号が予め割り当てられている。辞書データには、この見出語番号を表す情報と、当該見出語番号で識別される見出部CEが格納された情報記憶部110における記憶領域の先頭アドレスを表す情報と、当該見出部CEの直後に格納された本文部CBの先頭アドレスを表す情報と、が対応付けられた情報が、見出語の数だけ含まれる。
第1に、テキスト検索装置100は、ユーザがキーボード100iを用いて検索キーワードを一文字入力する毎に、その時点のキーワードを前方一致検索して、キーワードを先頭に含む見出語を表示する。この検索をインクリメント検索と呼ぶ。また、テキスト検索装置100がインクリメント検索を実行している状態を、インクリメント検索モードと呼ぶ。インクリメント検索の実行例を図6に示す。
次の一字(ここではh)を入力すると、同様にwhを先頭に持つ見出語を検索して表示する(図6の中央)。以下、3文字以上入力した場合についても、同様に検索して表示する(例えば図6の右)。ユーザは候補として所望の見出語(ここではwhile)が表示されると、いつでも所望の見出語を選択してその本文テキストを表示できるようにすることができる。
なお、図6ではインクリメント検索の結果を各辞書データ(英英辞典、英和辞典、百科事典)毎に分けて表示する例を紹介した。しかし、この例に限られず、すべての検索結果を文字順にソートしてまとめて表示する構成も可能である。このとき、重複する単語については一つだけ表示するとしても良い。
本実施形態では、インクリメント検索と本検索を一つの索引情報(転置インデックス)を用いて実行する。
さらに、生成部120はステップS102で、抽出された見出語テキスト毎に、見出語テキストで表される見出語を解説する解説テキストを本文テキストから解説タグに基づいて複数抽出し、かつ見出語の用例を表す用例テキストを用例タグに基づいて本文テキストから複数抽出する。
同様に、生成部120は、構成単位毎に、抽出された複数の用例テキストの並び順を変更せずにまとめて配置することで、抽出された複数の用例テキストが配置された部位(以下、用例部CXという)を生成する。
図9では、出現位置情報ファイル(APファイル)は「position.idx」という名称(ファイル名)で示されている。また、出現位置情報ファイルに保存された出現位置情報は、先頭アドレスから出現頻度用の所定バイト数までの領域に出現頻度を表す情報が格納され、当該領域の直後から出現位置用の所定バイト数毎に出現位置アドレスを表す情報が格納される。
図9では、Sファイルは「pattern.idx」という名称(ファイル名)で示されている。
図9では、EPファイルは「example.idx」という名称(ファイル名)で示されている。
その後、生成部120は、用例開始位置情報ファイルを情報記憶部110へ保存する(図3に示すステップS108)。尚、EPファイルに保存された用例開始位置情報は、用例部開始位置からの差分を表す情報が、先頭アドレスから当該差分用の所定バイト数までの領域に格納され、当該領域の直後から所定バイト数毎に他の差分を表す情報が格納される。
図9では、Tファイルは「number.idx」という名称(ファイル名)で示されている。
生成部120は、Tファイルを情報記憶部110へ保存した後に(図3に示すステップS109)、データ等生成処理の実行を終了する。
このテキスト検索処理を実行することにより、CPU100aは図4に示すような取得部130、インクリメント検索部1410と本検索部1420を含む検索部140、算出部150、決定部160、及び出力部170として機能する。また、CPU100aは、図2に示したビデオカード100g及びLCD100hと協働して表示部180として機能する。
Nの値は、設定値(転置インデックスに対応するNの値)及び入力キーワードの文字数で変化する。例えば、入力キーワードが「・whi」であり、設定値がN=2である場合には、バイグラム文字列パタン「・w」、「wh」、「hi」を検索パタンとして生成する。N=3の場合は、「・wh」、「whi」を生成する。なお、(マーク挿入後の)入力キーワードの文字数が設定値以下である場合(例えば設定値がN=3であり、入力キーワードが「・w」である場合)、入力キーワードの文字数(ここでは2)をNの値とする。そして、一つのNグラム(バイグラム「・w」)のみからなるNグラム文字列パタンを生成する。ここでは、N=2とし、「・w」、「wh」、「hi」を生成するとする。
ここでは、生成した複数の検索パタンのうち最も出現頻度が少ない検索パタンの出現位置を注目出現位置とする。具体的には、まずインクリメント検索部1410がAPファイル(つまり、出現位置情報ファイル)及びSファイル(つまり、Nグラム文字列パタンファイル)から、検索パタンの出現頻度を検索する。即ち、インクリメント検索部1410は、Nグラム文字列パタンファイル(図9の「pattern.idx」)から、生成した検索パタンを表す情報に対応付けられた出現位置情報格納アドレスを表す情報を検索する。そして、インクリメント検索部1410は、出現位置情報ファイル(図9の「position.idx」)から、検索された情報で表される出現位置情報格納アドレスが指し示す位置を開始位置として、情報記憶部110に格納された出現位置情報を取得する。次に、インクリメント検索部1410は、取得した出現位置情報の先頭アドレスから上記出現頻度用の所定バイト数までの領域に格納された出現頻度を表す情報を抽出する。
具体的には、まず情報記憶部110が予め記憶する所定範囲を表す情報を取得する。さらに、インクリメント検索部1410は、注目検索パタン注目検索パタン「wh」以外の検索パタン「・w」、「hi」の出現位置の内で、注目出現位置から所定範囲までの出現位置を、それぞれ特定出現位置とする(ステップS305)。
具体的には、インクリメント検索部1410はステップS306で注目検索パタンと他の検索パタンについて、入力キーワードにおける相対位置(距離及び前後関係)を取得する。例えば、注目検索パタン「wh」は、入力キーワード(マーク挿入後)「・whi」において、他の検索パタン「・w」の一文字後にあり、「hi」の一文字前に位置する。相対位置とは、このような「n文字後(前)に位置する」という位置情報である。
同様に、ステップS305でSファイルとAPファイルを参照して取得した注目出現位置と特定出現位置を比較して、再配置コンテンツテキストデータ上の注目検索パタンと他の検索パタンとの相対位置を取得する。そして、全ての他の検索パタンと注目検索パタンの相対位置が、入力キーワードと再配置コンテンツテキストデータとで一致した場合に、連続性があると評価される。一方、何れかの他の検索パタンと注目検索パタンの相対位置が、入力キーワードと再配置コンテンツテキストデータとで異なる場合、連続性は無いと評価される。このようにして、注目出現位置における連続性を評価する(ステップS306)。
そして、検索キーワードが確定したか判別する(ステップS204)。具体的には、現在の入力キーワードを検索キーワードとして確定する操作(例えば実行キーの押下)を検出すると、現在の入力キーワードを検索キーワードとする。この操作を検出しない場合(ステップS204;NO)、新たに一文字追加する操作を待ち受ける。そして、新たな操作を受け付けたことにより、新たな入力キーワードが得られた場合には、その入力キーワードについてステップS201から処理を繰り返す。
一方、検索キーワードが複数である場合(ステップS15;No)、ステップS12で生成した検索パタンのうち、最少の出現頻度の検索パタンを含む検索キーワードを基準文字列とし、基準文字列以外のキーワードを検証文字列とする(ステップS18)。検索に要する計算量を削減するためである。そして、複数の検索キーワードを検索する処理(複数文字列検索処理)を実行する(ステップS19)。ステップS17乃至ステップS19の検索処理を終えると、図12の本検索処理は終了する。
例えば、検索キーワードが「単一」(つまり、1個)であり、見出部CEが出現部位である場合については、数式(2)を用いて評価値を算出するという情報を取得する。このとき、その見出部CEに含まれるテキストを特定テキストと呼ぶ。
さらに、算出部150は、評価値を算出する方法の情報を取得すると、その情報が示す方法で各出現部位の評価値を算出する(ステップS23)。この評価値の値が小さい程、出力優先度は高い。
数式(2)で算出される評価値は、基準文字列と特定部位(見出部)の文字列(つまり、見出テキスト)とが完全に一致する場合に最小の値となり、特定見出部の見出テキストに基準文字列「while」以外の文字が多く含まれる程大きい値となる。これは、通常、ユーザは、検索キーワードである基準文字列と完全一致する見出テキストの表示を所望することが多いからである。また、通常、ユーザは、検索キーワード以外の文字を多く含む見出テキストよりも検索キーワード以外の文字を少なく含む見出テキストの表示を所望することが多いからである。
なお、検索部140は、PosStidxid,example,expidは、次の手順で取得する。
まず、ステップS23で取得した用例開始位置情報格納アドレスに基づいて、図9に示したファイル名が「example.idx」のEPファイル(つまり、用例開始位置情報ファイル)から用例開始位置情報を参照して求める。さらに、用例番号用例開始位置情報に含まれる用例部開始位置からの差分を表す情報の内で、算出された用例部CXの開始位置と、処理対象となる特定出現位置と、の差分以下であり、かつ最大の差分を求める。
次に、検索部140は、検索した差分を表す情報が用例開始位置情報において何番目の情報であるかを上記差分用の所定バイト数に基づいて特定し、特定した番号を用例番号とする。
その後、求めた差分を、特定見出部に対応した用例部CXの開始位置に加算することで、特定した用例番号の用例テキストの開始位置(PosStidxid,example,expid)を算出する。
なお、この「所定の範囲」はこれに限らず、自由に設定可能である。また、ユーザ操作等により設定変更することが出来るとしても良い。
一方、全ての出現位置について上記処理済みであった場合(ステップS61;Yes)、決定部160が、カテゴリ毎に、ステップS60で算出された評価値に基づき、1又は複数の特定テキストの表示順位を決定する(ステップS62)。本実施形態では、決定部160は、特定テキストの評価値が小さい特定テキストの表示順位程、先に表示される順位に決定する。
以上、本発明の実施形態1について説明したが、本発明の実施形態はこれに限られない。
例えば、上記実施形態1では、先頭マークは半角スペースであるとしたが、先頭マークはこれに限られず自由に選択可能である。例えば、先頭マークはシステムに予約されたユニークなマーク(その他で前方一致検索の対象となるテキストに現れないマーク)であってよい。このような場合、ユニークな先頭マークを挿入した転置インデックスを用いて、先頭マークを挿入した検索キーワードを検索すれば、検索ヒット部位は必ず対象となる文字列の先頭である。そのため、この場合には検索ヒット部位(特定部位)が前方一致検索の対象となるテキストの先頭であるかを、先頭を示すアドレスと特定部位とを比較して評価する必要はない。具体的には、図11のステップS312で評価値を算出し、ステップS313での判別処理に反映する必要は無い。このような構成によれば、少ない必要計算量で前方一致検索と部分一致検索を実現できる。
また、検索の対象とされる文書は、例えば、ある製品が有する機能の名称を表すテキストが分類されるカテゴリ(以下、機能名カテゴリという)と、当該機能を利用するための操作方法を表すテキストが分類されるカテゴリ(以下、操作方法カテゴリという)とを有する説明書であっても良い。このとき、製品名と、カテゴリと、をインクリメント検索の対象とし、全文を本検索の対象とうすることが考えられる。
以下に本願出願の当初の特許請求の範囲に記載された発明を付記する。
複数の文書カテゴリから構成される検索対象となる文書に含まれる文字列と、当該文字列の前記文書における出現位置と、を対応づけた索引情報を記憶する記憶手段と、
検索キーワードを取得する取得手段と、
前記文書のうち前方一致検索の対象となるカテゴリに属する文字列から、前記検索キーワードから始まる文字列を、前記索引情報を用いて検索する前方一致検索手段と、
前記索引情報を用いて、前記文書から前記検索キーワードを含む文字列を検索する部分一致検索手段と、
前記前方一致検索手段が検索した結果を示す情報と、前記部分一致検索手段が検索した結果を示す情報と、を出力する出力手段と、
を備えることを特徴とするテキスト検索装置。
前記前方一致検索手段は、前記索引情報を用いて、前記検索キーワードが前記前方一致検索の対象となるカテゴリに属する文字列のうち、当該検索キーワードが先頭にある文字列を特定して、前記検索キーワードから始まる文字列を検索する、
ことを特徴とする付記1に記載のテキスト検索装置。
前記記憶手段は、前記前方一致検索の対象となるカテゴリに属する文字列の先頭に、先頭であることを示すマークである先頭マークを挿入した上で、当該文字列を前記索引情報を記憶し、
前記前方一致検索手段は、前記取得手段が取得した検索キーワードの先頭に前記先頭マークを挿入して、当該先頭マークを含む検索キーワードを、前記先頭マークを挿入した文字列を含む索引情報を用いて前記文書を検索することにより、前記検索キーワードが先頭にある文字列を特定する、
ことを特徴とする付記2に記載のテキスト検索装置。
前記索引情報は、前記前方一致検索の対象となるカテゴリに属する各文字列の先頭の位置を示す先頭情報をさらに含み、
前記前方一致検索手段は、前記索引情報を用いて前記検索キーワードの位置を特定し、当該特定した位置と、前記索引情報の先頭情報が示す位置と、を比較して前記検索キーワードが先頭にある文字列を特定する、
ことを特徴とする付記2又は3に記載のテキスト検索装置。
検索キーワードを一字ずつ入力するユーザの操作と、検索キーワードを確定するユーザの操作と、を受け付ける操作受付手段を更に備え、
前記取得手段は、
前記操作受付手段が検索キーワードを入力する操作を受け付ける度に、当該操作が示す文字をそれまで受け付けた操作が示す文字又は文字列に加えて、前記前方一致検索手段が検索する検索キーワードとして取得し、
前記操作受付手段が前記検索キーワードを確定するユーザの操作を受け付けると、当該確定された検索キーワードを、前記部分一致検索手段が検索する検索キーワードとして取得する、
ことを特徴とする付記1乃至4の何れか一つに記載のテキスト検索装置。
コンピュータに、
複数の文書カテゴリから構成される検索対象となる文書に含まれる文字列と、当該文字列の前記文書における出現位置と、を対応づけた索引情報を取得する処理、
検索キーワードを取得する処理、
前記文書のうち前方一致検索の対象となるカテゴリに属する文字列から、前記検索キーワードから始まる文字列を、前記索引情報を用いて検索する処理、
前記索引情報を用いて、前記文書のうち前記検索キーワードを含む文字列を検索する処理、
前記検索した結果を示す情報を出力する処理、
を実行させることを特徴とするプログラム。
Claims (6)
- 複数の文書カテゴリから構成される検索対象となる文書に含まれる文字列と、当該文字列の前記文書における出現位置と、を対応づけた索引情報を記憶する記憶手段と、
検索キーワードを取得する取得手段と、
前記文書のうち前方一致検索の対象となるカテゴリに属する文字列から、前記検索キーワードから始まる文字列を、前記索引情報を用いて検索する前方一致検索手段と、
前記索引情報を用いて、前記文書から前記検索キーワードを含む文字列を検索する部分一致検索手段と、
前記前方一致検索手段が検索した結果を示す情報と、前記部分一致検索手段が検索した結果を示す情報と、を出力する出力手段と、
を備えることを特徴とするテキスト検索装置。 - 前記前方一致検索手段は、前記索引情報を用いて、前記検索キーワードが前記前方一致検索の対象となるカテゴリに属する文字列のうち、当該検索キーワードが先頭にある文字列を特定して、前記検索キーワードから始まる文字列を検索する、
ことを特徴とする請求項1に記載のテキスト検索装置。 - 前記記憶手段は、前記前方一致検索の対象となるカテゴリに属する文字列の先頭に、先頭であることを示すマークである先頭マークを挿入した上で、当該文字列を前記索引情報を記憶し、
前記前方一致検索手段は、前記取得手段が取得した検索キーワードの先頭に前記先頭マークを挿入して、当該先頭マークを含む検索キーワードを、前記先頭マークを挿入した文字列を含む索引情報を用いて前記文書を検索することにより、前記検索キーワードが先頭にある文字列を特定する、
ことを特徴とする請求項2に記載のテキスト検索装置。 - 前記索引情報は、前記前方一致検索の対象となるカテゴリに属する各文字列の先頭の位置を示す先頭情報をさらに含み、
前記前方一致検索手段は、前記索引情報を用いて前記検索キーワードの位置を特定し、当該特定した位置と、前記索引情報の先頭情報が示す位置と、を比較して前記検索キーワードが先頭にある文字列を特定する、
ことを特徴とする請求項2又は3に記載のテキスト検索装置。 - 検索キーワードを一字ずつ入力するユーザの操作と、検索キーワードを確定するユーザの操作と、を受け付ける操作受付手段を更に備え、
前記取得手段は、
前記操作受付手段が検索キーワードを入力する操作を受け付ける度に、当該操作が示す文字をそれまで受け付けた操作が示す文字又は文字列に加えて、前記前方一致検索手段が検索する検索キーワードとして取得し、
前記操作受付手段が前記検索キーワードを確定するユーザの操作を受け付けると、当該確定された検索キーワードを、前記部分一致検索手段が検索する検索キーワードとして取得する、
ことを特徴とする請求項1乃至4の何れか一項に記載のテキスト検索装置。 - コンピュータに、
複数の文書カテゴリから構成される検索対象となる文書に含まれる文字列と、当該文字列の前記文書における出現位置と、を対応づけた索引情報を取得する処理、
検索キーワードを取得する処理、
前記文書のうち前方一致検索の対象となるカテゴリに属する文字列から、前記検索キーワードから始まる文字列を、前記索引情報を用いて検索する処理、
前記索引情報を用いて、前記文書のうち前記検索キーワードを含む文字列を検索する処理、
前記検索した結果を示す情報を出力する処理、
を実行させることを特徴とするプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012024491A JP5910134B2 (ja) | 2012-02-07 | 2012-02-07 | テキスト検索装置及びプログラム |
US13/734,174 US8996571B2 (en) | 2012-02-07 | 2013-01-04 | Text search apparatus and text search method |
CN201310049022.2A CN103257995B (zh) | 2012-02-07 | 2013-02-07 | 文本检索装置以及文本检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012024491A JP5910134B2 (ja) | 2012-02-07 | 2012-02-07 | テキスト検索装置及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016050358A Division JP6447549B2 (ja) | 2016-03-15 | 2016-03-15 | テキスト検索装置、テキスト検索方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013161371A true JP2013161371A (ja) | 2013-08-19 |
JP5910134B2 JP5910134B2 (ja) | 2016-04-27 |
Family
ID=48903842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012024491A Active JP5910134B2 (ja) | 2012-02-07 | 2012-02-07 | テキスト検索装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8996571B2 (ja) |
JP (1) | JP5910134B2 (ja) |
CN (1) | CN103257995B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016177395A (ja) * | 2015-03-19 | 2016-10-06 | アイシン・エィ・ダブリュ株式会社 | 文字入力システム、方法およびプログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6135331B2 (ja) * | 2013-06-27 | 2017-05-31 | カシオ計算機株式会社 | 電子機器、プログラム、および、検索システム、検索方法 |
CN104424255B (zh) * | 2013-08-28 | 2019-02-01 | 阿尔派株式会社 | 检索装置及检索方法 |
WO2016082094A1 (en) | 2014-11-25 | 2016-06-02 | Yahoo! Inc. | Method and system for providing a user agent string database |
US11120004B2 (en) * | 2014-11-25 | 2021-09-14 | Verizon Media Inc. | Method and system for analyzing a user agent string |
CN110471888A (zh) * | 2018-05-09 | 2019-11-19 | 株式会社日立制作所 | 一种自动收集数据的方法、装置、介质、设备及系统 |
CN110674249B (zh) * | 2019-09-29 | 2020-10-20 | 北京幻想纵横网络技术有限公司 | 一种信息处理方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08241332A (ja) * | 1995-03-02 | 1996-09-17 | Fuji Xerox Co Ltd | 全文登録語検索装置および方法 |
JPH08314948A (ja) * | 1995-05-23 | 1996-11-29 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JP2002269139A (ja) * | 2001-03-08 | 2002-09-20 | Ricoh Co Ltd | 文書検索方法 |
JP2011107986A (ja) * | 2009-11-17 | 2011-06-02 | Casio Computer Co Ltd | 辞書機能を備えた電子機器およびプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3160201B2 (ja) * | 1996-03-25 | 2001-04-25 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 情報検索方法、情報検索装置 |
JPH1049549A (ja) | 1996-05-29 | 1998-02-20 | Matsushita Electric Ind Co Ltd | 文書検索装置 |
US6772150B1 (en) * | 1999-12-10 | 2004-08-03 | Amazon.Com, Inc. | Search query refinement using related search phrases |
JP2003006216A (ja) * | 2001-06-26 | 2003-01-10 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム |
US7496559B2 (en) * | 2002-09-03 | 2009-02-24 | X1 Technologies, Inc. | Apparatus and methods for locating data |
CN1300718C (zh) * | 2002-10-31 | 2007-02-14 | 卡西欧计算机株式会社 | 信息显示装置和信息显示处理程序 |
JP2005043977A (ja) * | 2003-07-23 | 2005-02-17 | Hitachi Ltd | 文書間の類似度算出方法および装置 |
US7836044B2 (en) * | 2004-06-22 | 2010-11-16 | Google Inc. | Anticipated query generation and processing in a search engine |
US7487145B1 (en) * | 2004-06-22 | 2009-02-03 | Google Inc. | Method and system for autocompletion using ranked results |
US7516125B2 (en) * | 2005-08-01 | 2009-04-07 | Business Objects Americas | Processor for fast contextual searching |
JP2007272872A (ja) * | 2006-03-08 | 2007-10-18 | Ricoh Co Ltd | 情報検索方法、情報検索装置、情報検索システム、及び情報検索プログラム |
JP4861078B2 (ja) * | 2006-06-30 | 2012-01-25 | 富士通株式会社 | 索引作成プログラム、索引作成装置および索引作成方法 |
US8504553B2 (en) * | 2007-04-19 | 2013-08-06 | Barnesandnoble.Com Llc | Unstructured and semistructured document processing and searching |
CN102073639A (zh) * | 2009-11-20 | 2011-05-25 | 英业达股份有限公司 | 使用者输入与查询的辅助系统及其方法 |
CN102156724A (zh) * | 2011-03-31 | 2011-08-17 | 北京百度网讯科技有限公司 | 一种用于对查询片段进行后缀匹配的方法与设备 |
-
2012
- 2012-02-07 JP JP2012024491A patent/JP5910134B2/ja active Active
-
2013
- 2013-01-04 US US13/734,174 patent/US8996571B2/en active Active
- 2013-02-07 CN CN201310049022.2A patent/CN103257995B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08241332A (ja) * | 1995-03-02 | 1996-09-17 | Fuji Xerox Co Ltd | 全文登録語検索装置および方法 |
JPH08314948A (ja) * | 1995-05-23 | 1996-11-29 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JP2002269139A (ja) * | 2001-03-08 | 2002-09-20 | Ricoh Co Ltd | 文書検索方法 |
JP2011107986A (ja) * | 2009-11-17 | 2011-06-02 | Casio Computer Co Ltd | 辞書機能を備えた電子機器およびプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016177395A (ja) * | 2015-03-19 | 2016-10-06 | アイシン・エィ・ダブリュ株式会社 | 文字入力システム、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5910134B2 (ja) | 2016-04-27 |
CN103257995A (zh) | 2013-08-21 |
CN103257995B (zh) | 2016-08-03 |
US8996571B2 (en) | 2015-03-31 |
US20130204898A1 (en) | 2013-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5910134B2 (ja) | テキスト検索装置及びプログラム | |
US7752032B2 (en) | Apparatus and method for translating Japanese into Chinese using a thesaurus and similarity measurements, and computer program therefor | |
JP5900367B2 (ja) | 検索装置、検索方法及びプログラム | |
JP5737079B2 (ja) | テキスト検索装置、テキスト検索プログラム、及びテキスト検索方法 | |
JP2006072744A (ja) | 文書処理装置、その制御方法、プログラム、及び記憶媒体 | |
CN114297143A (zh) | 一种搜索文件的方法、显示文件的方法、装置及移动终端 | |
JP5204203B2 (ja) | 用例翻訳システム、用例翻訳方法及び用例翻訳プログラム | |
JP6447549B2 (ja) | テキスト検索装置、テキスト検索方法及びプログラム | |
JPH0844771A (ja) | 情報検索装置 | |
JP5733285B2 (ja) | 検索装置、検索方法及びプログラム | |
JP4813312B2 (ja) | 電子文書検索方法、電子文書検索装置及びプログラム | |
JP4301879B2 (ja) | 抄録作成支援システム及び特許文献検索システム | |
JP2009104475A (ja) | 類似文書検索装置、類似文書検索方法およびプログラム | |
JP5326781B2 (ja) | 抽出規則作成システム、抽出規則作成方法及び抽出規則作成プログラム | |
JP6668855B2 (ja) | 検索装置、検索方法及びプログラム | |
JP2003108582A (ja) | 類義語抽出方法および文書検索装置 | |
JP2004152041A (ja) | 重要語句抽出装置、プログラムおよび記録媒体 | |
JP5292873B2 (ja) | 文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体 | |
JPH09231234A (ja) | 文書検索装置 | |
CN112528635A (zh) | 检索装置、检索方法、及记录介质 | |
JP2005234635A (ja) | 文書要約装置および方法 | |
JP2006146578A (ja) | 検索装置、検索方法、及びプログラム | |
JP2003006229A (ja) | 文書検索システム、文書検索方法及びその方法を実行させるためのプログラム | |
JP2013058230A (ja) | 文書検索方法、文書検索装置、文書検索プログラムを記録した記録媒体 | |
JPH10307849A (ja) | 検索用のキーワードの決定方法及び装置、文書検索装置、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5910134 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |