JP2009175826A - テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体 - Google Patents
テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2009175826A JP2009175826A JP2008011125A JP2008011125A JP2009175826A JP 2009175826 A JP2009175826 A JP 2009175826A JP 2008011125 A JP2008011125 A JP 2008011125A JP 2008011125 A JP2008011125 A JP 2008011125A JP 2009175826 A JP2009175826 A JP 2009175826A
- Authority
- JP
- Japan
- Prior art keywords
- document
- word
- search
- text
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】テキスト検索装置1は、検索処理装置20を有し、検索処理装置20は、複数の単語等で指定された検索条件101を入力する検索条件入力手段と、入力された単語群102を単語辞書に基づいて抽出する単語抽出手段と、予め算出されたdf値に基づいて、抽出された各単語を、df値が低い単語群と高い単語群とに分類する単語群分類手段と、df値が低い単語群については単語毎に構築されたインパクト値順の転置ファイル71,74を利用すると共に、df値が高い単語群については単語毎に構築された文書ID順の転置ファイル73を利用して出力候補となる候補文書を探索する候補文書探索手段と、検索条件を満たした時点で候補文書d16,…を確定して出力する候補文書出力手段とを備える。
【選択図】図2
Description
[テキスト検索装置の構成]
図1は、本発明の第1実施形態に係るテキスト検索装置を模式的に示す構成図である。
テキスト検索装置1は、文書IDを有する各テキスト文書においてインパクト値を用いた単語毎に構築されたインパクト値順の転置ファイルと、各テキスト文書に含まれる単語毎に構築された文書ID順の転置ファイルとを含む複数の転置ファイルを文書検索用のインデックスとして用いて、検索対象としてテキスト文書を検索するものである。ここで、インパクト値は、各テキスト文書において各単語毎に予め算出された単語出現頻度(tf値)と、当該テキスト文書に含まれる単語の総数と、に基づいて得られる重みの数値を示す。
文書記憶装置40は、検索対象となる複数の検索対象文書(テキスト文書、テキスト情報)を蓄積するものであり、例えば、一般的なハードディスク等から構成される。検索対象文書には、文書ID(識別情報)が付与されている。
単語辞書記憶装置50は、単語辞書を蓄積するものであり、例えば、一般的なハードディスク等から構成される。なお、インデックス記憶装置30、文書記憶装置40、単語辞書記憶装置50は、1以上の外部記憶装置で構成することもできる。
図2は、本発明の第1実施形態に係るテキスト検索装置の概要を模式的に示す説明図である。なお、図2では、テキスト検索装置1の検索処理の概要を説明するために、図1に示したインデックス構築装置10および文書記憶装置40を省略して表示している。
図4は、図1に示すインデックス構築装置の一例を模式的に示すブロック図である。
インデックス構築装置10は、インパクト値順の転置ファイルと、文書ID順の転置ファイルとを構築するものであり、文書読込手段11と、文書特徴量算出手段12と、出現頻度判別手段13と、第1転置ファイル構築手段14と、第2転置ファイル構築手段15とを備えている。
文書特徴量算出手段12は、単語辞書記憶装置50に蓄積された単語辞書に基づいて、文書読込手段11で読み込んだ各テキスト文書から単語を抽出して当該テキスト文書に含まれる単語の特徴量として単語の総数および各単語の単語出現頻度(tf値:Term Frequency)を算出すると共に、単語毎に検索対象とする全テキスト文書を通じた文書出現頻度(df値:Document Frequency)を算出するものである。なお、df値は、その単語を含む文書数のことを指す。算出されたdf値(文書出現頻度)は、例えば単語辞書記憶装置50の所定領域に格納される。
図4に示したインデックス構築装置10の動作について図5を参照(適宜図4参照)して説明する。図5は、図4に示すインデックス構築装置の動作を示すフローチャートである。インデックス構築装置10は、文書読込手段11によって、検索対象とするテキスト文書群を読み込み(ステップS1)、文書特徴量算出手段12によって、各テキスト文書から単語を抽出して各文書に含まれる単語の総数、tf値およびdf値を算出する(ステップS2)。
図6は、図1に示す検索処理装置の一例を模式的に示すブロック図である。検索処理装置20は、図6に示すように、検索条件入力手段21と、単語抽出手段22と、単語群分類手段23と、候補文書探索手段24と、候補文書出力手段25とを備えている。
単語群分類手段23は、予め算出された文書出現頻度に基づいて、単語抽出手段22で抽出された各単語を、文書出現頻度が所定のしきい値よりも低い単語群と、そうではない単語群とに分類するものである。本実施形態では、インデックス構築の際に得られて例えば単語辞書記憶装置50の所定領域に格納されているdf値(文書出現頻度)に基づいて、単語群分類手段23は、抽出した単語群をdf値(文書出現頻度)の高い単語群と低い単語群とに分類する。
図6に示した検索処理装置20の動作について図7を参照(適宜図6参照)して説明する。図7は、図6に示す検索処理装置の動作を示すフローチャートである。まず、検索処理装置20は、検索条件入力手段21によって、検索式と文書件数とを指定された検索条件として入力する(ステップS11:検索条件入力ステップ)。そして、検索処理装置20は、単語抽出手段22によって、検索式を解析して含まれる単語群を抽出する(ステップS12:単語抽出ステップ)。そして、検索処理装置20は、単語群分類手段23によって、抽出した単語群を、df値(出現頻度)の高い単語群と、低い単語群とに分類する(ステップS13:単語群分類ステップ)。そして、検索処理装置20は、候補文書探索手段24によって、候補文書探索処理を実行する(ステップS14:候補文書探索ステップ)。そして、検索処理装置20は、候補文書出力手段25によって、入力された検索条件を満たした時点で候補文書を確定して検索結果として出力する(ステップS15:候補文書出力ステップ)。
次に、前記したステップS14の候補文書探索処理について図8を参照(適宜図6参照)して説明する。図8は、図7に示す候補文書探索処理の詳細を示すフローチャートである。まず、候補文書探索手段24は、第1探索手段241によって、df値の低い単語群についてインパクト値順の転置ファイル31を読み込み、単語依存文書スコアを算出し、算出したスコアに基づいて候補文書を探索する(ステップS21)。そして、候補文書探索手段24は、件数判別手段242によって、候補文書の件数が、指定された文書件数を超えたか否かを判別する(ステップS23)。候補文書の件数が、指定された文書件数を超えた場合(ステップS23:Yes)、候補文書探索手段24は、第2探索手段243によって、df値の高い単語群について文書ID順の転置ファイル32を読み込み(ステップS25)、ステップS21で探索された候補文書の文書IDに一致する候補文書を探索する(ステップS27)。ステップS27において、第2探索手段243は、候補文書を探索する際に、文書ID順の転置ファイルを適宜スキップしつつスキャンすると共に、文書IDを突合せつつ候補文書毎に文書毎のスコアを計算する。
また、前記したステップS23において、候補文書の件数が、検索条件で指定された文書件数を超えていない場合(ステップS23:No)、候補文書探索手段24は、ステップS21に戻り、インパクト値順の転置ファイルをさらに読み進めて他の候補文書を探索する。これにより、スコアの高い候補文書として、検索対象とする文書群の中で偏ることなくより幅広い多くの文書の中から選択された適切な候補文書を出力することが可能となる。
[テキスト検索装置の検索処理の概要]
図9は、本発明の第2実施形態に係るテキスト検索装置の概要を模式的に示す説明図である。テキスト検索装置1Aは、インデックス構築装置10Aと、検索処理装置20Aと、インデックス記憶装置30と、文書記憶装置40(図1参照)と、単語辞書記憶装置50とを備えている。なお、図9では、テキスト検索装置1Aの検索処理の概要を説明するために、文書記憶装置40を省略して表示している。また、図2と同様の構成については、同じ符号を付して説明を省略する。
図10は、図9に示すインデックス構築装置の一例を模式的に示すブロック図である。図10に示すインデックス構築装置10Aは、独自スコア算出手段16と、文書独自スコア転置ファイル構築手段17とを備えている点を除いて、図4に示したインデックス構築装置10と同じ構成なので、同じ構成には同じ符号を付して説明を省略する。
文書独自スコア転置ファイル構築手段17は、独自スコア算出手段16で算出した文書独自のスコアに基づいて、文書独自スコア順の転置ファイル33を構築するものである。文書独自スコア転置ファイル構築手段17は、構築した文書独自スコア順の転置ファイル33をインデックス記憶装置30に格納する。
図10に示したインデックス構築装置10Aがインパクト値順の転置ファイル31および文書ID順の転置ファイル32を構築する動作は、第1実施形態のインデックス構築装置10と同じなので説明を省略し、異なる点について図11を参照(適宜図10参照)して説明する。図11は、図10に示すインデックス構築装置による文書独自スコア転置ファイルを構築する動作を示すフローチャートである。インデックス構築装置10Aは、独自スコア算出手段16によって、検索対象とするテキスト文書群を読み込み(ステップS31)、独自スコア算出手段16によって、テキスト文書毎に文書独自のスコアを算出する(ステップS32)。そして、インデックス構築装置10Aは、文書独自スコア転置ファイル構築手段17によって、文書独自スコア順の転置ファイル33を構築する(ステップS33)。なお、インデックス構築装置10Aが、文書独自スコア順の転置ファイル33を構築するタイミングは、インパクト値順の転置ファイル31および文書ID順の転置ファイル32を構築する前後いずれのタイミングでもよいし、これらのファイルと並行して構築してもよい。
図12は、図9に示す検索処理装置の一例を模式的に示すブロック図である。検索処理装置20Aは、第1探索手段241Aの構成が異なる点を除いて図6に示した検索処理装置20と同じ構成なので、同じ構成には同じ符号を付して説明を省略する。
第1探索手段241Aは、図12に示すように、第1処理手段251と、第2処理手段252とを備える。
図12に示した検索処理装置20Aは、全体の動作の中で候補文書探索処理(ステップS14、図7参照)のみが異なる点を除いて、第1実施形態の検索処理装置20と同じように動作するので、全体の動作の説明を省略し、候補文書探索処理について図13を参照(適宜図12参照)して説明する。図13は、図12に示す検索処理装置による候補文書探索処理の詳細を示すフローチャートである。
10(10A) インデックス構築装置(インデックス構築手段)
11 文書読込手段
12 文書特徴量算出手段
13 出現頻度判別手段
14 第1転置ファイル構築手段
15 第2転置ファイル構築手段
16 独自スコア算出手段
17 文書独自スコア転置ファイル構築手段
20(20A) 検索処理装置
21 検索条件入力手段
22 単語抽出手段
23 単語群分類手段
24 候補文書探索手段
241(241A) 第1探索手段
242 件数判別手段
243 第2探索手段
244 絞込制御手段
25 候補文書出力手段
251 第1処理手段
252 第2処理手段
30 インデックス記憶装置
40 文書記憶装置
50 単語辞書記憶装置
60 端末装置
M 入力装置
D 出力装置
Claims (9)
- 文書IDを有する各テキスト文書において単語毎に予め算出された単語出現頻度と、当該テキスト文書に含まれる単語の総数と、に基づいて得られる重みの数値を示すインパクト値を用いた単語毎に構築されたインパクト値順の転置ファイルと、前記各テキスト文書に含まれる単語毎に構築された文書ID順の転置ファイルとを含む複数の転置ファイルを文書検索用のインデックスとして用いて、前記テキスト文書を検索するテキスト検索装置であって、
複数の単語を含む検索式と文書件数とを指定された検索条件として入力する検索条件入力手段と、
前記入力された検索式に含まれる各単語を単語辞書に基づいて抽出する単語抽出手段と、
単語毎に検索対象とする全テキスト文書を通じて予め算出された文書出現頻度に基づいて、前記抽出された各単語を、前記文書出現頻度が所定のしきい値よりも低い単語群と、そうではない単語群とに分類する単語群分類手段と、
前記文書出現頻度が所定のしきい値よりも低い単語群については前記インパクト値順の転置ファイルを利用して出力候補となる候補文書を探索し、その後、前記文書出現頻度が前記所定のしきい値以上の単語群については前記文書ID順の転置ファイルを利用して出力候補となる候補文書を探索する候補文書探索手段と、
前記入力された検索条件を満たした時点で前記候補文書を確定して出力する候補文書出力手段とを備えることを特徴とするテキスト検索装置。 - 前記候補文書探索手段は、
前記文書出現頻度が前記所定のしきい値よりも低い単語群について前記インパクト値順の転置ファイルを読み込み、インパクト値の高い順に文書毎に前記検索式に依存する単語依存文書スコアを算出し、前記算出した単語依存文書スコアに基づいて前記候補文書を探索する第1探索手段と、
前記探索された候補文書の件数が、前記指定された文書件数よりも大きくなったか否かを判別する件数判別手段と、
前記探索された候補文書の件数が前記指定された文書件数よりも大きくなった場合に、前記文書出現頻度が前記所定のしきい値以上の単語群についての前記文書ID順の転置ファイルを読み込み、前記第1探索手段で探索された候補文書の文書IDに一致する候補文書を探索しつつ文書毎のスコアを算出する第2探索手段と、
前記第1探索手段と前記第2探索手段とを交互に用いて前記候補文書を絞り込み、前記候補文書の順位として前記指定された文書件数以内の順位を決定する絞込み制御手段とを備えることを特徴とする請求項1に記載のテキスト検索装置。 - 前記第1探索手段は、
前記文書出現頻度が前記所定のしきい値よりも低い単語群について前記インパクト値順の転置ファイルを読み込み、文書毎にインパクト値の高い順に前記検索式に依存する単語依存文書スコアを算出する第1処理手段と、
前記各テキスト文書毎に算出された文書独自のスコア順に予め構築された文書独自スコア順の転置ファイルから、前記単語依存文書スコアを算出した文書に対応する前記文書独自のスコアを読み込み、前記読み込んだ文書独自のスコアと、前記算出した単語依存文書スコアとの線形和を用いて前記候補文書を探索する第2処理手段とを備えることを特徴とする請求項2に記載のテキスト検索装置。 - 前記テキスト文書毎に文書独自のスコアを算出する独自スコア算出手段と、
前記算出した文書独自のスコアに基づいて、前記文書独自スコア順の転置ファイルを構築する文書独自スコア転置ファイル構築手段とをさらに備えることを特徴とする請求項3に記載のテキスト検索装置。 - 前記各テキスト文書に含まれる単語毎に構築された文書ID順の転置ファイルは、当該単語について前記検索対象とする全テキスト文書を通じて最大のインパクト値を保持したものであることを特徴とする請求項1ないし請求項4のいずれか一項に記載のテキスト検索装置。
- 前記インパクト値順の転置ファイルと、前記文書ID順の転置ファイルとを構築するインデックス構築手段をさらに備え、
前記インデックス構築手段は、
検索対象とするテキスト文書群を読み込む文書読込手段と、
単語辞書に基づいて前記読み込んだ各テキスト文書から単語を抽出して当該テキスト文書に含まれる単語の特徴量として単語の総数および各単語の単語出現頻度を算出すると共に、単語毎に検索対象とする全テキスト文書を通じた文書出現頻度を算出する文書特徴量算出手段と、
単語毎に前記文書出現頻度を前記検索対象とする全テキスト文書を通じて比較し、各単語の前記文書出現頻度が所定のしきい値よりも低いか否かを判別する出現頻度判別手段と、
単語の前記文書出現頻度が前記所定のしきい値よりも低い場合に、当該単語について前記インパクト値順の転置ファイルを前記文書検索用のインデックスとして構築する第1転置ファイル構築手段と、
単語の前記文書出現頻度が前記所定のしきい値以上である場合に、当該単語について前記検索対象とする全テキスト文書を通じて最大のインパクト値を算出し、前記算出した最大のインパクト値を含む文書ID順の転置ファイルを前記文書検索用のインデックスとして構築する第2転置ファイル構築手段とを備えることを特徴とする請求項1ないし請求項5のいずれか一項に記載のテキスト検索装置。 - 文書IDを有する各テキスト文書において単語毎に予め算出された単語出現頻度と、当該テキスト文書に含まれる単語の総数と、に基づいて得られる重みの数値を示すインパクト値を用いた単語毎に構築されたインパクト値順の転置ファイルと、前記各テキスト文書に含まれる単語毎に構築された文書ID順の転置ファイルとを含む複数の転置ファイルを文書検索用のインデックスとして用いて、検索対象として前記テキスト文書を検索するテキスト検索装置のテキスト検索方法であって、
前記テキスト検索装置は、検索条件入力手段と、単語抽出手段と、単語群分類手段と、候補文書探索手段と、候補文書出力手段とを備え、
前記検索条件入力手段によって、複数の単語を含む検索式と文書件数とを指定された検索条件として入力する検索条件入力ステップと、
前記単語抽出手段によって、前記入力された検索式に含まれる各単語を単語辞書に基づいて抽出する単語抽出ステップと、
前記単語群分類手段によって、単語毎に検索対象とする全テキスト文書を通じて予め算出された文書出現頻度に基づいて、前記抽出された各単語を、前記文書出現頻度が所定のしきい値よりも低い単語群と、そうではない単語群とに分類する単語群分類ステップと、
前記候補文書探索手段によって、前記文書出現頻度が所定のしきい値よりも低い単語群については前記インパクト値順の転置ファイルを利用して出力候補となる候補文書を探索し、その後、前記文書出現頻度が所定のしきい値以上の単語群については前記文書ID順の転置ファイルを利用して出力候補となる候補文書を探索する候補文書探索ステップと、
前記候補文書出力手段によって、前記入力された検索条件を満たした時点で前記候補文書を確定して出力する候補文書出力ステップとを含んで実行することを特徴とするテキスト検索方法。 - 請求項1ないし請求項6のいずれか一項に記載のテキスト検索装置の機能をコンピュータで実現するためのテキスト検索プログラム。
- 請求項8に記載のテキスト検索プログラムが記録されたことを特徴とするコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008011125A JP4691117B2 (ja) | 2008-01-22 | 2008-01-22 | テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008011125A JP4691117B2 (ja) | 2008-01-22 | 2008-01-22 | テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009175826A true JP2009175826A (ja) | 2009-08-06 |
JP4691117B2 JP4691117B2 (ja) | 2011-06-01 |
Family
ID=41030879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008011125A Active JP4691117B2 (ja) | 2008-01-22 | 2008-01-22 | テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4691117B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013196545A (ja) * | 2012-03-22 | 2013-09-30 | Nec Corp | データ移行管理装置およびデータ移行管理方法、並びにコンピュータ・プログラム |
KR20200014979A (ko) * | 2018-08-02 | 2020-02-12 | 주식회사 누리랩 | 역 색인 구성 방법, 역 색인을 이용한 유사 데이터 검색 방법 및 장치 |
JP2020123134A (ja) * | 2019-01-30 | 2020-08-13 | 富士通株式会社 | 抽出方法,情報処理装置および抽出プログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8589164B1 (en) * | 2012-10-18 | 2013-11-19 | Google Inc. | Methods and systems for speech recognition processing using search query information |
-
2008
- 2008-01-22 JP JP2008011125A patent/JP4691117B2/ja active Active
Non-Patent Citations (6)
Title |
---|
CSNG200300474001, 赤峯 享, "高速全文検索のためのフレキシブル文字列インバージョン法", アドバンスト・データベース・シンポジウム’96, 19961202, 第96巻, 第35頁乃至第42頁, JP, 社団法人情報処理学会 * |
JPN6010061339, 赤峯 享, "高速全文検索のためのフレキシブル文字列インバージョン法", アドバンスト・データベース・シンポジウム’96, 19961202, 第96巻, 第35頁乃至第42頁, JP, 社団法人情報処理学会 * |
JPN7010003421, Justin Zobel, "Inverted files for text search engines", ACM Computing Surveys, 200607, Volume 38 , Issue 2 , Article 6, US, ACM * |
JPN7010003422, Vo Ngoc Anh, "Impact transformation: effective and efficient web retrieval", Proceedings of the 25th annual international ACM SIGIR conference on Research and development in inf, 2002, 3−10, US, ACM * |
JPN7010003423, Vo Ngoc Anh, "Vector−space ranking with effective early termination", Proceedings of the 24th annual international ACM SIGIR conference on Research and development in inf, 2001, 35−42, US, ACM * |
JPN7010003424, Vo Ngoc Anh, "Pruned query evaluation using pre−computed impacts", Proceedings of the 29th annual international ACM SIGIR conference on Research and development in inf, 2006, 372−379, US, ACM * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013196545A (ja) * | 2012-03-22 | 2013-09-30 | Nec Corp | データ移行管理装置およびデータ移行管理方法、並びにコンピュータ・プログラム |
KR20200014979A (ko) * | 2018-08-02 | 2020-02-12 | 주식회사 누리랩 | 역 색인 구성 방법, 역 색인을 이용한 유사 데이터 검색 방법 및 장치 |
KR102081867B1 (ko) * | 2018-08-02 | 2020-02-26 | 주식회사 누리랩 | 역 색인 구성 방법, 역 색인을 이용한 유사 데이터 검색 방법 및 장치 |
JP2020123134A (ja) * | 2019-01-30 | 2020-08-13 | 富士通株式会社 | 抽出方法,情報処理装置および抽出プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4691117B2 (ja) | 2011-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI536181B (zh) | 在多語文本中的語言識別 | |
EP2798540B1 (en) | Extracting search-focused key n-grams and/or phrases for relevance rankings in searches | |
US8666994B2 (en) | Document analysis and association system and method | |
US8868469B2 (en) | System and method for phrase identification | |
KR101479040B1 (ko) | 태그들을 문서에 자동으로 추가하는 방법, 장치 및 컴퓨터 저장 매체 | |
US20070203885A1 (en) | Document Classification Method, and Computer Readable Record Medium Having Program for Executing Document Classification Method By Computer | |
US8655648B2 (en) | Identifying topically-related phrases in a browsing sequence | |
Manjari et al. | Extractive Text Summarization from Web pages using Selenium and TF-IDF algorithm | |
JP5710581B2 (ja) | 質問応答装置、方法、及びプログラム | |
JP5143057B2 (ja) | 重要キーワード抽出装置及び方法及びプログラム | |
US8812504B2 (en) | Keyword presentation apparatus and method | |
US20150205860A1 (en) | Information retrieval device, information retrieval method, and information retrieval program | |
JP5538185B2 (ja) | テキストデータ要約装置、テキストデータ要約方法及びテキストデータ要約プログラム | |
Jain et al. | Context sensitive text summarization using k means clustering algorithm | |
JP5718405B2 (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
JP4691117B2 (ja) | テキスト検索装置、テキスト検索方法、テキスト検索プログラムおよびそのプログラムを記録した記録媒体 | |
CN115794995A (zh) | 目标答案获取方法及相关装置、电子设备和存储介质 | |
JP2005301856A (ja) | 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置 | |
KR101868936B1 (ko) | 키워드 추출 및 정련 시스템과 그 방법 | |
Fan et al. | Article clipper: a system for web article extraction | |
US20140358522A1 (en) | Information search apparatus and information search method | |
JP4143085B2 (ja) | 同義語獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP5179564B2 (ja) | クエリセグメント位置決定装置 | |
JP4953440B2 (ja) | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 | |
KR101113787B1 (ko) | 텍스트 색인 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101008 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101026 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110215 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4691117 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140225 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |