JP5345987B2 - 文書検索装置、文書検索方法および文書検索プログラム - Google Patents

文書検索装置、文書検索方法および文書検索プログラム Download PDF

Info

Publication number
JP5345987B2
JP5345987B2 JP2010182769A JP2010182769A JP5345987B2 JP 5345987 B2 JP5345987 B2 JP 5345987B2 JP 2010182769 A JP2010182769 A JP 2010182769A JP 2010182769 A JP2010182769 A JP 2010182769A JP 5345987 B2 JP5345987 B2 JP 5345987B2
Authority
JP
Japan
Prior art keywords
feature word
situation
document
search
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010182769A
Other languages
English (en)
Other versions
JP2012043115A (ja
Inventor
伸章 廣嶋
宜仁 安田
由美子 松浦
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010182769A priority Critical patent/JP5345987B2/ja
Publication of JP2012043115A publication Critical patent/JP2012043115A/ja
Application granted granted Critical
Publication of JP5345987B2 publication Critical patent/JP5345987B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、文書集合の中から指定された場所または日時を含む状況に応じた文書を検索する技術に関する。
現在、キーワードが入力されるとそのキーワードに関する文書を検索するシステムが数多く存在する。特に、近年では、指定された場所や日時などの状況に応じたキーワードに関する文書の検索を行う方法が提案されてきている。
特許文献1では、場所に応じたキーワードに関する文書の検索を行っている。特許文献2では、日時に応じたキーワードに関する文書の検索を行っている。
特開2000−163436号公報 特開2005−85109号公報
しかしながら、特許文献1および特許文献2の方法では、場所や日時などの状況に応じた文書を検索したい場合に、状況に加えて適切なキーワードを入力として指定しなければならないという問題があった。
ある状況において話題になっている事物を知りたいような場合には、何が話題になっているかをユーザは把握していないため、所望の検索結果を得るために適切なキーワードを入力することは困難であると考えられる。
また、状況に関連する文書を検索し、検索された文書から特徴語を抽出して選択し、特徴語と状況に関連する文書を提示することにより、状況に応じて話題になっている事物に関する文書を検索することができるが、検索された文書から特徴語を抽出する処理に時間がかかるため、検索を行うのに時間がかかるという問題があった。
本発明は上記の問題点に鑑みてなされたものであって、あらかじめ様々な状況から特徴語を取得するための特徴語インデクスを作成し、特徴語インデクスを参照して状況に関連する特徴語を取得して選択し、特徴語と状況に関連する文書を検索して提示することによって、状況に応じて話題になっている事物に関する文書を高速に検索することを可能とした文書検索装置、方法、プログラムを提供することを目的とする。
上記の課題は、文書集合の中から、指定された検索のための分類軸として考慮した状況に応じた文書を検索する文書検索装置であって、文書中に含まれる前記状況を解析する状況解析手段と、前記状況解析手段によって解析された状況を含む検索インデクスを作成する検索インデクス作成手段と、前記状況解析手段によって解析された各状況における文書から、状況との距離に基づいて特徴語を抽出する特徴語抽出手段と、文書検索時に入力された状況から、前記特徴語抽出手段によって抽出された特徴語を検索するための特徴語インデクスを作成する特徴語インデクス作成手段と、指定された検索のための分類軸として考慮した状況を入力する状況入力手段と、前記特徴語インデクスを参照して、前記状況入力手段によって入力された状況に関する特徴語を選択する特徴語選択手段と、前記検索インデクスを参照して、前記状況入力手段によって入力された状況と前記特徴語選択手段によって選択された特徴語に関連する文書を検索する検索結果取得手段と、を備えることにより解決できる。
請求項1〜7に記載の発明によれば、入力された状況に関連する文書に含まれる特徴語を選択し、選択された特徴語を含む状況関連文書を提示するため、状況に応じて話題になっている事物に関する文書を高速に検索することができる。
本発明の実施例における文書検索装置100の構成図。 本発明の実施例における文書検索装置100の前処理の動作を示すフローチャート。 本発明の実施例における文書検索装置100の文書検索処理の動作を示すフローチャート。 本発明の実施例における文書の例を示す説明図。 本発明の実施例における場所の解析結果の例を示す説明図。 本発明の実施例における日時の解析結果の例を示す説明図。 本発明の実施例における転置インデクスの例を示す説明図。 本発明の実施例における状況インデクスの例を示す説明図。 本発明の実施例における「2010年5月5日」を含む文書とそれらの文書から特徴語候補を抽出した例を示す説明図。 本発明の実施例における「2010年5月5日」に関する文書から抽出された特徴語候補にスコアを付与した例を示す説明図。 本発明の実施例における日時に関する特徴語インデクスの例を示す説明図。 本発明の実施例における場所に関する特徴語インデクスの例を示す説明図。 本発明の実施例における取得された特徴語の例を示す説明図。 本発明の実施例における特徴語提示結果の例を示す説明図。 本発明の実施例における検索結果の例を示す説明図。
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。
図1は、本発明の実施例である文書検索装置100の構成を示す図である。
図1に示す文書検索装置100は、状況解析手段としての状況解析部1と、検索インデクス作成手段としての検索インデクス作成部2と、特徴語抽出手段としての特徴語抽出部3と、特徴語インデクス作成手段としての特徴語インデクス作成部4と、状況入力手段としての状況入力部5と、特徴語提示手段としての特徴語提示部6と、特徴語入力手段としての特徴語入力部7と、検索結果取得手段としての検索結果取得部8と、検索インデクスデータベース9と、特徴語インデクスデータベース10を有する。
前記文書検索装置100は、例えばコンピュータにより構成され、通常のコンピュータのハードウェアリソース、例えばROM、RAM、CPU、キーボードなどの入力装置、表示ディスプレイ、プリンターなどの出力装置、通信インタフェース、ハードディスク、記録媒体駆動装置等(図示省略)を備えている。
このハードウェアリソースとソフトウェアリソース(OS、アプリケーションなど)との協働の結果、前記文書検索装置100は、図1に示すように、状況解析部1、検索インデクス作成部2、特徴語抽出部3、特徴語インデクス作成部4、状況入力部5、特徴語提示部6、特徴語入力部7、検索結果取得部8、検索インデクスデータベース9、特徴語インデクスデータベース10を実装する。
前記検索インデクスデータベース9と特徴語インデクスデータベース10は、ハードディスクあるいはRAMなどの保存手段・記憶手段に構築されているものとする。
状況解析部1は、後述する前処理段階において文書検索装置100に入力された文書中に含まれる、検索のための分類軸として考慮した場所または日時などの状況を解析する。
検索インデクス作成部2は、状況解析部1によって解析された状況を含む検索インデクスを作成し、検索インデクスデータベース9に格納する。
特徴語抽出部3は、状況解析部1によって解析された各状況における文書から、状況との距離に基づいて特徴語を抽出する。
特徴語インデクス作成部4は、後述する文書検索段階において入力された状況から、前記抽出された特徴語を検索するための特徴語インデクスを作成し、特徴語インデクスデータベース10に格納する。
状況入力部5は、ユーザからの状況を文書検索段階において入力する。
特徴語提示部6は、特徴語インデクスデータベース10を参照して前記入力された状況に関する特徴語を取得して提示する。
特徴語入力部7は、前記特徴語提示部6により取得された特徴語の中から、例えばユーザが選択した1つまたは複数の特徴語を入力する。
検索結果取得部8は、検索インデクスデータベース9を参照して前記状況入力部5から入力された状況と前記特徴語入力部7から入力された特徴語に関連する文書を検索する。
次に、文書検索装置100の動作について説明する。
本発明は、文書の検索を行うための検索インデクスおよび特徴語インデクスを作成するための前処理段階と、実際に文書を検索する段階の2つに分かれている。
図2は、文書検索装置100の前処理の動作を示すフローチャートである。
まず、状況解析部1が、入力された文書中に含まれる状況を解析する(ステップS101)。
検索インデクス作成部2が、状況を含む検索インデクスを作成し、検索インデクスデータベース9に格納する(ステップS102)。
特徴語抽出部3が、各状況における文書から、状況との距離に基づいて特徴語を抽出する(ステップS103)。
特徴語インデクス作成部4が、状況から特徴語を検索するための特徴語インデクスを作成し、特徴語インデクスデータベース10に格納する(ステップS104)。
図3は、文書検索装置100の文書検索処理の動作を示すフローチャートである。
まず、文書検索を行なうユーザが状況入力部5によって状況を入力する(ステップS201)。
特徴語提示部6が、特徴語インデクスデータベース10を参照して入力された状況に関する特徴語を取得し、例えば表示ディスプレイに表示してユーザに提示する(ステップS202)。
特徴語入力部7が、前記取得し提示された特徴語の中から、ユーザが1つまたは複数選択した特徴語を入力する(ステップS203)。
検索結果取得部8が、検索インデクスデータベース9を参照し、状況入力部5によって入力された状況と前記ユーザが選択し特徴語入力部7によって入力された特徴語に関連する文書を検索する(ステップS204)。
次に、文書検索装置100の動作をより具体的に説明する。この例では、状況として場所および日時の2つを考慮することとする。考慮する状況はこれに限るものではなく、状況を表すものであれば天気などの様々な状況を考慮したりしてもかまわない。
図2に示したフローチャートにしたがって前処理の動作を具体的に説明する。
ステップS101では、状況解析部1により、入力された文書中に含まれる状況を解析する。文書の例を図4に示す。ここでは、文書中に含まれる場所の解析方法として、文書を形態素解析して単語に分割し、固有表現抽出を行って地名を抽出し、地名に対して位置情報が対応付けられた位置情報辞書を参照して位置情報を付与することとする。場所の解析方法はこれに限るものではなく、文書から地名を表す文字列を探索したり、地名に対して位置情報を付与せずに地名の表記を場所としたりしてもかまわない。場所の解析結果の例を図5に示す。
また、ここでは、文書中に含まれる日時の解析方法として、文書を形態素解析して単語に分割し、固有表現抽出を行って日時表現を抽出し、その日時表現のパターンから日時を取得することとする。日時の解析方法はこれに限るものではなく、文書中に「…月…日」のような文字列のパターンに一致した場合に該当部分を日時表現としたり、「今日」などの単語を文書の作成日時をもとに実際の日時に変換したりしてもかまわない。日時の解析結果の例を図6に示す。
ステップS102では、検索インデクス作成部2により、状況を含む検索インデクスを作成して検索インデクスデータベース9に格納する。ここでは、状況を含む検索インデクスとして、キーワード検索を行うための転置インデクスおよび状況に関する検索を行うための状況インデクスを作成する。
転置インデクスの作成では、文書検索において一般的に用いられている転置インデクス作成手法を用いる。転置インデクスの例を図7に示す。この図において、単語「ABC」に対する(1,1)は、文書番号1の文書本文の1番目の単語が「ABC」であったことを意味する。
状況インデクスの作成では、文書に対して状況解析部1で解析した状況を付与する。状況インデクスの例を図8に示す。検索インデクスの作成方法はこれに限るものではなく、転置インデクスの代わりにNグラムに基づくインデクスを作成したりしてもかまわない。
ステップS103では、特徴語抽出部3により、各状況における文書から状況との距離に基づいて特徴語を抽出する。ここでは、場所と日時のそれぞれの状況について、状況を複数の単位に分割し、それぞれの状況に関する文書を取得してその文書から特徴語を抽出することとする。
場所については対象とする地域を1km×1kmのメッシュに分割し、それぞれのメッシュに含まれる場所に関する文書から特徴語を抽出することとする。日時については対象とする日時を1日ごとに分割し、それぞれの日に含まれる日時に関する文書から特徴語を抽出することとする。各状況の決め方はこれに限るものではなく、メッシュの大きさを変更したり、日時をさらに午前と午後に分割したりしてもかまわない。
また、ここでは、各状況における文書全体から人名・地名・組織名を特徴語候補として抽出し、各状況における文書に含まれる状況と特徴語候補との距離に基づいて特徴語候補にスコアを付与し、特徴語候補のスコアをもとに特徴語を抽出することとする。
特徴語の抽出の仕方は、文書に含まれる状況との距離に基づいていればこれに限るものではなく、各状況における一部の文書を利用したり、人名・地名・組織名以外の固有表現を特徴語候補として抽出したり、固有表現以外の一般的な名詞を特徴語候補として抽出したり、名詞以外の品詞を持つものを特徴語候補として抽出したり、各状況における頻出する文字列を特徴語候補として抽出したり、各状況における文書に含まれる特徴語候補の出現頻度を考慮したり、各状況における文書に含まれる特徴語候補のそれ以外の状況での出現頻度を考慮したり、複数の文書のタイトルに共通する文字列や単語列を特徴語として抽出したり、スコアによらずすべての特徴語候補を特徴語としたりしてもかまわない。
日時に関する例として、「2010年5月5日」を含む文書とそれらの文書から特徴語候補を抽出した例を図9に示す。ここでは、各状況における文書に含まれる状況と特徴語候補との距離は、状況を表す文字列と特徴語候補の文字列との間に挟まれた文字列の文字数に1を加えた値の逆数とし、特徴語が出現する文書における距離の総和を特徴語候補のスコアとする。距離の求め方はこれに限るものではなく、距離の最大値をスコアとしたりしてもかまわない。
図9の各特徴語候補に対してスコアを求めた結果を図10に示す。この特徴語候補のスコアをもとに、特徴語を抽出する。ここでは、特徴語のスコアが高い上位3個の特徴語候補を特徴語として抽出することとする。特徴語の抽出の仕方はこれに限るものではなく、抽出する特徴語の個数を変更したり、上位X%の特徴語を抽出したりしてもかまわない。図10より、特徴語として「ABC」「XYZ」「DEF」が抽出される。
ステップS104では、特徴語インデクス作成部4により、状況から特徴語を検索するための特徴語インデクスを作成し特徴語インデクスデータベース10に格納する。日時に関する特徴語インデクスを作成した結果を図11に示す。場所に関しても同様にして特徴語インデクスを作成する。場所に関する特徴語インデクスを作成した結果を図12に示す。
次に、図3に示したフローチャートにしたがって文書検索処理の動作を具体的に説明する。この例では、文書検索を行うユーザが「35°37′N 139°53′E」で表される位置に存在しており、文書検索を行う日時が「2010/5/5(水)」であるものとする。
ステップS201では、状況入力部5により、状況を入力する。ここでは、ユーザが現在置かれている状況である場所「35°37′N 139°53′E」および日時「2010/5/5(水)」を入力することとする。状況の入力の仕方はこれに限るものではなく、現在置かれている場所以外を入力としたり、現在置かれている日時以外を入力としたり、位置情報ではなく地名を場所として入力したり、時・分・秒までの詳細な日時を指定したりしてもかまわない。
ステップS202では、特徴語提示部6により、特徴語インデクスデータベース10を参照して入力された状況に関する特徴語を取得して提示する。ここでは、入力された日時と一致する日時に対応する特徴語を検索し、入力された場所を含むメッシュに対応する特徴語を検索することとする。
特徴語の検索の仕方はこれに限るものではなく、入力された日時を含む日時の範囲に対応する特徴語を検索したり、入力された場所を含むメッシュを中心としたメッシュの範囲に対応する特徴語を検索したりしてもかまわない。入力された日時は図9における「2010年5月5日」という日時に一致するため、それに対応する特徴語が検索される。同様に、入力された場所は図12における「35°30′N 139°45′E〜35°60′N 139°90′E」というメッシュに含まれるため、このメッシュに対応する特徴語が検索される。検索された特徴語をもとに、入力された状況に関する特徴語を取得する。
ここでは、場所および日時に関して検索された特徴語のスコアの積を計算し、その値が0.1以上のものを特徴語として取得することとする。特徴語の取得の仕方はこれに限るものではなく、スコアの和を計算したり、スコアによらず検索されたすべての特徴語を取得したり、スコアの閾値を変更したり、スコアの高い上位X%の特徴語を取得したりしてもよい。特徴語を取得した結果の例を図13に示す。取得した特徴語を、例えば図示省略の表示ディスプレイに表示して提示する。ここでは、特徴語スコアの高い順に上位2件の特徴語を提示することとする。
特徴語の提示の仕方はこれに限るものではなく、上位N件の特徴語を提示したり、上位X%の特徴語を提示したり、特徴語スコアの値がY以上の特徴語を提示したり、人名などの種別ごとにそれぞれ1件ずつ特徴語を提示したり、特徴語とともに特徴語スコアを提示したり、特徴語スコアの値に応じてフォントの大きさを変化させて提示したりしてもかまわない。特徴語を提示した結果の例を図14に示す。
ステップS203では、特徴語入力部7によって、前記取得し提示された特徴語の中からユーザが1つまたは複数選択した特徴語を入力する。ここでは、特徴語として「XYZ」が選択されたこととする。特徴語の選択の仕方はこれに限るものではなく、複数の特徴語を選択できるようにしてもかまわない。
ステップS204では、検索結果取得部8により、検索インデクスデータベース9を参照して、入力された状況と選択された特徴語に関連する文書を検索する。ここでは、例えば図7の転置インデクスを参照して、従来の文書検索において一般的に用いられている方法を用いて特徴語を含む文書を検索し、検索された文書の中から、さらに例えば図8の状況インデクスを参照して、入力された日時と一致する日時を持ち、入力された場所との距離が一定以内である場所を持ち、選択された特徴語「XYZ」を文書のタイトルまたは本文中に含む文書を検索することとする。
文書の検索の仕方はこれに限るものではなく、入力された日時の一部と一致する日時を持つ文書を検索したり、入力された場所が地名を表す文字列だった場合にその文字列を本文中に含む文書を検索したりしてもかまわない。また、文書に対するスコアは、特徴語を含む文書を検索することによって得られる適合度であるとする。文書に対するスコアの算出方法はこれに限るものではなく、文書中の特徴語と日時との距離の近さを考慮したり、文書中の特徴語と場所との距離の近さを考慮したりしてもかまわない。検索された文書の例を図15に示す。
尚、今回の実施例では、特徴語提示部6により特徴語をユーザに提示し、前記提示した特徴語の1つまたは複数をユーザが選択し、特徴語入力部7により入力することとしたが、特徴語をユーザに提示することなく、特徴語提示部6で算出した特徴語スコアの値に応じて自動的に特徴語を選択するようにしてもかまわない。
このように、本実施例で説明した処理により、入力された状況に関連する文書に含まれる特徴語を選択し、選択された特徴語を含む状況関連文書を提示することで、状況に応じて話題になっている事物に関する文書を検索することができる。
なお、本実施例の文書検索装置100は、上述した一連の動作を実行させるプログラムをコンピュータにインストールすることにより実現することが可能である。また、当該プログラムを文書検索装置として利用されるコンピュータに接続されるハードディスク装置や、フレキシブルディスク、CD−ROMなどの可搬記憶媒体に格納しておき、コンピュータにインストールして実行させることも可能である。また、当該プログラムをネットワークのサーバに格納しておき、そこからダウンロードしてインストールする形態をとることも可能である。
なお、本発明は、上記の実施の形態及び実施例に限定されることなく、種々変更・応用が可能である。
本発明は、場所や日時などの状況を考慮した検索を行う検索システムの開発などに利用可能である。
1…状況解析部
2…検索インデクス作成部
3…特徴語抽出部
4…特徴語インデクス作成部
5…状況入力部
6…特徴語提示部
7…特徴語入力部
8…検索結果取得部
9…検索インデクスデータベース
10…特徴語インデクスデータベース
100…文書検索装置

Claims (7)

  1. 文書集合の中から、指定された検索のための分類軸として考慮した状況に応じた文書を検索する文書検索装置であって、
    文書中に含まれる前記状況を解析する状況解析手段と、
    前記状況解析手段によって解析された状況を含む検索インデクスを作成する検索インデクス作成手段と、
    前記状況解析手段によって解析された各状況における文書から、状況との距離に基づいて特徴語を抽出する特徴語抽出手段と、
    文書検索時に入力された状況から、前記特徴語抽出手段によって抽出された特徴語を検索するための特徴語インデクスを作成する特徴語インデクス作成手段と、
    指定された検索のための分類軸として考慮した状況を入力する状況入力手段と、
    前記特徴語インデクスを参照して、前記状況入力手段によって入力された状況に関する特徴語を選択する特徴語選択手段と、
    前記検索インデクスを参照して、前記状況入力手段によって入力された状況と前記特徴語選択手段によって選択された特徴語に関連する文書を検索する検索結果取得手段と、
    を有することを特徴とする文書検索装置。
  2. 前記特徴語抽出手段は、
    前記文書から特徴語候補を抽出し、文書に含まれる状況と前記特徴語候補との距離に基づいて特徴語候補にスコアを付与し、該特徴語候補のスコアをもとに特徴語を抽出する
    ことを特徴とする請求項1に記載の文書検索装置。
  3. 前記特徴語選択手段は、
    前記特徴語インデクスを参照して、前記入力された状況に関する特徴語を取得して提示する特徴語提示手段と、
    前記特徴語提示手段によって取得された特徴語の中から1つまたは複数の特徴語を入力する特徴語入力手段と、
    を含む請求項1または2に記載の文書検索装置。
  4. 文書集合の中から、指定された検索のための分類軸として考慮した状況に応じた文書を検索する文書検索方法であって、
    状況解析手段が、文書中に含まれる前記状況を解析する状況解析工程と、
    検索インデクス作成手段が、前記状況解析手段によって解析された状況を含む検索インデクスを作成する検索インデクス作成工程と、
    特徴語抽出手段が、前記状況解析手段によって解析された各状況における文書から、状況との距離に基づいて特徴語を抽出する特徴語抽出工程と、
    特徴語インデクス作成手段が、文書検索時に入力された状況から、前記特徴語抽出手段によって抽出された特徴語を検索するための特徴語インデクスを作成する特徴語インデクス作成工程と、
    状況入力手段が、指定された検索のための分類軸として考慮した状況を入力する状況入力工程と、
    特徴語選択手段が、前記特徴語インデクスを参照して、前記状況入力手段によって入力された状況に関する特徴語を選択する特徴語選択工程と、
    検索結果取得手段が、前記検索インデクスを参照して、前記状況入力手段によって入力された状況と前記特徴語選択手段によって選択された特徴語に関連する文書を検索する検索結果取得工程と、
    を有することを特徴とする文書検索方法。
  5. 前記特徴語抽出工程は、
    前記文書から特徴語候補を抽出し、文書に含まれる状況と前記特徴語候補との距離に基づいて特徴語候補にスコアを付与し、該特徴語候補のスコアをもとに特徴語を抽出する
    ことを特徴とする請求項4に記載の文書検索方法。
  6. 前記特徴語選択工程は、
    特徴語提示手段が、前記特徴語インデクスを参照して、前記入力された状況に関する特徴語を取得して提示する特徴語提示工程と、
    特徴語入力手段が、前記特徴語提示手段によって取得された特徴語の中から1つまたは複数の特徴語を入力する特徴語入力工程と、
    を含むことを特徴とする請求項4または5に記載の文書検索方法。
  7. 請求項4ないし6のいずれか1項に記載の文書検索方法における各工程をコンピュータに実行させる文書検索プログラム。
JP2010182769A 2010-08-18 2010-08-18 文書検索装置、文書検索方法および文書検索プログラム Active JP5345987B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010182769A JP5345987B2 (ja) 2010-08-18 2010-08-18 文書検索装置、文書検索方法および文書検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010182769A JP5345987B2 (ja) 2010-08-18 2010-08-18 文書検索装置、文書検索方法および文書検索プログラム

Publications (2)

Publication Number Publication Date
JP2012043115A JP2012043115A (ja) 2012-03-01
JP5345987B2 true JP5345987B2 (ja) 2013-11-20

Family

ID=45899364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010182769A Active JP5345987B2 (ja) 2010-08-18 2010-08-18 文書検索装置、文書検索方法および文書検索プログラム

Country Status (1)

Country Link
JP (1) JP5345987B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5798081B2 (ja) * 2012-04-25 2015-10-21 日本電信電話株式会社 情報検索装置及び方法及びプログラム
JP5806971B2 (ja) * 2012-04-25 2015-11-10 日本電信電話株式会社 地域推定装置及び方法及びプログラム
JP5806974B2 (ja) * 2012-05-17 2015-11-10 日本電信電話株式会社 近隣情報検索装置及び方法及びプログラム
JP6763732B2 (ja) * 2016-09-28 2020-09-30 株式会社Nttドコモ 抽出装置
JP7037778B2 (ja) * 2020-04-28 2022-03-17 株式会社ソケッツ 検索装置および方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4468294B2 (ja) * 2005-12-08 2010-05-26 日本電信電話株式会社 体験情報評価装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP5056133B2 (ja) * 2007-04-13 2012-10-24 日本電気株式会社 情報抽出システム、情報抽出方法および情報抽出用プログラム
JP2007226843A (ja) * 2007-06-14 2007-09-06 Hitachi Ltd 文書管理システム及び文書管理方法
JP5056365B2 (ja) * 2007-11-19 2012-10-24 日本電気株式会社 コンテンツ情報配信装置、コンテンツ情報配信システムおよびコンテンツ情報配信方法

Also Published As

Publication number Publication date
JP2012043115A (ja) 2012-03-01

Similar Documents

Publication Publication Date Title
JP5241828B2 (ja) 辞書の単語及び熟語の判定
KR102334064B1 (ko) 음성 입력에 기초한 테이블형 데이터에 관한 연산의 수행 기법
US8442970B2 (en) Creating and editing user search queries
US7899818B2 (en) Method and system for providing focused search results by excluding categories
US20110320470A1 (en) Generating and presenting a suggested search query
US8332208B2 (en) Information processing apparatus, information processing method, and program
WO2015047920A1 (en) Title and body extraction from web page
JP5156047B2 (ja) キーワード提示装置、方法及びプログラム
US20120323905A1 (en) Ranking data utilizing attributes associated with semantic sub-keys
US20200372088A1 (en) Recommending web api's and associated endpoints
CN110297880B (zh) 语料产品的推荐方法、装置、设备及存储介质
KR101355945B1 (ko) 온라인 문맥기반 광고 장치 및 방법
AU2018250372B2 (en) Method to construct content based on a content repository
CN103678362A (zh) 搜索方法及系统
JP2007094855A (ja) 文書処理装置及び文書処理方法
JP5345987B2 (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP4426894B2 (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
US20120317141A1 (en) System and method for ordering of semantic sub-keys
US9875298B2 (en) Automatic generation of a search query
JP2010092357A (ja) 施設関連情報検索方法および施設関連情報検索システム
US10504145B2 (en) Automated classification of network-accessible content based on events
CN109783612B (zh) 报表数据定位方法及装置、存储介质、终端
JP2017117021A (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
JP2012141681A (ja) クエリセグメント位置決定装置
JP4426893B2 (ja) 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130813

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130815

R150 Certificate of patent or registration of utility model

Ref document number: 5345987

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350