JP5186453B2 - 検索装置及び方法 - Google Patents

検索装置及び方法 Download PDF

Info

Publication number
JP5186453B2
JP5186453B2 JP2009184319A JP2009184319A JP5186453B2 JP 5186453 B2 JP5186453 B2 JP 5186453B2 JP 2009184319 A JP2009184319 A JP 2009184319A JP 2009184319 A JP2009184319 A JP 2009184319A JP 5186453 B2 JP5186453 B2 JP 5186453B2
Authority
JP
Japan
Prior art keywords
clause
extracted
importance
document
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009184319A
Other languages
English (en)
Other versions
JP2011039639A (ja
Inventor
智正 佐古
充 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2009184319A priority Critical patent/JP5186453B2/ja
Publication of JP2011039639A publication Critical patent/JP2011039639A/ja
Application granted granted Critical
Publication of JP5186453B2 publication Critical patent/JP5186453B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書を検索する検索装置及び方法に関する。
近年、インターネットの普及により、ネットワークを介した情報検索サービスを容易に利用することが可能になり、ユーザは検索キーを入力するだけで、ネットワーク上に存在する大量のデータの中から検索された情報を容易に取得することが出来る。
このような情報の検索には通常、検索用のキーワードを複数指定するが、キーワードの組合せによって意図しない情報が検索されることもある。例えば、「○○電気」、「開発」というキーワードを指定することにより、「○○電気が開発した・・・」という文が検索されるが、意図しない「○○電気は・・・、××会社が開発した・・・」という文も検索される。そこで、検索の精度を高めるために、ユーザから検索文を入力し、入力した文を構成する単語の格関係を解析し、同じ格関係を有する文を抽出する技術を開示する特許文献1が知られている。
特許文献1は、ユーザが入力した日本語検索要求文の格解析結果と、文書ファイル集合内の文の格解析結果とを照合することによって、検索要求文と関連する文書を検索する。すなわち、特許文献1に記載された発明は、入力された日本語検索要求文を格解析手段によって格解析を行い格関係を抽出する。次に、全文検索手段によって文書ファイル集合から検索要求文中の二つの自立語を共に含む文書ファイルを検索する。続いて、文切り出し手段によって、全文検索結果の中から二つの自立語を同じ文に含むような候補文を抽出する。更に、格照合手段によって、候補文の中の二つの自立語に対して検索要求文と同じ格関係が成立するかどうかを調べ、成立すれば表示手段によって格照合結果を優先的に画面表示する。
特開平7−244669号公報
しかしながら、特許文献1では、文を構成する自立語の格関係が成立するかどうかを調べるために、文書ファイルから検索要求文中の二つの自立語を共に含む文書ファイルを検索するので、システムの負荷が増大する。例えば、二つの自立語を共に含む場合、漢字や、平仮名等の表記の違いと、送り仮名の違いとの組合せは、自立語のそれぞれの表記数を掛け合わせた数になり、システムに負荷がかかる。
そこで、文書を検索する際にシステム負荷を低減しつつ検索精度を維持することができる装置が望まれている。
本発明は、文書を検索する際にシステム負荷を低減しつつ検索精度を維持することができる装置及び方法を提供することを目的とする。
本発明では、以下のような解決手段を提供する。
(1) 検索結果リストの順位を調整する検索装置であって、少なくとも一の文節を含むクエリの入力を受け付けるクエリ受付手段と、前記クエリ受付手段が受け付けた前記クエリに含まれる単語及び文節を抽出する分析手段と、前記分析手段が抽出した単語により、少なくとも一の文節を含む文書を記憶する文書データベースから当該単語に関連度の高い文書のリストを抽出する検索手段と、前記検索手段によって抽出した前記リストに含まれる文書について、前記分析手段が抽出した文節により、当該文節に関連度の高い文書がより上位にリストされるように前記リストの順位を調整する検索結果調整手段と、を備えることを特徴とする検索装置。
(1)の構成によれば、本発明に係る検索装置は、少なくとも一の文節を含むクエリの入力を受け付け、受け付けたクエリに含まれる単語及び文節を抽出し、抽出した単語により、少なくとも一の文節を含む文書を記憶する文書データベースから当該単語に関連度の高い文書のリストを抽出し、抽出したリストに含まれる文書について、抽出した文節により、当該文節に関連度の高い文書がより上位にリストされるようにリストの順位を調整する。
すなわち、本発明に係る検索装置は、文書データベースから、クエリに含まれる単語により、関連度の高い文書を抽出し、抽出した文書について、クエリに含まれる文節との関連度に基づいて、文書の順位を調整する。したがって、本発明に係る検索装置は、単語により抽出した文書について、文節により順位を調整するので、文書データベースから直接的に文節により抽出するというシステム負荷を低減しつつ、検索精度を維持することができる。
(2) 前記検索装置は、前記文節について、重要度の指定を受け付ける重要度受付手段を更に備え、前記検索結果調整手段は前記重要度に応じて前記リストの順位を調整することを特徴とする(1)に記載の検索装置。
(2)の構成によれば、(1)に記載の検索装置は、文節について、重要度の指定を受け付け、受け付けた重要度に応じてリストの順位を調整する。したがって、文節の重要度に応じて、順位を調整するので、クエリとの関連度が高い文書をより上位の順位にするという検索精度を更に向上させることができる。
(3) 検索結果リストの順位を調整する方法であって、少なくとも一の文節を含むクエリの入力を受け付けるステップと、前記クエリ受付手段が受け付けた前記クエリに含まれる単語及び文節を抽出するステップと、抽出した単語により、少なくとも一の文節を含む文書を記憶する文書データベースから当該単語に関連度の高い文書のリストを抽出するステップと、抽出した前記リストに含まれる文書について、抽出した文節により、当該文節に関連度の高い文書がより上位にリストされるように前記リストの順位を調整するステップと、を備えることを特徴とする方法。
(3)の構成によれば、本発明に係る方法は、検索結果リストの順位を調整する方法であって、少なくとも一の文節を含むクエリの入力を受け付け、受け付けたクエリに含まれる単語及び文節を抽出し、抽出した単語により、少なくとも一の文節を含む文書を記憶する文書データベースから当該単語に関連度の高い文書のリストを抽出し、抽出したリストに含まれる文書について、抽出した文節により、当該文節に関連度の高い文書がより上位にリストされるようにリストの順位を調整する。したがって、本発明に係る方法は、単語により抽出した文書について、文節により順位を調整するので、文書データベースから直接的に文節により抽出するというシステム負荷を低減しつつ、検索精度を維持することができる。
本発明によれば、文書を検索する際にシステム負荷を低減しつつ検索精度を維持することができる装置及び方法を提供することができる。
本発明の一実施形態に係る検索装置10の機能構成を示す機能ブロック図である。 本発明の一実施形態に係る検索装置10の処理を示すフローチャートである。 本発明の一実施形態に係る検索装置10の検索結果リストの例を示す図である。 本発明の一実施形態に係る検索装置10の、再度ランキングした検索結果リストの例を示す図である。 本発明の一実施形態に係る検索装置10の機能構成を示す機能ブロック図である。 本発明の一実施形態に係る検索装置10の重要度テーブル20を示す図である。 本発明の一実施形態に係る検索装置10の処理を示すフローチャートである。 本発明の一実施形態に係る検索装置10の、文節の重要度に応じて再度ランキングした検索結果リストの例を示す図である。
以下、本発明の実施形態について図を参照しながら説明する。
本実施形態は、コンピュータ及びその周辺装置に適用される。本実施形態における各部は、コンピュータ及びその周辺装置が備えるハードウェア並びに該ハードウェアを制御するソフトウェアによって構成される。
上記ハードウェアには、制御部としてのCPU(Central Processing Unit)の他、記憶部、通信装置、表示装置及び入力装置が含まれる。記憶部としては、例えば、メモリ(RAM:Random Access Memory、ROM:Read Only Memory等)、ハードディスクドライブ(HDD:Hard Disk Drive)、及び光ディスク(CD:Compact Disk、DVD:Digital Versatile Disk等)ドライブが挙げられる。通信装置としては、例えば、各種有線及び無線インターフェース装置が挙げられる。表示装置としては、例えば、液晶ディスプレイ、プラズマディスプレイ等の各種ディスプレイが挙げられる。入力装置としては、例えば、キーボード及びポインティング・デバイス(マウス、トラッキングボール等)が挙げられる。
上記ソフトウェアには、上記ハードウェアを制御するコンピュータ・プログラムやデータが含まれる。コンピュータ・プログラムやデータは、記憶部により記憶され、制御部により適宜実行、参照される。また、コンピュータ・プログラムやデータは、通信回線を介して配布されることも可能であり、CD−ROM等のコンピュータ可読媒体に記録して配布されることも可能である。
[実施例1]
図1は、本発明の一実施形態に係る検索装置10の機能構成を示す機能ブロック図である。検索装置10は、検索結果リストの順位を調整する検索装置であって、クエリ受付手段としてクエリ受付部11と、分析手段として分析部12と、検索手段として検索部13と、検索結果調整手段として検索結果調整部14と、を備えている。
クエリ受付部11は、少なくとも一の文節を含むクエリの入力を受け付ける。例えば、クエリ受付部11は、クエリとして、「メールが送信出来ません。なぜでしょうか。」というような質問文をユーザ端末50から受け付ける。
分析部12は、クエリ受付部11が受け付けたクエリに含まれる単語及び文節を抽出する。単語の抽出は、自然言語処理により辞書を用いて形態素解析を行い、単語を抽出する。文節の抽出には、n文節最長一致法、うしろ向きn文節評価最大法、接続コスト最小法等がある。ここで、日本語の文節は、単語のうちの自立語(名詞や、動詞等)に接語(助詞)がつながって構成される。文節には、接語が無いこともある。文には、1個以上の文節がある。このような日本語の特徴を捉えて、文節による検索を行うために、分析部12は、単語抽出を行うと共に、文節抽出を行う。
例えば、分析部12は、「メールが送信出来ません。なぜでしょうか。」という質問文を解析して単語(自立語)を抽出する。例えば、抽出される自立語は、「メール」、「送信」、「出来」、「なぜ」となる。そして、分析部12は、単語を抽出すると共に、「メールが」、「送信」、「出来ません」、「なぜでしょうか」という文節を抽出し、接語が無い場合には「送信」に次の文節「出来ません」を連結し、「メールが」、「送信出来ません」、「なぜでしょうか」を抽出する。
検索部13は、分析部12が抽出した単語により、少なくとも一の文節を含む文書を記憶する文書DB(データベース)31から当該単語に関連度の高い文書のリストを抽出する。文書DB31は、文書保管サーバ30によって、少なくとも一の文節を含む文書を記憶している。例えば、検索部13は、分析部12が抽出した「メール」、「送信」、「出来」、「なぜ」に、辞書に基づいて表記法が異なる「でき」、「何故」を加えて、文書DB31をOR検索する。OR検索なので、検索装置10は、抽出した単語を含む文書を、システムに負荷をかけずに漏れなく検索することができる。そして、検索部13は、検索した文書と当該単語との関連度が高い順に順位付け、上位から所定数(例えば、100件)の文書を抽出する。関連度は、例えば、抽出した単語を全て含む場合は、関連度が高くなり、抽出した単語を含む数が少なくなるほど関連度が低くなる。
検索結果調整部14は、検索部13によって抽出したリストに含まれる文書について、分析部12が抽出した文節により、当該文節に関連度の高い文書がより上位にリストされるようにリストの順位を調整する。すなわち、検索結果調整部14は、検索部13によって抽出した文書について、自然言語処理による解析を行い、解析した文節についての解析結果と、分析部12が抽出した文節とに基づいて、抽出した文書と抽出した文節との関連度を求め、求めた関連度に基づいて、抽出した文書の順位を調整する。
ここで、文書と文節との関連度において、例えば、抽出した文節と同じ文節を含む文書は関連度が高い。更に、文節間の係り受け関係において、主語となる文節と、述語となる文節とが対応している文書は、関連度が高い。例えば、クエリ「送信は時々出来ない」に基づいて、単語「送信」、「時々」、「出来」により、文書「送信は出来るが、受信は出来ない」と、文書「受信は出来るが、送信は出来ない」とを検索したとすると、検索結果調整部14は、クエリの文節間の係り受け関係(主語となる文節「送信は」と、述語となる文節「出来ない」)と同じ関係を、検索した文書についての自然言語処理による解析により抽出し、文書「受信は出来るが、送信は出来ない」を関連度が高いとすることができる。
図2は、本発明の一実施形態に係る検索装置10の処理を示すフローチャートである。なお、本処理は、プログラム開始指令を受けて処理を開始し、処理の終了によりプログラムを終了する。
ステップS101において、CPUは、ユーザ端末50からクエリを受け付ける。より具体的には、CPUは、ユーザ端末50から、所定のフォーマットによるデータを通信装置を介して受信し、受信データのデータ種別及びフォーマットに基づいてクエリとして受け付ける。その後、CPUは、単語を抽出し検索するプロセス(ステップS102〜ステップS104)と、文節を抽出するプロセス(ステップS105)とを並列して実行する。
単語を抽出し検索するプロセスであるステップS102において、CPUは、クエリに含まれる単語を抽出する。より具体的には、CPUは、受け付けたクエリについて自然言語処理により辞書を用いて形態素解析を行い単語を抽出し、抽出した単語の中から自立語を抽出する。その後、CPUは、処理をステップS103に移す。
単語を抽出し検索するプロセスであるステップS103において、CPUは、抽出した単語(自立語)により文書DB31を検索する。より具体的には、CPUは、抽出した自立語に基づいて文書DB31を検索するためのクエリを作成し、通信装置を介して文書保管サーバ30に送信する。その後、CPUは、処理をステップS104に移す。
単語を抽出し検索するプロセスであるステップS104において、CPUは、検索結果をランキングし、文書を抽出する。より具体的には、CPUは、文書保管サーバ30から通信装置を介して検索結果を受信する。そして、受信した検索結果を関連度に基づいて、順位付けし、上位から所定数(例えば100件)の文書を抽出し、記憶する。なお、検索装置10において、検索結果と抽出した自立語との関連度を求めてもよい。その後、CPUは、処理をステップS106に移す。
文節を抽出するプロセスであるステップS105において、CPUは、クエリに含まれる文節を抽出する。より具体的には、CPUは、受け付けたクエリについて自然言語処理により辞書を用いて形態素解析を行い文節を抽出する。CPUは、例えば、2文節最長一致法により文節を抽出する。その後、CPUは、処理をステップS106に移す。
ステップS106において、CPUは、単語を抽出し検索するプロセスによる検索結果と、文節を抽出するプロセスとに基づいて、抽出した文節により、抽出した文書を再度ランキングする。より具体的には、CPUは、ステップS104において抽出した文書について、自然言語処理による解析を行い、解析した文節についての解析結果と、ステップS105において抽出した文節とに基づいて、抽出した文書と抽出した文節との関連度を求め、ステップS104において抽出した文書を再度ランキングする。その後、CPUは、処理をステップS107に移す。
ステップS107において、CPUは、再度ランキングした結果をユーザ端末50に送信する。より具体的には、CPUは、ステップS105において再度ランキングした結果を、上位順に通信装置を介してユーザ端末50に送信する。その後、CPUは、処理を終了する。
図3は、本発明の一実施形態に係る検索装置10の検索結果リストの例を示す図である。
図3の例は、ユーザ端末50から受け付けたクエリに含まれる単語(自立語)を抽出し、抽出した単語(自立語)により文書DB31を検索した結果の例である。図3の例では、受け付けたクエリ「メールが送信出来ません。なぜでしょうか。」に含まれる単語(自立語)である「メール」、「送信」、「出来」、「なぜ」を抽出し、抽出した単語(自立語)に「でき」、「何故」を加えてOR検索した結果、図3の検索対象の文書を検索し、単語(自立語)との関連度に基づいて、上位から所定数(例えば、100件)を抽出している。例えば、関連度は、抽出した単語(自立語)の個数によって関連度としている(文書IDがA002の場合、「メール」、「送信」、「でき」、「何故」、「出来」を含むので関連度5としている)。
図4は、本発明の一実施形態に係る検索装置10の、再度ランキングした検索結果リストの例を示す図である。
図4の例は、クエリに含まれる文節を抽出し、抽出した文節により、図3においてランキングした結果を、再度ランキングした結果の例である。図4の例では、受け付けたクエリ「メールが送信出来ません。なぜでしょうか。」に含まれる文節「メールが」、「送信」、「出来ません」、「なぜでしょうか」から接語のない文節を連結して、「メールが」、「送信出来ません」、「なぜでしょうか」を抽出し、抽出した文節を含む場合に関連度をそれぞれ10とする関連度の算出を行い、算出した関連度に基づいて、再度ランキングしている。その結果、図3では3位であった文書「メールが送信できません。送信方法を教えてください。」(単語による関連度4+「メールが」の関連度10+「送信できません」の関連度10によって関連度24)が1位にランキングされていることを示している。
[実施例2]
図5は、本発明の一実施形態に係る検索装置10の機能構成を示す機能ブロック図である。検索装置10は、実施例1に加えて、重要度受付手段として重要度受付部15を更に備え、質問文と回答文とを対にした質問回答DB(データベース)32から検索する。
重要度受付部15は、文節について、重要度の指定を受け付ける。受け付けた重要度は、例えば、重要度テーブル20(後述する図6参照)によって記憶されている。受け付けは、検索装置10の管理者によって指定された重要度を受け付けて予め重要度テーブル20に記憶する。更に、受け付けは、検索するユーザによって指定される需要度の変更を受け付けて重要度テーブル20に記憶するとしてもよい。例えば、質問回答DB32から検索するような場合には、予想できる質問文を構成する文節の重要度を、検索装置10の管理者が予め指定する。そして、検索するユーザは、重要度テーブル20の内容を適宜、追加したり変更したりすることができる。
文節の重要度は、クエリの意味に関わる程度によって高くなる。例えば、通信関係のクエリの文節においては、「メールが」、「送信出来ません」、「受信出来ません」等の文節の重要度が高くなり、重要度の高い文節が重要度テーブル20に設定される。そして、検索結果調整部14は、重要度テーブル20の文節の重要度に応じて、抽出した文書の順位を調整する。例えば、検索結果調整部14は、クエリ「メールが送信出来ません。なぜでしょうか。」から抽出した文節「メールが」、「送信出来ません」、「なぜでしょうか」のうち、重要度テーブル20に基づいて「メールが」、「送信出来ません」の重要度を取得し、取得した重要度に応じて、抽出した文書について、関連度を算出する。更に、検索結果調整部14は、述語となる文節(例えば、「送信できません」)と反対の意味を持つ文節(例えば、「送信できる」)については、負の重要度(例えば、「送信できる」の重要度30に基づいて−30)に応じて関連度を算出するとしてもよい。このようにして、検索結果調整部14は、関連度の高い文書がより上位にリストされるように、抽出した文書の順位を調整することができる。
図6は、本発明の一実施形態に係る検索装置10の重要度テーブル20を示す図である。
重要度テーブル20は、文節を識別するための文節ID及び文節に対応付けて重要度を記憶している。文節及び重要度は、検索装置10の管理者によって入力され、更に、検索装置10のユーザによっても適宜、追加され、変更される。
図7は、本発明の一実施形態に係る検索装置10の処理を示すフローチャートである。なお、本処理は、プログラム開始指令を受けて処理を開始し、処理の終了によりプログラムを終了する。
ステップS201からステップS204、ステップS205については、実施例1と同様である。
ステップS206において、CPUは、単語を抽出し検索するプロセスによる検索結果と、文節を抽出するプロセスとに基づき、更に、抽出した文節の重要度に応じて、抽出した文書を再度ランキングする。より具体的には、CPUは、ステップS204において抽出した文書について、自然言語処理による解析を行い、解析した文節についての解析結果と、ステップS205において抽出した文節とに基づいて、抽出した文書と抽出した文節との関連度を求め、更に、重要度テーブル20に基づいた文節の重要度に応じて、ステップS204において抽出した文書を再度ランキングする。その後、CPUは、処理をステップS207に移す。
ステップS207において、CPUは、再度ランキングした結果をユーザ端末50に送信する。より具体的には、CPUは、ステップS206において再度ランキングした結果を、上位順に通信装置を介してユーザ端末50に送信する。その後、CPUは、処理を終了する。
図8は、本発明の一実施形態に係る検索装置10の、文節の重要度に応じて再度ランキングした検索結果リストの例を示す図である。
図8の例は、クエリに含まれる文節を抽出し、抽出した文節の重要度に応じて、図3においてランキングした検索結果を、再度ランキングした結果の例である。図8の例では、クエリ「メールが送信出来ません。なぜでしょうか。」から抽出した文節「メールが」、「送信出来ません」、「なぜでしょうか」のうち、重要度テーブル20に基づいて「メールが」の重要度10、「送信出来ません」の重要度30に応じて、例えば、文書IDがA003の場合、単語による関連度4+「メールが」の関連度10+「送信できません」の関連度30によって関連度44を算出している。
更に、関連度の算出において、クエリを解析して取得した述語の文節「送信出来ません」に、反対の意味を持つ文節「送信出来ます」については、負の重要度(重要度30に基づいて−30)を付与することにより、例えば、文書IDがA002の場合、単語による関連度5+「メールが」の関連度10+「送信できる」の関連度−30によって関連度−15を算出している。そして、検索装置10は、図3においてランキングした検索結果について、算出した関連度に基づいて、再度ランキングし、クエリに関連度の高い文書が抽出されるようにしている。その結果、図8は、文節「送信出来ます」を含む文書の順位が、図4よりも更に下がっていることを示している。
実施例1によれば、検索装置10は、少なくとも一の文節を含むクエリの入力を受け付け、受け付けたクエリに含まれる単語及び文節を抽出し、クエリから抽出した単語により、少なくとも一の文節を含む文書を記憶する文書DB31から、当該単語との関連度が高い文書を抽出し、抽出した文書について、クエリから抽出した文節により、当該文節との関連度に基づいて関連度の高い文書がより上位にリストされるように、抽出した文書の順位を調整する。したがって、検索装置10は、文書DB31から直接的に文節により抽出するというシステム負荷を低減しつつ、検索精度を維持することができる。
更に、実施例2によれば、検索装置10は、クエリに含まれる文節について、重要度の指定を受け付け、受け付けた重要度に応じて、抽出した文書の順位を調整する。したがって、検索装置10は、文書DB31から直接的に文節により抽出するというシステム負荷を低減しつつ、検索精度を維持することができ、更に文節の重要度に応じて、関連度が高い文書をより上位の順位にすることができる。
なお、質問回答DB32から検索する場合には、検索装置10は、クエリを受け付け、クエリに含まれる単語及び文節により関連度の高い質問文を質問回答DB32から抽出し、抽出した質問文に対応付けられた回答文をユーザ端末50に送信してもよい。検索装置10は、ユーザが入力したクエリとしての質問文に関連度が高い回答文を、システム負荷を低減しつつ、検索精度を維持して、検索することができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。
10 検索装置
11 クエリ受付部
12 分析部
13 検索部
14 検索結果調整部
15 重要度受付部
20 重要度テーブル
31 文書DB
32 質問回答DB

Claims (2)

  1. 検索結果リストの順位を調整する検索装置であって、
    少なくとも一の文節を含むクエリの入力と文節と該文節の重要度とが対応付けて予め記憶された重要度テーブルに対する当該重要度の追加または変更の入力を受け付けるクエリ受付手段と、
    前記クエリ受付手段が受け付けた前記クエリに含まれる単語及び文節を抽出する分析手と、
    前記分析手段が抽出した単語により、少なくとも一の文節を含む文書を記憶する文書データベースから当該単語に関連度の高い文書のリストを抽出する検索手段と、
    前記検索手段によって抽出した前記リストに含まれる文書、前記分析手段が抽出した文節との関連度として、前記クエリに含まれる文節に前記重要度テーブルに記憶された文節が含まれる場合には、該文書に対して該文節の重要度を付与して関連度を算出し、当該文節に関連度の高い文書がより上位にリストされるように前記リストの順位を調整する検索結果調整手段と、
    を備えることを特徴とする検索装置。
  2. 検索結果リストの順位を調整する方法であって、
    少なくとも一の文節を含むクエリの入力と文節と該文節の重要度とが対応付けて予め記憶された重要度テーブルに対する当該重要度の追加または変更の入力を受け付けるステップと、
    受け付けた前記クエリに含まれる単語及び文節を抽出するステップと、
    抽出した単語により、少なくとも一の文節を含む文書を記憶する文書データベースから当該単語に関連度および重要度の高い文書のリストを抽出するステップと、
    抽出した前記リストに含まれる文書、抽出した文節との関連度として、前記クエリに含まれる文節に前記重要度テーブルに記憶された文節が含まれる場合には、該文書に対して該文節の重要度を付与して関連度を算出し、当該文節に関連度の高い文書がより上位にリストされるように前記リストの順位を調整するステップと、
    を備えることを特徴とする方法。
JP2009184319A 2009-08-07 2009-08-07 検索装置及び方法 Active JP5186453B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009184319A JP5186453B2 (ja) 2009-08-07 2009-08-07 検索装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009184319A JP5186453B2 (ja) 2009-08-07 2009-08-07 検索装置及び方法

Publications (2)

Publication Number Publication Date
JP2011039639A JP2011039639A (ja) 2011-02-24
JP5186453B2 true JP5186453B2 (ja) 2013-04-17

Family

ID=43767364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009184319A Active JP5186453B2 (ja) 2009-08-07 2009-08-07 検索装置及び方法

Country Status (1)

Country Link
JP (1) JP5186453B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11789953B2 (en) 2018-03-23 2023-10-17 Semiconductor Energy Laboratory Co., Ltd. Document search system, document search method, program, and non-transitory computer readable storage medium

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2742115B2 (ja) * 1989-12-01 1998-04-22 日本電信電話株式会社 類似文書検索装置
JPH0765030A (ja) * 1993-08-27 1995-03-10 Toshiba Corp 文章検索方法及びその装置
JPH08137894A (ja) * 1994-11-07 1996-05-31 Toshiba Corp 類似文章の検索方法及び文書検索装置
JP2000207422A (ja) * 1999-01-13 2000-07-28 Fujitsu Ltd 概念シソ―ラスを用いた文書の検索及び格付けシステム並びに方法
JP4502615B2 (ja) * 2003-09-26 2010-07-14 日本電気株式会社 類似文検索装置、類似文検索方法、およびプログラム
JP2006163478A (ja) * 2004-12-02 2006-06-22 Canon Inc 検索装置

Also Published As

Publication number Publication date
JP2011039639A (ja) 2011-02-24

Similar Documents

Publication Publication Date Title
JP3820242B2 (ja) 質問応答型文書検索システム及び質問応答型文書検索プログラム
US11481417B2 (en) Generation and utilization of vector indexes for data processing systems and methods
US11468238B2 (en) Data processing systems and methods
US20070203688A1 (en) Apparatus and method for word translation information output processing
US8332208B2 (en) Information processing apparatus, information processing method, and program
US10552467B2 (en) System and method for language sensitive contextual searching
US8631097B1 (en) Methods and systems for finding a mobile and non-mobile page pair
US20040098385A1 (en) Method for indentifying term importance to sample text using reference text
JP4778474B2 (ja) 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体
US11455357B2 (en) Data processing systems and methods
JP2006073012A (ja) 予め定められた個数の予め定義された質問に応答することによって情報を管理するシステムおよび方法
JP2020071865A (ja) インテリジェントクロスドメイン検索を行うためのシステムおよび方法
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
WO2021092272A1 (en) Qa-bots for information search in documents using paraphrases
KR102256007B1 (ko) 자연어 질의를 통한 문서 검색 및 응답 제공 시스템 및 방법
JP2010267247A (ja) 情報検索装置、情報検索方法、端末装置、およびプログラム
KR20200136636A (ko) 형태소 기반 ai 챗봇 및 그의 문장의도 결정 방법
JP5186453B2 (ja) 検索装置及び方法
JP4499179B1 (ja) 端末装置
JP5014252B2 (ja) コンテンツを検索する索引データを管理する方法、サーバ、およびプログラム
KR101238927B1 (ko) 전자도서컨텐츠 검색 서비스 시스템 및 전자도서컨텐츠 검색 서비스 방법
JP5072792B2 (ja) 情報量に応じたページを優先的に表示する検索方法、プログラム及びサーバ
JP5439028B2 (ja) 情報検索装置、情報検索方法、およびプログラム
US20080162433A1 (en) Browsable search system
JP4934115B2 (ja) キーワード抽出装置、方法及びプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120515

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120528

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120713

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121114

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130121

R150 Certificate of patent or registration of utility model

Ref document number: 5186453

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250