JP2013191119A - 検索式生成のためのプログラム、情報処理方法及び情報処理装置 - Google Patents

検索式生成のためのプログラム、情報処理方法及び情報処理装置 Download PDF

Info

Publication number
JP2013191119A
JP2013191119A JP2012058177A JP2012058177A JP2013191119A JP 2013191119 A JP2013191119 A JP 2013191119A JP 2012058177 A JP2012058177 A JP 2012058177A JP 2012058177 A JP2012058177 A JP 2012058177A JP 2013191119 A JP2013191119 A JP 2013191119A
Authority
JP
Japan
Prior art keywords
search
keyword
storage unit
expression
data storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012058177A
Other languages
English (en)
Inventor
Tomoya Ogawa
知也 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012058177A priority Critical patent/JP2013191119A/ja
Publication of JP2013191119A publication Critical patent/JP2013191119A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索漏れが減るように検索式を改良する。
【解決手段】本情報処理方法は、正解文書集合に含まれる文書のうち、文書のデータを格納するデータベースを第1の検索式によって検索した場合に得られる第1の文書集合に含まれる文書の数を用いて、第1の検索式の再現率を算出する処理と、第1の検索式中の論理積で連結されている複数のキーワード等いずれかと所定の方法で特定された第1のキーワードとを論理和で連結するように、第1の検索式に第1のキーワードを追加し、第2の検索式を生成する処理と、正解文書集合に含まれる文書のうち、データベースを第2の検索式によって検索した場合に得られる第2の文書集合に含まれる文書の数を用いて、第2の検索式の再現率を算出する処理と、第2の検索式の再現率が第1検索式の再現率より高いと判断された場合に、第1の検索式を第2の検索式に変更することに決定する処理とを含む。
【選択図】図1

Description

本技術は、検索式の生成技術に関する。
公知例調査を行う場合、一般の発明者にとってキーワードや分類コードの選定などを行い検索式を作成することは難しいため、過去に行われた公知例調査に関する知識(検索ナレッジとも言われる)を利用することが好ましい。過去に行われた公知例調査の結果は、調査レポート(例えば、検索に利用した検索式や先行技術文献の情報などを含む)として社内に保存してある場合がある。調査レポートの活用方法の一例として、調査レポートに含まれる、出願アイデアに関連する検索式や先行技術文献の情報を利用することが考えられる。
出願アイデアに関連する先行技術文献が調査レポートに有った場合、更に類似した技術文献を検索する方法として曖昧検索がある。曖昧検索は、例えば先行技術文献のデータを検索キーとして与えることにより、関連度が高い技術文献を検索結果として得ることができる。関連度の高さは、例えば同じ単語がどの程度含まれるかといった点で決定される。しかし、曖昧検索は、類似した技術文献を見つけられることも多いが、エビデンスが残らない(すなわち、検索エンジンのパラメータが異なると結果が異なる)といった欠点がある。
そこで、調査レポートに含まれる検索式を用いて検索を行うことが考えられる。検索式を用いて検索を行えば、エビデンスが残る検索結果を得ることが出来る。しかし、検索式による検索では検索漏れが生じ、適切な技術文献を見つけられないことがある。また、調査レポートの検索式には、先行技術文献を見つけるには不要なキーワードが含まれていることがあり、これによりノイズが生じることもある。そのため、調査レポートに含まれる検索式を適切な検索式に改良する技術が求められている。
従来、検索式を利用した検索方法に関しては、以下のような従来技術が存在する。具体的には、文書データベースを検索する場合に、表示部に表示されるノードツリー(検索木)において、所望のノード検索式が格納されているノードをユーザが選択する。これにより、ノードツリー上で、選択ノードからノードツリーに至るパス上の他のノードが抽出され、選択ノードと抽出された他のノードとのノード検索式を参照して、検索用検索式が生成される。しかし、この技術では、予め検索木を用意しておかなければ検索式を生成することができない。
また、検索に関して、以下のような技術も存在する。具体的には、複数の文書からユーザの興味に合致する特定文書を選び出すフィルタリングを初期プロファイルを用いて行い、その結果をユーザに出力する。その結果に対する評価結果の入力をユーザから受け付け、評価結果に基づいて正解の文書及び不正解の文書の内容を解析する。解析の結果を初期プロファイルの情報と比較して、追加候補キーワード及び削除候補キーワードを抽出し、ユーザに出力する。そして、候補キーワードに対するユーザの選択入力に従い、プロファイルの修正を行う。この技術においては、候補キーワードの抽出について示されているにすぎず、検索式を改良する方法は示されていない。
さらに、検索に関して、以下のような技術も存在する。具体的には、文書データベースからキーワードに適合する文書及び適合しない文書を選出し、選出された適合文書中に出現する単語について、キーワードとの関連度を単語の弁別性と無関係に算出する。そして、関連度が高い単語をキーワードの関連語として選出し、選出された関連語を追加して新しいキーワードを生成し、生成された新しいキーワードに適合する文書を再度検索する。しかし、この技術においても、検索式を改良する方法は示されていない。
特開2002−312383号公報 特開2003−157273号公報 特開2002−288215号公報
従って、本技術の目的は、一側面においては、検索漏れが減るように検索式を改良するための技術を提供することである。
本技術の一側面に係る情報処理方法は、(A)予め定められた文書集合に含まれる文書のうち、文書のデータを格納するデータベースを第1の検索式によって検索した場合に得られる第1の文書集合に含まれる文書の数を用いて、第1の検索式の再現率を算出し、第1データ格納部に格納する第1算出処理と、(B)第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかと所定の方法により特定された第1のキーワードとを論理和で連結するように、第1の検索式に第1のキーワードを追加し、第2の検索式を生成する生成処理と、(C)予め定められた文書集合に含まれる文書のうち、データベースを第2の検索式によって検索した場合に得られる第2の文書集合に含まれる文書の数を用いて、第2の検索式の再現率を算出し、第2データ格納部に格納する第2算出処理と、(D)第2データ格納部に格納されている再現率が第1データ格納部に格納されている再現率より高いか判断し、高いと判断された場合に、第1の検索式を第2の検索式に変更することに決定する決定処理とを含む。
検索漏れが減るように検索式を改良できるようになる。
図1は、本実施の形態に係る検索支援装置の機能ブロック図である。 図2は、調査レポート格納部に格納されるデータの一例を示す図である。 図3は、メインの処理フローを示す図である。 図4は、第1検索結果格納部に格納されるデータの一例を示す図である。 図5は、各集合の関係について説明するための図である。 図6は、第1データ格納部に格納されるデータの一例を示す図である。 図7は、メインの処理フローを示す図である。 図8は、評価値Vの一例を示す図である。 図9は、リスト格納部に格納されるデータの一例を示す図である。 図10は、算出処理の処理フローを示す図である。 図11は、評価値Vの一例を示す図である。 図12は、第2データ格納部に格納されるデータの一例を示す図である。 図13は、リスト格納部に格納されるデータの一例を示す図である。 図14は、第2データ格納部に格納されるデータの一例を示す図である。 図15は、出力データの一例を示す図である。 図16は、コンピュータの機能ブロック図である。
本実施の形態に係る検索支援装置1の機能ブロック図を図1に示す。検索支援装置1は、入力部101と、関連文献格納部102と、曖昧検索部103と、第1検索結果格納部104と、検索式格納部105と、キーワード検索部106と、第2検索結果格納部107と、検索式修正部108と、修正後検索式格納部109と、出力部110と、第3検索結果格納部111とを含む。また、検索式修正部108は、チェック集合格納部1081と、リスト格納部1082と、生成部1088及び決定部1089を含む修正処理部1083と、第1算出部1084と、第2算出部1085と、第1データ格納部1086と、第2データ格納部1087とを含む。なお、検索支援装置1には、特許文献データベース(DB)11と、調査レポート格納部12とが接続されている。
入力部101は、特許文献DB11に格納されているデータ及び調査レポート格納部12に格納されているデータを用いて処理を行い、処理結果を関連文献格納部102及び検索式格納部105に格納する。曖昧検索部103は、関連文献格納部102に格納されているデータを用いて、特許文献DB11に対して曖昧検索を実行し、検索結果を第1検索結果格納部104に格納する。キーワード検索部106は、検索式格納部105に格納されている検索式及び検索式修正部108から受け取った検索式を用いて、特許文献DB11に格納されているデータに対してキーワード検索を実行し、検索結果を第2検索結果格納部107及び第3検索結果格納部111に格納する。生成部1088は、検索式にキーワードを追加して検索式を修正する処理等を行う。決定部1089は、生成部1088により修正された検索式を採用するか判断する処理等を行い、採用する検索式を修正後検索式格納部109に格納する。第1算出部1084は、修正前の検索式による検索について再現率、適合率及びスコアを算出する。第2算出部1085は、修正後の検索式による検索について再現率、適合率及びスコアを算出する。出力部110は、修正後検索式格納部109に格納されているデータを表示装置に表示する。
図2に、調査レポート格納部12に格納されているデータの一例を示す。調査レポート格納部12には、過去に行われた先行技術文献の調査に関するデータが格納されている。図2の例では、検索式の識別番号と、検索により得られた特許文献の数と、検索式と、先行技術文献の識別番号とが格納されている。なお、図2は調査レポート1件分のデータを示しているが、調査レポート格納部12には複数件分のデータが格納されていても良い。
次に、図3乃至図15を用いて、検索支援装置1の動作を説明する。まず、入力部101は、調査レポート格納部12から先行技術文献の識別情報を読み出す(図3:ステップS1)。ステップS1においては、先行技術文献の識別情報を1件分読み出すものとする。先行技術文献の識別情報は、ランダムに選択しても良いし、重要度等の情報が付されている場合にはそれに応じて選択を行っても良い。また、ユーザから指定を受け付けるようにしても良い。
また、入力部101は、ステップS1において読み出された識別情報を含む特許文献のデータを特許文献DB11から抽出し、関連文献格納部102に格納する(ステップS3)。なお、特許文献DB11には、既に公開されている特許文献のデータが格納されている。関連文献格納部102に格納されているデータのフォーマットは特許文献DB11に格納されているデータのフォーマットと同様である。
そして、曖昧検索部103は、関連文献格納部102に格納されている特許文献のデータを曖昧検索の入力データとして、特許文献DB11に対して曖昧検索を実行し、検索結果のデータを第1検索結果格納部104に格納する(ステップS5)。なお、ステップS5においては、曖昧検索の入力データとして、例えば出願人の情報や技術的な用語等が用いられる。
図4に、第1検索結果格納部104に格納されているデータの一例を示す。図4の例では、順位と、公報番号と、発明の名称と、出願人の情報とが格納されている。なお、順位は例えば類似度により決定される。
そして、検索式修正部108における修正処理部1083は、第1検索結果格納部104に格納されている検索結果のうち上位所定件数の検索結果を抽出してチェック集合Cを生成し、チェック集合Cのデータをチェック集合格納部1081に格納する(ステップS7)。チェック集合格納部1081に格納されているデータのフォーマットは、第1検索結果格納部104に格納されているデータのフォーマットと同様である。
なお、説明をわかりやすくするため、本実施の形態におけるチェック集合Cは、図5に示すような集合であるとする。図5において、チェック集合Cは、網掛けが付されている「a+b+c+d」に相当する集合である。図5における各枠は文献の集合を表しており、枠の面積が文献の数を反映している。括弧内の数字が文献の数である。例えば、特許文献DB11を「ロボット」というキーワードでキーワード検索を実行した場合、ヒットする文献の数は200件である。また、例えば「b」の集合に含まれる特許文献には、「脚式移動」というキーワード、「音声認識」というキーワード及び「ロボット」というキーワードのいずれも含まれる。なお、本実施の形態においては、特許文献DB11にデータが格納されている特許文献の数は700万件である。
図3の説明に戻り、入力部101は、調査レポート格納部12に格納されている検索式を読み出し、検索式格納部105に格納する(ステップS9)。ステップS9においては、検索式を1つ分読み出すものとする。検索式は、ランダムに選択しても良いし、数が所定の条件を満たしている場合に選択を行うようにしても良い。また、ユーザから指定を受け付けるようにしても良い。本実施の形態においては、「歩行 and 音声認識 and ロボット」という検索式を読み出したものとする。
そして、キーワード検索部106は、ステップS9において読み出された検索式を用いて、特許文献DB11に格納されているデータに対してキーワード検索を実行し、検索結果のデータを第2検索結果格納部107に格納する(ステップS11)。第2検索結果格納部107に格納されているデータのフォーマットは、第1検索結果格納部104に格納されているデータのフォーマットと同様である。なお、「歩行 and 音声認識 and ロボット」という検索式によってキーワード検索を実行した場合、図5における「a+j」に相当する集合が、検索で得られた文献の集合となる。
第1算出部1084は、第2検索結果格納部107に格納されている文献のデータと、チェック集合格納部1081に格納されているデータとを用いて、正解集合をチェック集合Cとして再現率を算出し、算出結果を第1データ格納部1086に格納する(ステップS12)。再現率は、検索漏れの少なさを表す指標であり、よく知られた指標であるので詳細な説明は省略する。図5の例では、(「a」に相当する集合に含まれる文献の数)/(「a+b+c+d」に相当する集合に含まれる文献の数)=40/100=0.4が再現率となる。
また、第1算出部1084は、第2検索結果格納部107に格納されている検索結果のデータと、チェック集合格納部1081に格納されているデータとを用いて、正解集合をチェック集合Cとして適合率を算出し、算出結果を第1データ格納部1086に格納する(ステップS13)。適合率は、検索漏れの少なさを表す指標であり、よく知られた指標であるので詳細な説明は省略する。図5の例では、(「a」に相当する集合に含まれる文献の数)/(「a+j」に相当する集合に含まれる文献の数)=40/45=0.88が適合率となる。
さらに、第1算出部1084は、ステップS12において算出された再現率とステップS13において算出された適合率とを用いてスコアを算出し、算出結果を第1データ格納部1086に格納する(ステップS14)。本実施の形態においては、スコアはF値(F-measure)であるとする。F値は、2*再現率*適合率/(再現率+適合率)によって算出する。図5の例では、2*0.4*0.88/(0.4+0.88)=0.55となる。
図6に、第1データ格納部1086に格納されているデータの一例を示す。図6の例では、検索式と、検索漏れに相当する文献の数と、ノイズに相当する文献の数と、再現率と、適合率と、スコアとが格納されている。検索式、検索漏れに相当する文献の数及びノイズに相当する文献の数は、例えばステップS12の処理の実行後に格納しておく。
そして、決定部1089は、ステップS9において読み出された検索式を最良検索式BFに設定し、ステップS12において算出された再現率を最高再現率BRに設定し、ステップS14において算出されたスコアを最高スコアBSに設定する(ステップS15)。また、決定部1089は、最良検索式BF、最高再現率BR及び最高スコアBSを修正後検索式格納部109に格納する。そして、処理は端子Aを介して図7のステップS17に移行する。
図7の説明に移行し、決定部1089は、最良検索式BFにおける論理積で連結された各キーワードについて、検索漏れについての評価値Vを算出し、メインメモリ等の記憶装置に格納する(ステップS17)。評価値Vは、(チェック集合に含まれる文献のうちキーワードを含まない文献の数)/(チェック集合に含まれる文献の数)として算出され、値が大きいほど、検索漏れの解消に寄与していないことを表している。なお、図5の例であれば、図8に示すように「歩行」、「音声認識」及び「ロボット」というキーワードについてVが算出される。図8の例の場合、検索漏れの解消に最も寄与していないのは、「音声認識」というキーワードということになる。なお、論理積で連結される要素がキーワードではなく検索式であっても、本実施の形態を適用可能である。
決定部1089は、最良検索式BFにおける各キーワードをリスト格納部1082に登録し、評価値Vに従い昇順にソートする(ステップS19)。
図9に、リスト格納部1082に格納されているデータの一例を示す。図9の例では、処理順序と、キーワードとが格納されている。なお、「ロボット」というキーワードについて算出された評価値Vは0であったため、図9のリスト格納部1082には登録されていない。
そして、決定部1089は、リスト格納部1082にキーワードが無くなったか判断する(ステップS21)。キーワードが無くなっていない場合(ステップS21:Noルート)、キーワード格納部1082から先頭のキーワード(以下、キーワードKとする)を取り出す(ステップS25)。図9の例の場合には、「音声認識」というキーワードが取り出される。
生成部1088は、算出処理を実施する(ステップS27)。算出処理については、図10を用いて説明する。
まず、生成部1088は、チェック集合Cに含まれる文献のうちキーワードKを含まない文献から追加キーワードの候補を抽出する(図10:ステップS40)。キーワードKが「音声認識」である場合、図5における「c+d」に相当する集合に含まれる文献から追加キーワードの候補を抽出する。ステップS40においては、例えば該当する文献に含まれるキーワードを漏れなく抽出するようにしてもよいし、ランダムに抽出するようにしてもよい。
生成部1088は、追加キーワードの候補の各々について、検索漏れ及びノイズについての評価値Vを算出し、メインメモリ等の記憶装置に格納する(ステップS41)。評価値Vは、(チェック集合に含まれる文献のうちキーワードKを含まず且つ追加キーワードの候補を含む文献の数)/(チェック集合に含まれる文献のうちキーワードKを含まない文献の数)に、((全文献数)−(追加キーワードの候補を含む文献のうちチェック集合に含まれない文献の数))/全文献数を乗じることによって算出する。この算出式において、前者は検索漏れの解消に寄与する度合いを表し、後者はノイズ増加の抑制に寄与する度合いを表す。よって、Vは、追加キーワードの候補の総合的な適切さを判断するための評価値となる。なお、図5の例であれば、図11に示すようにVが算出されることになる。図11の例であれば、3つの候補のうち「音声入力」という候補が追加キーワードとして最も適切であるということになる。
生成部1088は、ステップS40において抽出された複数の候補のうち、ステップS41において算出された評価値Vが上位所定位以内である候補を特定し、メインメモリ等の記憶装置に格納する(ステップS43)。そして、生成部1088は、ステップS43において特定された候補のうち未処理の候補を1つ特定する(ステップS45)。
そして、生成部1088は、ステップS45において特定された候補とキーワードKとを論理和で連結するように最良検索式BFに候補を追加した検索式を生成し、メインメモリ等の記憶装置に格納する(ステップS47)。例えば、最良検索式BFが「歩行 and 音声認識 and ロボット」であり、キーワードKが「音声認識」であり、追加キーワードの候補が「音声入力」である場合には、「歩行 and (音声認識 or 音声入力) and ロボット」という検索式を生成する。
そして、キーワード検索部106は、ステップS47において生成された検索式を用いて、特許文献DB11に格納されているデータに対してキーワード検索を実行し、検索結果のデータを第3検索結果格納部111に格納する。そして、第2算出部1085は、第3検索結果格納部111に格納されている文献のデータと、チェック集合格納部1081に格納されているデータとを用いて、正解集合をチェック集合Cとして再現率を算出し、算出結果を第2データ格納部1087に格納する(ステップS49)。図5の例では、(「a+c」に相当する集合に含まれる文献の数)/(「a+b+c+d」に相当する集合に含まれる文献の数)=70/100=0.7が再現率となる。
また、第2算出部1085は、第3検索結果格納部111に格納されている検索結果のデータと、チェック集合格納部1081に格納されているデータとを用いて、正解集合をチェック集合Cとして適合率を算出し、算出結果を第2データ格納部1087に格納する(ステップS51)。図5の例では、(「a+c」に相当する集合に含まれる文献の数)/(「a+c+j+k」に相当する集合に含まれる文献の数)=70/80=0.88が適合率となる。
さらに、第2算出部1085は、ステップS49において算出された再現率とステップS51において算出された適合率とを用いてスコア(すなわちF値)を算出し、算出結果を第2データ格納部1087に格納する(ステップS53)。図5の例では、2*再現率*適合率/(再現率+適合率)=0.78となる。
図12に、第2データ格納部1087に格納されているデータの一例を示す。図12の例では、追加キーワードの候補と、検索漏れに相当する文献の数と、ノイズに相当する文献の数と、再現率と、適合率と、スコアとが格納されている。追加するキーワードの候補、検索漏れに相当する文献の数及びノイズに相当する文献の数は、例えばステップS49の処理の実行後に格納しておく。
そして、生成部1088は、未処理の候補が有るか判断する(ステップS55)。未処理の候補が有る場合(ステップS55:Yesルート)、次の候補について処理するため、ステップS45の処理に戻る。
一方、未処理の候補が無い場合(ステップS55:Noルート)、生成部1088は、ステップS47において生成された検索式のうち、ステップS53において算出されたスコアが最も高い検索式を特定する(ステップS57)。そして、生成部1088は、ステップS57において特定された検索式を検索式Fに設定し、当該検索式Fを使用した検索による再現率を再現率Rに設定し、当該検索式Fを使用した検索によるスコアをスコアSに設定する(ステップS59)。そして元の処理に戻る。
このようにすれば、検索漏れを減らし且つノイズの増加を抑制するような検索式に修正することができるようになる。また、チェック集合Cに含まれる文献のうちキーワードKを含まない文献から追加キーワードの候補を抽出するので、効果的に検索漏れを減らすことができるようになる。
図7の説明に戻り、決定部1089は、再現率Rが1(すなわち100%)であるか判断する(ステップS29)。再現率Rが1(すなわち100%)である場合(ステップS29:Yesルート)、検索漏れが無くなったので、決定部1089は、修正後検索式格納部109に格納されている最良検索式BFを検索式Fで更新する。そして、出力部110は、修正後検索式格納部109に格納されている検索式Fを含む出力データを生成し、表示装置に出力する(ステップS31)。
一方、再現率Rが1(すなわち100%)ではない場合(ステップS29:Noルート)、決定部1089は、(スコアS>最高スコアBS)且つ(再現率R>最高再現率BR)であるか判断する(ステップS33)。(スコアS>最高スコアBS)且つ(再現率R>最高再現率BR)ではない場合(ステップS33:Noルート)、検索式BFにおける他のキーワードについて処理するため、ステップS21の処理に戻る。
(スコアS>最高スコアBS)且つ(再現率R>最高再現率BR)である場合(ステップS33:Yesルート)、決定部1089は、検索式Fを最良検索式BFに設定し、再現率Rを最高再現率BRに設定し、スコアSを最高スコアBSに設定する(ステップS35)。また、決定部1089は、最良検索式BF、最高再現率BR及び最高スコアBSを修正後検索式格納部109に格納することにより、既に修正後検索式格納部109に格納されている最良検索式BF、最高再現率BR及び最高スコアBSを更新する。そしてステップS17の処理に戻る。
一方、ステップS21において、キーワードが無くなっていると判断された場合(ステップS21:Yesルート)、出力部110は、修正後検索式格納部109に格納されている最良検索式BFを含む出力データを生成し、表示装置に出力する(ステップS23)。そして処理を終了する。
以上のような処理を実施することにより、曖昧検索によって得られた結果に近い結果を得られるような検索式を生成することができるようになる。また、検索式において効果的ではないキーワード等と追加キーワードとを連結しているので、検索漏れを効果的に減らすことができるようになる。
なお、上で述べた例について処理を最後まで行うと、最終的に以下のような検索式になる。
まず、1回目の算出処理(ステップS27)において、検索式Fが「歩行 and (音声認識 or 音声入力) and ロボット」であり、再現率Rが0.7、スコアSが0.78になったとする。この場合、ステップS29において再現率Rは1ではないと判断されるから、ステップS33に進む。ステップS33においては、スコアS(0.78)>最高スコアBS(0.55)且つ再現率R(0.7)>最高再現率BR(0.4)が成立する。よって、ステップS35に進み、最良検索式BFが「歩行 and (音声認識 or 音声入力) and ロボット」に設定され、最高再現率BRが0.7に設定され、最高スコアBSが0.78に設定される。そしてステップS17の処理に戻る。
ステップS17の処理においては、最良検索式BFにおける論理積で連結された各キーワードについて、評価値Vを算出する。ここでは、「歩行」というキーワードの評価値Vは30/100=0.3であり、「音声認識 or 音声入力」という検索式の評価値Vは0/100=0であり、「ロボット」というキーワードの評価値Vは0/100=0である。従って、ステップS19においては、図13に示すようなデータがリスト格納部1082に格納される。すなわち、以下の処理では、「歩行」というキーワードが処理の対象となる。
ステップS19の後、ステップS21においてはNoルートを進み、ステップS25においては、「歩行」というキーワードがリスト格納部1082から取り出される。そして、2回目の算出処理(S27)が実行される。
2回目の算出処理においては、追加キーワードの候補として「脚式移動」というキーワードが抽出されたとする。この場合、「歩行」というキーワードと「脚式移動」という追加キーワードの候補とを論理和で連結した「(歩行 or 脚式移動) and (音声認識 or 音声入力) and ロボット」という検索式が生成される。そして、生成された検索式を使用した検索について再現率、適合率及びスコアを算出すると、図14に示すようなデータが第2データ格納部1087に格納される。よって、ステップS59において、検索式Fが「(歩行 or 脚式移動) and (音声認識 or 音声入力) and ロボット」に設定され、再現率Rが1に設定され、スコアSが0.95に設定される。
算出処理が終了すると、ステップS29に進む。ステップS29においては、再現率Rが1であるからステップS31に進む。そしてステップS31において、検索式F「(歩行 or 脚式移動) and (音声認識 or 音声入力) and ロボット」を含む出力データが生成され、表示装置に表示される。
図15に、表示装置に表示される出力データの一例を示す。図15の例では、検索支援装置1による処理の結果として、検索式Fが表示されるようになっている。
以上本技術の一実施の形態を説明したが、本技術はこれに限定されるものではない。例えば、上で説明した検索支援装置1の機能ブロック図は必ずしも実際のプログラムモジュール構成に対応するものではない。
また、上で説明した各テーブルの構成は一例であって、必ずしも上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。
なお、上で述べた例では、スコアとしてF値を利用したが、他の評価値を利用するようにしてもよい。また、再現率及び適合率についても、他の同等な評価値を利用するようにしてもよい。
また、追加キーワードの候補は、例えば同義語辞書から抽出したり、過去の検索結果から抽出したり、キーワードKとの排他性を考慮して管理者が設定する等、その他の方法で選定しても良い。
また、上で述べた例では、評価値Vが上位所定位以内であるものを最終的な追加キーワードの候補としているが、例えば評価値Vが所定の閾値以上であるものを最終的な追加キーワードの候補とするようにしてもよい。
また、ステップS29においては、再現率Rが1になった場合にステップS31に移行するようにしているが、再現率Rが予め定められた閾値以上になった場合にステップS31に移行するようにしてもよい。
なお、上で述べた検索支援装置1は、コンピュータ装置であって、図16に示すように、メモリ2501とCPU(Central Processing Unit)2503とハードディスク・ドライブ(HDD:Hard Disk Drive)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
以上述べた本技術の実施の形態をまとめると以下のようになる。
本技術の実施の形態に係る情報処理方法は、(A)予め定められた文書集合に含まれる文書のうち、文書のデータを格納するデータベースを第1の検索式によって検索した場合に得られる第1の文書集合に含まれる文書の数を用いて、第1の検索式の再現率を算出し、第1データ格納部に格納する第1算出処理と、(B)第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかと所定の方法により特定された第1のキーワードとを論理和で連結するように、第1の検索式に第1のキーワードを追加し、第2の検索式を生成する生成処理と、(C)予め定められた文書集合に含まれる文書のうち、データベースを第2の検索式によって検索した場合に得られる第2の文書集合に含まれる文書の数を用いて、第2の検索式の再現率を算出し、第2データ格納部に格納する第2算出処理と、(D)第2データ格納部に格納されている再現率が第1データ格納部に格納されている再現率より高いか判断し、高いと判断された場合に、第1の検索式を第2の検索式に変更することに決定する決定処理とを含む。
このようにすれば、検索漏れが減るように検索式を改良することができるようになる。
また、上で述べた生成処理が、(b1)第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかについて、予め定められた文書集合に含まれる文書のうち当該キーワード又は当該検索式によって特定されるキーワードを含まない文書の集合である第3の文書集合を特定し、第3データ格納部に格納する処理を含むようにしてもよい。そして、上で述べた第1のキーワードが、第3データ格納部に格納されている第3の文書集合に含まれる文書から抽出したキーワードであってもよい。上で述べたような第3の文書集合に含まれる文書から抽出したキーワードを利用すれば、より効果的に検索漏れを減らすことができるようになる。
また、上で述べた生成処理が、(b2)第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかについて、予め定められた文書集合に含まれる文書のうち当該キーワード又は当該検索式によって特定されるキーワードを含まない文書の集合である第3の文書集合を特定し、第3データ格納部に格納する処理と、(b3)第3データ格納部に格納されている第3の文書集合に含まれる文書から、キーワードの集合を抽出する処理と、(b4)キーワードの集合に含まれるキーワードの各々について、当該キーワードと第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかとを論理和で連結するように第1の検索式に当該キーワードを追加し、検索式を生成する処理と、(b5)キーワードの集合に含まれるキーワードの各々について、当該キーワードについて生成された検索式によってデータベースを検索した場合に得られる文書集合と、予め定められた文書集合とを用いて、検索性能の評価値を算出する処理と、(b6)キーワードの集合に含まれるキーワードのうち算出された評価値が最も高いキーワードである第1のキーワードを第1の検索式に追加した検索式を、第2の検索式に決定する処理とを含むようにしてもよい。上で述べたような第3の文書集合に含まれる文書から抽出したキーワードを利用すれば、より効果的に検索漏れを減らすことができるようになる。また、第3の文書集合から抽出されたキーワードのうち、最も検索性能を向上させることができるキーワードによって検索式を改良することができるようになる。
また、上で述べた第1のキーワードが、当該第1のキーワードと論理和で連結されるキーワードの同義語であるようにしてもよい。例えば、「歩行ロボット」という用語を文書の中で使用する者は、ほぼ同義である「脚式移動ロボット」という用語を文書の中で使用しないことがある。そのため、「脚式移動」というキーワードを検索式に入れて検索を行うと、「歩行ロボット」という用語が使用されている文書はヒットしなくなってしまう。そこで、上で述べたように同義語を利用することによって、このような問題に対処できるようになる。
また、上で述べた生成処理が、(b7)第1の検索式中の論理積で連結されている複数のキーワード又は検索式の各々について、第3の文書集合に含まれる文書のうち当該キーワード又は当該検索式によって特定されるキーワードを含まない文書の数を計数する処理と、(b8)特定された当該文書の数に基づき、第1のキーワードと連結するキーワード又は検索式を決定する処理とを含むようにしてもよい。上で述べたようにして計数された文書の数は、効果的なキーワード又は検索式であるかを判断するための評価値となる。よって、例えば効果的ではないキーワード又は検索式と第1のキーワードとを連結すれば、効果的に検索漏れを減らすことができるようになる。
また、(E)第1の文書集合に含まれる文書のうち予め定められた文書集合に含まれる文書の数を用いて、第1の検索式の適合率を算出し、第1データ格納部に格納する処理と、(F)第1の検索式の再現率と適合率とを用いて、第1の検索式の検索性能の評価値を算出し、第1データ格納部に格納する処理と、(G)第2の文書集合に含まれる文書のうち予め定められた文書集合に含まれる文書の数を用いて、第2の検索式の適合率を算出し、第2データ格納部に格納する処理と、(H)第2の検索式の再現率と適合率とを用いて、第2の検索式の検索性能の評価値を算出し、第2データ格納部に格納する処理とをさらに含むようにしてもよい。そして、上で述べた決定処理が、(d1)第1データ格納部に格納されている評価値と第2データ格納部に格納されている評価値とを用いて、第2の検索式の検索性能が第1の検索式の検索性能よりも高いか判断し、高いと判断された場合に、第1の検索式を第2の検索式に変更することに決定する決定処理を含むようにしてもよい。このようにすれば、検索漏れだけでなくノイズも考慮して検索式を改良することができるようになる。
また、検索性能の評価値がF値であってもよい。F値を用いれば、検索性能を適切に評価することができるようになる。
また、予め定められた文書集合が、データベースに対して曖昧検索を実行することにより得られた文書集合であってもよい。このようにすれば、曖昧検索の検索結果に対してエビデンスを残すことができるようになる。
なお、上記方法による処理をコンピュータに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
予め定められた文書集合に含まれる文書のうち、文書のデータを格納するデータベースを第1の検索式によって検索した場合に得られる第1の文書集合に含まれる文書の数を用いて、前記第1の検索式の再現率を算出し、第1データ格納部に格納する第1算出処理と、
前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかと所定の方法により特定された第1のキーワードとを論理和で連結するように、前記第1の検索式に前記第1のキーワードを追加し、第2の検索式を生成する生成処理と、
前記予め定められた文書集合に含まれる文書のうち、前記データベースを前記第2の検索式によって検索した場合に得られる第2の文書集合に含まれる文書の数を用いて、前記第2の検索式の再現率を算出し、第2データ格納部に格納する第2算出処理と、
前記第2データ格納部に格納されている再現率が前記第1データ格納部に格納されている再現率より高いか判断し、高いと判断された場合に、前記第1の検索式を前記第2の検索式に変更することに決定する決定処理と
をコンピュータに実行させるためのプログラム。
(付記2)
前記生成処理が、
前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかについて、前記予め定められた文書集合に含まれる文書のうち当該キーワード又は当該検索式によって特定されるキーワードを含まない文書の集合である第3の文書集合を特定し、第3データ格納部に格納する処理
を含み、
前記第1のキーワードが、
前記第3データ格納部に格納されている第3の文書集合に含まれる文書から抽出したキーワードである
ことを特徴とする付記1記載のプログラム。
(付記3)
前記生成処理が、
前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかについて、前記予め定められた文書集合に含まれる文書のうち当該キーワード又は当該検索式によって特定されるキーワードを含まない文書の集合である第3の文書集合を特定し、第3データ格納部に格納する処理と、
前記第3データ格納部に格納されている第3の文書集合に含まれる文書から、キーワードの集合を抽出する処理と、
前記キーワードの集合に含まれるキーワードの各々について、当該キーワードと前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかとを論理和で連結するように前記第1の検索式に当該キーワードを追加し、検索式を生成する処理と、
前記キーワードの集合に含まれるキーワードの各々について、当該キーワードについて生成された検索式によって前記データベースを検索した場合に得られる文書集合と、前記予め定められた文書集合とを用いて、検索性能の評価値を算出する処理と、
前記キーワードの集合に含まれるキーワードのうち算出された前記評価値が最も高いキーワードである前記第1のキーワードを前記第1の検索式に追加した検索式を、前記第2の検索式に決定する処理と、
を含む付記1記載のプログラム。
(付記4)
前記第1のキーワードが、
当該第1のキーワードと論理和で連結されるキーワードの同義語である
付記1記載のプログラム。
(付記5)
前記生成処理が、
前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式の各々について、前記第3の文書集合に含まれる文書のうち当該キーワード又は当該検索式によって特定されるキーワードを含まない文書の数を計数する処理と、
特定された当該文書の数に基づき、前記第1のキーワードと連結するキーワード又は検索式を決定する処理と、
を含む付記2又は3記載のプログラム。
(付記6)
前記第1の文書集合に含まれる文書のうち前記予め定められた文書集合に含まれる文書の数を用いて、前記第1の検索式の適合率を算出し、前記第1データ格納部に格納する処理と、
前記第1の検索式の再現率と適合率とを用いて、前記第1の検索式の検索性能の評価値を算出し、前記第1データ格納部に格納する処理と、
前記第2の文書集合に含まれる文書のうち前記予め定められた文書集合に含まれる文書の数を用いて、前記第2の検索式の適合率を算出し、前記第2データ格納部に格納する処理と、
前記第2の検索式の再現率と適合率とを用いて、前記第2の検索式の検索性能の評価値を算出し、前記第2データ格納部に格納する処理と
をさらに実行させ、
前記決定処理が、
前記第1データ格納部に格納されている評価値と前記第2データ格納部に格納されている評価値とを用いて、前記第2の検索式の検索性能が前記第1の検索式の検索性能よりも高いか判断し、高いと判断された場合に、前記第1の検索式を前記第2の検索式に変更することに決定する決定処理
を含む付記1乃至5のいずれか1つ記載のプログラム。
(付記7)
前記検索性能の評価値がF値である
付記3又は6記載のプログラム。
(付記8)
前記予め定められた文書集合が、前記データベースに対して曖昧検索を実行することにより得られた文書集合である
付記1乃至7のいずれか1つ記載のプログラム。
(付記9)
予め定められた文書集合に含まれる文書のうち、文書のデータを格納するデータベースを第1の検索式によって検索した場合に得られる第1の文書集合に含まれる文書の数を用いて、前記第1の検索式の再現率を算出し、第1データ格納部に格納する第1算出処理と、
前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかと所定の方法により特定された第1のキーワードとを論理和で連結するように、前記第1の検索式に前記第1のキーワードを追加し、第2の検索式を生成する生成処理と、
前記予め定められた文書集合に含まれる文書のうち、前記データベースを前記第2の検索式によって検索した場合に得られる第2の文書集合に含まれる文書の数を用いて、前記第2の検索式の再現率を算出し、第2データ格納部に格納する第2算出処理と、
前記第2データ格納部に格納されている再現率が前記第1データ格納部に格納されている再現率より高いか判断し、高いと判断された場合に、前記第1の検索式を前記第2の検索式に変更することに決定する決定処理と
をコンピュータが実行する情報処理方法。
(付記10)
第1データ格納部と、
第2データ格納部と、
予め定められた文書集合に含まれる文書のうち、文書のデータを格納するデータベースを第1の検索式によって検索した場合に得られる第1の文書集合に含まれる文書の数を用いて、前記第1の検索式の再現率を算出し、前記第1データ格納部に格納する第1算出部と、
前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかと所定の方法により特定された第1のキーワードとを論理和で連結するように、前記第1の検索式に前記第1のキーワードを追加し、第2の検索式を生成する生成部と、
前記予め定められた文書集合に含まれる文書のうち、前記データベースを前記第2の検索式によって検索した場合に得られる第2の文書集合に含まれる文書の数を用いて、前記第2の検索式の再現率を算出し、前記第2データ格納部に格納する第2算出部と、
前記第2データ格納部に格納されている再現率が前記第1データ格納部に格納されている再現率より高いか判断し、高いと判断された場合に、前記第1の検索式を前記第2の検索式に変更することに決定する決定部と
を有する情報処理装置。
1 検索支援装置 11 特許文献DB
12 調査レポート格納部 101 入力部
102 関連文献格納部 103 曖昧検索部
104 第1検索結果格納部 105 検索式格納部
106 キーワード検索部 107 第2検索結果格納部
108 検索式修正部 1081 チェック集合格納部
1082 リスト格納部 1083 修正処理部
1084 第1算出部 1085 第2算出部
1086 第1データ格納部 1087 第2データ格納部
1088 生成部 1089 決定部
110 出力部 111 第3検索結果格納部
109 修正後検索式格納部

Claims (8)

  1. 予め定められた文書集合に含まれる文書のうち、文書のデータを格納するデータベースを第1の検索式によって検索した場合に得られる第1の文書集合に含まれる文書の数を用いて、前記第1の検索式の再現率を算出し、第1データ格納部に格納する第1算出処理と、
    前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかと所定の方法により特定された第1のキーワードとを論理和で連結するように、前記第1の検索式に前記第1のキーワードを追加し、第2の検索式を生成する生成処理と、
    前記予め定められた文書集合に含まれる文書のうち、前記データベースを前記第2の検索式によって検索した場合に得られる第2の文書集合に含まれる文書の数を用いて、前記第2の検索式の再現率を算出し、第2データ格納部に格納する第2算出処理と、
    前記第2データ格納部に格納されている再現率が前記第1データ格納部に格納されている再現率より高いか判断し、高いと判断された場合に、前記第1の検索式を前記第2の検索式に変更することに決定する決定処理と
    をコンピュータに実行させるためのプログラム。
  2. 前記生成処理が、
    前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかについて、前記予め定められた文書集合に含まれる文書のうち当該キーワード又は当該検索式によって特定されるキーワードを含まない文書の集合である第3の文書集合を特定し、第3データ格納部に格納する処理
    を含み、
    前記第1のキーワードが、
    前記第3データ格納部に格納されている第3の文書集合に含まれる文書から抽出したキーワードである
    ことを特徴とする請求項1記載のプログラム。
  3. 前記生成処理が、
    前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかについて、前記予め定められた文書集合に含まれる文書のうち当該キーワード又は当該検索式によって特定されるキーワードを含まない文書の集合である第3の文書集合を特定し、第3データ格納部に格納する処理と、
    前記第3データ格納部に格納されている第3の文書集合に含まれる文書から、キーワードの集合を抽出する処理と、
    前記キーワードの集合に含まれるキーワードの各々について、当該キーワードと前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかとを論理和で連結するように前記第1の検索式に当該キーワードを追加し、検索式を生成する処理と、
    前記キーワードの集合に含まれるキーワードの各々について、当該キーワードについて生成された検索式によって前記データベースを検索した場合に得られる文書集合と、前記予め定められた文書集合とを用いて、検索性能の評価値を算出する処理と、
    前記キーワードの集合に含まれるキーワードのうち算出された前記評価値が最も高いキーワードである前記第1のキーワードを前記第1の検索式に追加した検索式を、前記第2の検索式に決定する処理と、
    を含む請求項1記載のプログラム。
  4. 前記第1のキーワードが、
    当該第1のキーワードと論理和で連結されるキーワードの同義語である
    請求項1記載のプログラム。
  5. 前記生成処理が、
    前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式の各々について、前記第3の文書集合に含まれる文書のうち当該キーワード又は当該検索式によって特定されるキーワードを含まない文書の数を計数する処理と、
    特定された当該文書の数に基づき、前記第1のキーワードと連結するキーワード又は検索式を決定する処理と、
    を含む請求項2又は3記載のプログラム。
  6. 前記第1の文書集合に含まれる文書のうち前記予め定められた文書集合に含まれる文書の数を用いて、前記第1の検索式の適合率を算出し、前記第1データ格納部に格納する処理と、
    前記第1の検索式の再現率と適合率とを用いて、前記第1の検索式の検索性能の評価値を算出し、前記第1データ格納部に格納する処理と、
    前記第2の文書集合に含まれる文書のうち前記予め定められた文書集合に含まれる文書の数を用いて、前記第2の検索式の適合率を算出し、前記第2データ格納部に格納する処理と、
    前記第2の検索式の再現率と適合率とを用いて、前記第2の検索式の検索性能の評価値を算出し、前記第2データ格納部に格納する処理と
    をさらに実行させ、
    前記決定処理が、
    前記第1データ格納部に格納されている評価値と前記第2データ格納部に格納されている評価値とを用いて、前記第2の検索式の検索性能が前記第1の検索式の検索性能よりも高いか判断し、高いと判断された場合に、前記第1の検索式を前記第2の検索式に変更することに決定する決定処理
    を含む請求項1乃至5のいずれか1つ記載のプログラム。
  7. 予め定められた文書集合に含まれる文書のうち、文書のデータを格納するデータベースを第1の検索式によって検索した場合に得られる第1の文書集合に含まれる文書の数を用いて、前記第1の検索式の再現率を算出し、第1データ格納部に格納する第1算出処理と、
    前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかと所定の方法により特定された第1のキーワードとを論理和で連結するように、前記第1の検索式に前記第1のキーワードを追加し、第2の検索式を生成する生成処理と、
    前記予め定められた文書集合に含まれる文書のうち、前記データベースを前記第2の検索式によって検索した場合に得られる第2の文書集合に含まれる文書の数を用いて、前記第2の検索式の再現率を算出し、第2データ格納部に格納する第2算出処理と、
    前記第2データ格納部に格納されている再現率が前記第1データ格納部に格納されている再現率より高いか判断し、高いと判断された場合に、前記第1の検索式を前記第2の検索式に変更することに決定する決定処理と
    をコンピュータが実行する情報処理方法。
  8. 第1データ格納部と、
    第2データ格納部と、
    予め定められた文書集合に含まれる文書のうち、文書のデータを格納するデータベースを第1の検索式によって検索した場合に得られる第1の文書集合に含まれる文書の数を用いて、前記第1の検索式の再現率を算出し、前記第1データ格納部に格納する第1算出部と、
    前記第1の検索式中の論理積で連結されている複数のキーワード又は検索式のいずれかと所定の方法により特定された第1のキーワードとを論理和で連結するように、前記第1の検索式に前記第1のキーワードを追加し、第2の検索式を生成する生成部と、
    前記予め定められた文書集合に含まれる文書のうち、前記データベースを前記第2の検索式によって検索した場合に得られる第2の文書集合に含まれる文書の数を用いて、前記第2の検索式の再現率を算出し、前記第2データ格納部に格納する第2算出部と、
    前記第2データ格納部に格納されている再現率が前記第1データ格納部に格納されている再現率より高いか判断し、高いと判断された場合に、前記第1の検索式を前記第2の検索式に変更することに決定する決定部と
    を有する情報処理装置。
JP2012058177A 2012-03-15 2012-03-15 検索式生成のためのプログラム、情報処理方法及び情報処理装置 Pending JP2013191119A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012058177A JP2013191119A (ja) 2012-03-15 2012-03-15 検索式生成のためのプログラム、情報処理方法及び情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012058177A JP2013191119A (ja) 2012-03-15 2012-03-15 検索式生成のためのプログラム、情報処理方法及び情報処理装置

Publications (1)

Publication Number Publication Date
JP2013191119A true JP2013191119A (ja) 2013-09-26

Family

ID=49391259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012058177A Pending JP2013191119A (ja) 2012-03-15 2012-03-15 検索式生成のためのプログラム、情報処理方法及び情報処理装置

Country Status (1)

Country Link
JP (1) JP2013191119A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190030566A (ko) * 2017-09-14 2019-03-22 인하대학교 산학협력단 재현율 기반의 특허 검색 엔진 평가 시스템 및 그 방법
KR102008387B1 (ko) * 2018-04-30 2019-08-07 인하대학교 산학협력단 비재현율 기반의 특허 검색 엔진 평가 시스템 및 그 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190030566A (ko) * 2017-09-14 2019-03-22 인하대학교 산학협력단 재현율 기반의 특허 검색 엔진 평가 시스템 및 그 방법
KR102008386B1 (ko) 2017-09-14 2019-08-08 인하대학교 산학협력단 재현율 기반의 특허 검색 엔진 평가 시스템 및 그 방법
KR102008387B1 (ko) * 2018-04-30 2019-08-07 인하대학교 산학협력단 비재현율 기반의 특허 검색 엔진 평가 시스템 및 그 방법

Similar Documents

Publication Publication Date Title
US10268766B2 (en) Systems and methods for computation of a semantic representation
JP5638616B2 (ja) 情報検索方法およびシステム
JP6638480B2 (ja) 類似文書検索プログラム、類似文書検索装置、及び類似文書検索方法
CN110929038B (zh) 基于知识图谱的实体链接方法、装置、设备和存储介质
JP3225912B2 (ja) 情報検索装置、方法及び記録媒体
WO2016180270A1 (zh) 网页分类方法和装置、计算设备以及机器可读存储介质
WO2019223552A1 (zh) 文章推荐方法、装置、计算机设备及存储介质
JP2015506515A (ja) タグをドキュメントに自動的に追加するための方法、装置およびコンピュータ記憶媒体
CN109241243B (zh) 候选文档排序方法及装置
JP2013196358A (ja) 検索支援装置および検索支援方法
JP5497105B2 (ja) 文書検索装置および方法
JP2008152641A (ja) 類似例文検索装置
JP5355483B2 (ja) 略語完全語復元装置とその方法と、プログラム
JP2012008899A (ja) 検索クエリ推薦方法、検索クエリ推薦装置及び検索クエリ推薦プログラム
KR20120115005A (ko) 효율적으로 질의를 처리하는 방법 및 장치
JP2013191119A (ja) 検索式生成のためのプログラム、情報処理方法及び情報処理装置
JP5179564B2 (ja) クエリセグメント位置決定装置
JP6426074B2 (ja) 関連文書検索装置、モデル作成装置、これらの方法及びプログラム
JP6495206B2 (ja) 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム
JP2020071678A (ja) 情報処理装置、制御方法、プログラム
JP5585489B2 (ja) 検索支援装置、プログラム及び方法
JP6173958B2 (ja) 複数のハッシュテーブルを用いて検索するプログラム、装置及び方法
KR20210146832A (ko) 토픽 키워드의 추출 장치 및 방법
JP6634001B2 (ja) テキスト要約装置、方法、及びプログラム
JP5458640B2 (ja) 規則処理方法及び装置