JP2018005758A - 文献検索装置、文献検索方法およびコンピュータプログラム - Google Patents

文献検索装置、文献検索方法およびコンピュータプログラム Download PDF

Info

Publication number
JP2018005758A
JP2018005758A JP2016134961A JP2016134961A JP2018005758A JP 2018005758 A JP2018005758 A JP 2018005758A JP 2016134961 A JP2016134961 A JP 2016134961A JP 2016134961 A JP2016134961 A JP 2016134961A JP 2018005758 A JP2018005758 A JP 2018005758A
Authority
JP
Japan
Prior art keywords
document
extracted
documents
noise
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016134961A
Other languages
English (en)
Other versions
JP6707410B2 (ja
Inventor
高野 誠司
Seiji Takano
誠司 高野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2016134961A priority Critical patent/JP6707410B2/ja
Publication of JP2018005758A publication Critical patent/JP2018005758A/ja
Application granted granted Critical
Publication of JP6707410B2 publication Critical patent/JP6707410B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文献検索におけるノイズや漏れを効率的に把握できるよう支援する。
【解決手段】文献検索装置10は、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件をユーザ端末16から取得する。文献検索装置10は、文献DB12に格納された複数の文献の中から上記条件を満たす文献を抽出する。文献検索装置10は、抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、複数の抽出文献に含まれないが複数の抽出文献との関連性が高いと見込まれる漏れ文献と、複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれるノイズ文献の少なくとも一方を検出する。文献検索装置10は、漏れ文献またはノイズ文献に関する情報をユーザ端末16へ提供する。
【選択図】図1

Description

この発明は、データ処理技術に関し、特に文献検索の技術に関する。
本出願人は、特許文献の検索を支援する技術を提案している(例えば特許文献1、特許文献2参照)。
特開2005−50175号広報 特開2009−110541号広報
目的の特許文献を抽出するための特許検索では、抽出された特許文献群の中に目的の特許文献に該当しない言わばノイズの特許文献が混ざることがある。また、目的の特許文献の一部が抽出されずに漏れてしまうこともある。これまで特許検索の結果からノイズや漏れの存在を把握するためには、抽出された特許文献群をユーザが読み込むことが必要であり、また、ユーザの知見が必要であった。すなわち、特許検索結果からノイズや漏れの存在を把握することは容易ではなかった。
本発明は、こうした課題に鑑みてなされたものであり、主たる目的は、文献検索におけるノイズや漏れを効率的に把握できるよう支援する技術を提供することである。
上記課題を解決するために、本発明のある態様の文献検索装置は、ユーザから入力された条件であって、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件を取得する取得部と、所定の記憶部に格納された複数の文献の中から、取得部により取得された条件を満たす文献を複数抽出する検索部と、検索部により抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、複数の抽出文献に含まれないが複数の抽出文献との関連性が高いと見込まれる文献である漏れ文献と、複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれる文献であるノイズ文献の少なくとも一方を検出する検出部と、検出部により検出された漏れ文献またはノイズ文献に関する情報をユーザへ提示する出力部と、を備える。
本発明の別の態様は、文献検索方法である。この方法は、ユーザから入力された条件であって、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件を取得するステップと、所定の記憶部に格納された複数の文献の中から、取得するステップで取得された条件を満たす文献を複数抽出するステップと、抽出するステップで抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、複数の抽出文献に含まれないが複数の抽出文献との関連性が高いと見込まれる文献である漏れ文献と、複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれる文献であるノイズ文献の少なくとも一方を検出するステップと、検出するステップで検出された漏れ文献またはノイズ文献に関する情報をユーザへ提示するステップと、をコンピュータが実行する。
なお、以上の構成要素の任意の組合せ、本発明の表現をシステム、コンピュータプログラム、コンピュータプログラムを格納した記録媒体などの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、文献検索におけるノイズや漏れを効率的に把握できるよう支援できる。
実施例の情報システムの構成を示す図である。 図1の文献検索装置の機能構成を示すブロック図である。 抽出特許における引用関係の例を示す図である。 文献検索装置が提供する検索画面の例を示す図である。 文献検索装置が提供する検索画面の例を示す図である。 文献検索装置が提供する引用マップの例を示す図である。 文献検索装置の動作を示すフローチャートである。 変形例の文献検索装置が提供する引用マップの例を示す図である。
本発明の実施例を説明する前にまず概要を説明する。
実施例の文献検索装置は、検索により抽出された特許群の引用情報および被引用情報に基づいて特許検索におけるノイズと漏れを予測する特徴と、検索により抽出された特許群を母集団とした引用マップを表示する特徴を備える。
特徴1.特許検索におけるノイズと漏れの予測:
特許に関する各種調査において、特許文献を格納したデータベースをユーザが与えた検索条件にて検索し、目的とする特許文献を抽出することがある。ユーザが与えた検索条件(検索式)が適切でない場合、本来抽出されるべき目的の特許文献が十分に抽出されず、すなわち検索の漏れが発生することがある。また、抽出された特許文献に、目的とする特許文献に該当しないノイズの特許文献が含まれることもある。
ノイズの割合については、粗い精度であれば、検索結果一覧を表示し、技術分類コードや発明の名称等に基づいてある程度判断することができる。しかし、ノイズの割合を高精度で把握するためには、抽出された文献をユーザが読み込む必要がある。また、漏れの割合については、既知の特許文献に関するユーザの知見があればその既知の特許文献が抽出されたか否かによりある程度判断することができるが、その知見がなければ判断することは困難である。このように、特許検索結果におけるノイズと漏れの割合を判断するためには、ユーザによる抽出文献の読み込みや、ユーザの知見が必要であり、ノイズと漏れの割合を効率的に判断することは容易ではなかった。
そこで、実施例の文献検索装置は、検索により抽出された文献と他の文献との引用関係に基づいて、文献検索における漏れとノイズの候補を検出し、検出した漏れとノイズに関する情報(比率等)をユーザへ提示する。文献検索における漏れとノイズに関する情報をユーザへ提示することで、実際にユーザが抽出文献を読み込む前に、文献抽出の精度を確認でき、また、検索条件の妥当性を判断しやすくなる。
特徴2.特許検索結果を母集団とした引用マップの表示:
通常、特許検索結果は、複数の特許文献が表形式で一覧表示されることが多い。実施例の文献検索装置は、検索により抽出された複数の特許文献と他の文献との引用関係を示す引用マップを用いて特許検索結果をユーザへ提示する。引用マップは、検索により抽出された複数の特許文献を示す複数のオブジェクトを、引用関係に基づいて関連づけた態様で配置した画像である。これにより、検索により抽出された複数の特許文献の関係をユーザが直観的に把握できるように支援する。
なお、実施例の文献検索装置の構成は、特許文献の検索に限らず、実用新案・意匠・商標を含む各種産業財産権に関する文献の検索に適用可能である。また、実施例の文献検索装置の構成は、産業財産権に関する文献の検索に限られず、他の文献との間で引用関係が結ばれうる文献(例えば学術論文、学位請求論文、標準化技術を策定するための提案技術文書である寄書及び書籍(書籍内に記載されている参考文献が引用文献に相当)、各種技術文献等)の検索に広く適用可能である。この引用関係は、文献の出願人や著者により指定されるかもしれないし、文献の審査・審判の過程(拒絶理由通知書等)で指定されるかもしれない。以下の実施例では、特許文献(公開特許公報および特許掲載公報)の検索を例として説明する。
ここで実施例における「抽出特許」「必要特許」、「漏れ特許」、「ノイズ特許」について説明する。抽出特許は、データベース等に格納された複数の特許文献の中から、ユーザが指定した検索条件に基づく検索処理により抽出された特許文献である。必要特許は、複数の抽出特許のうち少なくとも1つを引用する特許文献であり、かつ、複数の抽出特許のうち少なくとも1つにより引用される特許文献である。必要特許は、ユーザの検索目的に合致すると見込まれる特許文献であり、すなわち本来抽出されるべき特許文献と言える。必要特許は、抽出特許に含まれる特許文献と、抽出特許には含まれない特許文献の両方を含みうる。
漏れ特許は、必要特許のうち抽出特許に含まれないものである。すなわち、漏れ特許は、抽出特許には含まれないが、抽出特許との関連性が高いと見込まれる特許文献である。言い換えれば、漏れ特許は、ユーザの検索目的に合致すると見込まれる特許文献であるが、ユーザの検索条件では抽出されなかった特許文献である。
ノイズ特許は、複数の抽出特許の1つであるが、抽出特許に含まれない特許文献である非抽出特許のみを引用する特許文献であるか、非抽出特許のみにより引用される特許文献である。言い換えれば、ノイズ特許は、引用関係を有するものの、複数の抽出特許のうちどの抽出特許からも引用されない特許文献であり、且つ、複数の抽出特許のうちどの抽出特許も引用しない特許文献である。さらに言い換えれば、ノイズ特許は、非抽出特許との関連性が高い(非抽出特許と関連性が高く、他の抽出特許との関連性が低いとも言える)と見込まれる特許文献である。さらに言い換えれば、ノイズ特許は、ユーザの検索条件で抽出された特許文献であるが、ユーザの検索目的には不一致の(すなわち本来は抽出されるべきではない)特許文献である。上記でノイズ特許は、非抽出特許のみを引用する特許文献であるか、非抽出特許のみにより引用される特許文献であるとしたが、ノイズ特許は、非抽出特許のみを引用する特許文献であり、且つ、非抽出特許のみにより引用される特許文献であってもよい。なお、(抽出特許とも、非抽出特許とも)引用関係のない抽出特許の特許文献は、通常、ノイズ特許として扱わないが、ノイズ特許として取り扱う構成であってもよい。また、(抽出特許とも、非抽出特許とも)引用関係のない非抽出特許の特許文献は、漏れ特許として扱わないが、漏れ特許として取り扱う構成であってもよい。
図1は、実施例の情報システム100の構成を示す。情報システム100は、文献検索装置10、文献DB12、ユーザ端末16を備える。文献検索装置10は、特許文献の検索サービスをユーザへ提供する情報処理装置である。文献検索装置10は、ウェブサーバとアプリケーションサーバが連携することにより実現されてよく、特許文献を検索するウェブサービスをユーザ端末16へ提供してもよい。
文献DB12は、複数の特許文献のデータを記憶するデータベースサーバである。特許文献のデータは、願書、明細書、図面、要約書の本体データを含む。さらに、出願日、審査ステータス、引用文献等、特許文献に関する各種属性情報を含む。文献検索装置10と文献DB12は、LANやイントラネット等の通信網14を介して接続される。なお文献DB12は、或る特許文献に対して引用された引用文献に関する引用種別を示す情報を保持する。引用種別は、引用関係を設定した主体の種類および引用タイミングの種類を含み、例えば、出願人による引用か、審査時の引用か、審判時の引用か、拒絶理由通知の引用か、拒絶査定の引用か、等を示す情報を含む。
ユーザ端末16は、特許文献の検索を行うべきユーザにより操作される情報端末である。ユーザ端末16と文献検索装置10は、LANやWAN、インターネット等の通信網18を介して接続される。ユーザ端末16は、PC、スマートフォン、タブレット端末であってもよい。ユーザ端末16には、ウェブブラウザがインストールされてよく、ユーザは、ウェブブラウザを起動して、文献検索装置10が提供するウェブサイトへアクセスし、特許文献の検索サービスを利用してもよい。
図2は、図1の文献検索装置10の機能構成を示すブロック図である。文献検索装置10は、制御部20、記憶部22、通信部24を備える。制御部20は、特許文献の検索と引用マップの表示を実現するための各種データ処理を実行する。記憶部22は、制御部20により参照または更新されるデータを記憶する記憶領域である。通信部24は、所定の通信プロトコルにしたがって外部装置と通信する。制御部20は、通信部24を介して文献DB12、ユーザ端末16とデータを送受する。
本明細書のブロック図において示される各ブロックは、ハードウェア的には、コンピュータのCPU・メモリをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組合せによっていろいろなかたちで実現できることは、当業者には理解されるところである。
例えば、制御部20の各ブロックの機能はコンピュータプログラムとして実装され、そのコンピュータプログラムが文献検索装置10のストレージにインストールされてもよい。そして文献検索装置10のCPUが、そのコンピュータプログラムをメインメモリへ読み出して実行することにより制御部20の各ブロックの機能が発揮されてもよい。また、記憶部22は、文献検索装置10のメインメモリやストレージ(HDD、SSD等)により実現されてもよい。
制御部20は、要求取得部26、検索部28、検出部30、検索結果生成部36、検索結果提供部38、引用マップ生成部40、引用マップ提供部42を含む。
要求取得部26は、ユーザ端末16から送信された検索要求であって、ユーザ端末16でユーザが入力した検索条件を含む検索要求を取得する。また、要求取得部26は、検索結果としての複数の特許文献に関する引用マップの提供を要求する引用マップ提供要求をユーザ端末16から取得する。
検索条件は、文献DB12に格納された複数の特許文献の中から、ユーザの検索目的に合致する特定の特許文献を抽出するための条件である。検索条件は、複数の検索項目(例えば特許請求の範囲が含むべき文字列や、公報全文が含むべき文字列等)がAND条件またはOR条件で組み合わされた検索式であってもよい。また、検索条件は、必要特許の検出条件とノイズ特許の検出条件を含む。
必要特許の検出条件は、漏れ特許の検出条件とも言え、ユーザにより指定された引用数と被引用数を含む。また、必要特許の検出条件は、第1の特許文献と第2の特許文献の間に直接的または間接的な引用関係が結ばれる場合の、第1の特許文献から第2の特許文献に至るまでの多段引用の段数である「世代数」を含む。世代数は、或る文献が他の文献を引用する方向での世代数を示す引用世代数と、或る文献が他の文献により引用される方向での世代数を示す被引用世代数を含む。
例えば、特許D→特許B→特許A→特許C→特許Eという引用関係(矢印の先が引用する側)を想定する。引用世代数が1かつ被引用世代数が1の場合、特許Aが直接引用する特許Bまでを引用方向の範囲とし、かつ、特許Aを直接引用する特許Cまでを被引用方向の範囲として抽出特許の有無を判定し、特許Aが必要特許か否かを判定する。また、引用世代数が2かつ被引用世代数が2の場合、特許Aが直接引用する特許B、さらに特許Bが直接引用する特許Dまでを引用方向の範囲とし、かつ、特許Aを直接引用する特許C、さらに特許Cを直接引用する特許Eまでを被引用方向の範囲として抽出特許の有無を判定し、特許Aが必要特許か否かが判定される。
ノイズ特許の検出条件は、ユーザにより指定された引用数と被引用数とを含む。また、ノイズ特許の検出条件は、第1の特許文献と第2の特許文献の間に直接的または間接的な引用関係が結ばれる場合の、第1の特許文献から第2の特許文献に至るまでの世代数(引用世代数および被引用世代数)を含む。必要特許の検出条件としての引用数・被引用数・引用世代数・被引用世代数と、ノイズ特許の検出条件としての引用数・被引用数・引用世代数・被引用世代数は、互いに異なる値が指定されてよい。
検索部28は、要求取得部26により検索要求が取得された場合に、文献DB12に格納された複数の特許文献の中から、検索要求に含まれる検索条件を満たす特許文献を複数抽出する。例えば、検索部28は、検索条件が示す1つ以上の検索項目のキーワードを設定したクエリ電文を文献DB12へ送信してもよく、クエリ電文への応答として、文献DB12は、検索条件を満たす特許文献データを文献検索装置10へ送信してもよい。
検索部28は、検索条件を満たす特許文献のデータとして、少なくとも当該特許文献と他の文献との引用関係を示すデータを文献DB12から取得する。引用関係を示すデータは、当該特許文献が引用した他の文献の識別情報と引用種別を含み、当該特許文献が引用された他の文献の識別情報と引用種別をさらに含む。他の文献の識別情報は、例えば、他の特許文献の出願番号であってもよく、文献名称やURLであってもよい。実施例の検索部28が取得する特許文献のデータは、出願人(特許文献以外であれば著者)を示すデータと、日付(例えば出願日、優先日、発表日、公開日等)に関するデータを含む。
検出部30は、検索部28により抽出された複数の抽出特許のそれぞれと他の特許文献との引用関係(すなわち文献DB12から提供された特許文献データが示す引用関係)に基づいて、漏れ特許とノイズ特許の少なくとも一方を検出する。引用関係は、或る特許文献が他の特許文献を引用する関係と、或る特許文献が他の特許文献により引用される関係の両方を含む。引用関係は、特許文献の出願人により設定されてもよく、また、特許文献の審査または審判の過程で設定されてもよい。実施例の検出部30は、漏れ特許とノイズ特許の両方を検出する。検出部30は、必要文献検出部31、漏れ検出部32、ノイズ検出部34を含む。
必要文献検出部31および漏れ検出部32は、ユーザが指定した検索条件での検索結果に対して、本来検索されるべき特許文献の漏れの存在を検出する。具体的には、必要文献検出部31は、複数の抽出特許のうち少なくとも1つを引用する特許文献であり、かつ、複数の抽出特許のうち少なくとも1つにより引用される特許文献を必要特許として検出する。漏れ検出部32は、必要文献検出部31により検出された必要特許のうち、複数の抽出特許に含まれない必要特許を漏れ特許として検出する。
必要文献検出部31は、検索条件に含まれる必要特許検出条件にしたがって必要特許を検出する。具体的には、必要文献検出部31は、次の条件1と条件2の両方を満たす特許文献を必要特許として検出する。条件1は、必要特許検出条件で指定された引用世代数の範囲内で、複数の抽出特許のうち必要特許検出条件で指定された引用数以上の抽出特許を直接的または間接的に引用する特許文献に該当することである。条件2は、必要特許検出条件で指定された被引用世代数の範囲内で、複数の抽出特許のうち必要特許検出条件で指定された被引用数以上の抽出特許により直接的または間接的に引用される特許文献に該当することである。
ノイズ検出部34は、ユーザが指定した検索条件での検索結果における、本来検索されるべきでないノイズの存在を検出する。具体的には、ノイズ検出部34は、ノイズ検出処理として、或る抽出特許が引用する非抽出特許の数が所定数以上であって引用する(他の)抽出特許がなく、かつ、上記或る抽出特許が引用される非抽出特許の数が所定数以上であって引用される(他の)抽出特許がない場合に、上記或る抽出特許をノイズ特許として検出する。ノイズ検出部34は、各抽出特許に対してノイズ検出処理を実行する。
ノイズ検出部34は、検索条件に含まれるノイズ特許検出条件にしたがってノイズ特許を検出する。具体的には、ノイズ検出部34は、或る抽出特許が次の条件1、条件2、条件3のいずれもを満たす場合に、当該或る抽出特許をノイズ特許として検出する。条件1は、或る抽出特許が、ノイズ特許検出条件で指定された引用世代数の範囲内で直接的または間接的に引用する非抽出特許の数がノイズ特許検出条件で指定された引用数以上であることである。
条件2は、或る抽出特許が、ノイズ特許検出条件で指定された被引用世代数の範囲内で直接的または間接的に引用される非抽出特許の数がノイズ特許検出条件で指定された被引用数以上であることである。言い換えれば、条件2は、ノイズ特許検出条件で指定された被引用世代数の範囲内で或る抽出特許を引用する非抽出特許の数が、ノイズ特許検出条件で指定された被引用数以上であることである。条件3は、或る抽出特許が、他の抽出特許のいずれも引用せず、他の抽出特許のいずれからも引用されないことである。
変形例として、ノイズ検出部34は、或る抽出特許が引用する非抽出特許の数が所定数以上であり、および/または、上記或る抽出特許が引用される非抽出特許の数が所定数以上である場合に、上記或る抽出特許をノイズ特許として検出してもよい。具体的には、ノイズ検出部34は、或る抽出特許が上記条件1および/または上記条件2を満たす場合に、当該或る抽出特許をノイズ特許として検出してもよい。また、ノイズ検出部34は、或る抽出特許が上記条件1と上記条件2の少なくとも一方を満たす場合に、当該或る抽出特許をノイズ特許として検出してもよい。この変形例においても、非抽出特許との関連性が高い抽出特許をノイズ特許として検出できる。
図3は、抽出特許における引用関係の例を示す。同図は、ユーザの検索条件によって抽出された7つの特許文献A、B、C、D、E、F、Yを示している。同図の引用欄は、抽出特許の出願人により指定され、または抽出特許の審査・審判の過程で引用された他の文献(例えば特許文献や非特許文献)を示している。また、同図の被引用欄は、出願人により、または審査・審判の過程で抽出特許が引用された他の文献を示している。
ここでは、必要特許検出条件として引用数=1、被引用数=1、引用世代数=1、被引用世代数=1が指定され、ノイズ特許検出条件として引用数=1、被引用数=1、引用世代数=1、被引用世代数=1が指定されたこととする。図3の例では、特許文献BとXが必要特許として検出される。そのうち特許文献Xは、抽出特許に含まれないため、さらに漏れ特許としても検出される。また、特許文献Yは、1つ以上の非抽出特許を引用するが他の抽出特許を引用せず、かつ、1つ以上の非抽出特許により引用されるが他の抽出特許からは引用されないものであるため、ノイズ特許として検出される。
なお、仮に特許文献Cが検索で抽出されなかったとすると、特許文献Bは、1世代以内の抽出特許から引用されていないことになり、必要特許から外れる。ただし、必要特許検出条件の被引用世代数が2以上に設定された場合、特許文献Bは、2世代先の特許文献Cから引用されることになるため、特許文献Cが抽出されなくても必要特許として検出される。また、仮に必要特許抽出条件の引用世代数が2以上に設定された場合、特許文献Dは、2世代先の特許文献Bを引用していることになるため、特許文献Dは必要特許として検出される。このように、引用世代数および被引用世代数の設定値が大きくなるほど、必要特許の検出範囲が広がる。
図2に戻り、検索結果生成部36は、必要文献検出部31と漏れ検出部32により検出された必要特許および/または漏れ特許に関する情報と、ノイズ検出部34により検出されたノイズ特許に関する情報を含む検索結果情報を生成する。実施例の検索結果生成部36は、(1)必要特許が抽出特許に含まれるか否かに関する比率を示す情報を生成し、さらに、(2)抽出特許におけるノイズ特許の比率を示す情報を生成する。なお検索結果情報は、抽出特許の件数を含む。
例えば上記(1)として、検索結果生成部36は、抽出特許に含まれる必要特許の比率(=抽出特許に含まれる必要特許数/必要特許総数)(以下「必要文献内在率」とも呼ぶ。)を算出してもよい。また、検索結果生成部36は、漏れ特許と必要特許の比率を示す情報を生成してもよい。例えば、抽出特許に含まれない必要特許の比率(=抽出特許に含まれない必要特許数/必要特許総数)を算出してもよい。ここで抽出特許に含まれない必要特許数は漏れ特許数と言える。また、必要特許の内外比率(=抽出特許に含まれる必要特許数/抽出特許に含まれない必要特許数)を算出してもよい。
また、上記(2)として、検索結果生成部36は、抽出特許に占めるノイズ特許の比率(=ノイズ特許総数/抽出特許総数)(以下「ノイズ文献率」とも呼ぶ。)を算出してもよい。また、抽出特許に占めるノイズ特許以外の比率(=(抽出特許総数−ノイズ特許総数)/抽出特許総数)を算出してもよい。
検索結果提供部38は、検索結果生成部36により生成された検索結果情報であり、漏れ特許(または必要特許)と、ノイズ特許の少なくとも一方に関する情報を含む検索結果情報をユーザ端末16へ提供して表示させる。実施例の検索結果提供部38は、抽出特許総数、必要文献内在率、ノイズ文献率を含む検索結果情報をユーザ端末16へ送信する。変形例として、これらの情報に代えて、またはこれらの情報ともに、検索結果提供部38は、上記他の種類の比率情報をユーザ端末16へ送信してもよい。
図4は、文献検索装置10が提供する検索画面の例を示す。ユーザは、ユーザ端末16を操作して文献検索装置10へアクセスし、文献検索装置10は、検索画面50をユーザ端末16に表示させる。ユーザは、検索画面50に対して、検索項目・キーワード・論理式を検索条件として入力する。ユーザが検索ボタン52を押下すると、ユーザ端末16は、検索画面50に入力された検索条件を含む検索要求を文献検索装置10へ送信する。
図5も、文献検索装置10が提供する検索画面の例を示す。図5の検索画面50は、検索結果情報64を含み、検索結果画面と言える。検索結果生成部36は、第1結果欄54に抽出特許数を設定し、第2結果欄56に必要文献内在率を設定し、第3結果欄58にノイズ文献率を設定する。図5の検索結果情報64が示す値は、図3の抽出結果に基づく値である。すなわち、抽出特許数は7件、必要文献内在率は50%(=1/2)、ノイズ文献率は14%(=1/7)となる。
図5の検索画面50で一覧表示ボタン60が選択されると、文献検索装置10の検索結果提供部38は、7件の抽出特許の一覧を示す抽出特許リストをユーザ端末16へ送信して表示させる。なお、検索結果提供部38は、漏れ特許および/またはノイズ特許の一覧を示すリストをユーザ端末16へさらに送信してもよい。また、抽出特許と漏れ特許を含む特許リストをユーザ端末16へ送信して表示させてもよく、そのリストにおいて漏れ特許とノイズ特許にはその種類を示すマークを付してもよい。さらにまた、検索結果提供部38は、ユーザが確認すべき特許文献の情報として、抽出特許に漏れ特許を加える一方、抽出特許からノイズ特許を除いた結果を示す特許文献一覧情報(リスト)をユーザ端末16へ提供してもよい。
図5の検索画面50で引用マップ表示ボタン62が選択されると、ユーザ端末16は、引用マップ提供要求を文献検索装置10へ送信し、文献検索装置10は、7件の抽出特許に関する引用マップ(後述)をユーザ端末16へ送信して表示させる。次に、引用マップをユーザへ提示するための文献検索装置10の構成を説明する。
図2に戻り、引用マップ生成部40は、要求取得部26により引用マップ提供要求が取得された場合に、検索部28により抽出された複数の抽出特許を示す複数のオブジェクトを配置(言い換えれば顕示)した画像である引用マップを生成する。オブジェクトは、ウェブページの構成要素であってよく、例えばボックスまたは枠付きボックスであってもよい。なお、文献検索装置10は、或るユーザ端末16からの検索要求に基づく検索部28による検索結果を、当該ユーザ端末16のセッションIDと対応づけて保持してもよい。引用マップ生成部40は、引用マップ提供要求を送信したユーザ端末16のセッションIDを特定し、特定したセッションIDに対応づけて予め保持された検索結果(特許文献データ)を使用して引用マップを生成してもよい。
引用マップ生成部40は、複数の抽出特許のうち第1の抽出特許と第2の抽出特許との間に引用関係(すなわち引用する関係または引用される関係)が結ばれている場合に、第1の抽出特許を示すオブジェクトと第2の抽出特許を示すオブジェクトとを関連づけて配置した引用マップを生成する。実施例の引用マップ生成部40は、複数のオブジェクトを関連づける場合に、これらのオブジェクトを矢印線で結ぶ。引用マップ提供部42は、引用マップ生成部40により生成された引用マップのデータをユーザ端末16へ送信して表示させる。
図6は、文献検索装置10が提供する引用マップの例を示す。同図は、図3に示した文献間の引用関係を示す二次元の引用マップを示している。引用マップ生成部40は、引用マップ70上に、図3で示した7件の抽出特許に対応する7つの文献オブジェクト76(A〜F、Y)を配置する。さらに引用マップ生成部40は、引用マップ70上に、抽出特許を引用する他の特許文献(抽出特許に含まれない特許文献)および抽出特許により引用される他の特許文献に対応する5つの文献オブジェクト76(G〜J、X)を配置する。引用マップ70上にオブジェクトが配置される対象となる特許文献(抽出特許および上記他の特許文献)を総称して以下「対象文献」と呼ぶ。なお、実際の文献オブジェクト76は、出願番号等、特許文献の識別情報を含む。
引用マップ70では、対象文献間の引用関係が矢印線78により示される。矢印線78の始点(元)は引用される対象文献を示し、矢印線78の終点(先)は引用する対象文献を示す。すなわち、引用マップ生成部40は、第1の特許文献が第2の特許文献を引用する場合、第1の特許文献を示すオブジェクトを矢印線78の始点に配置し、第2の特許文献を示すオブジェクトを矢印線78の終点に配置する。
例えば、引用マップ生成部40は、漏れ特許を示すオブジェクトと、その漏れ特許と引用関係が結ばれている抽出特許を示すオブジェクトとを、矢印線でつなげることにより関連づけて引用マップ70に配置する。また引用マップ生成部40は、ノイズ特許を示すオブジェクトと、そのノイズ特許と引用関係が結ばれている対象文献(具体的には抽出特許に含まれない他の特許文献)を示すオブジェクトとを、矢印線でつなげることにより関連づけて引用マップ70に配置する。図6で示すように、本実施例の引用マップ70は、1つの特許文献を起点として生成するものではなく、検索により抽出された複数の特許文献のそれぞれが有する引用関係を示すものであり、複数の特許文献のオブジェクトがネットワーク状に関連づけられる。
引用マップ生成部40は、複数の対象文献のそれぞれに対応付けられた日付(出願日や優先日等)に応じて、複数の対象文献を示す複数のオブジェクト(A〜J、X、Y)を引用マップ70上(図6の文献欄74)に時系列に配置する。実施例の引用マップ生成部40は、各対象文献に対応付けられた日付に応じて、各対象文献のオブジェクトを配置すべき引用マップ70の横軸(X軸)上の位置を決定する。例えば、出願日が早い対象文献のオブジェクトほど左方の位置を割り当て、言い換えれば、小さいX座標値を設定する。また、出願日が遅い対象文献のオブジェクトほど右方の位置を割り当て、言い換えれば、大きいX座標値を設定する。なお、引用マップ70におけるオブジェクトの配置の基準となる日付の種類(出願日、優先日等)はユーザにより選択可能である。
また、引用マップ生成部40は、複数の対象文献のそれぞれに対応付けられた出願人または著者に応じて、各対象文献のオブジェクトを配置すべき引用マップ70の縦軸(Y軸)上の位置を決定する。引用マップ70の縦軸上(出願人欄72)には、複数の出願人に対応する複数のレーンが設けられている。引用マップ生成部40は、各対象文献の出願人に合致する文献欄74のレーンに各対象文献を配置する。
なお、Y軸上の出願人の表示順序は、対象の出願人の表示されているオブジェクトと、このオブジェクトと直接に引用関係を有する他の出願人の表示されているオブジェクトとは、この対象の出願人のレーンとこの他の出願人のレーンとが隣接して構成される場合には、それぞれのレーンにて配置されることになり、より見易い表示態様となっている。ここで、このような表示態様によらず、出願人名の昇順若しくは降順に出願人のレーンを配置構成することもでき、更には、ユーザの指定によって出願人のレーンの順番を変更できる構成であってもよい。また、図6の表示では、一つのレーンに一の出願人を表示しているが、複数の出願人のオブジェクトを一つのレーンに表示してもよく、例えば、表示オブジェクトが所定数以下の出願人についてはまとめて一つのレーンに表示してもよく、また、出願人同士に法人上の関係がある場合(親会社と子会社の関係等)にも同じレーンに表示してもよい。勿論、ユーザの指定を受け、指定を受けた特定の出願人のオブジェクトを一つのレーンに表示してもよい。
また、引用マップ生成部40は、必要特許を示すオブジェクト、漏れ特許を示すオブジェクト、ノイズ特許を示すオブジェクト、抽出特許以外の対象文献を示すオブジェクトのそれぞれを互いに異なる態様で引用マップ70に配置(言い換えれば顕示)する。例えば、引用マップ生成部40は、ノイズ特許を示すオブジェクトを、ノイズ特許ではない抽出特許を示すオブジェクトとは異なる態様で引用マップ70に配置する。
図6の引用マップ70では、必要特許(文献B、文献X)を示すオブジェクトは太線のボックスで示されている。また、漏れ特許(文献X)を示すオブジェクトは斜線の網掛けで示されている。また、ノイズ特許(文献Y)を示すオブジェクトは横線の網掛けで示されている。また、抽出特許以外の対象文献を示すオブジェクトは破線のボックスで示されている。なお、必要特許を示すオブジェクト、漏れ特許を示すオブジェクト、ノイズ特許を示すオブジェクト、抽出特許以外の対象文献を示すオブジェクトのそれぞれに、種類ごとの異なるマークを付加してもよく、種類ごとの異なる色を設定してもよい。
図6の引用マップ70では、7件の抽出特許を抽出文献群80として示し、ユーザの本来の検索目的に合致する特許を目的文献群82として示している。目的文献群82は、抽出特許に漏れ特許を加える一方、ノイズ特許を除外したものである。引用マップ生成部40は、ユーザの指示に応じて、抽出文献群80のみを引用マップ70上に表示させてもよく、目的文献群82のみを引用マップ70上に表示させてもよい。これにより、ユーザが確認すべき文献数を低減することができる。
また、引用マップ生成部40は、ユーザ端末16から送信された引用マップ生成処理のモード切替指示に応じて、引用マップ生成処理のモードを、第1モード、第2モード、第3モードの間で切り替えてもよい。第1モードは、複数の抽出特許を示すオブジェクト(すなわち抽出文献群80)のみを配置した引用マップ70を生成するモードであってもよい。第2モードは、複数の抽出特許を示すオブジェクトに加えて、漏れ特許を示すオブジェクトを配置した引用マップ70を生成するモードであってもよい。
第3モードは、複数の抽出特許には含まれないが、少なくとも1つの抽出特許を引用する特許文献、または、少なくとも1つの抽出特許により引用される特許文献を示すオブジェクトを、複数の抽出特許を示すオブジェクトに加えて配置した引用マップ70を生成するモードであってもよい。第3モードは、複数の抽出特許を示すオブジェクトに加えて、漏れ特許を示すオブジェクトと、抽出特許ではなく漏れ特許でもないが抽出特許と引用関係がある対象文献を示すオブジェクト(図6のG〜J)を配置した引用マップ70を生成するモードである。すなわち、図6の引用マップ70は、第3モードで生成された引用マップである。
また、ユーザ端末16において引用マップ上の特定の特許文献のオブジェクトに対する所定の選択操作が入力された場合、選択された特許文献の詳細情報をユーザ端末16に表示させる。オブジェクトの選択操作は、オブジェクトに対するクリック操作でもよく、マウスカーソルをオブジェクトの上に置くマウスオーバー操作でもよい。ユーザ端末16は、引用マップ上で選択された特許文献の識別情報(出願番号等)を文献検索装置10へ送信し、文献検索装置10は、その特許文献のデータをユーザ端末16へ送信してもよい。ユーザ端末16と文献検索装置10間のこの通信は、Ajax(Asynchronous JavaScript(登録商標) + XML)通信で実現されてもよい。
文献検索装置10から提供される特許文献のデータは、公報全文でもよく、発明の名称、請求項1、要約、代表図等を含むサマリーデータでもよい。ユーザ端末16は、文献検索装置10から提供された特許文献のデータを、ウェブブラウザの新たなタブ(引用マップ表示中のタブとは異なるタブ)に表示させてもよい。また、ユーザ端末16は、ウェブブラウザの同一画面内で、引用マップと、特許文献のデータ(例えば上記サマリーデータ)とを並べて表示させてもよい。
なお、引用マップ提供部42は、引用マップ提供時に、その引用マップ上に配置された複数の特許文献のデータもユーザ端末16へ提供してもよい。この場合、引用マップを含むウェブページに組み込まれたJavascript(登録商標)プログラムをユーザ端末16のウェブブラウザが実行することにより、引用マップ上で選択された特許文献の詳細情報をウェブブラウザ画面に表示させてもよい。
以上の構成による文献検索装置10の動作を説明する。
図7は、文献検索装置10の動作を示すフローチャートである。特許文献を検索すべきユーザは、図4に示した検索画面50に検索条件を入力し、検索実行操作を入力する。ユーザ端末16は、検索画面50に入力された検索条件を含む検索要求を文献検索装置10へ送信する。要求取得部26が、ユーザ端末16から送信された検索要求を受信すると(S10のY)、検索部28は、文献DB12に記憶された複数の特許文献の中から、検索要求に含まれる検索条件を満たす特許文献を検索する(S12)。
検索部28により検索された各抽出特許のデータは他の文献との引用関係を示すデータを含む。必要文献検出部31と漏れ検出部32は、各抽出特許が有する引用関係にしたがって必要特許および漏れ特許を検出する(S14)。またノイズ検出部34は、各抽出特許が有する引用関係にしたがってノイズ特許を検出する(S16)。検索結果生成部36は、必要特許または漏れ特許の数や比率に関する値を算出するとともに、ノイズ特許の数や比率に関する値を算出し、これらの算出値を含む検索結果データを生成する(S18)。検索結果提供部38は、検索結果生成部36により生成された検索結果データをユーザ端末16へ送信する(S20)。ユーザ端末16には例えば図5の検索画面50が表示される。
このように実施例の文献検索装置10は、ユーザが指定した検索条件の妥当性を示す客観的な指標値をユーザに提示する。ユーザは、図5の検索結果情報64における必要文献内在率やノイズ文献率を確認することで、抽出文献等を読み込む前に、検索条件(検索式)の妥当性を判断しやすくなる。例えば、必要文献内在率が高く、かつ、ノイズ文献率が低ければ、検索条件の妥当性は高いと判断できる。その一方、必要文献内在率が低ければ、すなわち漏れ特許が多いことを意味し、検索条件の妥当性が低いと判断できる。また、ノイズ文献率が高ければ、検索項目を追加すべきであると判断できる。さらに実施例では、漏れ特許(必要特許)とノイズ特許の検出条件として、引用数、被引用数、世代数をユーザが指定できる。これにより、検索対象となる文献のテーマ等(例えば発明の種類や特性)に応じて、漏れ特許(必要特許)とノイズ特許の検出条件をきめ細かく指定することができる。
ユーザが、図5の検索画面50で引用マップ表示ボタン62を選択すると、ユーザ端末16は、引用マップ提供要求を文献検索装置10へ送信する。その際にユーザは、抽出特許のみをマッピング対象とするか否かを指定し、ユーザ端末16は、マッピング対象の指定を含む引用マップ提供要求を文献検索装置10へ送信する。要求取得部26が、ユーザ端末16から送信された引用マップ提供要求を受信し(S22のY)、抽出特許のみマッピング対象であれば(S24のY)、引用マップ生成部40は、抽出特許のみを配置した引用マップを生成する(S26)。例えば図6の抽出文献群80のみの引用マップを生成する。
その一方、抽出特許以外もマッピング対象であれば(S24のN)、引用マップ生成部40は、抽出特許には含まれないが抽出特許と引用関係がある特許文献を、抽出特許に加えて配置した引用マップを生成する(S28)。S28では、例えば図6の引用マップ70を生成する。引用マップ提供部42は、引用マップ生成部40により生成された引用マップのデータをユーザ端末16へ送信して表示させる(S30)。引用マップ提供要求を未受信であれば(S22のN)、S24以降の処理をスキップする。検索要求を未受信であれば(S10のN)、S12以降の処理をスキップする。
ユーザは、引用マップを確認することで、抽出特許間の引用関係を容易に把握できる。例えば、多くの特許により引用される抽出特許を基本技術特許として把握できる。また、実施例の引用マップでは必要特許、漏れ特許、ノイズ特許がそれぞれ異なる態様で表示される。これにより、ユーザは、必要特許、漏れ特許、ノイズ特許を容易に識別でき、例えば、必要特許の内在率や漏れ特許の比率、ノイズ特許の比率等を直観的に把握できる。さらに実施例の引用マップでは、横軸を出願日等の時間軸とし、縦軸を出願人とすることで、出願日や出願人等の付加的な情報をユーザが直観的に把握できるよう支援できる。
以上、本発明を実施例をもとに説明した。この実施例は例示であり、各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
第1変形例として、三次元の引用マップに関する変形例を説明する。
上記実施例では、対象文献のオブジェクトを出願人ごとに縦軸(Y軸)の異なる位置に配置したが、変形例として、対象文献のオブジェクトを出願人ごとに奥行き方向(Z軸)の異なる位置に配置してもよい。具体的には、引用マップ生成部40は、第1の対象文献と第2の対象文献間で出願人または著者が異なる場合に、第1の対象文献を示すオブジェクトと、第2の対象文献を示すオブジェクトを、奥行き方向の異なる位置に配置した三次元の引用マップ(三次元グラフとも言える)を生成してもよい。
図8は、変形例の文献検索装置10が提供する引用マップの例を示す。図8の引用マップは、図6の引用マップに対応し、また、図3に示した文献間の引用関係を示す三次元の引用マップである。ただし図8では出願人a、b、c、fのみを示し、それらの出願人ごとのXY平面を設けている。引用マップ生成部40は、対象文献の出願人ごとに引用マップ70の異なる奥行き方向(Z軸)の位置を割り当てる。例えば、引用マップ生成部40は、或る出願人の対象文献を、その出願人に割り当てたZ座標値のXY平面に配置する。図8では、出願人fのXY平面と対象文献(X)を実線で示し、出願人aのXY平面と対象文献(A、B、C)を破線で示し、出願人bのXY平面と対象文献(C、F)を一点鎖線で示し、出願人cのXY平面と対象文献(E、Y)を二点鎖線で示している。
ここで、図8では、各出願人の対象文献が、出願人毎のZ軸上の各XY平面に表示されているおり、X軸上の各出願人の表示順序は、対象の出願人の表示されているオブジェクトと、このオブジェクトと直接に引用関係を有する他の出願人の表示されているオブジェクトとは、この対象の出願人のXY平面とこの他の出願人のXY平面とが隣接して構成される場合には、それぞれのXY平面に配置されているオブジェクト間の引用関係を、より見易い表示態様にて表示することができる。ここで、このような表示態様によらず、出願人名の昇順若しくは降順にZ軸上の出願人のXY平面を配置構成することもでき、更には、ユーザの指定によってZ軸上の出願人のXY平面を配置構成することもできる。また、図8の表示では、一のXY平面に一の出願人を表示しているが、複数の出願人のオブジェクトを一のXY平面に表示してもよく、例えば、表示オブジェクトが所定数以下の出願人についてはまとめて一のXY平面に表示してもよく、また、出願人同士に法人上の関係がある場合(親会社と子会社の関係等)にも同じXY平面に表示してもよい。勿論、ユーザの指定を受け、指定を受けた特定の出願人のオブジェクトを一のXY平面に表示してもよい。
図8の引用マップ70の横方向(X軸方向)は図6と同様に時間方向であり、引用マップ生成部40は、出願日(または優先日等)が早い対象文献ほど原点側に配置する。言い換えれば、出願日(または優先日等)が遅い対象文献ほどX座標値を大きくする。また引用マップ生成部40は、出願日(または優先日等)が同じまたは近似する複数の対象文献を、引用マップ70の縦方向(Y軸方向)に並べて配置する。
引用マップ生成部40は、第1の出願人の第1の対象文献が、第2の出願人の第2の対象文献を引用している場合、第2の対象文献の文献オブジェクト76を始点とし、第1の対象文献の文献オブジェクト76を終点とする矢印線78を結ぶ。この場合、引用マップ生成部40は、第2の出願人のXY平面から第1の出願人のXY平面へ亘って矢印線78を設定する。
なお、三次元の引用マップにおいても、引用マップ生成部40は、必要特許を示すオブジェクト、漏れ特許を示すオブジェクト、ノイズ特許を示すオブジェクト、抽出特許以外の対象文献を示すオブジェクトのそれぞれを互いに異なる態様で引用マップに配置する。例えば図8では、必要特許を示すオブジェクト(B、X)には太線のボックスが設定されている。また、漏れ特許を示すオブジェクト(X)には斜線の網掛けが設定され、ノイズ特許(Y)を示すオブジェクトには横線の網掛けが設定されている。
引用マップ生成部40は、引用マップ70のZ軸がユーザから見た奥行き方向(画面の奥行き方向)になるように設定し、例えば、引用マップ70のZ軸をユーザの視線方向と並行するように設定してもよい。また引用マップ生成部40は、各出願人のXY平面に所定の透過度を設定することで、複数の出願人のXY平面をユーザから同時に確認可能にしてもよい。また引用マップ生成部40は、XY平面を表示するZ軸上の位置がユーザの操作に応じて切り替えられるように引用マップ70を設定してもよい。このような第1変形例によると、多数の対象文書が存在する場合でも、出願人ごとの対象文書(さらに必要特許、漏れ特許、ノイズ特許)の存在や個数をユーザが直観的に把握できるように支援できる。
上記第1変形例では、対象文献の出願人ごとに引用マップ70の奥行き方向(Z軸)の異なる位置を割り当てたが、対象文献の出願人ごとに引用マップ70の横軸(X軸)方向の異なる位置を割り当ててもよく、縦軸(Y軸)方向の異なる位置を割り当ててもよい。この場合、図8においてX軸、Y軸に割り当てた情報は、他の軸(例えばZ軸)方向の位置で表現されてもよい。
第2変形例として、三次元の引用マップに関する別の変形例を説明する。
引用マップ生成部40は、第1の対象文献(すなわち抽出特許、漏れ特許、もしくは抽出特許と引用関係がある他の特許)が、第2の対象文献を原出願とする分割出願であり、または、第1の対象文献が第2の対象文献を基礎出願とする優先権主張出願である場合、第1の対象文献を示すオブジェクトと第2の対象文献を示すオブジェクトを、引用マップにおける奥行き方向(Z軸上)の異なる位置に配置した三次元の引用マップ(三次元グラフとも言える)を生成してもよい。
例えば、引用マップ生成部40は、図8の引用マップ70のZ軸上の異なる位置に、(1)原出願(もしくは分割出願なし)用のXY平面、(2)子出願(言い換えれば分割1世代目)用のXY平面、(3)孫出願(言い換えれば分割2世代目)用のXY平面を配置してもよい。引用マップ生成部40は、対象文献が原出願の場合、上記(1)のXY平面上に当該対象文献のオブジェクトを配置し、対象文献が子出願の場合、上記(2)のXY平面上に当該対象文献のオブジェクトを配置してもよい。
また、引用マップ生成部40は、図8の引用マップ70のZ軸上の異なる位置に、(1)基礎出願用のXY平面、(2)優先権主張出願用のXY平面を配置してもよい。引用マップ生成部40は、対象文献が基礎出願の場合、上記(1)のXY平面上に当該対象文献のオブジェクトを配置し、対象文献が優先権主張出願の場合、上記(2)のXY平面上に当該対象文献のオブジェクトを配置してもよい。なお、第2変形例でのXY平面は、横軸を時間軸とし、縦軸を出願人軸とする図6の形式の引用マップであってもよい。
分割出願(優先権主張出願)では、他の文献との引用関係が原出願(基礎出願)と類似することが多い。分割出願(優先権主張出願)と原出願(基礎出願)を同一平面上の近傍位置に配置すると、同一平面におけるオブジェクト数が多大になり、また矢印線が入り組む結果、引用マップの可読性・判読性が低下することがある。第2変形例によると、分割出願(優先権主張出願)を示すオブジェクトと原出願(基礎出願)を示すオブジェクトを奥行き方向の異なる位置に配置することにより、同一平面上に描画されるオブジェクトおよび矢印線の個数を低減し、引用マップの可読性・判読性の低下を抑制できる。
上記第2変形例では、出願の種類(例えば原出願、分割出願、優先権主張出願)ごとに引用マップ70の奥行き方向(Z軸)の異なる位置を割り当てたが、出願の種類ごとに引用マップ70の横軸(X軸)方向の異なる位置を割り当ててもよく、縦軸(Y軸)方向の異なる位置を割り当ててもよい。この場合、図8においてX軸、Y軸に割り当てた情報は、他の軸(例えばZ軸)方向の位置で表現されてもよい。
第3変形例として、引用マップの表示態様に関する変形例を説明する。
引用マップ生成部40は、出願人が異なる複数の対象特許を示す複数のオブジェクトを引用マップの異なる縦位置に配置することに代えて、複数のオブジェクトを出願人ごとに異なる態様で配置してもよい。例えば、出願人ごとに異なる色や異なるマークを付加してもよい。また、引用マップ生成部40は、引用マップにおいて引用関係を示す矢印線を、引用種別を示す情報を付加して配置してもよく、各矢印線を引用種別ごとに異なる態様(例えば異なる色や異なる線種)に設定してもよい。引用種別は、引用関係を設定した主体の種類および引用タイミングの種類を含み、具体的には、出願人による引用、審査時の引用、審判時の引用、拒絶理由通知の引用、拒絶査定の引用等を含む。さらにまた、引用マップ生成部40は、各対象文献のオブジェクトの近傍に、各対象文献の引用数(他の対象文献を引用する個数)を示す情報と、各対象文献の被引用数(他の対象文献により引用される個数)を示す情報とを設定してもよい。
第4変形例を説明する。
既述したように、文献間の引用関係は、出願人または著者により申告されることがあり、これとともに/またはこれに代えて、審査または審判の過程(拒絶理由通知書等)で設定されることがある。実施例では言及していないが、必要文献検出部31、漏れ検出部32およびノイズ検出部34は、出願人または著者により申告された引用関係を除外し、審査および審判の過程で設定された引用関係に基づいて、必要特許、漏れ特許、ノイズ特許を検出してもよい。言い換えれば、出願人または著者により申告された引用関係を、必要特許、漏れ特許、ノイズ特許の検出に反映させず、審査および審判の過程で設定された引用関係のみを必要特許、漏れ特許、ノイズ特許の検出に反映させてもよい。出願人または著者により申告された引用関係は相対的に正確度が低く、審査および審判の過程で設定された引用関係は相対的に正確度が高い。第4変形例によると、必要特許、漏れ特許、ノイズ特許の検出の正確度を高めることができる。
なお、文献DB12が、或る特許文献に対する引用文献情報として、複数の引用文献のうち主となる引用文献(言わば主引例)を示す情報をさらに保持する場合、第4変形例の異なる態様として、必要文献検出部31、漏れ検出部32およびノイズ検出部34は、審査および審判の過程で設定された引用関係のうち主引例との引用関係に基づいて、必要特許、漏れ特許、ノイズ特許を検出してもよい。言い換えれば、主引例となった文献との引用関係のみを必要特許、漏れ特許、ノイズ特許の検出に反映させてもよい。この態様によると、必要特許、漏れ特許、ノイズ特許の検出の正確度を一層高めることができる。
第4変形例に関連する第5変形例を説明する。
上記実施例では言及していないが、引用マップ生成部40は、出願人または著者により申告された引用関係を除外し、審査および審判の過程で設定された引用関係に基づいて、対象文献を示すオブジェクトを関連づけた引用マップを生成してもよい。言い換えれば、引用マップ生成部40は、出願人または著者により申告された引用関係を反映させず、審査および審判の過程で設定された引用関係のみを反映してオブジェクト間の矢印線を設定してもよい。第5変形例によると、引用マップが示す引用関係の正確度を高め、言い換えれば、内容が実際に類似する文献のつながりを示す引用マップを生成できる。
なお、文献DB12が、或る特許文献に対する引用文献情報として、複数の引用文献のうち主となる引用文献(言わば主引例)を示す情報をさらに保持する場合、第5変形例の異なる態様として、引用マップ生成部40は、審査および審判の過程で設定された引用関係のうち主引例との引用関係に基づいて、引用マップを生成してもよい。言い換えれば、主引例となった文献との引用関係のみを反映してオブジェクト間の矢印線を設定してもよい。この態様によると、引用マップにおいて内容の類似度合いが高い文献同士を関連づけて示すことができ、引用マップの有用度を一層高めることができる。
第6変形例として、検索条件を自動的にユーザへ提案する変形例を説明する。
文献検索装置10は、複数の必要特許に共通する語句を抽出する第1抽出部をさらに備えてもよい。第1抽出部は、所定割合(例えば30%)以上の必要特許(または抽出特許)の文献データが含む共通のキーワード(またはキーフレーズ)を抽出してもよい。検索結果生成部36は、第1抽出部により抽出された語句を、検索条件に加えるべき候補、例えば現在の検索式に対してOR条件で加えるべき語句として検索結果データに含めてもよい。所定割合は、文献情報サービス会社の知見や経験に基づき定められてもよく、情報システム100を用いた実験により適切な値が決定されてもよい。共通のキーワードは、技術分類コード(例えばIPC)であってもよく、特許請求の範囲等に記載された文字列であってもよい。
また文献検索装置10は、(必要特許の部分集合である)漏れ特許には含まれるが、他の必要特許には含まれない語句を、漏れ特許の特徴語として抽出する第2抽出部をさらに備えてもよい。第2抽出部が抽出する語句は、必要特許のうち漏れ特許にのみ含まれる語句とも言え、必要分件のうち抽出文献には含まれない語句とも言える。第2抽出部は、漏れ特許には含まれるが、他の必要特許には含まれない語句を、カイ二乗検定等、公知の技術を用いて抽出してもよい。検索結果生成部36は、第2抽出部により抽出された語句を、検索条件に加えるべき候補、例えば現在の検索式に対してOR条件で加えるべき語句として検索結果データに含めてもよい。
また文献検索装置10は、ノイズ特許には含まれるが必要特許には含まれない語句を、ノイズ特許の特徴語として抽出する第3抽出部をさらに備えてもよい。第3抽出部は、ノイズ特許に含まれるが必要特許には含まれない、言わばノイズ特許の特徴語を、カイ二乗検定等、公知の技術を用いて抽出してもよい。検索結果生成部36は、第3抽出部により抽出されたノイズ特許の特徴語を、現在の検索式に加えるべきマイナス検索(除外検索、除く検索)のキーワード候補として検索結果データに含めてもよい。文献検索装置10は、上記第1抽出部、第2抽出部、第3抽出部のうち1つまたは複数を備えてもよい。第6変形例によると、検索条件の妥当性向上のための有用な情報をユーザへ提供できる。
第7変形例として、検索項目ごとに漏れ特許、ノイズ特許の情報を提示する変形例を説明する。
図4に関連して一部既述したように、要求取得部26により取得される検索条件は複数の検索項目(およびキーワード)を含んでもよい。検索部28は、複数の検索項目のそれぞれを満たす特許文献を抽出するとともに、複数の検索項目の組み合わせを満たす特許文献を抽出してもよい。必要文献検出部31と漏れ検出部32は、上記実施例の構成に加えて、検索項目ごとに抽出された特許文献群を母集団として、その母集団における各文献の引用関係に基づいて、検索項目ごとの必要特許および漏れ特許を検出してもよい。ノイズ検出部34は、上記実施例の構成に加えて、検索項目ごとに抽出された特許文献群を母集団として、その母集団における各文献の引用関係に基づいて、検索項目ごとのノイズ特許を検出してもよい。検索結果提供部38は、上記実施例の構成に加えて、複数の検索項目のそれぞれに対応付けて漏れ特許(必要特許)とノイズ特許の少なくとも一方に関する情報を出力してもよい。
検索結果生成部36は、検索項目ごとの必要特許数および漏れ特許数に基づいて、検索項目ごとに必要特許または漏れ特許の数や比率の情報(例えば必要文献内在率)を生成してもよい。また検索結果生成部36は、検索項目ごとのノイズ特許数に基づいて、検索項目ごとにノイズ特許の数や比率の情報(例えばノイズ文献率)を生成してもよい。検索結果生成部36は、図5の検索画面50における各検索項目のヒット件数の隣に、各検索項目についての必要文献内在率とノイズ文献率を設定してもよい。第7変形例によると、文献の適切な絞り込みに寄与している検索項目(およびキーワード)や、ノイズ混入の原因となっている検索項目(およびキーワード)をユーザに把握させやすくなり、検索条件の妥当性向上のための有用な情報をユーザへ提供できる。
第7変形例の異なる態様として、複数の検索項目のうち抽出特許の数が所定の閾値以上の検索項目については、必要特許、漏れ特許、ノイズ特許の検出を抑制してもよい。この閾値は、文献情報サービス会社の知見や経験に基づき定められてもよく、情報システム100を用いた実験により適切な値が決定されてもよい。また、ユーザにより設定されてもよい。閾値は、例えば1千件であってもよく1万件であってもよい。この態様によると、必要特許、漏れ特許、ノイズ特許の検出時間が長くなることを抑制でき、検索要求に対して検索結果データを返すまでのレスポンスタイムが長くなることを抑制できる。
上述した実施例および変形例の任意の組み合わせもまた本発明の実施の形態として有用である。組み合わせによって生じる新たな実施の形態は、組み合わされる実施例および変形例それぞれの効果をあわせもつ。請求項に記載の各構成要件が果たすべき機能は、実施例および変形例において示された各構成要素の単体もしくはそれらの連携によって実現されることも当業者には理解されるところである。
10 文献検索装置、 12 文献DB、 26 要求取得部、 28 検索部、 30 検出部、 31 必要文献検出部、 32 漏れ検出部、 34 ノイズ検出部、 36 検索結果生成部、 38 検索結果提供部、 40 引用マップ生成部、 42 引用マップ提供部、 100 情報システム。

Claims (18)

  1. ユーザから入力された条件であって、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件を取得する取得部と、
    所定の記憶部に格納された前記複数の文献の中から、前記取得部により取得された条件を満たす文献を複数抽出する検索部と、
    前記検索部により抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、前記複数の抽出文献に含まれないが前記複数の抽出文献との関連性が高いと見込まれる文献である漏れ文献と、前記複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれる文献であるノイズ文献の少なくとも一方を検出する検出部と、
    前記検出部により検出された漏れ文献またはノイズ文献に関する情報をユーザへ提示する出力部と、
    を備えることを特徴とする文献検索装置。
  2. 前記検出部は、前記複数の抽出文献のうち少なくとも1つを引用する文献であり、かつ、前記複数の抽出文献のうち少なくとも1つにより引用される文献を必要文献として検出する必要文献検出部を含むことを特徴とする請求項1に記載の文献検索装置。
  3. 前記必要文献検出部により検出された必要文献のうち、前記複数の抽出文献に含まれない必要文献を前記漏れ文献として検出する漏れ検出部をさらに含むことを特徴とする請求項2に記載の文献検索装置。
  4. 前記必要文献検出部は、ユーザにより指定された引用数以上の抽出文献を引用する文献であり、かつ、ユーザにより指定された被引用数以上の抽出文献により引用される文献を前記必要文献として検出することを特徴とする請求項2または3に記載の文献検索装置。
  5. 前記取得部は、第1の文献と第2の文献の間に直接的または間接的な引用関係が結ばれる場合の、第1の文献から第2の文献に至るまでの世代数であって、前記必要文献の検出条件となる世代数の指定をユーザから受け付け、
    前記必要文献検出部は、ユーザにより指定された世代数の範囲内で前記複数の抽出文献のうち少なくとも1つを直接的または間接的に引用する文献であり、かつ、ユーザにより指定された世代数の範囲内で前記複数の抽出文献のうち少なくとも1つにより直接的または間接的に引用される文献を前記必要文献として検出することを特徴とする請求項2から4のいずれかに記載の文献検索装置。
  6. 前記出力部は、必要文献が抽出文献に含まれるか否かに関する比率を示す情報をユーザへ提示することを特徴とする請求項2から5のいずれかに記載の文献検索装置。
  7. 前記出力部は、漏れ文献と必要文献の比率を示す情報をユーザへ提示することを特徴とする請求項2から5のいずれかに記載の文献検索装置。
  8. 前記検出部は、或る抽出文献が引用する非抽出文献の数が所定数以上であり、および/または、前記或る抽出文献が引用される非抽出文献の数が所定数以上である場合に、前記或る抽出文献を前記ノイズ文献として検出するノイズ検出部を含むことを特徴とする請求項1から7のいずれかに記載の文献検索装置。
  9. 前記検出部は、或る抽出文献が引用する非抽出文献の数が所定数以上であって引用する抽出文献がなく、かつ、前記或る抽出文献が引用される非抽出文献の数が所定数以上であって引用される抽出文献がない場合に、前記或る抽出文献を前記ノイズ文献として検出するノイズ検出部を含むことを特徴とする請求項1から7のいずれかに記載の文献検索装置。
  10. 前記ノイズ検出部は、或る抽出文献が引用する非抽出文献の数がユーザにより指定された引用数以上であり、および/または、前記或る抽出文献が引用される非抽出文献の数がユーザにより指定された被引用数以上である場合に、前記或る抽出文献を前記ノイズ文献として検出することを特徴とする請求項8または9に記載の文献検索装置。
  11. 前記取得部は、第1の文献と第2の文献の間に直接的または間接的な引用関係が結ばれる場合の、第1の文献から第2の文献に至るまでの世代数であって、前記ノイズ文献の検出条件となる世代数の指定をユーザから受け付け、
    前記ノイズ検出部は、ユーザにより指定された世代数の範囲内で或る抽出文献が直接的または間接的に引用する非抽出文献の数が所定数以上であり、および/または、ユーザにより指定された世代数の範囲内で前記或る抽出文献が直接的または間接的に引用される非抽出文献の数が所定数以上である場合に、前記或る抽出文献を前記ノイズ文献として検出することを特徴とする請求項8から10のいずれかに記載の文献検索装置。
  12. 前記出力部は、抽出文献におけるノイズ文献の比率を示す情報をユーザへ提示することを特徴とする請求項1から11のいずれかに記載の文献検索装置。
  13. 前記複数の抽出文献は産業財産権に関する公報であり、
    前記検出部は、各抽出文献と他の文献との引用関係のうち、出願人から申告された引用関係を除外し、審査で設定された引用関係に基づいて、前記漏れ文献と前記ノイズ文献の少なくとも一方を検出することを特徴とする請求項1から12のいずれかに記載の文献検索装置。
  14. 複数の必要文献に共通する語句を抽出する抽出部をさらに備えることを特徴とする請求項2に記載の文献検索装置。
  15. 漏れ文献には含まれるが、他の必要文献には含まれない語句を、漏れ文献の特徴語として抽出する抽出部をさらに備えることを特徴とする請求項3に記載の文献検索装置。
  16. ノイズ文献には含まれるが必要文献には含まれない語句を、ノイズ文献の特徴語として抽出する抽出部をさらに備えることを特徴とする請求項2に記載の文献検索装置。
  17. ユーザから入力された条件であって、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件を取得するステップと、
    所定の記憶部に格納された前記複数の文献の中から、前記取得するステップで取得された条件を満たす文献を複数抽出するステップと、
    前記抽出するステップで抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、前記複数の抽出文献に含まれないが前記複数の抽出文献との関連性が高いと見込まれる文献である漏れ文献と、前記複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれる文献であるノイズ文献の少なくとも一方を検出するステップと、
    前記検出するステップで検出された漏れ文献またはノイズ文献に関する情報をユーザへ提示するステップと、
    をコンピュータが実行することを特徴とする文献検索方法。
  18. ユーザから入力された条件であって、他の文献との間で引用関係が結ばれうる複数の文献の中から特定の文献を抽出するための条件を取得する機能と、
    所定の記憶部に格納された前記複数の文献の中から、前記取得する機能により取得された条件を満たす文献を複数抽出する機能と、
    前記抽出する機能により抽出された複数の抽出文献のそれぞれと他の文献との引用関係に基づいて、前記複数の抽出文献に含まれないが前記複数の抽出文献との関連性が高いと見込まれる文献である漏れ文献と、前記複数の抽出文献に含まれるが非抽出文献との関連性が高いと見込まれる文献であるノイズ文献の少なくとも一方を検出する機能と、
    前記検出する機能により検出された漏れ文献またはノイズ文献に関する情報をユーザへ提示する機能と、
    をコンピュータに実現させるためのコンピュータプログラム。
JP2016134961A 2016-07-07 2016-07-07 文献検索装置、文献検索方法およびコンピュータプログラム Active JP6707410B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016134961A JP6707410B2 (ja) 2016-07-07 2016-07-07 文献検索装置、文献検索方法およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016134961A JP6707410B2 (ja) 2016-07-07 2016-07-07 文献検索装置、文献検索方法およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2018005758A true JP2018005758A (ja) 2018-01-11
JP6707410B2 JP6707410B2 (ja) 2020-06-10

Family

ID=60949273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016134961A Active JP6707410B2 (ja) 2016-07-07 2016-07-07 文献検索装置、文献検索方法およびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6707410B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114780671A (zh) * 2022-03-14 2022-07-22 珠海横琴濠麦科技有限公司 一种专利引用关系的显示方法、计算机装置、计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114780671A (zh) * 2022-03-14 2022-07-22 珠海横琴濠麦科技有限公司 一种专利引用关系的显示方法、计算机装置、计算机可读存储介质

Also Published As

Publication number Publication date
JP6707410B2 (ja) 2020-06-10

Similar Documents

Publication Publication Date Title
US10169337B2 (en) Converting data into natural language form
US8145617B1 (en) Generation of document snippets based on queries and search results
CN109074383B (zh) 文档背景内可视化的文档搜索
CN107122400B (zh) 使用视觉提示细化查询结果的方法、计算系统及存储介质
AU2010328181B2 (en) Resource search operations
KR20160124079A (ko) 인-메모리 데이터베이스 탐색을 위한 시스템 및 방법
JP5185402B2 (ja) 文書検索装置、文書検索方法、及び文書検索プログラム
US11379536B2 (en) Classification device, classification method, generation method, classification program, and generation program
US10936667B2 (en) Indication of search result
US20140181099A1 (en) User management of electronic documents
US20230205796A1 (en) Method and system for document retrieval and exploration augmented by knowledge graphs
US8700624B1 (en) Collaborative search apps platform for web search
JP2024091709A (ja) 文作成装置、文作成方法および文作成プログラム
JP2010123036A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
US9886497B2 (en) Indexing presentation slides
JP6707410B2 (ja) 文献検索装置、文献検索方法およびコンピュータプログラム
JP2018005759A (ja) 引用マップ生成装置、引用マップ生成方法およびコンピュータプログラム
JP2010272006A (ja) 関係抽出装置、関係抽出方法、及びプログラム
JP6727097B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2020091607A (ja) 検索システム、及び検索方法
JP6534454B2 (ja) 情報検索方法及び情報検索装置並びに情報検索システム
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP6153262B2 (ja) 対象文章を象徴する簡易文を推定するプログラム、装置及びサーバ
JP5826148B2 (ja) 図面管理サーバ及びこれを用いた図面管理システム
US9420052B2 (en) Web navigation using web navigation pattern histories

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200519

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200520

R150 Certificate of patent or registration of utility model

Ref document number: 6707410

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250