以下、図面を参照して、本発明の実施形態を詳細に説明する。
実施の形態1.
本実施形態においては、特許文献を検索する文献検索装置を含む情報検索システムを例として説明する。
図1は、本実施の形態に係る情報検索システムの運用形態の例を示す図である。図1に示すように、本実施形態に係る情報検索システムは、情報検索装置1、クライアント装置2及び文献情報DB200を含む。クライアント装置2は、PC(Personal Computer)等の一般的な情報処理装置によって構成される。情報検索装置1は、ネットワークを介してクライアント装置2と接続されており、クライアント装置2からの検索要求を受けて文献情報DB200に格納されている文献情報を検索する。文献情報DB200は、検索対象の情報として特許文献の情報を記憶している。
次に、本実施形態に係る情報検索装置1のハードウェア構成について説明する。図2は、本実施形態に係る情報検索装置1のハードウェア構成を示すブロック図である。図2に示すように、本実施形態に係る情報検索装置1は、一般的なサーバやPC(Personal Computer)等の情報処理端末と同様の構成を有する。即ち、本実施形態に係る情報検索装置1は、CPU(Central Processing Unit)10、RAM(Random Access Memory)20、ROM(Read Only Memory)30、HDD(Hard Disk Drive)40及びI/F50がバス80を介して接続されている。また、I/F50にはLCD(Liquid
Crystal Display)60及び操作部70が接続されている。
CPU10は演算手段であり、情報検索装置1全体の動作を制御する。RAM20は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU10が情報を処理する際の作業領域として用いられる。ROM30は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。HDD40は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーション・プログラム等が格納される。I/F50は、バス80と各種のハードウェアやネットワーク等を接続し制御する。LCD60は、ユーザが情報検索装置1の状態を確認するための視覚的ユーザインタフェースである。操作部70は、キーボードやマウス等、ユーザが情報検索装置1に情報を入力するためのユーザインタフェースである。尚、図1において説明したように、本実施形態に係る情報検索装置1は、サーバとして運用される。従って、LCD600及び操作部70等のユーザインタフェースは省略可能である。
このようなハードウェア構成において、ROM30やHDD40若しくは図示しない光学ディスク等の記憶媒体に格納されたプログラムがRAM20に読み出され、CPU10の制御に従って動作することにより、ソフトウェア制御部が構成される。このようにして構成されたソフトウェア制御部と、ハードウェアとの組み合わせによって、本実施形態に係る情報検索装置1の機能を実現する機能ブロックが構成される。
次に、本実施形態に係る情報検索装置1の機能ブロックについて、図3を参照して説明する。図3は、本実施形態に係る情報検索装置1の機能ブロック及び情報検索装置1が検索する対象の文献情報を格納している文献情報DB200を示すブロック図である。図3に示すように、本実施形態に係る情報検索装置1は、検索制御部100、情報入力部110、ネットワークI/F120、表示部130及び辞書情報DB140を有する。
情報入力部110は、ユーザが情報検索装置1を操作して検索制御部100に情報を入力するための構成であり、図2に示すI/F50及び操作部70によって実現される。ネットワークI/F120は、情報検索装置1がネットワークを介して情報を取得し、若しくはネットワークを介して情報を送信するためのインタフェースであり、図2に示すI/F50によって実現される。具体的には、例えばEthernet(登録商標)接続のインタフェースや、USB(Universal Serial Bus)接続のインタフェースによって実現される。
表示部130は、情報検索装置1の動作状態や、検索結果等が表示される構成であり、図2に示すI/F50及びLCD60によって実現される。辞書情報DB140は、類義語検索が可能な単語のデータベースであり、図2に示すHDD40及びRAM20において動作するプログラムによって実現される。検索制御部100は、本実施形態に係る情報検索装置1の検索機能を担う構成であり、指定条件情報取得部101、指定条件情報解析部102、文献情報抽出部103及び抽出結果処理部104を有する。
指定条件情報取得部101は、ユーザによって情報入力部110を介して入力された情報若しくはネットワークI/F120を介してネットワーク経由で入力された情報を指定条件情報として取得する。指定条件情報取得部101は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。指定条件情報とは、所望の文献を抽出するための条件として、ユーザによって指定される条件である。指定条件情報解析部102は、指定条件情報取得部101が取得した指定条件情報を解析し、文献情報DB200から文献を抽出する際の条件となる抽出条件の情報(以降、抽出条件情報とする)を生成する。
また、指定条件情報解析部102は、生成した抽出条件情報を表示するための抽出条件表示情報を生成し、出力する。即ち、指定条件情報解析部102が、抽出条件表示情報生成部として機能する。抽出条件表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。指定条件情報解析部102の機能が本実施形態の要旨の1つとなる。指定条件情報解析部102が実行する処理については、後に詳述する。
文献情報抽出部103は、指定条件情報解析部102によって生成された抽出条件情報に基づき、文献情報DB200に格納されている文献を抽出する。即ち、文献情報抽出部103は、抽出条件情報によって定められている条件に適合する情報を辞書情報DB200から抽出する情報抽出部として機能する。情報抽出部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。また、文献情報抽出部103は、文献情報DB200から抽出した文献を示す情報の一覧(以降、文献表示一覧情報とする)を生成する。
抽出結果処理部104は、文献情報抽出部103によって生成された文献表示一覧情報に基づき、適合文献の抽出結果を表示部130若しくはクライアント装置2の表示部に表示するための適合情報表示情報を生成して、出力する。即ち、抽出結果処理部104は、抽出条件情報によって定められている条件に適合する情報として抽出された適合情報を表示部130若しくはクライアント装置2の表示部に表示するための適合情報表示情報を生成する適合情報表示情報生成部として機能する。適合情報表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
このような情報検索装置1において、本実施形態は、指定条件情報解析部102による、抽出条件情報を表示するための抽出条件表示情報の生成及び抽出条件情報の表示に特徴を有する。以下、本実施形態に係る情報検索装置1の動作について図を参照して説明する。図4は、本実施形態に係る情報検索システムにおける情報検索動作を示すシーケンス図である。図4に示すように、文献情報DB200に登録されている文献情報を検索する際、先ず、ユーザはクライアント装置2を操作して検索条件を指定するための検索条件指定画面を表示するための情報を情報検索装置1から取得し、検索条件指定画面を表示する(S401)。以下、本実施形態の説明においては、ユーザがクライアント装置2を操作して情報検索装置1の機能を利用する場合を例として説明する。
S401においてクライアント装置2の表示部に表示される検索条件指定画面を、図5(a)に示す。図5(a)は、文献情報DB200に格納されている文献を検索する際に表示される画面であって検索条件を指定する検索条件指定画面300を示す図である。図5(a)に示すように検索条件指定画面300は、検索対象指定部301、検索条件指定部302及び検索条件入力部303を有する。検索対象指定部301は、“国内特許”、“海外特許”、“実用新案”等のように、検索する対象として文献の種類を選択する。検索条件指定部302は、“文章”、“キーワード”、“書誌項目”等のように、文献を検索する条件の種類を選択する。検索条件入力部303は、検索条件指定部302において選択した検索条件の種類に応じた検索条件を入力する。
図5(a)の例においては、検索条件として“文章”を指定する場合を示している。“文章”を検索条件とした場合、検索条件入力部303には抽出すべき文献(本実施形態においては特許公報)を特定するための文章を入力する。本実施形態においては、特許文献に開示されている技術を特定する文章として、“A**B****C*、A**D**、B*E***、C*F*。”という文章が入力される場合を例として説明する。ユーザは、クライアント装置2の操作部を操作することにより、図5(a)に示すような文章を入力し、情報検索装置1に対して指定条件情報として送信する(S402)。
情報検索装置1に送信された指定条件情報は、ネットワークI/F120から情報検索装置1に入力され、検索制御部100の指定条件情報取得部101が取得する(S403)。指定条件情報解析部102は、指定条件情報取得部101から指定条件情報としての文章を取得すると、入力された文章を解析する(S404)。S404の処理において、指定条件情報解析部102は、文章として入力された指定条件情報から検索対象を特定する特徴となる文言である単語(以降、抽出単語とする)を抽出する。図7(a)は、本実施形態において入力された指定条件情報の文章から抽出された抽出単語を示す図である。図7(a)に示すように、本実施形態においては、図5(a)に示す検索条件入力部303に入力された文章から、“A”、“B”、“C”、“D”、“E”及び“F”という文言が抽出単語として抽出される。これらの抽出単語は、指定条件情報において定められる条件を構成する最小単位の条件、即ち、単位条件として用いられる。
指定条件情報解析部102は、図7(a)に示すように抽出単語を抽出すると、辞書情報DB140を検索して夫々の抽出単語の類義語(以降、抽出類義語とする)を抽出する(S405)。即ち、指定条件情報解析部102が類義語情報取得部として機能する。類義語情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。図7(b)は、図7(a)に示す夫々の抽出単語に対して抽出した抽出類義語を示す図である。図7(b)の例においては、“A”の類義語として“A1”、“A2”を、“B”の類義語として“B1”、“B2”、“B3”を、“C”の類義語として“C1”を、“D”の類義語として“D1”、“D2”を、“E”の類義語として“E1”を、“F”の類義語として“F1”、“F2”を、夫々抽出した例を示している。
図7(a)、(b)に示すように、抽出単語及び抽出類義語を特定すると、指定条件情報解析部102は、それらの情報に基づき、文献情報DB200から文献情報を抽出する条件となる抽出条件情報を生成する(S406)。本実施形態においては、抽出単語及び抽出類義語を抽出条件情報とする。指定条件情報解析部102は、抽出条件情報を生成すると、その抽出条件情報をクライアント装置2の表示部に表示するための抽出条件表示情報を生成し、出力する(S407)。即ち、指定条件情報解析部102が、抽出条件表示情報生成部として機能する。
指定条件情報解析部102は、S407において、ネットワークI/F120を介してクライアント装置2に対して抽出条件表示情報を送信する。クライアント装置2は、情報検索装置1から抽出条件表示情報を受信すると、表示部に抽出条件情報を表示する(S408)。S408におけるクライアント装置2の表示部の表示を図8(a)、(b)に示す。図8(a)は、S408において表示される抽出条件情報表示画面400を示す図である。図8(a)に示すように、本実施形態に係る抽出条件情報表示画面400は、検索語表示部401、辞書展開指示部402及び検索実行指示部403を有する。
検索語表示部401は、図8(a)に示すように、S405において抽出された抽出単語を表示している。ここで、ユーザが情報入力部110を操作し、マウス等のポインティングデバイスにより辞書展開指示部402をクリックすると、抽出条件情報表示画面400の表示が図8(b)に示すように切り換わる。即ち、指定条件情報解析部102は、ユーザによって入力された操作情報に基づき、類義語表示の有無を切り換え可能なように抽出条件表示情報を生成する。
図8(b)に示す抽出条件情報表示画面400においては、S405において抽出された抽出類義語が、夫々類義語として抽出される元となった抽出単語と関連付けられて表示されている。これにより、ユーザは抽出条件として抽出制御部100により自動的に追加される抽出類義語が、夫々どの単語の類義語として抽出されたのかを容易に認識することが可能となる。尚、以降の説明においては、抽出単語及び抽出類義語を総じて検索語とする。
尚、図8(a)、(b)に示す抽出条件情報表示画面400においては、検索語表示部401において“選択”と表示されている列の検索語指定部401aを切り換え、“○”若しくは“×”を選択することにより、夫々の抽出単語若しくは抽出類義語を検索語として用いるか否かを選択することが可能である。ユーザが、図8(a)、(b)に示す検索語表示部401の選択項目を切り換えて検索語として用いるか否かを設定し、検索実行指示部403をクリックすることにより、検索実行命令がクライアント装置2から情報検索装置1に送信される(S409)。
S409において送信される検索実行命令は、ネットワークI/F120を介して情報検索装置1の検索制御部100に入力される。S409において送信される検索実行命令には、図8(a)、(b)において説明した夫々の抽出単語若しくは抽出類義語を検索語として用いるか否かの情報、即ち、検索語指定情報が含まれる。即ち、検索制御部100が、検索語指定情報取得部として機能する。検索制御部100が取得した検索実行命令は、文献情報抽出部103に入力される。
文献情報抽出部103は、抽出条件情報解析部102から入力された抽出条件情報及びクライアント装置2から取得した検索語指定情報に基づき、文献情報DB200からの文献情報の抽出を実行する(S410)。即ち、文献情報抽出部103が情報抽出部として機能する。情報抽出部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
S410において、文献情報抽出部103は、文献情報DB200に格納されている夫々の文献において夫々の抽出単語及び抽出類義語が用いられている回数を求め、その回数を所定の計算に基づいて抽出条件に対する適合値として算出する。図9は、S410における文献情報の抽出過程において生成される情報を視覚的に示す図である。図9に示す図においては、ID、ヒット数、検索語及び文献番号の情報を含むテーブルが示されている。
ここで、図9において、例えばID“001”の情報は、文献番号が“****−*****a”である文献における検索語“A”のヒット数が“328”であることを示している。そして、ID“001”、“002”、“003”の情報は、夫々文献番号“****−*****a”、“****−*****b”、“****−*****c”における検索語Aのヒット数を示す情報となっている。また、ID“011”、“012”、“013”の情報は、夫々文献番号“****−*****a”、“****−*****c”、“****−*****f”における検索語A1のヒット数を示す情報となっている。
このように、文献情報抽出部103は、S406において文献情報DB200に格納されているすべての文献について、夫々の検索語が用いられている回数を求め図9に示すようなテーブルを生成する。次に、文献情報抽出部103は、図9に示す情報を所定の処理に従って集計する。この処理について図10を参照して説明する。図10は、図9に示す情報を集計する動作を示すフローチャートである。図9に示す情報を生成すると、文献情報抽出部103は、一の文献について検索結果を参照する(S1001)。例えば図9に示す例においては、文献番号“****−*****a”についての検索結果としてID“001”、“011”、“021”及び“101”の情報を参照する。
次に、文献情報抽出部103は、公報番号、即ち“****−*****a”を表示するための情報を生成する(S1002)。次に、文献情報抽出部103は、夫々の検索語毎のヒット数を表示するための情報を、公報番号と関連付けて表示するように生成する(S1003)。この場合、公報番号“****−*****a”を参照しているので、検索語“A”、“A1”、“B”、“C1”に関連付けて表示する情報として、夫々“328”、“155”、“78”、“14”を表示するための情報を生成する。S1001〜S1003の処理を、すべての公報について繰り返し(S1004/NO)、すべての公報についてS1001〜S1003の処理が完了したら(S1004/YES)、処理を終了する。
図10の処理によって生成される情報を図11に示す。図11に示すように、図10の処理の結果、文献情報抽出部103は、文献情報DB200に格納されている夫々の文献情報と抽出条件情報として指定されている検索語とをマトリクス状に配置して表示するための情報が生成される。そして、夫々の文献において夫々の検索語が用いられている回数を夫々のセルに表示するような情報が生成される。文献情報抽出部103は、図11に示す表を所定の計算式に適用し、夫々の文献について適合値を求める。そして、文献情報抽出部103は、S410の処理において、上記適合値が所定の閾値以上となる文献を適合文献として抽出する。
文献情報抽出部103は、適合文献を抽出すると、その適合文献について文献表示一覧情報を生成し、抽出結果処理部104に入力する。ここで、文献表示一覧情報とは、適合文献として抽出された文献に係る図11に示す情報、即ち、夫々の適合文献において、夫々の検索語が用いられている回数を示す情報である。また、図11に示す情報に加えて、夫々の適合文献の適応度に関する情報が含まれる。換言すると、文献表示一覧情報とは、図11において説明した情報から、適合値が所定の閾値に満たない文献を抜いた情報である。即ち、文献表示一覧情報は、抽出結果情報として用いられる。
文献情報抽出部103から抽出結果として文献表示一覧情報を受信した抽出結果処理部104は、抽出結果を表示するための抽出結果表示情報を生成し、クライアント装置2に対して送信する(S411)。抽出結果表示情報を受信したクライアント装置2は、表示部に抽出結果を表示し(S412)、処理を終了する。S412においてクライアント装置2の表示部に表示される画面について、図12を参照して説明する。図8は、標準的な抽出結果の表示態様として、文献情報の抽出結果の適応度による一覧を示す図である。図12に示すように、抽出結果表示画面500は、表示態様選択部501及び抽出結果表示部502を有する。
表示態様選択部501は、抽出結果表示画面500の表示態様を選択する選択部であり、表示態様選択部501の選択状態に応じて抽出結果表示部502に表示される内容が変化する。ユーザは、情報検索装置1の情報入力部110を操作し、表示態様選択部501の選択状態を切り換えることができる。表示態様選択部501において“適応度一覧”が選択されている場合、抽出結果表示部502は、図12に示すように、S410において抽出された文献である特許公報の番号、夫々の特許公報のタイトルである発明の名称及び夫々の特許公報の抽出条件に対する適応度を関連付けて表示する。また、図12において、抽出された文献は、適応度が高い順に並べられて表示される。
このような情報検索装置1において、本実施形態に係る要旨は、図4において説明したS404〜S408の類義語情報の取得及び抽出条件情報の取得処理にある。図6を参照して、本実施形態に係る情報検索装置1の類義語情報の取得及び抽出条件情報の取得処理について更に説明する。図6に示すように、S404において説明した指定条件情報の解析の結果、図7(a)に示すように、抽出単語を取得すると、指定条件情報解析部102は、夫々の抽出単語について語意IDを付与する(S602)。
そして、指定条件情報解析部102は、図7(a)に示す夫々の抽出単語ごとに辞書検索を実行し(S603)、図7(b)に示すように、抽出類義語を取得する(S604)。抽出類義語を取得すると、指定条件情報解析部102は、取得した抽出類義語に語意IDを付与する(S605)。ここで、S605の処理においては、夫々の抽出類義語に対して、その抽出元となった抽出単語と同一の語意IDを付与する例えば、図7(b)に示す抽出単語“A”と抽出類義語“A1”とは同一の語意IDが付与される。
語意IDの付与が完了すると、指定条件情報解析部102は、図8(a)に示すように抽出単語を表示するための表示情報を生成する(S606)。次に、指定条件情報解析部102は、図8(b)に示すように抽出類義語を抽出元となる抽出単語と関連付けて表示するように表示情報を生成し(S607)、処理を終了する。S607においては、S605において付与された語意IDに基づき、夫々の抽出類義語を同一の語意IDが付与された抽出単語に関連付けて表示するように表示情報を生成する。
以上説明したように、本実施形態に係る情報検索装置により、情報の検索における検索条件の表示において、入力された検索文言と当該検索文言の類義語として取得された文言との対応関係の理解を図8(b)に示すように容易化することができる。
尚、上記の説明においては、図8(b)において説明したように、抽出条件情報表示画面400を例として説明したが、抽出結果を表示する抽出結果表示画面500において抽出単語と抽出類義語とを関連付けて表示する態様も可能である。そのような例について図13を参照して説明する。図13は、図12において説明した抽出結果表示画面500の他の態様を示す図である。図13の表示態様においては、抽出結果表示部502に、適合文献である特許公報の番号を列として縦に列挙し、夫々の検索語語を行として横に列挙することによりマトリクス状に配置して表示している。
図13に示すような態様において、例えば、夫々の抽出単語を異なる色で表示し、夫々の抽出単語とその類義語とを同一の色で表示することが考えられる。具体的には、図13の例において、“A”及び“A1”を黒で表示し、“B”、“B1”及び“B2”を赤で表示し、“C”及び“C1”を青で表示する態様等が挙げられる。このように、抽出単語とその類義語とを関連付けて表示することにより、抽出結果表示画面500における抽出単語とその類義語との関連性のユーザによる把握を容易化することが可能となる。この場合は、抽出結果処理部104が抽出条件としての抽出単語及び抽出類義語を関連付けて表示するための抽出条件表示情報を生成する抽出条件表示情報生成部部として機能する。
また、上記の説明においては、抽出単語と抽出類義語とを関連付けて表示する抽出条件情報表示画面の例として、図8(a)、(b)の態様を例として説明した。この他、図14に示すように、抽出単語と抽出類義語とを同一の行に表示しても良い。また、図15に示すように、抽出単語と抽出類義語とを表示する行を別とした上で、抽出類義語はすべて同一の行に表示するようにしても良い。更に、図16示すように、抽出単語とその類義語とを連続して表示させ、抽出単語を強調表示するようにしても良い。図8(b)若しくは図13〜図16のいずれの態様であっても、抽出単語とその類義語とを関連付けて表示し、それらの関連性がユーザに理解可能な表示態様であれば、上記と同様の効果を得ることが可能である。この時、図16に示すように、抽出単語とその類義語とを異なる態様で表示することにより、抽出単語と類義語との区別を明確に表示することが可能となる。
また、上記の説明においては、ユーザが指定条件情報を入力する態様として、図5(a)のように、文章を入力する例を説明した。この他、検索条件指定画面300の検索条件指定部302において“キーワード”を選択することにより、“A”、“B”、“C”等の検索語を直接指定することも可能である。そのような態様について、図5(b)に示す。図5(b)は、検索条件指定画面300の検索条件指定部302において“キーワード”を選択した場合の例を示す図である。この場合、図5(b)に示すように、検索条件入力部303は、キーワードを入力する画面となる。
図5(b)に示す態様の場合、指定条件情報として、ユーザによって入力されたキーワードが指定条件情報解析部102に入力される。ユーザによって指定されたキーワードを指定条件情報として受信した指定条件情報解析部102は、そのキーワードの類義語を辞書情報DB140から取得する。即ち、図5(b)に示す態様の場合、ユーザによって入力されたキーワードが上記実施例の抽出単語に該当し、そのキーワードの類義語が上記実施例の抽出類義語に該当する。以降の処理は、上記実施例と同様に実行される。
また、上記の説明においては、図3に示すように、類義語取得結果を表示した後、文献情報の抽出を実行し、その後抽出結果を表示する例を説明した。この他、文献を抽出した後に類義語取得結果と抽出結果とを表示するようにしても良い。この際、文献情報抽出部103は一覧情報に加えて抽出条件情報をも抽出結果処理部104に入力し、抽出結果処理部104が抽出条件情報及び抽出結果情報を表示部130に表示させるようにしても良い。
実施の形態2.
実施の形態1においては、指定条件として入力された文章に含まれる単語と当該単語の類義語として抽出された類義語との対応関係の把握を容易化する情報検索システムを例として説明した。本実施形態においては、検索結果の表示態様に特徴を有する情報検索装置について説明する。尚、実施の形態1と同様の符号を付す構成については、実施の形態1と同一または相当部を示し、説明を省略する。
図13は、本実施形態に係る抽出結果表示画面500を示す図である。図13に示すように、本実施形態に係る抽出結果表示画面500は、表示態様選択部501の選択状態が“ヒット数一覧”である場合の態様である。表示態様選択部501において“ヒット数一覧”が選択されている場合、抽出結果表示画面500の表示態様は図13に示すようになる。即ち、抽出結果表示部502は、適合文献である特許公報の番号を列として縦に列挙し、夫々の検索語語を行として横に列挙することによりマトリクス状に配置して表示している。そして、夫々の文献において夫々の検索語が用いられている回数(以降、検索語ヒット数若しくはヒット数とする)を夫々のセルに表示している。即ち、図13に示す夫々のセルに表示されているヒット数は、単位条件に対する充足度である。
尚、図13に示す“(ヒット数一覧)”の抽出結果表示画面500は、実施の形態1の図11において説明した情報に基づいて表示される。即ち、文献情報抽出部103及び抽出結果処理部104が連動して適合情報表示情報生成部として機能する。ここで、夫々の検索語を示す領域は、ソート指示部521として機能する。また、夫々のセルに表示されている検索語ヒット数は、検索語ヒット箇所表示指示部522として機能する。検索語ヒット箇所表示指示部522においては、夫々のヒット数に応じた大きさの円の中にそのヒット数を示す数値が表示されている。これにより、ユーザは、夫々の文献が夫々の検索語をどの程度含んでいるのかを容易に把握することが可能となる。
図13に示す“ヒット数一覧”の抽出結果表示画面500においては、抽出された特許公報は、実施の形態1の図12において説明した適応度の順に並べられている。また、検索語の夫々の列は、図13に示す画面左側、即ち、公報番号の列に近い側から、適合度の高い公報(図13の例においては、適合度が最も高い公報)でのヒット数が大きい順に並べられている。これは、ヒット数が多い検索語ほど、それら公報を特徴づけているという傾向に基づく。即ち、ヒット数の多い単語を公報列の近傍に配置することにより、特徴的な単語のヒット数と公報番号との対比確認を容易化することが可能となる。
ここで、図13の例においては、一番上に表示されている公報における各検索語のヒット数を基準として検索語の列が並べ替えられている。この他、夫々の検索語において、抽出された全適合文献、即ち全特許公報におけるヒット数を合計し、その合計ヒット数に基づいて検索語の列を並べ替えても良い。若しくは、適合文献として抽出された文献のうち、さらに所定の閾値以上の適合度を有する文献のヒット数の合計に基づいて並べ替えても良い。また、図13に示す抽出単語及び抽出類義語の列の順番は、ユーザにより任意に変更可能である。これにより、ユーザの利便性を高めることが可能となる。
また、図13に示す“ヒット数一覧”の抽出結果表示画面500においては、夫々の検索語ヒット箇所表示指示部522をクリックすることにより、夫々の文献において夫々の検索語が用いられている箇所を表示する検索語ヒット箇所表示画面が表示される。図17を参照して、本実施形態に係る検索語ヒット表示画面600について説明する。図17においては、図13に示す検索語ヒット箇所表示指示部522のうち、“C1”の列の“14”と表示されているセルをクリックした場合の例を示す。
図17に示すように、本実施形態に係る検索語ヒット箇所表示画面600は、前後文表示部601及びヒット箇所表示部602を有する。前後文表示部601は、指定された文献中において、該当する検索語の直前の文章である“左文脈“及び該当する検索語の直後の文章である”右文脈“を表示する。また、ヒット箇所表示部602は、指定された検索語をハイライト表示した上で、指定された文献中において検索語が用いられている箇所を表示する。ヒット箇所表示部602におけるハイライト表示とは、指定された検索語を太字にて表示すると共に、下線を付す。この他、例えば赤字等、他の文章とは異なる色で検索語を表示しても良い。
図17に示す検索語ヒット箇所表示画面600は、抽出結果処理部104によって生成された表示情報に基づき、クライアント装置2の表示部に表示される。図17に示す前後文表示部601及びヒット箇所表示部602に表示される情報は、文献情報抽出部103から抽出結果処理部104に入力される文献表示一覧情報には含まれていない。従って、抽出結果処理部104は、図13に示す抽出結果表示画面500においてクリックされた検索語ヒット箇所表示指示部522に対応する特許公報の公報番号に基づき、文献情報DB200から前後文表示部601及びヒット箇所表示部602に表示すべき情報を取得する。これにより、抽出結果処理部104は、検索語ヒット箇所表示画面600を生成することが可能となる。即ち、抽出結果処理部104が夫々の適合文献において夫々の単位条件の充足態様を表示するための充足態様表示情報生成部として機能する。充足態様表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
尚、上述したように、図17に示す検索語ヒット箇所表示画面600を表示するためには、抽出結果表示画面500において検索語ヒット箇所表示指示部522をクリックする。ここで、抽出結果表示画面500はクライアント装置2の表示部に表示される情報であり、検索語ヒット箇所表示指示部522のクリックは、クライアント装置2において実行される処理である。従って、情報検索装置1は、ネットワークI/F120を介して検索語ヒット箇所表示指示部522がクリックされたことを示す情報(以降、検索語ヒット箇所表示指示情報とする)をクライアント装置2から受信する。
ネットワークI/F120を介して情報検索装置1に入力された検索語ヒット箇所表示指示情報は、検索制御部100に入力され、抽出結果処理部104が取得する。ここで、検索語ヒット箇所表示指示情報には、文献及び検索語を特定する情報が含まれる。これは、例えば、実施の形態1の図9において説明したIDである。この他、文献及び検索語を夫々特定しても良い。即ち、検索語ヒット箇所表示指示情報とは、適合文献のいずれか1つにおける検索語のいずれか1つのヒット数、即ち充足度を指定する充足度指定情報として用いられる。従って、抽出結果処理部104が充足度指定情報取得部として機能する。充足度指定情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
従来の検索装置においては、本実施形態に係る検索語“A”、“A1”、“B”、“B1”、“B2”・・・等、複数の検索語を用いて検索を実行した場合、それら複数の検索語がすべてハイライト表示されていた。そのため、多くの文字がハイライト表示されることにもなり、ヒット箇所表示部602のような画面において所望の検索語を参照する際に不便であった。これに対して、本実施形態に係るヒット箇所表示画面600のヒット箇所表示部602においては、指定された検索語、即ち、図13に示す抽出結果表示画面500の検索語ヒット箇所表示指示部522をクリックして指定されたセルに対応する検索語(図17の例においては“C1”)のみをハイライト表示する。これにより、ヒット箇所表示部602において所望の検索語を容易に発見し、参照することが可能となる。
次に、図13に示すソート指示部521の機能について、図18を参照して説明する。図18は、図13に示すソート指示部521のうち、“B1”が表示されている領域をクリックした場合を示している。図18に示すように、“B1”が表示されている領域のソート指示部521をクリックした場合、抽出された特許公報は“B1”のヒット数順に並べ替えられる。また、“B1”のヒット数に基づいてソートされていることの明示のため、“B1”のソート指示部521が反転表示される。このような処理により、抽出された特許公報の並び順をユーザの指定した検索語のヒット数に基づいた順位とすることが可能となり、情報解析の利便性を向上することが可能となる。
図17において説明した検索語ヒット箇所表示画面600の表示と同様に、ソート指示部521のクリックもクライアント装置2において実行される処理である。従って、情報検索装置1は、ソート指示部521がクリックされたことを示す情報(以降、ソート指示情報とする)をネットワークI/F120を介してクライアント装置2から受信する。ネットワークI/F120が受信したソート指示情報は、ネットワークI/F120から検索制御部100に入力され、抽出結果処理部104が取得する。即ち、抽出結果処理部104が操作情報取得部及び単位条件指定情報取得部として機能する。操作情報取得部及び単位条件指定情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
また、図13に示すような“ヒット数一覧”の抽出結果表示画面500においては、夫々の検索語毎のヒット数のみならず、複数の検索語をグループ化し、抽出された特許公報の番号と検索語のグループとをマトリクス状に配置する態様も可能である。そのような態様について、図19を参照して説明する。図19は、“A”及び“A1”を1つのグループとし、“B”、“B1”及び“B2”を1つのグループとし、“C”及び“C1”を1つのグループとした例を示している。図19に示すグループの指定は、図17若しくは図18の画面を表示する処理と同様に、クライアント装置2において実行される。
図13に示す態様においては、夫々の検索語が夫々の文献において用いられている数を一覧することが可能であるが、検索語の中には類義語として抽出された抽出類義語も含まれるため、全ての検索語毎の一覧は必ずしも必要ではない。これに対して、図19に示すように、抽出単語及びその単語の類義語として抽出された類義語を1つのグループとすることにより、夫々の検索語が夫々の特許公報において用いられている数を、同義の検索語毎に容易に一覧することが可能となる。
尚、ユーザがクライアント装置2を操作することにより生成される検索語のグループ指定の情報は、ネットワークI/F120が受信して検索制御部100に入力され、抽出結果処理部104が取得する。即ち、抽出結果処理部104が複数の単位条件である検索語を単位条件群として指定する単位条件群指定情報を取得する単位条件郡指定情報取得部として機能する。単位条件群指定情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
また、図19に示す抽出結果表示画面500においても、検索語ヒット箇所表示部522若しくはソート指示部521をクリックすることにより、図17若しくは図18において説明した機能を実現することが可能である。ここで、図19に示す抽出結果表示画面500において検索語ヒット箇所表示部522をクリックした場合、図17に示す検索語ヒット箇所表示画面600においては、指定した検索語グループに含まれるすべての検索語が前後文表示部601に表示され、ヒット箇所表示部602においては指定した検索語グループに含まれるすべての検索語がハイライト表示される。
以上説明したように、本実施形態に係る情報検索装置により、情報の検索における検索結果の表示において、検索条件と検索対象情報との適合度を算出する前の、検索条件と検索対象情報との適合状況について、図13に示すようによりユーザに理解し易いように表示することが可能となる。
また、上記の説明においては、図13に示すように、適合文献である特許公報の番号を列として縦に列挙し、夫々の検索語を行として横に列挙することによりマトリクス状に配置して表示する例を説明した。これに対して、適合文献を行とし、検索語を列としても良い。但し、指定された検索語の数よりも抽出された適合文献の数の方が多くなることが多いと考えられる。この場合、ユーザは適合文献が配列された方向に画面をスクロールさせて全文献を確認することになる。PC等の一般的な情報処理端末においては、マウスのホールを回転させることにより、上下方向の画面スクロールが容易なように構成されているものが多い。従って、適合文献を列として縦に列挙することにより、ユーザの利便性を向上することが可能となる。この他、適合文献数よりも検索語数の方が多い場合も考え、列と行とを入れ替え可能なようにしても良い。これにより、更にユーザの利便性を高めることが可能となる。更には、抽出結果の適合文献の数と検索語の数とを比較し、多い方を列として配置するようにしても良い。
また、上記の説明においては、図13において説明したように、抽出結果表示画面500における検索語の夫々の列が、公報番号の列に近い側からヒット数の大きい順に並べられている例を説明した。これは、上述したように、特徴的な言葉をより公報番号の列の近傍に表示させたいという要求に基づく。この他、特徴的な言葉を判断する要因としては、夫々の検索語によって抽出された文献の数(以降、文書頻度とする)がある。例えば、図13の例においては、検索語“C”を含む文献の数は6であり、検索語“A”を含む文献の数は3である。従って、検索語“C”の文書頻度は6であり、検索語“A”の文書頻度は3である。
上記文書頻度が大きければ、より多くの文献においてその文言が用いられているということであり、小さければ、その文言を用いている文献が少ないということである。即ち、文書頻度が小さい検索語は、特徴的な文言であり、文書頻度が大きい検索語は一般的な言葉であると言うことができる。従って、図20に示すように、抽出結果表示画面500において、検索語の夫々の列を、公報番号の列に近い側から文書頻度の小さい順に並べるようにしても良い。これによっても、図13の態様と同様の効果を得ることが可能となる。
また、上記の説明においては、図13において説明したように、マトリクス表示の各セルにヒット数を表示する例を説明した。この他、マトリクス表示の各セルに、夫々の検索語が夫々の適合文献の適合度にどの程度寄与しているかを示す数値(以降、スコア寄与率)を表示させても良い。このような態様について説明する。
まず、夫々の文献の適合度及び上述したスコア寄与率の求め方について説明する。夫々の文献の適合度は、以下の式(1)によって求められる。
ここで、式(1)に示すScorenは、夫々の文献における検索語nの適合度である。また、式(1)に示すiは、夫々の文献に含まれる検索語の数である。即ち、検索語nとは、一の文献に含まれるi個の検索語のうちの1つ(n番目)である。
また、Scorenは、以下の式(2)によって求められる。
ここで、式(2)に示すHitnは、夫々の文献における検索語nのヒット数である。また、式(2)に示すWeightnは、検索語nの重み値である。
また、Weightnは、以下の式(3)によって求められる。
ここで、式(3)に示す全登録文献とは、文献情報DB200に格納されている全ての文献、即ち、検索対象であるすべての文献数である。また、式(3)に示すDFnとは、検索語nの文書頻度(Document Frequency)である。
文献情報抽出部103は、図11において説明した情報及び文献情報DB200に格納されている全文献数に基づき、上記の式(1)〜(3)を用いて夫々の文献の適合度を算出する。
このような計算式に基づき、検索語nのスコア寄与率は、以下の式(4)によって求められる。
抽出結果処理部104は、文献情報抽出部103から受信した文献表示一覧情報に基づき、式(4)に示す計算を実行して夫々の検索語nのスコア寄与率を計算し、マトリクス表示の各セルにスコア寄与率が表示された抽出結果表示画面500を生成する。このような抽出結果表示画面500の例を図21に示す。図21に示すように、マトリクス表示の各セルにスコア寄与率を表示することにより、適合文献として抽出された文献の適合度において、夫々の検索語がどの程度寄与したかを容易に把握することが可能となる。このような情報は、例えば、再検索を実行する際の検索語の修正において有意な情報となる。
このように、図21に示す例においては、マトリクス表示における各セルに表示する充足度に関する情報として、夫々の検索語が夫々の適合文献の適合度にどの程度寄与しているかを示す数値であるスコア寄与率を表示する。尚、図21の例においては、マトリクス表示の各セルにスコア寄与率を表示する例を説明したが。この他、夫々の文献における夫々の検索語nの適合度であるScorenを表示しても良い。
実施の形態3.
本実施形態においては、抽出結果処理部104による抽出結果表示の他の態様について説明する。実施の形態2においては、図4に示すS410の処理の結果抽出された文献情報としての特許公報番号を様々な態様で表示する場合を説明した。この他、本実施形態に係る抽出結果処理部104は、検索対象である文献情報としての特許公報が含む書誌事項に基づいて抽出結果を解析し、その解析の結果生成された情報を表示するための表示情報を生成する機能を有する。即ち、抽出結果処理部104が、解析結果情報を生成する抽出結果解析部及び解析結果表示情報生成部として機能する。抽出結果解析部及び解析結果表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。以下、抽出結果処理部104による抽出結果の解析及びその表示態様の例について説明する。
まず、本実施形態に係る検索対象である文献情報として特許公報が含む書誌情報について説明する。図22は、特許公報が含む書誌情報の例を示す図である。図22に示すように、特許公報は、公開番号、出願番号、IPC(International Patent Classification)、FI(File Index)、Fターム(File Forming Term)、公開年月日、出願年月日、出願人、代理人及び発明者についての情報を含む。即ち、書誌情報とは、検索対象である文献情報に付加されている付加情報である。
公開番号及び出願番号は、その特許公報の公開時若しくはその特許公報に係る特許出願がされた際に付された番号である。IPC、FI、Fタームは、その特許公報に開示されている技術の分野を示す記号情報である。即ち、夫々の文献が開示している情報に含まれる要素をその内容に基づいて分類した要素分類情報である。ここで、特許公報においては、必ずしも一の技術分野に属する技術のみが開示されるとは限らず、また、多分野の技術を組み合わせた発明もある。従って、一の特許公報においては、複数のIPC、FI及びFタームが夫々付され得る。特に、Fタームは、夫々の記号が意味する技術が非常に細かく細分化されており、一の特許文献において複数のFターム記号が付されるのが通例である。
公開年月日及び出願年月日は、その特許公報の公開日時若しくはその特許公報に係る特許出願がされた日時である。出願人は、その特許公報に係る特許出願を行なった者である。代理人は、その特許公報に係る特許出願に際して手続きを代理する者である。発明者は、その特許公報にかかる特許出願が開示する発明を完成させた者である。出願人、代理人及び発明者は、夫々複数の者が該当する場合があり得る。
検索対象である特許公報の書誌情報は、文献情報抽出部103から抽出結果処理部104に入力される文献表示一覧情報には含まれていない。従って、抽出結果処理部104は、適合文献である特許公報の書誌情報の解析に際して、文献表示一覧に含まれる特許公報の書誌情報を文献情報DB200から取得する。これにより、抽出結果処理部104は、適合文献の書誌情報を解析することが可能となる。尚、本実施形態においては、日本国の公開特許公報を対象とするため、要素分類情報としては、図22に示す通りIPC、FI及びFタームであるが、アメリカ合衆国の特許公報を対象とする場合は、Current
US Classification等を用いることも可能である。
図23は、特許公報が有する書誌情報のうち、IPCに基づいて抽出結果を解析し、夫々の特許公報に含まれるIPCを集計して件数順に表示した状態を示す図である。尚、このような解析結果を表示する場合、ユーザは表示態様選択部501を“書誌情報解析”に切り換える。表示態様選択部501を“書誌情報解析”に切り換えると、図22に示すように、解析態様選択部503が表示される。解析態様選択部503を切り換えることにより、様々な解析態様を表示させることが可能となる。尚、図23の表示においては、解析態様選択部503の選択を“IPC件数”とする。
ここで、ユーザが表示態様選択部501を切り換える処理は、クライアント装置2において実行される処理である。従って、情報検索装置1は、クライアント装置2において表示態様選択部501が切り換えられたことを示す情報(以降、表示態様切換指示情報とする)をネットワークI/F120を介してクライアント装置2から受信する。ネットワークI/F120が受信した表示態様切換指示情報は、ネットワークI/F120から検索制御部100に入力され、抽出結果処理部104が取得する。これにより、抽出結果処理部104が指定された表示態様に従って抽出結果の解析を実行する。即ち、抽出結果処理部104が抽出結果解析部として機能する。抽出結果解析部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
上記表示態様切換指示情報には、解析態様選択部503の選択状態に関する情報も含まれる。図23の例においては、“IPC件数”が選択されているため、表示態様切換指示情報には、IPC件数に基づいて解析した表示態様に切り換えることを指示する情報が含まれる。
次に、図23に示す抽出結果表示画面500を生成する処理について、図24を参照して説明する。図24の例においては、図23に示すように、解析態様選択部503の選択状態が“IPC件数”である場合を例として説明する。抽出結果処理部104は、上述した表示態様切換指示情報を受信すると、適合文献として抽出された文献に付された全てのIPCを抽出する(S2401)。図25に、S2401の処理の結果生成される情報を示す。図25に示すように、S2401においては、適合文献に付された全てのIPCが列挙される。
適合文献に付された全IPCの抽出が完了すると、抽出結果処理部104は、抽出されたIPCのうち、一のIPCを参照する(S2402)。そして、適合文献として抽出された文献のうち、参照中のIPCが付されている適合文献の数をカウントする(S2403)。抽出結果処理部104は、S2402及びS2403の処理を、S2401において抽出された全IPCについて完了するまで繰り返し(S2404/NO)、全IPCについて完了したら(S2404/YES)、夫々のIPC毎のカウント数を表示するための表示情報を生成して(S2405)、処理を終了する。このような処理により、図23に示す画面を表示するための情報が生成される。即ち、抽出結果処理部104が解析結果表示情報生成部として機能する。解析結果表示情報生成部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
図23の例においては、図4において説明したS410において抽出された特許公報のうち、IPCとして“G06F17/30”が付されているものが821件あり、“G06F14/40”が付されているものが59件あることを示している。図23に示すように、“(IPC件数解析一覧)”の抽出結果表示画面500においては、夫々のIPC記号が付されている適合文献の件数が、夫々のIPC記号及びそのIPC記号において特徴的な言葉、即ち、夫々の付加情報に関連する関連情報と関連付けて表示されている。このような表示により、ユーザは、抽出結果において含まれるIPC記号の傾向及び夫々のIPC記号において特徴的な言葉を容易に一覧して把握することが可能となる。尚、図23に示すのはIPCに基づいて抽出結果を解析した例であるが、FI若しくはFタームにおいても同様に適用可能である。
ここで、上述したように、特許公報に付されているIPC記号は1つとは限らない。本実施形態に係る抽出結果処理部104は、一の特許公報に付されているIPCの組み合わせを解析し、夫々の特許公報に含まれるIPCの組み合わせを集計して件数順に表示する機能を有する。図26は、2つのIPCの組み合わせを解析し、件数順に表示した抽出結果表示画面500を示す図である。図26に示すように、2つのIPCの組み合わせを解析する場合は、解析態様選択部503の選択を“IPC×2件数”に切り換える。図26の例においては、図4のS410において抽出された特許公報のうち、IPCとして“G06F17/30”及び“G06F15/40”が付されているものが55件あり、“G0617/30”及び“G06F17/21”が付されているものが34件あることを示している。
また、図27は、抽出結果処理部104が3つのIPCの組み合わせを解析し、件数順に表示した抽出結果表示画面500を示す図である。図27に示すように、3つのIPCの組み合わせを解析する場合は、解析態様選択部503の選択を“IPC×3件数”に切り換える。図26の例においては、S306において抽出された特許公報のうち、IPCとして“G06F17/30”、“G06F15/40”及び“G06T1/00”の3つが付されているものが5件あり、“G0617/30”、“G06F17/21”及び“G06F15/20”の3つが付されているものが4件あることを示している。
上述した表示態様選択部501の切り換え処理と同様、解析態様選択部503の切り換え処理も、クライアント装置2において実行される処理である。従って、情報検索装置1は、クライアント装置2において解析態様選択部503が切り換えられたことを示す情報(以降、解析態様切換指示情報とする)をネットワークI/F120を介してクライアント装置2から受信する。
ネットワークI/F120が受信した解析態様切換指示情報は、ネットワークI/F120から検索制御部100に入力され、抽出結果処理部104が取得する。これにより、抽出結果処理部104が指定された解析態様に従って抽出結果の解析を実行する。図23、図26及び図27に示す態様においては、解析態様選択部503の切り換えによって切り換えられるのは、抽出結果を解析する際に参照するIPCの数である。例えば、解析態様選択部503において“IPC×2件数”が選択されれば、抽出結果を解析するIPCの組み合わせとして2つのIPCの組み合わせが付与された低号文献をカウントすることが指示される。即ち、図26、図27の態様においては、解析態様切換指示情報は、付加情報の数を指定する付加情報数指定情報として用いられる。即ち、抽出結果処理部104が付加情報数指定情報取得部として機能する。付加情報数指定情報取得部は、図2に示すRAM20にロードされたプログラムがCPU10の制御に従って動作することにより構成される。
次に、図26若しくは図27に示す抽出結果表示画面500を生成する処理について説明する。図28は、図26に示すように、解析態様選択部503の選択状態が“IPC×2件数”である場合において、抽出結果表示画面500を生成する処理を示すフローチャートである。抽出結果処理部104は、上述した表示態様切換指示情報を受信すると、適合文献として抽出された文献に付された全てのIPC2つの組み合わせを抽出する(S2801)。図29に、S2801の処理の結果生成される情報を示す。図29に示すように、S2801においては、適合文献に付された全てのIPC2つの組み合わせが列挙される。
適合文献に付されたIPC2つの組み合わせの抽出が完了すると、抽出結果処理部104は、抽出されたIPCの組み合わせうちの1つを参照する(S2802)。そして、適合文献として抽出された文献のうち、参照中のIPCの組み合わせが付されている適合文献の数をカウントする(S2803)。抽出結果処理部104は、S2802及びS2803の処理を、S2801において抽出された全IPCの組み合わせについて完了するまで繰り返し(S2804/NO)、全IPCについて完了したら(S2804/YES)、各IPCの組み合わせ毎のカウント数を表示するための表示情報を生成して(S2805)、処理を終了する。このような処理により、図26に示す画面を表示するための情報が生成される。
このように、夫々のIPC毎に夫々の特許公報に含まれる数を集計して件数を表示することに加え、複数のIPCの組み合わせ毎に夫々の特許公報に含まれる数を集計して表示することにより、ユーザによる抽出結果解析においてより有効な情報表示を行なうことが可能となる。また、上記の説明においては、2つのIPCの組み合わせ及び3つのIPCの組み合わせについての場合を例として示したが、4つ以上であっても同様に適用可能である。
図23、図26、図27においては、夫々のIPCの表示順として、夫々のIPCを含む特許公報の件数順に表示する例を説明した。このような表示としては、書誌情報の傾向を把握するためには有効である。しかしながら、解析対象の書誌情報によっては、他の並び順が有効である場合もあり得る。以下、抽出結果処理部104による解析結果の表示態様についての他の例を説明する。
図30は、図23に示す解析結果の並び順をIPCの種類順に変更した例を示す抽出結果表示画面500を示す図である。IPC、FI等、文献の内容種別を示す情報は、類似する内容順に構成されている場合がある。そのような場合、抽出結果処理部104による解析結果を、IPCの種類に従って表示することにより、適合文献として抽出された特許公報において、類似する技術が含まれる傾向を容易に把握することが可能となる。
図31は、特許公報が有する書誌情報のうち、出願年に基づいて抽出結果を解析し、夫々の特許公報の出願年を集計して表示した状態を示す図である。図31の例においては、夫々の出願年における特許公報の件数ではなく、出願年に従って情報が並べられている。これにより、検索対象の技術に対する出願件数の経年的な傾向を容易に把握することが可能となる。尚、図31に示すのは出願年に基づいて抽出結果を解析した例であるが、出願年月若しくは出願年月日においても同様に適用可能である。また、公開年、公開年月若しくは公開年月日についても同様に適用可能である。
図23から図30に示す画面への切り換えに際しては、ユーザがクライアント装置2を操作してソートの基準となる項目を示す情報(以降、並べ替え条件情報とする)を指定する。情報検索装置1は、並べ替え条件情報をネットワークI/F120を介してクライアント装置2から受信する。ネットワークI/F120が受信した並べ替え条件情報は、ネットワークI/F120から検索制御部100に入力され、抽出結果処理部104が取得する。抽出結果処理部104は、取得した並べ替え条件情報に基づいて、ソート後の抽出結果表示画面500を表示するための情報を生成する。
次に、図30若しくは図31に示す態様のように、ソートを実行する処理について図32を参照して説明する。図32は、図31に示すように、出願年に基づいてソートを実行する際のソート切換動作を示すフローチャートである。抽出結果処理部104は、先ず並べ替え条件情報を取得する(S3201)。そして、取得した並べ替え条件情報から出願年に基づいてソートを実行することを認識すると、各出願年毎のカウント結果項目のうち、出願年が最も若い項目を取得し(S3202)、取得した項目を表示するための表示情報を生成する(S3203)。S3202及びS3203の処理によって取得された項目は、以降の処理において取得対象には含めない。抽出結果処理部104は、S3402及びS3403の処理を、解析結果として生成された全項目、即ち、全出願年について完了するまで繰り返し(S3204/NO)、全項目について完了したら(S3204/YES)、処理を終了する。このような処理により、図31に示す画面を表示するための情報が生成される。
図30、図31に示した例に限らず、解析対象となる書誌情報の性質に基づいて並べ替えることにより、ユーザによる情報解析を容易化する表示を行なうことができる。例えば、図22に示す書誌情報のうち、出願人、代理人若しくは発明者について解析を行なう場合、例えば50音順、イニシャル順等の表示が可能である。また、上述した通り、出願人、代理人若しくは発明者は複数含まれる場合があり得るため、図26及び図27において説明したような組み合わせによる解析が可能である。
以上説明したように、本実施形態に係る情報検索装置により、検索対象の情報にその情報の内容に応じた分類情報が付されている場合において、付されている分類情報に基づいた検索結果表示の態様を、図26、図27に示すようにユーザの理解を助けるより有効な態様とすることが可能となる。
また、本実施形態に係る情報検索装置により、検索条件に適合するものとして抽出された情報の一覧表示において、図30、図31に示すようにユーザの理解を助けるように表示順序の設定が可能となる。
尚、上記実施の形態1から3は、文献情報として公開特許公報を検索する場合の例であるが、例えば、図書館等の蔵書を検索する場合にも適用可能である。その場合、上記の説明におけるIPC等の分類情報は日本十進分類法の分類番号等、図書を分類する情報となる。
また、上記実施の形態1から3の説明においては、文献情報DB200が情報検索装置1とは別に設けられているが、文献情報DB200を情報検索装置1内部の記憶領域に構成することも可能である。また、上記の説明においては、情報検索装置1と文献情報DB200とが図3に示すように直接接続されている例を説明したが、例えば、ネットワークI/F120を介して、ネットワークにより接続されていても良い。
同様に、上記の説明においては、辞書情報DB140が情報検索装置1内部に設けられている例を説明した。この他、辞書情報DB140を情報検索装置1とは別の装置、例えば、ネットワークに接続されたサーバとして構成しても良い。この場合、情報検索装置1は、ネットワークI/F120を介して辞書情報DB140にアクセスし、上述した類義語の検索を行なう。
また、上記の説明においては、ユーザがクライアント装置2を操作し、ネットワークを介してサーバとして機能する情報検索装置1の機能を利用する例を説明した。この他、図3に示す情報入力部110及び表示部130を用いて、ユーザが情報検索装置1を直接操作することも可能である。これによっても、上記と同様の効果を得ることが可能である。また、上記説明した各機能の一部をクライアント装置2において実行することも可能である。また、上記の説明においては、検索制御部100の機能を一の情報検索装置1において実現する例を説明したが、複数のサーバが連動して上記情報検索装置1の機能を実現することも可能である。