JP2003223466A - 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体 - Google Patents

特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体

Info

Publication number
JP2003223466A
JP2003223466A JP2002024406A JP2002024406A JP2003223466A JP 2003223466 A JP2003223466 A JP 2003223466A JP 2002024406 A JP2002024406 A JP 2002024406A JP 2002024406 A JP2002024406 A JP 2002024406A JP 2003223466 A JP2003223466 A JP 2003223466A
Authority
JP
Japan
Prior art keywords
node
word
search device
patent document
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002024406A
Other languages
English (en)
Inventor
Katsuhito Suzuki
勝仁 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2002024406A priority Critical patent/JP2003223466A/ja
Publication of JP2003223466A publication Critical patent/JP2003223466A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 検索目的に添った文書を検索者が容易に把握
できるような態様で表示し、提示する。 【解決手段】 形態素解析部16、ノード候補抽出部1
7、共起データ獲得部18およびノード候補グループ化
部14は、制御部12の制御下で複数の特許文献に対応
する特許文献データから発明の構成要件に対応する単語
を抽出し、当該単語あるいは当該単語と共起する単語に
基づいて複数の単語をノード単語とする。そして、配置
図作成部13、表示部19、要約獲得部20およびイベ
ント判定部21は、制御部12の制御下で抽出されたノ
ード単語に基づいて構成要件相互の関係あるいは特許文
献相互の関係を視覚化すべくノード単語をノードとする
発明の構成要件の相互関係を配置図として提示する。

Description

【発明の詳細な説明】
【0001】
【発明が属する技術分野】本発明は、特許検索装置、特
許検索装置の制御方法、制御プログラムおよび記録媒体
に係り、特に特許検索結果の表示技術に関する。
【0002】
【従来の技術】近年、各企業においては製品化に先立
ち、開発した技術あるいは開発品が他社の特許権などに
抵触していないかを事前に調査することが一般的に行わ
れている。特許検索システムとしては、日本国特許庁の
電子図書館の検索システムや、各種データベース企業の
特許用検索システムが知られている。
【0003】
【発明が解決しようとする課題】上記従来の特許検索シ
ステムにおいては、初期段階の検索結果においては、発
明の名称や公開公報番号などを一覧表示するだけであ
り、このような一覧表示だけでは、どの特許文献から読
めば良いのか、判断する基準が何もなかった。また、抄
録を表示する場合でも、件数が多い場合には、検索者に
とって何ら取りかかりが無く、どの文献から読めば良い
のか、判断する基準が何もなかった。従って、数多く検
索された文書のなかから、本来検索しようとしていた特
許文献を見いだすためには、少なくとも全ての特許文献
の抄録に目を通さなければならないという問題点があっ
た。そこで、本発明の目的は、検索目的に添った文書を
検索者が容易に把握できるような態様で表示し、提示す
ることが可能な特許検索装置、特許検索装置の制御方
法、制御プログラムおよび記録媒体を提供することにあ
る。
【0004】
【課題を解決するための手段】上記課題を解決するた
め、特許検索装置は、複数の特許文献に対応する特許文
献データから発明の構成要件に対応する単語を抽出し、
当該単語をノード単語とするノード単語抽出部と、抽出
された前記ノード単語に基づいて構成要件相互の関係あ
るいは前記特許文献相互の関係を視覚化すべく前記ノー
ド単語をノードとする前記発明の構成要件の相互関係を
配置図として提示する配置図表示部と、を備えたことを
特徴としている。上記構成によれば、ノード単語抽出部
は、複数の特許文献に対応する特許文献データから発明
の構成要件に対応する単語を抽出し、当該単語をノード
単語とする。配置図表示部は、ノード単語抽出部により
抽出された前記ノード単語に基づいて構成要件相互の関
係あるいは前記特許文献相互の関係を視覚化すべく前記
ノード単語をノードとする前記発明の構成要件の相互関
係を配置図として提示する。
【0005】この場合において、前記ノード単語を候補
としたノード候補単語について相互の類似度を比較し、
類似度が所定の類似度以上である場合に同一のグループ
に前記ノード候補単語をグループ化するノード候補グル
ープ化部と、前記ノード候補単語に共起する単語を獲得
する共起データ獲得部と、を備えるようにしてもよい。
また、前記配置図表示部は、前記配置図における前記ノ
ードの表示態様をツリー構造とし、上位階層に前記出現
回数の多いノード単語に対応する前記ノードを配置する
ようにしても良い。
【0006】さらに前記ノード相互間はパスにより接続
され、前記配置図表示部は、いずれかのパスがいずれか
一つの特許文献にのみ対応する場合に当該パスを削除
し、当該削除したパスに対応する二つのノードをまとめ
て一つのノードとするコンパクト化部を備えるようにし
てもよい。さらにまた、前記配置図上のいずれかの特許
文献における最下位層のノードに対応させて当該特許文
献の名称が表示されている場合に、当該名称の表示領域
に対応する所定の領域をユーザが指示している場合に、
当該特許文献の要約を獲得し、表示する要約獲得部を備
えるようにしてもよい。
【0007】また、前記配置図上のいずれかの特許文献
における最下位層のノードに対応させて当該特許文献の
名称が表示されている場合に、ユーザが当該名称の表示
領域に対応する所定の領域を指定して、所定の文献表示
操作を行った場合に、当該特許文献を表示する表示部を
備えるようにしてもよい。また、複数の特許文献に対応
する特許文献データから発明の構成要件に対応する単語
を抽出し、当該単語をノード単語とするノード単語抽出
過程と、抽出された前記ノード単語に基づいて構成要件
相互の関係あるいは前記特許文献相互の関係を視覚化す
べく前記ノード単語をノードとする前記発明の構成要件
の相互関係を配置図として提示する配置図表示過程と、
を備えるようにしてもよい。
【0008】さらに、前記ノード単語の候補となるノー
ド候補単語について相互の類似度を比較し、類似度が所
定の類似度以上である場合に同一のグループに前記ノー
ド候補単語をグループ化するノード候補グループ化過程
と、前記ノード候補単語に共起する単語を獲得する共起
データ獲得過程と、を備えるようにしてもよい。さらに
また、前記配置図表示過程において、前記配置図におけ
る前記ノードの表示態様をツリー構造とし、上位階層に
前記出現回数の多いノード単語に対応する前記ノードを
配置するようにしてもよい。
【0009】また、前記ノード相互間はパスにより接続
され、前記配置図表示過程は、いずれかのパスがいずれ
か一つの特許文献にのみ対応する場合に当該パスを削除
し、当該削除したパスに対応する二つのノードをまとめ
て一つのノードとするコンパクト化過程を備えるように
してもよい。さらに、前記配置図上のいずれかの特許文
献における最下位層のノードに対応させて当該特許文献
の名称を表示する特許文献名称表示過程と、当該名称の
表示領域に対応する所定の領域をユーザが指示している
場合に、当該特許文献の要約を獲得し、表示する要約獲
得過程と、を備えるようにしてもよい。さらにまた、前
記配置図上のいずれかの特許文献における最下位層のノ
ードに対応させて当該特許文献の名称を表示する特許文
献名称表示過程と、ユーザが当該名称の表示領域に対応
する所定の領域を指定して、所定の文献表示操作を行っ
た場合に、当該特許文献を表示する表示過程と、を備え
るようにしてもよい。
【0010】また、コンピュータを特許検索装置として
機能させるための制御プログラムにおいて、複数の特許
文献に対応する特許文献データから発明の構成要件に対
応する単語を抽出させ、当該単語をノード単語とし、抽
出された前記ノード単語に基づいて構成要件相互の関係
あるいは前記特許文献相互の関係を視覚化させるべく前
記ノード単語をノードとする前記発明の構成要件の相互
関係を配置図として提示させる、ことを特徴としてい
る。
【0011】この場合において、前記ノード単語の候補
となるノード候補単語と共起する単語を獲得させ、獲得
した単語を利用しながら前記ノード候補単語について相
互の類似度を比較させ、前記類似度が所定の類似度以上
である場合に同一のグループに前記ノード候補単語をグ
ループ化させるようにしてもよい。また、前記配置図に
おける前記ノードの表示態様をツリー構造とし、上位階
層に前記出現回数の多いノード単語に対応する前記ノー
ドを配置させるようにしてもよい。
【0012】さらに、前記ノード相互間はパスにより接
続させ、いずれかのパスがいずれか一つの特許文献にの
み対応する場合に当該パスを削除させ、当該削除させた
パスに対応する二つのノードをまとめて一つのノードと
させるようにしてもよい。さらにまた、前記配置図上の
いずれかの特許文献における最下位層のノードに対応さ
せて当該特許文献の名称を表示させ、当該名称の表示領
域に対応する所定の領域をユーザが指示している場合
に、当該特許文献の要約を獲得させ、表示させるように
してもよい。また、前記配置図上のいずれかの特許文献
における最下位層のノードに対応させて当該特許文献の
名称を表示させ、ユーザが当該名称の表示領域に対応す
る所定の領域を指定して、所定の文献表示操作を行った
場合に、当該特許文献を表示させるようにしてもよい。
また、上記各制御プログラムを記録媒体に記録してもよ
い。
【0013】
【発明の実施の形態】次に本発明の好適な実施の形態に
ついて説明する。 [1]実施形態の構成 図1に実施形態のスタンドアロン方式の特許検索システ
ムの概要構成ブロック図を示す。特許検索システム10
は、大別すると、操作部11、制御部12、配置図作成
部13、ノード候補グループ化部14、データベース部
15、形態素解析部16、ノード候補抽出部17、共起
データ獲得部18、表示部19、要約獲得部20および
イベント判定部21を備えている。
【0014】操作部11は、キーボード、マウス、タブ
レットなどの各種入力装置により構成され、ユーザが各
種操作を行ってデータ入力、コマンド入力を行う。制御
部12は、特許検索システムの各部を制御する。配置図
作成部13は、大別すると、ソート部31、グラフ作成
部32、コンパクト化部33、ビットマップ作成部34
を備えている。ソート部31は、ノード候補抽出部17
により抽出されたグラフ表示時にノードとして表示され
る単語の候補となりうる単語(以下、単にノード候補単
語という)についてソート(並べ替え)を行い、ノード
候補単語の重複回数を取得し、ソート結果データベース
に格納する。グラフ作成部32は、ソート結果データベ
ースに基づいてノード候補単語をノードとした各特許文
献の関係を2次元的に示すグラフ(配置図)を作成す
る。コンパクト化部33はグラフ作成部32により作成
されたグラフの視認性を向上するため冗長な部分を無く
しグラフのコンパクト化を行う。ビットマップ作成部3
4は、コンパクト化後のグラフをビットマップ化し、表
示させるべく格納する。
【0015】ノード候補グループ化部14は、ノード候
補抽出部17により抽出されたノード候補単語に対し
て、あらかじめ定めた手順でグループ化を行う。ノード
候補グループ化部14は、大別すると、ノードリスト作
成部41、標準化部42、ベクトル作成部43、分類部
44を備えている。ノードリスト作成部41は、ノード
候補単語および各ノード候補単語に共起する単語(これ
を共起語とよぶ)を共起データとしてノードリストを作
成する。標準化部42は、文字の揺れ、表記の揺れ、単
語の揺れを解消すべく共起データに対して、標準化を施
す。ベクトル作成部43は、各ノード候補単語につい
て、共起語を要素としたベクトルを作成する。分類部4
4は、ベクトル作成部43において作成されたベクトル
の類似度に基づいてノード候補データを分類してまとめ
る。
【0016】[2]実施形態の動作 次に実施形態の動作を説明する。以下の説明において
は、特許文献として日本国特許庁の電子出願フォーマッ
トの特許公開公報である場合を主として説明する。この
場合において、既にユーザにより設定された検索キーワ
ードにより複数の特許公開公報が抽出されているものと
する。図2に実施形態の特許文献検索処理の処理フロー
チャートを示す。まず、制御部12は、形態素解析部1
6を制御して特許文献の所定部分を形態素解析させる
(ステップS1)。例えば、抽出されている特許公開公
報の「課題を解決するための手段」の欄の最初から次の
段落番号が記載されている部分までを所定部分として形
態素解析を行う。この場合において、所定部分として特
許文献全体とすることも可能であるが、処理の簡略化の
観点から形態素解析の対象とする部分を一部にするのが
好ましい。
【0017】図5に特許文献としての特許公開公報(公
報番号H11ZZZZZ)の一部を示す。図5の例の場
合、形態素解析を行う所定部分として「課題を解決する
ための手段」の欄の最初から次の段落番号0005まで
の範囲としている。図6に形態素解析結果を示す。図6
において、()内は品詞名、カンマは単語区切りを表
し、スラッシュは文節区切りを表している。次に制御部
12は、ノード候補抽出部17を制御しノード候補単語
を抽出する(ステップS2)。
【0018】ノード候補抽出部17は、ノード候補単語
を抽出する際には、形態素解析後の特許公開公報につい
てノード候補単語を獲得するためにあらかじめ定めたキ
ーワードの集合に基づいて各キーワードの直前に位置す
る単語からあらかじめ定めた条件を満たす単語が出現す
るまで単語列を抽出する。この場合において、キーワー
ドとしては、発明の構成要件(いわゆる発明特定事項)
を表す単語が用いられ、例えば、「手段」、「部」、
「回路」、「装置」「過程」、「ステップ」などの単語
が用いられる。
【0019】そして抽出した単語群から重複した単語お
よび所定の種類の単語は除き、残った単語群をノード候
補単語とする。所定の種類の単語としては、単語の品詞
が名詞、サ変名詞以外である単語(ただし、連結記号
「・」などのキーワードはのこす。)や、単語があらか
じめ設定した所定のキーワード、例えば、「該」、「当
該」、「前記」、「上記」のようなものである。
【0020】具体的には、図7に示すように、枠で囲ま
れた単語をノード候補単語とする。すなわち、図7の場
合、ノード候補単語は、「表示」、「抽出」、「視線検
出」、「判定」となる。次に制御部12は共起データ獲
得部18を制御し、共起データを獲得(抽出)させる
(ステップS3)。
【0021】共起データ獲得部18は、抽出されたノー
ド候補単語に着目し、対象となる特許文献(本実施形態
では特許公開公報)において当該ノード候補単語の前方
方向に品詞が自立語である単語を抽出し、所定の条件を
満たす単語が出現するまで抽出を繰り返す。品詞が自立
語である単語とは、品詞が名詞、動詞、形容詞、形容動
詞の単語である。ここで、前方方向のみを抽出対象範囲
としているのは、「課題を解決するための手段」の欄に
おいては、連体修飾を用いた説明が多いと考えられるか
らである。従って、「ノード候補単語+助詞(は、が、
を等)」という表現を抽出してノード候補単語の後方方
向を同様に抽出対象範囲とすることも可能である。
【0022】そして抽出した単語と、ノード候補単語、
出現回数の組みを共起データとする。ここで、共起デー
タとはよく同時に出現する単語の関係を示す。すなわ
ち、ノード候補単語と共起語との間では、お互いに関連
性の高い関係を意味する。また、同一の共起データが複
数抽出された場合には、その出現回数もカウントする。
【0023】この場合に、所定の条件を満たす単語と
は、例えば、以下の5つの条件を満たす単語である。 (1) 前方方向(あるいは後方方向)に所定数N個の
単語を調べた場合。例えば、所定数N=10とする。こ
れは、調べる範囲が広がる、すなわち、元もノード候補
単語の出現位置から距離が遠くなるほどノード候補単語
との関連性が弱くなるために調べる範囲を限定する必要
があるからである。 (2) 抽出した単語が句読点である場合。 (3) 他のノード候補単語を抽出した場合。 (4) 日本国特許庁の電子出願フォーマットにおける
識別子である墨付閉じ括弧(シフトJISコード「81
79」あるいは「817A」の文字)を抽出した場合。 (5) あらかじめ設定した所定のキーワード、例え
ば、「該」、「当該」、「前記」、「上記」などを抽出
した場合。
【0024】具体的には、図7に示した枠で囲まれたノ
ード候補単語に対応させて、図8に示す単語を共起デー
タとする。なお、図8中、括弧内は共起データの当該特
許文献の所定部分における出現回数である。図8の場
合、例えば、ノード候補単語「表示」と共起する単語
は、「文書(出現回数1)」、「表示(出現回数1)」
となる。同様に、ノード候補単語「視線検出」に対して
は、「文書(出現回数1)」、「見(出現回数1)」、
「読者(出現回数1)」、「視線(出現回数1)」、
「検出(出現回数1)」となる。
【0025】以上の説明においては、共起データを「課
題を解決するための手段」の欄から抽出したが、特許文
献のいずれから抽出するように構成することも可能であ
る。次に制御部は、形態素解析(ステップS1)、ノー
ド候補獲得(ステップS2)および共起データ獲得(ス
テップS3)の処理を行っていない他の特許文献(本実
施形態では特許公開公報)が存在するか否かを判別する
(ステップS4)。ステップS4の判別において、形態
素解析(ステップS1)、ノード候補獲得(ステップS
2)および共起データ獲得(ステップS3)の処理を行
っていない他の特許文献が存在する場合には処理を再び
ステップS1に移行し、同様の処理を繰り返す。
【0026】ステップS4の判別において、全ての特許
文献について形態素解析(ステップS1)、ノード候補
獲得(ステップS2)および共起データ獲得(ステップ
S3)の処理を行った場合には、制御部12はノードグ
ループ化部14を制御して抽出したノード候補単語のグ
ループ化を行わせる(ステップS5)。図3にノードグ
ループ化処理の処理フローチャートを示す。まずノード
グループ化部14のノードリスト作成部41は、抽出さ
れたノード候補単語のリストを作成する(ステップS2
1)。この場合において、ノードリスト作成部41は、
同一のノード候補単語が複数存在する場合には、一つに
統合する。そして、統合前の複数のノード候補単語に属
していた共起語を統合して、同一の共起語については、
出現回数を加算する。
【0027】例えば、ノードリストは、図9に示すよう
なものとなっており、図中、下線で示すように、ノード
候補単語「表示」は他の特許文献でも用いられており、
他の特許文献における共起データとしても二つ抽出され
ていたため、図8の場合と比較して出現回数が2回の増
加し、出現回数が3回となっているのがわかる。次に標
準化部42は、ノード候補単語リストに属する各ノード
候補単語および共起語に対してデータベース15中の標
準化辞書を用いて標準化を適用する(ステップS2
2)。ここで、標準化とは、同一の意味を有し表記が異
なる単語を一つの単語にまとめたり(ex., 「コンピュ
ータ→コンピューター」)、よく似た意味をもった類義
語を1つの単語にまとめる(ex.,「語→単語」、「庭球
→テニス」)処理をいう。具体的には、図9におけるノ
ード候補単語「文解析」と共起する単語「語(出現回数
1)」については、「単語」という単語にまとめられ、
ノード候補単語リストは、図10に示すようなものとな
る。すなわち、標準化の結果は、図10中、下線で示す
ようなものとなる。
【0028】なお、本実施形態では行っていないが、デ
ータベース15中の標準化辞書に 形態素解析→文解析 構文解析→文解析 という情報が登録されている場合には、ノード候補単語
「形態素解析」、「構文解析」、「文解析」を一つのノ
ード候補単語「文解析」にまとめるように構成すること
も可能である。次にベクトル作成部43は、ノード候補
単語に対して、共起語を要素とするベクトルを作成する
(ステップS23)。例えば図10の例の場合、作成さ
れるベクトルは図11に示すようなものとなる。続いて
分類部44は、生成されたベクトルの類似度Kを算出
し、類似度Kの値の大きいノード候補単語を一つのグル
ープとしてまとめ、それぞれをノード単語とする(ステ
ップS24)。
【0029】具体的には、類似度Kの値の大きなノード
候補単語をまとめた結果を視覚的に表すと図12に示す
ようなものとなる。図12に示すように、ノード候補単
語「表示」、「出力」、「特定部分識別表示」は一つの
グループを構成するノード単語とし、以下の説明におい
ては、このグループのノード単語名=「表示」とする。
本実施形態においては、類似度K=0.6以上のノード
候補単語をノード単語としている。なお、これは一例で
あり、任意に設定することが可能である。また、ノード
候補単語「文解析」、「形態素解析」、「構文解析」は
他の一つのグループを構成するノード単語とし、以下の
説明においては、このグループのノード単語名=「文解
析」とする。
【0030】次に制御部12は、配置図作成部13を制
御して配置図作成処理を行わせる(ステップS6)。図
4に配置図作成処理の処理フローチャートを示す。配置
図作成部13のソート部31は、各特許文献のノード単
語について各ノード単語の出現回数順にソートを行う。
同時に、特許文献ごとに各ノード単語間の関係を定義す
べくパス(path)データを把握し、保持しておく(ステ
ップS31)。例えば、ステップS24の処理の結果、
特許文献毎に図13に示すようなノード単語名を得てい
た場合には、図14に示すようなソート結果が得られ
る。
【0031】次にグラフ作成部32は、ソート結果およ
びパスデータに基づいて出現回数の多いノード単語を上
位側に配置しツリー構造のグラフ作成用データを生成す
る(ステップS32)。具体的にはこの状態のグラフ作
成用データに基づいてグラフを作成すると図15に示す
ようなものとなる。すなわち、最上位の階層に出現回数
が6回と最も多いノード単語「表示」を配置し、その下
位に次に出現回数が多い(出現回数2)ノード単語「文
解析」が配置され、ノード単語「表示」とノード単語
「文解析」との間にはパスデータに相当する接続線が配
置される。さらに各特許文献における最末端のノード単
語の近傍には、特許文献名が表示される。
【0032】次にコンパクト化部33は、グラフ作成部
32により作成されたグラフの見やすさを改善すべくグ
ラフのコンパクト化を行う(ステップS33)。すなわ
ち、コンパクト化部33は、ある特許文献に対応するノ
ード単語およびパスデータに着目した場合に、他の特許
文献には対応しないノード単語がパスデータにより連続
していると判別された場合には、当該連続するノード単
語を一つのノード単語として扱い、両ノード単語間の関
係を定義するパスデータを削除する。
【0033】具体的にはこのコンパクト化部33による
コンパクト化後のグラフ作成用データに基づいてグラフ
を作成すると図16に示すようなものとなる。すなわ
ち、図15において接続線で結ばれていたノード単語
「視線検出」およびノード単語「警告」は、特許公開公
報H11ZZZZZの特許文献にのみ対応しているの
で、ノード単語「視線検出/警告」として取扱い、両ノ
ード単語間の関係を定義する接続線は削除されている。
同様に図15において接続線で結ばれていたノード単語
「画像データ読取」、「文字認識」およびノード単語
「……」は、特許公開公報H07XXXXXの特許文献
にのみ対応しているので、ノード単語「画像データ読取
/文字認識/……」として取扱い、これらのノード単語
間の関係を定義する接続線は削除されている。
【0034】次にビットマップ作成部34は、コンパク
ト化部33により生成されたコンパクト化後のグラフ作
成用データに基づいてグラフのビットマップ化(ビット
マップ画像化)を行い、ビットマップデータをデータベ
ース部15に格納する。この際にビットマップ作成部3
4は、各ノード単語のグラフ上の座標データを各ノード
単語に関連づけて記憶し、また、各特許文献名のグラフ
上の表示位置の座標を各特許文献に関連づけてデータベ
ース部15に格納する。次に制御部12は、グラフ表示
用のビットマップデータをデータベース部15から読出
し、表示部19を制御して、図16に示したような態様
で表示させる(ステップS7。これと並行して制御部1
2は、イベント判定部19を制御し、ユーザが表示部1
9の表示画面上でいずれかの特許文献にフォーカスして
いるか否か、例えば、マウスカーソルがいずれかの特許
文献名表示領域上にあるか否かを判別させる(ステップ
S8)。
【0035】ステップS8の判別においてユーザが表示
部19の表示画面上でいずれかの特許文献にフォーカス
している場合には(ステップS8;Yes)、制御部1
2は要約獲得部20を制御し、フォーカスされている特
許文献から要約文を抽出させる(ステップS11)。こ
の場合に、例えば、特許文献が公開公報であり、「要
約」の欄が存在するような場合には、当該「要約」欄の
文字列を取得し、図17に示すように表示部19の画面
上に所定時間の間表示し、その後非表示状態となる(ス
テップS11)。なお、特許文献に「要約」の欄に相当
する文章が存在しない場合には、既存の自然言語処理に
より生成した要約文を表示するように構成することも可
能である。ステップS8の判別においてユーザが表示部
19の表示画面上でいずれの特許文献にもフォーカスし
ていない場合には(ステップS8;No)、制御部12
は、イベント判定部19を制御し、ユーザが表示部19
の表示画面上でいずれかの特許文献を選択していないか
否か、例えば、マウスによりいずれかの特許文献名表示
領域上でクリック操作がなされていないか否かを判別さ
せる(ステップS9)。
【0036】ステップS9の判別において、ユーザが表
示部19の表示画面上でいずれかの特許文献を選択して
いる場合には(ステップS9;Yes)、対応する特許
文献の内容を表示し(ステップS7)、処理をステップ
S7に移行する。この場合において、特許文献の内容は
別ウィンドウを開いて表示しても良いし、図17に要約
の場合を示したように、グラフ内に表示するようにして
も良い。あるいはユーザがあらかじめ表示態様を設定可
能にしておいてもよい。ステップS9の判別において、
ユーザが表示部19の表示画面上でいずれの特許文献も
選択していない場合には(ステップS9;No)、制御
部12は、処理終了が指示されたか否かを判別する(ス
テップS10)。この場合に処理終了が指示されたと制
御部12が見なすのは、表示に用いているブラウザ画面
を閉じたり、ブラウザ内の終了ボタンをマウスによりク
リックしたり、新たな検索を指示したりした場合であ
る。ステップS10の判別において、処理終了が指示さ
れていない場合には、制御部12は、再び処理をステッ
プS7に移行して同様に処理を繰り返すこととなる。ま
た、ステップS10の判別において、制御部12は、処
理終了の指示がされたと判別した場合には、処理を終了
することとなる。
【0037】[3]実施形態の効果 本実施形態によれば、提示されるグラフに基づいて、特
許検索結果の複数の特許文献のうちいずれの特許文献を
優先的に読めば良いのかの判断を検索者が容易に行え
る。また、表示画面上でいずれかの特許文献名の表示領
域にマウスカーソルが存在すれば、要約を表示できるの
で、当該特許文献の概略を容易に把握でき、不要な特許
文献の本文データを取得することが必要なくなり、ひい
ては、特許検索時間の短縮化を図ることができる。 [4]実施形態の変形例 [4.1]第1変形例 以上の説明においては、特許検索システムがスタンドア
ロン方式の場合について説明したが、ネットワークを介
してサーバが実際の特許検索を行い、特許検索結果の表
示をネットワーク端末において行うように構成すること
も可能である。
【0038】[4.2]第2変形例 以上の説明においては、コンピュータを特許検索システ
ムとして機能させるための制御プログラムをROM、R
AMあるいは外部記憶装置に予め格納している場合につ
いて説明したが、この制御プログラムを光ディスクなど
のリムーバブル記録媒体に記録して、インストールする
ようにしたり、ネットワークを介してダウンロードし、
インストールするように構成することも可能である。ダ
ウンロードを行う場合には、実行のたびにダウンロード
するようにすることも可能である。
【0039】
【発明の効果】本発明によれば、特許検索結果の複数の
特許文献のうちいずれの特許文献を優先的に読めば良い
のかの判断を検索者が容易に行える。また、表示画面上
でいずれかの特許文献名の表示領域にマウスカーソルが
存在すれば、要約を表示できるので、当該特許文献の概
略を容易に把握でき、不要な特許文献の本文データを取
得することが必要なくなり、ひいては、特許検索時間の
短縮化を図ることができる。
【図面の簡単な説明】
【図1】 特許検索システムの概要構成ブロックであ
る。
【図2】 特許検索システムの概要処理フローチャート
である。
【図3】 ノードグループ化処理の処理フローチャート
である。
【図4】 配置図作成処理の処理フローチャートであ
る。
【図5】 特許文献の一例を説明する図である。
【図6】 図5の特許文献についての形態素解析結果の
説明図である。
【図7】 図6の形態素解析結果に基づいてノード候補
単語抽出を行った場合の説明図である。
【図8】 共起データの抽出の説明図である。
【図9】 ノードグループ化処理の説明図である。
【図10】 標準化処理の説明図である。
【図11】 ベクトル作成処理の説明図である。
【図12】 分類処理の説明図である。
【図13】 ノードグループ化結果の説明図である。
【図14】 ソート処理の説明図である。
【図15】 グラフ作成処理の説明図である。
【図16】 コンパクト化処理およびグラフ表示処理の
説明図である。
【図17】 要約標示処理の説明図である。
【符号の説明】
10……特許検索システム 11……操作部 12……制御部(ノード候補単語抽出部、配置図表示
部) 13……配置図作成部(配置図表示部) 14……ノード候補グループ化部(ノード候補単語抽出
部) 15……データベース部 16……形態素解析部(ノード候補単語抽出部) 17……ノード候補抽出部(ノード候補単語抽出部) 18……共起データ獲得部(ノード候補単語抽出部) 19……表示部(配置図表示部) 20……要約獲得部(配置図表示部) 21……イベント判定部(配置図表示部) 31……ソート部(配置図表示部) 32……グラフ作成部(配置図表示部) 33……コンパクト化部(配置図表示部) 34……ビットマップ作成部(配置図表示部) 41……ノードリスト作成部(ノード候補単語抽出部) 42……標準化部(ノード候補単語抽出部) 43……ベクトル作成部(ノード候補単語抽出部) 44……分類部(ノード候補単語抽出部)

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 複数の特許文献に対応する特許文献デー
    タから発明の構成要件に対応する単語を抽出し、当該単
    語をノード単語とするノード単語抽出部と、 抽出された前記ノード単語に基づいて構成要件相互の関
    係あるいは前記特許文献相互の関係を視覚化すべく前記
    ノード単語をノードとする前記発明の構成要件の相互関
    係を配置図として提示する配置図表示部と、 を備えたことを特徴とする特許検索装置。
  2. 【請求項2】 請求項1記載の特許検索装置において、 前記ノード単語を候補としたノード候補単語について相
    互の類似度を比較し、類似度が所定の類似度以上である
    場合に同一のグループに前記ノード候補単語をグループ
    化するノード候補グループ化部と、 前記ノード候補単語に共起する単語を獲得する共起デー
    タ獲得部と、 を備えたことを特徴とする特許検索装置。
  3. 【請求項3】 請求項1または請求項2記載の特許検索
    装置において、 前記配置図表示部は、前記配置図における前記ノードの
    表示態様をツリー構造とし、上位階層に前記出現回数の
    多いノード単語に対応する前記ノードを配置することを
    特徴とする特許検索装置。
  4. 【請求項4】 請求項1ないし請求項3のいずれかに記
    載の特許検索装置において、 前記ノード相互間はパスにより接続され、 前記配置図表示部は、いずれかのパスがいずれか一つの
    特許文献にのみ対応する場合に当該パスを削除し、当該
    削除したパスに対応する二つのノードをまとめて一つの
    ノードとするコンパクト化部を備えたことを特徴とする
    特許検索装置。
  5. 【請求項5】 請求項1ないし請求項4のいずれかに記
    載の特許検索装置において、 前記配置図上のいずれかの特許文献における最下位層の
    ノードに対応させて当該特許文献の名称が表示されてい
    る場合に、当該名称の表示領域に対応する所定の領域を
    ユーザが指示している場合に、当該特許文献の要約を獲
    得し、表示する要約獲得部を備えたことを特徴とする特
    許検索装置。
  6. 【請求項6】 請求項1ないし請求項4のいずれかに記
    載の特許検索装置において、 前記配置図上のいずれかの特許文献における最下位層の
    ノードに対応させて当該特許文献の名称が表示されてい
    る場合に、ユーザが当該名称の表示領域に対応する所定
    の領域を指定して、所定の文献表示操作を行った場合
    に、当該特許文献を表示する表示部を備えたことを特徴
    とする特許検索装置。
  7. 【請求項7】 複数の特許文献に対応する特許文献デー
    タから発明の構成要件に対応する単語を抽出し、当該単
    語をノード単語とするノード単語抽出過程と、 抽出された前記ノード単語に基づいて構成要件相互の関
    係あるいは前記特許文献相互の関係を視覚化すべく前記
    ノード単語をノードとする前記発明の構成要件の相互関
    係を配置図として提示する配置図表示過程と、 を備えたことを特徴とする特許検索装置の制御方法。
  8. 【請求項8】 請求項7記載の特許検索装置の制御方法
    において、 前記ノード単語の候補となるノード候補単語について相
    互の類似度を比較し、類似度が所定の類似度以上である
    場合に同一のグループに前記ノード候補単語をグループ
    化するノード候補グループ化過程と、 前記ノード候補単語に共起する単語を獲得する共起デー
    タ獲得過程と、を備えたことを特徴とする特許検索装置
    の制御方法。
  9. 【請求項9】 請求項7または請求項8記載の特許検索
    装置の制御方法において、 前記配置図表示過程において、前記配置図における前記
    ノードの表示態様をツリー構造とし、上位階層に前記出
    現回数の多いノード単語に対応する前記ノードを配置す
    ることを特徴とする特許検索装置の制御方法。
  10. 【請求項10】 請求項7ないし請求項9のいずれかに
    記載の特許検索装置の制御方法において、 前記ノード相互間はパスにより接続され、 前記配置図表示過程は、いずれかのパスがいずれか一つ
    の特許文献にのみ対応する場合に当該パスを削除し、当
    該削除したパスに対応する二つのノードをまとめて一つ
    のノードとするコンパクト化過程を備えたことを特徴と
    する特許検索装置の制御方法。
  11. 【請求項11】 請求項7ないし請求項10のいずれか
    に記載の特許検索装置の制御方法において、 前記配置図上のいずれかの特許文献における最下位層の
    ノードに対応させて当該特許文献の名称を表示する特許
    文献名称表示過程と、 当該名称の表示領域に対応する所定の領域をユーザが指
    示している場合に、当該特許文献の要約を獲得し、表示
    する要約獲得過程と、 を備えたことを特徴とする特許検索装置の制御方法。
  12. 【請求項12】 請求項7ないし請求項10のいずれか
    に記載の特許検索装置の制御方法において、 前記配置図上のいずれかの特許文献における最下位層の
    ノードに対応させて当該特許文献の名称を表示する特許
    文献名称表示過程と、 ユーザが当該名称の表示領域に対応する所定の領域を指
    定して、所定の文献表示操作を行った場合に、当該特許
    文献を表示する表示過程と、 を備えたことを特徴とする特許検索装置の制御方法。
  13. 【請求項13】 コンピュータを特許検索装置として機
    能させるための制御プログラムにおいて、 複数の特許文献に対応する特許文献データから発明の構
    成要件に対応する単語を抽出させ、 当該単語をノード単語とし、 抽出された前記ノード単語に基づいて構成要件相互の関
    係あるいは前記特許文献相互の関係を視覚化させるべく
    前記ノード単語をノードとする前記発明の構成要件の相
    互関係を配置図として提示させる、 ことを特徴とする制御プログラム。
  14. 【請求項14】 請求項13記載の制御プログラムにお
    いて、 前記ノード単語の候補となるノード候補単語と共起する
    単語を獲得させ、 獲得した単語を利用しながら前記ノード候補単語につい
    て相互の類似度を比較させ、 前記類似度が所定の類似度以上である場合に同一のグル
    ープに前記ノード候補単語をグループ化させる、 ことを特徴とする制御プログラム。
  15. 【請求項15】 請求項13または請求項14記載の制
    御プログラムにおいて、 前記配置図における前記ノードの表示態様をツリー構造
    とし、上位階層に前記出現回数の多いノード単語に対応
    する前記ノードを配置させることを特徴とする制御プロ
    グラム。
  16. 【請求項16】 請求項13ないし請求項15のいずれ
    かに記載の制御プログラムにおいて、 前記ノード相互間はパスにより接続させ、 いずれかのパスがいずれか一つの特許文献にのみ対応す
    る場合に当該パスを削除させ、 当該削除させたパスに対応する二つのノードをまとめて
    一つのノードとさせる、 ことを特徴とする制御プログラム。
  17. 【請求項17】 請求項13ないし請求項16のいずれ
    かに記載の制御プログラムにおいて、 前記配置図上のいずれかの特許文献における最下位層の
    ノードに対応させて当該特許文献の名称を表示させ、 当該名称の表示領域に対応する所定の領域をユーザが指
    示している場合に、当該特許文献の要約を獲得させ、表
    示させる、 ことを特徴とする制御プログラム。
  18. 【請求項18】 請求項13ないし請求項16のいずれ
    かに記載の制御プログラムにおいて、 前記配置図上のいずれかの特許文献における最下位層の
    ノードに対応させて当該特許文献の名称を表示させ、 ユーザが当該名称の表示領域に対応する所定の領域を指
    定して、所定の文献表示操作を行った場合に、当該特許
    文献を表示させる、 ことを特徴とする制御プログラム。
  19. 【請求項19】 請求項13ないし請求項18のいずれ
    かに記載の制御プログラムを記録したことを特徴とする
    記録媒体。
JP2002024406A 2002-01-31 2002-01-31 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体 Pending JP2003223466A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002024406A JP2003223466A (ja) 2002-01-31 2002-01-31 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002024406A JP2003223466A (ja) 2002-01-31 2002-01-31 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2003223466A true JP2003223466A (ja) 2003-08-08

Family

ID=27746864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002024406A Pending JP2003223466A (ja) 2002-01-31 2002-01-31 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2003223466A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101575797B1 (ko) 2008-06-26 2015-12-08 (주)윕스 특허문서의 열람 작업 로그 시스템 및 그 방법
JP2019200742A (ja) * 2018-05-18 2019-11-21 ヤフー株式会社 情報処理装置、情報処理方法、および情報処理プログラム
JP2020060811A (ja) * 2018-10-04 2020-04-16 Tis株式会社 情報処理装置、情報処理方法およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101575797B1 (ko) 2008-06-26 2015-12-08 (주)윕스 특허문서의 열람 작업 로그 시스템 및 그 방법
JP2019200742A (ja) * 2018-05-18 2019-11-21 ヤフー株式会社 情報処理装置、情報処理方法、および情報処理プログラム
JP2020060811A (ja) * 2018-10-04 2020-04-16 Tis株式会社 情報処理装置、情報処理方法およびプログラム
JP7203554B2 (ja) 2018-10-04 2023-01-13 Tis株式会社 情報処理装置

Similar Documents

Publication Publication Date Title
US8024175B2 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
US5077668A (en) Method and apparatus for producing an abstract of a document
US6442540B2 (en) Information retrieval apparatus and information retrieval method
JP3408291B2 (ja) 辞書作成支援装置
JP3577819B2 (ja) 情報探索装置及び情報探索方法
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
WO2010010918A1 (ja) 情報処理装置および情報処理方法
JPH07325827A (ja) ハイパーテキスト自動生成装置
US7197697B1 (en) Apparatus for retrieving information using reference reason of document
JPH11161682A (ja) 情報検索装置、情報検索方法及び記録媒体
JP2005043977A (ja) 文書間の類似度算出方法および装置
WO2008094970A9 (en) Method and apparatus for creating a tool for generating an index for a document
JP2020113129A (ja) 文書評価装置、文書評価方法及びプログラム
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
JP2006309347A (ja) 対象文書からキーワードを抽出する方法、システムおよびプログラム
JP5269399B2 (ja) 構造化文書検索装置、方法およびプログラム
JP2007279978A (ja) 文書検索装置及び文書検索方法
JP2005173999A (ja) 電子ファイル検索装置、電子ファイル検索システム、電子ファイル検索方法、プログラムおよび記録媒体
JP2000250908A (ja) 電子書籍の作成支援装置
JP2003223466A (ja) 特許検索装置、特許検索装置の制御方法、制御プログラムおよび記録媒体
JP2838984B2 (ja) 汎用参照装置
JP2004157965A (ja) 検索支援装置、検索支援方法、プログラムおよび記録媒体
JP4585768B2 (ja) 文書処理装置、文書処理方法および文書処理プログラム
JP4206266B2 (ja) 全文検索装置、処理方法、処理プログラム及び記録媒体
JP2006172489A (ja) 文書の参照理由を用いて情報検索を行なう装置