以下に、本願に係る表示プログラム、表示方法、及び表示装置を実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る表示プログラム、表示方法、及び表示装置が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(実施形態)
〔1.表示処理〕
まず、図1を用いて、実施形態に係る表示処理の一例について説明する。図1は、実施形態に係る表示処理の一例を示す図である。図1では、抽出装置100が特許文献(単に「特許」ともいう)の検索に用いるグラフ構造化されたグラフデータ(グラフ情報)を表示装置10が取得し、その情報に基づいて特許間の類似関係を示す画像情報(以下、単に「画像」ともいう)を表示する場合を示す。図1では、表示装置10は、各特許に対応するベクトルデータ(「ベクトル情報」や、単に「ベクトル」ともいう)がグラフ構造化されたグラフ情報を用いて特許間の類似関係を示す画像情報を表示する。なお、検索対象が特許文献(特許)である場合を一例として説明するが、検索対象は特許に限らず、どのような対象であってもよい。例えば、検索対象は、概要、提案手法等の複数の種類の情報を含む論文や画像等の種々の情報であってもよい。また、抽出装置100や表示装置10が用いる情報は、ベクトルに限らず、各検索対象の類似性を表現可能な情報であれば、どのような形式の情報であってもよい。例えば、抽出装置100や表示装置10は、各検索対象に対応する所定のデータや値を用いて検索対象をグラフ構造化したグラフ情報を用いてもよい。例えば、抽出装置100や表示装置10は、各検索対象から生成された所定の数値(例えば2進数の値や16進数の値)を用いて検索対象をグラフ構造化したグラフ情報を用いてもよい。例えば、ベクトルに代えて、データ間の距離(類似度)が定義されていれば任意の形態のデータであっても良い。
また、図1の例では、特許文献として特許の書類のうち、種類「要約書」と種類「図面」に対応する画像情報IM1、IM2を表示する場合を一例として示すが、特許の書類は、要約書や図面に限らず、明細書や特許請求の範囲(以下、「クレーム」とする場合がある)等の各種類に対応する書類であってもよい。すなわち、対象とする特許(オブジェクト)は、ベクトルとして表現可能であれば、どのような特許(情報)であってもよい。
〔1-1.グラフ情報について〕
まず、図1の表示処理の説明に先だって、抽出装置100が抽出処理に用いるグラフ情報の説明を行うことにより、表示装置10が表示する対象について説明する。表示装置10は、図17中のグラフ情報GR11に示すように、各ベクトル(ノード)が有向エッジにより連結され抽出装置100が抽出処理に用いるグラフデータを対象に表示処理を行う。なお、図17中のグラフ情報GR11に示すようなグラフ情報は、抽出装置100が生成してもよいし、抽出装置100は、図17中のグラフ情報GR11に示すようなグラフ情報を情報提供装置50(図2参照)等の他の外部装置から取得してもよい。なお、グラフ情報GR11は、特許の書類のうち、種類「要約書」に対応する要約情報(要約データ)をグラフ構造化したグラフ情報である。
また、ここでいう、有向エッジとは、一方向にしかデータを辿れないエッジを意味する。以下では、エッジにより辿る元、すなわち始点となるノードを参照元とし、エッジにより辿る先、すなわち終点となるノードを参照先とする。例えば、所定のノード「A」から所定のノード「B」に連結される有向エッジとは、参照元をノード「A」とし、参照先をノード「B」とするエッジであることを示す。なお、各ノードを連結するエッジは、有向エッジに限らず、種々のエッジであってもよい。例えば、各ノードを連結するエッジは、ノードを連結する方向のないエッジであってもよい。例えば、各ノードを連結するエッジは、相互に参照可能なエッジであってもよい。例えば、各ノードを連結するエッジは、全て双方向エッジであってもよい。
例えば、このようにノード「A」を参照元とするエッジをノード「A」の出力エッジという。また、例えば、このようにノード「B」を参照先とするエッジをノード「B」の入力エッジという。すなわち、ここでいう出力エッジ及び入力エッジとは、一の有向エッジをその有向エッジが連結する2つのノードのうち、いずれのノードを中心として捉えるかの相違であり、一の有向エッジが出力エッジ及び入力エッジになる。すなわち、出力エッジ及び入力エッジは、相対的な概念であって、一の有向エッジについて、参照元となるノードを中心として捉えた場合に出力エッジとなり、参照先となるノードを中心として捉えた場合に入力エッジとなる。なお、本実施形態においては、エッジについては、出力エッジや入力エッジ等の有向エッジを対象とするため、以下では、有向エッジを単に「エッジ」と記載する場合がある。
例えば、抽出装置100は、数百万~数億単位の特許文献に対応するノードを対象に処理を行うが、図面においてはその一部のみを図示する。図17の例では、説明を簡単にするために、8個のノードを図示して処理の概要を説明する。例えば、抽出装置100は、図17中のグラフ情報GR11に示すように、ノードN1、N2、N3等に示すような複数のノード(ベクトル)を含むグラフ情報を取得する。また、図17の例では、グラフ情報GR11における各ノードは、そのノードとの間の距離が近い方から所定数のノードへのエッジ(出力エッジ)が連結される。例えば、所定数は、目的や用途等に応じて、2や5や10や100等の種々の値であってもよい。例えば、所定数が2である場合、ノードN1からは、ノードN1からの距離が最も近いノード及び2番目に距離が近い2つノードに出力エッジが連結される。
また、このように「ノードN*(*は任意の数値)」と記載した場合、そのノードはノードID「N*」により識別されるノードであることを示す。例えば、「ノードN1」と記載した場合、そのノードはノードID「N1」により識別されるノードである。
また、図17中のグラフ情報GR11では、ノードN10は、ノードN7へ向かう有向エッジであるエッジE7が連結される。すなわち、ノードN10は、ノードN7とエッジE7により連結される。このように「エッジE*(*は任意の数値)」と記載した場合、そのエッジはエッジID「E*」により識別されるエッジであることを示す。例えば、「エッジE11」と記載した場合、そのエッジはエッジID「E11」により識別されるエッジである。例えば、ノードN10を参照元とし、ノードN7を参照先として連結されるエッジE7により、ノードN10からノードN7に辿ることが可能となる。この場合、有向エッジであるエッジE7は、ノードN10を中心として識別される場合、出力エッジとなり、ノードN7を中心として識別される場合、入力エッジとなる。また、図17のグラフ情報GR11中の双方向矢印は、両方のノードから他方のノードへの有向エッジが連結されることを示す。例えば、グラフ情報GR11中のノードN2とノードN451との間の双方向矢印は、ノードN2からノードN451へ向かう有向エッジと、ノードN451からノードN2へ向かう有向エッジとの2つのエッジが連結されることを示す。
また、図17中のグラフ情報GR11は、ユークリッド空間であってもよい。また、図17に示すグラフ情報GR11は、各ベクトル間の距離等の説明のための概念的な図であり、グラフ情報GR11は、多次元空間である。例えば、図17に示すグラフ情報GR11は、平面上に図示するため2次元の態様にて図示されるが、例えば100次元や1000次元等の多次元空間であるものとする。
ここで、ベクトルデータ間の距離は、特許文献の類似性を示し、距離が近いほど類似している。本実施形態においては、グラフ情報GR11における各ノードの距離を対応する各オブジェクト間の類似度とする。例えば、各ノードに対応する対象(特許文献)の類似性が、グラフ情報GR11内におけるノード間の距離として写像されているものとする。例えば、各ノードに対応する概念間の類似度が各ノード間の距離に写像されているものとする。ここで、図17に示す例においては、グラフ情報GR11における各ノード間の距離が短いオブジェクト同士の類似度が高く、グラフ情報GR11における各ノード間の距離が長いオブジェクト同士の類似度が低い。例えば、図17中のグラフ情報GR11において、ノードID「N35」により識別されるノードと、ノードID「N693」により識別されるノードとは近接している、すなわち距離が短い。そのため、ノードID「N35」により識別されるノードに対応するオブジェクトと、ノードID「N693」により識別されるノードに対応するオブジェクトとは類似度が高いことを示す。
また、例えば、図17中のグラフ情報GR11において、ノードID「N7」により識別されるノードと、ノードID「N2」により識別されるノードとは遠隔にある、すなわち距離が長い。そのため、ノードID「N7」により識別されるノードに対応するオブジェクトと、ノードID「N2」により識別されるノードに対応するオブジェクトとは類似度が低いことを示す。
〔1-2.ベクトルの生成例〕
また、ここでいう、各ノード(ベクトル)は、各オブジェクト(特許)に対応する。図17の例では、各特許の特許文献データ(特許文献情報)から抽出された特徴量により生成された多次元(N次元)のベクトルがオブジェクトであってもよい。図17の例では、抽出装置100は、特許文献情報に含まれる書類の種類ごとに生成されるベクトルを用いる。すなわち、抽出装置100は、各特許について、要約書、図面、明細書、及びクレームごとに生成された多次元(N次元)のベクトルを用いる。この場合、抽出装置100は、各種類について生成される複数のグラフ情報を用いる。図17の例では、説明を簡単にするために、抽出装置100は、各特許の要約書から抽出された特徴量により生成された多次元(N次元)のベクトルがグラフ構造化されたグラフ情報GR11を用いる場合を示す。以下、特許の一の書類の種類である要約書を基に説明する。なお、抽出装置100は、特許文献情報全体から抽出された特徴量により生成された多次元(N次元)のベクトルがオブジェクトとして用いてもよい。
例えば、抽出装置100は、特許文献情報の特徴を抽出するモデルを用いて各特許文献情報からN次元ベクトルを生成してもよい。図17の例では、抽出装置100は、モデル情報記憶部124(図12参照)に示すように、モデルID「M1」により識別されるモデル(モデルM1)を用いて、各特許の要約データからベクトルを生成する。上記のように、「モデルM*(*は任意の数値)」と記載した場合、そのモデルはモデルID「M*」により識別されるモデルであることを示す。例えば、「モデルM1」と記載した場合、そのモデルはモデルID「M1」により識別されるモデルである。また、モデル情報記憶部124に示すように、モデルM1は用途「特徴抽出(要約書)」、すなわち要約書(要約)のデータからの特徴抽出のために用いられるモデルであり、その具体的なモデルデータが「モデルデータMDT1」であることを示す。
例えば、抽出装置100は、モデルM1に要約書の要約情報を入力することにより、モデルM1中の各要素(ニューロン)の値を演算し、入力した要約情報と同様の情報を出力する。例えば、抽出装置100は、中間層の各要素(ニューロン)の値を特徴量として抽出し、各特許の要約書に対応するN次元のベクトルデータを生成してもよい。
ここで、図15を用いて、各特許の要約書に対応するベクトルデータの生成の一例を示す。図15は、実施形態に係る特徴量の抽出の一例を示す図である。図15は、モデルM1の概念図である。なお、図15では、各要素(ニューロン)の各接続関係を示す線の図示を省略する。図15に示すように、モデルM1は、入力層ILと、中間層CLと、出力層OLとを含む。例えば、モデルM1の入力層ILは、要約書の要約情報が入力される層である。また、出力層OLは、入力層ILへの入力に応じて、入力された要約情報と同様の情報を出力される層である。
また、例えば、中間層CLの中央部の最も圧縮された圧縮層RPは、入力された要約情報の特徴を表現する層である。例えば、モデルM1の中間層CLにおいて、入力層ILから圧縮層RPまでの間は、エンコードの処理を行う部分に対応する。モデルM1の中間層CLにおいて、入力層ILから圧縮層RPまでの間は、入力された要約情報の特徴を圧縮する処理を行う部分に対応する。例えば、モデルM1の中間層CLにおいて、圧縮層RPから出力層OLまでの間は、デコードの処理を行う部分に対応する。モデルM1の中間層CLにおいて、圧縮層RPから出力層OLまでの間は、圧縮された要約情報を復元する処理を行う部分に対応する。
例えば、抽出装置100は、圧縮層RPに含まれるニューロンNL1やニューロンNL2等の情報をベクトルに用いてもよい。例えば、抽出装置100は、要約書の要約情報が入力された場合に、算出されるニューロンNL1に対応する値VE1やニューロンNL2に対応する値VE2をベクトルの要素(一の次元の値)として抽出してもよい。例えば、抽出装置100は、要約書の要約情報が入力された場合に、算出されるニューロンNL1に対応する値VE1をその要約書のベクトルの1次元目の要素として抽出してもよい。また、例えば、抽出装置100は、要約書の要約情報が入力された場合に、算出されるニューロンNL2に対応する値VE2をその要約書のベクトルの2次元目の要素として抽出してもよい。このように、抽出装置100は、各要約書の要約情報をモデルM1に入力することにより、各要約書に対応するベクトルを生成してもよい。なお、抽出装置100は、各要約書に対応するベクトルを情報提供装置50等の他の外部装置から取得してもよい。なお、抽出装置100は、ベクトルの各要素として、各ニューロンに対応する値自体を用いてもよいし、各ニューロンに対応する値に所定の係数を乗算した値を用いてもよい。また、図17の例では説明を簡単にするために、ベクトルの各要素(値)が整数である場合を示すが、ベクトルの各要素(値)は、小数点以下の数値を含む実数であってもよい。
なお、抽出装置100は、圧縮層RPの要素(ニューロン)に限らず、中間層CL中の他の要素(ニューロン)の情報をベクトルに用いてもよい。例えば、抽出装置100は、エンコード部分のニューロンNL3やデコード部分のニューロンNL4等の情報をベクトルに用いてもよい。例えば、抽出装置100は、要約書の要約情報が入力された場合に、算出されるニューロンNL3に対応する値VE3やニューロンNL4に対応する値VE4をベクトルの要素(一の次元の値)として抽出してもよい。なお、上記は、一例であり、抽出装置100は、オートエンコーダに限らず、種々のモデルを用いて、要約情報からの特徴抽出を行ってもよい。また、例えば、トリプレットロス(triplet loss)といった類似性を学習する方法によりモデルを生成してもよい。また、抽出装置100は、モデルを用いずに、特徴抽出を行ってもよい。例えば、抽出装置100は、抽出装置100の管理者等が設定して特徴(素性)に対応する情報を要約情報から抽出し、ベクトルを生成してもよい。例えば、抽出装置100は、技術分野や解決手段や効果等の特徴(素性)に対応する情報を要約情報から抽出し、ベクトルを生成してもよい。
また、例えば、抽出装置100は、情報提供装置50等の他の外部装置からモデルM1を取得してもよい。なお、抽出装置100は、特許情報記憶部121(図9参照)に記憶された各特許の要約書の要約情報AD1、AD2、AD451等を入力として、モデルM1を生成してもよい。例えば、要約情報AD1、AD2、AD451等は、対応する特許文献中の要約書の文章全体であってもよい。また、例えば、要約情報AD1、AD2、AD451等は、対応する特許文献中の要約書の文章から抽出された各要素、例えば要約書に含まれる単語の一覧や単語の出現頻度等を示す情報であってもよい。また、例えば、要約情報AD1、AD2、AD451等が、文章や単語群である場合、抽出装置100は、Word2VecやDoc2Vecのようなアルゴリズム等を用いて、ベクトルを生成してもよい。例えば、抽出装置100は、要約情報AD1、AD2、AD451等から、Doc2Vecを用いてベクトルを生成してもよい。
抽出装置100は、要約書の要約情報(要約データ)が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたログ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、入力層に入力される情報と同様の情報を出力層から出力するモデルM1を生成してもよい。なお、抽出装置100は、他のモデルM2~M4についても同様の処理により生成する。例えば、抽出装置100は、モデルM2に特許の図面(選択図)の画像情報(画像データ)を入力することにより、モデルM2中の各要素(ニューロン)の値を演算し、入力した画像情報と同様の情報を出力する。例えば、抽出装置100は、中間層の各要素(ニューロン)の値を特徴量として抽出し、各特許に対応する図面に関するN次元のベクトルデータを生成してもよい。また、抽出装置100は、ベクトル生成に用いるモデルを情報提供装置50等の他の外部装置から取得してもよい。
例えば、抽出装置100は、上記のようなグラフ情報を表示装置10へ提供し、表示装置10は、抽出装置100から取得したグラフ情報に基づいて、複数のベクトルのエッジの連結関係による各検索対象の類似関係を示す画像情報を表示する。例えば、抽出装置100は、特許情報記憶部121やグラフ情報記憶部123等に記憶された各種情報を表示装置10へ提供する。
〔1-3.処理例〕
ここから、表示装置10による表示処理について説明する。図1の例では、表示装置10がユーザの指定に応じて、抽出装置100から特許書類の各種類に対応する複数のグラフ情報を取得し、取得したグラフ情報に基づいて、特許の類似関係を示す画像情報を表示する場合を示す。具体的には、図1の例では、表示装置10はユーザが指定した一の特許と他の特許との類似関係を示す画像情報を表示する場合を示す。図1の例では、表示装置10は、特許の類似関係の表示を所望するユーザU1が利用する。例えば、ユーザU1は、ある特許と類似関係を有する特許を把握することを所望するものとする。
図1では、表示装置10における表示内容等の変更に応じて、表示装置10を表示装置10-1~表示装置10-3として説明する。なお、表示装置10-1~表示装置10-3は同一の表示装置10である。また、以下では、表示装置10-1~表示装置10-3について、特に区別なく説明する場合には、表示装置10と記載する。
例えば、表示装置10は、制御情報として、ウェブブラウザソフトウェア上で実行されるスクリプトを取得し、取得したスクリプトを実行してもよい。このような制御情報は、実施形態に係る表示プログラムに対応するものであり、例えば、CSS(Cascading Style Sheets)、JavaScript(登録商標)、HTML(HyperText Markup Language)、あるいは、上述した表示処理を記述可能な任意の言語によって実現されてもよい。例えば、表示装置10は、上記のような制御情報に基づいて、画像情報の生成や表示等の種々の処理を行ってもよい。以下、実施形態に係る表示プログラムに従って上述した表示処理を実行する表示装置10等について、詳細に説明する。
まず、表示装置10は、ユーザU1による操作を受け付けることにより、グラフ情報の取得対象となる特許を指定する情報(指定情報)を抽出装置100へ送信する(ステップS11)。例えば、ユーザU1は、表示装置10において起動された閲覧アプリAP1を操作することにより、表示装置10から特許の指定情報を抽出装置100へ送信させる。例えば、ユーザU1は、閲覧アプリAP1において表示された特許の指定を受け付ける入力ボックス等に指定する特許を示す情報を入力することにより、表示装置10から特許の指定情報を抽出装置100へ送信させてもよい。なお、上記は一例であり、表示装置10から特許の指定情報を抽出装置100へ送信可能であれば、表示装置10は、どのような態様により指定情報を取得してもよい。
図1の例では、表示装置10は、特許#2を指定する指定情報を抽出装置100へ送信する。例えば、表示装置10は、特許#2を識別する特許ID「IP2」等の識別情報を指定情報として抽出装置100へ送信する。このように、表示装置10は、特許IP2(特許#2)を指定する指定情報を抽出装置100へ送信する。なお、以下では、「特許IP*(*は任意の数値)」と記載した場合、その特許は特許ID「IP*」により識別される特許であることを示す。例えば、「特許IP1」と記載した場合、その特許は特許ID「IP1」により識別される特許である。
そして、表示装置10から指定情報を取得した抽出装置100は、指定情報に対応するグラフ情報を取得する(ステップS12)。図1の例では、抽出装置100は、特許IP2を指定する指定情報を表示装置10から取得する。例えば、抽出装置100は、指定情報に対応するグラフ情報を記憶部120や外部の情報処理装置から取得する。図1の例では、抽出装置100は、指定された特許IP2に対応するグラフ情報をグラフ情報記憶部123(図11参照)や特許情報記憶部121(図9参照)から取得する。図1中のグラフ情報記憶部123は、グラフ情報の取得の一例として情報の一部を図示しており、種類「要約」に対応するグラフデータセット123-1の一部を図示する。抽出装置100は、図1中のグラフデータセット123-1に示すように、指定された特許IP2に対応するグラフ情報をグラフ情報記憶部123から取得する。
図1の例では、抽出装置100は、種類「要約」に対応するグラフデータセット123-1から、特許IP2に対応付けられたエッジ情報を取得する。また、抽出装置100は、グラフデータセット123-1から、特許IP2に対応付けられたエッジE21やエッジE22の情報を取得する。例えば、抽出装置100は、エッジE21の参照先がノードN38であることを示す情報やエッジE21の長さ(距離)を示す情報等を取得する。また、抽出装置100は、ノードN38が特許IP38に対応することを示す情報をグラフ情報記憶部123から取得してもよい。また、抽出装置100は、特許IP38の名称等の情報を特許情報記憶部121から取得してもよい。また、抽出装置100は、特許IP2の名称等の情報を特許情報記憶部121から取得してもよい。
また、抽出装置100は、他の種類「図面」、「明細書」及び「特許請求の範囲」に対応するグラフ情報も同様にグラフ情報記憶部123から取得する。例えば、抽出装置100は、種類「図面」に対応するグラフデータセット123-2(図11参照)から、特許IP2に対応付けられたエッジ情報等を取得する。例えば、抽出装置100は、種類「明細書」に対応するグラフデータセット123-3(図11参照)から、特許IP2に対応付けられたエッジ情報等を取得する。また、例えば、抽出装置100は、種類「特許請求の範囲」に対応するグラフデータセット123-4(図11参照)から、特許IP2に対応付けられたエッジ情報等を取得する。これにより、抽出装置100は、複数の種類「要約書」、「図面」、「明細書」及び「特許請求の範囲」の各々に対応するグラフ情報を含んだグラフ情報GINF11を取得する。
そして、抽出装置100は、グラフ情報GINF11を表示装置10へ提供する(ステップS13)。例えば、抽出装置100は、特許IP2に対応するグラフ情報GINF11を表示装置10へ送信する。
そして、抽出装置100からグラフ情報GINF11を取得した表示装置10は、グラフ情報GINF11に基づいて画像を表示する。例えば、表示装置10は、グラフ情報GINF11に基づいて、特許IP2とエッジの連結関係による他の特許の類似関係を示す画像を表示する。例えば、表示装置10は、グラフ情報GINF11のうち、種類「要約書」に関するグラフ情報に基づいて、特許IP2とエッジの連結関係による他の特許との種類「要約書」に関する類似関係を示す画像を表示する。例えば、表示装置10は、要約書情報記憶部141(図4参照)に示すような情報に基づいて、特許IP2と他の特許IP38やIP56等との種類「要約書」に関する類似関係を示す画像を表示する。また、抽出装置100は、他の種類「図面」、「明細書」及び「特許請求の範囲」についても同様に、特許IP2とエッジの連結関係による他の特許との各種類に関する類似関係を示す画像を表示する。
図1の例では、表示装置10は、グラフ情報GINF11に基づいて、画像情報IM1~IM4を生成する(ステップS14)。例えば、表示装置10は、グラフ情報GINF11のうち、種類「要約書」に関するグラフ情報に基づいて、画像情報IM1を生成する。例えば、表示装置10は、要約書情報記憶部141(図4参照)中の特許IP2が特許IP38や特許IP56や特許IP451や特許IP815とエッジで連結されていることを示す情報に基づいて、画像情報IM1を生成する。
例えば、表示装置10は、図1中の画像情報IM1に示すように、特許IP2が特許IP38や特許IP56や特許IP451や特許IP815とエッジで連結されていることを図として示す画像情報を生成する。例えば、表示装置10は、種々の従来技術を適宜用いて特許の類似関係を示す画像情報を生成する。例えば、表示装置10は、特許IP2や特許IP38や特許IP56や特許IP451や特許IP815を所定の図形(図1では円形)で図示し、各図形が各特許を連結するエッジに対応する線で接続された画像情報を生成する。例えば、表示装置10は、ユーザが指定した特許IP2の他の特許とは異なる態様で表示してもよい。例えば、表示装置10は、ユーザが指定した特許IP2の他の特許とは異なる色や異なる形状の図形で示す画像情報を生成してもよい。例えば、表示装置10は、イメージデータJPEG(Joint Photographic Experts Group)やGIF(Graphics Interchange Format)やPNG(Portable Network Graphics)など様々な形式で画像情報IM1を生成してもよい。例えば、表示装置10は、画像生成に関する種々の従来技術を適宜用いて、画像情報IM1を生成してもよい。なお、表示装置10は、各特許のエッジによる連結関係が図として表現されていれば、どのような態様によりエッジによる連結関係を示す画像情報を生成してもよい。また、例えば、表示装置10は、グラフ構造可視化に関する種々の従来技術を適宜用いて、画像情報IM1を生成したり、表示したりしてもよい。
また、抽出装置100は、他の種類「図面」、「明細書」及び「特許請求の範囲」についても同様に、特許IP2とエッジの連結関係による他の特許との各種類に関する類似関係を示す画像情報IM2~IM4を生成する。例えば、表示装置10は、グラフ情報GINF11のうち、種類「図面」に関するグラフ情報に基づいて、画像情報IM2を生成する。例えば、表示装置10は、図面情報記憶部142(図5参照)中の特許IP2が特許IP55や特許IP66や特許IP77や特許IP88とエッジで連結されていることを示す情報に基づいて、画像情報IM2を生成する。
また、例えば、表示装置10は、グラフ情報GINF11のうち、種類「明細書」に関するグラフ情報に基づいて、画像情報IM3を生成する。例えば、表示装置10は、明細書情報記憶部143(図6参照)中の特許IP2が特許IP66や特許IP1166や特許IP2277や特許IP33377とエッジで連結されていることを示す情報に基づいて、画像情報IM3を生成する。
また、例えば、表示装置10は、グラフ情報GINF11のうち、種類「特許請求の範囲」に関するグラフ情報に基づいて、画像情報IM4を生成する。例えば、表示装置10は、クレーム情報記憶部144(図7参照)中の特許IP2が特許IP77や特許IP2345や特許IP12568や特許IP44477とエッジで連結されていることを示す情報に基づいて、画像情報IM4を生成する。
また、表示装置10のグラフ情報GINF11の取得に応じて、閲覧アプリAP1の機能により、グラフ情報GINF11から画像情報IM1~IM4が生成されてもよい。例えば、閲覧アプリAP1の機能により、閲覧アプリAP1がグラフ情報GINF11を表示する際に、グラフ情報GINF11に基づいて、CSS、JavaScript(登録商標)、HTML等の情報を生成することにより、画像情報IM1~IM4を表示するための情報が生成されてもよい。また、画像情報IM1~IM4は、抽出装置100や情報提供装置50が生成してもよい。画像情報IM1~IM4を抽出装置100が生成する場合、画像生成に関する表示装置10の処理を抽出装置100が行ってもよい。
そして、表示装置10は、画像情報IM1~IM4を表示する。例えば、表示装置10は、閲覧アプリAP1により、画像情報IM1~IM4を表示する。図1の例では、表示装置10は、閲覧アプリAP1により、種類「要約」に対応する画像情報IM1を表示する(ステップS15)。これにより、表示装置10は、表示装置10-1から表示装置10-2へ表示が遷移する。表示装置10-2は、画像情報IM1が閲覧アプリAP1により表示された状態を示す。閲覧アプリAP1には、画像情報IM1~IM4等を表示する領域AR11や領域AR11に表示する種類を選択するタブTB1~TB4が表示される。
図1中の表示装置10-2は、種類「要約書」に対応するタブTB1、種類「図面」に対応するタブTB2、種類「明細書」に対応するタブTB3、種類「特許請求の範囲」に対応するタブTB4の4つのタブが表示され、タブTB1が選択された状態を示す。そのため、表示装置10-2においては、タブTB1が選択された状態であり、閲覧アプリAP1の領域AR11中に種類「要約書」に対応する画像情報IM1が表示される。なお、図1の例では、初期状態としてタブTB1が選択された状態を示すが、初期状態はタブTB1が選択された状態に限らず、前回の選択された状態等、種々の状態であってもよい。
図1に示す画像情報IM1においては、図形「○」が各特許を示し、図形「○」中の数字は「特許#*」(*は任意の数)の「*」に対応する。例えば、図形「○」中に数字「2」が図示される図形「○」は、特許#2に対応する。例えば、図形「○」中に数字「38」が図示される図形「○」は、特許#38に対応する。図1中の表示装置10-2は、種類「要約書」に関しては、特許IP2が特許IP38や特許IP56や特許IP451や特許IP815とエッジで連結される類似関係にあることを示す画像情報IM1を表示する。画像情報IM1中においては、特許IP2が特許IP38と線LN1で接続され、特許IP2が特許IP56と線LN2で接続される。また、画像情報IM1中においては、特許IP2が特許IP451と線LN3で接続され、特許IP2が特許IP815と線LN4で接続される。これにより、ユーザU1は、特許IP2が種類「要約書」に基づく場合、特許IP2が特許IP38や特許IP56や特許IP451や特許IP815と類似関係にあることを容易に把握することができる。
例えば、ユーザU1は、表示装置10の画面に表示されたマウスカーソルをタブTB2の位置に移動させ、タブTB2のクリック等の選択操作を行うことにより、種類「図面」を選択する。これにより、表示装置10は、選択情報を取得する(ステップS16)。
ユーザU1の選択情報を取得した表示装置10は、選択情報に基づいて表示を変更する(ステップS17)。このように、表示装置10は、ユーザによる種類の選択を示す選択情報を取得した場合、選択情報が示す種類に対応する画像情報(選択画像情報)を表示する。図1の例では、表示装置10は、タブTB2の種類「図面」に対応する画像情報IM2を表示する。図1の例では、表示装置10-2では、領域AR11に画像情報IM1が表示されているため、領域AR11に表示する画像を画像情報IM1から選択画像情報である画像情報IM2に変更する。これにより、表示装置10は、表示装置10-2から表示装置10-3へ表示が遷移する。表示装置10-3においては、タブTB2が選択された状態であり、閲覧アプリAP1の領域AR11中に種類「図面」に対応する画像情報IM2が表示される。表示装置10-3は、画像情報IM2が閲覧アプリAP1により表示された状態を示す。
図1中の表示装置10-3は、種類「図面」に関しては、特許IP2が特許IP55や特許IP66や特許IP77や特許IP88とエッジで連結される類似関係にあることを示す画像情報IM2を表示する。画像情報IM2中においては、特許IP2が特許IP55と線LN1-2で接続され、特許IP2が特許IP66と線LN2-2で接続される。また、画像情報IM2中においては、特許IP2が特許IP77と線LN3-2で接続され、特許IP2が特許IP88と線LN4-2で接続される。これにより、ユーザU1は、特許IP2が種類「図面」に基づく場合、特許IP2が特許IP55や特許IP66や特許IP77や特許IP88と類似関係にあることを容易に把握することができる。
上述したように、表示装置10は、各種類に対応するグラフ情報に基づく類似関係を示す画像情報を表示することにより、近傍検索に用いられるグラフに含まれる検索対象の類似関係を容易に把握可能にする。
〔1-4.距離に応じた表示〕
また、表示装置10は、各エッジ間の距離に応じて、対応する特許間の距離を変動させた画像情報を表示してもよい。例えば、表示装置10は、エッジE21の長さ(距離)がエッジE22の長さ(距離)よりも短い場合、画像情報IM1中の特許IP2と特許IP38との間の距離が特許IP2と特許IP56との間の距離よりも短くなるように画像情報IM1を生成してもよい。例えば、表示装置10は、グラフ構造可視化に関する種々の従来技術を適宜用いて、エッジE21の長さ(距離)が反映された画像情報を生成したり、表示したりしてもよい。例えば、表示装置10は、画像生成に関する種々の従来技術を適宜用いて、エッジE21の長さ(距離)が反映された画像情報を生成してもよい。例えば、表示装置10は、特許IP2と特許IP38とを接続する線LN1をエッジE21の長さ(距離)に基づく長さで表示してもよい。また、例えば、表示装置10は、特許IP2と特許IP56とを接続する線LN2をエッジE22の長さ(距離)に基づく長さで表示してもよい。
〔1-5.グラフ情報〕
また、図1の例では、表示装置10がユーザが指定した特許とその特許からのエッジが連結された特許のみを表示する場合を示したが、表示装置10は、各種類に対応するグラフ情報全体を表示してもよい。例えば、表示装置10は、種類「要約」に対応するグラフ情報全体を抽出装置100から取得し、種類「要約」に対応するグラフ情報全体のエッジの連結関係を示す画像情報を表示してもよい。
〔1-6.複数種類の同時表示〕
なお、図1の例では、タブの切換えにより、各種類の書類に基づく特許の類似関係を示す画像を表示する例を示したが、表示装置10は、複数の種類の書類に基づく特許の類似関係を示す画像を表示してもよい。この点について図19を用いて説明する。図19は、実施形態に係る表示処理の一例を示す図である。
図19の例では、表示装置10-21(表示装置10)は、グラフ情報GINF11に基づいて、画像情報IM21を生成する。例えば、表示装置10は、グラフ情報GINF11のうち、種類「要約書」及び種類「図面」に関するグラフ情報に基づいて、画像情報IM21を生成する。例えば、表示装置10は、要約書情報記憶部141(図4参照)中の特許IP2が特許IP38や特許IP56や特許IP451や特許IP815とエッジで連結されていることを示す情報に基づいて、画像情報IM21を生成する。画像情報IM21中においては、特許IP2が特許IP38と線LN1で接続され、特許IP2が特許IP56と線LN2で接続される。また、画像情報IM21中においては、特許IP2が特許IP451と線LN3で接続され、特許IP2が特許IP815と線LN4で接続される。また、例えば、表示装置10は、図面情報記憶部142(図5参照)中の特許IP2が特許IP55や特許IP66や特許IP77や特許IP88とエッジで連結されていることを示す情報に基づいて、画像情報IM21を生成する。画像情報IM21中においては、特許IP2が特許IP55と線LN1-2で接続され、特許IP2が特許IP66と線LN2-2で接続される。また、画像情報IM21中においては、特許IP2が特許IP77と線LN3-2で接続され、特許IP2が特許IP88と線LN4-2で接続される。
また、表示装置10は、特許IP2と種類「要約書」に基づく類似関係にある特許を接続する線LN1~LN4と、特許IP2と種類「図面」に基づく類似関係にある特許を接続する線LN1-2~LN4-2とを異なる形式(態様)で図示する画像情報IM21を生成する。図1の例では、表示装置10は、特許IP2と種類「要約書」に基づく類似関係にある特許を接続する線LN1~LN4を実線で示す画像情報IM21を生成する。また、図1の例では、表示装置10は、特許IP2と種類「図面」に基づく類似関係にある特許を接続する線LN1-2~LN4-2を点線で示す画像情報IM21を生成する。例えば、表示装置10は、画像生成やグラフ構造可視化に関する種々の従来技術を適宜用いて、画像情報IM21を生成してもよい。図19の例では、閲覧アプリAP1中に、図形「○」を接続する線の態様と特許の種類との対応を示す対応情報INF21が表示される。図19の例では、実線が種類「要約書」に対応し、点線が種類「図面」に対応することを示す。
上述したように、表示装置10は、複数の種類に対応するグラフ情報に基づく類似関係を示す画像情報を表示することにより、近傍検索に用いられるグラフに含まれる検索対象の類似関係を容易に把握可能にする。また、表示装置10は、各種類に対応する特許間の類似関係を示す線を異なる形式(態様)で示すことにより、いずれの特許間がどの種類に基づいて類似関係にあるのかをユーザが容易に把握することができる。
〔2.表示システムの構成〕
図2に示すように、表示システム1は、表示装置10と、情報提供装置50と、抽出装置100とが含まれる。表示装置10と、情報提供装置50と、抽出装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。図2は、実施形態に係る表示システムの構成例を示す図である。なお、図2に示した表示システム1には、複数台の表示装置10や、複数台の情報提供装置50や、複数台の抽出装置100が含まれてもよい。
表示装置10は、ユーザによって利用される情報処理装置である。表示装置10は、ユーザが利用する端末装置である。表示装置10は、ユーザによる種々の操作を受け付ける。なお、以下では、表示装置10をユーザと表記する場合がある。すなわち、以下では、ユーザを表示装置10と読み替えることもできる。なお、上述した表示装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。図1及び図17の例では、表示装置10は、ユーザU1が利用するノート型PCである場合を示す。
抽出装置100は、グラフ情報を表示装置10に送信する情報処理装置である。抽出装置100は、表示装置10から取得した特許の指定情報に基づいて、グラフ情報を表示装置10に送信する。また、抽出装置100は、起点ベクトルを起点としてグラフ情報を検索することにより、複数の特許文献のうち、一の発明に類似する特許文献である類似特許を抽出する情報処理装置である。例えば、抽出装置100は、一の発明に関する要約情報を取得し、要約書に対応するグラフ情報を取得する。例えば、抽出装置100は、一の発明に関する要約情報を取得し、特許文献情報と、グラフ情報の検索の起点となる起点ベクトルに関する情報とに基づいて、起点ベクトルを決定する。
抽出装置100は、ユーザ等に種々の情報提供を行うための情報が格納された情報処理装置である。例えば、抽出装置100は、表示装置10から一の発明の発明情報(以下、「クエリ情報」や「クエリ」ともいう)を取得すると、クエリに類似する特許(ベクトル情報等)を検索し、検索結果を表示装置10に提供する。図17の例では、抽出装置100は、表示装置10から一の発明(特許)の要約情報を取得すると、一の特許に類似する特許を検索し、検索結果を類似の特許として表示装置10に提供する。また、例えば、抽出装置100が表示装置10に提供するデータは、特許の名称や特許文献自体であってもよいし、URL(Uniform Resource Locator)等の対応するデータを参照するための情報であってもよい。
情報提供装置50は、抽出装置100に種々の情報提供を行うための情報が格納された情報処理装置である。例えば、情報提供装置50は、ウェブサーバ等の種々の外部装置から収集した特許情報等が格納されてもよい。例えば、情報提供装置50は、グラフ情報やインデックス情報やモデル等の種々の情報を抽出装置100に提供する情報処理装置である。
また、情報提供装置50は、表示装置10を利用するユーザに各種アプリを提供する情報処理装置である。例えば、情報提供装置50は、表示装置10を利用するユーザに閲覧アプリAP1に関するサービスを提供する。例えば、情報提供装置50は、表示装置10に閲覧アプリAP1に関する各種情報を提供する。例えば、閲覧アプリAP1は、ウェブブラウザであり、画像情報IM1~IM4等はウェブページ等のウェブブラウザに表示されるコンテンツであってもよい。
〔3.表示装置の構成〕
次に、図3を用いて、実施形態に係る表示装置10の構成について説明する。図3は、実施形態に係る表示装置の構成例を示す図である。図3に示すように、表示装置10は、通信部11と、入力部12と、出力部13と、記憶部14と、制御部15とを有する。
(通信部11)
通信部11は、例えば、通信回路等によって実現される。そして、通信部11は、図示しない所定の通信網と有線または無線で接続され、外部の情報処理装置との間で情報の送受信を行う。例えば、通信部11は、所定のネットワークN(図2参照)と有線または無線で接続され、抽出装置100や情報提供装置50との間で情報の送受信を行う。
(入力部12)
入力部12は、ユーザから各種操作が入力される。図1の例では、例えば、入力部12は、ノートPCのキーボードやタッチパッドやマウス等であってもよい。例えば、入力部12は、タッチパネル機能により表示面(例えば出力部13)を介してユーザからの各種操作を受け付けてもよい。また、入力部12は、表示装置10に設けられたボタンや、表示装置10に接続されたキーボードやマウスからの各種操作を受け付けてもよい。
(出力部13)
出力部13は、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ等によって実現されるタブレット端末等の表示画面であり、各種情報を表示するための表示装置である。
(記憶部14)
記憶部14は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部14は、例えば、表示装置10にインストールされているアプリケーションに関する情報、例えばプログラム等を記憶する。例えば、記憶部14は、例えば、表示装置10に特許の類似関係を示す画像情報を表示する表示アプリやビューア等のプログラム等を記憶する。また、実施形態に係る記憶部14は、図3に示すように、要約書情報記憶部141と、図面情報記憶部142と、明細書情報記憶部143と、クレーム情報記憶部144とを有する。このように、記憶部14は、検索対象に関する情報の各種類に対応する情報が記憶される。
(要約書情報記憶部141)
実施形態に係る要約書情報記憶部141は、特許の要約書に関する情報を記憶する。図4は、実施形態に係る要約書情報記憶部の一例を示す図である。例えば、要約書情報記憶部141は、検索対象に含まれる情報のうち、一の種類である要約書に関する情報を記憶する。すなわち、要約書情報記憶部141は、検索対象である特許に含まれる種類「要約書」に対応する情報を記憶する。例えば、要約書情報記憶部141は、特許の要約書に関するグラフ情報や特許の要約書に関する画像情報を記憶する。図4に示す要約書情報記憶部141は、「対象書類」、「画像情報」、「ノードID」、「特許ID」および「エッジ情報」といった項目を有する。また、「エッジ情報」には、「エッジID」や「類似関係特許」や「距離」といった情報が含まれる。
「対象書類」は、検索対象に含まれる情報のうちどの種類の情報(書類)であるかを示す。「画像情報」は、対応する特許ID(ノードID)やエッジ情報を基に生成された画像情報を示す。「ノードID」は、グラフ情報における各ノード(対象)を識別するための識別情報を示す。また、「特許ID」は、特許を識別するための識別情報を示す。図4の例では、「特許ID」には、特許IDとともに特許の具体的な名称等が記憶されてもよい。
また、「エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。また、「エッジID」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「類似関係特許」は、エッジにより連結された特許(ノード)を示す。図4の例では、「類似関係特許」は、ノードIDと特許IDとが記憶される。また、「距離」は、対応するエッジの長さ(距離)を示す。図4の例では、「距離」は、「D21」等の抽象的な符号で図示するが、エッジの長さ(距離)を示す具体的な数値が記憶されてもよい。
例えば、図4の例では、対象書類は、書類ID「TID1」により識別される書類「要約書」であることを示す。また、書類「要約書」に対応する画像情報として画像ID「IM1」により識別される画像情報(画像IM1)が記憶されていることを示す。また、画像IM1は、ノードID「N2」により識別されるノード(特許)と連結関係にあるノード(特許)との類似関係を示す画像であることを示す。
例えば、図4の例では、ノードID「N2」により識別されるノード(ノードN2)は、特許ID「IP2」により識別される特許(特許IP2)に対応することを示す。また、ノードN2は、エッジID「E21」により識別されるエッジが、ノードID「N38」により識別されるノード(ノードN38)に連結されることを示す。すなわち、図4の例では、ノードN2に対応する特許IP2は、ノードN38に対応する特許IP38がエッジにより連結された類似関係特許であることを示す。また、ノードN2に対応する特許IP2は、ノードN38に対応する特許IP38がエッジとの間の距離は、距離D21であることを示す。
このように、図4の例では、特許IP2(特許#2)が、特許IP38(特許#38)、特許IP56(特許#56)、特許IP451(特許#451)及び特許IP815(特許#815)と要約書に基づく類似関係を有することを示す情報やその画像情報IM1が記憶される。なお、要約書情報記憶部141は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(図面情報記憶部142)
実施形態に係る図面情報記憶部142は、特許の図面に関する情報を記憶する。図5は、実施形態に係る図面情報記憶部の一例を示す図である。例えば、図面情報記憶部142は、検索対象に含まれる情報のうち、一の種類である図面に関する情報を記憶する。すなわち、図面情報記憶部142は、検索対象である特許に含まれる種類「図面」に対応する情報を記憶する。例えば、図面情報記憶部142は、特許の図面に関するグラフ情報や特許の図面に関する画像情報を記憶する。図5に示す図面情報記憶部142は、「対象書類」、「画像情報」、「ノードID」、「特許ID」および「エッジ情報」といった項目を有する。また、「エッジ情報」には、「エッジID」や「類似関係特許」や「距離」といった情報が含まれる。
「対象書類」は、検索対象に含まれる情報のうちどの種類の情報(書類)であるかを示す。「画像情報」は、対応する特許ID(ノードID)やエッジ情報を基に生成された画像情報を示す。「ノードID」は、グラフ情報における各ノード(対象)を識別するための識別情報を示す。また、「特許ID」は、特許を識別するための識別情報を示す。図5の例では、「特許ID」には、特許IDとともに特許の具体的な名称等が記憶されてもよい。
また、「エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。また、「エッジID」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「類似関係特許」は、エッジにより連結された特許(ノード)を示す。図5の例では、「類似関係特許」は、ノードIDと特許IDとが記憶される。また、「距離」は、対応するエッジの長さ(距離)を示す。図5の例では、「距離」は、「D221」等の抽象的な符号で図示するが、エッジの長さ(距離)を示す具体的な数値が記憶されてもよい。
例えば、図5の例では、対象書類は、書類ID「TID2」により識別される書類「図面」であることを示す。また、書類「図面」に対応する画像情報として画像ID「IM2」により識別される画像情報(画像IM2)が記憶されていることを示す。また、画像IM2は、ノードID「N2-2」により識別されるノード(特許)と連結関係にあるノード(特許)との類似関係を示す画像であることを示す。
例えば、図5の例では、ノードID「N2-2」により識別されるノード(ノードN2-2)は、特許ID「IP2」により識別される特許(特許IP2)に対応することを示す。また、ノードN2-2は、エッジID「E21-2」により識別されるエッジが、ノードID「N55-2」により識別されるノード(ノードN55-2)に連結されることを示す。すなわち、図5の例では、ノードN2-2に対応する特許IP2は、ノードN55-2に対応する特許IP55がエッジにより連結された類似関係特許であることを示す。また、ノードN2-2に対応する特許IP2は、ノードN55-2に対応する特許IP55がエッジとの間の距離は、距離D221であることを示す。
このように、図5の例では、特許IP2(特許#2)が、特許IP55(特許#55)、特許IP66(特許#66)、特許IP77(特許#77)及び特許IP88(特許#88)と図面に基づく類似関係を有することを示す情報やその画像情報IM2が記憶される。なお、図面情報記憶部142は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(明細書情報記憶部143)
実施形態に係る明細書情報記憶部143は、特許の明細書に関する情報を記憶する。図6は、実施形態に係る明細書情報記憶部の一例を示す図である。例えば、明細書情報記憶部143は、検索対象に含まれる情報のうち、一の種類である明細書に関する情報を記憶する。すなわち、明細書情報記憶部143は、検索対象である特許に含まれる種類「明細書」に対応する情報を記憶する。例えば、明細書情報記憶部143は、特許の明細書に関するグラフ情報や特許の明細書に関する画像情報を記憶する。図6に示す明細書情報記憶部143は、「対象書類」、「画像情報」、「ノードID」、「特許ID」および「エッジ情報」といった項目を有する。また、「エッジ情報」には、「エッジID」や「類似関係特許」や「距離」といった情報が含まれる。
「対象書類」は、検索対象に含まれる情報のうちどの種類の情報(書類)であるかを示す。「画像情報」は、対応する特許ID(ノードID)やエッジ情報を基に生成された画像情報を示す。「ノードID」は、グラフ情報における各ノード(対象)を識別するための識別情報を示す。また、「特許ID」は、特許を識別するための識別情報を示す。図6の例では、「特許ID」には、特許IDとともに特許の具体的な名称等が記憶されてもよい。
また、「エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。また、「エッジID」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「類似関係特許」は、エッジにより連結された特許(ノード)を示す。図6の例では、「類似関係特許」は、ノードIDと特許IDとが記憶される。また、「距離」は、対応するエッジの長さ(距離)を示す。図6の例では、「距離」は、「D321」等の抽象的な符号で図示するが、エッジの長さ(距離)を示す具体的な数値が記憶されてもよい。
例えば、図6の例では、対象書類は、書類ID「TID3」により識別される書類「明細書」であることを示す。また、書類「明細書」に対応する画像情報として画像ID「IM3」により識別される画像情報(画像IM3)が記憶されていることを示す。また、画像IM3は、ノードID「N2-3」により識別されるノード(特許)と連結関係にあるノード(特許)との類似関係を示す画像であることを示す。
例えば、図6の例では、ノードID「N2-3」により識別されるノード(ノードN2-3)は、特許ID「IP2」により識別される特許(特許IP2)に対応することを示す。また、ノードN2-3は、エッジID「E21-3」により識別されるエッジが、ノードID「N66-3」により識別されるノード(ノードN66-3)に連結されることを示す。すなわち、図6の例では、ノードN2-3に対応する特許IP2は、ノードN66-3に対応する特許IP66がエッジにより連結された類似関係特許であることを示す。また、ノードN2-3に対応する特許IP2は、ノードN66-3に対応する特許IP66がエッジとの間の距離は、距離D321であることを示す。
このように、図6の例では、特許IP2(特許#2)が、特許IP66(特許#66)、特許IP1166(特許#1166)、特許IP2277(特許#2277)及び特許IP33377(特許#33377)と明細書に基づく類似関係を有することを示す情報やその画像情報IM3が記憶される。なお、明細書情報記憶部143は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(クレーム情報記憶部144)
実施形態に係るクレーム情報記憶部144は、特許の特許請求の範囲(クレーム)に関する情報を記憶する。図7は、実施形態に係るクレーム情報記憶部の一例を示す図である。例えば、クレーム情報記憶部144は、検索対象に含まれる情報のうち、一の種類である特許請求の範囲(クレーム)に関する情報を記憶する。すなわち、クレーム情報記憶部144は、検索対象である特許に含まれる種類「特許請求の範囲」に対応する情報を記憶する。例えば、クレーム情報記憶部144は、特許のクレームに関するグラフ情報や特許のクレームに関する画像情報を記憶する。図7に示すクレーム情報記憶部144は、「対象書類」、「画像情報」、「ノードID」、「特許ID」および「エッジ情報」といった項目を有する。また、「エッジ情報」には、「エッジID」や「類似関係特許」や「距離」といった情報が含まれる。
「対象書類」は、検索対象に含まれる情報のうちどの種類の情報(書類)であるかを示す。「画像情報」は、対応する特許ID(ノードID)やエッジ情報を基に生成された画像情報を示す。「ノードID」は、グラフ情報における各ノード(対象)を識別するための識別情報を示す。また、「特許ID」は、特許を識別するための識別情報を示す。図7の例では、「特許ID」には、特許IDとともに特許の具体的な名称等が記憶されてもよい。
また、「エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。また、「エッジID」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「類似関係特許」は、エッジにより連結された特許(ノード)を示す。図7の例では、「類似関係特許」は、ノードIDと特許IDとが記憶される。また、「距離」は、対応するエッジの長さ(距離)を示す。図7の例では、「距離」は、「D421」等の抽象的な符号で図示するが、エッジの長さ(距離)を示す具体的な数値が記憶されてもよい。
例えば、図7の例では、対象書類は、書類ID「TID4」により識別される書類「特許請求の範囲」であることを示す。また、書類「特許請求の範囲」に対応する画像情報として画像ID「IM4」により識別される画像情報(画像IM4)が記憶されていることを示す。また、画像IM4は、ノードID「N2-4」により識別されるノード(特許)と連結関係にあるノード(特許)との類似関係を示す画像であることを示す。
例えば、図7の例では、ノードID「N2-4」により識別されるノード(ノードN2-4)は、特許ID「IP2」により識別される特許(特許IP2)に対応することを示す。また、ノードN2-4は、エッジID「E21-4」により識別されるエッジが、ノードID「N77-4」により識別されるノード(ノードN77-4)に連結されることを示す。すなわち、図7の例では、ノードN2-4に対応する特許IP2は、ノードN77-4に対応する特許IP77がエッジにより連結された類似関係特許であることを示す。また、ノードN2-4に対応する特許IP2は、ノードN77-4に対応する特許IP77がエッジとの間の距離は、距離D421であることを示す。
このように、図7の例では、特許IP2(特許#2)が、特許IP77(特許#77)、特許IP2345(特許#2345)、特許IP12568(特許#12568)及び特許IP44477(特許#44477)とクレームに基づく類似関係を有することを示す情報やその画像情報IM4が記憶される。なお、クレーム情報記憶部144は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(制御部15)
制御部15は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、表示装置10内部の記憶部14などの記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。例えば、この各種プログラムは、表示処理を行うアプリケーションのプログラムが含まれる。また、制御部15は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部15は、取得部151と、生成部152と、表示部153と、送信部154とを有し、以下に説明する表示処理の機能や作用を実現または実行する。なお、制御部15の内部構成は、図3に示した構成に限られず、後述する表示処理を行う構成であれば他の構成であってもよい。また、制御部15が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
(取得部151)
取得部151は、各種情報を取得する。例えば、取得部151は、要約書情報記憶部141や図面情報記憶部142や明細書情報記憶部143やクレーム情報記憶部144等から各種情報を取得する。また、取得部151は、各種情報を外部の情報処理装置から取得してもよい。
例えば、取得部151は、抽出装置100や情報提供装置50から各種情報を取得する。例えば、取得部151は、抽出装置100や情報提供装置50から閲覧アプリAP1に関する各種情報を取得する。例えば、取得部151は、抽出装置100や情報提供装置50から閲覧アプリAP1のインストールに用いる情報や閲覧アプリAP1のアップデートに用いる情報を取得する。例えば、取得部151は、抽出装置100や情報提供装置50から閲覧アプリAP1において表示される画像情報を取得してもよい。
例えば、取得部151は、入力部12を介して、表示装置10を利用するユーザによる各種操作の入力を取得する。例えば、取得部151は、表示装置10を利用するユーザによる特許を指定する情報(指定情報)を取得する。例えば、取得部151は、表示装置10を利用するユーザによる画像を表示する種類を選択する情報(選択情報)を取得する。
取得部151は、近傍検索における複数の検索対象が類似性に応じてエッジにより連結されたグラフ情報を取得する。また、取得部151は、複数の特許出願書類の各々に含まれる各要約書に対応する複数のベクトルの類似性に応じて、各要約書に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得する。また、取得部151は、複数の特許出願書類の各々に含まれる各図面に対応する複数のベクトルの類似性に応じて、各図面に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得する。また、取得部151は、複数の特許出願書類の各々に含まれる各明細書に対応する複数のベクトルの類似性に応じて、各明細書に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得する。また、取得部151は、複数の特許出願書類の各々に含まれる各特許請求の範囲に対応する複数のベクトルの類似性に応じて、各特許請求の範囲に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得する。例えば、取得部151は、近傍検索における複数の検索対象の各々に対応する複数のベクトルが類似性に応じてエッジにより連結されたグラフ情報を取得する。また、取得部151は、複数の検索対象の各々の特徴を示す複数のベクトルが類似性に応じてエッジにより連結されたグラフ情報を取得する。
また、取得部151は、所定のモデルを用いて複数の検索対象から抽出された特徴量を要素とする複数のベクトルが、類似性に応じてエッジにより連結されたグラフ情報を取得する。また、取得部151は、複数の検索対象に関する情報を所定のモデルに入力することにより、抽出される複数の検索対象の各々の特徴量を要素とする複数のベクトルが、類似性に応じてエッジにより連結されたグラフ情報を取得する。
また、取得部151は、複数の検索対象の各々に含まれる情報の各種類に対応する複数のグラフ情報を取得する。また、取得部151は、ユーザによる種類の選択を示す選択情報を取得する。また、取得部151は、複数の検索対象である複数の特許出願書類の各々に含まれる書類の各種類に対応する複数のグラフ情報を取得する。
また、取得部151は、複数の特許出願書類の各々に含まれる各要約書に対応する複数のベクトルが類似性に応じて連結されたグラフ情報を含む複数のグラフ情報を取得する。また、取得部151は、複数の特許出願書類の各々に含まれる各図面に対応する複数のベクトルが類似性に応じて連結されたグラフ情報を含む複数のグラフ情報を取得する。また、取得部151は、複数の特許出願書類の各々に含まれる各明細書に対応する複数のベクトルが類似性に応じて連結されたグラフ情報を含む複数のグラフ情報を取得する。また、取得部151は、複数の特許出願書類の各々に含まれる各特許請求の範囲に対応する複数のベクトルが類似性に応じて連結されたグラフ情報を含む複数のグラフ情報を取得する。
図1の例では、取得部151は、抽出装置100からグラフ情報GINF11を取得する。取得部151は、ユーザU1による操作に関する情報を取得する。取得部151は、ユーザU1が特許#2を指定する指定情報を取得する。取得部151は、選択情報を取得する。取得部151は、ユーザU1が種類「図面」を選択することを示す選択情報を取得する。
(生成部152)
生成部152は、種々の情報を生成する。生成部152は、記憶部14に記憶された情報に基づいて、種々の情報を生成する。例えば、生成部152は、記憶部14に記憶された情報に基づいて、画像情報を生成する。生成部152は、要約書情報記憶部141や図面情報記憶部142や明細書情報記憶部143やクレーム情報記憶部144等に記憶された情報に基づいて、種々の情報を生成する。
図1の例では、生成部152は、グラフ情報GINF11に基づいて、画像情報IM1~IM4を生成する。例えば、生成部152は、グラフ情報GINF11のうち、種類「要約書」に関するグラフ情報に基づいて、画像情報IM1を生成する。例えば、生成部152は、要約書情報記憶部141(図4参照)中の特許IP2が特許IP38や特許IP56や特許IP451や特許IP815とエッジで連結されていることを示す情報に基づいて、画像情報IM1を生成する。
例えば、生成部152は、図1中の画像情報IM1に示すように、特許IP2が特許IP38や特許IP56や特許IP451や特許IP815とエッジで連結されていることを図として示す画像情報を生成する。
また、抽出装置100は、他の種類「図面」、「明細書」及び「特許請求の範囲」についても同様に、特許IP2とエッジの連結関係による他の特許との各種類に関する類似関係を示す画像情報IM2~IM4を生成する。例えば、生成部152は、グラフ情報GINF11のうち、種類「図面」に関するグラフ情報に基づいて、画像情報IM2を生成する。例えば、生成部152は、図面情報記憶部142(図5参照)中の特許IP2が特許IP55や特許IP66や特許IP77や特許IP88とエッジで連結されていることを示す情報に基づいて、画像情報IM2を生成する。
また、例えば、生成部152は、グラフ情報GINF11のうち、種類「明細書」に関するグラフ情報に基づいて、画像情報IM3を生成する。例えば、生成部152は、明細書情報記憶部143(図6参照)中の特許IP2が特許IP66や特許IP1166や特許IP2277や特許IP33377とエッジで連結されていることを示す情報に基づいて、画像情報IM3を生成する。
また、例えば、生成部152は、グラフ情報GINF11のうち、種類「特許請求の範囲」に関するグラフ情報に基づいて、画像情報IM4を生成する。例えば、生成部152は、クレーム情報記憶部144(図7参照)中の特許IP2が特許IP77や特許IP2345や特許IP12568や特許IP44477とエッジで連結されていることを示す情報に基づいて、画像情報IM4を生成する。
(表示部153)
表示部153は、種々の情報を表示する。例えば、表示部153は、出力部13を介して各種情報を表示する。例えば、表示部153は、記憶部14に記憶された各種情報を用いて、種々の情報を表示する。例えば、表示部153は、要約書情報記憶部141や図面情報記憶部142や明細書情報記憶部143やクレーム情報記憶部144等に記憶された各種情報を用いて、種々の情報を表示する。例えば、表示部153は、生成部152により生成された画像情報を表示する。例えば、表示部153は、記憶部14に記憶された各種情報に基づいて、画面の表示を変更する。例えば、表示部153は、要約書情報記憶部141や図面情報記憶部142や明細書情報記憶部143やクレーム情報記憶部144等に記憶された各種情報に基づいて、画面の表示を変更する。
また、表示部153は、取得部151により取得されたグラフ情報に基づいて、複数の検索対象のエッジの連結関係による各検索対象の類似関係を示す画像情報を表示する。表示部153は、複数のグラフ情報に基づいて、各種類に対応する複数の検索対象のエッジによる連結関係を示す複数の画像情報を表示する。表示部153は、取得部151により取得されたグラフ情報に基づいて、複数のベクトルのエッジの連結関係による各検索対象の類似関係を示す画像情報を表示する。表示部153は、複数のグラフ情報に基づいて、各種類に対応する複数のベクトルのエッジによる連結関係を示す複数の画像情報を表示する。表示部153は、選択情報が示す種類に対応する選択画像情報を表示する。また、表示部153は、複数の画像情報のうち、所定の基準により選択される一の種類に対応する画像情報である選択画像情報を表示する。また、表示部153は、他の画像情報が表示されている場合、他の画像情報から選択画像情報に表示を変更する。
図1の例では、表示部153は、グラフ情報GINF11に基づいて画像を表示する。例えば、表示部153は、グラフ情報GINF11に基づいて、特許IP2とエッジの連結関係による他の特許の類似関係を示す画像を表示する。例えば、表示部153は、グラフ情報GINF11のうち、種類「要約書」に関するグラフ情報に基づいて、特許IP2とエッジの連結関係による他の特許との種類「要約書」に関する類似関係を示す画像を表示する。例えば、表示部153は、要約書情報記憶部141(図4参照)に示すような情報に基づいて、特許IP2と他の特許IP38やIP56等との種類「要約書」に関する類似関係を示す画像を表示する。また、抽出装置100は、他の種類「図面」、「明細書」及び「特許請求の範囲」についても同様に、特許IP2とエッジの連結関係による他の特許との各種類に関する類似関係を示す画像を表示する。
表示部153は、画像情報IM1~IM4を表示する。例えば、表示部153は、閲覧アプリAP1により、画像情報IM1~IM4を表示する。図1の例では、表示部153は、閲覧アプリAP1により、種類「要約」に対応する画像情報IM1を表示する。表示部153は、種類「要約書」に関しては、特許IP2が特許IP38や特許IP56や特許IP451や特許IP815とエッジで連結される類似関係にあることを示す画像情報IM1を表示する。例えば、表示部153は、抽出装置100や情報提供装置50等の外部の情報処理装置から取得した画像情報を表示してもよい。表示部153は、抽出装置100や情報提供装置50等の外部の情報処理装置から取得した画像情報IM1~IM4を表示してもよい。この場合、表示装置10は、生成部152を有しなくてもよい。
図1の例では、表示部153は、選択情報に基づいて表示を変更する。このように、表示部153は、ユーザによる種類の選択を示す選択情報を取得した場合、選択情報が示す種類に対応する画像情報(選択画像情報)を表示する。表示部153は、タブTB2の種類「図面」に対応する画像情報IM2を表示する。表示部153では、領域AR11に画像情報IM1が表示されているため、領域AR11に表示する画像を画像情報IM1から選択画像情報である画像情報IM2に変更する。表示部153は、種類「図面」に関しては、特許IP2が特許IP55や特許IP66や特許IP77や特許IP88とエッジで連結される類似関係にあることを示す画像情報IM2を表示する。
(送信部154)
送信部154は、各種情報を送信する。例えば、送信部154は、各種情報を外部の情報処理装置へ送信する。また、例えば、送信部154は、抽出装置100や情報提供装置50に各種情報を提供する。例えば、送信部154は、抽出装置100に特許に関する各種情報の要求を送信する。例えば、送信部154は、抽出装置100にグラフに関する各種情報の要求を送信する。例えば、送信部154は、抽出装置100や情報提供装置50に画像情報を表示するアプリケーションやビューアに関する各種情報の要求を送信する。例えば、送信部154は、抽出装置100や情報提供装置50に閲覧アプリAP1に関する各種情報の要求を送信する。例えば、送信部154は、入力部12により入力されたユーザ操作に従って、外部の情報処理装置へ種々の情報を送信してもよい。
図1の例では、送信部154は、ユーザU1による操作を受け付けることにより、グラフ情報の取得対象となる特許を指定する情報(指定情報)を抽出装置100へ送信する。送信部154は、特許#2を指定する指定情報を抽出装置100へ送信する。例えば、送信部154は、特許#2を識別する特許ID「IP2」等の識別情報を指定情報として抽出装置100へ送信する。このように、送信部154は、特許IP2(特許#2)を指定する指定情報を抽出装置100へ送信する。
なお、上述した制御部15による表示処理等の処理は、所定のアプリケーションにより行われる場合、制御部15の各部は、例えば、所定のアプリケーションにより実現されてもよい。例えば、制御部15による表示処理や表示処理等の処理は、JavaScript(登録商標)などを含む制御情報により実現されてもよい。また、上述した表示処理や表示処理等が専用アプリにより行われる場合、制御部15は、例えば、所定のアプリ(例えば図1の閲覧アプリAP1等)や専用アプリを制御するアプリ制御部を有してもよい。
〔4.抽出装置の構成〕
次に、図8を用いて、実施形態に係る抽出装置100の構成について説明する。図8は、実施形態に係る抽出装置の構成例を示す図である。図8に示すように、抽出装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、抽出装置100は、抽出装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワーク(例えば図2中のネットワークN)と有線または無線で接続され、表示装置10や情報提供装置50との間で情報の送受信を行う。
(記憶部120)
記憶部120は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図8に示すように、特許情報記憶部121と、インデックス情報記憶部122と、グラフ情報記憶部123と、モデル情報記憶部124とを有する。
(特許情報記憶部121)
実施形態に係る特許情報記憶部121は、特許文献(オブジェクト)に関する各種情報を記憶する。例えば、特許情報記憶部121は、特許IDやベクトルデータを記憶する。図9は、実施形態に係る特許情報記憶部の一例を示す図である。図9に示す特許情報記憶部121は、「特許ID」、「特許」、「特許書類情報」といった項目が含まれる。「特許書類情報」には、特許文献に含まれる各種類の書類情報(特許文献情報)が含まれる。図9の例では、「特許書類情報」には、「要約書」、「図面」、「明細書」、「特許請求の範囲」といった項目が含まれる。
また、「要約書」には、「要約情報」、「ベクトル情報」といった項目が含まれる。また、「図面」には、「図面情報(選択図)」、「ベクトル情報」といった項目が含まれる。また、「明細書」には、「明細書情報(課題)」、「ベクトル情報」といった項目が含まれる。また、「特許請求の範囲」には、「クレーム情報(メインクレーム)」、「ベクトル情報」といった項目が含まれる。
「特許ID」は、特許文献(オブジェクト)を識別するための識別情報を示す。また、「特許」は、特許IDにより識別される特許文献の具体的な名称や内容等を示す。なお、図9の例では、特許を「特許#1」といった抽象的な符号で示すが、各特許は、発明の名称や、出願番号や公開番号等が含まれてもよい。
「要約書」中の「要約情報」は、特許IDにより識別される特許文献の要約書の情報を示す。なお、図9の例では、要約情報を「AD1」といった抽象的な符号で示すが、各要約情報は、要約書の文章全体や要約書の文章から抽出された各要素、例えば要約書に含まれる単語の一覧や単語の出現頻度等を示す情報等が含まれてもよい。「ベクトル情報」とは、特許IDにより識別される特許文献(オブジェクト)の要約書に対応するベクトル情報を示す。すなわち、図9の例では、特許文献(オブジェクト)を識別する特許IDに対して、オブジェクトに対応する要約書のベクトルデータ(ベクトル情報)が対応付けられて登録されている。
「図面」中の「図面情報(選択図)」は、特許IDにより識別される特許文献の選択図の情報を示す。なお、図9の例では、図面情報を「SID1」といった抽象的な符号で示すが、各図面情報は、選択図の画像データ等が含まれてもよい。また、図面情報は、選択図に限らず、全図面が含まれてもよい。「ベクトル情報」とは、特許IDにより識別される特許文献(オブジェクト)の選択図に対応するベクトル情報を示す。すなわち、図9の例では、特許文献(オブジェクト)を識別する特許IDに対して、オブジェクトに対応する選択図のベクトルデータ(ベクトル情報)が対応付けられて登録されている。
「明細書」中の「明細書情報(課題)」は、特許IDにより識別される特許文献の課題の情報を示す。なお、図9の例では、明細書情報を「PSD1」といった抽象的な符号で示すが、各明細書情報は、課題の文章全体や課題の文章から抽出された各要素、例えば課題に含まれる単語の一覧や単語の出現頻度等を示す情報等が含まれてもよい。また、明細書情報は、課題に限らず、明細書全体が含まれてもよい。「ベクトル情報」とは、特許IDにより識別される特許文献(オブジェクト)の課題に対応するベクトル情報を示す。すなわち、図9の例では、特許文献(オブジェクト)を識別する特許IDに対して、オブジェクトに対応する課題のベクトルデータ(ベクトル情報)が対応付けられて登録されている。
「特許請求の範囲」中の「クレーム情報(メインクレーム)」は、特許IDにより識別される特許文献のメインクレーム(請求項1)の情報を示す。なお、図9の例では、明細書情報を「CLD1」といった抽象的な符号で示すが、各クレーム情報は、メインクレームの文章全体やメインクレームの文章から抽出された各要素、例えばメインクレームに含まれる単語の一覧や単語の出現頻度等を示す情報等が含まれてもよい。また、クレーム情報は、メインクレームに限らず、クレーム全体が含まれてもよい。「ベクトル情報」とは、特許IDにより識別される特許文献(オブジェクト)のメインクレームに対応するベクトル情報を示す。すなわち、図9の例では、特許文献(オブジェクト)を識別する特許IDに対して、オブジェクトに対応するメインクレームのベクトルデータ(ベクトル情報)が対応付けられて登録されている。
例えば、図9の例では、特許ID「IP1」により識別される特許文献(オブジェクト)は、「10,24,54,2...」の多次元(N次元)の要約書のベクトル情報が対応付けられることを示す。例えば、特許#1については、モデルM1等により、特許#1の要約書の特徴を示す「10,24,54,2...」の多次元(N次元)のベクトル情報が要約情報AD1から抽出されたことを示す。
なお、特許情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(インデックス情報記憶部122)
実施形態に係るインデックス情報記憶部122は、インデックスに関する各種情報を記憶する。図10は、実施形態に係るインデックス情報記憶部の一例を示す図である。具体的には、図10の例では、インデックス情報記憶部122は、ツリー構造のインデックス情報を示す。図10の例では、インデックス情報記憶部122は、インデックスデータセット122-1やインデックスデータセット122-2やインデックスデータセット122-3やインデックスデータセット122-4等のように対象書類ごとに情報(テーブル)を記憶する。図10に示すインデックスデータセット122-1~122-4等は、「対象書類」、「ルート階層」、「第1階層」、「第2階層」、「第3階層」等といった項目を含む。なお、「第1階層」~「第3階層」に限らず、インデックスの階層数に応じて、「第4階層」、「第5階層」、「第6階層」等が含まれてもよい。
図10の例では、インデックスデータセット122-1は、書類ID「TID1」により識別される書類「要約書」に対応し、インデックスデータセット122-2は、書類ID「TID2」により識別される書類「図面(選択図)」に対応する。例えば、書類「要約書」は、特許文献のうち、要約書を対象とするグラフ情報のインデックス情報であることを示す。例えば、書類「図面(選択図)」は、図面のうち、選択図を対象とするグラフ情報のインデックス情報であることを示す。
また、インデックスデータセット122-3は、書類ID「TID3」により識別される書類「明細書(課題)」に対応し、インデックスデータセット122-4は、書類ID「TID4」により識別される書類「特許請求の範囲(メインクレーム)」に対応する。例えば、書類「明細書(課題)」は、明細書のうち、課題を対象とするグラフ情報のインデックス情報であることを示す。例えば、書類「特許請求の範囲(メインクレーム)」は、クレームのうち、メインクレーム(請求項1)を対象とするグラフ情報のインデックス情報であることを示す。
具体的には、インデックスデータセット122-1には、対象書類「要約書」に対応するインデックスに関する情報(インデックス情報IND11)が記憶される。また、インデックスデータセット122-2には、対象書類「図面(選択図)」に対応するインデックスに関する情報(インデックス情報IND12)が記憶される。また、インデックスデータセット122-3には、対象書類「明細書(課題)」に対応するインデックスに関する情報(インデックス情報IND13)が記憶される。また、インデックスデータセット122-4には、対象書類「特許請求の範囲(メインクレーム)」に対応するインデックスに関する情報(インデックス情報IND14)が記憶される。
「対象書類」は、対応するインデックスデータセットが対象とする書類を示す。「ルート階層」は、インデックスを用いた起点ノードの決定の開始点となるルート(最上位)の階層を示す。「第1階層」は、インデックスの第1階層に属するノード(節点またはグラフ情報中のベクトル)を識別(特定)する情報が格納される。「第1階層」に格納されるノードは、インデックスの根(ルート)に直接結ばれる階層に対応するノードとなる。
「第2階層」は、インデックスの第2階層に属するノード(節点またはグラフ情報中のベクトル)を識別(特定)する情報が格納される。「第2階層」に格納されるノードは、第1階層のノードに結ばれる直下の階層に対応するノードとなる。「第3階層」は、インデックスの第3階層に属するノード(節点またはグラフ情報中のベクトル)を識別(特定)する情報が格納される。「第3階層」に格納されるノードは、第2階層のノードに結ばれる直下の階層に対応するノードとなる。
例えば、図10に示す例においては、インデックス情報記憶部122のうち、インデックスデータセット122-1には、図17中のインデックス情報IND11に対応する情報が記憶される。例えば、インデックスデータセット122-1は、第1階層のノードが、節点VT1~VT3等であることを示す。また、各節点の下の括弧内の数値は、各節点に対応するベクトルの値を示す。
また、例えば、インデックスデータセット122-1は、節点VT2の直下の第2階層のノードが、節点VT2-1~VT2-4であることを示す。また、例えば、インデックスデータセット122-1は、節点VT2-2の直下の第3階層のノードが、ノードN35、ノードN451、ノードN693のグラフ情報GR11中のノード(ベクトル)であることを示す。
なお、インデックス情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(グラフ情報記憶部123)
実施形態に係るグラフ情報記憶部123は、グラフ情報に関する各種情報を記憶する。図11は、実施形態に係るグラフ情報記憶部の一例を示す図である。図11の例では、グラフ情報記憶部123は、グラフデータセット123-1やグラフデータセット123-2やグラフデータセット123-3やグラフデータセット123-4等のように対象書類ごとに情報(テーブル)を記憶する。図11に示すグラフデータセット123-1~123-4等は、「対象書類」、「ノードID」、「特許ID」、および「エッジ情報」といった項目を有する。また、「エッジ情報」には、「エッジID」や「参照先」といった情報が含まれる。
図11の例では、グラフデータセット123-1は、書類ID「TID1」により識別される書類「要約書」に対応し、グラフデータセット123-2は、書類ID「TID2」により識別される書類「図面(選択図)」に対応する。例えば、書類「要約書」は、特許文献のうち、要約書を対象とするグラフ情報のインデックス情報であることを示す。すなわち、グラフデータセット123-1に記憶されるグラフ情報(図17中のグラフ情報GR11)は、特許書類のうち要約書がベクトル化されグラフ構造化された情報であることを示す。また、例えば、書類「図面(選択図)」は、図面のうち、選択図を対象とするグラフ情報のインデックス情報であることを示す。すなわち、グラフデータセット123-2に記憶されるグラフ情報は、特許書類のうち図面中の選択図がベクトル化されグラフ構造化された情報であることを示す。
また、グラフデータセット123-3は、書類ID「TID3」により識別される書類「明細書(課題)」に対応し、グラフデータセット123-4は、書類ID「TID4」により識別される書類「特許請求の範囲(メインクレーム)」に対応する。例えば、書類「明細書(課題)」は、明細書のうち、課題を対象とするグラフ情報であることを示す。すなわち、グラフデータセット123-3に記憶されるグラフ情報は、特許書類のうち明細書中の課題がベクトル化されグラフ構造化された情報であることを示す。例えば、書類「特許請求の範囲(メインクレーム)」は、クレームのうち、メインクレーム(請求項1)を対象とするグラフ情報であることを示す。すなわち、グラフデータセット123-4に記憶されるグラフ情報は、特許書類のうちクレーム中の請求項1がベクトル化されグラフ構造化された情報であることを示す。
具体的には、グラフデータセット123-1には、対象書類「要約書」に対応するグラフに関する情報(グラフ情報GR11)が記憶される。また、グラフデータセット123-2には、対象書類「図面(選択図)」に対応するグラフに関する情報(グラフ情報GR12)が記憶される。また、グラフデータセット123-3には、対象書類「明細書(課題)」に対応するグラフに関する情報(グラフ情報GR13)が記憶される。また、グラフデータセット123-4には、対象書類「特許請求の範囲(メインクレーム)」に対応するグラフに関する情報(グラフ情報GR14)が記憶される。
「対象書類」は、対応するグラフデータセットが対象とする書類を示す。「ノードID」は、グラフデータにおける各ノード(対象)を識別するための識別情報を示す。また、「特許ID」は、特許を識別するための識別情報を示す。
また、「エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。図11の例では、「エッジ情報」は、エッジが有向エッジである場合を示し、対応するノードから出力される出力エッジに関する情報を示す。また、「エッジID」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「参照先」は、エッジにより連結された参照先(ノード)を示す情報を示す。すなわち、図11の例では、ノードを識別するノードIDに対して、そのノードに対応するオブジェクト(対象)を識別する情報やそのノードからの有向エッジ(出力エッジ)が連結される参照先(ノード)が対応付けられて登録されている。
例えば、図11の例では、グラフ情報記憶部123のうち、グラフデータセット123-1においては、ノードID「N1」により識別されるノード(ベクトル)は、特許ID「IP1」により識別される特許(オブジェクト)に対応することを示す。また、グラフデータセット123-1においては、ノードID「N1」により識別されるノードからは、エッジID「E11」により識別されるエッジが、ノードID「N25」により識別されるノード(ベクトル)に連結されることを示す。すなわち、図11の例では、グラフデータセット123-1においては、ノードID「N1」により識別されるノード(ベクトル)からはノードID「N25」により識別されるノード(ベクトル)に辿ることができることを示す。
なお、グラフ情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、グラフ情報記憶部123は、各ノード(ベクトル)間を連結するエッジの長さが記憶されてもよい。すなわち、グラフ情報記憶部123は、各ノード(ベクトル)間の距離を示す情報が記憶されてもよい。
(モデル情報記憶部124)
実施形態に係るモデル情報記憶部124は、モデルに関する情報を記憶する。例えば、モデル情報記憶部124は、生成処理により生成されたモデル情報(モデルデータ)を記憶する。図12は、実施形態に係るモデル情報記憶部の一例を示す図である。図12に示すモデル情報記憶部124は、「モデルID」、「用途」、「モデルデータ」といった項目が含まれる。なお、図12では、モデルM1~M4のみを図示するが、各用途(書類の種類)に応じて多数のモデル情報が記憶されてもよい。例えば、モデル情報記憶部124には、特許文献全体を対象とするモデルM21が記憶されてもよい。
「モデルID」は、モデルを識別するための識別情報を示す。例えば、モデルID「M1」により識別されるモデルは、図17の例に示したモデルM1に対応する。「用途」は、対応するモデルの用途を示す。また、「モデルデータ」は、対応付けられた対応するモデルのデータを示す。例えば、「モデルデータ」には、各層におけるノードと、各ノードが採用する関数と、ノードの接続関係と、ノード間の接続に対して設定される接続係数とを含む情報が含まれる。
例えば、図12に示す例において、モデルID「M1」により識別されるモデル(モデルM1)は、用途が「特徴抽出(要約書)」であり、入力された特許の要約書の要約情報からの特徴の抽出に用いられることを示す。また、モデルM1のモデルデータは、モデルデータMDT1であることを示す。
モデルM1(モデルデータMDT1)は、特許の要約書の要約情報(要約データ)が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された要約情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、入力層に入力される情報と同様の情報を出力層から出力するよう、コンピュータを機能させるためのモデルである。
また、モデルM1~M4等がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、例えば、モデルM1~M4が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。
ここで、モデルM1~M4等が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、例えば、モデルM1~M4等が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。
なお、モデル情報記憶部124は、上記に限らず、目的に応じて種々のモデル情報を記憶してもよい。
(制御部130)
図8の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPUやMPU等によって、抽出装置100内部の記憶装置に記憶されている各種プログラム(抽出プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASICやFPGA等の集積回路により実現される。例えば、制御部130は、モデル情報記憶部124に記憶されているモデルM1に従った情報処理により、特許の要約書の要約情報(要約データ)が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたログ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、入力層に入力される情報と同様の情報を出力層から出力する。
図8に示すように、制御部130は、取得部131と、生成部132と、決定部133と、抽出部134と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図8に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
(取得部131)
取得部131は、各種情報を取得する。例えば、取得部131は、記憶部120から各種情報を取得する。例えば、取得部131は、特許情報記憶部121や、インデックス情報記憶部122や、グラフ情報記憶部123や、モデル情報記憶部124等から各種情報を取得する。また、取得部131は、各種情報を外部の情報処理装置から取得する。取得部131は、表示装置10や情報提供装置50から各種情報を取得する。
取得部131は、表示装置10から指定情報を取得する。図1の例では、取得部131は、特許IP2を指定する指定情報を表示装置10から取得する。例えば、取得部131は、指定情報に対応するグラフ情報を記憶部120や外部の情報処理装置から取得する。図1の例では、取得部131は、指定された特許IP2に対応するグラフ情報をグラフ情報記憶部123(図11参照)や特許情報記憶部121(図9参照)から取得する。図1中のグラフ情報記憶部123は、グラフ情報の取得の一例として情報の一部を図示しており、種類「要約」に対応するグラフデータセット123-1の一部を図示する。取得部131は、図1中のグラフデータセット123-1に示すように、指定された特許IP2に対応するグラフ情報をグラフ情報記憶部123から取得する。
図1の例では、取得部131は、種類「要約」に対応するグラフデータセット123-1から、特許IP2に対応付けられたエッジ情報を取得する。また、取得部131は、グラフデータセット123-1から、特許IP2に対応付けられたエッジE21やエッジE22の情報を取得する。例えば、取得部131は、エッジE21の参照先がノードN38であることを示す情報やエッジE21の長さ(距離)を示す情報等を取得する。また、取得部131は、ノードN38が特許IP38に対応することを示す情報をグラフ情報記憶部123から取得してもよい。また、取得部131は、特許IP38の名称等の情報を特許情報記憶部121から取得してもよい。また、取得部131は、特許IP2の名称等の情報を特許情報記憶部121から取得してもよい。
また、取得部131は、他の種類「図面」、「明細書」及び「特許請求の範囲」に対応するグラフ情報も同様にグラフ情報記憶部123から取得する。例えば、取得部131は、種類「図面」に対応するグラフデータセット123-2(図11参照)から、特許IP2に対応付けられたエッジ情報等を取得する。例えば、取得部131は、種類「明細書」に対応するグラフデータセット123-3(図11参照)から、特許IP2に対応付けられたエッジ情報等を取得する。また、例えば、取得部131は、種類「特許請求の範囲」に対応するグラフデータセット123-4(図11参照)から、特許IP2に対応付けられたエッジ情報等を取得する。これにより、取得部131は、複数の種類「要約書」、「図面」、「明細書」及び「特許請求の範囲」の各々に対応するグラフ情報を含んだグラフ情報GINF11を取得する。
取得部131は、複数の特許文献の各々に対応する複数のベクトルが類似性に応じて連結されたグラフ情報と、一の発明に関する情報を取得する。また、取得部131は、複数の特許文献の各々の特徴を示す複数のベクトルが類似性に応じて連結されたグラフ情報を取得する。また、取得部131は、所定のモデルを用いて複数の特許文献の各々から抽出された特徴量を要素とする複数のベクトルが、類似性に応じて連結されたグラフ情報を取得する。
また、取得部131は、複数の特許文献に関する情報を所定のモデルに入力することにより、抽出される複数の特許文献の各々の特徴量を要素とする複数のベクトルが、類似性に応じて連結されたグラフ情報を取得する。また、取得部131は、複数の特許文献に含まれる書類の各種類に対応する複数のグラフ情報を取得する。
また、取得部131は、複数の特許文献の各々に含まれる各要約書に対応する複数のベクトルが類似性に応じて連結されたグラフ情報を含む複数のグラフ情報を取得する。また、取得部131は、複数の特許文献の各々に含まれる各図面に対応する複数のベクトルが類似性に応じて連結されたグラフ情報を含む複数のグラフ情報を取得する。また、取得部131は、複数の特許文献の各々に含まれる各明細書に対応する複数のベクトルが類似性に応じて連結されたグラフ情報を含む複数のグラフ情報を取得する。また、取得部131は、複数の特許文献の各々に含まれる各特許請求の範囲に対応する複数のベクトルが類似性に応じて連結されたグラフ情報を含む複数のグラフ情報を取得する。
また、取得部131は、ユーザが利用する表示装置10から一の発明に関する情報を取得する。また、取得部131は、一の発明に関する情報として、一の発明の特許文献に関する情報を取得する。また、取得部131は、一の発明に関する情報として、一の発明の特許文献のうち、一の種類の書類に関する情報を取得する。
例えば、取得部131は、データ検索の対象となる複数のノード(ベクトル)を取得する。例えば、取得部131は、複数のノードと、複数のノードの各々を連結する複数の有向エッジを含む有向エッジ群を取得する。
例えば、取得部131は、外部の情報処理装置からグラフ情報(グラフデータ)を取得する。例えば、取得部131は、グラフ情報記憶部123からグラフ情報を取得する。例えば、取得部131は、グラフ情報を取得する。図17の例では、取得部131は、グラフ情報GR11を取得する。
例えば、取得部131は、外部の情報処理装置からインデックス情報(インデックスデータ)を取得する。例えば、取得部131は、インデックス情報記憶部122からインデックス情報を取得する。例えば、取得部131は、木構造型のインデックス情報を取得する。図17の例では、取得部131は、インデックス情報IND11を取得する。
また、取得部131は、ユーザが利用する表示装置10から一の発明に関する特許情報を取得する。例えば、取得部131は、検索クエリとして、一の発明の要約情報を取得する。
取得部131は、一の発明に関する特許文献情報(要約情報)を取得する。図17の例では、取得部131は、表示装置10から特許Xに関する要約情報AD11を取得する。
図17の例では、取得部131は、情報群INF11に示すように、グラフ情報GR11やインデックス情報IND11を用いて特許Xの類似特許を検索する。例えば、取得部131は、グラフ情報記憶部123(図11参照)から特許の要約書に関するグラフ情報GR11を取得する。具体的には、取得部131は、グラフデータセット123-1(図11参照)から特許の要約書に関するグラフ情報GR11を取得する。また、例えば、取得部131は、インデックス情報記憶部122(図10参照)から、グラフ情報GR11における検索の起点となるノード(以下、「起点ベクトル」ともいう)の決定に用いるインデックス情報IND11を取得する。具体的には、取得部131は、インデックスデータセット122-1(図10参照)から特許の要約書に関するインデックス情報IND11を取得する。なお、インデックス情報IND11は、取得部131が生成してもよいし、取得部131は、インデックス情報IND11を情報提供装置50等の他の外部装置から取得してもよい。
(生成部132)
生成部132は、各種情報を生成する。例えば、生成部132は、特許情報記憶部121に記憶された学習データ(ログ情報)を用いて、モデル情報記憶部124に示すようなモデルを生成する。例えば、生成部132は、取得部131により取得された学習データに基づいて、入力したログ情報と同様の情報を出力するモデル(オートエンコーダ)を生成する。例えば、生成部132は、入力するログ情報自体を正解情報として、入力したログ情報と同様の情報を出力するモデル(オートエンコーダ)を生成する。
例えば、生成部132は、モデルM1等を生成し、生成したモデルM1等をモデル情報記憶部124に格納する。なお、生成部132は、いかなる学習アルゴリズムを用いてモデルM1を生成してもよい。例えば、生成部132は、ニューラルネットワーク(neural network)等の学習アルゴリズムを用いてモデルM1を生成する。一例として、生成部132がニューラルネットワークを用いてモデルM1等を生成する場合、モデルM1等は、一以上のニューロンを含む入力層と、一以上のニューロンを含む中間層と、一以上のニューロンを含む出力層とを有する。
生成部132は、発明や特許に関する情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたログ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、入力層に入力される情報と同様の情報を出力層から出力するモデルを生成する。
例えば、生成部132は、学習データに基づいてモデルを生成する。例えば、生成部132は、学習データに基づいてモデルを生成する。例えば、生成部132は、特許情報記憶部121中の要約情報AD1、AD2等を学習データ(教師データ)として、学習を行なうことにより、モデルを生成する。
例えば、生成部132は、要約情報AD1が入力された場合に、モデルM1が要約情報AD1と同様の情報を出力するように、学習処理を行う。例えば、生成部132は、要約情報AD2が入力された場合に、モデルM1が要約情報AD2と同様の情報を出力するように、学習処理を行う。生成部132は、モデルを生成し、生成したモデルをモデル情報記憶部124に格納する。なお、抽出装置100は、情報提供装置50等の他の外部装置からモデルを取得する場合、生成部132を有しなくてもよい。
なお、生成部132は、モデルM1に限らず、特許の図面に対応するモデルM2や特許の明細書に対応するモデルM3や特許のクレームに対応するモデルM4等を生成してもよい。例えば、生成部132は、種々の学習アルゴリズムを用いてモデルを生成してもよい。例えば、生成部132は、ニューラルネットワーク、サポートベクターマシン(SVM)、クラスタリング、強化学習等の学習アルゴリズムを用いてモデルM21、M22等を生成する。一例として、生成部132がニューラルネットワークを用いてモデルM21、M22等を生成する場合、モデルM21、M22等は、一以上のニューロンを含む入力層と、一以上のニューロンを含む中間層と、一以上のニューロンを含む出力層とを有する。
図17の例では、生成部132は、一の発明に対応する要約情報からグラフ情報の探索に用いるベクトルを生成する。図17の例では、生成部132は、処理群PS11に示すような処理により、特許Xに対応するベクトルを生成する。生成部132は、特許Xに関する要約情報AD11をモデルM1に入力する。具体的には、生成部132は、表示装置10から取得した特許Xの要約情報AD11をモデルM1に入力する。そして、生成部132は、要約情報AD11の入力後のモデルM1中の情報を用いて、ベクトルを生成する。例えば、生成部132は、要約情報AD11が入力されたモデルM1中の各要素を用いて、ベクトルデータを生成する。
図17の例では、生成部132は、要約情報AD11が入力されたモデルM1中の各要素の値を用いて、ベクトルデータVD11(単に「ベクトルVD11」ともいう)を生成する。例えば、生成部132は、特許Xの要約情報AD11が入力された場合における、モデルM1のニューロンNL1に対応する値VE1(図15参照)やニューロンNL2に対応する値VE2(図15参照)を用いて、ベクトルを生成する。例えば、生成部132は、特許Xの要約情報AD11が入力された場合に、算出されるニューロンNL1に対応する値VE1をベクトルVD11の1次元目の要素として抽出してもよい。また、例えば、生成部132は、要約書の要約情報が入力された場合に、算出されるニューロンNL2に対応する値VE2をベクトルVD11の2次元目の要素として、ベクトルVD11を生成する。図17の例では、生成部132は、1次元目の要素が「35」であり、2次元目の要素が「63」であるようなベクトルVD11を生成する。
(決定部133)
決定部133は、各種情報を決定する。例えば、決定部133は、取得部131により取得された一の発明に関する情報と、グラフ情報の検索の起点となる起点ベクトルに関する情報とに基づいて、起点ベクトルを決定する。また、決定部133は、起点ベクトルの決定に用いるインデックス情報に基づいて、起点ベクトルを決定する。また、決定部133は、木構造型のインデックス情報に基づいて、起点ベクトルを決定する。
図17の例では、決定部133は、一の要約書(クエリ)に対応する起点ベクトルを決定(特定)するために、インデックス情報IND11を用いる。図17の例では、決定部133は、特許XのベクトルVD11に対応する起点ベクトルを決定(特定)するために、インデックス情報IND11を用いる。すなわち、決定部133は、ベクトルVD11とインデックス情報IND11とを用いて、グラフ情報GR11における起点ベクトルを決定する。
例えば、決定部133は、図17中のインデックス情報IND11に示すような木構造型のインデックス情報を用いて、グラフ情報GR11における起点ベクトルを決定する。図17の例では、決定部133は、ベクトルVD11を生成した後、インデックス情報IND11を上から下へ辿ることにより、インデックス情報IND11の近傍候補となる起点ベクトルを特定することにより、効率的に検索クエリ(一の要約書)に対応する起点ベクトルを決定することができる。
例えば、決定部133は、インデックス情報IND11をルートRTからリーフノード(グラフ情報GR11中のノード(ベクトル))まで辿ることにより、ベクトルVD11に対応する起点ベクトルを決定してもよい。図17の例では、例えば、決定部133は、インデックス情報IND11をルートRTからノードN451まで辿ることにより、ノードN451を起点ベクトルとして決定する。
(抽出部134)
抽出部134は、各種情報を抽出する。抽出部134は、取得部131により取得されたグラフ情報の複数のベクトルのうち、所定の基準に基づいて決定されたグラフ情報の検索の起点となる起点ベクトルを起点としてグラフ情報を検索することにより、複数の特許文献のうち、一の発明に類似する特許文献である類似特許を抽出する。例えば、抽出部134は、決定部133により決定された起点ベクトルを起点としてグラフ情報を検索することにより、複数の特許文献のうち、一の発明に類似する特許文献である類似特許を抽出する。例えば、抽出部134は、グラフ情報記憶部123に記憶された各ノード(ベクトル)間を連結するエッジの長さ(距離)の情報を用いてもよいし、各ノードのベクトル情報から各ノード(ベクトル)間を連結するエッジの長さ(距離)の情報を算出し、算出した長さ(距離)の情報を用いてもよい。
図17の例では、抽出部134は、グラフ情報GR11を検索することにより、特許Xの類似特許を抽出する。例えば、抽出部134は、ノードN451の近傍に位置するノードを類似特許として抽出する。例えば、抽出部134は、ノードN451からの距離が近いノードを類似特許として抽出する。例えば、抽出部134は、ノードN451を起点として、エッジを辿ることにより、ノードN451から到達可能なノードを類似特許として抽出する。例えば、抽出部134は、所定数(例えば、2個や10個等)のノードを類似特許として抽出する。例えば、抽出部134は、図16に示すような検索処理により、特許Xの類似特許を抽出してもよいが、詳細は後述する。図17の例では、抽出部134は、ノードN451を起点として、グラフ情報GR11を探索することにより、ノードN451やノードN35を類似特許として抽出する。
(提供部135)
提供部135は、各種情報を提供する。例えば、提供部135は、表示装置10や情報提供装置50に各種情報を送信する。例えば、提供部135は、表示装置10や情報提供装置50に各種情報を配信する。例えば、提供部135は、表示装置10や情報提供装置50に各種情報を提供する。
図1の例では、提供部135は、グラフ情報GINF11を表示装置10へ提供する。例えば、提供部135は、特許IP2に対応するグラフ情報GINF11を表示装置10へ送信する。
例えば、提供部135は、抽出部134により抽出された類似特許に基づいて、所定のサービスを提供する。また、提供部135は、類似特許に関する情報提供サービスを提供する。提供部135は、表示装置10に類似特許に関する情報を提供する。
例えば、提供部135は、クエリに対応するオブジェクトIDを検索結果として提供する。例えば、提供部135は、抽出部134により選択されたオブジェクトIDを情報提供装置50へ提供する。提供部135は、抽出部134により選択されたオブジェクトIDをクエリに対応するベクトルを示す情報として情報提供装置50に提供する。また、提供部135は、生成部132により生成されたモデルを外部の情報処理装置へ提供してもよい。
図17の例では、提供部135は、抽出部134により抽出された類似特許に関する情報を提供する。例えば、提供部135は、ノードN451に対応する特許#451や、ノードN35に対応する特許#35を特許Xに類似する特許文献としてユーザU1が利用する表示装置10に提供する。
〔5.表示処理のフロー〕
次に、図13を用いて、実施形態に係る表示システム1による表示処理の手順について説明する。図13は、実施形態に係る表示処理の一例を示すフローチャートである。
図13に示すように、表示装置10は、特許の指定情報を送信する(ステップS101)。例えば、表示装置10は、抽出装置100へ特許の指定情報を送信する。図1の例では、表示装置10は、特許#2を指定する指定情報を抽出装置100へ送信する。
表示装置10は、指定情報に対応する特許に関するグラフ情報を取得する(ステップS102)。例えば、表示装置10は、抽出装置100から指定情報の特許に対応するグラフ情報を取得する。図1の例では、表示装置10は、抽出装置100からグラフ情報GINF11を取得する。
そして、表示装置10は、グラフ情報を用いて指定情報に対応する特許と他の特許との類似関係を示す画像情報を生成する(ステップS103)。例えば、表示装置10は、抽出装置100から取得したグラフ情報を用いて指定情報に対応する特許と他の特許との類似関係を示す画像情報を生成する。図1の例では、表示装置10は、グラフ情報GINF11に基づいて、画像情報IM1~IM4を生成する。
そして、表示装置10は、生成した画像情報を表示する(ステップS104)。例えば、表示装置10は、画像情報IM1~IM4を表示する。例えば、表示装置10は、閲覧アプリAP1により、画像情報IM1~IM4を表示する。図1の例では、表示装置10は、閲覧アプリAP1により、種類「要約」に対応する画像情報IM1を表示する。
〔6.生成処理のフロー〕
次に、図14を用いて、実施形態に係る表示システム1による生成処理の手順について説明する。図14は、実施形態に係る生成処理の一例を示すフローチャートである。
図14に示すように、抽出装置100は、学習データを取得する(ステップS201)。例えば、抽出装置100は、特許情報記憶部121から学習データを取得する。例えば、抽出装置100は、特許情報記憶部121から要約情報AD1、AD2等を学習データとして取得する。
その後、抽出装置100は、学習データに基づきモデルを生成する(ステップS202)。例えば、抽出装置100は、特許情報記憶部121から学習データを用いてモデルM1を生成する。例えば、抽出装置100は、入力層に入力される情報(要約情報)と同様の情報(要約情報)を出力層から出力するようにモデルM1を生成する。例えば、抽出装置100は、特許の書類の種類「要約書」の要約情報(要約データ)を入力とするオートエンコーダとしてのモデルM1を生成する。
〔7.抽出処理〕
ここで、図17を用いて、抽出装置100がグラフ情報を用いて行う抽出処理の一例について説明する。図17は、実施形態に係る抽出処理の一例を示す図である。図17では、抽出装置100が特許をグラフ構造化したグラフ情報を検索することにより、類似する特許文献である類似特許文献(以下、「類似特許」ともいう)を抽出する場合を示す。図17では、抽出装置100は、各特許に対応するベクトル情報を用いて特許をグラフ構造化したグラフ情報を用いる。なお、図17の例では、特許文献として特許の書類のうち、種類「要約書」を対象とする場合を一例として示す。
〔7-1.処理例〕
図17では、抽出装置100は、ユーザから一の発明(特許)の要約書の要約情報を取得し、一の特許に類似する特許に関する情報提供を行う場合を一例として説明する。図17の例では、表示装置10は、類似特許の検索を所望するユーザU1が利用する。例えば、ユーザU1は、自身や所属する事業体(企業)等が発明し作成した特許出願書類(特許文献)に類似する特許を検索することを所望するものとする。また、図17の例では、説明を簡単にするために、特許書類のうち、種類「要約書」のみを用いて類似特許の検索を行う場合を示す。なお、複数の種類の書類を用いて検索を行う場合は図18において後述する。
まず、ユーザU1は、表示装置10を操作することにより、表示装置10から一の発明に関する情報(発明情報)として、特許Xの要約情報AD11を抽出装置100へ送信する。例えば、要約情報AD11は、特許Xの要約書の文章全体であってもよい。また、例えば、要約情報AD11は、特許Xの要約書の文章から抽出された各要素、例えば特許Xの要約書に含まれる単語の一覧や単語の出現頻度等を示す情報であってもよい。
そして、抽出装置100は、一の発明に関する特許文献情報を取得する(ステップS31)。図17の例では、抽出装置100は、表示装置10から特許Xに関する要約情報AD11を取得する。
そして、抽出装置100は、一の発明に対応する要約情報からグラフ情報の探索に用いるベクトルを生成する。図17の例では、抽出装置100は、処理群PS11に示すような処理により、特許Xに対応するベクトルを生成する。抽出装置100は、特許Xに関する要約情報AD11をモデルM1に入力する(ステップS32)。具体的には、抽出装置100は、表示装置10から取得した特許Xの要約情報AD11をモデルM1に入力する。そして、抽出装置100は、要約情報AD11の入力後のモデルM1中の情報を用いて、ベクトルを生成する(ステップS33)。例えば、抽出装置100は、要約情報AD11が入力されたモデルM1中の各要素を用いて、ベクトルデータを生成する。
図17の例では、抽出装置100は、要約情報AD11が入力されたモデルM1中の各要素の値を用いて、ベクトルデータVD11(単に「ベクトルVD11」ともいう)を生成する。例えば、抽出装置100は、特許Xの要約情報AD11が入力された場合における、モデルM1のニューロンNL1に対応する値VE1(図15参照)やニューロンNL2に対応する値VE2(図15参照)を用いて、ベクトルを生成する。例えば、抽出装置100は、特許Xの要約情報AD11が入力された場合に、算出されるニューロンNL1に対応する値VE1をベクトルVD11の1次元目の要素として抽出してもよい。また、例えば、抽出装置100は、要約書の要約情報が入力された場合に、算出されるニューロンNL2に対応する値VE2をベクトルVD11の2次元目の要素として、ベクトルVD11を生成する。図17の例では、抽出装置100は、1次元目の要素が「35」であり、2次元目の要素が「63」であるようなベクトルVD11を生成する。
そして、抽出装置100は、特許Xに類似する特許(類似特許)を検索する(ステップS34)。例えば、抽出装置100は、非特許文献1に開示されるような近傍検索の技術等の種々の従来技術を適宜用いて、特許Xの類似特許を検索してもよい。
図17の例では、抽出装置100は、情報群INF11に示すように、グラフ情報GR11やインデックス情報IND11を用いて特許Xの類似特許を検索する。例えば、抽出装置100は、グラフ情報記憶部123(図11参照)から特許の要約書に関するグラフ情報GR11を取得する。具体的には、抽出装置100は、グラフデータセット123-1(図11参照)から特許の要約書に関するグラフ情報GR11を取得する。また、例えば、抽出装置100は、インデックス情報記憶部122(図10参照)から、グラフ情報GR11における検索の起点となるノード(以下、「起点ベクトル」ともいう)の決定に用いるインデックス情報IND11を取得する。具体的には、抽出装置100は、インデックスデータセット122-1(図10参照)から特許の要約書に関するインデックス情報IND11を取得する。なお、インデックス情報IND11は、抽出装置100が生成してもよいし、抽出装置100は、インデックス情報IND11を情報提供装置50等の他の外部装置から取得してもよい。
そして、抽出装置100は、一の要約書(クエリ)に対応する起点ベクトルを決定(特定)するために、インデックス情報IND11を用いる。図17の例では、抽出装置100は、特許XのベクトルVD11に対応する起点ベクトルを決定(特定)するために、インデックス情報IND11を用いる。すなわち、抽出装置100は、ベクトルVD11とインデックス情報IND11とを用いて、グラフ情報GR11における起点ベクトルを決定する。
図17中のインデックス情報IND11は、図10中のインデックス情報記憶部122に示す階層構造を有する。例えば、インデックス情報IND11は、ルートRTの直下に位置する第1階層のノード(ベクトル)が、節点VT1、VT2等であることを示す。また、例えば、インデックス情報IND11は、節点VT2の直下の第2階層のノードが、節点VT2-1~VT2-4(図示せず)であることを示す。また、例えば、インデックス情報IND11は、節点VT2-2の直下の第3階層のノードが、ノードN35、ノードN451、ノードN693、すなわちグラフ情報GR11中のノード(ベクトル)であることを示す。
例えば、抽出装置100は、図17中のインデックス情報IND11に示すような木構造型のインデックス情報を用いて、グラフ情報GR11における起点ベクトルを決定する(ステップS35)。図17の例では、抽出装置100は、ベクトルVD11を生成した後、インデックス情報IND11を上から下へ辿ることにより、インデックス情報IND11の近傍候補となる起点ベクトルを特定することにより、効率的に検索クエリ(一の要約書)に対応する起点ベクトルを決定することができる。
例えば、抽出装置100は、インデックス情報IND11をルートRTからリーフノード(グラフ情報GR11中のノード(ベクトル))まで辿ることにより、ベクトルVD11に対応する起点ベクトルを決定してもよい。図17の例では、例えば、抽出装置100は、インデックス情報IND11をルートRTからノードN451まで辿ることにより、ノードN451を起点ベクトルとして決定する。なお、図17の例では、説明を簡単にするために、起点ベクトルを1つ決定する場合を示すが、抽出装置100は、複数個の起点ベクトルを決定してもよい。例えば、抽出装置100は、ノードN451、N35、N693、N2等の複数個のベクトル(ノード)を起点ベクトルとして決定してもよい。なお、インデックス情報IND11を用いずに、検索開始時にグラフ情報GR11からランダムに1つ以上のノードを選択し、それを起点ベクトルとしてもよいし、または、予め指定された1つ以上のノードを起点ベクトルとしてもよい。
そして、抽出装置100は、グラフ情報GR11を検索することにより、特許Xの類似特許を抽出する(ステップS36)。例えば、抽出装置100は、ノードN451の近傍に位置するノードを類似特許として抽出する。例えば、抽出装置100は、ノードN451からの距離が近いノードを類似特許として抽出する。例えば、抽出装置100は、ノードN451を起点として、エッジを辿ることにより、ノードN451から到達可能なノードを類似特許として抽出する。例えば、抽出装置100は、所定数(例えば、2個や10個等)のノードを類似特許として抽出する。例えば、抽出装置100は、図16に示すような検索処理により、特許Xの類似特許を抽出してもよいが、詳細は後述する。図17の例では、抽出装置100は、ノードN451を起点として、グラフ情報GR11を探索することにより、ノードN451やノードN35を類似特許として抽出する。
そして、抽出装置100は、抽出した類似特許に関する情報を提供する(ステップS37)。図17の例では、抽出装置100は、ノードN451に対応する特許#451や、ノードN35に対応する特許#35を特許Xに類似する特許文献としてユーザU1が利用する表示装置10に提供する。
上述したように、抽出装置100は、グラフ情報GR11やインデックス情報IND11を用いて、ユーザU1から取得した特許Xの類似特許を抽出する。例えば、抽出装置100は、インデックス情報IND11を用いて、特許Xの類似特許を抽出する際のグラフ情報GR11における起点ベクトルを決定する。そして、抽出装置100は、決定した起点ベクトルを起点としてグラフ情報GR11を探索することにより、特許Xの類似特許を抽出する。これにより、抽出装置100は、類似の特許文献を適切に抽出することができる。
〔7-2.複数の書類〕
〔7-2-1.処理例〕
図17の例では、1つの書類(要約書)による抽出の例を示したが、抽出装置100は、複数の書類の情報に基づいて類似特許を抽出(決定)してもよい。この点について、図18を用いて説明する。図18は、実施形態に係る抽出処理の一例を示す図である。なお、図18における抽出処理については、図17で説明した処理は適宜説明を省略する。
図18では、あるユーザ(例えばユーザU1)が表示装置10を用いる場合を示す。図18では、抽出装置100は、表示装置10から書類「要約書」、「図面」、「明細書」、「特許請求の範囲」等の複数の書類の情報を取得し、各情報に基づいて類似特許を抽出(決定)する場合を一例として説明する。
まず、表示装置10は、特許Yに関する特許書類「要約書」、「図面」、「明細書」、「特許請求の範囲」等の複数の書類の情報を抽出装置100へ送信する(ステップS51)。図18の例では、表示装置10は、特許Yの要約情報AD51、図面情報SID51、明細書情報PSD51、及びクレーム情報CLD51等を含む特許Yに関する特許書類を抽出装置100へ送信する。
要約情報AD51は、特許Yの要約書の文章全体であってもよい。また、要約情報AD51は、特許Yの要約書の文章から抽出された各要素、例えば特許Yの要約書に含まれる単語の一覧や単語の出現頻度等を示す情報であってもよい。
また、図面情報SID51は、特許Yの選択図の画像データ等であってもよい。また、図面情報SID51は、特許Yの図1や全図面であってもよい。
また、明細書情報PSD51は、特許Yの課題の文章全体であってもよい。また、明細書情報PSD51は、特許Yの課題の文章から抽出された各要素、例えば特許Yの課題に含まれる単語の一覧や単語の出現頻度等を示す情報であってもよい。また、明細書情報PSD51は、特許Yの明細書の文章全体であってもよい。また、明細書情報PSD51は、特許Yの明細書の文章から抽出された各要素、例えば特許Yの明細書に含まれる単語の一覧や単語の出現頻度等を示す情報であってもよい。
また、クレーム情報CLD51は、特許Yのメインクレームの文章全体であってもよい。また、クレーム情報CLD51は、特許Yのメインクレームの文章から抽出された各要素、例えば特許Yのメインクレームに含まれる単語の一覧や単語の出現頻度等を示す情報であってもよい。また、クレーム情報CLD51は、特許Yのクレームの文章全体であってもよい。また、クレーム情報CLD51は、特許Yのクレームの文章から抽出された各要素、例えば特許Yのクレームに含まれる単語の一覧や単語の出現頻度等を示す情報であってもよい。
そして、表示装置10から特許Yに関する特許書類を取得した抽出装置100は、対象書類「要約書」の要約情報AD51に基づく特許Yの類似特許を抽出する処理を行う。まず、抽出装置100は、特許Yの要約情報AD51からグラフ情報の探索に用いるベクトルを生成する。例えば、抽出装置100は、要約情報AD51を要約情報からベクトルを生成するモデルに入力する。例えば、抽出装置100は、要約情報AD51をモデルM1に入力する。そして、抽出装置100は、要約情報AD51の入力後のモデルM1中の情報を用いて、ベクトルを生成する(ステップS52)。例えば、抽出装置100は、要約情報AD51が入力されたモデルM1中の各要素を用いて、ベクトルデータを生成する。
図18の例では、抽出装置100は、要約情報AD51が入力されたモデルM1中の各要素の値を用いて、ベクトルデータVD51を生成する。例えば、抽出装置100は、特許Yの要約情報AD51が入力された場合における、モデルM1のニューロンNL1に対応する値VE1(図15参照)やニューロンNL2に対応する値VE2(図15参照)を用いて、ベクトルを生成する。
そして、抽出装置100は、対象書類「要約書」に対応するグラフ情報GR11やインデックス情報IND11を含む情報群INF11やベクトルデータVD51を用いて、対応類似特許を抽出する(ステップS53)。例えば、抽出装置100は、対象書類「要約書」に対応するグラフ情報GR11をグラフ情報記憶部123(図11参照)から取得し、インデックス情報IND11をインデックス情報記憶部122(図10参照)から取得する。例えば、抽出装置100は、グラフ情報GR11を検索することにより、要約情報AD51に基づく特許Yの類似特許として、ノードN451やノードN35を抽出する。そして、抽出装置100は、グラフ情報記憶部123(図11参照)中のノードと特許との対応付けを示す情報に基づいて、図18中の類似特許一覧PL51に示すように、ノードN451に対応する特許#451やノードN35に対応する特許#35を類似特許として抽出する。
次に、抽出装置100は、対象書類「図面」の図面情報SID51に基づく特許Yの類似特許を抽出する処理を行う。まず、抽出装置100は、特許Yの図面情報SID51からグラフ情報の探索に用いるベクトルを生成する。例えば、抽出装置100は、図面情報SID51を図面情報からベクトルを生成するモデルに入力する。例えば、抽出装置100は、図面情報SID51をモデルM2に入力する。そして、抽出装置100は、図面情報SID51の入力後のモデルM2中の情報を用いて、ベクトルを生成する(ステップS54)。例えば、抽出装置100は、図面情報SID51が入力されたモデルM2中の各要素を用いて、ベクトルデータを生成する。
図18の例では、抽出装置100は、図面情報SID51が入力されたモデルM2中の各要素の値を用いて、ベクトルデータVD52を生成する。例えば、抽出装置100は、特許Yの図面情報SID51が入力された場合における、モデルM2の特徴抽出の対象となる各ニューロンの値(図示せず)を用いて、ベクトルを生成する。例えば、抽出装置100は、モデルM2の中間層の中央部の最も圧縮された圧縮層の各ニューロンの値を用いて、ベクトルを生成してもよい。
そして、抽出装置100は、対象書類「図面」に対応するグラフ情報GR12やインデックス情報IND12を含む情報群INF12やベクトルデータVD52を用いて、対応類似特許を抽出する(ステップS55)。例えば、抽出装置100は、対象書類「図面」に対応するグラフ情報GR12をグラフ情報記憶部123(図11参照)から取得し、インデックス情報IND12をインデックス情報記憶部122(図10参照)から取得する。例えば、抽出装置100は、グラフ情報GR12を検索することにより、図面情報SID51に基づく特許Yの類似特許として、ノードN1やノードN35を抽出する。そして、抽出装置100は、グラフ情報記憶部123(図11参照)中のノードと特許との対応付けを示す情報に基づいて、図18中の類似特許一覧PL52に示すように、ノードN1に対応する特許#1やノードN35に対応する特許#35を類似特許として抽出する。
そして、抽出装置100は、対象書類「明細書」の明細書情報PSD51に基づく特許Yの類似特許を抽出する処理を行う。まず、抽出装置100は、特許Yの明細書情報PSD51からグラフ情報の探索に用いるベクトルを生成する。例えば、抽出装置100は、明細書情報PSD51を明細書情報からベクトルを生成するモデルに入力する。例えば、抽出装置100は、明細書情報PSD51をモデルM3に入力する。そして、抽出装置100は、明細書情報PSD51の入力後のモデルM3中の情報を用いて、ベクトルを生成する(ステップS56)。例えば、抽出装置100は、明細書情報PSD51が入力されたモデルM3中の各要素を用いて、ベクトルデータを生成する。
図18の例では、抽出装置100は、明細書情報PSD51が入力されたモデルM3中の各要素の値を用いて、ベクトルデータVD53を生成する。例えば、抽出装置100は、特許Yの明細書情報PSD51が入力された場合における、モデルM3の特徴抽出の対象となる各ニューロンの値(図示せず)を用いて、ベクトルを生成する。例えば、抽出装置100は、モデルM3の中間層の中央部の最も圧縮された圧縮層の各ニューロンの値を用いて、ベクトルを生成してもよい。
そして、抽出装置100は、対象書類「明細書」に対応するグラフ情報GR13やインデックス情報IND13を含む情報群INF13やベクトルデータVD53を用いて、対応類似特許を抽出する(ステップS57)。例えば、抽出装置100は、対象書類「明細書」に対応するグラフ情報GR13をグラフ情報記憶部123(図11参照)から取得し、インデックス情報IND13をインデックス情報記憶部122(図10参照)から取得する。例えば、抽出装置100は、グラフ情報GR13を検索することにより、明細書情報PSD51に基づく特許Yの類似特許として、ノードN35やノードN89を抽出する。そして、抽出装置100は、グラフ情報記憶部123(図11参照)中のノードと特許との対応付けを示す情報に基づいて、図18中の類似特許一覧PL53に示すように、ノードN35に対応する特許#35やノードN89に対応する特許#89を類似特許として抽出する。
また、抽出装置100は、対象書類「特許請求の範囲」のクレーム情報CLD51に基づく特許Yの類似特許を抽出する処理を行う。まず、抽出装置100は、特許Yのクレーム情報CLD51からグラフ情報の探索に用いるベクトルを生成する。例えば、抽出装置100は、クレーム情報CLD51をクレーム情報からベクトルを生成するモデルに入力する。例えば、抽出装置100は、クレーム情報CLD51をモデルM4に入力する。そして、抽出装置100は、クレーム情報CLD51の入力後のモデルM4中の情報を用いて、ベクトルを生成する(ステップS58)。例えば、抽出装置100は、クレーム情報CLD51が入力されたモデルM4中の各要素を用いて、ベクトルデータを生成する。
図18の例では、抽出装置100は、クレーム情報CLD51が入力されたモデルM4中の各要素の値を用いて、ベクトルデータVD54を生成する。例えば、抽出装置100は、特許Yのクレーム情報CLD51が入力された場合における、モデルM4の特徴抽出の対象となる各ニューロンの値(図示せず)を用いて、ベクトルを生成する。例えば、抽出装置100は、モデルM4の中間層の中央部の最も圧縮された圧縮層の各ニューロンの値を用いて、ベクトルを生成してもよい。
そして、抽出装置100は、対象書類「特許請求の範囲」に対応するグラフ情報GR14やインデックス情報IND14を含む情報群INF14やベクトルデータVD54を用いて、対応類似特許を抽出する(ステップS59)。例えば、抽出装置100は、対象書類「特許請求の範囲」に対応するグラフ情報GR14をグラフ情報記憶部123(図11参照)から取得し、インデックス情報IND14をインデックス情報記憶部122(図10参照)から取得する。例えば、抽出装置100は、グラフ情報GR14を検索することにより、クレーム情報CLD51に基づく特許Yの類似特許として、ノードN571やノードN35を抽出する。そして、抽出装置100は、グラフ情報記憶部123(図11参照)中のノードと特許との対応付けを示す情報に基づいて、図18中の類似特許一覧PL54に示すように、ノードN571に対応する特許#571やノードN35に対応する特許#35を類似特許として抽出する。
次に、抽出装置100は、4つの種類の書類ごとに抽出した類似特許の情報に基づいて、特許Yの類似特許を決定(抽出)する(ステップS60)。図18の例では、抽出装置100は、図18中の類似特許一覧PL51~PL54に示すように、4つの種類の全書類の類似特許に含まれる特許#35を特許Yの類似特許として決定(抽出)する。
そして、抽出装置100は、類似特許情報を表示装置10へ送信する(ステップS61)。図18の例では、抽出装置100は、特許#35が特許Yの類似特許であることを示す情報を表示装置10へ送信する。これにより、抽出装置100は、特許Yの複数の種類の類似性を加味した類似特許を抽出することができる。
〔7-2-2.他の抽出例〕
上述した例では、抽出装置100が4つの種類の全書類の類似特許に含まれる特許#35を特許Yの類似特許として決定(抽出)する場合を示したが、抽出装置100は、他の基準に基づいて抽出を行ってもよい。例えば、抽出装置100は、複数の書類に基づいて類似特許が抽出された場合、各書類の類似特許として含まれる割合に応じて、類似特許を決定(抽出)してもよい。例えば、抽出装置100は、一の発明(特許)の複数の書類に対応する抽出のうち、所定の閾値(例えば50%や80%等)以上の抽出で類似特許として抽出された特許(特許AA)がある場合、その特許(特許AA)を一の発明(特許)の類似特許としてもよい。
例えば、抽出装置100は、書類の種類数が4であり、閾値が50%であり、一の発明(特許)の3つの種類の書類において類似特許として抽出された特許(特許AB)がある場合、その特許(特許AB)を一の発明(特許)の類似特許としてもよい。上述のように、抽出装置100は、一の発明(特許)の複数の書類全体での抽出された割合に応じて、一の発明(特許)の類似特許を決定することにより、より適切に類似特許を抽出することができる。
〔7-3.インデックス情報〕
図17の例に示すインデックス情報(インデックスデータ)は一例であり、抽出装置100は、種々のインデックス情報を用いて、グラフ情報を検索してもよい。また、例えば、抽出装置100は、検索時に用いるインデックスデータを生成してもよい。例えば、抽出装置100は、高次元ベクトルを検索する検索インデックスをインデックスデータとして生成する。ここでいう高次元ベクトルとは、例えば、数百次元から数千次元のベクトルであってもよいし、それ以上の次元のベクトルであってもよい。
例えば、抽出装置100は、図17に示すようなツリー構造(木構造)に関する検索インデックスをインデックスデータとして生成してもよい。例えば、抽出装置100は、kd木(k-dimensional tree)に関する検索インデックスをインデックスデータとして生成してもよい。例えば、抽出装置100は、VP木(Vantage-Point tree)に関する検索インデックスをインデックスデータとして生成してもよい。
また、例えば、抽出装置100は、その他の木構造を有するインデックスデータとして生成してもよい。例えば、抽出装置100は、木構造のインデックスデータのリーフがグラフデータに接続する種々のインデックスデータを生成してもよい。例えば、抽出装置100は、木構造のインデックスデータのリーフがグラフデータ中のノードに対応する種々のインデックスデータを生成してもよい。また、抽出装置100は、このようなインデックスデータを用いて検索を行う場合、インデックスデータを辿って到達したリーフ(ノード)からグラフデータを探索してもよい。
なお、上述したようなインデックスデータは一例であり、抽出装置100は、グラフデータ中のクエリを高速に特定することが可能であれば、どのようなデータ構造のインデックスデータを生成してもよい。例えば、抽出装置100は、クエリに対応するグラフ情報中のノードを高速に特定することが可能であれば、バイナリ空間分割に関する技術等の種々の従来技術を適宜用いて、インデックスデータを生成してもよい。例えば、抽出装置100は、高次元ベクトルの検索に対応可能なインデックスであれば、どのようなデータ構造のインデックスデータを生成してもよい。例えば、抽出装置100は、非特許文献1に記載されるようなグラフ型の検索インデックスに関する情報をインデックス情報として用いてもよい。抽出装置100は、上述のようなインデックスデータとグラフデータとを用いることにより、所定の対象に関するより効率的な検索を可能にすることができる。
〔8.検索例〕
ここで、上述したグラフ情報を用いた検索の一例を示す。なお、グラフ情報(グラフデータ)を用いた検索は下記に限らず、種々の手順により行われてもよい。この点について、図16を一例として説明する。図16は、グラフデータ(グラフ情報)を用いた検索処理の一例を示すフローチャートである。また、以下でいうオブジェクトは、ベクトルやノードと読み替えてもよい。なお、以下では、抽出装置100が検索処理を行うものとして説明するが、検索処理は他の装置により行われてもよい。例えば、抽出装置100は、検索クエリとして、一の発明の要約情報(要約データ)から生成されたベクトルデータを用いる。例えば、抽出装置100は、一の発明の要約情報(要約データ)から生成されたベクトルデータとインデックス情報とに基づいて決定された起点ベクトルを起点としてグラフデータを検索する。図17の例では、抽出装置100は、特許XのベクトルVD11とインデックス情報IND11とに基づいて決定された起点ベクトルであるノードN451を起点としてグラフ情報GR11を検索する。
ここでは、近傍オブジェクト集合N(G,y)は、ノードyに付与されているエッジにより関連付けられている近傍のオブジェクトの集合である。「G」は、所定のグラフデータ(例えば、グラフ情報GR11等)であってもよい。例えば、抽出装置100は、k近傍検索処理を実行する。
例えば、抽出装置100は、超球の半径rを∞(無限大)に設定し(ステップS300)、既存のオブジェクト集合から部分集合Sを抽出する(ステップS301)。例えば、抽出装置100は、ルートノード(起点ベクトル)として選択されたオブジェクト(ノード)を部分集合Sとして抽出してもよい。図17の例では、抽出装置100は、起点ベクトルであるノードN451等を部分集合Sとして抽出してもよい。また、例えば、超球とは、検索範囲を示す仮想的な球である。なお、ステップS301において抽出されたオブジェクト集合Sに含まれるオブジェクトは、同時に検索結果のオブジェクト集合Rの初期集合にも含められる。
次に、抽出装置100は、オブジェクト集合Sに含まれるオブジェクトの中で、検索クエリオブジェクトをyとするとオブジェクトyとの距離が最も短いオブジェクトを抽出し、オブジェクトsとする(ステップS302)。図17の例では、抽出装置100は、オブジェクト集合Sに含まれるオブジェクトの中で、検索クエリオブジェクトであるベクトルVD11との距離が最も短いオブジェクトを抽出し、オブジェクトsとする。例えば、抽出装置100は、オブジェクト集合Sに含まれるオブジェクトの中で、ベクトルVD11との距離が最も短いノードN451を抽出し、オブジェクトsとする。例えば、抽出装置100は、ルートノード(起点ベクトル)として選択されたオブジェクト(ノード)のみがオブジェクト集合Sの要素の場合には、結果的にルートノード(起点ベクトル)がオブジェクトsとして抽出される。次に、抽出装置100は、オブジェクトsをオブジェクト集合Sから除外する(ステップS303)。
次に、抽出装置100は、オブジェクトsとオブジェクトyとの距離d(s,y)がr(1+ε)を超えるか否かを判定する(ステップS304)。ここで、εは拡張要素であり、r(1+ε)は、探索範囲(この範囲内のノードのみを探索する。検索範囲よりも大きくすることで精度を高めることができる)の半径を示す値である。オブジェクトsとオブジェクトyとの距離d(s,y)がr(1+ε)を超える場合(ステップS304:Yes)、抽出装置100は、オブジェクト集合Rをオブジェクトyの近傍オブジェクト集合として出力し(ステップS305)、処理を終了する。
オブジェクトsと検索クエリオブジェクトyとの距離d(s,y)がr(1+ε)を超えない場合(ステップS304:No)、抽出装置100は、オブジェクトsの近傍オブジェクト集合N(G,s)の要素であるオブジェクトの中からオブジェクト集合Cに含まれないオブジェクトを一つ選択し、選択したオブジェクトuを、オブジェクト集合Cに格納する(ステップS306)。オブジェクト集合Cは、重複検索を回避するために便宜上設けられるものであり、処理開始時には空集合に設定される。
次に、抽出装置100は、オブジェクトuとオブジェクトyとの距離d(u,y)がr(1+ε)以下であるか否かを判定する(ステップS307)。オブジェクトuとオブジェクトyとの距離d(u,y)がr(1+ε)以下である場合(ステップS307:Yes)、抽出装置100は、オブジェクトuをオブジェクト集合Sに追加する(ステップS308)。
次に、抽出装置100は、オブジェクトuとオブジェクトyとの距離d(u,y)がr以下であるか否かを判定する(ステップS309)。オブジェクトuとオブジェクトyとの距離d(u,y)がrを超える場合(ステップS309:No)、抽出装置100は、ステップS315の判定(処理)を行う。
オブジェクトuとオブジェクトyとの距離d(u,y)がr以下である場合(ステップS309:Yes)、抽出装置100は、オブジェクトuをオブジェクト集合Rに追加する(ステップS310)。そして、抽出装置100は、オブジェクト集合Rに含まれるオブジェクト数がksを超えるか否かを判定する(ステップS311)。所定数ksは、任意に定められる自然数である。例えば、ks=2やks=10等の種々の設定であってもよい。
オブジェクト集合Rに含まれるオブジェクト数がksを超える場合(ステップS311:Yes)、抽出装置100は、オブジェクト集合Rに含まれるオブジェクトの中でオブジェクトyとの距離が最も長い(遠い)オブジェクトを、オブジェクト集合Rから除外する(ステップS312)。
次に、抽出装置100は、オブジェクト集合Rに含まれるオブジェクト数がksと一致するか否かを判定する(ステップS313)。オブジェクト集合Rに含まれるオブジェクト数がksと一致する場合(ステップS313:Yes)、抽出装置100は、オブジェクト集合Rに含まれるオブジェクトの中でオブジェクトyとの距離が最も長い(遠い)オブジェクトと、オブジェクトyとの距離を、新たなrに設定する(ステップS314)。
そして、抽出装置100は、オブジェクトsの近傍オブジェクト集合N(G,s)の要素であるオブジェクトから全てのオブジェクトを選択してオブジェクト集合Cに格納し終えたか否かを判定する(ステップS315)。オブジェクトsの近傍オブジェクト集合N(G,s)の要素であるオブジェクトから全てのオブジェクトを選択してオブジェクト集合Cに格納し終えていない場合(ステップS315:No)、抽出装置100は、ステップS306に戻って処理を繰り返す。
オブジェクトsの近傍オブジェクト集合N(G,s)の要素であるオブジェクトから全てのオブジェクトを選択してオブジェクト集合Cに格納し終えた場合(ステップS315:Yes)、抽出装置100は、オブジェクト集合Sが空集合であるか否かを判定する(ステップS316)。オブジェクト集合Sが空集合でない場合(ステップS316:No)、抽出装置100は、ステップS302に戻って処理を繰り返す。また、オブジェクト集合Sが空集合である場合(ステップS316:Yes)、抽出装置100は、オブジェクト集合Rを出力し、処理を終了する(ステップS317)。例えば、抽出装置100は、オブジェクト集合Rに含まれるオブジェクト(ノード)を検索クエリ(入力オブジェクトy)に対応する検索結果として、検索を行った表示装置10等へ提供してもよい。図17の例では、抽出装置100は、オブジェクト集合Rに含まれるノードN451やノードN35を検索クエリ(特許XのベクトルVD11)に対応する検索結果として、検索を行った表示装置10等へ提供してもよい。例えば、抽出装置100は、ノードN451に対応する特許#451や、ノードN35に対応する特許#35を特許Xに類似する特許文献としてユーザU1が利用する表示装置10に提供する。
〔9.効果〕
上述してきたように、実施形態に係る表示装置10は、取得部151と、表示部153とを有する。取得部151は、近傍検索における複数の検索対象が類似性に応じてエッジにより連結されたグラフ情報を取得する。また、表示部153は、取得部151により取得されたグラフ情報に基づいて、複数の検索対象のエッジの連結関係による各検索対象の類似関係を示す画像情報を表示する。
このように、実施形態に係る表示装置10は、近傍検索における複数の検索対象が類似性に応じてエッジにより連結されたグラフ情報に基づいて、複数の検索対象のエッジの連結関係による各検索対象の類似関係を示す画像情報を表示することにより、近傍検索に用いられるグラフに含まれる検索対象の類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、複数の検索対象の各々に対応する複数のベクトルが類似性に応じてエッジにより連結されたグラフ情報を取得する。表示部153は、取得部151により取得されたグラフ情報に基づいて、複数のベクトルのエッジの連結関係による各検索対象の類似関係を示す画像情報を表示する。
このように、実施形態に係る表示装置10は、近傍検索における複数の検索対象の各々に対応する複数のベクトルが類似性に応じてエッジにより連結されたグラフ情報に基づいて、複数のベクトルのエッジの連結関係による各検索対象の類似関係を示す画像情報を表示することにより、近傍検索に用いられるグラフに含まれる検索対象の類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、複数の検索対象の各々の特徴を示す複数のベクトルが類似性に応じてエッジにより連結されたグラフ情報を取得する。
このように、実施形態に係る表示装置10は、複数の検索対象の各々の特徴を示す複数のベクトルが類似性に応じてエッジにより連結されたグラフ情報を取得することにより、近傍検索に用いられるグラフに含まれる検索対象の類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、所定のモデルを用いて複数の検索対象から抽出された特徴量を要素とする複数のベクトルが、類似性に応じてエッジにより連結されたグラフ情報を取得する。
このように、実施形態に係る表示装置10は、所定のモデルを用いて複数の検索対象から抽出された特徴量を要素とする複数のベクトルが、類似性に応じてエッジにより連結されたグラフ情報を取得することにより、近傍検索に用いられるグラフに含まれる検索対象の類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、複数の検索対象に関する情報を所定のモデルに入力することにより、抽出される複数の検索対象の各々の特徴量を要素とする複数のベクトルが、類似性に応じてエッジにより連結されたグラフ情報を取得する。
このように、実施形態に係る表示装置10は、複数の検索対象に関する情報を所定のモデルに入力することにより、抽出される複数の検索対象の各々の特徴量を要素とする複数のベクトルが、類似性に応じてエッジにより連結されたグラフ情報を取得することにより、近傍検索に用いられるグラフに含まれる検索対象の類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、複数の検索対象の各々に含まれる情報の各種類に対応する複数のグラフ情報を取得する。表示部153は、複数のグラフ情報に基づいて、各種類に対応する複数の検索対象のエッジによる連結関係を示す複数の画像情報を表示する。
このように、実施形態に係る表示装置10は、複数のグラフ情報に基づいて、各種類に対応する複数のベクトルのエッジによる連結関係を示す複数の画像情報を表示することにより、近傍検索に用いられるグラフに含まれる検索対象の各種類に対応する類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、表示部153は、複数の画像情報のうち、所定の基準により選択される一の種類に対応する画像情報である選択画像情報を表示する。
このように、実施形態に係る表示装置10は、複数の画像情報のうち、所定の基準により選択される一の種類に対応する画像情報である選択画像情報を表示することにより、選択される一の種類に対応する検索対象の類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、ユーザによる種類の選択を示す選択情報を取得する。表示部153は、選択情報が示す種類に対応する選択画像情報を表示する。
このように、実施形態に係る表示装置10は、ユーザによる種類の選択した種類に対応する選択画像情報を表示することにより、ユーザが所望する種類に対応する類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、表示部153は、他の画像情報が表示されている場合、他の画像情報から選択画像情報に表示を変更する。
このように、実施形態に係る表示装置10は、他の画像情報が表示されている場合、他の画像情報から選択画像情報に表示を変更することにより、各種類に対応する画像を切り替えて表示し、各種類に対応する検索対象の類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、複数の検索対象である複数の特許出願書類の各々に含まれる書類の各種類に対応する複数のグラフ情報を取得する。
このように、実施形態に係る表示装置10は、複数の検索対象である複数の特許出願書類の各々に含まれる書類の各種類に対応する複数のグラフ情報を取得することにより、特許の各種類に対応する類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、複数の特許出願書類の各々に含まれる各要約書に対応する複数のベクトルの類似性に応じて、各要約書に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得する。
このように、実施形態に係る表示装置10は、複数の特許出願書類の各々に含まれる各要約書に対応する複数のベクトルの類似性に応じて、各要約書に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得することにより、特許の要約書に対応する類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、複数の特許出願書類の各々に含まれる各図面に対応する複数のベクトルの類似性に応じて、各図面に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得する。
このように、実施形態に係る表示装置10は、複数の特許出願書類の各々に含まれる各図面に対応する複数のベクトルの類似性に応じて、各図面に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得することにより、特許の図面に対応する類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、複数の特許出願書類の各々に含まれる各明細書に対応する複数のベクトルの類似性に応じて、各明細書に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得する。
このように、実施形態に係る表示装置10は、複数の特許出願書類の各々に含まれる各明細書に対応する複数のベクトルの類似性に応じて、各明細書に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得することにより、特許の明細書に対応する類似関係を容易に把握可能にすることができる。
また、実施形態に係る表示装置10において、取得部151は、複数の特許出願書類の各々に含まれる各特許請求の範囲に対応する複数のベクトルの類似性に応じて、各特許請求の範囲に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得する。
このように、実施形態に係る表示装置10は、複数の特許出願書類の各々に含まれる各特許請求の範囲に対応する複数のベクトルの類似性に応じて、各特許請求の範囲に対応する複数のノードが連結されたグラフ情報を含む複数のグラフ情報を取得することにより、特許の特許請求の範囲に対応する類似関係を容易に把握可能にすることができる。
〔10.プログラム〕
上述してきた表示装置10による処理は、本願に係る表示プログラムにより実現される。例えば、表示装置10に係る表示部153は、表示装置10が有するCPUやMPU等によって、例えば表示プログラムがRAMを作業領域として、表示プログラムに係る表示手順が実行されることにより実現される。表示装置10に係る他の処理部も同様に、表示プログラムによる各手順が実行されることにより実現される。
なお、本願に係る表示装置10が実行する処理は、必ずしも全てが表示プログラムによって実現されるものでなくてもよい。例えば、表示装置10外の情報等は、表示装置10が有するOS(Operating System)によって取得されてもよい。すなわち、表示プログラム自体が、上述してきたような表示装置10で実行される処理を実行するのではなく、OSによって取得されたデータ(例えば、フィルタ等を表示するために用いるデータ)を受け取ったりすることにより、上述してきた表示装置10の処理を実現するようにしてもよい。
〔11.ハードウェア構成〕
上述してきた実施形態に係る表示装置10や抽出装置100は、例えば図20に示すような構成のコンピュータ1000によって実現される。図20は、表示装置及び抽出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定のネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定のネットワークNを介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る表示装置10や抽出装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部15、130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定のネットワークNを介してこれらのプログラムを取得してもよい。
以上、本願の実施形態を図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔12.その他〕
また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた各実施形態に記載された各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。