以下に、本願に係る判定装置、判定方法、および判定プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る判定装置、判定方法、および判定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
[実施形態]
〔1−1.情報提供装置の一例〕
まず、図1を用いて、判定装置の一例である情報提供装置が実行する処理の一例について説明する。なお、以下の説明では、情報提供装置が実行する処理の一例として、所定の技術分野に属する技術要素を、各技術要素の関係性に基づいて連結したグラフ情報を生成し、生成したグラフ情報の変化に基づいて、所定の技術分野において技術革新等の変化が生じたか否かを判定する処理の一例について記載する。しかしながら、後述するように、実施形態の情報提供装置が実行する処理は、任意の目的に対して適用可能であり、以下の説明により利用目的が限定されるものではない。
図1は、実施形態に係る情報提供装置が実行する処理の一例を示す図である。図1では、情報提供装置10は、以下に説明する判定処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。より具体的には、情報提供装置10は、インターネット等の所定のネットワークN(例えば、図2参照)を介して、管理装置100といった任意の装置と通信が可能である。
管理装置100は、各種のコンテンツを管理する情報提供装置であり、例えば、サーバ装置やクラウドシステム等により実現される。例えば、管理装置100は、各種の技術分野に属する論文や特許出願に係る公開公報等のコンテンツを管理する。なお、管理装置100は、例えば、利用者により投稿されたレシピやSNS(Social Networking Service)に対する投稿等、テキストを含む任意の情報をコンテンツとして管理してよい。
〔1−2.グラフ情報の生成について〕
ここで、情報提供装置10は、ある技術分野に属する技術要素をノードとし、技術要素間の関係性をノード間のリンクに落とし込んだグラフ情報(以下、「技術グラフ」と記載する。)を生成する。例えば、情報提供装置10は、所定の技術分野に属する単語組で表される技術要素をノードとし、各要素間の関係性をノード間のリンクとして示すグラフ情報を生成する。このようなグラフ情報は、ある分野に属する技術要素が、どのような技術要素から生じたものであるかを示す情報である。例えば、第1技術要素が、第2技術要素と第3技術要素との組合せである場合や、第2技術要素と第3技術要素とから発展した技術である場合、第1技術要素と対応するノードは、リンクを介して、第2技術要素と対応するノードおよび第3技術要素と対応するノードと接続される。
ここで、情報提供装置10は、ある分野に属する技術を示す情報であれば、任意の情報を技術要素としてよい。例えば、情報提供装置10は、ある分野に属する特許発明や特許出願を技術要素とし、各技術要素同士の関係性を技術グラフに落とし込んでもよい。また、情報提供装置10は、1つの論文を1つの技術要素と見做し、引用関係がある論文同士をリンクにより接続することで、技術グラフを生成してもよい。また、情報提供装置10は、共通性を有する複数の論文を1つの技術要素と見做してもよい。
このような技術グラフにおいて、ノードの数の増加傾向は、その分野に属する技術要素の増加傾向、すなわち、新たな技術要素の増加傾向を示す。このような新たな技術要素の増加傾向は、その分野におけるイノベーションの生じやすさの指標と見做すことができる。また、このような技術グラフにおいて、リンクの数の増加傾向は、その分野においてある技術から他の技術がどれくらい生じやすいかを示すと考えられる。すなわち、リンクの数の増加傾向は、その分野において新たな技術が生じた際に、その技術に基づいて新たな技術がどれくらい生じやすいか、潜在的な技術発展の可能性の指標となりえる情報である。
〔1−3.判定処理について〕
ここで、技術グラフを利用したイノベーションの推定について説明する。例えば、イノベーションが発生しやすい分野、すなわち、発展性が豊かな分野においては、既存技術から新たな技術が生じやすい分野における新たな技術の生じやすさは、その分野に属する既存技術から新たな技術がどのように生じるかを特定することで判断できると考えられる。
そこで、技術グラフがどのように拡大していくかに基づいて、技術分野におけるイノベーションを推定する手法が考えられる。例えば、ある日時を境に技術グラフに含まれるノードの数やリンクの数が増大した場合は、その日時において何らかのイノベーションが生じたとも考えられる。しかしながら、このような手法では、ある技術分野の研究が流行し、技術要素の数が増大した場合に、イノベーションが生じているのか、単純に流行しているだけなのかを判別できない。
ここで、ある技術分野においてイノベーションが生じた場合には、技術グラフが拡大する態様が、それまでとは異なる態様に変化すると推定される。すなわち、イノベーションが生じた場合、技術グラフの特性が変化すると推定される。このため、技術グラフの位相構造が技術グラフの特性を示すと見做した場合、技術グラフが、位相構造を保持したまま拡大しているか、位相構造を変化させながら拡大しているかを判定することで、イノベーションの発生を推定することができると考えられる。
そこで、情報提供装置10は、技術グラフの大局的な形状若しくは局所的な形状に変化が生じたか否かを判定し、変化が生じた場合には、イノベーションが生じたと判定する。より具体的には、情報提供装置10は、多次元空間におけるグラフ情報から、各グラフ情報の位相構造を示すリーマン面を生成する。そして、情報提供装置10は、比較対象となる複数のグラフ情報から生成された複数のリーマン面を等角同値による同値類に基づいて分類した結果に基づき、比較対象となるグラフ情報が、類似する構造を有しているか否かを判定する。
例えば、情報提供装置10は、所定の日時において所定の技術分野に属する技術要素と各技術要素間の関係性とを示す第1グラフ情報から生成された第1リーマン面を生成する。また、情報提供装置10は、所定の日時よりも後の日時において所定の技術分野に属する技術要素と各技術要素間の関係性とを示す第2グラフ情報から生成された第2リーマン面を生成する。そして、情報提供装置10は、第1リーマン面と第2リーマン面とを等角同値による同値類に基づいて分類し、分類結果に基づいて、所定の技術分野においてイノベーションが生じたか否かを判定する。
例えば、第1リーマン面と第2リーマン面とを等角同値による同値類で分類した場合に第1リーマン面と第2リーマン面とが同じ同値類に分類される場合、第1グラフ情報と第2グラフ情報とは、その位相構造にあまり変化が無かったと考えられる。そこで、情報提供装置10は、第1リーマン面と第2リーマン面とが同じ同値類に分類される場合は、所定の技術分野においてイノベーションが発生していないと判定する。一方、第1リーマン面と第2リーマン面とが異なる同値類に分類される場合、第1グラフ情報と第2グラフ情報とは、その位相構造に変化が生じていると考えられる。そこで、情報提供装置10は、第1リーマン面と第2リーマン面とが異なる同値類に分類される場合は、所定の技術分野においてイノベーションが発生したと判定する。
〔1−4.判定処理の一例について〕
以下、図1を用いて、情報提供装置10が実行する判定処理の一例について説明する。まず、情報提供装置10は、管理装置100から各技術分野に属するコンテンツを収集する(ステップS1)。そして、情報提供装置10は、技術分野ごとに技術グラフを生成する(ステップS2)。例えば、情報提供装置10は、第1の技術分野に属する技術要素と技術要素間の関連性とに基づいて、技術グラフG1−1を生成し、第2の技術分野に属する技術要素と技術要素間の関連性とに基づいて、技術グラフG2−1を生成する。
ここで、情報提供装置10は、所定の時間間隔で、ステップS1およびステップS2を繰り返し実行することで、異なる日時における技術グラフを各技術分野ごとに生成する。例えば、情報提供装置10は、第1の技術分野について、第1の日時における技術要素と技術要素間の関連性とを示す技術グラフG1−1を生成するとともに、第1の技術分野について、第2の日時における技術要素と技術要素間の関連性とを示す技術グラフG1−2を生成する。
続いて、情報提供装置10は、所定の技術分野において異なる日時における技術グラフを取得する(ステップS3)。例えば、情報提供装置10は、第1の技術分野において第1の日時から第2の日時までの間にイノベーションが生じたか否かを判定する場合は、技術グラフG1−1および技術グラフG1−2を取得する。
そして、情報提供装置10は、技術グラフをリーマン面に変換する(ステップS4)。例えば、情報提供装置10は、技術グラフを多様体空間上のつながり(基本群)とみなすことで、技術グラフの位相構造を示すリーマン面を生成する。より具体的な例を挙げると、情報提供装置10は、第1ノードからリンクを辿って第2ノードへと至るリンクの経路を同値と見做すことで、リーマン面の位相構造を推定する。
例えば、情報提供装置10は、ある技術グラフにおいて、第1ノードから第2ノードへと至るリンクの経路が2つ存在する場合、その技術グラフの位相構造を有するリーマン面は、少なくとも1つの孔を有するトーラスの形状を有すると推定する。なお、情報提供装置10は、グラフ構造の位相構造を推定する任意の推定技術に基づいて、技術グラフの位相構造を推定し、推定した位相構造と同じ位相構造を有するリーマン面の設定を行ってもよい。このような処理の結果、例えば、情報提供装置10は、技術グラフG1−1からリーマン面LG1−1を生成し、技術グラフG1−2から、リーマン面LG1−2を生成する。なお、図1においては、リーマン面をトーラスで示したが、実際には、情報提供装置10は、技術グラフ毎に異なる位相構造を有するリーマン面を生成する。
続いて、情報提供装置10は、各リーマン面を等角同値による同値類に基づいて分類する。例えば、情報提供装置10は、各リーマン面LG1−1とリーマン面LG1−2が同一のモジュラー群であるか否かを判定する(ステップS5)。また、情報提供装置10は、各リーマン面LG1−1とリーマン面LG1−2がタイヒミュラー同値であるか否かを判定する(ステップS6)。
例えば、非特許文献1に記載されているように、あるリーマン面Sとリーマン面S’とが同相で、かつ、その同相写像として等角(正則)なものが取れる場合は、リーマン面Sとリーマン面S’とは、等角同値となる。ここで、リーマン面Sと同相なリーマン面全体を等角同値による同値類で分けた集合は、モジュライ(空間)と呼ばれ、M(S)で表される。このような等角同値となる複数のリーマン面、すなわち、同じ同値類に分類されたリーマン面は、モジュライ空間上で同一の点と見做すことができる。そこで、情報提供装置10は、比較対象となる技術グラフのリーマン面が同じ同値類に分類される場合、各技術グラフの位相構造が大局的に類似すると判定する。
ここで、種類gのコンパクトリーマン面Sを固定し、擬等角変形全体を以下の式(1)で定義する。ここで、式(1)のSはリーマン面S、Rはリーマン面Rを示し、fは、リーマン面Sをリーマン面Rへと変化させる同相写像であって、擬等角写像を表す。また、qc(quasi-conformal map)は、擬等角写像を示す。ここで、qcは、向きを保持する同相車上であり、ヘルダー連続である。また、qcは、ほとんどいたるところで全微分可能であり、qcの合成および逆写像もqcとなる。また、qcでは、複素平面Cと単位円板Dとを区別する。
ここで、リーマン面R1をリーマン面R2へと変形する擬等角写像とホモトピックな等角同相写像hが存在する場合、Def(S)に元として含まれる(R1、f1)、(R2、f2)がタイヒミュラー同値となる。このため、リーマン面Sのタヒミュラー空間T(S)は、以下の式(2)で表すことができる。
ここで、比較対象となるリーマン面がタイヒミュラー同値となる場合、比較対象となるリーマン面により構成される位相構造の形状は、大きさを自由に変更可能な服(カバー)を同じように着せることができると言える。すなわち、タイヒミュラー同値となるリーマン面の位相構造は、局所的に類似すると言える。そこで、情報提供装置10は、リーマン面Sとリーマン面Rが、以下の式(3)を満たす場合は、リーマン面Sとリーマン面Rとがタイヒミュラー同値であると判定する。
そして、情報提供装置10は、判定結果に基づいて、所定の技術分野においてイノベーションが発生したか否かを判定する(ステップS7)。例えば、情報提供装置10は、技術分野全体に対する大局的なイノベーションが発生したか否かを判定する。また、情報提供装置10は、技術分野の一部に対する局所的なイノベーションが発生したか否かを判定する。
例えば、情報提供装置10は、リーマン面LG1−1とリーマン面LG1−2とが同一のモジュラー群に属さない場合には、技術グラフG1−1と技術グラフG1−2とが、大局的に異なる構造を有していると判定する。このように、技術グラフG1−1と技術グラフG1−2とが大局的に異なる構造を有する場合、第1の日時から第2の日時の間に、技術分野全体に影響する何かしらのイノベーションが発生したと考えられる。そこで、情報提供装置10は、技術グラフG1−1と技術グラフG1−2とが、大局的に異なる構造を有していると判定した場合は、技術グラフG1−1と対応する日時から、技術グラフG1−2と対応する日時迄の間に、技術分野全体に影響するイノベーションが発生したと判定する。
一方、情報提供装置10は、リーマン面LG1−1とリーマン面LG1−2とが同一のモジュラー群に属する場合には、技術グラフG1−1と技術グラフG1−2とが、大局的に類似する構造を有していると判定する。このように、技術グラフG1−1と技術グラフG1−2とが大局的に類似する構造を有する場合、第1の日時から第2の日時の間に、技術分野全体に影響する何かしらのイノベーションが発生していないと考えられる。そこで、情報提供装置10は、技術グラフG1−1と技術グラフG1−2とが、大局的に類似する構造を有していると判定した場合は、技術グラフG1−1と対応する日時から、技術グラフG1−2と対応する日時迄の間に、技術分野全体に影響するイノベーションが発生しなかったと判定する。なお、情報提供装置10は、非特許文献1に開示されているように、一意化定理(モデル化定理)を用いて、リーマン面の分類を行ってもよい。
また、例えば、情報提供装置10は、リーマン面LG1−1とリーマン面LG1−2とがタイヒミュラー同値ではない場合には、技術グラフG1−1と技術グラフG1−2とが、局所的に異なる構造を有していると判定する。このように、技術グラフG1−1と技術グラフG1−2とが局所的に異なる構造を有する場合、第1の日時から第2の日時の間に、技術分野の一部に影響する何かしらのイノベーションが発生したと考えられる。そこで、情報提供装置10は、技術グラフG1−1と技術グラフG1−2とが、局所的に異なる構造を有していると判定した場合は、技術グラフG1−1と対応する日時から、技術グラフG1−2と対応する日時迄の間に、技術分野の一部(すなわち、その技術分野に属する下位分野)に影響するイノベーションが発生したと判定する。
一方、例えば、情報提供装置10は、リーマン面LG1−1とリーマン面LG1−2とがタイヒミュラー同値である場合には、技術グラフG1−1と技術グラフG1−2とが、局所的に類似する構造を有していると判定する。このように、技術グラフG1−1と技術グラフG1−2とが局所的に類似する構造を有する場合、何らかのイノベーションが生じていたとしても、類似する構造の範囲には、イノベーションの影響が及んでいないと推定される。そこで、情報提供装置10は、技術グラフG1−1と技術グラフG1−2とが、局所的に類似する構造を有していると判定した場合は、イノベーションが生じていない、もしくは、イノベーションの影響が及んでいない範囲があると判定する。
そして、情報提供装置10は、判定結果を利用者に対して提供する(ステップS8)。このような処理の結果、情報提供装置10は、利用者に対して、所定の技術分野において、第1の日時から第2の日時までの間に、技術分野全体に対して大局的に影響を及ぼすイノベーションが生じたか否か、技術分野の一部に対して局所的に影響を及ぼすイノベーションが生じたか否かを通知することができる。
〔1−5.判定処理の適用対象について〕
上述した説明では、情報提供装置10は、ある技術分野において、第1の日時における技術要素や技術要素間の関係性を示す技術グラフG1−1、および、第2の日時における技術要素や技術要素間の関係性を示す技術グラフG1−2について、リーマン面を等角同値による同値類に基づいて分類した結果に基づいて、類似する構造を有するか否かを判定し、判定結果に基づいて、第1の日時から第2の日時までの間にイノベーションが生じたか否かを判定した。しかしながら、実施形態は、これに限定されるものではない。
例えば、情報提供装置10は、異なる技術分野の技術グラフについて、類似する構造を有するか否かを判定することで、各技術分野が類似するか否かを判定してもよい。例えば、情報提供装置10は、第1技術分野に属する技術要素と各技術要素間の関係性とを示す第1グラフ情報から生成された第1リーマン面と、第1技術分野とは異なる第2技術分野に属する技術要素と各技術要素間の関係性とを示す第2グラフ情報から生成された第2リーマン面とを生成する。そして、情報提供装置10は、生成した第1リーマン面と第2リーマン面とを等角同値による同値類に基づいて分類し、分類結果に基づき、第1グラフ情報と第2グラフ情報とが類似する構造を有しているか否かを判定してもよい。また、情報提供装置10は、判定結果に基づいて、第1技術分野と第2技術分野とが類似するか否かを判定してもよい。
例えば、情報提供装置10は、薬学の技術グラフと、レシピの技術グラフとについて、リーマン面を生成し、生成したリーマン面が同一のモジュラー群に分類されるか否かに基づいて、薬学とレシピとが大局的に類似する分野であるか否かを判定してもよい。また、情報提供装置10は、生成したリーマン面がタイヒミュラー同値であるか否かに基づいて、薬学とレシピとに局所的に類似する部分があるか否かを判定してもよい。
また、情報提供装置10は、上述した判定処理を実行することで、複雑な技術と簡単な技術との技術構造が類似するか否かを判定することができる。すなわち、情報提供装置10は、技術グラフそのものではなく、技術グラフの位相構造を示すリーマン面を比較することで、比較対象となる技術グラフの規模(例えば、ノードの数やリンクの数)が異なる場合であっても、各技術分野が類似するか否かを判定することができる。
例えば、情報提供装置10は、第1技術分野の技術グラフから第1リーマン面を生成する。また、情報提供装置10は、第1技術分野よりも属する技術要素の数が少ない、若しくは、第1技術分野よりも技術要素間の関係性が低い第2技術分野に属する技術要素と各技術要素間の関係性とを示す第2グラフ情報から、第2リーマン面を生成する。そして、情報提供装置10は、第1リーマン面と第2リーマン面との分類結果に基づき、第1グラフ情報と第2グラフ情報とが類似する構造を有しているか否かを判定し、判定結果に応じて、第1技術分野と第2技術分野とが類似するか否かを判定してもよい。
すなわち、情報提供装置10は、各技術分野の技術グラフ同士を比較するのではなく、技術グラフの位相構造を示すリーマン面を生成し、生成したリーマン面を等角同値による同値類に分類できるか否かに基づいて、各技術グラフの類似性、ひいては、各技術分野の類似性を判断するのであれば、任意の目的について上述した判定処理を採用してよい。
また、情報提供装置10は、比較対象となる分野に応じて異なる時間間隔で、技術グラフの比較を行ってよい。例えば、情報提供装置10は、ウェブ関連技術等、イノベーションが発生しやすい分野については、所定の時間間隔よりも短い時間間隔で技術グラフを生成し、生成した各技術グラフのリーマン面の分類結果に基づいて、イノベーションの発生を判定してもよい。また、例えば、情報提供装置10は、イノベーションが発生しづらい分野については、所定の時間間隔よりも長い時間間隔で技術グラフを生成し、生成した各技術グラフのリーマン面の分類結果に基づいて、イノベーションの発生を判定してもよい。
〔1−6.複数の技術グラフについて〕
上述した説明では、情報提供装置10は、2つのリーマン面について、等角同値による同値類に分類した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、3つ以上のリーマン面について、等角同値による同値類への分類を行ってよい。
例えば、情報提供装置10は、所定の技術分野において、第1日時における第1技術グラフから第1リーマン面を生成し、第1日時よりも後の第2日時における第2技術グラフから第2リーマン面を生成し、さらに第2日時よりも後の第3日時における第3技術グラフから第3リーマン面を生成する。そして、情報提供装置10は、第1リーマン面と第2リーマン面と第3リーマン面とが、それぞれ異なる同値類に分類される場合、所定の技術分野において継続的にイノベーションが生じていると判定してもよい。また、情報提供装置10は、第1リーマン面と第2リーマン面とが同じ同値類に分類され、第3リーマン面が異なる同値類に分類される場合、第2日時と第3日時との間でイノベーションが生じたと判定してもよい。
また、情報提供装置10は、複数の技術分野について、各技術分野の技術グラフからリーマン面を生成し、生成したリーマン面の分類結果に基づいて、各技術分野の分類を行ってもよい。すなわち、情報提供装置10は、任意の単位で上述した判定処理を実行して良い。
〔1−7.分類結果の解釈について〕
上述した説明では、情報提供装置10は、リーマン面が同一のモジュラー群であるか否かを判定するとともに、タイヒミュラー同値であるか否かを判定し、判定結果に基づいて、技術分野が大局的或いは局所的に類似するか否かを判定した。ここで、情報提供装置10は、判定結果に基づいて、任意の解釈を行ってよい。例えば、情報提供装置10は、リーマン面が同一のモジュラー群であるが、タイヒミュラー同値ではない場合は、イノベーションが発生したばかり、若しくは、局所的なイノベーションのみが生じたと判定してもよい。
〔1−8.技術グラフの予測について〕
ここで、情報提供装置10は、予測された技術グラフを用いて、将来のイノベーションの発生を推定してもよい。例えば、情報提供装置10は、所定の技術分野について、所定の日時における技術グラフから第1リーマン面を生成するとともに、その技術グラフから将来の技術グラフを推定し、推定した技術グラフから第2リーマン面を生成する。そして、情報提供装置10は、第1リーマン面と第2リーマン面とが、大局的あるいは局所的に異なる位相構造を有する場合、将来においてイノベーションが発生すると推定してもよい。
例えば、情報提供装置10は、過去の技術要素の数の変化や、技術要素間の関係性の変化に基づいて、その分野における技術グラフの発展を示すパラメータを推定し、推定したパラメータに基づいて技術グラフに含まれるノードやリンクの数を変化させることで、対象分野における将来の技術グラフを生成する。そして、情報提供装置10は、生成した技術グラフのリーマン面と、現在の技術グラフのリーマン面との分類結果に基づいて、将来のイノベーションを推定してもよい。
また、非特許文献2に記載されているように、技術分野の発展をポリアの壺アルゴリズムにより数学的に表す手法が考えられる。そこで、情報提供装置10は、ポリアの壺アルゴリズムを用いて、技術グラフを発展させ、将来の技術グラフを予測してもよい。より具体的には、情報提供装置10は、ある技術分野に属する文章により示される技術要素をノードとし、各技術要素間の関係性をノード間のリンクとして示すグラフ構造において、ポリアの壺に基づく確率で既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、将来の技術グラフを予測してもよい。
以下、ポリアの壺アルゴリズムの一例について説明する。例えば、ポリアの壺アルゴリズムにおいては、それぞれ異なる色の玉が入れられた壺からランダムに1つの玉が取り出され、取り出された玉が、初めて取り出された玉の色であるか否かが判定される。そして、取り出された玉が、過去に取り出された玉と同じ色である場合は、取り出された玉が壺に戻されるとともに、その玉と同じ色の玉が所定の数だけ壺に追加される。一方、取り出された玉が初めて取り出された色である場合は、取り出された玉が壺に戻され、その玉と同じ色の玉が所定の数だけ壺に追加されるとともに、それぞれ色が異なる所定の数の玉であって、それぞれが新たな色を有する玉が壺に入れられる。
このようなポリアの壺アルゴリズムは、ある分野における技術要素の発展の確率モデルと見做せる。例えば、壺の中に入れられた玉を技術要素とした場合、壺の中から取り出された玉の色が初めて取り出された玉の色である確率は、新たな技術要素が発生する確率と対応付けることができる。また、取り出された玉が初めて取り出された色である場合に、新たに壺の中に入れられる新たな色の玉の数は、新たな技術要素が発生した際にその技術から将来発生する新たな技術要素の数を示すパラメータと対応付けることができる。また、取り出された玉とともに壺に入れられる玉であって、壺の中から取り出された玉と同じ色の玉の数は、技術要素間の関係性、すなわち、リンクが生じるパラメータと対応付けることができる。
そこで、情報提供装置10は、ポリアの壺アルゴリズムを用いて、技術グラフを発展させ、対象分野における将来の発展傾向を推定する。例えば、情報提供装置10は、複数種別の要素の集合からいずれかの要素が選択された際に、選択された要素とともに選択された要素とは異なる種別の要素を集合に加えた後において各種別の要素が選択される確率に基づいて、既存のノードから、そのノードとリンクにより接続される新たなノードが発生するものとして、将来の技術グラフを予測してもよい。
〔2.情報提供装置の構成〕
以下、上記した提供処理を実現する情報提供装置10が有する機能構成の一例について説明する。図2は、実施形態に係る情報提供装置の構成例を示す図である。図2に示すように、情報提供装置10は、通信部20、記憶部30、および制御部40を有する。
通信部20は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部20は、ネットワークNと有線または無線で接続され、管理装置100、利用者端末300、および事業者装置200との間で情報の送受信を行う。
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部30は、技術グラフデータベース31を記憶する。
技術グラフデータベース31には、技術グラフが登録されている。例えば、図3は、実施形態に係る技術グラフデータベースに登録される情報の一例を示す図である。図3に示す例では、技術グラフデータベース31には、「カテゴリ」、「パラメータ」、「リンクID(Identifier)」、「第1ノードID」、および「第2ノードID」等といった項目を有する情報が、技術グラフごとに登録される。
ここで、「カテゴリ」とは、技術グラフと対応する対応カテゴリを示す情報である。また、「パラメータ」とは、対応する技術グラフにおいてノードやリンクの数がどのように増加していくかを示すパラメータである。また、「リンクID」とは、技術グラフに含まれるリンクを識別するための情報である。また、「第1ノードID」および「第2ノードID」とは、対応付けられた「リンクID」が示すリンクによって接続されたノード、すなわち、関連性を有する2つの技術要素を示すノードを識別する情報である。
例えば、図3に示す例では、「技術グラフ#1」が示す技術グラフの情報として、カテゴリ「カテゴリ#1」、パラメータ「パラメータ#1」、リンクID「リンク#1」、第1ノードID「ノード#1」、および第2ノードID「ノード#2」が対応付けて登録されている。このような情報は、「技術グラフ#1」が示す技術グラフが、「カテゴリ#1」と対応する技術グラフであり、上述したρやvの値として、パラメータ「パラメータ#1」が設定され、リンクID「リンク#1」が示すリンクにより、第1ノードID「ノード#1」が示すノードと、第2ノードID「ノード#2」が示すノードとが接続されている旨を示す。
なお、図3に示す例では、「カテゴリ#1」、「リンク#1」、「ノード#1」等といった概念的な値について記載したが、実際には、カテゴリを示す文字列や数値、リンクやノードを示す文字列や数値等が登録されることとなる。また、図3に示す情報は、あくまで一例であり、技術グラフデータベース31には、グラフ構造を有するデータであれば、任意の形式のデータが登録されていてよい。また、技術グラフデータベース31には、各技術分野の技術グラフであって、所定の時間ごとに生成された技術グラフが登録されているものとする。
図2に戻り、説明を続ける。制御部40は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報提供装置10内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部40は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
図2に示すように、制御部40は、収集部41、変換部42、生成部43、判定部44、および提供部45を有する。
収集部41は、単語組の抽出元となるコンテンツとして、各技術分野に属する文献を収集する。例えば、収集部41は、管理装置100が管理する文献を収集する。
変換部42は、収集部41が収集した文献を技術分野ごとの技術グラフに変換する。例えば、変換部42は、同一の技術分野(カテゴリ)に属する論文や特許発明等を技術要素とするとともに、技術要素間の関係性を特定する。例えば、変換部42は、形態素解析や文章解析の各種公知技術を用いて、論文や特許発明の明細書に含まれる単語群を抽出し、抽出した単語群が示す技術要素と、技術要素同義の関係性とを特定する。このような特定は、例えば、各種意図解析の技術を用いて、イノベーションの単位となる技術を特定することにより実現されてもよい。
また、推定した技術同士の関係性を単語群の共起姓に基づいて、技術要素間の関係性を特定してもよい。すなわち、変換部42は、各種の意図解析技術を用いて、技術要素を特定し、単語群の類似性や共起性に基づいて単語群が示す意味同士の関係性を推定する推定技術を用いて、技術要素間の関係性を特定するのであれば、任意の意図解析技術や推定技術を採用してよい。
そして、変換部42は、特定した技術要素をノードとし、技術要素間の関係性をリンクとした技術グラフを生成し、生成した技術グラフを技術グラフデータベース31に登録する。なお、変換部42は、バラバシ・アルバートモデルを用いて、技術グラフの初期状態を生成し、生成した技術グラフを技術グラフデータベース31に登録してもよい。
また、変換部42は、技術グラフごとに、グラフの成長を示す各種パラメータの値を設定する。例えば、変換部42は、実際の論文数や特許発明数等といった技術要素の数の変化に基づいて、単位時間あたりのノードの増加量を特定してもよい。また、変換部42は、実際の技術要素間の関係性の変化に基づいて、単位時間あたりのリンクの増加量を特定してもよい。そして、変換部42は、これらノードの増加量やリンクの増加量に基づいて、グラフの成長を示す各種パラメータを、技術グラフデータベース31に登録する。
生成部43は、多次元空間におけるグラフ情報から、各グラフ情報の位相構造を示すリーマン面を生成する。例えば、生成部43は、判定目的を受付ける。より具体的には、生成部43は、ある技術分野においてイノベーションが発生したか否かの判定、複数の技術分野が類似するか否かの判定、もしくは、将来のイノベーションの発生推定のいずれかの指定を受付ける。このような場合、生成部43は、判定目的に応じた技術グラフから、リーマン面の生成を行う。
例えば、生成部43は、ある技術分野においてイノベーションが発生したか否かの判定を行う場合、その技術分野における技術グラフであって、異なる日時に対応する技術グラフを技術グラフデータベース31から抽出する。そして、生成部43は、抽出した各技術グラフからリーマン面を生成する。例えば、生成部43は、技術グラフを多様体空間上の基本群とみなすことで、技術グラフの位相構造を示すリーマン面を生成する。
また、例えば、生成部43は、複数の技術分野が類似するか否かの判定を行う場合、各技術分野における技術グラフをそれぞれ技術グラフデータベース31から抽出する。そして、生成部43は、抽出した技術グラフのリーマン面をそれぞれ生成する。
また、例えば、生成部43は、将来のイノベーションの発生推定を行う場合、推定対象となる技術分野における技術グラフのうち、最新の技術グラフを抽出する。続いて、生成部43は、ポリアの壺アルゴリズムに基づき、最新の技術グラフを時間発展させたグラフ、すなわち、将来における技術グラフの推定を行う。そして、生成部43は、抽出した技術グラフと、将来における技術グラフとのリーマン面をそれぞれ生成する。なお、生成部43は、最新の技術グラフから時間発展させたグラフを複数生成し、生成した各グラフごとにリーマン面の生成を行ってもよい。
判定部44は、比較対象となる複数の技術グラフから生成された複数のリーマン面を等角同値による同値類に基づいて分類した結果に基づき、比較対象となる技術グラフが、類似する構造を有しているか否かを判定する。例えば、判定部44は、生成部43によって生成されたリーマン面を、等角同値による同値類に分類する。そして、判定部44は、分類結果に基づいて、各リーマン面と対応する技術グラフが類似する構造を有しているか否かを判定する。
例えば、判定部44は、比較対象となる複数の技術グラフから生成された複数のリーマン面が同一のモジュラー群に属するか否かに基づいて、比較対象となる技術グラフが、類似する構造を有しているか否かを判定する。より具体的には、判定部44は、生成部43により生成された各リーマン面のペアごとに、等角同値であるか否かを判定し、判定結果に基づいて等角同値となるリーマン面をグルーピングすることで、各リーマン面をモジュラー群に分類する。そして、判定部44は、複数のリーマン面が同一のモジュラー群に属する場合は、比較対象となる技術グラフが大局的に類似する構造を有していると判定する。一方、判定部44は、複数のリーマン面が同一のモジュラー群に属する場合は、比較対象となる技術グラフが大局的に類似する構造を有していないと判定する。
また、例えば、判定部44は、比較対象となる複数の技術グラフから生成された複数のリーマン面がタイヒミュラー同値であるか否かに基づいて、比較対象となる技術グラフが、類似する構造を有しているか否かを判定する。より具体的には、判定部44は、各リーマン面のペアごとに、タイヒミュラー同値であるか否かを判定し、判定結果に基づいて、タイヒミュラー同値であるリーマン面をグルーピングする。そして、判定部44は、同一のグループにグルーピングされたリーマン面については、比較対象となる技術グラフが局所的に類似する構造を有していると判定する。一方、判定部44は、異なるのグループにグルーピングされたリーマン面については、比較対象となる技術グラフが局所的に類似する構造を有していないと判定する。
また、判定部44は、判定結果に基づいて、ある技術分野においてイノベーションが発生したか否かの判定、複数の技術分野が類似するか否かの判定、もしくは、将来のイノベーションの発生推定を行う。
例えば、判定部44は、所定の日時において所定の技術分野に属する技術要素と各技術要素間の関係性とを示す第1技術グラフから生成された第1リーマン面と、所定の日時よりも後の日時において所定の技術分野に属する技術要素と各技術要素間の関係性とを示す第2技術グラフから生成された第2リーマン面とを分類する。そして、判定部44は、分類結果に基づき、第1技術グラフと第2技術グラフとが類似する構造を有しているか否かを判定し、判定結果に基づいて、所定の技術分野における変化が生じたか否かを判定する。より具体的には、判定部44は、第1リーマン面と第2リーマン面との構造が類似すると判定した場合は、第1日時から第2日時までの間でイノベーションが生じたと判定する。なお、判定部44は、生成部43が最新の技術グラフから時間発展させたグラフのリーマン面を第2リーマン面として、上述した処理を実行することで、将来のイノベーションの発生を推定してもよい。
また、例えば、判定部44は、第1技術分野に属する技術要素と各技術要素間の関係性とを示す第1技術グラフから生成された第1リーマン面と、第1技術分野とは異なる第2技術分野に属する技術要素と各技術要素間の関係性とを示す第2技術グラフから生成された第2リーマン面との分類を行う。そして、判定部44は、分類結果に基づき、第1技術グラフと第2技術グラフとが類似する構造を有しているか否かを判定し、判定結果に基づいて、第1技術分野と第2技術分野とが類似するか否かを判定する。例えば、判定部44は、第1リーマン面と第2リーマン面との構造が類似すると判定した場合は、第1技術分野と第2技術分野とが類似すると判定する。
ここで、判定部44は、第1技術分野よりも属する技術要素の数が少ない、若しくは、第1技術分野よりも技術要素間の関係性が低い第2技術分野に属する技術要素と各技術要素間の関係性とを示す第2技術グラフから生成された第2リーマン面と、第1リーマン面との分類を行い、分類結果に基づいて、第1技術グラフと第2技術グラフとが類似する構造を有しているか否かを判定してもよい。このような処理を実行することで、判定部44は、規模が異なる分野同士の比較を実現する。
提供部45は、判定部44による判定結果を利用者に提供する。例えば、提供部45は、イノベーションが発生したか否か、将来イノベーションが発生するか否か、若しくは、複数の技術分野が類似するか否かを示す情報を利用者に対して提供してもよい。なお、このような情報は、例えば、テキストや画像等により提供されることとなる。
〔3.情報提供装置が実行する処理の流れの一例〕
次に、図4を用いて、情報提供装置10が実行する処理の流れの一例について説明する。図4は、実施形態に係る情報提供装置が実行する処理の流れの一例を説明するフローチャートである。なお、図4に示す例では、処理の一例として、将来のイノベーションの発生を推定する処理の流れの一例を記載した。
まず、情報提供装置10は、技術グラフを生成し(ステップS101)、ポリアの壺アルゴリズムによる各パラメータに基づいて、各技術グラフのノードとリンクとの数の増加傾向を推定する(ステップS102)。そして、情報提供装置10は、推定結果に基づいて、将来の技術グラフを生成する(ステップS103)。
続いて、情報提供装置10は、現在の技術グラフおよび生成した技術グラフをそれぞれリーマン面に変換し(ステップS104)、リーマン面がモジュラー群であるか否かに基づいて、技術グラフが大局的に類似するか否かを判定する(ステップS105)。また、情報提供装置10は、リーマン面がタイヒミュラー同値であるか否かに基づいて、技術グラフが局所的に類似するか否かを判定する(ステップS106)。
そして、情報提供装置10は、判定結果に基づいて、技術グラフと対応する技術分野のイノベーションの発生を推定し(ステップS107)、推定結果を利用者に提供して(ステップS108)、処理を終了する。
〔4.変形例〕
上記では、情報提供装置10による処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報提供装置10が実行する処理のバリエーションについて説明する。
〔4−1.装置構成〕
上述した例では、情報提供装置10は、情報提供装置10内で判定処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、情報提供装置10は、複数の装置が協調して動作することで、上述した判定処理を実行してもよい。また、情報提供装置10は、例えば、外部の記憶サーバが保持する技術グラフデータベース31を参照してもよい。また、情報提供装置10は、他の情報処理装置が生成した技術グラフを取得し、取得した技術グラフを用いた処理を実行してもよい。このような場合、情報提供装置10は、生成部43および判定部44のみを有することとなる。
〔4−2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
〔4−3.プログラム〕
また、上述してきた実施形態に係る情報提供装置10は、例えば図5に示すような構成のコンピュータ1000によって実現される。図5は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
例えば、コンピュータ1000が情報提供装置10として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムまたはデータを実行することにより、制御部40の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムまたはデータを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
〔5.効果〕
上述したように、情報提供装置10は、多次元空間における技術グラフから、各技術グラフの位相構造を示すリーマン面を生成する。そして、情報提供装置10は、比較対象となる複数の技術グラフから生成された複数のリーマン面を等角同値による同値類に基づいて分類した結果に基づき、比較対象となる技術グラフが、類似する構造を有しているか否かを判定する。このような処理の結果、情報提供装置10は、多次元のグラフ情報間の類似関係を適切に判定することができる。
また、例えば、情報提供装置10は、比較対象となる複数の技術グラフから生成された複数のリーマン面が同一のモジュラー群に属するか否かに基づいて、比較対象となる技術グラフが、類似する構造を有しているか否かを判定する。例えば、情報提供装置10は、複数のリーマン面が同一のモジュラー群に属する場合は、比較対象となる技術グラフが類似する構造を有していると判定する。このため、情報提供装置10は、多次元のグラフ情報が大局的に類似しているか否かを適切に判定できる。
また、例えば、情報提供装置10は、比較対象となる複数の技術グラフから生成された複数のリーマン面がタイヒミュラー同値であるか否かに基づいて、比較対象となる技術グラフが、類似する構造を有しているか否かを判定する。例えば、情報提供装置10は、複数のリーマン面がタイヒミュラー同値である場合は、比較対象となる技術グラフが類似する構造を有していると判定する。このため、情報提供装置10は、多次元のグラフ情報が局所的に類似しているか否かを適切に判定できる。
また、例えば、情報提供装置10は、所定の日時において所定の技術分野に属する技術要素と各技術要素間の関係性とを示す第1技術グラフから生成された第1リーマン面と、所定の日時よりも後の日時において所定の技術分野に属する技術要素と各技術要素間の関係性とを示す第2技術グラフから生成された第2リーマン面とを分類する。そして、情報提供装置10は、分類結果に基づき、第1技術グラフと第2技術グラフとが類似する構造を有しているか否かを判定し、判定結果に基づいて、所定の技術分野における変化が生じたか否かを判定する。このため、情報提供装置10は、所定の技術分野においてイノベーションが発生したか否かを判定することができる。
また、例えば、情報提供装置10は、第1技術分野に属する技術要素と各技術要素間の関係性とを示す第1技術グラフから生成された第1リーマン面と、第1技術分野とは異なる第2技術分野に属する技術要素と各技術要素間の関係性とを示す第2技術グラフから生成された第2リーマン面とを分類する。そして、情報提供装置10は、分類結果に基づき、第1技術グラフと第2技術グラフとが類似する構造を有しているか否かを判定し、判定結果に基づいて、第1技術分野と第2技術分野とが類似するか否かを判定する。このため、情報提供装置10は、異なる技術分野が類似するか否かを判定することができる。
また、例えば、情報提供装置10は、第1技術分野よりも属する技術要素の数が少ない、若しくは、第1技術分野よりも技術要素間の関係性が低い第2技術分野に属する技術要素と各技術要素間の関係性とを示す第2技術グラフから生成された第2リーマン面と、第1リーマン面とを分類する。そして、情報提供装置10は、分類結果に基づき、第1技術グラフと第2技術グラフとが類似する構造を有しているか否かを判定する。このため、情報提供装置10は、規模が異なる技術分野が類似するか否かを適切に判定することができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。