JPWO2015029809A1 - データ分析方法、プログラム、及び装置 - Google Patents

データ分析方法、プログラム、及び装置 Download PDF

Info

Publication number
JPWO2015029809A1
JPWO2015029809A1 JP2015534141A JP2015534141A JPWO2015029809A1 JP WO2015029809 A1 JPWO2015029809 A1 JP WO2015029809A1 JP 2015534141 A JP2015534141 A JP 2015534141A JP 2015534141 A JP2015534141 A JP 2015534141A JP WO2015029809 A1 JPWO2015029809 A1 JP WO2015029809A1
Authority
JP
Japan
Prior art keywords
vector
comparison target
company
data analysis
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015534141A
Other languages
English (en)
Other versions
JP6516159B2 (ja
Inventor
慶文 奥田
慶文 奥田
穂高 菅野
穂高 菅野
拓也 吉原
拓也 吉原
渡部 俊也
俊也 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
University of Tokyo NUC
Original Assignee
NEC Corp
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, University of Tokyo NUC filed Critical NEC Corp
Publication of JPWO2015029809A1 publication Critical patent/JPWO2015029809A1/ja
Application granted granted Critical
Publication of JP6516159B2 publication Critical patent/JP6516159B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

基準主体と比較対象が保有する識別子が付与された資産情報を受け、識別子毎に資産量を成分とするベクトルを生成するベクトル生成部を備えている。得られたベクトルを比較することによって基準主体と比較対象間の影響力を把握することが可能となる。

Description

本発明は基準主体と比較対象との間の資産情報を比較し互いの影響力を比較するデータ分析方法、プログラム、及び装置に関する。
以下では、基準主体及び比較対象をそれぞれ主体企業と比較対象企業として説明するが、本発明に係る基準主体及び比較対象は単に企業に限定されることなく、本発明に係る基準主体及び比較対象は主体個人及び比較対象個人であっても良い。
基準主体及び比較対象をそれぞれ主体企業及び比較対象企業とし、資産情報として主体企業及び比較対象企業がそれぞれ保有する特許を評価する技術が特許文献1〜3で提案されている。
特許文献1は、主体企業が保有する1つの主体特許文献に対して、主体特許文献の被引用数の内、比較対象企業が引用した割合を算出することで、主体特許文献が比較対象企業に与えた影響を算出している。
特許文献2は、主体企業の保有する主体特許と比較対象企業の保有する複数の特許に対して、主体特許と比較対象企業の特許中で使われている技術用語から概念ベクトルを形成している。さらに、主体特許の概念ベクトルと比較対象企業の複数の特許文献の概念ベクトルとの間で内積を算出し分析を行なっている。
特許文献3は、主体企業が特定の国・期間で取得した特許件数の、同一国・期間で取得した全特許件数に対する割合を算出し、算出した値に基づいてグラフ、表を作成することにより主体企業の技術力を算出している。
非特許文献1は、主体企業、および比較対象企業が保有する特許を、Fタームを利用した技術ポジションベクトルで表現し、これらの技術ポジションベクトルの角度(技術距離)を算出することで、それぞれが保有する特許の関係性を算出している。
特開2010−067110号公報 特開2007−200167号公報 特開2002−092228号公報
小出実、遠山亮子著"特許情報による共同研究開発の知識創造の役割に関する調査研究 −超LSI技術研究組合の事例研究−"技術と経済(538),50−58,2011−12
企業の特許を評価し分析する方法は色々と提案されてはいるが、以下の問題点があることが判明した。
特許文献1は、特許文献の引用回数で主体企業と比較対象企業との間における特許の影響力の比較を行なっている。特許文献の引用回数は、まだ新しい特許文献の場合、その文献を引用する他の特許文献が存在しない、もしくは、まだ少ない可能性があるため正確に評価ができない問題がある。また、時間と共に引用目的、引用分野が変化していくため、文献の評価は時間と共に変わっていってしまうという問題がある。また、出版が古い文献ほど引用回数は多くなり高い評価となってしまうことも問題である。
特許文献2は、主体特許と複数の比較対象特許の内積値を算出し、所定の内積値を超えた比較対象特許の数から、先願性、占有率、特許密集度、出願増加傾向を算出し、その結果に基づいて分析対象特許を16区分に分類する技術を開示している。しかしながら、分析は1つの特許文献に対して行うため、企業が保有する複数の特許、即ち、特許ポートフォリオを評価するものでは無いという問題がある。
特許文献3は、主体企業が保有する特許権の技術分野全体に対する割合を算出しているが、技術分野全体に対する割合であるので企業相互間における優劣を評価できない問題がある。
非特許文献1は、主体企業と比較対象企業とが保有する特許の関係性を算出しているが、それぞれが保有する特許が相手に与える影響を評価してない問題がある。
したがって、本発明は、基準主体(例えば、企業又は個人)と比較対象(企業又は個人)が知的財産等の資産を複数の種別に亘って保有する場合に、基準主体と比較対象がそれぞれ保有する資産を比較することで、基準主体と比較対象の相互間における影響力を算出する、データ分析方法、プログラム、及び装置を得ようとするものである。
以下、本明細書中において「影響力」とは、基準主体と比較対象の保有する資産の類似度(後述)、基準主体と比較対象の保有する資産の相似度(後述)、及び基準資産と比較対象の保有する資産の作用度(後述)を合む。
本発明のデータ分析方法は、識別子が付与された資産情報を受け、指定された基準主体が持つ上記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ上記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成ステップを含む。
本発明のデータ分析プログラムは、識別子が付与された資産情報を受け、指定された基準主体が持つ上記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ上記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成手段として、コンピュータを動作させる。
本発明のデータ分析装置は、識別子が付与された資産情報を受け、指定された基準主体が持つ上記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ上記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成部を備える。
本発明の効果は、基準主体と比較対象のベクトルを算出することで、基準主体と比較対象の資産情報の類似度、相似度、及び作用度を算出し、基準主体と比較対象間の影響力を評価することが可能となる。
図1は、本発明を示すブロック図であり、(a)は、本発明の原理を説明するブロック図である。(b)は、本発明の一実施の形態に係るデータ分析装置のブロック図である。
図2は、特許情報の一例であり、(a)及び(b)は、資産情報データベースが保持する特許情報の一例である。
図3は、複数の識別子から構成された資産情報の一例である。
図4は、ベクトル生成部が出力するポートフォリオの一例ある。
図5は、基準ベクトルと比較対象ベクトルの概念図である。
図6は、主体企業と比較対象企業が保有する特許分類毎の特許件数を示した表の一例である。
図7は、基準ベクトルと比較対象ベクトル間の距離を利用した比較を表すグラフの一例である。
図8は、基準ベクトルと比較対象ベクトル間の角度を利用した比較を表すグラフの一例である。
図9は、比較対象ベクトルから基準ベクトルへの写像を利用した比較を表すグラフの一例である。
図10は、ポートフォリオの一例であり、(a)及び(b)は、主体企業と比較対象企業の特許分類毎の特許件数、基準ベクトルと比較対象ベクトルの内積成分を示すポートフォリオである。
図11は、基準ベクトルと比較対象ベクトル間の角度とベクトルの大きさを利用し、2次元極座標上の表示することで比較を行うグラフの一例である。
図12は、主体企業に対する比較対象企業の相対的な技術動向を表すグラフの一例である。
図13は、主体企業と比較対象企業が複数存在する場合に、複数の企業間の作用度の比較を表す表の一例である。
図14は、本発明に係るデータ分析装置の処理フローを示すフローチャートである。
図15は、本発明に係るデータ分析装置の一例であり、(a)は、本発明を実現できるデータ分析装置の最小単位の構成を示すブロック図である。(b)は、(a)に係るデータ分析装置の処理の流れを示すフローチャートである。
図1(a)を参照して、本発明の原理的な構成を説明する。本発明の原理的な構成は、資産情報を格納した資産情報データベース10と、ベクトル生成プログラムにしたがって動作を行なうベクトル生成部(具体的には、CPU)1とを備えている。ベクトル生成部1は、識別子及び基準主体に応答して資産情報データベース10にアクセスし、識別子に応じた基準主体の資産情報に係る基準ベクトルを生成する。さらに、ベクトル生成部1は、識別子及び比較対象に応じた比較対象の資産情報に係る比較対象ベクトルを生成する。以後、ベクトル生成部1は、資産情報に係る基準ベクトル及び比較対象ベクトルを処理して、基準主体と比較対象の影響力を算出する。
以下で、図1(b)を参照して、上記原理に従って動作する本発明の一実施形態に係るデータ分析装置を説明する。
この実施形態では企業が保有する資産情報、特に、特許情報を例にとって説明する。さらに、この実施形態では、企業間の特許情報を比較しているため、以下では基準主体を主体企業と呼び、比較対象を比較対象企業と呼ぶことにする。
実施形態は、主体企業と比較対象企業の特許情報を比較する場合についてのみ説明するが、比較を行うのは企業間及び特許情報である必要は必ずしもない。例えば、ある企業の今年度に登録された特許情報と、同一企業の去年度に登録された特許情報を比較しても良い。また、比較は、企業間に限らず個人間の情報比較、さらには、特定の群間の情報比較であっても良い。比較を行う基準主体と比較対象、さらには、比較を行う資産の範囲は本発明の使用者によって自由に決定できる。
図1(b)は、本発明の一実施形態に係るデータ分析装置である。図1(b)のデータ分析装置は、外部に設置している資産情報データベース10と、入出力装置20、処理部30とを有している。
資産情報データベース10は、知的財産情報、ここでは、特許情報を保持しているものとする。但し、本発明は特許情報に限定されることなく、例えば、商標情報、意匠情報であっても良い。また、特許情報、商標情報、及び意匠情報は登録されている情報に限らず、公開公報であっても良い。さらに、本発明は、知的財産情報に限定されることなく、例えば、学術的な論文の情報であっても良いし、さらには、貸借対照表上の資産情報、損益計算表上の資産情報であっても良い。
この実施形態で使用する特許情報は、ファイルインデックス(FI)、国際特許分類であるIPC(International Patent Classification)等によって分類されている。また、商標情報及び意匠情報は、それぞれ商品区分及び物品区分毎に分類されている。さらに、貸借対照表及び損益計算表上の資産情報も、各項目に区分されている。そこで、以下では、特許情報等の資産情報の分類区分を総称して識別子と呼ぶ。また、本発明における識別子は、予め定めた分類区分だけでなく、本発明の使用者が自ら作成した分類区分でも良い。さらに、本発明における識別子は、例えば特許分類、論文、研究開発費等の、カテゴリの異なる識別子を複数組み合わせて使用することも可能である。
図1(b)に示した資産情報データベース10は、識別子が付与された主体企業、及び比較対象企業の資産情報を保持している。また、資産情報データベース10は、識別子が付与された資産情報として特許、実用新案、意匠、商標の情報だけでなく、論文、研究開発費、貸借対照表及び損益計算表上の資産情報も保持している。
入出力装置20は、条件入力部21と、処理部30の算出結果を出力する出力部22とを備えている。
処理部30は、通信インターフェース40と、CPU(Central Processing Unit)50と、記憶装置60とを含むコンピュータである。
通信インターフェース40は、資産情報データベース10と処理部30の情報の送受信、入出力装置20と処理部30の情報の送受信を実行する。
処理部30が備える記憶装置60は、OS(Operating System)格納部61と、データ記憶部62と、プログラム格納部63とを有している。データ記憶部62は、条件入力部21が送信した情報、資産情報データベース10から抽出した特許情報を保持している。プログラム格納部63は、本発明に係る資産情報のベクトルを生成するベクトル生成プログラム64を保持している。
また、CPU50は、ベクトル格納部63が保持するベクトル生成プログラム64を実行する。この場合、CPU50は、条件入力部21が受け付けた複数の識別子に基づき、資産情報データベース10が保持する特許情報を検索処理する。さらに、CPU50は、検索処理をした資産情報データベース10が保持する特許情報から、主体企業、及び比較対象企業に関する特許情報を抽出する。また、CPU50は、抽出した特許情報をデータ記憶部62に記憶する一方、後述するように、ベクトル生成プログラム64にしたがって、主体企業及び比較対象企業に係る基準ベクトル及び比較対象ベクトルを生成する。したがって、CPU50は基準ベクトル及び比較対象ベクトルを生成するベクトル生成部として動作すると共に、基準ベクトル及び比較対象ベクトルから影響力を算出する算出部としても動作する。
ここで、資産情報データベース10が保持する特許情報は、各企業が保有する1件毎の特許情報でも良いし、各企業が保有する特許情報が予め識別子毎に件数がカウントされた特許情報であっても良い。
例えば、図2(a)は、IPCを識別子とした、1件毎の特許情報の一例である。資産情報データベース10が、特許情報を図2(a)のように保持している場合には、CPU50は、主体企業、及び比較対象企業の識別子(ここではIPC)毎の特許情報を抽出し、その件数をカウントする。
また、図2(b)は、識別子として使用するIPC毎に分類された特許情報について、予め特許情報の件数を複数の企業に亘ってカウントした例である。資産情報データベース10が、特許情報を図2(b)のように保持している場合、使用者は、利用する識別子を任意に決定できるとともに、利用する識別子の範囲も自由に決定できる。この場合、使用者が、条件入力部21に利用する識別子を入力すると、CPU50が、識別子に応じたデータを資産情報データベース10から抽出する。
次に、CPU50は、ベクトル生成プログラム64にしたがって、以下の動作を実行する。まず、CPU50は資産情報データベース10から抽出した主体企業に関する特許情報から基準ベクトルを生成する。また、CPU50は、比較対象企業に関する特許情報から比較対象ベクトルを生成する。さらに、CPU50は、基準ベクトルと比較対象ベクトル間の内積、距離、角度、及び写像の大きさを算出する。ここで、基準ベクトル及び比較対象ベクトルは、2つの識別子(ここでは、2つのIPC)から生成したベクトルであれば、2次元ベクトルとなり、より多くの識別子からベクトルを生成した場合には、多次元ベクトルとなる。多次元ベクトル間の内積、距離、角度、及び写像の大きさはコンピュータを用いて計算することができる。
ここで、上記した例は、主体企業及び比較対象企業の特許情報から基準ベクトル及び比較対象ベクトルを生成するものとして説明した。しかしながら、本発明は、特許情報に限定されることなく、主体企業、及び比較対象企業が著した論文や、研究開発費といったカテゴリの異なる複数の識別子からベクトルを生成することも可能である。
例えば、図3は、各企業が保有する、特定のIPCの特許件数と、特定の学会誌に掲載された論文数と、研究開発費とを識別子とした資産情報の一例である。即ち、本発明における識別子は、IPC、学会誌、及び研究開発費のような異なるカテゴリに属するものであっても良い。この場合、CPU50は、このようなカテゴリの異なる複数の識別子を用いて抽出した特許件数、論文数、研究開発投資額の一つから基準ベクトル、及び比較対象ベクトルを生成しても良いし。さらには、特許件数、論文数、研究開発投資額を組み合わせて基準ベクトル、及び比較対象ベクトルを生成しても良い。
以下で、図4を参照して、本発明におけるベクトルの意味、及び、基準ベクトルと比較対象ベクトルの導出方法について説明する。
図4は、使用者が、主体企業としてX社、比較対象企業としてY社、識別子として複数のIPCを用いた場合に得られるポートフォリオの一例である。即ち、この例は、識別子としてIPC1〜IPCnを条件入力部21に識別子として入力して、複数のIPC1〜IPCnの間で主体企業(X社)と比較対象企業(Y社)のポートフォリオの比較を行なう例である。この場合、条件入力部21が受け付けたIPC1〜IPCnに応じて、CPU50が、特許情報を資産情報データベース10から抽出する。
図4の例では、IPC1〜IPCnに対応するX社の特許件数はx1〜xn件、Y社の特許件数はy1〜yn件である。ここで、CPU50は、ベクトル生成プログラム64にしたがって、X社が保有する特許件数x1〜xnから基準ベクトルTxを生成する。同様に、CPU50は、Y社が保有する特許件数y1〜ynから比較対象ベクトルTyを生成する。
なお、図4のポートフォリオは識別子としてIPCを使用しているが、識別子としてファイルインデックス(FI)、Fターム、米国特許分類(USC)、ヨーロッパ特許分類(ECLA)等を使用することも可能である。また、識別子としてIPCを使用する場合、IPCの階層はどこまでであっても良い。さらに、使用者が自ら作成した識別子を使用しても良い。
CPU50が生成したベクトルTx、及びTyは、式1のように表すことができる。
Figure 2015029809
ここで、Tx及びTyの次元は等しいことが重要である。即ち、成分x1及びy1は、例えば、IPC1に応じてCPU50が抽出した特許件数であり、以下同様に、成分xn及びynは、IPCnに応じてCPU50が抽出した特許件数である。したがって、Txが成分xmを持たず、他方、それに対応するTyの成分ymが値を持つ場合、xmを0とすることになる。このように、CPU50は、TxとTyの次元を揃える演算を行うことになる。
次に、CPU50はベクトル生成プログラム64にしたがって、TxとTy間の内積、距離、角度及び写像の大きさを算出する。以下、図5を適宜参照して、内積、距離、角度及び写像の大きさの算出方法と、それぞれが持つ意味を説明する。
図5は、TxとTyを2次元(識別子が2個)ベクトルとして描いた概略図である。一般的には、TxとTyはn次元(識別子がn個)ベクトルである。しかしながら、考え方は2次元ベクトルと同じであるので簡単のため2次元ベクトルを使用して説明する。
CPU50がTxとTy間の角度、及び写像を算出するためには、TxとTy間の内積の算出が必要である。TxとTy間の内積の定義は、式2のように表すことができる。
Figure 2015029809
ここで、|Tx|と|Ty|は、それぞれTx、Tyの絶対値、θはTxとTyのなす角度70を表している。
さらに、CPU50はTxとTy間の距離71を算出する。距離71はTxとTyの差の絶対値であるので、距離71をDと書くことにすると式3で表すことができる。
Figure 2015029809
さらに、CPU50はTxとTyのなす角度70を算出する。角度70は、TxとTy間の内積の式の逆関数を導出することによって算出できる。したがって、角度70は式4で表すことができる。
Figure 2015029809
ここで、arccosはcosの逆関数である。
最後に、CPU50はTyからTxへの写像の大きさ73を算出する。写像73はTyからTxへの射影72であるので、下記の式5で表すことができる。
Figure 2015029809
また、TxからTyへの写像の大きさ74も、同様の方法で算出できる。
上記に記載のTxとTy間の内積、距離、角度、及び写像の大きさは式6で表すこともできる。
Figure 2015029809
上記のαとβは、使用者が任意に決めることのできる重み因子(即ち、補正係数)である。ここで、αとβは、スカラー値であっても良いし、ベクトル関数であっても良い。TxとTyに重み因子を掛けることは、TxとTyの値を補正することを意味する。したがって、使用者がαとβを任意に決めることで、より使用者の目的に沿った分析が可能となる。なお、αとβがベクトル関数であった場合、αとβは式7のように表される。
Figure 2015029809
この場合、αとβは、補正するベクトルの成分と同じ数、例えばn個の成分を持つベクトルである。また、αとβは式8に示すように行列で表すこともできる。
Figure 2015029809
この場合、αとβは、補正するベクトルの成分と同じ数、例えばn個の行と、n個の列を持つn×n行列である。
上記α1〜αn、β1〜βn、α11〜αnn、β11〜βnnは対応する識別子と掛け合わす重みであり、使用者は、それぞれの値を任意に決めることができる。例えば、使用者が分析の重要項目と考える識別子の重みは大きくし、分析に重要でないと考える識別子の重みを小さくすることで、より詳細な分析が可能になる。
次に、本発明において、上記で算出したTxとTy間の距離、角度、及び写像の大きさが表す意味を説明する。
この実施形態では、基準ベクトルと比較対象ベクトルは異なる複数のIPCにおける特許件数を表している。
したがって、基準ベクトルと比較対象ベクトル間の距離が近いということは、主体企業と比較対象企業が保有する特許情報において、識別子と識別子毎の特許件数が近いことを意味する。即ち、距離が近いということは、主体企業と比較対象企業が保有する特許件数の構成が類似していることを意味し、本発明では類似度と呼ぶ。
一方、基準ベクトルと比較対象ベクトルの角度が近いということは、主体企業と比較対象企業が保有する特許情報において、識別子と識別子毎の特許情報の構成が相似であることを意味する。即ち、角度が近いということは、主体企業と比較対象企業の保有する特許情報の構成比率が、特許件数は違っていても相似的な分布になっていることを意味し、本発明では相似度と呼ぶ。
さらに、基準ベクトルに対する比較対象ベクトルの写像の大きさが大きいということは、主体企業と比較対象企業が保有する特許は重複する識別子の数が多く、且つ、重複する識別子の特許の件数が多いことを意味している。したがって、このような場合、基準ベクトルと比較対象ベクトルの距離や角度が離れていても、主体企業と比較対象企業は、共に同じ分野の特許を数多く保有していることになり、両社の事業、及び技術開発の競争は激しいと判断できる。したがって、写像の大きさは、主体企業と比較対象企業相互間の競争の度合、即ち、作用を表しているから、ここでは、写像の大きさを作用度と呼ぶ。
本発明では、類似度、相似度、及び作用度を集合的に影響力と呼ぶものとする。ここで、類似度、相似度、及び作用度をより一般化して説明すると、類似度とは、基準ベクトルと比較対象ベクトル間の距離を表す指標である。距離が近いほど類似度は高く、類似度が高いほど基準主体が保有する資産情報と比較対象が保有する資産情報が類似していることを意味する。
また、相似度とは、基準ベクトルと比較対象ベクトル間の角度の大きさを表す指標である。角度が小さいほど相似度は高く、相似度が高いほど基準主体が保有する資産情報と比較対象が保有する資産情報の構成比率が似ていることを意味する。
また、作用度とは、比較対象ベクトルから基準ベクトル、又は、基準ベクトルから比較対象ベクトルへの写像の大きさを表す指標である。写像が大きいほど作用度は高く、作用度が高いほど基準主体と比較対象が保有する資産情報は重複する識別子の数が多く、且つ、重複する識別子の資産量が多いことを意味する。したがって、基準主体と比較対象間における競争の影響が大きくなることを意味する。
TxとTy間の作用度を算出する場合、CPU50は、TyからTxへの写像、及びTxからTyへの写像の2通りの写像を算出することができる。CPU50は、この2通りの写像を算出することで、TxとTy間における互いの作用度の大きさを比較することが可能である。
再び図5を参照して、主体企業と比較対象企業間における互いの作用度の大きさを比較する方法を説明する。例えば、TyからTxへの写像の大きさ73をEy、TxからTyへの写像の大きさ74をExと表すことにする。この時、Eyは主体企業に対する比較対象企業の作用度を表し、Exは比較対象企業に対する主体企業の作用度を表している。CPU50はExとEyの値や、ExとEyの差分等を算出することで、主体企業と比較対象企業間で互いに与えた作用度の大きさを比較することが可能となる。例えば、主体企業と比較対象企業に対応するベクトル間の距離が遠く、且つ、主体企業と比較対象企業に対応するベクトル間の角度が大きい場合、類似度は低く、相似度も低い。このような場合であっても、企業規模の大きさの違いによっては、主体企業と比較対象企業に対応するベクトル間の写像が大きくなることも有り得る。この場合、主体企業と比較対象企業間で互いに与えた作用度は大きくなり、企業間の競争が激しいことが予測できる。
発明者らは、これらの影響力を示すパラメータについて、企業間における引用と被引用の件数から影響力を示すことができることを確認している。
上記した実施形態は、主体企業と比較対象企業間の特許情報を比較する場合について説明した。しかし、本発明は、主体企業と比較対象企業が保有する一般的な資産情報の類似度、相似度、及び作用度を分析するためにも使用できる。
具体的に言えば、主体企業と比較対象企業の類似度を算出する場合、類似度は基準ベクトルと比較対象ベクトル間の距離、及び相似度は基準ベクトルと比較対象ベクトル間の角度から算出するため、その値は一意に定まる。
それに対し、基準主体と比較対象の作用度を算出する場合、作用度は写像から算出するため、基準ベクトルから比較対象ベクトルへの写像と、及び比較対象ベクトルから基準ベクトルへの写像の2つの値が算出できる。
また、CPU50は、基準ベクトルと比較対象ベクトル間の距離、角度、及び写像の大きさの結果に応じたポートフォリオやグラフを作成する。さらに、CPU50は、作成したポートフォリオやグラフを出力部22に送信し、算出結果として出力するように指示する。
図6を参照して、本発明の第1の実施例を説明する。図6は、A社〜L社が保有する特許について、IPC1〜IPC10の範囲で識別子毎の特許件数をまとめた表(件数表と呼ぶ)を示している。ここで、A社は主体企業であり、B〜L社は比較対象企業である。以下では、図6の件数表に基づいて、CPU50が、A社から基準ベクトルを生成する一方、B社〜L社から比較対象ベクトルを生成し、類似度、相似度、及び作用度を利用して分析する場合を説明する。
図7(a)は、図6に示されたA社の件数表から得られた基準ベクトルとB〜L社の件数表から得られた比較対象ベクトル間の距離を示しているグラフである。基準ベクトルと比較対象ベクトル間の距離を算出した場合、CPU50は基準ベクトルと比較対象ベクトルの距離が近いほど、主体企業と比較対象企業間の類似度が高いと判定する。したがって、図7(a)を参照することで主体企業と比較対象企業間の類似度を判定することができる。図7(a)の例では、主体企業であるA社と、比較対象企業であるF社、I社に対応するベクトル間の距離が近い。この結果、使用者はA社と類似度の高い比較対象企業はF社とI社であることが判定できる。
ここで、CPU50は、図7(a)のグラフを値の大きさ順に並び替えることが可能である。図7(a)を類似度の高い順番に並び替えたグラフが図7(b)である。図7(b)を参照すると、A社と類似度が高い比較対象企業を判定することが容易となる。
さらに、CPU50は、図7(a)、または図7(b)の算出結果のうち、使用者が指定する範囲の値を持つ比較対象企業のみを抽出することも可能である。例えば、図7(c)は、使用者が、A社との距離が40以下という条件を指定し、CPU50が、F社とI社のみを抽出したグラフである。
図8(3)は、図6に示された件数表から得られた基準ベクトルと比較対象ベクトル間の角度を示しているグラフである。基準ベクトルと比較対象ベクトル間の角度を算出した場合、CPU50は基準ベクトルと比較対象ベクトル間の角度が小さいほど、主体企業と比較対象企業間の相似度が高いと判定する。したがって、図8(a)を参照することで主体企業と比較対象企業間の類似度を判定することが可能である。図8(a)の例では、主体企業であるA社と、比較対象企業であるD社とI社に対応するベクトル間の角度が小さい。この結果、使用者はA社と相似度の高い比較対象企業はD社とI社であることが判定できる。
ここで、CPU50は、角度についても値の大きさ順に並び替えることが可能である。図8(a)を相似度の高い順番に並び替えたグラフが、図8(b)である。図8(b)を参照することで、A社と相似度の高い比較対象企業を判定することが容易となる。
また、CPU50は、相似度についても、図8(a)、または図8(b)の算出結果のうち、使用者が指定した範囲の値を持つ比較対象企業のみを抽出することも可能である。例えば、図8(c)は、使用者が、A社との角度が20以下という条件を指定し、CPU50が、D社とI社を抽出したグラフである。
図9(a)は、図6に示された件数表から得られた比較対象ベクトルから基準ベクトルへの写像の大きさを示しているグラフである。比較対象ベクトルから基準ベクトルに対する写像を算出した場合、CPU50は、比較対象ベクトルから基準ベクトルに対する写像の大きさが大きいほど作用度は大きいと判定する。したがって、図9(a)を参照することで主体企業に対する比較対象企業間の作用度を判定することができる。図9(a)の例では、主体企業であるA社に対して、比較対象企業であるB社とD社に対応するベクトルの写像が大きい。この結果、使用者はA社と作用度の高い比較対象企業はB社とD社であることが判定できる。
ここで、CPU50は、写像についても値の大きさ順に並び替えることが可能である。図9(a)を作用度の高い順番に並び替えたグラフが、図9(b)である。図9(b)を参照することで、作用度の高い比較対象企業を判定することが容易となる。
また、CPU50は、作用度についても図9(a)、または図9(b)の算出結果のうち、使用者が指定した範囲の値を持つ比較対象企業のみを抽出することも可能である。例えば、図9(c)は、使用者が写像の大きさを65以上という条件を指定し、CPU50が、A社と作用度の高いB社とD社を抽出したグラフである。
図7〜9に示しているように、本発明は、主体企業と比較対象企業間の類似度、相似度、及び作用度を算出し、算出した類似度、相似度、及び作用度から、主体企業と比較対象企業間の影響力を個別に又は総合的に判定できる。
また、主体企業と比較対象企業間の影響力は、使用者の目的に応じて、類似度、相似度、及び作用度のいずれかを選択的に用いて評価しても良いし、あるいは、これらの類似度、相似度及び作用度を組み合わせることによって総合的に評価しても良い。
次に、図10を参照して、写像の算出結果から、主体企業と比較対象企業間の影響力をさらに分析する方法について説明する。ここでは、図6に示された主体企業であるA社とし、比較対象企業としてB社を例にとって説明する。
図10(a)は、主体企業であるA社と、比較対象企業であるB社が保有するIPC1〜IPC10の特許件数について、CPU50が作成したポートフォリオである。また、CPU50は、比較対象ベクトルから基準ベクトルへの写像の内積成分を抽出している。ここで、CPU50は内積成分の大きさ順に、ポートフォリオを並び替える操作を行なうことも可能である。
図10(b)は、CPU50が、写像の内積成分が大きい技術分野の順に図10(a)のポートフォリオを並び替えたポートフォリオである。図10(b)を参照することで、主体企業と比較対象企業間の技術分野(即ち、IPC)毎の影響力を判定することが可能となる。
例えば、図7〜9に示したように、A社とB社におけるベクトル間の距離及び角度は比較的大きく、且つ、写像もD社程大きくない。しかしながら、図10(b)に示すように、内積成分を参照すると、IPC4における内積成分は非常に大きくなっている。このことは、IPC4で表される特定の技術分野では、相互に影響力が大きいことを示している。
このような場合、CPU50は、図10(b)によって主体企業と比較対象企業間の総合的な影響力は小さいが、1つの分野に対しては大きな影響力を持っているといったことを判定する。また、主体企業と比較対象企業間の総合的な影響力は大きいが1つ1つの分野の影響力は小さいといったことも判定することが可能となる。
ここで、図10(a)及び(b)に示すように内積成分は、異なるカテゴリの識別子を複数用いて演算しても良いし、異なるカテゴリの識別子を組み合わせて演算しても良い。例えば、特定雑誌に掲載された論文数、研究開発費を識別子として利用しても良いし、これらの識別子をIPCと組み合わせても良い。これによって、詳細に主体企業と比較対象企業間の比較が可能となる。
次に、図11を参照して、図6に示された主体企業と比較対象企業について、2次元極座標上にマッピングをし、主体企業と比較対象企業の相対的な特許情報を比較する方法について説明する。なお、図11は、図6の件数表のA社を主体企業、B社〜L社を比較対象企業としている。
図11は、比較対象ベクトルの長さと、比較対象ベクトルと基準ベクトル間の角度の差とで、各比較対象企業を2次元極座標上にマッピングしたグラフである。図11を得るために、CPU50は、A社〜L社が保有する特許情報の技術分野を、識別子として使用するIPC毎に分類する。さらに、CPU50は、比較対象毎に、比較対象ベクトルの大きさと、比較対象ベクトルと基準ベクトル間の角度の差を算出する。次に、比較対象毎に、算出した比較対象ベクトルの大きさを原点からの距離、算出した角度を横軸からの角度として2次元極座標上にプロットする。
一方、基準ベクトルと比較対象ベクトルの角度の差と比較対象ベクトルの大きさの代わりに、基準ベクトルと比較対象ベクトルの距離や写像の大きさから2次元極座標上に比較対象企業をプロットすることも可能である。
さらに、CPU50は、図11の2次元極座標のグラフの結果から、比較対象企業毎のA社に与えた影響力(ここでは、相似度、及び作用度)を算出することが可能である。横軸からの角度が相似度、横軸方向の座標が写像の大きさ、すなわち作用度を示している。以下では、図11を参照して、第2の実施例を説明する。
例えば、B社に対応する比較対象ベクトルは、A社に対応する基準ベクトルとの間の角度が大きく、基準ベクトルに対する写像は2番目に大きい。このことは、A社とB社は、相似度は低く、作用度は高いことを意味している。
また、I社に対応する比較対象ベクトルは、A社に対応する基準ベクトルとの間の角度は一番小さく、基準ベクトルに対する写像は小さい。このことは、A社とI社は、相似度は高く、作用度は低いことを意味している。
さらに、D社に対応する比較対象ベクトルは、A社に対応する基準ベクトルとの間の角度は2番目に小さく、基準ベクトルに対する写像は一番大きい。このことは、A社とD社は、相似度、及び作用度の両方が高いことを意味している。
そして、H社に対応する比較対象ベクトルは、A社に対応する基準ベクトルとの間の角度は大きく、基準ベクトルに対する写像は小さい。このことは、A社とD社は、相似度、及び作用度の両方が低いことを意味している。
図12は、本発明の第3の実施例を説明する図であり、図12は主体企業であるA社と、比較対象企業であるL社との間の技術動向の時間的な遷移を分析する例を示している。図12は、図11の2次元極座標表示のグラフに、年毎の値をプロットすることで作成している。例えば、L社について10年前、5年前、今年の値をプロットしてみると、L社の技術分野は、主体企業であるA社の技術分野から徐々に離れて行く傾向にあることを判定できる。
次に、図13を参照して、本発明の第4の実施例を説明する。本発明の第4の実施例は、主体企業(A社)と複数の比較対象企業(B,C,D社)間の作用度についてマトリックスを使用して分析する方法である。ここで資産情報は図6を利用している。
図13では、CPU50が作成したA社、B社、C社、D社の4社間の作用度をマトリックス形式で示している。
ここで、ある業界がA社、B社、C社、D社の4社から構成されるとする。図13のマトリックスにおいて、列の値を足し合わせることにより、自社が業界全体に与える作用度を算出することができる。例えば、A社の場合、A社がB社に与える作用度は31、C社に与える作用度は40、D社に与える作用度は56である。それぞれの作用度を足し合わせた値である127は、A社が他社全体に与えた総合的な作用度となる。
また、マトリックスの行に関しても、他社から受ける作用度を足し合わすことで、他社全体から受ける作用度も算出することができる。例えば、A社の場合、A社がB社から受ける作用度は67、C社から受ける作用度は58、D社から受ける作用度は95である。それぞれを足し合わせた値である220はA社が他社全体から受ける作用度となる。
B社、C社、及びD社に関してもA社と同様に、他社全体に与えた作用度、及び業界全体から受けた作用度を算出することができる。各社が他社に与えた作用度や他社から受けた作用度を比較することで、業界の中での自社の地位を測定することができる。例えば、図13では、業界内で最も他社に影響を与えているのはD社であり、逆に最も影響を受けているのはA社であるといった分析結果を得ることができる。即ち、図13の例では、業界内で、D社が最も強く、A社が最も弱いといったことが判定できる。
次に、図14のフローチャートを参照して、上記した第1〜第4の実施例に共通する本発明のデータ分析装置(図1)における処理の流れを説明する。
最初に、条件入力部21は主体企業と比較対象企業について、比較条件を表す複数の識別子、主体企業と比較対象企業を受け付ける(ステップS100)。本発明の実施形態において、入力する識別子は、例えば、特許情報を検索するためのIPCである。識別子の入力が無い場合、後のステップにおいては主体企業と比較対象企業の資産情報が付与されている全ての識別子が用いられる。
次に、条件入力部21は、ステップS100において受け付けた識別子を、通信インターフェース40を介してCPU50に送信する(ステップS101)。
CPU50は、受信した識別子を記憶装置60のデータ記憶部62に格納する。そして、CPU50は、通信インターフェース40を介して資産情報データベース10から識別子に応じた主体企業と比較対象企業に関する特許情報を、例えば図6の形式で抽出する。さらに、CPU50は、抽出した特許情報をデータ記憶部62に格納する(ステップS102)。
次に、CPU50は、ベクトル生成プログラム64にしたがい、データ記憶部62に格納した主体企業の特許情報に基づいて基準ベクトルを生成する。また、CPU50は、データ記憶部62に格納した比較対象企業の特許情報に基づいて比較対象ベクトルを生成する(ステップS103)。
条件入力部21に、基準ベクトルと比較対象ベクトル間の内積、距離、角度、及び写像等のパラメータを算出する命令が入力されている場合(ステップS104において「YES」と判定)には、ステップS105に進む。条件入力部21に内積、距離、角度及び写像を算出する命令が入力されていない場合(ステップS104において「NO」と判定)にはステップS106に進む。
ステップS104において「YES」と判定された場合、CPU50はベクトル生成プログラム64にしたがって、基準ベクトルと比較対象ベクトル間の内積、距離、角度、及び写像の少なくとも一つを演算する(ステップS105)。この場合、CPU50は図7〜13のようなポートフォリオやグラフを作成することも可能である。
最後に、CPU50は、ステップS103やステップS105において算出した、算出結果を出力部22に表示する(ステップS106)。例えば、出力部22は、ステップS104において、「YES」と判定した場合には図6〜13の結果を表示し、「NO」と判定した場合には図6の結果を表示する。
次に、図15(a)及び(b)を参照して、本発明を実現できる最小単位の構成で表されるデータ分析装置について説明する。図15(a)は本発明を実現できるデータ分析装置の最小単位の構成を示すブロック図である。本発明のデータ分析装置はベクトル生成部1によって特徴付けられる。
図15(b)は、図15(a)に係るデータ分析装置が行う処理の流れを示すフローチャートである。以下で、図15(a)及び(b)を適宜参照しながら、データ分析装置の処理の流れを説明する。
先ず、ベクトル生成部1は分析に利用する識別子、基準主体と比較対象を受け付ける(ステップS200)。次に、ベクトル生成部1は別途設けた資産情報データベースから、基準主体と比較対象について指定された識別子毎の資産情報を抽出する(ステップS201)。最後に、ベクトル生成部1は、抽出した資産情報に基づき、基準主体に対応する資産情報から基準ベクトルを、比較対象に対応する資産情報から比較対象ベクトルを生成する(ステップS202)。
上記のフローにより、本発明のデータ分析装置は、基準主体と比較対象の資産情報に基づいて、ベクトルを生成することができる。
また、上記の実施形態の一部又は全部は、以下のようにも記載されうる。なお、以下の付記は本発明を何等限定するものではない。
[付記1]
識別子が付与された資産情報を受け、指定された基準主体が持つ前記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ前記識別子毎の資産量を成分とする比較対象ベクトルを生成する、
ことを特徴とするデータ分析方法。
[付記2]
前記基準ベクトルに対する前記比較対象ベクトルの写像と、前記比較対象ベクトルに対する前記基準ベクトルの写像の少なくとも1つを算出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記3]
前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の少なくとも1つを算出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記4]
前記基準ベクトルと前記比較対象ベクトル間の前記識別子毎の内積値を算出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記5]
前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付ける、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記6]
前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の算出結果を値の大きさ順に抽出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記7]
前記内積値の大きさ順に前記識別子を出力する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記8]
前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離について、指定した範囲の数値である算出結果を抽出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記9]
前記基準ベクトルに対する前記比較対象ベクトルの写像の大きさと、前記比較対象ベクトルに対する前記基準ベクトルの写像の大きさの差を算出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記10]
複数の前記比較対象が存在する際に、前記比較対象毎に前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記11]
複数の前記比較対象が存在する際に、前記比較対象毎に前記基準ベクトルから前記比較対象ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記12]
前記資産情報は特許、実用新案、意匠、商標、著作権のいずれかの情報である、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記13]
前記資産量は特許、実用新案、意匠、商標、著作権のいずれかの件数である、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記14]
前記資産情報は有形資産と無形資産の情報の組み合わせである、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記15]
前記基準ベクトルと前記比較対象ベクトルの少なくとも1つに補正関数を掛け合わせる、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記16]
識別子が付与された資産情報を受け、指定された基準主体が持つ前記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ前記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成手段として、コンピュータを動作させる、
ことを特徴とするデータ分析プログラム。
[付記17]
コンピュータに、前記基準ベクトルに対する前記比較対象ベクトルの写像と、前記比較対象ベクトルに対する前記基準ベクトルの写像の少なくとも1つを算出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記18]
コンピュータに、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の少なくとも1つを算出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記19]
コンピュータに、前記基準ベクトルと前記比較対象ベクトル間の前記識別子毎の内積値を算出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記20]
コンピュータに、前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付けさせる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記21]
コンピュータに、前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の算出結果を、値の大きさ順に抽出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記22]
コンピュータに、前記内積値の大きさ順に前記識別子を出力させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記23]
コンピュータに、前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離について、指定した範囲の数値である算出結果を抽出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記24]
コンピュータに、前記基準ベクトルに対する前記比較対象ベクトルの写像の大きさと、前記比較対象ベクトルに対する前記基準ベクトルの写像の大きさの差を算出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記25]
複数の前記比較対象が存在する際に、コンピュータに、前記比較対象毎に前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記26]
複数の前記比較対象が存在する際に、コンピュータに、前記比較対象毎に前記基準ベクトルから前記比較対象ベクトルに対する写像を算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記27]
前記資産情報は特許、実用新案、意匠、商標、著作権のいずれかの情報である、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記28]
前記資産量は特許、実用新案、意匠、商標、著作権のいずれかの件数である、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記29]
前記資産情報は有形資産と無形資産の情報の組み合わせである、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記30]
前記基準ベクトルと前記比較対象ベクトルの少なくとも1つに補正関数を掛け合わせる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記31]
識別子が付与された資産情報を受け、指定された基準主体が持つ前記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ前記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成部を備える、
ことを特徴とするデータ分析装置。
[付記32]
前記基準ベクトルに対する前記比較対象ベクトルの写像と、前記比較対象ベクトルに対する前記基準ベクトルの写像の少なくとも1つを算出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記33]
前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の少なくとも1つを算出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記34]
前記基準ベクトルと前記比較対象ベクトル間の前記識別子毎の内積値を算出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記35]
前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付ける、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記36]
前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の算出結果を値の大きさ順に抽出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記37]
前記内積値の大きさ順に前記識別子を出力する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記38]
前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離について、指定した範囲の数値である算出結果を抽出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記39]
前記基準ベクトルに対する前記比較対象ベクトルの写像の大きさと、前記比較対象ベクトルに対する前記基準ベクトルの写像の大きさの差を算出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記40]
複数の前記比較対象が存在する際に、前記比較対象毎に前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記41]
複数の前記比較対象が存在する際に、前記比較対象毎に前記基準ベクトルから前記比較対象ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記42]
前記資産情報は特許、実用新案、意匠、商標、著作権のいずれかの情報である、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記43]
前記資産量は特許、実用新案、意匠、商標、著作権のいずれかの件数である、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記44]
前記資産情報は有形資産と無形資産の情報の組み合わせである、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記45]
前記基準ベクトルと前記比較対象ベクトルの少なくとも1つに補正関数を掛け合わせる、
ことを特徴とする上記付記に記載のデータ分析装置。
本発明によれば、基準主体と比較対象が共通して保有する資産情報があれば、本発明のデータ分析装置、方法及びプログラムが適用できる。例えば、本発明の実施形態のように企業間での比較であれば、売上、利益、コスト、人材等の比較をする際に適用できる。さらに、本発明は、単に企業間の資産情報に留まらず、個人資産情報の分析にも使用できる。
さらに、例えば、本発明のデータ分析装置、方法及びプログラムは、株式市場の分析にも適用することが可能である。各企業の株価収益率(PER)、株価純資産倍率(PBR)、自己資本利益率(ROE)等の株価指標を識別子とすることで、企業毎の株価分析を行うことも可能である。
この出願は、2013年8月29日に出願された日本出願特願第2013−177752号を基礎とする優先権を主張し、その開示のすべてをここに取り込む。
1 ベクトル生成部
10 資産情報データベース
20 入出力装置
21 条件入力部
22 出力部
30 処理部
40 通信インターフェース
50 CPU(Central Processing Unit)
60 記憶装置
61 OS格納部
62 データ記憶部
63 プログラム格納部
64 ベクトル生成プログラム
70 角度
71 距離
72 射影
73 TyからTxへの写像
74 TxからTyへの写像
本発明は基準主体と比較対象との間の資産情報を比較し互いの影響力を比較するデータ分析方法、プログラム、及び装置に関する。
以下では、基準主体及び比較対象をそれぞれ主体企業と比較対象企業として説明するが、本発明に係る基準主体及び比較対象は単に企業に限定されることなく、本発明に係る基準主体及び比較対象は主体個人及び比較対象個人であっても良い。
基準主体及び比較対象をそれぞれ主体企業及び比較対象企業とし、資産情報として主体企業及び比較対象企業がそれぞれ保有する特許を評価する技術が特許文献1〜3で提案されている。
特許文献1は、主体企業が保有する1つの主体特許文献に対して、主体特許文献の被引用数の内、比較対象企業が引用した割合を算出することで、主体特許文献が比較対象企業に与えた影響を算出している。
特許文献2は、主体企業の保有する主体特許と比較対象企業の保有する複数の特許に対して、主体特許と比較対象企業の特許中で使われている技術用語から概念ベクトルを形成している。さらに、主体特許の概念ベクトルと比較対象企業の複数の特許文献の概念ベクトルとの間で内積を算出し分析を行なっている。
特許文献3は、主体企業が特定の国・期間で取得した特許件数の、同一国・期間で取得した全特許件数に対する割合を算出し、算出した値に基づいてグラフ、表を作成することにより主体企業の技術力を算出している。
非特許文献1は、主体企業、および比較対象企業が保有する特許を、Fタームを利用した技術ポジションベクトルで表現し、これらの技術ポジションベクトルの角度(技術距離)を算出することで、それぞれが保有する特許の関係性を算出している。
特開2010−067110号公報 特開2007−200167号公報 特開2002−092228号公報
小出実、遠山亮子著"特許情報による共同研究開発の知識創造の役割に関する調査研究 −超LSI技術研究組合の事例研究−"技術と経済(538),50−58,2011−12
企業の特許を評価し分析する方法は色々と提案されてはいるが、以下の問題点があることが判明した。
特許文献1は、特許文献の引用回数で主体企業と比較対象企業との間における特許の影響力の比較を行なっている。特許文献の引用回数は、まだ新しい特許文献の場合、その文献を引用する他の特許文献が存在しない、もしくは、まだ少ない可能性があるため正確に評価ができない問題がある。また、時間と共に引用目的、引用分野が変化していくため、文献の評価は時間と共に変わっていってしまうという問題がある。また、出版が古い文献ほど引用回数は多くなり高い評価となってしまうことも問題である。
特許文献2は、主体特許と複数の比較対象特許の内積値を算出し、所定の内積値を超えた比較対象特許の数から、先願性、占有率、特許密集度、出願増加傾向を算出し、その結果に基づいて分析対象特許を16区分に分類する技術を開示している。しかしながら、分析は1つの特許文献に対して行うため、企業が保有する複数の特許、即ち、特許ポートフォリオを評価するものでは無いという問題がある。
特許文献3は、主体企業が保有する特許権の技術分野全体に対する割合を算出しているが、技術分野全体に対する割合であるので企業相互間における優劣を評価できない問題がある。
非特許文献1は、主体企業と比較対象企業とが保有する特許の関係性を算出しているが、それぞれが保有する特許が相手に与える影響を評価してない問題がある。
したがって、本発明は、基準主体(例えば、企業又は個人)と比較対象(企業又は個人)が知的財産等の資産を複数の種別に亘って保有する場合に、基準主体と比較対象がそれぞれ保有する資産を比較することで、基準主体と比較対象の相互間における影響力を算出する、データ分析方法、プログラム、及び装置を得ようとするものである。
以下、本明細書中において「影響力」とは、基準主体と比較対象の保有する資産の類似度(後述)、基準主体と比較対象の保有する資産の相似度(後述)、及び基準資産と比較対象の保有する資産の作用度(後述)を含む。
本発明のデータ分析方法は、識別子が付与された資産情報を受け、指定された基準主体が持つ上記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ上記識別子毎の資産量を成分とする比較対象ベクトルを生成し、前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付ける
本発明のデータ分析プログラムは、識別子が付与された資産情報を受け、指定された基準主体が持つ上記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ上記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成手段と、前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付けさせる手段として、コンピュータを動作させる。
本発明のデータ分析装置は、識別子が付与された資産情報を受け、指定された基準主体が持つ上記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ上記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成部を備え、前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付ける。
本発明の効果は、基準主体と比較対象のベクトルを算出することで、基準主体と比較対象の資産情報の類似度、相似度、及び作用度を算出し、基準主体と比較対象間の影響力を評価することが可能となる。
本発明を示すブロック図であり、(a)は、本発明の原理を説明するブロック図である。(b)は、本発明の一実施の形態に係るデータ分析装置のブロック図である。 特許情報の一例であり、(a)及び(b)は、資産情報データベースが保持する特許情報の一例である。 複数の識別子から構成された資産情報の一例である。 ベクトル生成部が出力するポートフォリオの一例ある。 基準ベクトルと比較対象ベクトルの概念図である。 主体企業と比較対象企業が保有する特許分類毎の特許件数を示した表の一例である。 基準ベクトルと比較対象ベクトル間の距離を利用した比較を表すグラフの一例である。 基準ベクトルと比較対象ベクトル間の角度を利用した比較を表すグラフの一例である。 比較対象ベクトルから基準ベクトルへの写像を利用した比較を表すグラフの一例である。 ポートフォリオの一例であり、(a)及び(b)は、主体企業と比較対象企業の特許分類毎の特許件数、基準ベクトルと比較対象ベクトルの内積成分を示すポートフォリオである。 基準ベクトルと比較対象ベクトル間の角度とベクトルの大きさを利用し、2次元極座標上の表示することで比較を行うグラフの一例である。 主体企業に対する比較対象企業の相対的な技術動向を表すグラフの一例である。 主体企業と比較対象企業が複数存在する場合に、複数の企業間の作用度の比較を表す表の一例である。 本発明に係るデータ分析装置の処理フローを示すフローチャートである。 本発明に係るデータ分析装置の一例であり、(a)は、本発明を実現できるデータ分析装置の最小単位の構成を示すブロック図である。(b)は、(a)に係るデータ分析装置の処理の流れを示すフローチャートである。
図1(a)を参照して、本発明の原理的な構成を説明する。本発明の原理的な構成は、資産情報を格納した資産情報データベース10と、ベクトル生成プログラムにしたがって動作を行なうベクトル生成部(具体的には、CPU)1とを備えている。ベクトル生成部1は、識別子及び基準主体に応答して資産情報データベース10にアクセスし、識別子に応じた基準主体の資産情報に係る基準ベクトルを生成する。さらに、ベクトル生成部1は、識別子及び比較対象に応じた比較対象の資産情報に係る比較対象ベクトルを生成する。以後、ベクトル生成部1は、資産情報に係る基準ベクトル及び比較対象ベクトルを処理して、基準主体と比較対象の影響力を算出する。
以下で、図1(b)を参照して、上記原理に従って動作する本発明の一実施形態に係るデータ分析装置を説明する。
この実施形態では企業が保有する資産情報、特に、特許情報を例にとって説明する。さらに、この実施形態では、企業間の特許情報を比較しているため、以下では基準主体を主体企業と呼び、比較対象を比較対象企業と呼ぶことにする。
実施形態は、主体企業と比較対象企業の特許情報を比較する場合についてのみ説明するが、比較を行うのは企業間及び特許情報である必要は必ずしもない。例えば、ある企業の今年度に登録された特許情報と、同一企業の去年度に登録された特許情報を比較しても良い。また、比較は、企業間に限らず個人間の情報比較、さらには、特定の群間の情報比較であっても良い。比較を行う基準主体と比較対象、さらには、比較を行う資産の範囲は本発明の使用者によって自由に決定できる。
図1(b)は、本発明の一実施形態に係るデータ分析装置である。図1(b)のデータ分析装置は、外部に設置している資産情報データベース10と、入出力装置20、処理部30とを有している。
資産情報データベース10は、知的財産情報、ここでは、特許情報を保持しているものとする。但し、本発明は特許情報に限定されることなく、例えば、商標情報、意匠情報であっても良い。また、特許情報、商標情報、及び意匠情報は登録されている情報に限らず、公開公報であっても良い。さらに、本発明は、知的財産情報に限定されることなく、例えば、学術的な論文の情報であっても良いし、さらには、貸借対照表上の資産情報、損益計算表上の資産情報であっても良い。
この実施形態で使用する特許情報は、ファイルインデックス(FI)、国際特許分類であるIPC(International Patent Classification)等によって分類されている。また、商標情報及び意匠情報は、それぞれ商品区分及び物品区分毎に分類されている。さらに、貸借対照表及び損益計算表上の資産情報も、各項目に区分されている。そこで、以下では、特許情報等の資産情報の分類区分を総称して識別子と呼ぶ。また、本発明における識別子は、予め定めた分類区分だけでなく、本発明の使用者が自ら作成した分類区分でも良い。さらに、本発明における識別子は、例えば特許分類、論文、研究開発費等の、カテゴリの異なる識別子を複数組み合わせて使用することも可能である。
図1(b)に示した資産情報データベース10は、識別子が付与された主体企業、及び比較対象企業の資産情報を保持している。また、資産情報データベース10は、識別子が付与された資産情報として特許、実用新案、意匠、商標の情報だけでなく、論文、研究開発費、貸借対照表及び損益計算表上の資産情報も保持している。
入出力装置20は、条件入力部21と、処理部30の算出結果を出力する出力部22とを備えている。
処理部30は、通信インターフェース40と、CPU(Central Processing Unit)50と、記憶装置60とを含むコンピュータである。
通信インターフェース40は、資産情報データベース10と処理部30の情報の送受信、入出力装置20と処理部30の情報の送受信を実行する。
処理部30が備える記憶装置60は、OS(Operating System)格納部61と、データ記憶部62と、プログラム格納部63とを有している。データ記憶部62は、条件入力部21が送信した情報、資産情報データベース10から抽出した特許情報を保持している。プログラム格納部63は、本発明に係る資産情報のベクトルを生成するベクトル生成プログラム64を保持している。
また、CPU50は、ベクトル格納部63が保持するベクトル生成プログラム64を実行する。この場合、CPU50は、条件入力部21が受け付けた複数の識別子に基づき、資産情報データベース10が保持する特許情報を検索処理する。さらに、CPU50は、検索処理をした資産情報データベース10が保持する特許情報から、主体企業、及び比較対象企業に関する特許情報を抽出する。また、CPU50は、抽出した特許情報をデータ記憶部62に記憶する一方、後述するように、ベクトル生成プログラム64にしたがって、主体企業及び比較対象企業に係る基準ベクトル及び比較対象ベクトルを生成する。したがって、CPU50は基準ベクトル及び比較対象ベクトルを生成するベクトル生成部として動作すると共に、基準ベクトル及び比較対象ベクトルから影響力を算出する算出部としても動作する。
ここで、資産情報データベース10が保持する特許情報は、各企業が保有する1件毎の特許情報でも良いし、各企業が保有する特許情報が予め識別子毎に件数がカウントされた特許情報であっても良い。
例えば、図2(a)は、IPCを識別子とした、1件毎の特許情報の一例である。資産情報データベース10が、特許情報を図2(a)のように保持している場合には、CPU50は、主体企業、及び比較対象企業の識別子(ここではIPC)毎の特許情報を抽出し、その件数をカウントする。
また、図2(b)は、識別子として使用するIPC毎に分類された特許情報について、予め特許情報の件数を複数の企業に亘ってカウントした例である。資産情報データベース10が、特許情報を図2(b)のように保持している場合、使用者は、利用する識別子を任意に決定できるとともに、利用する識別子の範囲も自由に決定できる。この場合、使用者が、条件入力部21に利用する識別子を入力すると、CPU50が、識別子に応じたデータを資産情報データベース10から抽出する。
次に、CPU50は、ベクトル生成プログラム64にしたがって、以下の動作を実行する。まず、CPU50は資産情報データベース10から抽出した主体企業に関する特許情報から基準ベクトルを生成する。また、CPU50は、比較対象企業に関する特許情報から比較対象ベクトルを生成する。さらに、CPU50は、基準ベクトルと比較対象ベクトル間の内積、距離、角度、及び写像の大きさを算出する。ここで、基準ベクトル及び比較対象ベクトルは、2つの識別子(ここでは、2つのIPC)から生成したベクトルであれば、2次元ベクトルとなり、より多くの識別子からベクトルを生成した場合には、多次元ベクトルとなる。多次元ベクトル間の内積、距離、角度、及び写像の大きさはコンピュータを用いて計算することができる。
ここで、上記した例は、主体企業及び比較対象企業の特許情報から基準ベクトル及び比較対象ベクトルを生成するものとして説明した。しかしながら、本発明は、特許情報に限定されることなく、主体企業、及び比較対象企業が著した論文や、研究開発費といったカテゴリの異なる複数の識別子からベクトルを生成することも可能である。
例えば、図3は、各企業が保有する、特定のIPCの特許件数と、特定の学会誌に掲載された論文数と、研究開発費とを識別子とした資産情報の一例である。即ち、本発明における識別子は、IPC、学会誌、及び研究開発費のような異なるカテゴリに属するものであっても良い。この場合、CPU50は、このようなカテゴリの異なる複数の識別子を用いて抽出した特許件数、論文数、研究開発投資額の一つから基準ベクトル、及び比較対象ベクトルを生成しても良いし。さらには、特許件数、論文数、研究開発投資額を組み合わせて基準ベクトル、及び比較対象ベクトルを生成しても良い。
以下で、図4を参照して、本発明におけるベクトルの意味、及び、基準ベクトルと比較対象ベクトルの導出方法について説明する。
図4は、使用者が、主体企業としてX社、比較対象企業としてY社、識別子として複数のIPCを用いた場合に得られるポートフォリオの一例である。即ち、この例は、識別子としてIPC1〜IPCnを条件入力部21に識別子として入力して、複数のIPC1〜IPCnの間で主体企業(X社)と比較対象企業(Y社)のポートフォリオの比較を行なう例である。この場合、条件入力部21が受け付けたIPC1〜IPCnに応じて、CPU50が、特許情報を資産情報データベース10から抽出する。
図4の例では、IPC1〜IPCnに対応するX社の特許件数はx1〜xn件、Y社の特許件数はy1〜yn件である。ここで、CPU50は、ベクトル生成プログラム64にしたがって、X社が保有する特許件数x1〜xnから基準ベクトルTxを生成する。同様に、CPU50は、Y社が保有する特許件数y1〜ynから比較対象ベクトルTyを生成する。
なお、図4のポートフォリオは識別子としてIPCを使用しているが、識別子としてファイルインデックス(FI)、Fターム、米国特許分類(USC)、ヨーロッパ特許分類(ECLA)等を使用することも可能である。また、識別子としてIPCを使用する場合、IPCの階層はどこまでであっても良い。さらに、使用者が自ら作成した識別子を使用しても良い。
CPU50が生成したベクトルTx、及びTyは、1のように表すことができる。
Figure 2015029809
ここで、Tx及びTyの次元は等しいことが重要である。即ち、成分x1及びy1は、例えば、IPC1に応じてCPU50が抽出した特許件数であり、以下同様に、成分xn及びynは、IPCnに応じてCPU50が抽出した特許件数である。したがって、Txが成分xmを持たず、他方、それに対応するTyの成分ymが値を持つ場合、xmを0とすることになる。このように、CPU50は、TxとTyの次元を揃える演算を行うことになる。
次に、CPU50はベクトル生成プログラム64にしたがって、TxとTy間の内積、距離、角度及び写像の大きさを算出する。以下、図5を適宜参照して、内積、距離、角度及び写像の大きさの算出方法と、それぞれが持つ意味を説明する。
図5は、TxとTyを2次元(識別子が2個)ベクトルとして描いた概略図である。一般的には、TxとTyはn次元(識別子がn個)ベクトルである。しかしながら、考え方は2次元ベクトルと同じであるので簡単のため2次元ベクトルを使用して説明する。
CPU50がTxとTy間の角度、及び写像を算出するためには、TxとTy間の内積の算出が必要である。TxとTy間の内積の定義は、2のように表すことができる。
Figure 2015029809
ここで、|Tx|と|Ty|は、それぞれTx、Tyの絶対値、θはTxと
Tyのなす角度70を表している。
さらに、CPU50はTxとTy間の距離71を算出する。距離71はTxとTyの差の絶対値であるので、距離71をDと書くことにすると3で表すことができる。
Figure 2015029809
さらに、CPU50はTxとTyのなす角度70を算出する。角度70は、TxとTy間の内積の式の逆関数を導出することによって算出できる。したがって、角度70は4で表すことができる。
Figure 2015029809
ここで、arccosはcosの逆関数である。
最後に、CPU50はTyからTxへの写像の大きさ73を算出する。写像73はTyからTxへの射影72であるので、下記の5で表すことができる。
Figure 2015029809
また、TxからTyへの写像の大きさ74も、同様の方法で算出できる。
上記に記載のTxとTy間の内積、距離、角度、及び写像の大きさは6で表すこともできる。
Figure 2015029809
上記のαとβは、使用者が任意に決めることのできる重み因子(即ち、補正係数)である。ここで、αとβは、スカラー値であっても良いし、ベクトル関数であっても良い。TxとTyに重み因子を掛けることは、TxとTyの値を補正することを意味する。したがって、使用者がαとβを任意に決めることで、より使用者の目的に沿った分析が可能となる。なお、αとβがベクトル関数であった場合、αとβは7のように表される。
Figure 2015029809
この場合、αとβは、補正するベクトルの成分と同じ数、例えばn個の成分を持つベクトルである。また、αとβは8に示すように行列で表すこともできる。
Figure 2015029809
この場合、αとβは、補正するベクトルの成分と同じ数、例えばn個の行と、n個の列を持つn×n行列である。
上記α1〜αn、β1〜βn、α11〜αnn、β11〜βnnは対応する識別子と掛け合わす重みであり、使用者は、それぞれの値を任意に決めることができる。例えば、使用者が分析の重要項目と考える識別子の重みは大きくし、分析に重要でないと考える識別子の重みを小さくすることで、より詳細な分析が可能になる。
次に、本発明において、上記で算出したTxとTy間の距離、角度、及び写像の大きさが表す意味を説明する。
この実施形態では、基準ベクトルと比較対象ベクトルは異なる複数のIPCにおける特許件数を表している。
したがって、基準ベクトルと比較対象ベクトル間の距離が近いということは、主体企業と比較対象企業が保有する特許情報において、識別子と識別子毎の特許件数が近いことを意味する。即ち、距離が近いということは、主体企業と比較対象企業が保有する特許件数の構成が類似していることを意味し、本発明では類似度と呼ぶ。
一方、基準ベクトルと比較対象ベクトルの角度が近いということは、主体企業と比較対象企業が保有する特許情報において、識別子と識別子毎の特許情報の構成が相似であることを意味する。即ち、角度が近いということは、主体企業と比較対象企業の保有する特許情報の構成比率が、特許件数は違っていても相似的な分布になっていることを意味し、本発明では相似度と呼ぶ。
さらに、基準ベクトルに対する比較対象ベクトルの写像の大きさが大きいということは、主体企業と比較対象企業が保有する特許は重複する識別子の数が多く、且つ、重複する識別子の特許の件数が多いことを意味している。したがって、このような場合、基準ベクトルと比較対象ベクトルの距離や角度が離れていても、主体企業と比較対象企業は、共に同じ分野の特許を数多く保有していることになり、両社の事業、及び技術開発の競争は激しいと判断できる。したがって、写像の大きさは、主体企業と比較対象企業相互間の競争の度合、即ち、作用を表しているから、ここでは、写像の大きさを作用度と呼ぶ。
本発明では、類似度、相似度、及び作用度を集合的に影響力と呼ぶものとする。ここで、類似度、相似度、及び作用度をより一般化して説明すると、類似度とは、基準ベクトルと比較対象ベクトル間の距離を表す指標である。距離が近いほど類似度は高く、類似度が高いほど基準主体が保有する資産情報と比較対象が保有する資産情報が類似していることを意味する。
また、相似度とは、基準ベクトルと比較対象ベクトル間の角度の大きさを表す指標である。角度が小さいほど相似度は高く、相似度が高いほど基準主体が保有する資産情報と比較対象が保有する資産情報の構成比率が似ていることを意味する。
また、作用度とは、比較対象ベクトルから基準ベクトル、又は、基準ベクトルから比較対象ベクトルへの写像の大きさを表す指標である。写像が大きいほど作用度は高く、作用度が高いほど基準主体と比較対象が保有する資産情報は重複する識別子の数が多く、且つ、重複する識別子の資産量が多いことを意味する。したがって、基準主体と比較対象間における競争の影響が大きくなることを意味する。
TxとTy間の作用度を算出する場合、CPU50は、TyからTxへの写像、及びTxからTyへの写像の2通りの写像を算出することができる。CPU50は、この2通りの写像を算出することで、TxとTy間における互いの作用度の大きさを比較することが可能である。
再び図5を参照して、主体企業と比較対象企業間における互いの作用度の大きさを比較する方法を説明する。例えば、TyからTxへの写像の大きさ73をEy、TxからTyへの写像の大きさ74をExと表すことにする。この時、Eyは主体企業に対する比較対象企業の作用度を表し、Exは比較対象企業に対する主体企業の作用度を表している。CPU50はExとEyの値や、ExとEyの差分等を算出することで、主体企業と比較対象企業間で互いに与えた作用度の大きさを比較することが可能となる。例えば、主体企業と比較対象企業に対応するベクトル間の距離が遠く、且つ、主体企業と比較対象企業に対応するベクトル間の角度が大きい場合、類似度は低く、相似度も低い。このような場合であっても、企業規模の大きさの違いによっては、主体企業と比較対象企業に対応するベクトル間の写像が大きくなることも有り得る。この場合、主体企業と比較対象企業間で互いに与えた作用度は大きくなり、企業間の競争が激しいことが予測できる。
発明者らは、これらの影響力を示すパラメータについて、企業間における引用と被引用の件数から影響力を示すことができることを確認している。
上記した実施形態は、主体企業と比較対象企業間の特許情報を比較する場合について説明した。しかし、本発明は、主体企業と比較対象企業が保有する一般的な資産情報の類似度、相似度、及び作用度を分析するためにも使用できる。
具体的に言えば、主体企業と比較対象企業の類似度を算出する場合、類似度は基準ベクトルと比較対象ベクトル間の距離、及び相似度は基準ベクトルと比較対象ベクトル間の角度から算出するため、その値は一意に定まる。
それに対し、基準主体と比較対象の作用度を算出する場合、作用度は写像から算出するため、基準ベクトルから比較対象ベクトルへの写像と、及び比較対象ベクトルから基準ベクトルへの写像の2つの値が算出できる。
また、CPU50は、基準ベクトルと比較対象ベクトル間の距離、角度、及び写像の大きさの結果に応じたポートフォリオやグラフを作成する。さらに、CPU50は、作成したポートフォリオやグラフを出力部22に送信し、算出結果として出力するように指示する。
図6を参照して、本発明の第1の実施例を説明する。図6は、A社〜L社が保有する特許について、IPC1〜IPC10の範囲で識別子毎の特許件数をまとめた表(件数表と呼ぶ)を示している。ここで、A社は主体企業であり、B〜L社は比較対象企業である。以下では、図6の件数表に基づいて、CPU50が、A社から基準ベクトルを生成する一方、B社〜L社から比較対象ベクトルを生成し、類似度、相似度、及び作用度を利用して分析する場合を説明する。
図7(a)は、図6に示されたA社の件数表から得られた基準ベクトルとB〜L社の件数表から得られた比較対象ベクトル間の距離を示しているグラフである。基準ベクトルと比較対象ベクトル間の距離を算出した場合、CPU50は基準ベクトルと比較対象ベクトルの距離が近いほど、主体企業と比較対象企業間の類似度が高いと判定する。したがって、図7(a)を参照することで主体企業と比較対象企業間の類似度を判定することができる。図7(a)の例では、主体企業であるA社と、比較対象企業であるF社、I社に対応するベクトル間の距離が近い。この結果、使用者はA社と類似度の高い比較対象企業はF社とI社であることが判定できる。
ここで、CPU50は、図7(a)のグラフを値の大きさ順に並び替えることが可能である。図7(a)を類似度の高い順番に並び替えたグラフが図7(b)である。図7(b)を参照すると、A社と類似度が高い比較対象企業を判定することが容易となる。
さらに、CPU50は、図7(a)、または図7(b)の算出結果のうち、使用者が指定する範囲の値を持つ比較対象企業のみを抽出することも可能である。例えば、図7(c)は、使用者が、A社との距離が40以下という条件を指定し、CPU50が、F社とI社のみを抽出したグラフである。
図8(a)は、図6に示された件数表から得られた基準ベクトルと比較対象ベクトル間の角度を示しているグラフである。基準ベクトルと比較対象ベクトル間の角度を算出した場合、CPU50は基準ベクトルと比較対象ベクトル間の角度が小さいほど、主体企業と比較対象企業間の相似度が高いと判定する。したがって、図8(a)を参照することで主体企業と比較対象企業間の類似度を判定することが可能である。図8(a)の例では、主体企業であるA社と、比較対象企業であるD社とI社に対応するベクトル間の角度が小さい。この結果、使用者はA社と相似度の高い比較対象企業はD社とI社であることが判定できる。
ここで、CPU50は、角度についても値の大きさ順に並び替えることが可能である。図8(a)を相似度の高い順番に並び替えたグラフが、図8(b)である。図8(b)を参照することで、A社と相似度の高い比較対象企業を判定することが容易となる。
また、CPU50は、相似度についても、図8(a)、または図8(b)の算出結果のうち、使用者が指定した範囲の値を持つ比較対象企業のみを抽出することも可能である。例えば、図8(c)は、使用者が、A社との角度が20以下という条件を指定し、CPU50が、D社とI社を抽出したグラフである。
図9(a)は、図6に示された件数表から得られた比較対象ベクトルから基準ベクトルへの写像の大きさを示しているグラフである。比較対象ベクトルから基準ベクトルに対する写像を算出した場合、CPU50は、比較対象ベクトルから基準ベクトルに対する写像の大きさが大きいほど作用度は大きいと判定する。したがって、図9(a)を参照することで主体企業に対する比較対象企業間の作用度を判定することができる。図9(a)の例では、主体企業であるA社に対して、比較対象企業であるB社とD社に対応するベクトルの写像が大きい。この結果、使用者はA社と作用度の高い比較対象企業はB社とD社であることが判定できる。
ここで、CPU50は、写像についても値の大きさ順に並び替えることが可能である。図9(a)を作用度の高い順番に並び替えたグラフが、図9(b)である。図9(b)を参照することで、作用度の高い比較対象企業を判定することが容易となる。
また、CPU50は、作用度についても図9(a)、または図9(b)の算出結果のうち、使用者が指定した範囲の値を持つ比較対象企業のみを抽出することも可能である。例えば、図9(c)は、使用者が写像の大きさを65以上という条件を指定し、CPU50が、A社と作用度の高いB社とD社を抽出したグラフである。
図7〜9に示しているように、本発明は、主体企業と比較対象企業間の類似度、相似度、及び作用度を算出し、算出した類似度、相似度、及び作用度から、主体企業と比較対象企業間の影響力を個別に又は総合的に判定できる。
また、主体企業と比較対象企業間の影響力は、使用者の目的に応じて、類似度、相似度、及び作用度のいずれかを選択的に用いて評価しても良いし、あるいは、これらの類似度、相似度及び作用度を組み合わせることによって総合的に評価しても良い。
次に、図10を参照して、写像の算出結果から、主体企業と比較対象企業間の影響力をさらに分析する方法について説明する。ここでは、図6に示された主体企業であるA社とし、比較対象企業としてB社を例にとって説明する。
図10(a)は、主体企業であるA社と、比較対象企業であるB社が保有するIPC1〜IPC10の特許件数について、CPU50が作成したポートフォリオである。また、CPU50は、比較対象ベクトルから基準ベクトルへの写像の内積成分を抽出している。ここで、CPU50は内積成分の大きさ順に、ポートフォリオを並び替える操作を行なうことも可能である。
図10(b)は、CPU50が、写像の内積成分が大きい技術分野の順に図10(a)のポートフォリオを並び替えたポートフォリオである。図10(b)を参照することで、主体企業と比較対象企業間の技術分野(即ち、IPC)毎の影響力を判定することが可能となる。
例えば、図7〜9に示したように、A社とB社におけるベクトル間の距離及び角度は比較的大きく、且つ、写像もD社程大きくない。しかしながら、図10(b)に示すように、内積成分を参照すると、IPC4における内積成分は非常に大きくなっている。このことは、IPC4で表される特定の技術分野では、相互に影響力が大きいことを示している。
このような場合、CPU50は、図10(b)によって主体企業と比較対象企業間の総合的な影響力は小さいが、1つの分野に対しては大きな影響力を持っているといったことを判定する。また、主体企業と比較対象企業間の総合的な影響力は大きいが1つ1つの分野の影響力は小さいといったことも判定することが可能となる。
ここで、図10(a)及び(b)に示すように内積成分は、異なるカテゴリの識別子を複数用いて演算しても良いし、異なるカテゴリの識別子を組み合わせて演算しても良い。例えば、特定雑誌に掲載された論文数、研究開発費を識別子として利用しても良いし、これらの識別子をIPCと組み合わせても良い。これによって、詳細に主体企業と比較対象企業間の比較が可能となる。
次に、図11を参照して、図6に示された主体企業と比較対象企業について、2次元極座標上にマッピングをし、主体企業と比較対象企業の相対的な特許情報を比較する方法について説明する。なお、図11は、図6の件数表のA社を主体企業、B社〜L社を比較対象企業としている。
図11は、比較対象ベクトルの長さと、比較対象ベクトルと基準ベクトル間の角度の差とで、各比較対象企業を2次元極座標上にマッピングしたグラフである。
図11を得るために、CPU50は、A社〜L社が保有する特許情報の技術分野を、識別子として使用するIPC毎に分類する。さらに、CPU50は、比較対象毎に、比較対象ベクトルの大きさと、比較対象ベクトルと基準ベクトル間の角度の差を算出する。次に、比較対象毎に、算出した比較対象ベクトルの大きさを原点からの距離、算出した角度を横軸からの角度として2次元極座標上にプロットする。
一方、基準ベクトルと比較対象ベクトルの角度の差と比較対象ベクトルの大きさの代わりに、基準ベクトルと比較対象ベクトルの距離や写像の大きさから2次元極座標上に比較対象企業をプロットすることも可能である。
さらに、CPU50は、図11の2次元極座標のグラフの結果から、比較対象企業毎のA社に与えた影響力(ここでは、相似度、及び作用度)を算出することが可能である。横軸からの角度が相似度、横軸方向の座標が写像の大きさ、すなわち作用度を示している。以下では、図11を参照して、第2の実施例を説明する。
例えば、B社に対応する比較対象ベクトルは、A社に対応する基準ベクトルとの間の角度が大きく、基準ベクトルに対する写像は2番目に大きい。このことは、A社とB社は、相似度は低く、作用度は高いことを意味している。
また、I社に対応する比較対象ベクトルは、A社に対応する基準ベクトルとの間の角度は一番小さく、基準ベクトルに対する写像は小さい。このことは、A社とI社は、相似度は高く、作用度は低いことを意味している。
さらに、D社に対応する比較対象ベクトルは、A社に対応する基準ベクトルとの間の角度は2番目に小さく、基準ベクトルに対する写像は一番大きい。このことは、A社とD社は、相似度、及び作用度の両方が高いことを意味している。
そして、H社に対応する比較対象ベクトルは、A社に対応する基準ベクトルとの間の角度は大きく、基準ベクトルに対する写像は小さい。このことは、A社とD社は、相似度、及び作用度の両方が低いことを意味している。
図12は、本発明の第3の実施例を説明する図であり、図12は主体企業であるA社と、比較対象企業であるL社との間の技術動向の時間的な遷移を分析する例を示している。図12は、図11の2次元極座標表示のグラフに、年毎の値をプロットすることで作成している。例えば、L社について10年前、5年前、今年の値をプロットしてみると、L社の技術分野は、主体企業であるA社の技術分野から徐々に離れて行く傾向にあることを判定できる。
次に、図13を参照して、本発明の第4の実施例を説明する。本発明の第4の実施例は、主体企業(A社)と複数の比較対象企業(B,C,D社)間の作用度についてマトリックスを使用して分析する方法である。ここで資産情報は図6を利用している。
図13では、CPU50が作成したA社、B社、C社、D社の4社間の作用度をマトリックス形式で示している。
ここで、ある業界がA社、B社、C社、D社の4社から構成されるとする。図13のマトリックスにおいて、列の値を足し合わせることにより、自社が業界全体に与える作用度を算出することができる。例えば、A社の場合、A社がB社に与える作用度は31、C社に与える作用度は40、D社に与える作用度は56である。それぞれの作用度を足し合わせた値である127は、A社が他社全体に与えた総合的な作用度となる。
また、マトリックスの行に関しても、他社から受ける作用度を足し合わすことで、他社全体から受ける作用度も算出することができる。例えば、A社の場合、A社がB社から受ける作用度は67、C社から受ける作用度は58、D社から受ける作用度は95である。それぞれを足し合わせた値である220はA社が他社全体から受ける作用度となる。
B社、C社、及びD社に関してもA社と同様に、他社全体に与えた作用度、及び業界全体から受けた作用度を算出することができる。各社が他社に与えた作用度や他社から受けた作用度を比較することで、業界の中での自社の地位を測定することができる。例えば、図13では、業界内で最も他社に影響を与えているのはD社であり、逆に最も影響を受けているのはA社であるといった分析結果を得ることができる。即ち、図13の例では、業界内で、D社が最も強く、A社が最も弱いといったことが判定できる。
次に、図14のフローチャートを参照して、上記した第1〜第4の実施例に共通する本発明のデータ分析装置(図1)における処理の流れを説明する。
最初に、条件入力部21は主体企業と比較対象企業について、比較条件を表す複数の識別子、主体企業と比較対象企業を受け付ける(ステップS100)。本発明の実施形態において、入力する識別子は、例えば、特許情報を検索するためのIPCである。識別子の入力が無い場合、後のステップにおいては主体企業と比較対象企業の資産情報が付与されている全ての識別子が用いられる。
次に、条件入力部21は、ステップS100において受け付けた識別子を、通信インターフェース40を介してCPU50に送信する(ステップS101)。
CPU50は、受信した識別子を記憶装置60のデータ記憶部62に格納する。そして、CPU50は、通信インターフェース40を介して資産情報データベース10から識別子に応じた主体企業と比較対象企業に関する特許情報を、例えば図6の形式で抽出する。さらに、CPU50は、抽出した特許情報をデータ記憶部62に格納する(ステップS102)。
次に、CPU50は、ベクトル生成プログラム64にしたがい、データ記憶部62に格納した主体企業の特許情報に基づいて基準ベクトルを生成する。また、CPU50は、データ記憶部62に格納した比較対象企業の特許情報に基づいて比較対象ベクトルを生成する(ステップS103)。
条件入力部21に、基準ベクトルと比較対象ベクトル間の内積、距離、角度、及び写像等のパラメータを算出する命令が入力されている場合(ステップS104において「YES」と判定)には、ステップS105に進む。条件入力部21に内積、距離、角度及び写像を算出する命令が入力されていない場合(ステップS104において「NO」と判定)にはステップS106に進む。
ステップS104において「YES」と判定された場合、CPU50はベクトル生成プログラム64にしたがって、基準ベクトルと比較対象ベクトル間の内積、距離、角度、及び写像の少なくとも一つを演算する(ステップS105)。この場合、CPU50は図7〜13のようなポートフォリオやグラフを作成することも可能である。
最後に、CPU50は、ステップS103やステップS105において算出した、算出結果を出力部22に表示する(ステップS106)。例えば、出力部22は、ステップS104において、「YES」と判定した場合には図6〜13の結果を表示し、「NO」と判定した場合には図6の結果を表示する。
次に、図15(a)及び(b)を参照して、本発明を実現できる最小単位の構成で表されるデータ分析装置について説明する。図15(a)は本発明を実現できるデータ分析装置の最小単位の構成を示すブロック図である。本発明のデータ分析装置はベクトル生成部1によって特徴付けられる。
図15(b)は、図15(a)に係るデータ分析装置が行う処理の流れを示すフローチャートである。以下で、図15(a)及び(b)を適宜参照しながら、データ分析装置の処理の流れを説明する。
先ず、ベクトル生成部1は分析に利用する識別子、基準主体と比較対象を受け付ける(ステップS200)。次に、ベクトル生成部1は別途設けた資産情報データベースから、基準主体と比較対象について指定された識別子毎の資産情報を抽出する(ステップS201)。最後に、ベクトル生成部1は、抽出した資産情報に基づき、基準主体に対応する資産情報から基準ベクトルを、比較対象に対応する資産情報から比較対象ベクトルを生成する(ステップS202)。
上記のフローにより、本発明のデータ分析装置は、基準主体と比較対象の資産情報に基づいて、ベクトルを生成することができる。
また、上記の実施形態の一部又は全部は、以下のようにも記載されうる。なお、以下の付記は本発明を何等限定するものではない。
[付記1]
識別子が付与された資産情報を受け、指定された基準主体が持つ前記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ前記識別子毎の資産量を成分とする比較対象ベクトルを生成する、
ことを特徴とするデータ分析方法。
[付記2]
前記基準ベクトルに対する前記比較対象ベクトルの写像と、前記比較対象ベクトルに対する前記基準ベクトルの写像の少なくとも1つを算出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記3]
前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の少なくとも1つを算出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記4]
前記基準ベクトルと前記比較対象ベクトル間の前記識別子毎の内積値を算出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記5]
前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付ける、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記6]
前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の算出結果を値の大きさ順に抽出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記7]
前記内積値の大きさ順に前記識別子を出力する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記8]
前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離について、指定した範囲の数値である算出結果を抽出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記9]
前記基準ベクトルに対する前記比較対象ベクトルの写像の大きさと、前記比較対象ベクトルに対する前記基準ベクトルの写像の大きさの差を算出する、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記10]
複数の前記比較対象が存在する際に、前記比較対象毎に前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記11]
複数の前記比較対象が存在する際に、前記比較対象毎に前記基準ベクトルから前記比較対象ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記12]
前記資産情報は特許、実用新案、意匠、商標、著作権のいずれかの情報である、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記13]
前記資産量は特許、実用新案、意匠、商標、著作権のいずれかの件数である、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記14]
前記資産情報は有形資産と無形資産の情報の組み合わせである、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記15]
前記基準ベクトルと前記比較対象ベクトルの少なくとも1つに補正関数を掛け合わせる、
ことを特徴とする上記付記に記載のデータ分析方法。
[付記16]
識別子が付与された資産情報を受け、指定された基準主体が持つ前記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ前記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成手段として、コンピュータを動作させる、
ことを特徴とするデータ分析プログラム。
[付記17]
コンピュータに、前記基準ベクトルに対する前記比較対象ベクトルの写像と、前記比較対象ベクトルに対する前記基準ベクトルの写像の少なくとも1つを算出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記18]
コンピュータに、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の少なくとも1つを算出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記19]
コンピュータに、前記基準ベクトルと前記比較対象ベクトル間の前記識別子毎の内積値を算出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記20]
コンピュータに、前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付けさせる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記21]
コンピュータに、前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の算出結果を、値の大きさ順に抽出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記22]
コンピュータに、前記内積値の大きさ順に前記識別子を出力させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記23]
コンピュータに、前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離について、指定した範囲の数値である算出結果を抽出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記24]
コンピュータに、前記基準ベクトルに対する前記比較対象ベクトルの写像の大きさと、前記比較対象ベクトルに対する前記基準ベクトルの写像の大きさの差を算出させる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記25]
複数の前記比較対象が存在する際に、コンピュータに、前記比較対象毎に前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記26]
複数の前記比較対象が存在する際に、コンピュータに、前記比較対象毎に前記基準ベクトルから前記比較対象ベクトルに対する写像を算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記27]
前記資産情報は特許、実用新案、意匠、商標、著作権のいずれかの情報である、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記28]
前記資産量は特許、実用新案、意匠、商標、著作権のいずれかの件数である、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記29]
前記資産情報は有形資産と無形資産の情報の組み合わせである、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記30]
前記基準ベクトルと前記比較対象ベクトルの少なくとも1つに補正関数を掛け合わせる、
ことを特徴とする上記付記に記載のデータ分析プログラム。
[付記31]
識別子が付与された資産情報を受け、指定された基準主体が持つ前記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ前記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成部を備える、
ことを特徴とするデータ分析装置。
[付記32]
前記基準ベクトルに対する前記比較対象ベクトルの写像と、前記比較対象ベクトルに対する前記基準ベクトルの写像の少なくとも1つを算出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記33]
前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の少なくとも1つを算出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記34]
前記基準ベクトルと前記比較対象ベクトル間の前記識別子毎の内積値を算出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記35]
前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付ける、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記36]
前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の算出結果を値の大きさ順に抽出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記37]
前記内積値の大きさ順に前記識別子を出力する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記38]
前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離について、指定した範囲の数値である算出結果を抽出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記39]
前記基準ベクトルに対する前記比較対象ベクトルの写像の大きさと、前記比較対象ベクトルに対する前記基準ベクトルの写像の大きさの差を算出する、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記40]
複数の前記比較対象が存在する際に、前記比較対象毎に前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記41]
複数の前記比較対象が存在する際に、前記比較対象毎に前記基準ベクトルから前記比較対象ベクトルに対する写像の大きさを算出し足し合わせる、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記42]
前記資産情報は特許、実用新案、意匠、商標、著作権のいずれかの情報である、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記43]
前記資産量は特許、実用新案、意匠、商標、著作権のいずれかの件数である、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記44]
前記資産情報は有形資産と無形資産の情報の組み合わせである、
ことを特徴とする上記付記に記載のデータ分析装置。
[付記45]
前記基準ベクトルと前記比較対象ベクトルの少なくとも1つに補正関数を掛け合わせる、
ことを特徴とする上記付記に記載のデータ分析装置。
本発明によれば、基準主体と比較対象が共通して保有する資産情報があれば、本発明のデータ分析装置、方法及びプログラムが適用できる。例えば、本発明の実施形態のように企業間での比較であれば、売上、利益、コスト、人材等の比較をする際に適用できる。さらに、本発明は、単に企業間の資産情報に留まらず、個人資産情報の分析にも使用できる。
さらに、例えば、本発明のデータ分析装置、方法及びプログラムは、株式市場の分析にも適用することが可能である。各企業の株価収益率(PER)、株価純資産倍率(PBR)、自己資本利益率(ROE)等の株価指標を識別子とすることで、企業毎の株価分析を行うことも可能である。
この出願は、2013年8月29日に出願された日本出願特願第2013−177752号を基礎とする優先権を主張し、その開示のすべてをここに取り込む。
1 ベクトル生成部
10 資産情報データベース
20 入出力装置
21 条件入力部
22 出力部
30 処理部
40 通信インターフェース
50 CPU(Central Processing Unit)
60 記憶装置
61 OS格納部
62 データ記憶部
63 プログラム格納部
64 ベクトル生成プログラム
70 角度
71 距離
72 射影
73 TyからTxへの写像
74 TxからTyへの写像

Claims (45)

  1. 識別子が付与された資産情報を受け、指定された基準主体が持つ前記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ前記識別子毎の資産量を成分とする比較対象ベクトルを生成する、
    ことを特徴とするデータ分析方法。
  2. 前記基準ベクトルに対する前記比較対象ベクトルの写像と、前記比較対象ベクトルに対する前記基準ベクトルの写像の少なくとも1つを算出する、
    ことを特徴とする請求項1に記載のデータ分析方法。
  3. 前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の少なくとも1つを算出する、
    ことを特徴とする請求項1に記載のデータ分析方法。
  4. 前記基準ベクトルと前記比較対象ベクトル間の前記識別子毎の内積値を算出する、
    ことを特徴とする請求項1に記載のデータ分析方法。
  5. 前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付ける、
    ことを特徴とする請求項1または3に記載のデータ分析方法。
  6. 前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の算出結果を値の大きさ順に抽出する、
    ことを特徴とする請求項2または3に記載のデータ分析方法。
  7. 前記内積値の大きさ順に前記識別子を出力する、
    ことを特徴とする請求項4に記載のデータ分析方法。
  8. 前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離について、指定した範囲の数値である算出結果を抽出する、
    ことを特徴とする請求項2または3に記載のデータ分析方法。
  9. 前記基準ベクトルに対する前記比較対象ベクトルの写像の大きさと、前記比較対象ベクトルに対する前記基準ベクトルの写像の大きさの差を算出する、
    ことを特徴とする請求項2に記載のデータ分析方法。
  10. 複数の前記比較対象が存在する際に、前記比較対象毎に前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさを算出し足し合わせる、
    ことを特徴とする請求項2に記載のデータ分析方法。
  11. 複数の前記比較対象が存在する際に、前記比較対象毎に前記基準ベクトルから前記比較対象ベクトルに対する写像の大きさを算出し足し合わせる、
    ことを特徴とする請求項2に記載のデータ分析方法。
  12. 前記資産情報は特許、実用新案、意匠、商標、著作権のいずれかの情報である、
    ことを特徴とする請求項1〜11のいずれか1項に記載のデータ分析方法。
  13. 前記資産量は特許、実用新案、意匠、商標、著作権のいずれかの件数である、
    ことを特徴とする請求項1〜12のいずれか1項に記載のデータ分析方法。
  14. 前記資産情報は有形資産と無形資産の情報の組み合わせである、
    ことを特徴とする請求項1〜13のいずれか1項に記載のデータ分析方法。
  15. 前記基準ベクトルと前記比較対象ベクトルの少なくとも1つに補正関数を掛け合わせる、
    ことを特徴とする請求項1〜14のいずれか1項に記載のデータ分析方法。
  16. 識別子が付与された資産情報を受け、指定された基準主体が持つ前記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ前記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成手段として、コンピュータを動作させる、
    ことを特徴とするデータ分析プログラム。
  17. コンピュータに、前記基準ベクトルに対する前記比較対象ベクトルの写像と、前記比較対象ベクトルに対する前記基準ベクトルの写像の少なくとも1つを算出させる、
    ことを特徴とする請求項16に記載のデータ分析プログラム。
  18. コンピュータに、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の少なくとも1つを算出させる、
    ことを特徴とする請求項16に記載のデータ分析プログラム。
  19. コンピュータに、前記基準ベクトルと前記比較対象ベクトル間の前記識別子毎の内積値を算出させる、
    ことを特徴とする請求項16に記載のデータ分析プログラム。
  20. コンピュータに、前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付けさせる、
    ことを特徴とする請求項16または18に記載のデータ分析プログラム。
  21. コンピュータに、前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の算出結果を、値の大きさ順に抽出させる、
    ことを特徴とする請求項17または18に記載のデータ分析プログラム。
  22. コンピュータに、前記内積値の大きさ順に前記識別子を出力させる、
    ことを特徴とする請求項19に記載のデータ分析プログラム。
  23. コンピュータに、前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離について、指定した範囲の数値である算出結果を抽出させる、
    ことを特徴とする請求項17または18に記載のデータ分析プログラム。
  24. コンピュータに、前記基準ベクトルに対する前記比較対象ベクトルの写像の大きさと、前記比較対象ベクトルに対する前記基準ベクトルの写像の大きさの差を算出させる、
    ことを特徴とする請求項17に記載のデータ分析プログラム。
  25. 複数の前記比較対象が存在する際に、コンピュータに、前記比較対象毎に前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさを算出し足し合わせる、
    ことを特徴とする請求項17に記載のデータ分析プログラム。
  26. 複数の前記比較対象が存在する際に、コンピュータに、前記比較対象毎に前記基準ベクトルから前記比較対象ベクトルに対する写像を算出し足し合わせる、
    ことを特徴とする請求項17に記載のデータ分析プログラム。
  27. 前記資産情報は特許、実用新案、意匠、商標、著作権のいずれかの情報である、
    ことを特徴とする請求項16〜26のいずれか1項に記載のデータ分析プログラム。
  28. 前記資産量は特許、実用新案、意匠、商標、著作権のいずれかの件数である、
    ことを特徴とする請求項16〜27のいずれか1項に記載のデータ分析プログラム。
  29. 前記資産情報は有形資産と無形資産の情報の組み合わせである、
    ことを特徴とする請求項16〜28のいずれか1項に記載のデータ分析プログラム。
  30. 前記基準ベクトルと前記比較対象ベクトルの少なくとも1つに補正関数を掛け合わせる、
    ことを特徴とする請求項16〜29のいずれか1項に記載のデータ分析プログラム。
  31. 識別子が付与された資産情報を受け、指定された基準主体が持つ前記識別子毎の資産量を成分とする基準ベクトルを生成し、指定された比較対象が持つ前記識別子毎の資産量を成分とする比較対象ベクトルを生成するベクトル生成部を備える、
    ことを特徴とするデータ分析装置。
  32. 前記基準ベクトルに対する前記比較対象ベクトルの写像と、前記比較対象ベクトルに対する前記基準ベクトルの写像の少なくとも1つを算出する、
    ことを特徴とする請求項31に記載のデータ分析装置。
  33. 前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の少なくとも1つを算出する、
    ことを特徴とする請求項31に記載のデータ分析装置。
  34. 前記基準ベクトルと前記比較対象ベクトル間の前記識別子毎の内積値を算出する、
    ことを特徴とする請求項31に記載のデータ分析装置。
  35. 前記比較対象を、前記比較対象ベクトルの長さと、前記基準ベクトルと前記比較対象ベクトル間の角度差に基づいて、2次元極座標上に位置付ける、
    ことを特徴とする請求項31または33に記載のデータ分析装置。
  36. 前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離の算出結果を値の大きさ順に抽出する、
    ことを特徴とする請求項32または33に記載のデータ分析装置。
  37. 前記内積値の大きさ順に前記識別子を出力する、
    ことを特徴とする請求項34に記載のデータ分析装置。
  38. 前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさ、前記基準ベクトルと前記比較対象ベクトル間の角度差、距離について、指定した範囲の数値である算出結果を抽出する、
    ことを特徴とする請求項32または33に記載のデータ分析装置。
  39. 前記基準ベクトルに対する前記比較対象ベクトルの写像の大きさと、前記比較対象ベクトルに対する前記基準ベクトルの写像の大きさの差を算出する、
    ことを特徴とする請求項32に記載のデータ分析装置。
  40. 複数の前記比較対象が存在する際に、前記比較対象毎に前記比較対象ベクトルから前記基準ベクトルに対する写像の大きさを算出し足し合わせる、
    ことを特徴とする請求項32に記載のデータ分析装置。
  41. 複数の前記比較対象が存在する際に、前記比較対象毎に前記基準ベクトルから前記比較対象ベクトルに対する写像の大きさを算出し足し合わせる、
    ことを特徴とする請求項32に記載のデータ分析装置。
  42. 前記資産情報は特許、実用新案、意匠、商標、著作権のいずれかの情報である、
    ことを特徴とする請求項31〜41のいずれか1項に記載のデータ分析装置。
  43. 前記資産量は特許、実用新案、意匠、商標、著作権のいずれかの件数である、
    ことを特徴とする請求項31〜42のいずれか1項に記載のデータ分析装置。
  44. 前記資産情報は有形資産と無形資産の情報の組み合わせである、
    ことを特徴とする請求項31〜43のいずれか1項に記載のデータ分析装置。
  45. 前記基準ベクトルと前記比較対象ベクトルの少なくとも1つに補正関数を掛け合わせる、
    ことを特徴とする請求項31〜44のいずれか1項に記載のデータ分析装置。
JP2015534141A 2013-08-29 2014-08-12 データ分析方法、プログラム、及び装置 Active JP6516159B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013177752 2013-08-29
JP2013177752 2013-08-29
PCT/JP2014/071516 WO2015029809A1 (ja) 2013-08-29 2014-08-12 データ分析方法、プログラム、及び装置

Publications (2)

Publication Number Publication Date
JPWO2015029809A1 true JPWO2015029809A1 (ja) 2017-03-02
JP6516159B2 JP6516159B2 (ja) 2019-05-22

Family

ID=52586374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015534141A Active JP6516159B2 (ja) 2013-08-29 2014-08-12 データ分析方法、プログラム、及び装置

Country Status (2)

Country Link
JP (1) JP6516159B2 (ja)
WO (1) WO2015029809A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002245232A (ja) * 2001-02-14 2002-08-30 Cml:Kk 経営診断情報提供装置、経営診断情報提供システム及びプログラム
JP2004164036A (ja) * 2002-11-08 2004-06-10 Hewlett Packard Co <Hp> 文書の共通性評価方法
WO2008075744A1 (ja) * 2006-12-20 2008-06-26 Intellectual Property Bank Corp. 情報処理装置、提携先を選定するための情報を生成する方法、およびプログラム
JP2009169979A (ja) * 2009-04-28 2009-07-30 Mitsubishi Electric Information Systems Corp 特徴語抽出システム及びプログラム
JP2010181966A (ja) * 2009-02-03 2010-08-19 Ntt Docomo Inc レコメンド情報評価装置およびレコメンド情報評価方法
JP2013143074A (ja) * 2012-01-12 2013-07-22 Hitachi Systems Ltd 情報集計システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002245232A (ja) * 2001-02-14 2002-08-30 Cml:Kk 経営診断情報提供装置、経営診断情報提供システム及びプログラム
JP2004164036A (ja) * 2002-11-08 2004-06-10 Hewlett Packard Co <Hp> 文書の共通性評価方法
WO2008075744A1 (ja) * 2006-12-20 2008-06-26 Intellectual Property Bank Corp. 情報処理装置、提携先を選定するための情報を生成する方法、およびプログラム
JP2010181966A (ja) * 2009-02-03 2010-08-19 Ntt Docomo Inc レコメンド情報評価装置およびレコメンド情報評価方法
JP2009169979A (ja) * 2009-04-28 2009-07-30 Mitsubishi Electric Information Systems Corp 特徴語抽出システム及びプログラム
JP2013143074A (ja) * 2012-01-12 2013-07-22 Hitachi Systems Ltd 情報集計システム

Also Published As

Publication number Publication date
JP6516159B2 (ja) 2019-05-22
WO2015029809A1 (ja) 2015-03-05

Similar Documents

Publication Publication Date Title
Underwood et al. Dissecting the illegal ivory trade: an analysis of ivory seizures data
Wang et al. A new random subspace method incorporating sentiment and textual information for financial distress prediction
Vasilyeva et al. Neural network modeling of the economic and social development trajectory transformation due to quarantine restrictions during COVID-19
Oliveira et al. Some experiments on modeling stock market behavior using investor sentiment analysis and posting volume from Twitter
Kumar Effective hedging strategy for us treasury bond portfolio using principal component analysis
Kamley et al. Performance forecasting of share market using machine learning techniques: A review
Gan Application of metamodeling to the valuation of large variable annuity portfolios
Azqueta-Gavaldón Causal inference between cryptocurrency narratives and prices: Evidence from a complex dynamic ecosystem
US11210673B2 (en) Transaction feature generation
KR20200039037A (ko) 신경망을 이용한 주가 예측 장치 및 그 방법
Pekár et al. Portfolio performance measurement using differential evolution
Bonne et al. An artificial intelligence-based industry peer grouping system
Jahanshahloo et al. Using the minimum distance of DMUs from the frontier of the PPS for evaluating group performance of DMUs in DEA
Esubalew et al. Revisiting the global definitions of MSMEs: parametric and standardization issues
Lita DATA ENVELOPMENT ANALYSIS TECHNIQUES-DEA AND MALMQUIST INDICATORS, IN CRS MODE, FOR MEASURING THE EFFICIENCY OF ROMANIAN PUBLIC HIGHER EDUCATION INSTITUTIONS.
WO2015029809A1 (ja) データ分析方法、プログラム、及び装置
Phang et al. A study of cost, revenue, and profit efficiency of commercial banks in Cambodia using DEA approach
Gong et al. Pricing foreign equity option under stochastic volatility tempered stable Lévy processes
Heidari et al. Finding knees in bayesian multi-objective optimization
Al-Hroot The influence of sample size and selection of financial ratios in bankruptcy model accuracy
Wu et al. The total return swap pricing model under fuzzy random environments
Lambert Sales Forecasting: Machine Learning Solution to B2B Sales Opportunity Win-Propensity Computation
Bai Using orthogonal GARCH to forecast covarince matrix of stock returns
Lajevardi A hybrid portfolio selection model based on grey relational analysis and feature selection: Evidence on listed firms in Tehran Stock Exchange
Ghazali et al. The Emerging Technology of Blockchain for Decision-Makers in Supply Chain Management

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190404

R150 Certificate of patent or registration of utility model

Ref document number: 6516159

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250