JP2005292871A - 技術文献の市場性分析システム及び市場性分析プログラム - Google Patents

技術文献の市場性分析システム及び市場性分析プログラム Download PDF

Info

Publication number
JP2005292871A
JP2005292871A JP2004102475A JP2004102475A JP2005292871A JP 2005292871 A JP2005292871 A JP 2005292871A JP 2004102475 A JP2004102475 A JP 2004102475A JP 2004102475 A JP2004102475 A JP 2004102475A JP 2005292871 A JP2005292871 A JP 2005292871A
Authority
JP
Japan
Prior art keywords
marketability
vector
product category
technical
technical document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004102475A
Other languages
English (en)
Other versions
JP4397264B2 (ja
Inventor
Masayuki Miyake
将之 三宅
Yuji So
裕二 宗
Takeshi Osuga
健 大須賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2004102475A priority Critical patent/JP4397264B2/ja
Publication of JP2005292871A publication Critical patent/JP2005292871A/ja
Application granted granted Critical
Publication of JP4397264B2 publication Critical patent/JP4397264B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】技術文献の市場性を具体的な数値として提示可能な技術の実現。
【解決手段】複数の技術用語の辞書ベクトルを格納しておく記憶部38と、各製品の市場規模を表す基準数値を製品カテゴリ別に登録しておく基準数値DB40と、製品カテゴリと辞書ベクトルを比較し、各製品カテゴリの概念ベクトルを生成する手段と、この概念ベクトルに基準数値を乗ずることで市場性ベクトルを算出する手段と、技術文献中のキーワードを抽出し、これらを辞書ベクトルとを比較して技術文献の概念ベクトルを生成する手段と、これと各製品カテゴリの概念ベクトルとを比較し、所定の類似度を備えた製品カテゴリを関連製品カテゴリとして抽出する手段と、各関連製品カテゴリの市場性ベクトルと技術文献の概念ベクトルとの内積値を積算して当該技術文献の市場性数値を算出する手段とを備えた。
【選択図】 図1

Description

この発明は技術文献の市場性分析技術に係り、特に、各技術文献(特許文献や学術論文等)の市場規模を自動的に算出する分析システム及び分析プログラムに関する。
出願公開公報等の特許文献は技術情報の宝庫であるため、多くの企業において特許文献の収集及び分析が行われている。
また、分析結果を平面上にマッピングすることにより、当該技術分野における全体的な傾向を視覚的に把握できるように工夫することも実践されている。
この所謂特許マップの作成手順や表現形式については様々なものが提案されているが、その作成に際しては人為的な作業が中心となり、多大な労力を要するため、これを支援するツールが種々提案されている。
例えば、下記の特許文献1においては、予め配置条件設定画面上において特許マップの外形寸法、表示項目、縦軸と横軸に用いる項目等を設定しておき、特許マップ化の対象となる二次元配列データ(出願日、分類、公開番号、コメント等のデータを含むCSVファイル)の座標をこれらの配置条件に従って算出する特許マップ作成システムが開示されている。
特開2001−222536号公報
しかしながら、従来の特許マップは当然ながら特許出願の技術的な傾向や分布を把握することしかできず、各特許出願が関係する技術分野の市場規模を具体的な数値で表示することはできなかった。
もちろん、技術開発の方向性を検討する際に特定技術分野の特許マップを作成し、未開拓領域を発見することは有意義であるが、例えば買収対象企業が保有している特許出願の市場性を概括的に把握する用途や、発明提案書や研究計画書の潜在的な市場性を具体的な数値として弾き出す用途には無力である。
また、個々の文献を精読して関連技術分野を特定し、これと工業統計等の数値とを突き合わせることによって人為的に市場規模を算出することは可能であるとしても、1件当たりに膨大な時間と労苦を要するため、大量の技術文献に対してこの作業を適用することは事実上不可能である。
この発明は、従来の上記問題点を解決するためになされたものであり、自動的に各特許文献や学術論文等の関連技術分野を特定すると共に、これに各種統計データや推計データを適用させることにより、その市場性を具体的な数値として提示することを可能とする技術の実現を目的としている。
上記の目的を達成するため、請求項1に記載した技術文献の市場性分析システムは、複数の技術用語の辞書ベクトルを格納しておく記憶手段と、各製品の市場規模を表す基準数値を製品カテゴリ別に登録しておく記憶手段と、上記製品カテゴリと上記辞書ベクトルとを比較し、各製品カテゴリの概念ベクトルを生成する手段と、各製品カテゴリの概念ベクトルに上記基準数値を乗ずることにより、それぞれの市場性ベクトルを算出する手段と、電子化された技術文献の中からキーワードを抽出する手段と、当該キーワードと上記辞書ベクトルとを比較し、当該技術文献の概念ベクトルを生成する手段と、この技術文献の概念ベクトルと各製品カテゴリの概念ベクトルとを比較し、所定の類似度を備えた製品カテゴリを当該技術文献の関連製品カテゴリとして抽出する手段と、各関連製品カテゴリの市場性ベクトルと上記技術文献の概念ベクトルとの内積値を積算することにより、当該技術文献の市場性数値を算出する手段とを備えたことを特徴としている。
また、請求項2に記載した技術文献の市場性分析システムは、請求項1のシステムを前提とし、さらに、電子化された複数の技術文献の中から所定の基準に従って複数のキーワードを抽出する手段と、各技術文献に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各技術文献の座標を算出する手段と、各技術文献の市場性数値の大小に対応した色彩を施したマークを、上記二次元平面上の対応座標に配置させた画像を生成する手段と、当該画像を出力する手段とを備えたことを特徴としている。
上記「出力」には、プリンタを介しての印刷及びディスプレイへの表示が含まれる(以下同様)。
請求項3に記載した技術文献の市場性分析プログラムは、コンピュータを、コンピュータを、複数の技術用語の辞書ベクトルを格納しておく記憶手段、各製品の市場規模を表す基準数値を製品カテゴリ別に登録しておく記憶手段、上記製品カテゴリと上記辞書ベクトルとを比較し、各製品カテゴリの概念ベクトルを生成する手段、各製品カテゴリの概念ベクトルに上記基準数値を乗ずることにより、それぞれの市場性ベクトルを算出する手段、電子化された技術文献の中からキーワードを抽出する手段、当該キーワードと上記辞書ベクトルとを比較し、当該技術文献の概念ベクトルを生成する手段、この技術文献の概念ベクトルと各製品カテゴリの概念ベクトルとを比較し、所定の類似度を備えた製品カテゴリを当該技術文献の関連製品カテゴリとして抽出する手段、各関連製品カテゴリの市場性ベクトルと上記技術文献の概念ベクトルとの内積値を積算することにより、当該技術文献の市場性数値を算出する手段として機能させることを特徴としている。
また、請求項4に記載した技術文献の市場性分析プログラムは、請求項3のプログラムを前提とし、さらにコンピュータを、電子化された複数の技術文献の中から、所定の基準に従って複数のキーワードを抽出する手段、各技術文献に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各技術文献の座標を算出する手段、各技術文献の市場性数値の大小に対応した色彩を施したマークを、上記二次元平面上の対応座標に配置させた画像を生成する手段、当該画像を出力する手段として機能させることを特徴としている。
この発明に係る技術文献の市場性分析システム及び市場性分析プログラムによれば、工業統計やリサーチ結果など、製品カテゴリ別に市場規模を表す数値(例えば製品出荷額)を記述したデータに基づき、各種技術文献の市場性数値(市場規模額)を人手を介さず自動的に算出することが可能となり、特定企業が保有する多数の特許出願の市場規模をマクロ的に把握したり、発明提案書や研究計画書等の市場価値を事前に把握する用途に有効である。
図1は、この発明に係る技術文献の市場性分析システム10の構成例を示すブロック図であり、キーボードやマウス等の入力装置12とディスプレイ14が接続されたPC等のコンピュータ16よりなり、このコンピュータ16は、検索処理部20と、辞書ベクトル生成部22と、概念ベクトル生成部24と、関連製品カテゴリ抽出部26と、市場性数値算出部28と、市場性数値表示部30と、技術文献データベース32と、抽出文献蓄積部34と、辞書用技術文献データベース36と、辞書ベクトル記憶部38と、基準数値データベース40と、市場性数値記憶部42とを備えている。
上記検索処理部20、辞書ベクトル生成部22、概念ベクトル生成部24、関連製品カテゴリ抽出部26、市場性数値算出部28、市場性数値表示部30は、コンピュータ16のCPUがOS及び専用のアプリケーションプログラムに従って必要な処理を実行することによって実現される。
また、技術文献データベース32、抽出文献蓄積部34、辞書用技術文献データベース36、辞書ベクトル記憶部38、基準数値データベース40、市場性数値記憶部42は、コンピュータ16のメモリやハードディスク内に設けられている。
この市場性分析システム10においては、辞書用技術文献データベース36内の登録情報を基に、辞書ベクトル生成部22によって辞書ベクトルが予め生成され、辞書ベクトル記憶部38に格納されている。
以下、この辞書ベクトルの生成方法について説明する。
まず、辞書用技術文献データベース36内には、理化学辞典や各種用語解説書、特許文献、学術論文等のテキストデータが格納されており、辞書ベクトル生成部22は、これらのデータをテキストマイニングのアルゴリズムに従って単語レベルに分解する。
つぎに、接続詞などの不要語を削除して所定数の技術用語を抽出すると共に、各技術用語の出現頻度や出現文献数を集計し、これらのデータを専用のアルゴリズムに代入することによって辞書ベクトル(ステムベクトル)を生成する。
例えば、「光触媒は、太陽光や室内光に含まれる微弱な紫外光を利用した、光活性の高い光触媒薄膜コーティング材料からなり、光触媒反応を利用した、抗菌、セルフクリーニング、空気浄化材料などの実用展開が進められている。」という内容の技術文献が辞書用技術文献データベース36内に格納されていた場合、辞書ベクトル生成部22は、これから「光触媒」、「太陽光」、「室内光」、「紫外光」、「光活性」、「薄膜コーティング材料」、「光触媒反応」、「抗菌」、「セルフクリーニング」、「空気浄化材料」の技術用語を抽出する。これらの技術用語は、1つの文献での共起性(同時に出現しやすいこと)が高いものとして、ひとつの類似性の概念として分析される。
辞書ベクトル生成部22は、このような分析を多くの技術文献を基にして繰り返すことにより、上記に示したような技術用語を、各々方向を持ったベクトルとして生成し、辞書ベクトルとなす。
なお、この辞書ベクトルの生成ロジック自体は既に公知であるため、これ以上の詳細な説明を省略する。
図2は辞書ベクトル44のイメージを表したものであり、PCやコンピュータ、イオン、アルカリなど複数の技術用語が相互の関連性の強弱に基づいて方向付けられ、単位ベクトル化されている様子が描かれている。
この図は、ベクトルの方向が近い(ベクトル間のなす角が狭い)技術用語同士は類似性が高く、ベクトルの方向が遠い(ベクトル間のなす角が広い)技術用語同士は類似性が低いことを表している。
図示の便宜上、技術用語の数が10個に限定されているが、実際には数百の技術用語が抽出され、数百次元のベクトル空間上に配置されている。
つぎに、図3のフローチャートに従い、この分析システム10における市場性数値算出の処理手順を説明する。
まず、ユーザが入力装置12を介して特定の企業名及び年度範囲を検索条件としてコンピュータ16に入力すると、検索処理部20が上記検索条件に合致する技術文献を技術文献データベース32から抽出する(S10)。
技術文献データベース32には、予め多数の特許文献(例えば出願公開公報)の電子データが格納されており、検索処理部20は各特許文献の書誌データを参照することによって目的の文献を選別する。
つぎに検索処理部20は、選別した各文献の出願番号、出願日、出願人、発明者、公開番号、要約書等の記載内容を抽出し、所定のデータ形式(CSV等)に変換して抽出文献蓄積部34に格納する(S12)。
つぎに概念ベクトル生成部24が起動し、抽出文献蓄積部34に格納された各特許文献の実体的な記載内容(例えば要約書のテキストデータ)から技術的なキーワードを複数抽出し、これらを辞書ベクトル記憶部38に格納された辞書ベクトル44と比較することより、当該特許文献自体の概念ベクトルを生成する(S14)。
このキーワードの抽出に際し、概念ベクトル生成部24は要約書の記載をテキストマイニングのアルゴリズムに従って単語レベルに分解すると共に、予め登録されている不要な単語を除去し、技術用語のみを出現頻度と共に抽出する。
例えば、ある特許文献中に「可視光線も利用可能な新たな光触媒を含有し、空気中の窒素酸化物を除去するコーティング材」という記述が含まれていた場合、概念ベクトル生成部24は以下のように技術用語及びその出現頻度を抽出する。
「可視光線」・・・1回
「光触媒」・・・1回
「空気中」・・・1回
「窒素酸化物」・・・1回
「除去する」・・・1回
「コーティング材」・・・1回
そして、概念ベクトル生成部24は抽出した各技術用語単語について辞書ベクトル記憶部38内の辞書ベクトル44中に該当の技術用語が存在するか否かを判断し、存在する場合はこの辞書ベクトルを取得する。
取得した辞書ベクトルは、最終的に出現頻度と共にベクトル合成され、これにより特許文献の概念ベクトルが生成される。
この概念ベクトルの生成ロジックも公知であるため、これ以上の説明を省略する。
つぎに概念ベクトル生成部24は、基準数値データベース40を参照し、上記と同様のロジックに従って製品カテゴリの概念ベクトルを生成する(S16)。
すなわち、基準数値データベース40には、パソコンやカメラ、自動車、エンジン、記憶装置といった製品カテゴリ毎の統計数値(例えば製品出荷額)が各年度毎に格納されており、概念ベクトル生成部24は各製品カテゴリ(技術用語)、あるいはその解説文中の技術用語を辞書ベクトル記憶部38内の辞書ベクトル44と比較することにより、各製品カテゴリの概念ベクトルを生成する。
概念ベクトル生成部24によって各特許文献の概念ベクトル及び各製品カテゴリの概念ベクトルが算出された後、関連製品カテゴリ抽出部26が起動し、各特許文献に関連した製品カテゴリが特定される(S18)。
図4は、関連製品カテゴリを選定する際のイメージを図示したものであり、関連製品カテゴリ抽出部26は特許文献の概念ベクトルTと各製品カテゴリの概念ベクトルCiとの内積値を算出し、この内積値が所定のベクトル類似度α(0<α<1)以上となる製品カテゴリを当該特許文献の関連製品カテゴリとして認定する。
図においては、製品カテゴリの概念ベクトルC2、C3が関連製品カテゴリとして選定され、概念ベクトルC1、C4が非関連製品カテゴリとして排除される様子が描かれている。
ここで、特許文献の概念ベクトルと製品カテゴリの概念ベクトルとの間にどの程度の類似性があれば関連製品カテゴリとして認定すべきかが問題となるが、これは技術文献の種類や技術分野、基準数値データベース40内の製品カテゴリの詳細度等に応じて適宜設定される。
つぎに市場性数値算出部28が起動し、各特許文献の関連製品カテゴリに基準数値を適用することにより、当該特許文献の市場性数値(市場規模)を算定する(S20)。
すなわち、関連製品カテゴリを抽出する際にはベクトル演算を単純化するため、大きさを有さない単位ベクトル(製品カテゴリの概念ベクトル)をベースにしていたが、元々製品カテゴリには市場規模を示す具体的な数値(基準数値)が関連付けられているため、これを反映させることによって当該特許文献の市場性を具体的な金額として導くことが可能となる。
図5は、各製品カテゴリの概念ベクトルに基準数値を反映させた市場性ベクトルMiのイメージを表している。
この場合、ある特許文献の概念ベクトルTに対して一定の類似度を有する製品カテゴリの概念ベクトルに市場規模を表す基準数値(製品出荷額等)を乗することにより、当該製品カテゴリの市場性ベクトルMiが求められることを示している。
市場性数値算出部28は、具体的には以下の数式に従って各特許文献の市場性数値を算出する。
Figure 2005292871
すなわち、各製品カテゴリの概念ベクトルと特許文献の概念ベクトルとの内積値に当該製品カテゴリの基準数値を乗算し、これらを積算した総和が市場性数値算出部28によって当該特許文献の市場性数値(市場規模額)として認定される。
このように、各製品カテゴリの市場性ベクトルと特許文献の概念ベクトルとの内積値を積算しているため、特許文献の概念ベクトルTにより近い(なす角度がより小さい)製品カテゴリの市場性ベクトルが拡大評価され、特許文献の概念ベクトルにより遠い(なす角度がより大きい)製品カテゴリの市場性ベクトルが縮小評価されることとなる。
この算出結果である市場性数値は、市場性数値算出部28により、各特許文献の属性情報と関連付けて市場性数値記憶部42に格納される(S22)。
最後に市場性数値表示部30が起動し、市場性数値記憶部42に格納された全ての特許文献の市場性数値(市場規模額)及び書誌的事項を抽出すると共に、これらを所定のテンプレートに充填することによって算出結果の表示画面を生成し、ディスプレイ14に表示させる(S24)。
図6はその一例を示すものであり、出願番号、公開番号、発明の名称、出願人の一般的な表示項目の他に、市場性数値の項目を備えた一覧表46が画面中に表示されている。
この市場性数値の項目に記載された具体的な金額の多寡により、各特許文献の市場性を認識することができ、特許出願相互間の市場価値を比較検討することも可能となる。
この市場性分析システム10は、多数の特許文献の市場性をより効果的に表示させる機能を備えている。
図7は、その場合のシステム構成例を示すものであり、コンピュータ16は、キーワード抽出部48と、座標算出部50と、描画処理部52と、言語辞書群54と、抽出文献蓄積部34と、キーワード記憶部56と、座標データ記憶部58と、市場性数値記憶部42とを備えている。
上記キーワード抽出部48、座標算出部50、及び描画処理部52は、コンピュータ16のCPUがOS及び専用のアプリケーション・プログラムに従って必要な処理を実行することによって実現される。
また、言語辞書群54、キーワード記憶部56、座標データ記憶部58は、コンピュータ16のメモリやハードディスク内に設けられている。
以下、図8のフローチャートに従い、この表示方法を実現する場合の処理手順を説明する。
まず、キーワード抽出部48が起動し、抽出文献蓄積部34に格納された特許文献の実体部分(例えば要約書の記載)に対して整形処理を施す(S30)。
すなわち、キーワード抽出部48はテキストマイニングのアルゴリズムに従い、各特許文献の実体部分を構成するテキストデータを単語レベルに分解する。
つぎにキーワード抽出部48は、言語辞書群54の要置換・削除単語辞書60を参照し、テキストデータに含まれる不要な単語を削除すると共に、必要な置換処理を実行する。
ここで不要な単語とは、例えば要約書中に含まれる「課題」や「解決手段」、「効果」などの定型的な段落タイトル、あるいは「ところで」や「しかしながら」、「そこで」などの接続詞、「である。」、「この場合」など技術的な意味を有さない言葉が該当する。要置換・削除単語辞書60内には、予め分析対象外とすべき多数の要削除単語が登録されている。
また必要な置換処理としては、例えば出願番号中に含まれる「特願昭55-」の和暦表示を、「特願1980-」の西暦表示に変換することが該当する。このため、要置換・削除単語辞書60内には、予め和暦と西暦との対応データが格納されている。
つぎにキーワード抽出部48は、整形済みのテキストデータからキーワード候補を抽出すると共に(S32)、各キーワード候補を出現文献数順に集計する。
この際、キーワード抽出部48は類義語・必要語辞書62を参照し、実質的に同義である複数の技術用語を一つの用語(代表語)に統一させる。例えば、ある特許文献中に「炭素繊維」とあり、他の特許文献中に「カーボンファイバ」の記載があった場合、キーワード抽出部はそれぞれについて「炭素繊維」の記載ありと認定し、それぞれを当該キーワード候補の出現文献としてカウントする。
ここで、無数の単語の中からどの程度の数のキーワード候補を抽出するかについては、予めシステム10内に設定しておくこともできるが、分析要求時にユーザの側で設定することもできる。
例えば、抽出件数の上限を100件と設定されていた場合、キーワード抽出部48は出現文献数の上位100位内の単語をキーワード候補として選定する。
ただし、類義語・必要語辞書62内に特定の技術用語が必要語として設定されていた場合、キーワード抽出部48は当該必要語に該当する単語については例え出現文献数に基づく順位が100位以下であっても、キーワード候補として選定する。
この必要語の設定は、予めシステム運用者の側で準備して類義語・必要語辞書62に格納しておく他に、処理要求時にユーザが指定することもできる。
図9は、キーワード候補の抽出結果リスト64を例示するものであり、出現件数1位の「画像」というキーワード候補は、105件の特許文献中に合計で212回出現しており、全文献数に占める割合(出現頻度)が2.16%であることを示している。
このキーワード候補の抽出結果は、ディスプレイ14に表示される(S34)。
これに対しユーザは、上記抽出結果リスト64の中から必要なキーワード候補のチェックボックスにレ点を入力し、「選択」ボタン(図示省略)をクリックする。
これを受けたキーワード抽出部48は(S36)、ユーザが指定したキーワード候補を正式なキーワードとして認定し、キーワード記憶部56に格納する(S38)。
この際、各特許文献の出願番号と抽出したキーワード、及び各キーワードの出現数との対応関係も登録される。
なお、上記にあってはキーワード抽出部48によって名詞のキーワード候補が抽出される例を示したが、この発明はこれに限定されるものではなく、名詞と名詞の組合せ、形容詞と名詞の組合せや、あるいは名詞と動詞の組合せをキーワード候補として抽出することもできる。
例えば、「水の汚れ(名詞+名詞)」、「高い親水性(形容詞+名詞)」、「紫外線を照射する(名詞+動詞)」などが該当する。
また、上記のようにキーワード抽出部48によってまずキーワード候補がリストアップされ、その中からユーザが選択したものをキーワードとして認定する代わりに、キーワード抽出部48によって自動的にキーワードが確定されるように設定することもできる。
つぎに座標算出部50が起動し、各特許文献の二次元平面上における位置座標を算出する(S40)。
すなわち、座標算出部50は、各特許文献に関連付けられたキーワードの組合せ及びそれぞれの出現数のデータを多変量解析の主成分分析用アルゴリズムに入力することにより、図10に示すように、各特許文献のX軸座標(第1主成分)及びY軸座標(第2主成分)が算出される。
この算出結果は、座標データ記憶部58に格納される。
つぎに座標算出部50は、各特許文献の座標データを基に、二次元平面上における特許文献の分布密度を算出する(S42)。
すなわち、座標算出部50は、座標軸上の一定の面積に含まれる文献数を当該領域の分布密度に変換する。
図11はその変換処理のイメージを示すものであり、二次元平面66上に各特許文献を座標通りにプロットした後(図中の黒点が各特許文献の位置を示している)、X軸及びY軸を所定の間隔で仕切ることによって複数の領域に区分し、各領域内に含まれる文献数を当該領域の分布密度として集計する。
例えば、αの領域には4件の特許文献が含まれているため、分布頻度は「4」とカウントされる。これに対し、βの領域には1件の特許文献も含まれていないため、分布頻度は「0」となる。
この分布密度データは、座標データ記憶部58に格納される。
つぎに座標算出部50は、各キーワードを含む特許文献の件数、及び出現数のデータを主成分分析用アルゴリズムに入力することにより、図12に示すように、各キーワードのX軸座標(第1主成分)及びY軸座標(第2主成分)を算出する(S44)。
この算出結果は、座標データ記憶部58に格納される。
つぎに描画処理部52が起動し、まず座標算出部50による算出結果に基づき、二次元平面上に分布密度データ及びキーワードの座標データを反映させた特許マップを生成し、ディスプレイ14に表示させる(S46)。
図13(a)は特許マップ68の一例を示すものであり、各キーワードの存在を示す点が該当の座標上にプロットされると共に、各点の近傍には対応のキーワード(文字列)が表示されている。
また、特許マップ68上には、特許文献の分布密度に対応した図形(紋様)70が表示されている。
すなわち、上記のように特許マップ68を構成する細分化された領域には分布密度が予め関連付けられており、描画処理部52がその分布密度に応じて異なった色彩(表示パターン)を当該領域に割り当てることにより、特許マップ68上に分布密度を反映した図形(紋様)70が描画されることとなる。
各領域に対する色彩の割当て方に限定はないが、一例を挙げれば以下のようになる。
(1) 分布密度が50以上の領域 →赤色
(2) 分布密度が40〜49の領域→橙色
(3) 分布密度が30〜39の領域→黄色
(4) 分布密度が20〜29の領域→黄緑色
(5) 分布密度が10〜19の領域→水色
(6) 分布密度が1〜9の領域 →青色
(7) 分布密度が0の領域 →藍色
図13(a)の特許マップ68は白黒で表現されているため分布密度を直感的に把握することは難しいが、実際には上記の色彩によって分布密度が鮮やかに描画されているため、ユーザはディスプレイ14上に表示された特許マップ68を一目見ただけで特許文献数の粗密具合を認識することができる。
分布密度の変化を色彩によって表現する代わりに、他の表示パターンによって表現することもできる。例えば、同一色彩における濃淡に差を付けることによって分布密度の変化を表現することが該当する。あるいは、各領域に分布密度に応じて異なった模様(斜線、網線等)を割り当てることにより、分布密度の変化を表現してもよい。
以下、図13(a)の特許マップを観察することにより、ユーザはどのような情報を読み取ることができるのかについて説明する。
(1) まずユーザは、特定のキーワードの周辺に広がる分布密度を参照することにより、当該キーワード(技術テーマ)に関連する特許出願の多寡を認識することができる。例えば、「帯電器」のキーワードの周辺が赤色で取り囲まれている場合、「帯電器」に関連している特許出願件数が多いことを意味している。
(2) つぎにユーザは、各キーワードのマップ上における位置により、当該キーワードのユニーク度を確認することができる。すなわち、特許マップ68の中心に近い位置に配置されたキーワードは比較的オーソドックスであることを意味し、中心から外れるほどユニークな技術要素であることを読み取ることができる。
(3) またユーザは、複数のキーワード間の距離や組合せに基づき、各技術要素間の関係や位置付けを推察することもできる。
つぎに描画処理部52は、図13(b)に示すように、各特許文献の存在を示すドット72をそれぞれの座標に従って二次元平面状に配置させた分布図74を生成し、ディスプレイ14に表示させる(S48)。
この際、描画処理部52は、市場性数値記憶部42内に格納された各特許文献の市場性数値(市場規模額)を参照し、その大小に応じた色彩を各ドットに付与する。
各市場性数値に対する色彩の割当て方に限定はないが、一例を挙げれば以下のようになる。
(1) 市場規模額が1,000億円以上 →赤色
(2) 市場規模額が700億円以上1,000億円未満→橙色
(3) 市場規模額が500億円以上700億円未満 →黄色
(4) 市場規模額が300億円以上500億円未満 →黄緑色
(5) 市場規模額が100億円以上300億円未満 →水色
(6) 市場規模額が50億円以上100億円未満 →青色
(7) 市場規模額が50億円未満 →藍色
図13(b)の分布図74は白黒で表現されているため各ドット72が表す市場規模を直感的に把握することは難しいが、実際には上記の色彩によってドット72が鮮やかに色付けされているため、ユーザは特許文献の市場規模の分布状況を視覚的に認識することが可能となる。
また、(b)の分布図74における各特許文献は、(a)の特許マップ68における分布密度算定の基礎となった各特許文献と同じ位置に配置されているため、両者を対比観察することにより、特許出願の密度と市場規模との関係を把握することが可能となる。
さらに、関連製品カテゴリの基準数値を年度別に入れ替えて各特許文献の市場性数値を再計算し、この算出結果を上記分布図74に反映させることにより、市場規模の推移を各特許文献を表すドットの色彩の変化として表現することも可能となる。
この技術文献の市場性分析システム10を利用することにより、特定企業の保有する特定技術分野に係る特許出願群に対し、所謂PPM(Patent Portfolio Management)分析が可能となる。
このPPM分析は、図14に示すように、横軸に占有率を、縦軸に市場規模を設定した平面をそれぞれの高低によって4つの象限(ポテンシャル領域、安定事業領域、事業見直し領域、ニッチ領域)に区分し、特定企業が保有する特定技術分野に係る特許出願群(Patent Portfolio)を該当する象限に位置付けることによってその特性を分析する手法である。
例えば、ある総合電機メーカが保有する半導体製造装置関連の特許出願が、同分野における全特許出願の30%を占めており(占有率:高)、この市場性分析システム10によって算出した各特許出願の市場規模額の合計が1,000億円以上(市場規模:高)であった場合、「安定事業領域」に該当することとなり、それ程焦って特許出願に邁進する必要がないとの判断が可能となる。
これに対し、同メーカが保有するノイズフィルタ関連の特許出願が、同分野における全特許出願の5%に満たず(占有率:低)、各特許出願の市場規模額の合計が30億円未満(市場規模:低)であった場合、「事業見直し領域」に該当することとなり、これ以上の特許出願は無用であるとの判断を導くことが可能となる。
上記にあっては、PC等のコンピュータ16に専用のアプリケーションプログラムをセットアップすることによってシステム10を構成する、所謂スタンドアロン型のシステム構成を例示したが、この発明はこれに限定されるものではない。
すなわち、サーバに専用のアプリケーションプログラムをセットアップし、インターネット等のネットワークを介して接続された多数のクライアント端末に対してサービスを提供するクライアント−サーバ型のシステムとしてこの発明を実現することもできる。
また、上記にあっては、技術文献データベース32をコンピュータ16のハードディスクに格納しておく例を説明したが、ネットワークを介して接続されたDBサーバ内に格納された文献データベースから必要な文献情報を抽出するように構成することもできる。
上記にあっては、日本語の特許文献の市場性を算定する例を示したが、このシステム10は英語や中国語、ドイツ語、フランス語など日本語以外の言語で記述された技術文献の市場性算定にも適用可能であることは言うまでもない。
また、技術文献の一例として上記においては特許文献を挙げたが、学術論文や発明提案書、研究計画書などの市場性を事前に算定する目的にも有効である。
この発明に係る技術文献の市場性分析システムの構成を示すブロック図である。 辞書ベクトルのイメージを示す概念図である。 市場性数値の算出手順を示すフローチャートである。 関連製品カテゴリを選定する際のイメージを示す概念図である。 製品カテゴリの概念ベクトルに基準数値を反映させた市場性ベクトルのイメージを示す概念図である。 市場性数値の表示画面を示すレイアウト図である。 市場性数値を反映させた特許文献の分布図を生成する場合のシステム構成を示すブロック図である。 市場性数値を反映させた特許文献の分布図を生成する場合の処理手順を示すフローチャートである。 キーワード候補の抽出結果リストを示すレイアウト図である。 各特許文献のX軸座標及びY軸座標の算出結果を示す説明図である。 特許文献の座標から分布密度を算出する際のイメージを示す概念図である。 各キーワードのX軸座標及びY軸座標の算出結果を示す説明図である。 特許マップ及び市場性数値を反映させた特許文献の分布図を示すレイアウト図である。 市場性数値に基づきPPM分析を行う場合の概念図である。
符号の説明
10 技術文献の市場性分析システム
12 入力装置
14 ディスプレイ
16 コンピュータ
20 検索処理部
22 辞書ベクトル生成部
24 概念ベクトル生成部
26 関連製品カテゴリ抽出部
28 市場性数値算出部
30 市場性数値表示部
32 技術文献データベース
34 抽出文献蓄積部
36 辞書用技術文献データベース
38 辞書ベクトル記憶部
40 基準数値データベース
42 市場性数値記憶部
44 辞書ベクトル
46 市場性数値の一覧表
48 キーワード抽出部
50 座標算出部
52 描画処理部
54 言語辞書群
56 キーワード記憶部
58 座標データ記憶部
60 要置換・削除単語辞書
62 類義語・必要語辞書
64 キーワード候補の抽出結果リスト
66 二次元平面
68 特許マップ
70 特許文献の分布密度に対応した図形
72 特許文献の存在を示すドット
74 特許文献の分布図

Claims (4)

  1. 複数の技術用語の辞書ベクトルを格納しておく記憶手段と、
    各製品の市場規模を表す基準数値を製品カテゴリ別に登録しておく記憶手段と、
    上記製品カテゴリと上記辞書ベクトルとを比較し、各製品カテゴリの概念ベクトルを生成する手段と、
    各製品カテゴリの概念ベクトルに上記基準数値を乗ずることにより、それぞれの市場性ベクトルを算出する手段と、
    電子化された技術文献の中からキーワードを抽出する手段と、
    当該キーワードと上記辞書ベクトルとを比較し、当該技術文献の概念ベクトルを生成する手段と、
    この技術文献の概念ベクトルと各製品カテゴリの概念ベクトルとを比較し、所定の類似度を備えた製品カテゴリを当該技術文献の関連製品カテゴリとして抽出する手段と、
    各関連製品カテゴリの市場性ベクトルと上記技術文献の概念ベクトルとの内積値を積算することにより、当該技術文献の市場性数値を算出する手段と、
    を備えたことを特徴とする技術文献の市場性分析システム。
  2. 電子化された複数の技術文献の中から、所定の基準に従って複数のキーワードを抽出する手段と、
    各技術文献に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各技術文献の座標を算出する手段と、
    各技術文献の市場性数値の大小に対応した色彩を施したマークを、上記二次元平面上の対応座標に配置させた画像を生成する手段と、
    当該画像を出力する手段と、
    を備えたことを特徴とする請求項1に記載の技術文献の市場性分析システム。
  3. コンピュータを、
    複数の技術用語の辞書ベクトルを格納しておく記憶手段、
    各製品の市場規模を表す基準数値を製品カテゴリ別に登録しておく記憶手段、
    上記製品カテゴリと上記辞書ベクトルとを比較し、各製品カテゴリの概念ベクトルを生成する手段、
    各製品カテゴリの概念ベクトルに上記基準数値を乗ずることにより、それぞれの市場性ベクトルを算出する手段、
    電子化された技術文献の中からキーワードを抽出する手段、
    当該キーワードと上記辞書ベクトルとを比較し、当該技術文献の概念ベクトルを生成する手段、
    この技術文献の概念ベクトルと各製品カテゴリの概念ベクトルとを比較し、所定の類似度を備えた製品カテゴリを当該技術文献の関連製品カテゴリとして抽出する手段、
    各関連製品カテゴリの市場性ベクトルと上記技術文献の概念ベクトルとの内積値を積算することにより、当該技術文献の市場性数値を算出する手段、
    として機能させることを特徴とする技術文献の市場性分析プログラム。
  4. コンピュータを、
    電子化された複数の技術文献の中から、所定の基準に従って複数のキーワードを抽出する手段、
    各技術文献に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各技術文献の座標を算出する手段、
    各技術文献の市場性数値の大小に対応した色彩を施したマークを、上記二次元平面上の対応座標に配置させた画像を生成する手段、
    当該画像を出力する手段、
    として機能させることを特徴とする請求項3に記載の技術文献の市場性分析プログラム。
JP2004102475A 2004-03-31 2004-03-31 技術文献の市場性分析システム及び市場性分析プログラム Expired - Fee Related JP4397264B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004102475A JP4397264B2 (ja) 2004-03-31 2004-03-31 技術文献の市場性分析システム及び市場性分析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004102475A JP4397264B2 (ja) 2004-03-31 2004-03-31 技術文献の市場性分析システム及び市場性分析プログラム

Publications (2)

Publication Number Publication Date
JP2005292871A true JP2005292871A (ja) 2005-10-20
JP4397264B2 JP4397264B2 (ja) 2010-01-13

Family

ID=35325779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004102475A Expired - Fee Related JP4397264B2 (ja) 2004-03-31 2004-03-31 技術文献の市場性分析システム及び市場性分析プログラム

Country Status (1)

Country Link
JP (1) JP4397264B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007172429A (ja) * 2005-12-26 2007-07-05 Nomura Research Institute Ltd 文献情報分析装置及び文献情報分析方法
JP2007265009A (ja) * 2006-03-28 2007-10-11 Nomura Research Institute Ltd 文献情報分析システム及び文献情報分析プログラム
JP2007310720A (ja) * 2006-05-19 2007-11-29 Toshiba Corp データ処理装置、データ処理方法およびデータ処理プログラム
JP2008084151A (ja) * 2006-09-28 2008-04-10 Just Syst Corp 情報表示装置および情報表示方法
JP2008112208A (ja) * 2006-10-27 2008-05-15 Lg Electronics Inc 情報自動分類方法と情報検索及び分析方法
JP2008226248A (ja) * 2007-03-14 2008-09-25 Nhn Corp クエリターゲティング方法およびシステム
JP2008268985A (ja) * 2007-04-16 2008-11-06 Yahoo Japan Corp タグを付与する方法
KR101067846B1 (ko) * 2009-07-27 2011-09-27 (주)더비엔아이 특허 평가 시스템 및 그 방법, 이를 구현하기 위한 프로그램을 기록한 디지털 처리장치가 판독 가능한 기록매체
JP2015207173A (ja) * 2014-04-21 2015-11-19 株式会社カネカ 特許情報分析装置及び特許情報分析方法
KR20210030808A (ko) * 2019-09-10 2021-03-18 한국과학기술정보연구원 시장규모추정장치 및 그 동작 방법

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007172429A (ja) * 2005-12-26 2007-07-05 Nomura Research Institute Ltd 文献情報分析装置及び文献情報分析方法
JP2007265009A (ja) * 2006-03-28 2007-10-11 Nomura Research Institute Ltd 文献情報分析システム及び文献情報分析プログラム
JP2007310720A (ja) * 2006-05-19 2007-11-29 Toshiba Corp データ処理装置、データ処理方法およびデータ処理プログラム
JP2008084151A (ja) * 2006-09-28 2008-04-10 Just Syst Corp 情報表示装置および情報表示方法
JP2008112208A (ja) * 2006-10-27 2008-05-15 Lg Electronics Inc 情報自動分類方法と情報検索及び分析方法
JP2008226248A (ja) * 2007-03-14 2008-09-25 Nhn Corp クエリターゲティング方法およびシステム
JP2008268985A (ja) * 2007-04-16 2008-11-06 Yahoo Japan Corp タグを付与する方法
KR101067846B1 (ko) * 2009-07-27 2011-09-27 (주)더비엔아이 특허 평가 시스템 및 그 방법, 이를 구현하기 위한 프로그램을 기록한 디지털 처리장치가 판독 가능한 기록매체
JP2015207173A (ja) * 2014-04-21 2015-11-19 株式会社カネカ 特許情報分析装置及び特許情報分析方法
KR20210030808A (ko) * 2019-09-10 2021-03-18 한국과학기술정보연구원 시장규모추정장치 및 그 동작 방법
KR102358357B1 (ko) * 2019-09-10 2022-02-04 한국과학기술정보연구원 시장규모추정장치 및 그 동작 방법

Also Published As

Publication number Publication date
JP4397264B2 (ja) 2010-01-13

Similar Documents

Publication Publication Date Title
JP7289047B2 (ja) ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム
US9591028B2 (en) Visualization and analysis of complex security information
RU2421810C2 (ru) Грамматический разбор визуальных структур документа
JP4397264B2 (ja) 技術文献の市場性分析システム及び市場性分析プログラム
US20240152836A1 (en) Apparatus for generating resource allocation recommendations
KR20060095565A (ko) 조사 대상 문서의 문서 특징 분석 장치
JPWO2009110550A1 (ja) 属性抽出方法、システム及びプログラム
Paudyal et al. Algorithmic opacity: making algorithmic processes transparent through abstraction hierarchy
JP2005149346A (ja) 文献情報分析システム及び文献情報分析プログラム
Angelini et al. CLAIRE: A combinatorial visual analytics system for information retrieval evaluation
US20230236892A1 (en) Apparatus for resource enhacement
KR101911447B1 (ko) 구조설계 도면의 패턴분석을 통한 3차원 구조해석 모델 생성 장치
JP4829655B2 (ja) 文献情報分析システム及び文献情報分析プログラム
WO2020090356A1 (ja) インクデータ生成装置、方法及びプログラム
CN105164667A (zh) 修改分析流
Sharma et al. A reliable knowledge processing framework for combustion science using foundation models
Sailaja et al. An overview of pre-processing text clustering methods
JPWO2018150453A1 (ja) データ分析装置およびデータ分析方法
CN116933130A (zh) 一种基于大数据的企业行业分类方法、系统、设备及介质
Gandhi et al. Natural Language Commanding via Program Synthesis
JP2016045552A (ja) 特徴抽出プログラム、特徴抽出方法、および特徴抽出装置
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
CN114780577A (zh) Sql语句生成方法、装置、设备及存储介质
Fruth et al. The fanovagraph package: Visualization of interaction structures and construction of block-additive Kriging models
Trost et al. Parameter free hierarchical graph-based clustering for analyzing continuous word embeddings

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091013

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091020

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131030

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees