JP2009032119A

JP2009032119A - 情報構造化装置、情報構造化方法、及びプログラム

Info

Publication number: JP2009032119A
Application number: JP2007196661A
Authority: JP
Inventors: Shigeaki Matsumoto; 繁明松元
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2007-07-27
Filing date: 2007-07-27
Publication date: 2009-02-12

Abstract

【課題】与えられた情報源から精度よく必要な情報を抽出し、企業特性を考慮して定量化することができる情報構造化装置、情報構造化方法及びプログラムを提供する。
【解決手段】情報源を分割して単語を生成する情報源裁断部１００と、予め定められた書式ルールに従って単語を分類する情報源再構築部２００と、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定部５００と、初期スコアに基づき企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定部６００とを有する。企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出されるものである。
【選択図】図１

Description

本発明は、入力された情報源を所定の規則に従って構造化する情報構造化装置、情報構造化方法及びプログラムに関し、特に、例えば情報源としてウェブ情報を使用し製品企画支援を行なう情報構造化装置、情報構造化方法及びプログラムに関する。

企業が新商品のための製品企画を行う際、従来から市場の動向、他社の保有技術、自社の保有技術などを考慮に入れて行なわれていた。具体的には、事業ドメインの市場が伸びるのかどうか、売れている製品はどのようなものか、又は他社になく自社にある技術を生かすにはどうすればよいのか、といった検討がなされているのが通例である。

一般消費者が購入する商品（消費財）の製品企画であれば、一般消費者に対するアンケート方式のマーケティングによって製品の特性などを決定することが多かった。近年では、クチコミサイト、Q&Aコミュニティ、ソーシャルネットワーキングサービス（ＳＮＳ）、ブログ、ＣＯＩ（Community Of Interest）サイト等インターネット等を活用して消費者が内容を生成していく消費者発信型メディア／消費者生成メディア（Consumer Generated Media：ＣＧＭ）を利用して、口コミ情報を集める仕組みも試行されている。

一方、企業が購入する商品（生産財）の商品企画の場合は、顧客の声によるマーケティングが困難である。その理由として、生産財を購入するのは企業であり購入者の母集団が少ないこと、購入対象となる生産財の種類、購入数は購入企業の投資戦略に関わる情報であり、部分的にしか公開されないためである。

一般に公開されている情報から企業を評価するための情報を抽出するための技術として、特許文献１には、企業信用度測定の一例が記載されている。この特許文献１記載の財務安全度の算出方法においては、借入金のある企業が財務安全度を、現金預金／借入金×１００％と云う簡単な計算式で指数を算出し、過去・現在の傾向を確認する。すなわち、財務安全度の指数を、決算期毎に３期間ないし５期間を比較し、上昇傾向であれば経営が順調な証拠であり、低下を続けるなら経営全般の改善が必要と判定する。

ところで、特許文献２には、例えば商品やサービスの販売促進のための広告配信を効果的に行なうこと等を目的とし、販売促進の対象となる顧客の母集団の中から、特定の商品やサービスを実際に購入する可能性が高いと考えられる潜在顧客を選別する顧客選別方法が開示されている。この特許文献２に記載の技術は、テキストを含むファイルを自動的に分類する情報分類装置であって、ファイル格納手段が出力するファイルのテキスト部分を形態素解析してファイルの識別子と共に出力する形態素解析手段と、ファイルを分類するためのキーワードを格納するキーワード格納手段と、キーワード格納手段の出力と形態素解析手段の出力とを入力として形態素解析の結果の中からキーワードを収集してファイルの識別子と共に出力するキーワード収集手段と、利用者が最近の分類結果と異なる分類結果を要求するための入力手段と、入力手段の出力とキーワード収集手段の出力とを入力としてファイルの識別子をキーワードで分類して出力する情報分類手段と、情報分類手段の出力とファイル格納手段の出力とを入力として情報分類手段が分類した結果を利用者に提供するものである。
特開２０００−１１３０３７号公報特開平１０−２８３３６６号公報

しかしながら、特許文献１に記載の技術においては、企業力を測定しているが、財務情報した考慮しないため、日々の企業動向（ニュース）を詳細に反映したものが得られていない。また、特許文献２に記載の技術においては、キーワードにより入力情報を分類するものであるが、企業特性を考慮したものではない。したがって、特許文献１及び特許文献２に記載の技術によっては、企業特性を考慮し、日々のニュースを定量化することができないという問題点がある。

本発明は、このような事情に鑑みてなされたものであり、与えられた情報源から精度よく必要な情報を抽出し、企業特性を考慮して定量化することができる情報構造化装置、情報構造化方法及びプログラムを提供することを目的とする。

本発明に係る情報構造化装置は、情報源を分割して単語を生成する情報源裁断部と、予め定められた書式ルールに従って前記単語を分類する情報源再構築部と、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、前記情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定部と、前記初期スコアに基づき前記企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定部とを有し、前記企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出されるものである。

また、本発明にかかる情報構造化方法は、上記の情報構造化処理を実行する方法であり、本発明にかかるプログラムは、上記の情報構造化処理をコンピュータに実行させるものである。

本発明によれば、与えられた情報源から精度よく必要な情報を抽出し、企業特性を考慮して定量化することができる情報構造化装置、情報構造化方法及びプログラムを提供することができる。

以下、本発明を適用した具体的な実施例について、図面を参照しながら詳細に説明する。本実施例にかかる情報構造化装置は、ウェブなどにおける企業情報、製品情報、技術情報を整理し、製品企画支援を行なうための装置であり、生産財メーカにとって優良顧客であるかどうかを、企業の投資欲から判定し、より購買力のある企業を発見する。また、他社への納入実績情報を商品に付加して提示することにより、信用ある他社が購入した生産財のみを選択することができ、購入者側の実績を元に商品比較をすることができる。さらに、ニュースという公開された情報から、新規顧客や新規部品納入業者を発見することにより、販路や部品供給の拡大を行うことができ、これによってボトルネックを解消することが可能となる。

ここで、本実施例においては、説明上、部品を製造している企業を部品納入企業、部品納入企業から部品が納入される企業を競合企業、競合企業が製品を納入する企業を顧客企業として説明する。そして、競合企業であるユーザが本システムを使用する場合を想定して説明を行なう。いうまでもなく、顧客企業間、部品納入企業間は互いに競合企業であるが、本実施例においては、部品納入企業、顧客企業ということとする。

本発明の第１の実施例
図１は、本発明の第１の実施例にかかる情報構造化装置１０を示す図である。図１に示すように、本実施例にかかる情報構造化装置１０は、分類装置１１と定量化装置１２とを有し、与えられた情報源を分類し、定量化するものであり、より具体的には、単文で表現されたニュースタイトルのような情報源から必要な単語を抽出し、企業情報、製品情報、技術情報を整理し、情報源の価値や企業価値を定量化するものである。この情報構造化装置１０は、情報源裁断部１００、情報源再構築部２００、情報源価値推定部５００及び企業力推定部６００を有する。情報源裁断部１００は、情報源の文字列を文法レベルの不可分要素に分割する。情報源再構築部２００は、不可分要素を組み合わせてツリー構造に再構築する。情報源価値推定部５００は、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が情報源に含まれる単語により定義された定義表と、情報源とを参照し、当該リーフのスコア（コスト）を初期スコアとして算出する。企業力推定部６００は、初期スコアに基づき企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する。ここで、企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出されるものであるが、その詳細は後述する。次に、各ブロックについて詳述する。

図２は、本実施例における情報源裁断部１００を示すブロック図である。図２に示すように、情報源裁断部１００は、情報源（タイトル）蓄積部１０１、形態素解析部１０２、及び形態素蓄積部１０３を有する。これらの手段はそれぞれ概略次のように動作する。

情報源蓄積部１０１は、情報源文字列を保持している。情報源文字列は、図３で示すように、日時及び文字列の情報からなる。この情報源文字列は「、」を複数有し、「。」を１つ有するような短文である。

形態素解析部１０２は、情報源である例えばタイトル文字列"日本電気、光アクセス製品「ＤＷ４０００」を発売"のような１文で表現された文字列を、形態素（Morpheme）（"日本電気"，"、"，"光"，"アクセス"，"製品"，"「"，"ＤＷ"，"４０００"，"」"，"を"，"発売"）に分割し、形態素解析を行う。形態素とはこれ以上に細かくすると意味がなくなってしまう最小の文字列をいう。形態素解析とは、対象言語の文法の知識（文法のルールの集まり）や辞書（品詞等の情報付きの単語リスト）を使用し、自然言語で書かれた文を形態素の列に分割（分節処理（分かち書き））し、それぞれの品詞を判別する作業を指す。形態素解析された結果は、例えば、図４に示すように、単語、品詞、補助、読みからなるデータ形式で形態素蓄積部１０３に格納される。

図５は、本実施例における情報源再構築部２００を示す図である。図５に示すように、情報源再構築部２００は、書式解析部２０１、書式ルール蓄積部２０２、及び要素単語格納部２０３を有する。これらの手段はそれぞれ概略次のように動作する。

書式解析部２０１には、形態素蓄積部１０３から、情報源を形態素に分断された品詞集合が入力される。この品詞集合において連続した名詞を結合する。上述の例では、例えば"光"、"アクセス"、"製品"を連結して"光アクセス製品"とする。その後、書式ルール蓄積部２０２を参照して、情報源特有の表現にマッチするルール集合を取り出し、主体者、行動、製品名、特徴語などのキーワードを抽出することで、形態素集合から、製品名・主体者・行動・特徴語・シノニム（要素単語）を生成し、要素単語格納部２０３に格納する。下記の書式ルールに従うと、
主体者：日本電気
製品名：ＤＷ４０００
行動：発売
特徴語：光アクセス製品
という要素単語を生成する。

書式ルール蓄積部２０２に格納されているルールは下記のようなものがある。
１）製品／派生製品抽出ルール
（ア）かぎ括弧「」で囲まれている連続名詞を製品名として抽出する
（イ）英字＋数字があれば、製品型番として抽出する
（ウ）マーク（Ｒ）の前にくる連続名詞を商標名として抽出する
（エ）過去に抽出された製品名との差分をとり、差分部分を派生製品名として抽出する
（オ）該当するものがなければ、製品名なしと判定し、抽出されない

２）主体者抽出ルール
（ア）行頭から句点（、）までの範囲に、名詞しか出現しなかった場合には、最長一致の名詞を企業名とする
（イ）格助詞（「が」、「は」）の前にくる最長一致の名詞を企業名とする
（ウ）（株）、（有）の直後に来る最長一致の名詞を企業名とする
（エ）該当するものがなければ、情報源発信元サイトのＵＲＬから企業名を抜き出す

３）行動抽出ルール
（ア）行末のサ変名詞を、企業の行動とする
（イ）最後に出現する動詞を企業の行動とする
（ウ）該当するものがなければ、発表という行動を抽出する

４）行動対象ルール
（ア）行動が「納入」の場合は、助詞「へ」「に」の前にくる名詞を納入先企業とする
（イ）行動が「採用」の場合は、主体者として抽出された企業を納入先企業とする。
（ウ）該当するものがなければ、行動対象なしと判定し、抽出されない

５）シノニム抽出ルール
（ア）括弧「（」の前後にくる連続名詞１組を、キーワードとそのシノニムとして抽出する。
（イ）該当するものがなければ、シノニムなしと判定し、抽出されない

６）特徴語抽出ルール
（ア）他のルール集合で漏れた連続名詞を、特徴語として抽出する。

図６は、本実施例における情報源価値推定部５００を示すブロック図である。図６に示すように、情報源価値推定部５００は、主体者判定部５０１と、主体者辞書格納部５０２と、主体者分類済み情報源格納部５０３と、情報源定量化部５０４と、単語定量化マップ格納部５０５と、情報減初期スコア格納部５０６、企業力測定ツリー格納部５０７と、ドメイン辞書格納部５０８とを有する。

主体者判定部５０１は、ドメイン辞書格納部３０２のドメイン辞書を参照し、事業ドメインに適合する情報源のみを適合情報源として選択する。具体的には、先ず、情報源の中に例えば"納入"、"採用"といった行動を含む言葉があれば、生産財に関する情報源であると判定する。

次に主体者判定部５０１は、ドメイン辞書を参照し、生産財に関する情報源と判定された情報源に含まれる要素単語、すなわち主体者、製品名、行動、特徴語、及びシノニムと、ドメイン辞書格納部５０８に格納されている事業ドメイン専門の企業名、製品名、及び特徴語とを比較する。図７は、ドメイン辞書の構造を示す図、図８は、ドメイン辞書の一例を示す図である。ドメイン辞書には、主体者、製品名、特徴語などのカテゴリ別に、語句１列、語句２列、・・・と複数の語句列が登録されている。

そして、主体者判定部５０１は、生産財に関する情報源と判定された情報源に含まれる各要素単語とドメイン辞書の単語を比較して、マッチするものが１つ以上合った場合に、その情報源は事業ドメインに合致した生産財と判定し、図示せぬ適合情報源格納部に格納する。マッチするものがない場合には、例えば図示せぬ非適合情報源格納部に格納する。そして、適合情報原格納部に格納した情報原に含まれる"製品名"、"特徴語"、及び"シノニム"のうち、ドメイン辞書に登録がないものをドメイン辞書格納部５０８のドメイン辞書へ登録する。情報源に含まれる"主体者"は、事業ドメインにおける専門業者と総合メーカを区別するため、情報源の各要素単語がドメイン辞書と適合又は非適合する個数を毎回測定する。同一主体者の情報源に関して、情報源の総数に対し、所定の割合ｔｈ１（０＜ｔｈ１＜１）以上の数の情報源が適合情報源であれば、専門業者として当該情報源の主体者をドメイン辞書の主体者カテゴリに登録し、所定の割合未満である場合は総合メーカとして主体者カテゴリに登録する。

主体者辞書格納部５０２は主体者辞書を格納する。主体者辞書は、上述の図９に示すように、カテゴリ、｛顧客、競合、部品納入｝と企業名（名前）との組からなる構造を有する。この主体者辞書の企業名には、競合企業の名前、顧客企業の名前、部品納入企業の名前が格納されている。

主体者辞書を参照することで、ニュースが事業ドメインに合致しているかどうかを判定することができる。専門業者の名前がニュースに含まれていた場合、技術辞書にない特徴語でも、事業ドメインに合致する製品であると判定したり、主体者による判定によって、ニュースに含まれる製品名も事業ドメインに適していると判定することができる。よって、それを購入した顧客を新顧客として認定することができる。また、総合メーカＫを主体者に登録してしまうと、Ｋ製の洗濯機も、光ネットワーク製品だと誤判定したり、Ｋ製の洗濯機を大量に購入したコインランドリー業者がいた場合に、光事業ドメイン製品を購入した新規顧客と誤判定したりしてしまうが、総合メーカを主体者に登録せずに主体者判定することにより、あるメーカの製品は全て事業ドメインに合致するという動作をすることを防止する。

主体者判定部５０１は、適合情報源格納部を参照し、その主体者と、主体者辞書格納部５０２の主体者辞書とを比較する。そして、適合情報源を、主体者で分類し、競合企業に関する競合企業情報源、顧客企業に関する顧客企業情報源、又は納入企業に関する納入企業情報源として、情報源格納部５０３に格納する。

情報源定量化部５０４は、情報源格納部５０３に格納された主体者別情報源と単語定量化マップ格納部５０５に格納された図１０に示す構造の単語定量化マップから、後述する企業力測定ツリー格納部５０７に格納された企業力測定ツリーの最下層を構成するリーフのスコアを初期スコアとして算出する。単語定量化マップは、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が情報源ツリーに含まれる単語により定義された定義表である。

先ず、図１０に示す単語定量化マップについて説明すると、単語定量化マップは、情報源の「主体者」、「製品名」、「特徴語」、「アクション」、「アクションの対象」を組み合わせたルールと、それらに対応する初期スコア算出方法が記載されている。

具体的には、計算を開始するためのトリガーとして働く「単語」列と、情報源からどのようにスコアを算出するか記載された「スコア算出方法」列、初期スコアの配分先を決定するための「配分企業」列、「配分リーフ」列、及び「配分率」列を有する。

スコア算出方法としては大きく分けて４種類がある。１つめは固定値を与えるもので、ある単語が情報源に含まれていたら固定値で指定した値を初期スコアとして与える方式である。２つめは、配分先のリーフの値を用いて算出するもので、対象リーフが有する値を２倍、３倍するときに適用する方式である。３つ目は情報源が有する単語を組み合わせで計算するもので、"１００億"、"増資"といった額面の値をスコアとして適用する方式である。４つ目は、外部算出部で定義する方式に従って算出するもので、複数の情報源を用いてスコアを算出する場合に適用する方式である。

次に、企業力測定ツリーについて説明する。図１１乃至図１３は、それぞれ顧客企業力測定ツリー、競合企業力測定ツリー、部品納入企業力測定ツリーの構造を示す図である。企業力測定ツリー格納部５０７には、図１１に示す競合企業向けの競合企業力測定ツリー、図１２に示す顧客企業向けの顧客企業力測定ツリー、図１３に示す部品納入企業向けの納入企業力測定ツリーの３種類の企業力測定ツリーが準備されている。図１１乃至図１３に示すように、企業力測定ツリーは、ノード構造とリーフ構造の２種類のデータ構造を有し、企業名をルートノードとし、各企業の競争力を表現するための企業特性ノードを階層的に有することが可能である。最下層は、情報源から生成した初期スコアを割り当てるためのリーフとなっている。リーフはノードを有することができない。

図１４は、単語定量化マップに含まれる単語・ノード対応表を示す図である。情報源定量化部５０４は、この単語・ノード対応表におけるワード欄に一致する要素単語が主体者別情報源に含まれているか判別する。含まれている場合は、当該ワード欄に対応するタイプの企業力測定ツリーの最下層を構成するリーフ（ノード１〜ノード３）に対し、スコア欄に指定されているスコアを初期スコアとして設定する。例えば、主体者別情報源の主体者（タイプ）が競合であって、当該情報源に"展示"含まれる場合、"納入実績"リーフのスコア（初期スコア）を２とする。また、例えば、主体者別情報源の主体者（タイプ）が"競合又は納入"であって、当該情報源に"開発"含まれる場合、"製品バリエーション"、"開発スピード"、"機能特徴"、又は"部品バリエーション"、"開発スピード"、"部品最高性能順位"の各リーフのスコア（初期スコア）に拡張関数を適用し、それぞれ０．４、０．２、０．４を乗算する。

ここで、拡張関数：２×ｇ（ｆ（製品バリエーション），ｆ（開発スピード），ｆ（特徴））
ここで、
g(param1, param2, param3){

if(param1 node==製品バリエーション){
return param1;
}
ｆ（製品バリエーション）＝過去のリリース製品の数＋１
ｆ（開発スピード）＝ｆ（製品バリエーション）／リリース期間の累計
ｆ（特徴）＝情報源ツリーの特徴語数
を示す。

すなわち、開発というキーワードに対しては、拡張関数の結果を２倍した値を、定量化マップに記載の配分先、配分率で分配し、それぞれのリーフに与える初期スコアを決定する。拡張関数は、３つのパラメータを引数にもち、各引数のリーフの型で返却される値が異なるよう機能する。製品バリエーションリーフの場合には、過去のリリース製品の数に１を足したものを、拡張関数の返却値とする。開発スピードリーフの場合には、各製品のリリース間隔の合計で製品数を割った値を、拡張関数の返却値とする。特徴リーフの場合には、情報源の特徴語数を、拡張関数の返却値とする。

このように、情報源価値推定部５００により、単語定量化マップを用いて、情報源中に存在する行動とそれに付随する特徴語を組み合わせて、情報源の初期スコアを決定することができる。

図１５は、本実施例における企業力推定部６００を示すブロック図である。図１５に示すように、企業力推定部６００は、企業力計算部６０１と、情報源最終スコア格納部６０２を有する。

企業力計算部６０１は、企業力測定ツリーの最下層を構成するリーフに与えられた初期スコアが入力され、単語定量化マップ格納部５０５に格納された単語定量化マップの単語・ノード割り当て配分率と、企業力測定ツリー格納部５０７に格納された企業力測定ツリー情報から各ノードのスコアを算出し、企業力（最上位ノード）を算出する。そして、現在の企業力（スコアから過去の企業力（スコア）を引き算した値を情報源の最終スコアとして生成する。図１６は、ノード構造及びリーフ構造を示す図である。図１１乃至図１３に示す企業力測定ツリーにおいて、各ノードの値は、下位のリーフ値又はノード値から算出され、ノード毎に算出方法を定義することができる。

企業力計算部６０１は、先ず、情報源がどの企業タイプに属するかを主体者辞書格納部５０２に格納された主体者辞書を用いて判定するとともに、単語定量化マップ格納部５０５に格納された単語定量化マップに記載された単語・ノード割り当て配分率に応じて、情報源定量化部が算出した初期スコアを該当企業タイプの該当ノードに配分する。単語・ノード割り当て配分率は、初期スコアを企業力測定ツリーのどのリーフに配分するか記載したものである。ここで、企業力測定ツリーは、主体者の企業タイプごとに企業特性が異なり、主体者の企業ごとにその特性値が異なるものとなる。このため、情報源から算出した初期スコアが同じでも、適用する主体者が異なれば、最終スコアは異なるという特性を有する。

主体者が顧客企業であれば、図１１に示すように顧客企業向けに準備した企業力測定ツリーによって情報源を定量化する。顧客企業力測定ツリーは、「投資力」「サービス占有力」の子ノードから構成される。「投資力」ノードは、「投資積極性」「新規投資力」の子ノードから構成される。「投資積極性」は「流動資産」「固定資産」のリーフを有し、「新規投資力」は「純資産」「負債」のリーフを有する。「サービス占有力」ノードは、「地域性」「需要性」の子ノードを有する。さらに「地域性」ノードは、「サービス密度」「サービスエリア」リーフを有する。また「需要性」ノードは、「周期」「製品マッチング」リーフを有する。

それぞれのノード、リーフは初期値が１となっており、図１４で示す単語・ノード対応表を用いてスコアを計算する。各企業タイプの各ノード・リーフは、情報源に含まれるワードを受け取り、ルールに従ってそのスコアを更新する。例えば、固定資産リーフや流動資産リーフの「スコア算出方法」列には、「情報源に記載のスコアをそのまま利用する」というルールが割り当てられている。情報源に「１０００億円投資」という情報が掲載されていれば、固定資産リーフは額面を「１０００」分増加させ、流動資産リーフは「１０００」の額面分減少させる。上述したように、最下位のリーフは、情報源定量化部５０４によりその初期スコアが算出される。中間、及び最上位のノードは、下記の計算式により、企業力計算部６０１により、そのスコアを算出する。
中間ノード：レベル２
「投資積極性」ノードのスコア＝「固定資産」リーフのスコア／「流動資産」リーフのスコア
「新規投資力」ノードのスコア＝「純資産」リーフのスコア／「固定負債」リーフのスコア
「地域性」ノードのスコア＝（α０１×「サービス密度」リーフのスコア）＋（α０２×「サービスエリア」リーフのスコア）
「需要性」ノードのスコア＝（β０１×「周期」リーフのスコア）+（β０２×「製品マッチング」リーフのスコア）
中間ノード：レベル１
「投資力」ノードのスコア＝α１１×「投資積極性」ノードのスコア×α１２×「新規投資力」ノードのスコア
「サービス占有力」ノードのスコア＝β１１×「地域性」ノードのスコア×β１２×「需要性」ノードのスコア
最上位ノード
「顧客企業のスコア」＝α２１×「投資力」ノードのスコア×β２１×「サービス占有力」

ここで、α０１からβ２１までの重みは自由に設定できるようになっており、顧客企業型に属する企業力のうち重要視する特性を選択させることができる。各ノードのスコアは、次の計算式で求めることができる。
リーフのスコア（ｔ＋１）＝情報源（ｔ＋１）の初期スコア
ノードのスコア（ｔ＋１）＝ノードのスコア（ｔ）＋h(node_child1,node_child2,...,node_childN)
ここで、ｈ（）は、各ノードに自由に設定できる関数であり、具体的には、上述の「投資積極性」ノードのスコア＝「固定資産」リーフのスコア／「流動資産」リーフのスコア
のような数式である。関数ｈ（）の値は、マイナスになることもあり、結果的に各ノードの値を減少させることも可能となっている。

そして、企業力計算部６０１は、上記のノードのスコアを顧客企業力測定ツリーに保存する。企業力計算部６０１は、主体者毎に異なる企業力測定ツリーを生成する。情報源が各企業に対応する企業力測定ツリーのノードのスコアを増加させるため、ニュースリリースの多い企業は、少ない企業に比べて企業力が蓄積される。情報源の最終スコアは、最上位ノードで得られるスコアから、過去の最上位ノードの値を減算したスコアに等しく、企業力計算部６０１は、最終スコアを情報源最終スコア格納部６０２に保存する。

同様に、主体者が競合企業であれば、図１２に示すように競合企業向けに準備した企業力測定ツリーを基にして、情報源を定量化する。企業力測定ツリーは、「顧客利便性」「信用力」「販売力」「開発力」の子ノードから構成される。「顧客利便性」ノードは、「サポート拠点」の子リーフを有する。「信用力」ノードは、「格付け」、「納入実績」の子リーフを有する。「販売力」ノードは、「売り上げ実績」の子ノードを有する。「開発力」ノードは、「製品バリエーション」「開発スピード」「機能特徴」の子リーフを有する。それぞれのノード・リーフは初期スコアが１となっており、情報源の内容に応じて初期スコアを増加させる。上述したように、最下位のリーフは、情報源定量化部５０４が情報源の内容からスコアを直接的に計算する。例えば、情報源に「３つの製品を販売開始」という情報が掲載されていれば、情報源定量化部５０４は、図１４を参照して製品バリエーションのリーフスコアを３増加させる。中間、及び最上位のノードは、下記の計算式により企業力計算部６０１が算出する。
中間ノード
「顧客利便性」ノードのスコア＝（α１１×「１／アクセス時間」リーフのスコア）＋（β１1×「サービス拠点数」リーフのスコア）＋（γ１1×「サポート要員数」リーフのスコア）
「信用力」ノードのスコア＝（α２１×「納入実績」リーフのスコア）＋（β２２×「格付け」リーフのスコア）
「開発力」ノードのスコア＝（α３１×「製品バリエーション」リーフのスコア）＋（β３２×「開発スピード」リーフのスコア）＋（γ３３×「機能特徴」リーフのスコア）
最上位ノード
「競合企業のスコア」＝（α４１×「顧客利便性」ノードのスコア）＋（β４２×「信用力」ノードのスコア）＋（γ４２×「販売力」ノードのスコア）

同様に、主体者が部品の納入業者であれば、図１３に示すように部品納入企業向けに準備した企業力測定ツリーを基にして、情報源を定量化する。企業力測定ツリーは、「顧客利便性」「信用力」「開発力」の子ノードから構成される。「顧客利便性」ノードは、「納入可能数」「納期」リーフを有する。「信用力」ノードは、「納入実績」「格付け」リーフを有する。「開発力」ノードは、「部品バリエーション」「開発スピード」「部品最高性能順位」「差異化」リーフを有する。それぞれのノード・リーフは初期スコアが１となっており、情報源の内容に応じてスコアを増加させる。上述したように、情報源定量化部５０４は、例えば、情報源に「世界最速の部品を開発」という情報が入力されれば、部品最高性能順位リーフの初期スコアを２増加させる。中間、及び最上位のノードは、下記の計算式により企業力計算部６０１が算出する。

中間ノード
「顧客利便性」ノードのスコア＝（α１１×「納入可能数」リーフの値）＋（β１１×「納期」リーフのスコア）
「信用力」ノードのスコア＝（α２１×「納入実績」リーフのスコア）＋（β２２×「格付け」リーフのスコア）
「開発力」ノードのスコア＝（α３１×「部品バリエーション」リーフのスコア）＋（β３２×「開発スピード」リーフのスコア）＋（γ３３×「部品最高性能順位」リーフのスコア）

最上位ノード
「部品納入企業のスコア」＝（α４１×「顧客利便性」ノードのスコア）＋（β４２×「信用力」ノードのスコア）＋（γ４３×「開発力」ノードのスコア）

この企業力計算部６０１により、主体者辞書を用いて、情報源を顧客企業／競合企業／納入企業に分類し、企業タイプごとの評価テンプレート（企業力測定ツリー）を用いて、情報源の初期スコアを企業力の特質に配分し、過去の企業力を加味して情報源の最終スコアを定量化することができる。また、企業タイプごとの評価テンプレートは、各ノードやリーフにルールを持たせることができる構造になっており、情報源の値に対してルールを適用することによって、各ノードやリーフの値を計算することができる。さらに、この企業タイプごとの評価テンプレートは、ノード間を結ぶリンクに、「割合」により重み付けを与えることができる構造になっており、分析者が重要視する企業特性と、重要視しない企業特性を企業タイプごとに設定することができる。

次に、本実施例の動作について説明する。図１７は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。本実施例は、未知の競合商品が市場にリリースされたことを検出する例である。前提として、"ＤＷ４０００"は事業ドメインに合致した製品であることを、ドメイン辞書格納部３０２のドメイン辞書の「製品名」行、「語句１」列に登録しておく。（図８参照）

情報源として、例えば
"日本電気、光アクセス製品「ＤＷ４０００」を発売"
という文字列がシステムに入力された場合について説明する。情報源裁断部１００の形態素解析部１０２は、当該情報源の形態素解析を行い、この情報源を形態素へ分解することで、図１８に示す形態素を得る。（ステップＳ１００）。この形態素は、形態素蓄積部１０３に格納される。

書式解析部２０１は、形態素蓄積部１０３に格納された形態素集合に連続した名詞が出現する場合、これらを結合する。（ステップＳ２００）。図１９は、形態素の連結後を示す図である。次に、結合された連続名詞が、主体者なのか、製品名なのか、行動なのか、特徴語なのか判定するために、書式解析ルールを適用する（ステップＳ３００）。

次に、書式解析ルール適用方法について説明する。書式解析部２０１は、形態素集合の連続名詞を結合し、形態素又は連続名詞から、書式ルールに従って、主体者、製品名、行動、特徴語、シノニムを抽出する。

先ず、製品名抽出方法について説明する。図２０は、製品名抽出方法を示すフローチャートである。製品名を抽出する場合には、図２０に示すように、順序付けされた形態素集合から、鍵括弧が存在するか判定し（ステップＳ３０１）、もし鍵括弧があればその鍵括弧内の形態素配列を抽出する（ステップＳ３０２）。そして、鍵括弧内の形態素配列に名詞又は記号のみが存在するか否か判定し（ステップＳ３０３）、英数字が連続しているものがあれば（ステップＳ３０４）、英字と数字の連続した名詞を結合する（ステップＳ３０５）。さらに、この鍵括弧内の形態素配列の中に商標記号が存在するか否かを判定し（ステップＳ３０６）、存在すれば商標記号を削除すると共に、商標記号前の名詞を商品名として製品名に登録し、商標記号後の名詞を特徴語して採用する（ステップＳ３０７）。以上により抽出された製品名が過去に製品名として登録されているかどうか判定し、（ステップＳ３０８）、製品名が過去に登録されており、括弧内に商標で分断された名詞が存在すれば、それを派生商品修飾語として要素単語格納部２０３の特徴語に登録し（ステップＳ３０９）、商品名が過去に登録されていなければ新製品名として要素単語格納部２０３の製品名に登録し（ステップＳ３１０）、製品名抽出フローを終了する。

図２１は、主体者抽出方法を示すフローチャートである。図２１に示すように、順序付けされた形態素集合において、行頭から句点まで名詞のみ存在するか否かを判定する（ステップＳ３１１）。名詞のみ存在する場合は、主体者として抽出する（ステップＳ３１２）。

一方、行頭から句点まで名詞のみではない場合、（株）、（有）の記号が存在するか否かを判定する（ステップＳ３１３）。存在する場合は、当該記号の前後名詞を主体者として抽出する（ステップＳ３１４）。また、（株）、（有）の記号が存在しない場合は、"が"又は"は"が存在するか否かを判定する（ステップＳ３１５）。存在する場合は、助詞の前の名詞を主体者として抽出する（ステップＳ３１６）。さらに、"が"又は"は"も存在しない場合は、発信元を主体者とする（ステップＳ３１７）。抽出した主体者は、要素単語格納部２０３に記録する。

図２２は、行動抽出方法を示すフローチャートである。図２１に示すように、順序付けされた形態素集合において、行末にサ変名詞があるか否かを判定する（ステップＳ３２１）。ある場合は、サ変名詞を含む連続名詞を行動として抽出する（ステップＳ３２２）。サ変名詞がない場合は、動詞が存在するか否かを判定する（ステップＳ３２３）。動詞が存在する場合は、最後に出現する動詞を行動として抽出する（ステップＳ３２４）。動詞が存在しない場合は、"発表"という行動を図５に示す要素単語格納部２０３の行動に追加する（ステップＳ３２５）

図２３は、行動対象抽出方法を示すフローチャートである。図２３に示すように、順序付けされた形態素集合において、行動が"納入"か否かが判断される（ステップＳ３３１）。なお、行動対象抽出処理は、行動抽出処理の後に実施される。抽出された行動が"納入"であれば、助詞"へ"、"に"の前の名詞を行動対象として抽出する（ステップＳ３３２）。行動が"納入"でない場合、"採用"か否かを判断する（ステップＳ３３３）。"採用"である場合は、主体者の企業を行動対象として抽出する（ステップＳ３３４）。抽出した行動は、要素単語格納部２０３に記録する。一方、行動が"採用"でもない場合は、処理を終了する（ステップＳ３３５）。

図２４は、シノニム抽出方法を示すフローチャートである。図２４に示すように、順序付けされた形態素集合において、括弧が存在するか否かを判断し（ステップＳ３４１）、括弧が存在する場合は、右括弧の前後にくる連続名詞１組を語源とそのシノニムとし、これを抽出する（ステップＳ３４２）。抽出した語源及びそのシノニムは、要素単語格納部２０３に記録する。一方、括弧が存在しない場合は、シノニムなしを要素単語格納部２０３に記録する（ステップＳ３４３）。

図２５は、特徴語抽出方法を示すフローチャートである。図２５に示すように、順序付けされた形態素集合において、他のルールを適用して分類不能な名詞があるか否かを判断する（ステップＳ３５１）。ある場合は、その名詞を特徴語として抽出し（ステップＳ３５２）、要素単語格納部２０３に記録する。

以上のように、図２０に示す製品名抽出工程、図２１で示す主体者抽出工程、図２２で示す行動抽出工程、図２３で示す行動対象抽出工程、図２４で示すシノニム抽出工程、図２５で示す特徴語抽出工程を経て、図２６に示すような解析結果を得る（ステップＳ３００）。すなわち、"日本電気、光アクセス製品「ＤＷ４０００」を発売"という情報源から、
主体者：日本電気
製品名：ＤＷ４０００
行動：発売
特徴語：光アクセス製品
という解析結果が得られる。

次に情報源価値推定部５００の主体者判定部５０１は、情報源の中に例えば"納入"、"採用"といった行動を含むか否かで情報源が生産財に関するものであるか否かを判定する。そして、生産財に関するものと判定した情報源を構成する主体者、製品名、特徴語と、ドメイン辞書格納部５０８のドメイン辞書とを比較する。ドメイン辞書の単語と、情報源を構成する要素単語とが一部一致又は全部一致した場合に、当該情報源を適合情報源とする。本例においては、図２９に示すドメイン辞書において、製品名"ＤＷ４０００"が一致し、特徴語"光アクセス製品"がドメイン辞書の"光アクセス"と部分一致していることが分かるため、当該情報源を事業ドメインに合致した適合情報源であると判定し、当該情報源を適合情報源として適合情報源格納部に格納する。（ステップＳ４００）。

次に、主体者判定部５０１が、ドメイン辞書を参照し、情報源から適合情報源を選別する方法について具体的に説明する。図２７は、適合情報源選別方法を示すフローチャートである。情報源（ニュース情報源）として、
"オプト販売が光増幅をラマン方式とする「ＦＸ４２００」をＮＥＥへ納入"
という文字列が情報構造化装置１０へ入力されるとする。情報構造化装置１０は、図１７のステップＳ１００からステップＳ３００まで実行し、図２８に示す書式解析結果を得る。すると、主体者判定部５０１が情報源に含まれる要素単語と事業ドメイン辞書とを照合する。すなわち、図２７に示すように、主体者判定部５０１は、情報源から、行動に対応する単語として"納入"、"採用"が含まれているか否かを検出する（ステップＳ４０１）。そして、"納入"、"採用"が含まれており、生産財に関する情報源と判断されたものに含まれる単語と、ドメイン辞書の各カテゴリの単語とをマッチングする（ステップＳ４０２）。

そして、１つ以上、一部又は全部一致するものが存在するか否かを判定し（ステップＳ４０３）、一致するものがあれば適合情報源として登録する（ステップＳ４０４）。次に、情報源の製品名・特徴語等であって、ドメイン情報に登録がないものはドメイン辞書へ追加する（ステップＳ４０５）。次いで、適合回数が所定の割合以上であるか否かが判定され（ステップＳ４０６）、所定の条件に合致する場合には、情報源の主体者をドメイン辞書へ追加する（ステップＳ４０７）。これにより、情報源を構成する"主体者"が、事業ドメインにおける専門業者か、又は総合メーカかを区別することができる。

そして、情報源定量化部５０４は、このような情報源が到着する毎に企業力測定ツリーの初期スコアを更新し（ステップＳ５００）、企業力計算部６０１は、更新された初期スコアに基づき各ノードのスコアを算出する（ステップＳ８００）。

次に、初期スコアの更新方法の具体例について説明する。本例においては、顧客企業の純資産が５０億、負債が５０億、固定資産が３０億、流動資産が７０億であるとする。情報源のニュースとして、
"ＡＤＤＩ、メトロ事業に向け第三者割当による１００億円の増資"
という文字列が情報構造化装置３１に入力されるとする。情報構造化装置１０はステップＳ１００からステップＳ４００までを実行し、"メトロ"というキーワードによって、主体者判定部５０１が情報源が事業ドメインに合致していると判定する。そして、この情報源を適合情報源格納部に格納する（ステップＳ６００）。

次に、主体者判定部５０１は、図９に示す主体者辞書を参照し、主体者"ＡＤＤＩ"が顧客企業であると判定し、情報源格納部５０３に顧客企業情報源として格納する。過去のニュースも考慮にいれて、主体者が専門業者か総合メーカかを判定するため、主体者が様々な適合情報源ツリーを開発している場合に、誤って異なる事業ドメインの新製品と判定することも減少し、この異なる事業ドメインの新製品を購入した顧客も、誤って新顧客として判定することも減少する。そして、情報源定量化部５０４は、この顧客企業情報源を読み出し、図１３に示す顧客企業力測定ツリーと図１４に示す単語定量化マップを元に、当該情報源の各要素単語の初期スコアを算出する（ステップＳ７００）。

ここで、情報源入力前においては、企業力計算部６０１は、純資産が５０、負債が５０、固定資産が３０、流動資産が７０という初期スコアに基づき、その上位層のスコアを算出する。例えば、"投資積極性"のスコア＝固定資産／流動資産のスコアで計算されるため、３０／７０≒０．４３となり、"新規投資力"のスコア＝純資産／負債で計算されるため、５０／５０＝１となる。そして、"投資力"のスコア＝α１１×（"投資積極性"ノードのスコア）×α１２×（"新規投資力"ノードのスコア）で計算されるため、α１１＝α１２＝１とすると、１×０．４３×１×１＝０．４３となる。

サービス密度、サービスエリア、周期、製品マッチングの初期値を１、α０１〜β２１＝１とすると、
"地域性"ノードのスコア＝（α０１×"サービス密度"リーフのスコア）＋（α０２×"サービスエリア"リーフのスコア）＝２、
"需要性"ノードのスコア＝（β０１×"周期"リーフのスコア）+（β０２×"製品マッチング"リーフのスコア）＝２
"サービス占有力"ノードのスコア＝β１１×"地域性"ノードのスコア×β１２×"需要性"ノードのスコア＝４
となり、"顧客企業のスコア"＝α２１×"投資力"ノードのスコア×β２１×"サービス占有力"＝４．９３と求まる。

そして、上記の情報源が到着すると、情報源定量化部５０４は、初期スコアを更新する。すなわち、上述の情報源には、"増資"という単語が含まれ、図１４の単語・ノード対表に同じく"増資"というワードが含まれることから、ノード"純資産"の初期スコアを更新する。この場合、"純資産"リーフと同じく新規投資力ノードのリーフである"負債"リーフの割合は０であるため、スコア配分しない。すなわち、情報源に"１００億円"という単語が含まれるため、"％ｓ円"（"％ｓ円"は、"円"の前の数字をノードのスコアとすることを示す。）に対応する"１００億"が、"純資産"の初期スコアとなる。

そして、企業力計算部６０１は、更新された初期スコアに基づき各ノードのスコアを算出する（ステップＳ８００）。"新規投資力"は、情報源が到着後は１５０／５０＝３となる。

ＡＤＤＩの増資ニュースが流れるたびに、"投資積極性"、"新規投資力"ノードの値が変化する。投資力は投資積極性と新規投資力の掛け算で求められ、係数α１１及びα１２の値をそれぞれ１とすれば、１．９×３．０＝５．７が投資力ノードの値となる。もともと投資力ノードの値は０．４２×１．０＝０．４２であったことから、増分の５．７−０．４２＝５．２８が情報源のスコアであることがわかる。ここで、重みα１１とα１２は事業ドメインに応じて自由な値としてよい。

サービス占有力ノードのスコアは、α、βをいずれも１とすると、地域性のスコア×需要性のスコア＝４、上記情報源到着前後での変化分は０である。企業力スコア＝投資力かけるサービス占有力であり、情報源到着前後で、５．７×４−０．４２×４＝２１．１２が当該情報源のスコアとして求まる。

本実施例においては、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった会社の競合製品を発見し、購入対象として提示することができる。そして、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出し、分類することができる。また、ドメイン辞書を用いて、生産財かつターゲットとする事業ドメインに属している情報源のみ適合情報として抽出することができる。

さらに、企業力計算部６０１は、競合、顧客、納入企業ごとに定義した企業力測定ツリーを参照し、過去の情報源の価値を含んだ企業力を元に、今回の情報源によって生成される企業力を算出する。そして、情報源が与えられる前と後の企業力の差分を最終的な情報源のスコアとみなす。これにより、主体者辞書を用いて、情報源を顧客企業／競合企業／納入企業に分類し、企業タイプごとの評価テンプレートである企業力測定ツリーを用いて、情報源の初期スコアを企業力の特質に配分し、過去の企業力を加味して情報源の最終スコアを定量化することができる。

本発明の第２の実施例
次に、本発明の第２の実施例について説明する。本実施例は、分類装置が情報源選別部３００及びグループ生成部４００を有する点、並びに情報源再構築部２００ｂがツリー生成部２０４及び情報源ツリー格納部２０５を有する点、情報源選別部３００がドメイン辞書を有する点が第１の実施例と異なる。図２９は、本実施例にかかる情報定量化装置２０を示す図である。

情報定量化装置２０は、分類装置２１及び定量化装置２２を有する。分類装置２１は、情報源裁断部１００、情報源再構築部２００ｂ、情報源選別部３００及びグループ生成部４００を有する。定量化装置２２は、情報源価値推定部５００ｂ及び企業力推定部６００ｂを有する。

情報源裁断部１００は、第１の実施例と同様の構成を有するため説明は省略する。図３０は本実施例の情報源再構築部２００ｂを示す図である。本実施例にかかる情報源再構築部２００ｂは、図３０に示すように、情報源再構築部２００ｂは、書式解析部２０１、書式ルール蓄積部２０２、要素単語格納部２０３、ツリー生成部２０４、及び情報源ツリー格納部２０５を有する。書式解析部２０１、書式ルール蓄積部２０２、及び要素単語格納部２０３は第１の実施例と同様の構成を有する。

ツリー生成部２０４は、繋がりのない要素単語から、主体者をルートする情報源ツリーを生成する。図３１は、情報源ツリーを示す図である。図３１に示すように、主体者名がルートノードとなり、商標を有する製品名がその子ノードとなっている。さらに、派生製品、アクション、特徴語が商標を有する製品名の子ノードとなっている。さらに、シノニム、特徴語が派生製品の子ノードとなり、アクションの対象がアクションの子ノードとなっている。この情報源ツリーは、下記のルールに従って生成される。
（１）主体者名をルートノードとする
（２）製品名は商標の関係で普遍性を有する単語である。製品名を企業名の子ノードとする
（３）派生製品名を、商標を有する製品名の子ノードとする
（４）企業の行動は、製品又は派生製品の子ノードとする
（５）納入先は、行動の子ノードとする
（６）特徴語は、製品名又は派生製品名の子ノードとする
（７）シノニムは、言い換え対象となったキーワードと同じレベルのノードとする

上記ルールに従って生成された情報源ツリーは、１件の情報源に対応する。生成された情報源ツリーは、情報源ツリー格納部２０５へ格納される。

この情報源再構築部２００ｂにより、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出し、これらの要素単語からツリー構造を構築することができる。抽出された要素単語をツリー構造にすることで、要素単語を構造化した情報源ツリーを得ることができる。

図３２は、本実施例における情報源選別部３００を示すブロック図である。図３２に示すように、情報源選別部３００は、ツリー選別部３０１、ドメイン辞書格納部３０２、適合情報源ツリー格納部３０３、及び非適合情報源ツリー格納部を有する。これらの手段はそれぞれ概略次のように動作する。

ツリー選別部３０１は、ドメイン辞書格納部３０２のドメイン辞書を参照し、事業ドメインに適合するツリーのみを適合情報源ツリーとして選択する。具体的には、先ず、情報源ツリーの中に例えば"納入"、"採用"といった行動を含む言葉があれば、生産財に関する情報源であると判定する。上述の第１の実施例においては、情報源価値推定部５００の主体者判定部５０１がドメイン辞書を参照し、情報源を適合情報源か非適合情報源か選別するものとして説明したが、本実施例においては、情報源を適合情報源か、又は非適合情報源かを選別する選別情報源選別部３００を別途設けるものである。

次にツリー選別部３０１は、ドメイン辞書を参照し、生産財に関する情報源と判定された情報源ツリーを構成する要素単語、すなわち主体者、製品名、行動、特徴語、及びシノニムと、ドメイン辞書格納部３０２に格納されている事業ドメイン専門の企業名、製品名、及び特徴語とを比較する。

そして、ツリー選別部３０１は、生産財に関する情報源と判定された情報源ツリーの各要素単語とドメイン辞書の単語を比較して、マッチするものが１つ以上合った場合に、その情報源ツリーは事業ドメインに合致した生産財と判定し、適合情報源ツリー格納部３０３に格納し、マッチするものがない場合には、非適合情報源ツリー格納部３０４に格納する。そして、適合情報原ツリー格納部３０３に格納した情報原ツリーを構成する"製品名"、"特徴語"、及び"シノニム"のうち、ドメイン辞書に登録がないものをドメイン辞書格納部３０２のドメイン辞書へ登録する。上述したように、情報源ツリーを構成する"主体者"は、事業ドメインにおける専門業者と総合メーカを区別するため、情報源ツリーの各要素単語がドメイン辞書と適合又は非適合する個数を毎回測定する。同一主体者の情報源に関して、情報源の総数に対し、所定の割合ｔｈ１（０＜ｔｈ１＜１）以上の数の情報源が適合情報源ツリーであれば、総合メーカとして当該情報源ツリーの主体者をドメイン辞書の主体者カテゴリに登録し、所定の割合未満である場合は専門メーカとして主体者カテゴリに登録する。

図３３は、本実施例におけるグループ生成部４００を示すブロック図である。図３３に示すように、グループ生成部４００は、ツリー増殖部４０１、及び技術辞書格納部４０２を有する。これらの手段はそれぞれ概略次のように動作する。

ツリー増殖部４０１は、事業ドメインの生産財と判定されなかった情報源ツリーを非適合情報源ツリー格納部３０４から取得し、技術辞書格納部４０２の技術辞書を参照して事業ドメインに合致するものがないか検査することで、非適合情報源ツリーを適合情報源ツリーに昇格させる。

技術辞書は、技術用語とシノニムの集合を、その事業ドメインにおける上位概念・下位概念に基づき分類したものである。例えば、図３４は製品構成をベースにした技術辞書である。この技術辞書では、生産財を生産するためのモジュール構成を元に、パーツに関する技術用語を最下位のノードに、パーツ集合から構成されるモジュール部分をその上位に、モジュールから構成される製品を最上位のノードに、といった階層構造を定義している。すなわち、最下位には、"光増幅"、"光アクセス"、"ＯＣ−１２"、"ＳＲＭ−１６"が定義され、その上位に"ＤＷＤＭ"、"ＳＯＮＥＴ／ＳＤＨ"が定義され、最上位には、"光伝送装置"が定義されている。また、それぞれのノード間の距離も技術辞書作成時に設定する。図３５は、技術辞書の構造を示す図である。同時に利用される用語同士は距離が短く、同時に利用されない用語は距離を長く置くように設定する。例えば"光増幅"と"光アクセス"との距離は０．６であり、"光増幅"と"ＳＯＮＥＴ／ＳＤＨ"の距離は２．３である。生産財にも様々なドメインがあるため、分析対象の事業ドメインに合致するものをあらかじめ準備しておく。

この技術辞書を使用することで、あるキーワードと同種のワードが含まれている場合であって、そのワードがキーワードに一致しない場合であっても、適合情報源とすることができる。よって、必要な情報が漏れてしまったりする可能性を低減し、新しい競合製品や、その特徴語を容易に追加することができる。

なお、本実施の形態においては技術辞書として説明するが、単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び／又は下位概念に基づき分類した単語辞書であればよい。例えば、生鮮食品業界の企業ニュースを取り扱う場合、技術辞書は、"食品"が最上位ノード、その下位ノードに"肉"、"魚"、更に"肉"の下位ノードに"豚肉"、"牛肉"、"鶏肉"などのノードを有するツリー辞書とすることも可能である。

先ず、事業ドメインに合致する生産財商品の特徴語をドメイン辞書格納部３０２のドメイン辞書から取得し、非適合情報源ツリーの特徴語と比較して、類似度を計算する。類似度は、上記技術辞書に基づき計算し、非適合情報源ツリーと技術辞書との距離が所定の閾値以下であれば非適合情報源ツリーを事業ドメインの生産財に関する情報と判定し、適合情報源ツリーとして適合情報源ツリー格納部３０３に格納する。すなわち、非適合情報源ツリーから、事業ドメインに適合する蓋然性が高いものを抽出し、適合情報源ツリー格納部３０３へ再登録する。そして、このとき、適合情報源ツリーに昇格した非適合情報源ツリーを構成する要素単語のうち、技術辞書に登録されていない単語を技術辞書に登録することで技術辞書を増殖する。さらに、ドメイン辞書格納部３０２に登録されていない特徴語や製品名は、新たにドメイン辞書格納部３０２に追記することでドメイン辞書を増殖する。

このツリー増殖部４０１により、ドメイン辞書を用いて非適合と判定された非適合情報源ツリーを、技術辞書を用いて適合ツリーに昇格させることができる。また、ツリー増殖部４０１は、既存のドメイン辞書や技術辞書を参照し、新たに適合情報源ツリーとして適合情報源ツリー格納部３０３に加えられたツリーに含まれる主体者や特徴語が既存のドメイン辞書や技術辞書に登録されているか判定する。もし登録されていなければ、新たにドメイン辞書や技術辞書に登録することで、ドメイン辞書や技術辞書にない単語を、ドメインに適合している情報源ツリーに含まれる要素単語を用いて増殖させることができる。

従来、生産財の製品企画を行うためにも、競合他社製品のベンチマーク、技術動向、市場動向などを収集する必要がある。このため、従来であれば例えばコンサルタントと共同で社外の外部環境調査を行う必要があった。また、製品企画に役立つ情報源として、インターネット上に散在しているホームページ、営業担当者が保持しているヒアリング情報、雑誌記事などを、漏れなく収集し纏めあげる作業は労力を要する。継続的に人が行う作業であるため、調査する人の力量に大きく依存し、客観的な情報に基づいて製品企画を行うことが困難であった。このため、生産財の製品企画においては、競合他社の新製品がリリースされたが、横並びの製品であるように見えてしまい、どのような差異化要因があるのか、分かりづらいという課題があった。

このような課題に対し、本実施例にかかる情報構造化装置１０によれば、情報源から特徴語などの要素単語が抽出できるため、競合他社の新製品がどのような差異化要因を保持しているのか分かりやすくなるため、上記課題を解決することができる。また、情報源を、事業ドメイン辞書を参照するのみならず、非適合情報源ツリーと判断された情報源ツリーも技術辞書を参照することで適合情報源ツリーに昇格させることができ、情報源から漏れなく必要な情報源を抽出することができる。

図３６は、本実施例にかかる情報源価値推定部を示す図である。図３６に示すように、情報源価値推定部５００ｂは、ドメイン辞書格納部を有さず、情報源再構築部２０００の出力ではなく、グループ生成部４００の出力が供給される点が第１の実施例と異なる。その他の点は第１の実施例と同様である。本実施例のドメイン辞書格納部は、情報源選別部３００に設けられる。なお、本実施例においては、定量化装置２２は、情報源ツリーを定量化するものとして説明するが、実施例１と同様、情報源のままツリー構造とせずに扱ってもよいことは言うまでもない。企業力測定部６００ｂは、情報源ではなく情報源ツリーを受け取る以外、第１の実施例と同様である。

次に、図３７のフローチャートを参照して、本発明の第２の実施例の動作について詳細に説明する。先ず、ツリー選別部３０１は、ドメイン辞書を参照し、情報源ツリーから適合情報源ツリーを選別する方法について具体的に説明する。情報源（ニュース情報源）として、
"オプト販売が光増幅をラマン方式とする「ＦＸ４２００」をＮＥＥへ納入"
という文字列が情報構造化装置１０へ入力されるとする。情報構造化装置１０は、図３７のステップＳ１００からステップＳ３００まで実行し、図２８に示す書式解析結果を得る。ツリー生成部２０４は、この書式解析結果から図３８に示すような情報源ツリーを生成し、ツリー選別部３０１が情報源ツリーを構成する要素単語と事業ドメイン辞書とを照合する。すなわち、図２７に示すように、ツリー選別部３０１は、情報源ツリーから、行動ノードに"納入"、"採用"が含まれているか否かを検出する（ステップＳ４０１）。"納入"、"採用"が含まれており、生産財に関する情報源ツリーと判断されたツリーを構成する単語と、ドメイン辞書の各カテゴリの単語とをマッチングする（ステップＳ４０２）。そして、１つ以上、一部又は全部一致するものが存在するか否かを判定し（ステップＳ４０３）、ツリーを適合情報源ツリーとして登録する（ステップＳ４０４）。

次に、ツリーの製品名・特徴語などであって、ドメイン情報に登録がないものはドメイン辞書へ追加する（ステップＳ４０５）。次いで、適合回数が所定の割合以上であるか否かが判定され（ステップＳ４０６）、所定の条件に合致する場合には、情報源ツリーの主体者をドメイン辞書へ追加する（ステップＳ４０７）。これにより、情報源ツリーを構成する"主体者"が、事業ドメインにおける専門業者か、又は総合メーカかを区別することができる。本例においては、図２８に示す情報源ツリーを構成する要素単語と図８に示す事業ドメイン辞書とは部分一致もしないため、この事業ドメイン選別工程Ｓ４００では、入力された情報源が事業ドメインに合致しないと判定される。合致しない場合は、非適当情報源ツリー格納部３０４に当該情報源ツリーを格納する。

次に、ツリー増殖部４０１が技術辞書を参照して、非適合情報源ツリー格納部３０４の情報ツリーから事業ドメイン候補を選別することで情報源ツリーを増殖すると共に技術辞書及びドメイン辞書の単語を増殖する（ステップＳ５００）。図３９は、情報源ツリーの増殖方法を示すフローチャートである。

図３９に示すように、ツリー増殖部４０１は、先ず、図３４に示す技術辞書の全ノードと、非適合情報源ツリー格納部３０４に格納された非適合情報源ツリーの各要素単語とを照合する（ステップＳ４１１）。本例においては、特徴語"光増幅"が技術辞書の一のノードと一致するため、事業ドメイン候補として列挙される。（ステップＳ４１２）そして、この"光増幅"とドメイン辞書の特徴語"光アクセス"との距離を、技術辞書を使用して計算する（ステップＳ４１３）。この場合、"光増幅"と"光アクセス"の距離は０．６である。ここでは閾値が１．５未満を事業ドメインとすると設定されているものとすると（ステップＳ４１４）、光増幅という特徴語を含む当該情報源もツリー増殖部４０１により事業ドメインに関連するものと判定される。そして、事業ドメインに関連するものと判定された非適合情報源ツリーを、適合情報源ツリー格納部３０３に格納する（ステップＳ４１５、ステップＳ６００）。

そして、ツリー増殖部４０１は、この事業ドメインに関連するものと判定された非適合情報源ツリーに基づき、特徴語として「ラマン方式」を追加する（ステップＳ４１６）。また、ツリー増殖部４０１は、非適合情報源ツリーのうち、事業ドメインに関連するものと判定された情報源ツリーに基づき、技術辞書の光増幅ノードの子ノードとして、「ラマン方式」ノードを例えば固定距離０．１で追加する。この場合、このように自動増殖される単語については、システムの固定値を距離として設定することも可能であるが、例えば、追加する単語と、当該単語を追加される単語とのオリジナル文章（情報源）における位置関係に基づき算出すること等も可能である。また、適合回数が所定の割合以上であるか否かを判断し（ステップＳ４１７）、適合回数が所定の割合以上である場合には、ドメイン辞書の主体者として「オプト販売」を追加する。（ステップＳ４１８）。事業ドメインに合致する情報源の入力によって、自動的に事業ドメイン辞書及び技術辞書が増殖する。

次に、情報源価値推定部５００ｂが情報源ツリー及び図１４に示す単語定量化マップを参照し、企業力測定ツリーのリーフのスコア（初期スコア）を算出し、企業力計算部６０１は、その初期スコアに基づき各ノードのスコアを算出し、最上位ノードのスコア（企業力）を算出する（ステップＳ８００）。

次に、他の動作例について説明する。ここでは、未知の競合商品が未知の顧客に納入されたことを検出する例を示す。なお、本実施例においては、図４０に示す事業ドメイン辞書と、図４１に示す技術辞書を利用するものとする。

情報源のニュースとして、
"タメシタ産業、ＡＤＤＩ向け最軽量「Ｊ７０３ｉＵ」を納入"
という文字列が情報構造化装置に入力されることとする。情報構造化装置は、情報構造化装置１０と同様に、ステップＳ１００からステップＳ３００まで実行し、図４２に示す書式解析結果を得る。そして、ツリー生成部２０４が情報源ツリーを生成する（ステップＳ３６０）。次に、図４０に示す事業ドメイン辞書を参照し、この情報源ツリーが事業ドメインに属さないことを判定し（ステップＳ４００ｂ、Ｓ４１０）、図４１に示す技術辞書を参照し、この情報源が事業ドメイン候補にならないことを判定する（ステップＳ５００）。

次いで、情報源のニュースとして、
"タメシタ産業、ＡＤＤＩへＤＷＤＭ製品「ＡＤＤＩ５０００」を納入"
という文字列が情報構造化装置２０に入力されるとする。情報構造化装置２０は同様にステップＳ１００からステップＳ３００まで実行し、図４３に示す書式解析結果を得、情報源ツリーを生成する（ステップＳ３６０）。次に、"納入"や"採用"といった言葉を含む情報源が入力された場合は、ツリー選別部３０１が、図４０に示す事業ドメイン辞書を参照し、当該情報源ツリーが事業ドメインに合致した適合情報源ツリーであるか否かを判定する（ステップＳ４００）。

そして、情報源ツリーが非適合情報源ツリーである場合（ステップＳ４１０：Ｙｅｓ）、図４１に示す技術辞書を参照し、この情報源がＤＷＤＭというキーワードで一致し、事業ドメインに属する製品との特徴語と比較して、閾値以下の距離であるため、事業ドメインに属すると判定する（ステップＳ５００）。ここで、"タメシタ産業"は、事業ドメインに合致する適合情報源ツリー、及び合致しない適合情報源ツリーを有するため、事業ドメイン辞書の主体者として登録されないが、製品名及び特徴語は事業ドメイン辞書に登録される（図４４）。

そして、情報源が入力される度に、第１の実施例と同様に、適合情報源ツリーまたは非適合情報源ツリーを判別し、ステップＳ７００にて企業力測定ツリーのリーフの初期スコアを算出し、ステップＳ８００にて、企業力を再度算出する。

本実施例においては、第１の実施例と同様、製品名や競合企業、さらには顧客企業が未知であっても、事業ドメインに合致する適合情報源ツリーであるか否かを、技術辞書を用いて判定する。このため、自社にとって脅威のある納入ニュースと、そうでないものを分類することが可能である。さらに、本実施例においては、主体者を分類することができるので、必要なカテゴリの企業情報を所望のタイミングで抽出し、表示等させることができる。

本発明の第３の実施例
以下に説明する第３の実施例乃至第７の実施例においては、それぞれ波及力計算部７０
０、需要周期推定部８００、潜在購買力推定部９００、販売力推定部１０００、競争力増強部品推定部１１００を設ける。各ブロックは、それぞれ特定の企業力測定ツリーのリーフのスコアを更新する機能を備える。すなわち、波及力計算部７００は、一の情報源が競合企業の企業力に与える波及力を算出すると共に、競合企業力測定ツリーの機能特徴リーフのスコアを更新する。需要周期推定部８００は、製品の需要周期を推定すると共に、顧客企業力測定ツリーの周期リーフのスコアを更新する。潜在購買力推定部９００は、顧客企業の潜在購買力を推定し、販売可能性が高い製品の機能及び価格を推定すると共に、顧客企業力測定ツリーの製品マッチングリーフのスコアを更新する。販売力推定部１０００は、企業の販売力を推定すると共に、競合企業力測定ツリーの売り上げ実績リーフのスコアを更新する。競争力増強部品推定部１１００は、競争力に影響のある部品を推定すると共に、部品納入企業力測定ツリーの差異化リーフのスコアを更新する。なお、以下の第３乃至第７の実施例においては、グループ生成部４００が出力する適合情報源ツリーを使用して各処理を実行するものとして説明するが、情報源再構築部２００が抽出した要素単語を使用して各処理を実行することも可能である。

先ず、本発明の第３の実施例について説明する。図４５は、本実施例にかかる情報構造化装置３０を示す図である。本実施例は、過去の情報源を辿ることで、現在の情報源の影響範囲を直接記載されていない企業にまで及ばせるものである。本情報構造化装置３０は、図４５に示すように、第２の実施例における情報構造化装置２０に、定量化装置として波及力計算部７００を更に設ける構成を有する。その他の構成は、第２の実施例と同様であり、その詳細な説明は省略する。本第３の実施例は、部品メーカが技術的優位性を有することを示す例である。

図４６は、本実施例における波及力計算部７００を示すブロック図である。図４６に示すように、波及力計算部７００は、納入業者の部品納入情報源選別部７０１、納入先企業抽出部７０２、特徴語列挙部７０３、近距離用語抽出部７０４、及び波及力計算部７０５を有する。この波及力計算部７００は、情報源の影響範囲及び影響力を技術辞書を用いて推定する。情報源に含まれる特徴語が技術辞書に登録されていた場合、その特徴語と近い距離の別の特徴語を列挙する。情報源に含まれるターゲット企業が、列挙された特徴語に関連する商品を過去に開発していた場合に、技術的な距離から波及スコアを計算する。各ブロックについて詳述する。

部品納入情報源選別部７０１は、情報源ツリーの中から納入業者の部品納入情報源ツリーのみ抽出する。納入先企業抽出部７０２は、部品の納入先企業、すなわち部品を購入した競合企業を抽出し、その競合企業がリリースした製品のニュースを抽出する。特徴語列挙部７０３は、競合企業の製品リリース情報に含まれる特徴語を全て列挙する。近距離用語抽出部７０４は、部品の特徴語を含む技術用語が技術辞書にあるか調査し、ある閾値以下のものを全て列挙する。波及力計算部７０５は、特徴語列挙部７０３で列挙した単語集合と、近距離用語抽出部７０４で列挙した単語集合を比較し、一致するものがあれば納入部品が製品に採用された可能性が高いと判定する。波及力計算部７０５は、近距離用語抽出部７０４にて抽出した技術用語の距離の逆数（波及係数）と、部品納入企業力測定ツリーから求まる情報源価値を掛け合わせた波及力を、競合企業力測定ツリーを構成する機能特徴リーフの初期スコアに加算する。

このことにより、過去の情報源ツリーをたどることで、現在の情報源の影響範囲が直接記載されていない企業にまでは波及スコアを及ばせることができる。例えば、部品納入業者のニュースは、部品納入企業ツリー（図３８）という閉じた系により、初期スコアを算出していたのに対し、競合企業ツリー（図３７）に波及スコアを与える仕組みを導入することにより、すなわち、波及スコアを競合企業ツリーの機能特徴リーフに割り当てることにより、部品納入業者のニュースが競合企業ツリーのリーフ値に影響を及ぼすことができる。これらにより、情報源を事業ドメインに合致したものに分類し、合致した情報源のスコアのみを単語スコアと企業力スコアから算出することで、露出度の高い企業や商品を、新たな取引先として選別することができる。

図４７のフローチャートを参照して、本発明の第３の実施例の動作について詳細に説明する。前提として、第２の実施例の結果増殖した事業ドメイン辞書（図３４）と、技術辞書（図３１）の値を利用する。

情報源のニュースとして、
"新川電工は、ラマン方式で世界最高レベルの増幅モジュール「Ａ２００Ｒ」を開発"
という文字列が情報構造化装置５１に入力されるとする。情報構造化装置５１はステップＳ１００からステップＳ６００まで実行し、技術辞書に"ラマン方式"というキーワードがあることから、この情報源が光事業ドメイン（適合情報源ツリー）であると判定する。主体者判定部５０１は、主体者が競合企業か納入企業か又は顧客企業かを判別するため、図４９に示す主体者辞書を参照する。これにより、新川電工が納入企業であると判定し、情報源格納部５０３に、納入企業情報源ツリーとして格納する。

情報源定量化部５０４は、情報源格納部５０３の納入企業情報源ツリーを読み出し（ステップＳ４２１）、初期スコアを算出する（ステップＳ７００）。図４０に示す部品納入企業力測定ツリーと図４１に示す単語・ノード対応表を元に定量化を行う。情報源ツリーには、「開発」というキーワードがあり、図４０の単語・ノード対応表から、スコアが２倍にされることが記載されている。また、部品バリエーションリーフに０．４、開発スピードリーフに０．２、部品最高性能順位リーフに０．４の割合でスコアを分配するように記載がされている。全てのリーフは初期値として１が与えられている。事業ドメイン辞書を参照すると、過去にＡ２００Ｒという製品はないことが分かるため、新製品であることが分かり、部品バリエーションリーフは下記の計算式で求めることができる。
部品バリエーションリーフの値＝２×過去の部品バリエーションリーフの値×０．４＝２×１×０．４＝０．８
開発スピードリーフの値＝２×前回の製品リリース次期からの経過時間（月）／１２×０．２＝２×１×０．２＝０．２
部品最高性能順位リーフの値＝２×{ｅ＾{−（ｏｒｄｅｒ−１）}＋１}×０．４＝２×２×０．４＝１．６

次に、企業力計算部６０１が最終スコアを算出する（ステップＳ８００）。ここで、企業力計算部６０１は、情報源ツリーの主体者を判断し、主体者が顧客企業又は納入企業である場合にのみ最終スコアを算出する。主体者が競合企業である場合は、後述の波及力計算を行なってから最終スコアを算出する。本例においては、納入企業の情報源であるため、その最終スコアを算出する。すなわち、先ず、納入企業力測定ツリーにおける開発力ノードスコアは次のような計算式で求めることができる。
開発力＝０．８＋０．２＋１．６＝２．６
顧客利便性や信用力が初期値のまま１であり、中間ノードの係数α、β、γも値が１であったとすると、部品納入企業の企業力値は、
部品納入企業の値＝顧客利便性＋信用力＋開発力＝１＋１＋２．６＝４．６
となる。情報源の入力前では、部品納入企業の値は合計３であったため、増加分４．６−３．０＝１．６が情報源のスコア（価値）として求まる。

さらに情報源のニュースとして、
"新川電工、光増幅モジュール「Ａ２００Ｒ」をオプト販売に納入"
という文字列が情報構造化装置５１に入力された場合には、情報構造化装置５１はステップＳ１００からステップＳ４００まで実行し、図４８に示す情報源ツリーを得る。そして、技術辞書に"光増幅"というキーワードがあることから、この情報源が光事業ドメイン（適合情報源ツリー）であると判定する（ステップＳ５００、Ｓ６００）。主体者判定部５０１は、主体者が競合企業か納入企業かを判別するため、図４９に示す主体者辞書を参照する。これにより、新川電工が納入企業であると判定し、情報源格納部５０３に、納入企業情報源ツリーとして格納する。

そして、同様に、情報源定量化部５０４により初期スコアを算出し、企業力計算部６０１は主体者が競合企業以外の場合は、初期スコアに基づき最終スコアを算出する（ステップＳ７００、８００）。すなわち、主体者判定部５０１は、図２９に示す主体者辞書を参照し、主体者"新川電工"が納入企業であると判定し、情報源格納部５０３に納入企業情報源ツリーとして格納する。そして、情報源定量化部５０４は、この納入企業情報源ツリーを読み出し、図４０に示す納入企業力測定ツリーと図４１に示す単語定量化マップを元に、当該情報源ツリーの各要素単語の初期スコアを算出する（ステップＳ７００）。そして、企業力計算部６０１は、更新された初期スコアに基づき各ノードのスコアを算出する（ステップＳ８００）。

次に、波及力計算部７００により競合企業の企業力ツリーの機能特徴ノードのスコアに乗算する波及スコアを計算する（ステップＳ９００）。波及力計算部７００には、情報源価値推定部５００と同様の情報源ツリーのデータが入力される。図５０は、波及力算出方法の詳細を示すフローチャートである。先ず、部品納入情報源選別部７０１が適用情報源ツリーの集合から納入元企業（納入企業）の情報源ツリーを選別する（ステップＳ４２１）。次いで、納入先企業抽出部７０２は、抽出した情報源ツリーの主体者（納入元企業）の納入先企業（競合企業）に関する製品ニュースの情報源があるか否かを、適合情報源ツリー格納部３０３にて検索する（ステップＳ４２２）。ここでは、"新川電工"の納入先である"オプト販売"に関する製品ニュースがあるか否かを検索する。そして、"オプト販売は、μレーザを用いたロスレス光伝送装置「ＦＸ５０００」を開発"の情報源があることを発見する。そして、特徴語列挙部７０３は、Ｓ４２２にて抽出された情報源（製品ニュース）から特徴語を抽出する（ステップＳ４２４）。ここでは、"μレーザ"、"ロスレス伝送装置"の特徴語を抽出する。

一方、近距離用語抽出部７０４は、技術辞書格納部４０２の技術辞書を参照し、Ｓ４２１で選別した納入元企業の情報源ツリーに含まれる特徴語と部分一致、又は完全一致の単語があるか否かを検索する（ステップＳ４２３）。ここでは、情報源ツリーにおける"光増幅モジュール"が図３１に示す技術辞書に存在するか探索し、"ＤＷＤＭ"ノードの子ノードに"光増幅"ノードが存在することがわかる。これにより、光増幅の向上が、ＤＷＤＭの向上になることが判明する。すなわち、技術辞書において、上位要素は下位要素から構成されるため、下位要素で優れた部品があれば、それに伴い上位要素の製品の差異化につながる。そして、部分一致又は完全一致した単語との距離が所定の閾値以下の単語を抽出する（ステップＳ４２５）。ここでは、"光増幅"から距離１．５以下を抽出するものとすると、"ＤＷＤＭ"（距離０．３）、"光アクセス"（距離０．６）、"光伝送装置"（距離１．３）の３つが抽出される。

波及力計算部７０５は、特徴語列挙部７０３が列挙した特徴語と、近距離用語抽出部が列挙した技術単語とを比較し（ステップＳ４２６）、一部又は全部が一致するものがあるか否かを判定し（ステップＳ４２７）、一致するものがある場合は、その波及スコアを計算する。ここでは、ステップＳ４２４で列挙された"ロスレス伝送装置"と、ステップＳ４２５で列挙された"光伝送装置"とにおいて。"伝送装置"で一致する。一致した場合、一致した記述単語と、情報源ツリーの単語と一致した技術用語との距離の逆数が波及係数となる。波及係数は、納入企業の情報源の価値に乗算され、この値が納入先企業（競合企業）の企業力測定ツリー（図３９）における機能特徴リーフのスコアに加算される。すなわち、波及力計算部は、ステップＳ４２８にて、"光増幅"ノードと"光伝送装置"ノードとの距離１．３の逆数≒０．７７を求める。
波及力＝競合企業測定ツリーの機能特徴リーフの増加分スコア＝波及係数×部品納入企業の情報源のスコア（価値）＝０．７７×１．６＝１．２３２

こうして、機能特徴リーフの初期スコア１に波及力１．２３２が加算されて更新され、この更新された初期スコアに基づき、企業力計算部６０１が情報源のスコアを算出する。

本実施例においては、主体者企業辞書を用いることで生産財メーカ企業と部品メーカ企業を区別し、部品の特徴語から性能順位を推定するため、部品業者の技術優位性を測定することが可能になっている。また、部品の技術優位性のニュースと納入先（競合企業）のニュースを複合して評価するため、部品を採用している企業の技術優位性も更新することができる。さらに、波及力により競合企業の機能特徴リーフを増加させ、競合企業の企業力に影響を及ぼすことができる。

なお、本実施例においては、適合情報源ツリーから波及力を算出するものとして説明したが、波及力計算部７００が技術辞書又は事業ドメイン辞書を参照し、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。

本発明の第４の実施例
次に、本発明の第４の実施例について説明する。本実施例は、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定するものである。上述の第４の実施例は、企業をフォーカスし、どの企業が活発に活動しているか等の企業力を測定するものであったのに対し、本実施例においては、商品にフォーカスをあて、どのような商品が売れているかを知ることで、例えば第３の実施例のどのような企業が活発かという情報と共に、商品開発にあたり、どのような視点をもって商品をつくるかを分析することができる。

図５１は、本実施例における需要周期を示す図である。横軸に時間、縦軸に需要をとればある商品の需要周期を表すことができる。ここで、情報源から、ある商品Ｐを競合企業が納入した量Ｄ１及びある商品を顧客企業が購入した量Ｄ２を抽出し、両者を加算すれば、そのときの商品Ｐの需要がわかる。なお、加算する際には、競合企業の納入先が購入した顧客企業である場合を除いている。また、納入実績や購入実績などからどの企業が活発に活動しているかも判断することができ、本実施例においては、これらの情報を合わせて表示部に表示することが可能である。

図５２は、本発明の第４の実施例にかかる情報構造化装置４０を示す図である。本情報構造化装置４０は、図５２に示すように、第３の実施例における情報構造化装置３０に、定量化装置４２として需要周期推定部８００を更に設ける構成を有する。その他の構成は、第３の実施例と同様であり、その詳細な説明は省略する。本実施例は、商品需要を推定すると共に、その推定結果を、図３８に示す顧客企業力測定ツリーの周期リーフに反映させる。

図５３は、本実施例における需要周期推定部８００を示すブロック図である。図５３に示すように、需要周期推定部８００は、製品採用情報選別部８０１、製品納入情報選別部８０２、重複検知部８０３、月間累計カウンタ８０４、及び商品需要表示部８０５を有する。

需要周期推定部８００は、顧客企業と競合企業のニュースが、市場全体の需要を予測するデータを生成するように動作する。分析した月におけるグラフの勾配に対し、ｓｉｎ関数を適用した値を、顧客企業力測定ツリーの周期リーフの値として採用する。

すなわち、需要周期推定部８００の製品採用情報選別部８０１及び製品納入情報選別部８０２が、それぞれ顧客の生産財購入・採用ニュースと、競合他社の生産財販売・納入実績ニュースを、情報源格納部５０３から抽出する。重複検知部８０３は、製品採用情報選別部８０１が情報源格納部５０３から抽出した情報源ツリーに含まれる採用製品及び納入元を抽出し、製品納入情報選別部８０２が情報源格納部５０３から抽出した情報源ツリーに含まれる納入商品及び納入先を抽出し、製品名が一致するか否か、納入先と納入元が一致するか否かを判断する。同じ製品か否かの判定は、技術辞書の最上位ノードの子供ノード（ＤＷＤＭ又はＳＯＮＥＴ／ＳＤＨ）以下の特徴語を含むか否かで判定することができる。一致する場合は、その分の製品納入量（採用量）を全体の納入量（採用量）から減じる。月間累計カウンタ８０４は、重複検知部８０３の検知結果に基づき、横軸に時間推移を、縦軸に同じ商品グループに分類されている商品の売り上げ実績をプロットし、図５１に示すような商品需要周期グラフを生成する。これによって、周期的に発生する生産財の置き換え需要の傾向を予測し、これを商品需要表示部８０５にて表示することにより、ある商品グループの需要が下がっているのか、上がっているのかを製品毎に提示することができる。

さらに、企業力計算部６０１は、この需要勾配の数値を顧客企業力測定ツリーの周期の初期スコアに置き換える。需要周期推定部８００によって、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定することができる。従来、競合他社のどの製品がどれだけ売れているのか、分かりづらく、また、顧客の反応が直接見えないため、どのような需要があるのか分かりづらいという課題があったが、本実施例によりこれを解決する。

図５４のフローチャートを参照して、本発明の第４の実施例の動作について詳細に説明する。
"ＮＥＥ、オプト販売の「ＦＸ４２００」をアメリカ〜日本のバックボーン回線に採用"
というニュースが到着したとする。ＮＥＥは顧客企業であるため、製品採用情報選別部８０１により、この情報源格納部５０３からこの製品採用情報源ツリーが検出され（ステップＳ４３１）、採用製品及び納入元が列挙される（ステップＳ４３２）。本例では、採用製品が"ＦＸ４２００"で、納入元は"オプト販売"となる。次に、製品納入情報選別部８０２が情報源格納部５０３に格納されている過去の情報源から、競合企業の製品納入情報源ツリーとして
"オプト販売が光増幅をラマン方式とする「ＦＸ４２００」をＮＥＥへ納入"
を検出し（ステップＳ４３３）、その納入商品の納入先を列挙する（ステップＳ４３４）。本例では、納入商品が"ＦＸ４２００"で、納入先が"ＮＥＥ"となる。

次いで、重複検知部８０３により、製品名、納入先、納入元が一致しているか判定される。全て一致の場合は、２つの情報源が重複したと判定する。本例では製品名が一致ため、２つの情報は１つの売り上げ（製品販売）として月別需要に加算する（ステップＳ４３６）。製品名、納入先、納入元のいずれも一致しない場合は、別個の需要・供給として月別需要に加算する（ステップＳ４３８）。同様に顧客企業の採用情報、及び競合企業の納入情報で製品売り上げを月別に計上する。例えば、４月が５売り上げ、５月が６売り上げ、６月が５売り上げという結果になったとする。この場合、４月から６月までの３ヶ月の売り上げ結果（需要）を用いてベジエ曲線を描く（ステップＳ４３７）。本例では、５月の増加率はｓｉｎ（ＢｅｚｉｅｒＦｕｎｃｔｉｏｎ（５，６，５））＝ｓｉｎ（０）＝０となる。すなわち、需要は横ばい傾向であることが推定できる。このベジエ曲線を商品需要表示部８０５により表示する。

本実施例においては、顧客に関する情報と競合他社に関する情報を組み合わせ、及び情報源の等価性を用いることで商品需要の推定が可能となる。すなわち、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定することができる。

なお、本実施例においては、適合情報源ツリーを用いて需要周期を推定するものとして説明したが、需要周期推定部８００がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。

本発明の第５の実施例
次に、本発明の第５の実施例について説明する。図５５は、本発明の第５の実施例にかかる情報構造化装置５０を示す図である。本実施例は、財務諸表と、顧客の生産財購入履歴、又は競合他社の販売実績から、顧客の潜在購買力を推定し、優良顧客を推定するものである。本実施例にかかる情報構造化装置５０は、図５５に示すように、第４の実施例における情報構造化装置４０に、定量化装置５２として潜在購買力推定部９００を更に設ける構成を有する。その他の構成は、第４の実施例と同様であり、その詳細な説明は省略する。

図５６は、本実施例における潜在購買力推定部９００を示すブロック図である。図５６に示すように、第４の実施例における需要周期推定部８００の製品採用情報選別部８０１、製品納入情報選別部８０２、及び重複検知部８０３と共に潜在購買力推定部９００を構成する。潜在購買力推定部９００は、さらに、他社製品特徴語選別部９０４、自社類似製品選別部９０５、他社製品採用顧客選別部９０６、財務情報取得部９０７、投資実績計算部９０８、投資類似度計算部９０９、顧客集合選別部９１０、及び他社製品未採用顧客選別部９１１を有する。

この潜在購買力推定部９００は、顧客の財務諸表から資産余裕度を算出するとともに、生産財の購買履歴を重ね合わせることで、どの資金レベルでどのような特徴の生産財を購入する顧客であるのか、購買特性を提示する。顧客企業の資金面の投資姿勢と、実際に購入した商品から、自社製品の販売がしやすい顧客企業を指標化し、企業力更新部が顧客企業の製品マッチング特性に加算する。このことにより、自社にとっての優良顧客のランキングを行い、財務諸表と、顧客の生産財購入履歴、又は競合他社の販売実績から、顧客の潜在購買力を推定することができる。これは、従来、生産財を購入する余力のある潜在的な顧客と、従来から取引関係にある顧客のどちらを優先すべきか分かりづらいという課題を解決する手段となる。

図５７は、各企業の納入・購買実績のある商品の特徴を示す図である。図５７では、一般に機能が高くなるほど、価格も高くなるものとしている。この情報構造化装置６１を使用して構造化された情報を取得する企業を企業Ａとする。企業Ａは競合企業に属するものとする。顧客ａはそれよりも低機能で低価格の製品を製造しており、顧客ｂは更に低機能で低価格の製品を製造している。競合企業Ｂ、Ｃは、企業Ａとは異なる価格帯、機能の製品を製造し、それぞれ納入実績があるものとする。ここで、顧客企業が求めている機能及び価格の製品を製造しなければ製品を売ることができない。また、ライバル企業が既に製造し、納入実績がある製品と同様の製品は、既に製造されているため販売できる可能性が低い。すなわち、顧客企業が求めている機能及び価格であって、他の競合企業が製造していない製品を製造すれば販売できる可能性が高い。例えば、企業Ａが高機能、高価格の製品を製造しようと計画する際に、この情報構造化装置６１を使用して分析を行なうことで、より販売できる可能性が高い機能及び価格のものに製品を見直すことができる。

図５６に戻って、製品採用情報選別部８０１は、情報源ツリーの中から、顧客企業の製品採用情報源ツリーを選別する。製品納入情報選別部８０２は、情報源ツリーの中から、競合企業の製品納入情報源ツリーを選別する。重複検知部８０３は、顧客企業の製品採用情報源ツリーと製品納入情報源ツリーの等価性を計算し、同じものと判定された場合には、どちらか一方の情報源ツリーを破棄する。

次に、他社製品特徴語選別部９０４は、顧客に採用実績のある製品の特徴語を情報源ツリーの中から抽出する。自社類似製品選別部９０５は、競合他社の採用実績のあった製品の特徴語を自社製品がもっているか否かを判定し、持っていればその自社製品をピックアップする。他社製品採用顧客選別部９０６は、主体者辞書から顧客リストを取り出すと共に重複検知部９０３から得た情報源ツリーのうち、他社製品を採用した顧客企業を製品別に列挙する。一方、財務情報取得部９０７は顧客企業の公開された財務情報を取得する。例えば四半期又は半期毎に公開される企業の財務報告書から財務情報を抽出したり、情報源の中に含まれる財務情報を抽出することで得ることができる。または、外部から入力するようにしてもよい。投資実績計算部９０８は固定資産への投資額を計算する。投資類似度計算部９０９は、固定資産／流動資産で求めた基準（投資姿勢）で顧客企業をソートする。顧客集合選別部９１０は、他社製品を購入した顧客リストと全ての顧客の投資姿勢リストを入力とし、投資姿勢が類似しており、他社製品を購入していない顧客を選別する。この場合、他社製品を採用した企業の前後１社ずつを全て列挙する。

他社製品未採用顧客選別部９１１は、また、納入実績のある他社製品の特徴語と自社製品の特徴語を比較し、機能類似度を（部品・完全マッチする語数／他社製品と自社製品の前特徴語数）によって算出する。また、投資姿勢類似度を１−ｅ＾（−（／|固定資産／流動資産−固定資産／流動資産|））で計算し、それぞれ掛け合わせた値を、図３８に示す顧客企業力測定ツリーの製品マッチングリーフの初期スコアとする。

図５８は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。図５９は、本実施例の情報構造化装置により作成される表である。本実施例は、登録されている全顧客企業から、どのような製品が購入される蓋然性が高いかを推定し、その製品を購入する蓋然性が高い企業を選別する。まず、財務情報取得部９０７が図２９示す主体者辞書から顧客企業リストを取得し、その顧客企業、例えば"ＡＴＴ"、"リアル通信"、"ＯＶＯＰ"の財務諸表を得る（ステップＳ４４５）。具体的には、財務情報取得部９０７は、それぞれの顧客企業の固定資産及び流動資産を取得する。それぞれ固定資産が１０億、４０億、３０億で、流動資産が１０億、６０億、５０億であったとする。次に、投資実績計算部９０８は、各企業の固定資産への投資実績比率を固定資産／流動資産で求める。ここでは、１．０，０．６７，０．６と求まる（ステップＳ４４６）。そして、投資類似度計算部９０９が各顧客企業をこの投資姿勢の値でソートすると（ステップＳ４４７）、図５９に示すように、「ＯＶＯＰ（０．６）」「リアル通信（０．６７）」「ＡＴＴ（１．０）」の順となる。

一方、他社の納入・採用ニュースとして、それぞれ製品納入情報選択部９０２、製品採用情報選択部９０１により、
"オリオン、光アクセス製品の「ＯＲ２５００」をＯＶＯＰに納入"、
"ＡＴＴ、日本光伝送のメトロ製品「ＢＢ−Ｐ０１２」を採用"
というニュースから生成される情報源ツリーを新たに情報源格納部５０３から選択する（Ｓ４４１）。重複検知部９０３でこれらの情報源ツリーの重複検査をした後、他者製品特徴語選別部９０４により、前者の特徴語として"光アクセス製品"、後者の特徴語として"メトロ製品"を抽出する（Ｓ４４２）。次いで、自社類似製品選別部９０５は、情報源格納部５０３より、過去の自社製品のリリースニュース
"日本電気、光アクセス製品「ＤＷ４０００」を発売"
を選択し、"ＤＷ４０００"を抽出する。自社類似製品選別部９０５は、ＤＷ４０００の特徴語と、ＯＲ２５００、ＢＢ−Ｐ０１２の特徴語とを比較し、ＤＷ４０００が他社の納入実績のある製品と類似すると判断する。これにより、ＤＷ４０００は納入しやすい製品であることが推定される（ステップＳ４４３）。

次に、他社製品採用顧客選別部９０６は、納入実績がある納入先企業として、"ＯＶＯＰ"や"ＡＴＴ"を記憶する。また、リアル通信が採用したニュースがなく、かつ競合企業が納品したニュースがないことから、"リアル通信"は実績がない状態と判定する（Ｓ４４４）。顧客集合選別部９１０は、投資類似度計算部９０９にてソートされた結果と、他社製尾品採用顧客選別部９０６にて採用された製品情報とが入力され図５９のような表を作成する。この表より、"リアル通信"は投資実績比率が０．６７で、"ＯＶＯＰ"と投資姿勢が類似していることが分かる。顧客集合選別部９１０は、この表において購入実績を有する顧客企業及びその前後１社を抽出して他社製品未採用顧客選別部９１１に入力する。本例の場合は、全ての顧客企業の情報がそれに該当する。他社製品未採用顧客選別部９１１には、自社類似製品選別部９０５より採用実績のある他社製品と類似の特徴を有する製品情報が供給され、表の自社製造の可否の欄が記述される。

これにより、"ＯＶＯＰ"は自社製品と同様の特徴語を有する光アクセス製品を購入済みであることが分かる。一方、リアル通信は、製品購入実績がなく、かつＯＶＯＰと投資姿勢が類似している。すなわち、リアル通信は、投資姿勢の類似しているＯＶＯＰが採用した製品を採用する可能性が高い。よって、"リアル通信"は自社製品の"ＤＷ４０００"の販売候補先として有力な企業となる。他社製品未採用顧客選別部９１１は、このような他社製品を採用した顧客企業と投資姿勢が似ており、かつ他社製品を未だ採用していない別の顧客企業を抽出して図示せぬ表示部等に表示する（ステップＳ９１１）。

また、他社製品未採用顧客選別部９１１は、顧客企業"リアル通信"の図３８に示す顧客企業力測定ツリーの製品マッチングリーフの値を下記のように算出する。
機能類似度＝（部品・完全マッチする語数／他社製品と自社製品の前特徴語数）＝１／１
投資姿勢類似度＝１−ｅ＾（−（１／|固定資産／流動資産−固定資産／流動資産|））＝１−ｅ（−（１／|４０／６０−３０／５０|））＝１−ｅ＾（−０．０７）≒１
製品マッチングリーフのスコア＝機能類似度×投資姿勢類似度＝１
以上により、顧客企業力ツリーの製品マッチングの初期スコアを１に更新する。

なお、本実施例においては、適合情報源ツリーを用いて潜在購買力を推定するものとして説明したが、潜在購買力推定部９００がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。また、潜在購買力推定部９００は、自社製品と他社製品の特徴語を比較するため、情報源を適合情報源又は非適合情報源に分離しなくても本実施例を適用可能である。

本実施例によれば、顧客企業の投資意欲を公開されている財務諸表のうち、固定資産と流動資産を用いることで、顧客の投資姿勢の類似度を計算し、また顧客や競合他社の納入・採用実績ニュースから自社製品の受容性がありそうな未納入の企業を列挙するため、自社の製品を販売しやすい顧客の推定が可能となる。また、顧客企業の企業力をより正確に求めることができる。

本発明の第６の実施例
次に、本発明の第６の実施例について説明する。図６０は、本発明の第６の実施例にかかる情報構造化装置６０を示す図である。本実施例は、生産財の開発履歴と販売実績履歴を結びつけ、競合企業の収益性を推定するものである。本情報構造化装置６０は、図６０に示すように、第５の実施例における情報構造化装置５０に、定量化装置５２として販売力推定部１０００を更に設ける構成を有する。その他の構成は、第５の実施例と同様であり、その詳細な説明は省略する。この第６の実施例は、競合企業の販売力を推定する例である。

図６１（ａ）及び図６１（ｂ）は、それぞれ販売力と販売までの期間の関係、販売力と機能の関係を示すグラフ図である。図６１に示すように、一般に、販売時期−開発完了（リリース）時期が短い方が販売力が高いと見ることができる。また、一般に機能が低いのに売れた場合は、機能が高くて売れた場合より販売力が高いと見ることができる。なお、機能は、単位価格当たりの機能、又は価格とすることも可能である。単位価格当たりの機能が少なくて売れている場合や、単位価格当たりの価格が高いのに売れている場合、販売力が高いと見ることができる。本実施例においては、このような製品の機能及び期間の情報に基づき、企業の販売力を推定する。

図６２は、本実施例における販売力推定部１０００を示すブロック図である。図６２に示すように、第４の実施例における需要周期推定部８００の製品採用情報選別部８０１、製品納入情報選別部８０２、及び重複検知部８０３と共に販売力推定部１０００を構成する。販売力推定部１０００は、さらに製品別特徴語収集部１００４、製品開発情報選別部１００５、平均特徴語数算出部１００６及び競合製品販売率算出部１００７を有する。

販売力推定部１０００は、競合企業の営業力を予測するデータを生成するように動作し、競合企業の生産財開発リリースニュースと、その商品の納入実績ニュース、又は顧客の採用実績ニュースから販売力を計算する。

先ず、製品別特徴語収集部１００４は競合商品ごと情報源をまとめ、各情報源に含まれる特徴語をカウントし、製品ごとの累計特徴語数αｉ（ｉは任意の製品）を求める。平均特徴語数算出部１００６は、全ての製品の累計特徴語数と製品数から、１製品あたりの平均特徴語数βを算出する。平均数を求めることで、製品別特徴語収集部１００４が収集した特徴がその業界の製品にとって多いのか少ないのかが判別することができる。

次に、製品採用情報選別部８０１及び製品納入情報選別部８０２が、それぞれ顧客の生産財購入・採用ニュースと、競合他社の生産財販売・納入実績ニュースのみを、情報源格納部５０３から抽出する。重複検知部８０３は、製品採用情報選別部８０１が情報源格納部５０３から抽出した情報源ツリーに含まれる採用製品及び納入元を抽出し、製品納入情報選別部８０２が情報源格納部５０３から抽出した情報源ツリーに含まれる納入商品及び納入先を抽出し、製品名が一致するか否か、納入先と納入元が一致するか否かを判断することで納入ニュースと採用ニュースの等価性を判断する。重複があればそれを破棄する。製品開発情報選別部１００５は、重複検知部８０３から製品ごとのリリース時期及び販売量を受け取り、比率γｉ＝（売り上げニュース数）／（納入時期−リリース時期）を算出する。これは、図６１（ａ）に対応する。

競合製品販売率算出部１００７は、平均特徴語算出部１００６からのαｉ、βと、製品開発情報選別部１００５からのγｉとから、平均特徴語数／累計特徴語数×採用ニュース数／（納入時期−リリース時期）によって算出される販売率（販売力）を算出する。β／αは、その値が大きいほど機能が少ない、すなわち魅力が少ない商品を表す。β／α×γｉが大きいと、魅力がないのにも関わらず販売までの期間が短いことを示し、すなわち、販売力が高いことを示す値となる。

この指標を企業力計算部６０１が競合企業力測定ツリーの売り上げ実績リーフに加算する。また、図６１（ａ）に示すように、横軸に開発から販売までにかけた時間を、縦軸に売り上げ実績をプロットすることで、開発した商品を如何に効率よく販売に結び付けられているのかを図示せぬ表示部などにより提示することができる。このことにより、生産財の開発履歴と販売実績履歴を結びつけ、競合企業の収益性を推定することができる。そして、本実施例においては、競合他社の製品開発力と、自社の製品開発力の差が分かりづらいという従来の課題を解決する。

次に図６３のフローチャートを参照して、本実施例の動作について詳細に説明する。先ず、製品別特徴語収集部１００１が各競合商品のリリースニュースについて特徴語数を計測する。
"オプト販売は、μレーザを用いたロスレス光伝送装置「ＦＸ５０００」を開発"
というリリースニュースが８月に格納された場合、製品別特徴語収集部１００１は、特徴語として"μレーザ"、"ロスレス光伝送装置"の２つ（αｉ＝２）を収集する。こうして全ての競合製品について特徴語数をそれぞれ収集する（ステップＳ４５１）。そして、平均特徴語算出部１００２が、特徴語数を調査対象なった競合製品数で割る（ステップＳ４５２）。この場合、平均β＝１．４という値が得られるとする。次に、
"オプト販売、「ＦＸ５０００」をＡＴＴに納入"、
"オプト販売、ロスレス光伝送の「ＦＸ５０００」をリアル通信に納入"
といったニュースが追加され、それぞれ１０月、１１月に格納されたとすると、製品採用情報選別部８０１、製品納入情報選別部８０２、及び重複検知部８０３により、この情報源から製品の情報を抽出する。そして、各競合商品について、納入・採用ニュース数を計算する（ステップＳ４５４）。

次に、製品開発情報選別部１００５は、ｉを製品の番号として
比率γｉ＝売り上げニュース数／（納入時期−開発時期）
を算出する。本例の場合は、１０月、１１月に納入された売り上げニュース数が各１であるため、
比率γｉ＝１／（１０−８）＋１／（１１−８）≒０．５＋０．３＝０．８
となる（ステップＳ４５５）。そして、競合製品販売率算出部１００７は、
販売力＝Σβ／αｉ×γｉ
を求める。本例において、"ＦＸ５０００"の販売率は、１．４／２×０．８＝０．５６と求まる。営業販売力の特性として、特徴のない製品を開発してからすぐに納入した場合、高くなるという傾向がある。競合製品販売率算出部１００７は、この販売力の値を競合企業力測定ツリーの売り上げ実績リーフに加算する。

なお、本実施例においては、適合情報源ツリーを用いて販売力を推定するものとして説明したが、販売力推定部１０００がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。また、販売力推定部１０００は、製品の平均特徴語数を利用するため、情報源を適合情報源又は非適合情報源に分離しなくても本実施例を適用可能である。

本実施例においては、開発製品の特徴数、その平均値、売り上げニュース数及び当該開発製品の開発から納入までの期間を指標として使用することで競合企業の販売力の推定が可能となる。また、求めた販売力を競合企業力測定ツリーの売り上げ実績リーフの値とすることで、競合企業力を販売力を加味した値に更新することができ、正確に推定することができる。

本発明の第７の実施例
次に、本発明の第７の実施例について説明する。図６４は、本発明の第７の実施例にかかる情報構造化装置７０を示す図である。本実施例は、顧客に採用されている生産財商品と、商品開発メーカへ納入されている部品を結びつけ、どの部品が商品の競争力となっているのか推定するものである。本情報構造化装置７０は、図６４に示すように、第６の実施例における情報構造化装置６０に、定量化装置７２として競争力増強部品推定部１１００を更に設ける構成を有する。その他の構成は、第６の実施例と同様であり、その詳細な説明は省略する。第７の実施例は、優良部品を推定する例である。

図６５は、本実施例における競争力増強部品推定部１１００を示すブロック図である。図６５に示すように、競争力増強部品推定部１１００は、部品採用率上位企業選別部１１０１、競合企業製品納入実績計測部１１０２、及び部品貢献率算出部１１０３を有する。この競争力増強部品推定部１１００は、上述した製品採用情報選別部８０１、製品納入情報選別部８０２及び重複検知部８０３の出力結果を利用している。

競争力増強部品推定部１１００は、部品納入実績のニュース又は競合企業の部品採用ニュースと、競合企業の製品売り上げ実績又は顧客の商品採用実績を用いて、ある部品が競合企業の製品に組み込まれ、最終的に顧客へ販売された率を計算する。この指標は競争力増強部品推定部１１００により、納入企業力測定ツリーの差異化リーフの初期スコアに加算するために企業力推定部６００に入力される。また、横軸に納入した部品を、縦軸に顧客への納入実績をプロットすることで、どの部品が競争力を生み出す源泉となっているのかを提示する。このことにより、顧客に採用されている生産財商品と、商品開発メーカへ納入されている部品を結びつけ、どの部品が商品の競争力となっているのか推定することを実現する。これは、他社製品が採用している技術優位性が高い部品はどのようなものか分かりづらいという従来の課題を解決し、顧客に採用されている商品と、そのメーカに納入されている部品のマッピングを提示し、競争力の高い部品を抽出する。

部品採用率上位企業選別部１１０１は、納入業者の部品を採用している競合企業のうち、納入業者の部品占有率が高い企業を上位２社選択する。例えば、部品納入業者Ａ１の販売実績ニュースと、納入先競合企業Ｂ１の採用ニュースから部品占有率を算出する場合について説明する。例えば納入先競合企業Ｂ１が納入業者Ａ１の部品を採用したことを３回リリースし、納入先競合企業Ｂ１が別の納入業者Ａ２の部品を採用したことを１回リリースしたら、部品納入業者Ａ１にとって部品占有率が高い競合企業は納入先競合企業Ｂ１であることが分かる。

競合企業製品納入実績計測部１１０２は、各企業が開発した製品の顧客企業への採用率を、
採用率α＝採用実績製品数／開発製品数
によって算出する。競合企業に納品してもそれを使用した製品が顧客企業に納品されていなければ、当該部品は採用されていないことになる。

部品貢献率算出部１１０３は、競合企業に納入した部品の関係性から、ｉを製品種別とすると
貢献率Ｐｉ＝１／納入部品種数×採用率
で計算する。残りの上位１社に対しても同様に貢献率を算出し、前出の貢献率へ加算する。納入企業が保有する全ての部品について計算する。計算結果は、企業力計算部６０１に入力され、部品納入企業力測定ツリーの差異化リーフの初期スコアとして採用される。

図６６のフローチャート及び図６７のニュース関係図を参照して、本発明の第７の実施例の動作について詳細に説明する。利用するニュースは、
"新川電工が高濃度のμレーザを開発"、
"新川電工、小型の光増幅モジュールを開発"、
"新川電工は光クロスコネクト（ＸＣ）部品の供給を開始"
という新川電工の開発関係のニュース３件、
"新川電工、オリオンにμレーザを納入"、
"オリオン、新川電工の光増幅モジュールを全面的に採用"
という競合企業であるオリオンに対する部品供給ニュース２件、
"新川電工、日本光伝送にμレーザを納入"、
"新川電工、日本光伝送に光増幅モジュールを納入"、
"新川電工、ＸＣ部品を日本光伝送に納入"
という競合企業である日本光伝送に対する部品提供ニュース３件、
"新川電工、サクラ通にμレーザを納入"
という競合企業であるサクラ通に対する部品納品ニュース１件、
"オリオン、キャリアのＡＴＴにメトロ製品を納入"、
"リアル通信、オリオンのＤＷＤＭ部を採用"
という顧客企業のオリオン製品の採用ニュース２件、
"日本光伝送、メトロ製品をＯＶＯＰに納入"
という顧客企業の日本光伝送製品の採用ニュース１件、
"サクラ通、アクセス製品のＡＸ−１０００をＡＤＤＩに納入"
という顧客企業のサクラ通製品の採用ニュース１件である。これらのニュース関連図を示すと図６７となる。

部品採用率上位企業選別部１１０１が納入部品ごとに納入先の競合企業を列挙する（ステップＳ４６１）。上記例においては、納入先の競合企業は、"オリオン"、"日本光伝送"、"サクラ通"が列挙される。そして、"新川電工"からの部品納入が多い企業は上位から、"日本光伝送"（３）、"オリオン"（２）、"サクラ通"（１）となり、このうち部品採用率上位企業選別部１１０１は上位２社を選択する（ステップＳ４６２）。競合企業製品納入実績計測部１１０２は、上位２社の顧客への納入実績ニュースを抽出する（ステップＳ４６３）。本例では、
"オリオン、キャリアのＡＴＴにメトロ製品を納入"、
"リアル通信、オリオンのＤＷＤＭ部を採用"
の２件、及び
"日本光伝送、メトロ製品をＯＶＯＰに納入"
となる。

一方、競合企業製品納入実績計測部１１０２は、顧客への採用実績ニュース数を各部品ごとに算出する（ステップＳ４６４）。すなわち、部品が競合企業を経て、顧客へ到達するパスを列挙する。"μレーザ"に関しては、オリオン→ＡＴＴ／リアル通信の２件と、日本光伝送→ＯＶＯＰの１件が該当する。同様に光増幅も３件、ＸＣは１件となる。オリオンの自社製品を３種類、日本光伝送の自社製品を２種類だとすると、オリオンが顧客に収めた実績は２種類の製品であるため、競合企業製品納入実績計測部１１０２は、採用率α（オリオン）＝採用実績製品数／開発製品数＝２／３、α（日本光伝送）＝１／２を求める（ステップＳ４６５）。

次に、部品貢献率算出部１１０３は、競合企業に収めた実績のある各部品について貢献率Ｐｉ＝α×（１／全部品）を計算する（ステップＳ４６６）。本例では、"オリオン"に納入されている製品は、"μレーザ"と"光増幅"の２つであるため、部品貢献率算出部１１０３は、下記のようにして部品貢献率Ｐｉを求める。
Ｐｉ（μレーザ）＝（２／３）×１／２＝１／３、
Ｐｉ（光増幅）＝（２／３）×１／２＝１／３
同様に日本光伝送に納入されている部品は、３種類であるため、
Ｐｉ＋１（μレーザ）＝（１／２）×１／３＝１／６、
Ｐｉ＋１（光増幅）＝（１／２）×１／３＝１／６、
Ｐｉ＋１（ＸＣ）＝（１／２）×１／３＝１／６
となる。各企業ごとに算出した貢献率を、製品ごとに合計すると、
Ｐ（μレーザ）＝１／３＋１／６＝１／２、
Ｐ（光増幅）＝１／２、
Ｐ（ＸＣ）＝１／６
となる（ステップＳ４６７）。よって、製品をこの値でソートすると、"μレーザ"、"光増幅"、"ＸＣ"の順となり、新川電工の製品のお勧めは"μレーザ"又は"光増幅"となる。

なお、本実施例においては、適合情報源ツリーを用いて競争力増強部品を推定するものとして説明したが、競争力増強部品推定部１１００がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。

本実施例においては、関連ニュースの関係および納入実績を部品納入業者、競合企業、顧客企業の範囲で指標化することで、実績ベースの優良部品の推定が可能となる。また、求めた貢献率は、部品納入企業力測定ツリーにおける差異化リーフの初期スコアに置き換えられることで、部品の販売実績等の良否を反映した企業力の推定が可能となる。

以上、説明した本発明の第１乃至第７の実施例は下記の効果を奏する。すなわち、第１の効果は、未知の製品が事業ドメインと合致している競合商品であるかどうか、自動的に判定できることである。その理由は、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった競合製品を発見し、購入対象として提示することができるためである。さらに、過去の製品リリースニュース履歴、事業ドメインに合致していない製品をリリースする総合企業と、事業ドメインに合致した製品のみをリリースする専門業者を分類することによって、誤って異なる事業ドメインの新製品と判定することを低減する。

第２の効果は、事業ドメインに合致した競合企業を発見し、専門業者と総合メーカを区別できることである。その理由は、事業ドメインで普遍的な技術辞書を用いて、新製品リリースニュースの特徴語と比較するため、製品が事業ドメインに合致していることが判明し、さらに開発した企業名も取得できるからである。さらに、競合企業が扱う製品が事業ドメインに属する割合を計測し、閾値以上の割合で事業ドメインに合致する製品をリリースしているか判定できるからである。

第３の効果は、事業ドメインに合致した顧客企業を発見できることにある。その理由は、過去の製品納入ニュースから、事業ドメインの生産財を購入する企業を列挙し、まとめて提示することができるためである。これによって、過去に直接的に取引のない顧客を発見することができる。また、顧客企業の財務諸表を準備しておくことで、顧客の投資姿勢や余裕資金などを元に、優良顧客度合いを計算することで、どの顧客が生産財を購入しやすいか判定することができる。

第４の効果は、事業ドメインに関連したキーワードを自動収集できることにある。その理由は、事業ドメインに属すると判定した情報源から、同時に出現する単語動詞を関連の深い単語として記憶できるからである。新しい競合製品の特徴語を、事業ドメイン辞書や技術辞書に追加するため、自動的に事業ドメインの用語を増殖させることができ、人手でメンテナンスする工数を削減することができる。さらに増殖した特徴語も含めて、後から入力される情報源を比較するため、より広く製品を発見することが可能になる。また、ニュースの情報源に同時に出現するキーワードを、技術辞書の距離に反映させることによって、関連の深さに応じた技術ワードを自動構築できる。

第５の効果は、顧客・競合・部品納入企業の企業力の差を定量化できることにある。その理由は、顧客、競合、部品納入企業という３つのタイプに企業力を測定するテンプレートを用意し、情報源に含まれるキーワードと、単語・ノード対応表と、競合企業力測定ツリーの構造と、リーフ値計算式から、キーワードの持つインパクトを過去の企業活動に照らし合わせて計算するからである。また、直接的には部品納入業者のニュースでも、それを採用する企業への影響力も技術辞書を用いて定量化するため、より正確に波及効果も定量化することができる。

以上のような情報構造化処理は、専用コンピュータ、又はパーソナルコンピュータ（ＰＣ）などのコンピュータにより実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図６８に示すように、コンピュータ２１００は、ＣＰＵ２１０１（Central Processing Unit）、ＲＯＭ２１０２（Read Only Memory）及びＲＡＭ２１０３（Random Access Memory）を有し、これらがバス２１０４を介して相互に接続されている。尚、コンピュータを動作させるためのＯＳソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然備えているものとする。

バス２１０４には又、入出力インターフェース２１０５も接続されている。入出力インターフェース２１０５には、例えば、キーボード、マウス、センサなどよりなる入力部２１０６、ＣＲＴ、ＬＣＤなどよりなるディスプレイ、並びにヘッドフォンやスピーカなどよりなる出力部２１０７、ハードディスクなどより構成される記憶部２１０８、モデム、ターミナルアダプタなどより構成される通信部２１０９などが接続されている。

ＣＰＵ２１０１は、ＲＯＭ２１０２に記憶されている各種プログラム、又は記憶部２１０８からＲＡＭ２１０３にロードされた各種プログラムに従って各種の処理を実行する。本実施例においては、例えば、情報源裁断処理、情報源再構築処理、情報源選別処理、グループ生成処理、情報源価値推定処理、波及力計算処理、企業力推定処理、需要周期推定処理、潜在購買力推定処理、販売力推定処理、又は競争力増強部品推定処理等の処理を実行する。ＲＡＭ２１０３にはまた、ＣＰＵ２１０１が各種の処理を実行する上において必要なデータなども適宜記憶される。

通信部２１０９は、例えば図示しないインターネットを介しての通信処理を行ったり、ＣＰＵ２１０１から提供されたデータを送信したり、通信相手から受信したデータをＣＰＵ２１０１、ＲＡＭ２１０３、記憶部２１０８に出力したりする。記憶部２１０８はＣＰＵ２１０１との間でやり取りし、情報の保存・消去を行う。通信部２１０９は又、他の装置との間で、アナログ信号又はディジタル信号の通信処理を行う。

入出力インターフェース２１０５は又、必要に応じてドライブ２１１０が接続され、例えば、磁気ディスク２１１１、光ディスク２１１２、フレキシブルディスク２１１３、又は半導体メモリ２１１４などが適宜装着され、それらから読み出されたコンピュータプログラムが必要に応じて記憶部２１０８にインストールされる。

なお、本発明は上述した実施例のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。

例えば、上述の実施例では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、ＣＰＵ（Central Processing Unit）にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。

本発明の第１の実施例にかかる情報構造化装置を示すブロック図である。本発明の第１の実施例にかかる情報構造化装置における情報源裁断部を示すブロック図である。情報源文字列の構成を示す図である。本発明の第１の実施例にかかる情報構造化装置における形態素解析結果を示す図である。本発明の第１の実施例にかかる情報構造化装置における情報源再構築部を示す図である。本発明の第１の実施例にかかる情報構造化装置における情報源価値推定部を示すブロック図である。本発明の第１の実施例にかかる情報構造化装置が使用するドメイン辞書の構造を示す図である。本発明の第１の実施例にかかる情報構造化装置が使用するドメイン辞書の一例を示す図である。本発明の第１の実施例にかかる情報構造化装置が参照する主体者辞書の構造を示す図である。本発明の第１の実施例にかかる情報構造化装置が参照する単語定量化マップを示す図である。本発明の第１の実施例にかかる情報構造化装置が参照する顧客企業力測定ツリーの構造を示す図である。本発明の第１の実施例にかかる情報構造化装置が参照する競合企業力測定ツリーの構造を示す図である。本発明の第１の実施例にかかる情報構造化装置が参照する部品納入企業力測定ツリーの構造を示す図である。本発明の第１の実施例にかかる情報構造化装置が参照する単語定量化マップに含まれる単語・ノード対応表を示す図である。本発明の第１の実施例にかかる情報構造化装置における企業力推定部を示すブロック図である。ノード構造及びリーフ構造を示す図である。本発明の第１の実施例にかかる情報構造化装置の動作を示すフローチャートである。本発明の第１の実施例にかかる情報構造化装置における形態素解析結果の一例を示す図である。本発明の第１の実施例にかかる情報構造化装置における情報再構築部が形態素を連結した後を示す図である。本発明の第１の実施例にかかる情報構造化装置における製品名抽出方法を示すフローチャートである。本発明の第１の実施例にかかる情報構造化装置における主体者抽出方法を示すフローチャートである。本発明の第１の実施例にかかる情報構造化装置における行動抽出方法を示すフローチャートである。本発明の第１の実施例にかかる情報構造化装置における行動対象抽出方法を示すフローチャートである。本発明の第１の実施例にかかる情報構造化装置におけるシノニム抽出方法を示すフローチャートである。本発明の第１の実施例にかかる情報構造化装置における特徴語抽出方法を示すフローチャートである。本発明の第１の実施例にかかる情報構造化装置における情報源再構築部が書式ルールに従って、主体者、製品名、行動、特徴語、シノニムを抽出した結果を示す図である。本発明の第１の実施例にかかる情報構造化装置における適合情報源ツリー選別方法を示すフローチャートである。本発明の第１の実施例にかかる情報構造化装置における書式解析結果の一例を示す図である。本発明の第２の実施例にかかる情報構造化装置を示す図である。本発明の第２の実施例の情報源再構築部を示す図である。本発明の第２の実施例にかかる情報構造化装置が生成する情報源ツリーを示す図である。本発明の第２の実施例にかかる情報構造化装置における情報源選別部を示すブロック図である。本発明の第２の実施例にかかる情報構造化装置におけるグループ生成部を示すブロック図である。製品構成をベースにした技術辞書である。本発明の第２の実施例にかかる情報構造化装置が使用する技術辞書の構造を示す図である。本発明の第２の実施例にかかる情報源価値推定部を示す図である。本発明の第２の実施例にかかる情報構造化装置の動作を示すフローチャートである。本発明の第２の実施例にかかる情報構造化装置が生成した情報源ツリーの一例を示す図である。本発明の第２の実施例にかかる情報構造化装置における情報源ツリーの増殖方法を示すフローチャートである。本発明の第２の実施例の情報構造化装置が増殖した事業ドメイン辞書の一例を示す図である。本発明の第２の実施例の情報構造化装置が増殖した技術辞書の一例を示す図である。本発明の第２の実施例にかかる情報構造化装置における書式解析結果の一例を示す図である。本発明の第２の実施例にかかる情報構造化装置における書式解析結果の一例を示す図である。本発明の第２の実施例の情報構造化装置が増殖した事業ドメイン辞書の一例を示す図である。本発明の第４の実施例にかかる情報構造化装置を示す図である。本発明の第４の実施例における波及力計算部を示すブロック図である。本発明の第４の実施例にかかる情報構造化装置の動作を示すフローチャートである。本発明の第４の実施例にかかる情報構造化装置が参照する主体者辞書を示す図である。本発明の第４の実施例にかかる情報構造化装置が生成した情報源ツリーの一例を示す図である。本発明の第４の実施例にかかる情報構造化装置における波及力算出方法の詳細を示すフローチャートである。ある商品の需要周期を示す図である。本発明の第５の実施例にかかる情報構造化装置を示す図である。本発明の第５の実施例における需要周期推定部を示すブロック図である。本発明の第５の実施例にかかる情報構造化装置の動作を示すフローチャートである。本発明の第６の実施例にかかる情報構造化装置を示す図である。本発明の第６の実施例にかかる情報構造化装置における潜在購買力推定部を示すブロック図である。製品の機能と価格のバランスを説明する図である。本発明の第６の実施例にかかる情報構造化装置の動作を示すフローチャートである。本発明の第６の実施例の情報構造化装置により作成される表である。本発明の第７の実施例にかかる情報構造化装置を示す図である。（ａ）は、販売力と期間の関係を示し、（ｂ）は販売力と機能の関係を示す図である。本発明の第７の実施例にかかる情報構造化装置における販売力推定部を示すブロック図である。本発明の第７の実施例にかかる情報構造化装置の動作を示すフローチャートである。本発明の第８の実施例にかかる情報構造化装置を示す図である。本発明の第８の実施例にかかる情報構造化装置における競争力増強部品推定部を示すブロック図である。本発明の第８の実施例にかかる情報構造化装置の動作を示すフローチャートである。ニュース関係図を示す図である。本発明の実施例にかかるコンピュータを示す図である。

符号の説明

１０，２０，３０，４０，５０，６０，７０情報構造化装置
１１，２１，３１，４１，５１，６１，７１分類装置
１２，２２，３２，４２，５２，６２，７２定量化装置
１００情報源裁断部
１０１情報源蓄積部
１０２形態素解析部
１０３形態素蓄積部
２００、２００ｂ情報源再構築部
２０１書式解析部
２０２書式ルール蓄積部
２０３要素単語格納部
２０４ツリー生成部
２０５情報源ツリー格納部
３００情報源選別部
３０１ツリー選別部
３０２ドメイン辞書格納部
３０３適合情報源ツリー格納部
３０４非適合情報源ツリー格納部
４００グループ生成部
４０１ツリー増殖部
４０２技術辞書格納部
５００情報源価値推定部
５００、５００ｂ情報源価値推定部
５０１主体者判定部
５０２主体者辞書格納部
５０３情報源格納部
５０４情報源定量化部
５０５単語定量化マップ格納部
５０６情報減初期スコア格納部
５０７企業力測定ツリー格納部
５０８ドメイン辞書格納部
６００、６００ｂ企業力推定部
６０１企業力計算部
６０２情報源最終スコア格納部
７００波及力計算部
７０１部品納入情報源選別部
７０２納入先企業抽出部
７０３特徴語列挙部
７０４近距離用語抽出部
７０５波及力計算部
８００需要周期推定部
８０１製品採用情報選別部
８０２製品納入情報選別部
８０３重複検知部
８０４月間累計カウンタ
８０５商品需要表示部
９００潜在購買力推定部
９０１製品採用情報選択部
９０２製品納入情報選択部
９０３重複検知部
９０４他社製品特徴語選別部
９０４他者製品特徴後選別部
９０５自社類似製品選別部
９０６他社製品採用顧客選別部
９０６他社製尾品採用顧客選別部
９０７財務情報取得部
９０８投資実績計算部
９０９投資類似度計算部
９１０顧客集合選別部
９１１他社製品未採用顧客選別部
１０００販売力推定部
１００１製品別特徴語収集部
１００２平均特徴語算出部
１００３製品開発情報選別部
１００４製品別特徴語収集部
１００５製品開発情報選別部
１００６平均特徴語数算出部
１００７競合製品販売率算出部
１１００競争力増強部品推定部
１１０１部品採用率上位企業選別部
１１０２競合企業製品納入実績選別部
１１０２競合企業製品納入実績計測部
１１０３部品貢献率算出部
２１００コンピュータ
２１０１ＣＰＵ
２１０２ＲＯＭ
２１０３ＲＡＭ
２１０４バス
２１０５入出力インターフェース
２１０６入力部
２１０７出力部
２１０８記憶部
２１０９通信部
２１１０ドライブ
２１１１磁気ディスク
２１１２光ディスク
２１１３フレキシブルディスク
２１１４半導体メモリ

Claims

情報源を分割して単語を生成する情報源裁断部と、
予め定められた書式ルールに従って前記単語を分類する情報源再構築部と、
企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、前記情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定部と、
前記初期スコアに基づき前記企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定部とを有し、
前記企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出される、情報構造化装置。
前記企業力推定部は、前記情報源の入力による前記企業力の変化量を当該情報源のスコアとして算出する
ことを特徴とする請求項１記載の情報構造化装置。
前記情報源価値推定部は、事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する判定部を有し、
前記適合情報源を使用して企業力を算出する
ことを特徴とする請求項１又は２記載の情報構造化装置。
前記情報源価値推定部は、主体者の種別が記述された主体者辞書を参照し、前記適合情報源の主体者の種別を判定する判定部を有し、
主体者の種別毎に用意された前記企業力測定ツリーを使用して企業力を算出する
ことを特徴とする請求項１乃至３のいずれか１項記載の情報構造化装置。
事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別部を更に有する
ことを特徴とする請求項１又は２記載の情報構造化装置。
単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び／又は下位概念に基づき分類した単語辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成部を更に有する。
ことを特徴とする請求項１、２又は５のいずれか１項記載の情報構造化装置。
前記情報源裁断部は、前記情報源を形態素に分割する形態素解析部を有する
ことを特徴とする請求項１乃至６のいずれか１項記載の情報構造化装置。
前記情報源再構築部は、前記単語を組み合せ、主体者をルートとする情報源ツリーを形成する
ことを特徴とする請求項１乃至７のいずれか１項記載の情報構造化装置。
前記情報源再構築部は、
前記不可分要素を製品名、主体者、特徴語、及び行動に分類する書式解析部と、
前記書式解析結果に基づき前記不可分要素に分断された情報源から前記情報源ツリーを生成するツリー生成部とを有する
ことを特徴とする請求項８項記載の情報構造化装置。
前記書式解析部は、前記形態素のうち、連続する名詞を結合して要素単語を生成する
ことを特徴とする請求項９項記載の情報構造化装置。
前記グループ生成部は、主体者が種別毎に分類された主体者辞書を参照し、前記適合情報源を主体者毎に分類する
ことを特徴とする請求項６項記載の情報構造化装置。
前記情報源選別部は、前記適合情報源を構成する単語のうち、前記事業ドメイン辞書に存在しない単語を、当該事業ドメイン辞書に登録する
ことを特徴とする請求項３又は５項記載の情報構造化装置。
前記グループ生成部は、前記適合情報源を構成する単語のうち、前記単語辞書に存在しない単語を、当該単語辞書に登録する
ことを特徴とする請求項６項記載の情報構造化装置。
前記単語辞書は、単語間の類似度に基づき当該単語間の距離が設定されたものであって、
前記単語辞書を参照し、納入元企業が主体者となる情報源に含まれる単語と、納入先企業に関する情報源に含まれる単語との距離に応じて、前記納入先企業に対する前記納入元企業の影響力を算出する波及力計算部を更に有する
ことを特徴とする請求項６、１１、又は１３のいずれか１項記載の情報構造化装置。
顧客企業の製品採用情報源における製品及び納入元と、競合企業の製品納入情報源における製品及び納入先とに基づき当該製品の需要周期を推定する需要周期推定部を更に有する
ことを特徴とする請求項１乃至１４のいずれか１項記載の情報構造化装置。
顧客企業の財務情報と、顧客企業の製品購入履歴又は競合企業の製品販売実績とに基づき、当該顧客企業の潜在購買力を推定する潜在購買力推定部を更に有する
ことを特徴とする請求項１乃至１５のいずれか１項記載の情報構造化装置。
単語辞書は、技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び／又は下位概念に基づき分類した技術辞書である
ことを特徴とする請求項６、１３、及び１４のいずれか１項記載の情報構造化装置。
情報源を分割して単語を生成する情報源裁断工程と、
予め定められた書式ルールに従って前記単語を分類する情報源再構築工程と、
企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、前記情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定工程と、
前記初期スコアに基づき前記企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定工程とを有し、
前記企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出される、情報構造化方法。
前記企業力推定工程では、前記情報源の入力による前記企業力の変化量を当該情報源のスコアとして算出する
ことを特徴とする請求項１８記載の情報構造化方法。
前記情報源価値推定工程は、事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する判定工程を有し、
前記適合情報源を使用して企業力を算出する
ことを特徴とする請求項１８又は１９記載の情報構造化方法。
前記情報源価値推定工程は、主体者の種別が記述された主体者辞書を参照し、前記適合情報源の主体者の種別を判定する判定工程を有し、
主体者の種別毎に用意された前記企業力測定ツリーを使用して企業力を算出する
ことを特徴とする請求項１８乃至２０のいずれか１項記載の情報構造化方法。
事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別工程を更に有する
ことを特徴とする請求項１８又は１９記載の情報構造化方法。
単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び／又は下位概念に基づき分類した単語辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成工程を更に有する。
ことを特徴とする請求項１８、１９又は２２のいずれか１項記載の情報構造化方法。
前記情報源裁断工程は、前記情報源を形態素に分割する形態素解析工程を有する
ことを特徴とする請求項１８乃至２３のいずれか１項記載の情報構造化方法。
前記情報源再構築工程は、前記単語を組み合せ、主体者をルートとする情報源ツリーを形成する
ことを特徴とする請求項１８乃至２４のいずれか１項記載の情報構造化方法。
前記情報源再構築工程は、
前記不可分要素を製品名、主体者、特徴語、及び行動に分類する書式解析工程と、
前記書式解析結果に基づき前記不可分要素に分断された情報源から前記情報源ツリーを生成するツリー生成工程とを有する
ことを特徴とする請求項２５項記載の情報構造化方法。
前記書式解析工程では、前記形態素のうち、連続する名詞を結合して要素単語を生成する
ことを特徴とする請求項２６項記載の情報構造化方法。
前記グループ生成工程では、主体者が種別毎に分類された主体者辞書を参照し、前記適合情報源を主体者毎に分類する
ことを特徴とする請求項２３項記載の情報構造化方法。
前記情報源選別工程では、前記適合情報源を構成する単語のうち、前記事業ドメイン辞書に存在しない単語を、当該事業ドメイン辞書に登録する
ことを特徴とする請求項２０又は２２項記載の情報構造化方法。
前記グループ生成工程では、前記適合情報源を構成する単語のうち、前記単語辞書に存在しない単語を、当該単語辞書に登録する
ことを特徴とする請求項２３項記載の情報構造化方法。
前記単語辞書は、単語間の類似度に基づき当該単語間の距離が設定されたものであって、
前記単語辞書を参照し、納入元企業が主体者となる情報源に含まれる単語と、納入先企業に関する情報源に含まれる単語との距離に応じて、前記納入先企業に対する前記納入元企業の影響力を算出する波及力計算工程を更に有する
ことを特徴とする請求項２８乃至３０のいずれか１項記載の情報構造化方法。
顧客企業の製品採用情報源における製品及び納入元と、競合企業の製品納入情報源における製品及び納入先とに基づき当該製品の需要周期を推定する需要周期推定工程を更に有する
ことを特徴とする請求項２８乃至３１のいずれか１項記載の情報構造化方法。
顧客企業の財務情報と、顧客企業の製品購入履歴又は競合企業の製品販売実績とに基づき、当該顧客企業の潜在購買力を推定する潜在購買力推定工程を更に有する
ことを特徴とする請求項１８乃至３２のいずれか１項記載の情報構造化方法。
単語辞書は、技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び／又は下位概念に基づき分類した技術辞書である
ことを特徴とする請求項２３、３０、及び３１のいずれか１項記載の情報構造化装置。
入力される情報源を構造化する処理をコンピュータに実行させるためのプログラムであって、
情報源を分割して単語を生成する情報源裁断工程と、
予め定められた書式ルールに従って前記単語を分類する情報源再構築工程と、
企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、前記情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定工程と、
前記初期スコアに基づき前記企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定工程とを有し、
前記企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出される、プログラム。