JP2009032119A - 情報構造化装置、情報構造化方法、及びプログラム - Google Patents

情報構造化装置、情報構造化方法、及びプログラム Download PDF

Info

Publication number
JP2009032119A
JP2009032119A JP2007196661A JP2007196661A JP2009032119A JP 2009032119 A JP2009032119 A JP 2009032119A JP 2007196661 A JP2007196661 A JP 2007196661A JP 2007196661 A JP2007196661 A JP 2007196661A JP 2009032119 A JP2009032119 A JP 2009032119A
Authority
JP
Japan
Prior art keywords
information source
information
product
company
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007196661A
Other languages
English (en)
Inventor
Shigeaki Matsumoto
繁明 松元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007196661A priority Critical patent/JP2009032119A/ja
Publication of JP2009032119A publication Critical patent/JP2009032119A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】与えられた情報源から精度よく必要な情報を抽出し、企業特性を考慮して定量化することができる情報構造化装置、情報構造化方法及びプログラムを提供する。
【解決手段】情報源を分割して単語を生成する情報源裁断部100と、予め定められた書式ルールに従って単語を分類する情報源再構築部200と、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定部500と、初期スコアに基づき企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定部600とを有する。企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出されるものである。
【選択図】図1

Description

本発明は、入力された情報源を所定の規則に従って構造化する情報構造化装置、情報構造化方法及びプログラムに関し、特に、例えば情報源としてウェブ情報を使用し製品企画支援を行なう情報構造化装置、情報構造化方法及びプログラムに関する。
企業が新商品のための製品企画を行う際、従来から市場の動向、他社の保有技術、自社の保有技術などを考慮に入れて行なわれていた。具体的には、事業ドメインの市場が伸びるのかどうか、売れている製品はどのようなものか、又は他社になく自社にある技術を生かすにはどうすればよいのか、といった検討がなされているのが通例である。
一般消費者が購入する商品(消費財)の製品企画であれば、一般消費者に対するアンケート方式のマーケティングによって製品の特性などを決定することが多かった。近年では、クチコミサイト、Q&Aコミュニティ、ソーシャルネットワーキングサービス(SNS)、ブログ、COI(Community Of Interest)サイト等インターネット等を活用して消費者が内容を生成していく消費者発信型メディア/消費者生成メディア(Consumer Generated Media:CGM)を利用して、口コミ情報を集める仕組みも試行されている。
一方、企業が購入する商品(生産財)の商品企画の場合は、顧客の声によるマーケティングが困難である。その理由として、生産財を購入するのは企業であり購入者の母集団が少ないこと、購入対象となる生産財の種類、購入数は購入企業の投資戦略に関わる情報であり、部分的にしか公開されないためである。
一般に公開されている情報から企業を評価するための情報を抽出するための技術として、特許文献1には、企業信用度測定の一例が記載されている。この特許文献1記載の財務安全度の算出方法においては、借入金のある企業が財務安全度を、現金預金/借入金×100%と云う簡単な計算式で指数を算出し、過去・現在の傾向を確認する。すなわち、財務安全度の指数を、決算期毎に3期間ないし5期間を比較し、上昇傾向であれば経営が順調な証拠であり、低下を続けるなら経営全般の改善が必要と判定する。
ところで、特許文献2には、例えば商品やサービスの販売促進のための広告配信を効果的に行なうこと等を目的とし、販売促進の対象となる顧客の母集団の中から、特定の商品やサービスを実際に購入する可能性が高いと考えられる潜在顧客を選別する顧客選別方法が開示されている。この特許文献2に記載の技術は、テキストを含むファイルを自動的に分類する情報分類装置であって、ファイル格納手段が出力するファイルのテキスト部分を形態素解析してファイルの識別子と共に出力する形態素解析手段と、ファイルを分類するためのキーワードを格納するキーワード格納手段と、キーワード格納手段の出力と形態素解析手段の出力とを入力として形態素解析の結果の中からキーワードを収集してファイルの識別子と共に出力するキーワード収集手段と、利用者が最近の分類結果と異なる分類結果を要求するための入力手段と、入力手段の出力とキーワード収集手段の出力とを入力としてファイルの識別子をキーワードで分類して出力する情報分類手段と、情報分類手段の出力とファイル格納手段の出力とを入力として情報分類手段が分類した結果を利用者に提供するものである。
特開2000−113037号公報 特開平10−283366号公報
しかしながら、特許文献1に記載の技術においては、企業力を測定しているが、財務情報した考慮しないため、日々の企業動向(ニュース)を詳細に反映したものが得られていない。また、特許文献2に記載の技術においては、キーワードにより入力情報を分類するものであるが、企業特性を考慮したものではない。したがって、特許文献1及び特許文献2に記載の技術によっては、企業特性を考慮し、日々のニュースを定量化することができないという問題点がある。
本発明は、このような事情に鑑みてなされたものであり、与えられた情報源から精度よく必要な情報を抽出し、企業特性を考慮して定量化することができる情報構造化装置、情報構造化方法及びプログラムを提供することを目的とする。
本発明に係る情報構造化装置は、情報源を分割して単語を生成する情報源裁断部と、予め定められた書式ルールに従って前記単語を分類する情報源再構築部と、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、前記情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定部と、前記初期スコアに基づき前記企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定部とを有し、前記企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出されるものである。
また、本発明にかかる情報構造化方法は、上記の情報構造化処理を実行する方法であり、本発明にかかるプログラムは、上記の情報構造化処理をコンピュータに実行させるものである。
本発明によれば、与えられた情報源から精度よく必要な情報を抽出し、企業特性を考慮して定量化することができる情報構造化装置、情報構造化方法及びプログラムを提供することができる。
以下、本発明を適用した具体的な実施例について、図面を参照しながら詳細に説明する。本実施例にかかる情報構造化装置は、ウェブなどにおける企業情報、製品情報、技術情報を整理し、製品企画支援を行なうための装置であり、生産財メーカにとって優良顧客であるかどうかを、企業の投資欲から判定し、より購買力のある企業を発見する。また、他社への納入実績情報を商品に付加して提示することにより、信用ある他社が購入した生産財のみを選択することができ、購入者側の実績を元に商品比較をすることができる。さらに、ニュースという公開された情報から、新規顧客や新規部品納入業者を発見することにより、販路や部品供給の拡大を行うことができ、これによってボトルネックを解消することが可能となる。
ここで、本実施例においては、説明上、部品を製造している企業を部品納入企業、部品納入企業から部品が納入される企業を競合企業、競合企業が製品を納入する企業を顧客企業として説明する。そして、競合企業であるユーザが本システムを使用する場合を想定して説明を行なう。いうまでもなく、顧客企業間、部品納入企業間は互いに競合企業であるが、本実施例においては、部品納入企業、顧客企業ということとする。
本発明の第1の実施例
図1は、本発明の第1の実施例にかかる情報構造化装置10を示す図である。図1に示すように、本実施例にかかる情報構造化装置10は、分類装置11と定量化装置12とを有し、与えられた情報源を分類し、定量化するものであり、より具体的には、単文で表現されたニュースタイトルのような情報源から必要な単語を抽出し、企業情報、製品情報、技術情報を整理し、情報源の価値や企業価値を定量化するものである。この情報構造化装置10は、情報源裁断部100、情報源再構築部200、情報源価値推定部500及び企業力推定部600を有する。情報源裁断部100は、情報源の文字列を文法レベルの不可分要素に分割する。情報源再構築部200は、不可分要素を組み合わせてツリー構造に再構築する。情報源価値推定部500は、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が情報源に含まれる単語により定義された定義表と、情報源とを参照し、当該リーフのスコア(コスト)を初期スコアとして算出する。企業力推定部600は、初期スコアに基づき企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する。ここで、企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出されるものであるが、その詳細は後述する。次に、各ブロックについて詳述する。
図2は、本実施例における情報源裁断部100を示すブロック図である。図2に示すように、情報源裁断部100は、情報源(タイトル)蓄積部101、形態素解析部102、及び形態素蓄積部103を有する。これらの手段はそれぞれ概略次のように動作する。
情報源蓄積部101は、情報源文字列を保持している。情報源文字列は、図3で示すように、日時及び文字列の情報からなる。この情報源文字列は「、」を複数有し、「。」を1つ有するような短文である。
形態素解析部102は、情報源である例えばタイトル文字列"日本電気、光アクセス製品「DW4000」を発売"のような1文で表現された文字列を、形態素(Morpheme)("日本電気","、","光","アクセス","製品","「","DW","4000","」","を","発売")に分割し、形態素解析を行う。形態素とはこれ以上に細かくすると意味がなくなってしまう最小の文字列をいう。形態素解析とは、対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)を使用し、自然言語で書かれた文を形態素の列に分割(分節処理(分かち書き))し、それぞれの品詞を判別する作業を指す。形態素解析された結果は、例えば、図4に示すように、単語、品詞、補助、読みからなるデータ形式で形態素蓄積部103に格納される。
図5は、本実施例における情報源再構築部200を示す図である。図5に示すように、情報源再構築部200は、書式解析部201、書式ルール蓄積部202、及び要素単語格納部203を有する。これらの手段はそれぞれ概略次のように動作する。
書式解析部201には、形態素蓄積部103から、情報源を形態素に分断された品詞集合が入力される。この品詞集合において連続した名詞を結合する。上述の例では、例えば"光"、"アクセス"、"製品"を連結して"光アクセス製品"とする。その後、書式ルール蓄積部202を参照して、情報源特有の表現にマッチするルール集合を取り出し、主体者、行動、製品名、特徴語などのキーワードを抽出することで、形態素集合から、製品名・主体者・行動・特徴語・シノニム(要素単語)を生成し、要素単語格納部203に格納する。下記の書式ルールに従うと、
主体者:日本電気
製品名:DW4000
行動:発売
特徴語:光アクセス製品
という要素単語を生成する。
書式ルール蓄積部202に格納されているルールは下記のようなものがある。
1)製品/派生製品抽出ルール
(ア)かぎ括弧「」で囲まれている連続名詞を製品名として抽出する
(イ)英字+数字があれば、製品型番として抽出する
(ウ)マーク(R)の前にくる連続名詞を商標名として抽出する
(エ)過去に抽出された製品名との差分をとり、差分部分を派生製品名として抽出する
(オ)該当するものがなければ、製品名なしと判定し、抽出されない
2)主体者抽出ルール
(ア)行頭から句点(、)までの範囲に、名詞しか出現しなかった場合には、最長一致の名詞を企業名とする
(イ)格助詞(「が」、「は」)の前にくる最長一致の名詞を企業名とする
(ウ)(株)、(有)の直後に来る最長一致の名詞を企業名とする
(エ)該当するものがなければ、情報源発信元サイトのURLから企業名を抜き出す
3)行動抽出ルール
(ア)行末のサ変名詞を、企業の行動とする
(イ)最後に出現する動詞を企業の行動とする
(ウ)該当するものがなければ、発表という行動を抽出する
4)行動対象ルール
(ア)行動が「納入」の場合は、助詞「へ」「に」の前にくる名詞を納入先企業とする
(イ)行動が「採用」の場合は、主体者として抽出された企業を納入先企業とする。
(ウ)該当するものがなければ、行動対象なしと判定し、抽出されない
5)シノニム抽出ルール
(ア)括弧「(」の前後にくる連続名詞1組を、キーワードとそのシノニムとして抽出する。
(イ)該当するものがなければ、シノニムなしと判定し、抽出されない
6)特徴語抽出ルール
(ア)他のルール集合で漏れた連続名詞を、特徴語として抽出する。
図6は、本実施例における情報源価値推定部500を示すブロック図である。図6に示すように、情報源価値推定部500は、主体者判定部501と、主体者辞書格納部502と、主体者分類済み情報源格納部503と、情報源定量化部504と、単語定量化マップ格納部505と、情報減初期スコア格納部506、企業力測定ツリー格納部507と、ドメイン辞書格納部508とを有する。
主体者判定部501は、ドメイン辞書格納部302のドメイン辞書を参照し、事業ドメインに適合する情報源のみを適合情報源として選択する。具体的には、先ず、情報源の中に例えば"納入"、"採用"といった行動を含む言葉があれば、生産財に関する情報源であると判定する。
次に主体者判定部501は、ドメイン辞書を参照し、生産財に関する情報源と判定された情報源に含まれる要素単語、すなわち主体者、製品名、行動、特徴語、及びシノニムと、ドメイン辞書格納部508に格納されている事業ドメイン専門の企業名、製品名、及び特徴語とを比較する。図7は、ドメイン辞書の構造を示す図、図8は、ドメイン辞書の一例を示す図である。ドメイン辞書には、主体者、製品名、特徴語などのカテゴリ別に、語句1列、語句2列、・・・と複数の語句列が登録されている。
そして、主体者判定部501は、生産財に関する情報源と判定された情報源に含まれる各要素単語とドメイン辞書の単語を比較して、マッチするものが1つ以上合った場合に、その情報源は事業ドメインに合致した生産財と判定し、図示せぬ適合情報源格納部に格納する。マッチするものがない場合には、例えば図示せぬ非適合情報源格納部に格納する。そして、適合情報原格納部に格納した情報原に含まれる"製品名"、"特徴語"、及び"シノニム"のうち、ドメイン辞書に登録がないものをドメイン辞書格納部508のドメイン辞書へ登録する。情報源に含まれる"主体者"は、事業ドメインにおける専門業者と総合メーカを区別するため、情報源の各要素単語がドメイン辞書と適合又は非適合する個数を毎回測定する。同一主体者の情報源に関して、情報源の総数に対し、所定の割合th1(0<th1<1)以上の数の情報源が適合情報源であれば、専門業者として当該情報源の主体者をドメイン辞書の主体者カテゴリに登録し、所定の割合未満である場合は総合メーカとして主体者カテゴリに登録する。
主体者辞書格納部502は主体者辞書を格納する。主体者辞書は、上述の図9に示すように、カテゴリ、{顧客、競合、部品納入}と企業名(名前)との組からなる構造を有する。この主体者辞書の企業名には、競合企業の名前、顧客企業の名前、部品納入企業の名前が格納されている。
主体者辞書を参照することで、ニュースが事業ドメインに合致しているかどうかを判定することができる。専門業者の名前がニュースに含まれていた場合、技術辞書にない特徴語でも、事業ドメインに合致する製品であると判定したり、主体者による判定によって、ニュースに含まれる製品名も事業ドメインに適していると判定することができる。よって、それを購入した顧客を新顧客として認定することができる。また、総合メーカKを主体者に登録してしまうと、K製の洗濯機も、光ネットワーク製品だと誤判定したり、K製の洗濯機を大量に購入したコインランドリー業者がいた場合に、光事業ドメイン製品を購入した新規顧客と誤判定したりしてしまうが、総合メーカを主体者に登録せずに主体者判定することにより、あるメーカの製品は全て事業ドメインに合致するという動作をすることを防止する。
主体者判定部501は、適合情報源格納部を参照し、その主体者と、主体者辞書格納部502の主体者辞書とを比較する。そして、適合情報源を、主体者で分類し、競合企業に関する競合企業情報源、顧客企業に関する顧客企業情報源、又は納入企業に関する納入企業情報源として、情報源格納部503に格納する。
情報源定量化部504は、情報源格納部503に格納された主体者別情報源と単語定量化マップ格納部505に格納された図10に示す構造の単語定量化マップから、後述する企業力測定ツリー格納部507に格納された企業力測定ツリーの最下層を構成するリーフのスコアを初期スコアとして算出する。単語定量化マップは、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が情報源ツリーに含まれる単語により定義された定義表である。
先ず、図10に示す単語定量化マップについて説明すると、単語定量化マップは、情報源の「主体者」、「製品名」、「特徴語」、「アクション」、「アクションの対象」を組み合わせたルールと、それらに対応する初期スコア算出方法が記載されている。
具体的には、計算を開始するためのトリガーとして働く「単語」列と、情報源からどのようにスコアを算出するか記載された「スコア算出方法」列、初期スコアの配分先を決定するための「配分企業」列、「配分リーフ」列、及び「配分率」列を有する。
スコア算出方法としては大きく分けて4種類がある。1つめは固定値を与えるもので、ある単語が情報源に含まれていたら固定値で指定した値を初期スコアとして与える方式である。2つめは、配分先のリーフの値を用いて算出するもので、対象リーフが有する値を2倍、3倍するときに適用する方式である。3つ目は情報源が有する単語を組み合わせで計算するもので、"100億"、"増資"といった額面の値をスコアとして適用する方式である。4つ目は、外部算出部で定義する方式に従って算出するもので、複数の情報源を用いてスコアを算出する場合に適用する方式である。
次に、企業力測定ツリーについて説明する。図11乃至図13は、それぞれ顧客企業力測定ツリー、競合企業力測定ツリー、部品納入企業力測定ツリーの構造を示す図である。企業力測定ツリー格納部507には、図11に示す競合企業向けの競合企業力測定ツリー、図12に示す顧客企業向けの顧客企業力測定ツリー、図13に示す部品納入企業向けの納入企業力測定ツリーの3種類の企業力測定ツリーが準備されている。図11乃至図13に示すように、企業力測定ツリーは、ノード構造とリーフ構造の2種類のデータ構造を有し、企業名をルートノードとし、各企業の競争力を表現するための企業特性ノードを階層的に有することが可能である。最下層は、情報源から生成した初期スコアを割り当てるためのリーフとなっている。リーフはノードを有することができない。
図14は、単語定量化マップに含まれる単語・ノード対応表を示す図である。情報源定量化部504は、この単語・ノード対応表におけるワード欄に一致する要素単語が主体者別情報源に含まれているか判別する。含まれている場合は、当該ワード欄に対応するタイプの企業力測定ツリーの最下層を構成するリーフ(ノード1〜ノード3)に対し、スコア欄に指定されているスコアを初期スコアとして設定する。例えば、主体者別情報源の主体者(タイプ)が競合であって、当該情報源に"展示"含まれる場合、"納入実績"リーフのスコア(初期スコア)を2とする。また、例えば、主体者別情報源の主体者(タイプ)が"競合又は納入"であって、当該情報源に"開発"含まれる場合、"製品バリエーション"、"開発スピード"、"機能特徴"、又は"部品バリエーション"、"開発スピード"、"部品最高性能順位"の各リーフのスコア(初期スコア)に拡張関数を適用し、それぞれ0.4、0.2、0.4を乗算する。
ここで、拡張関数:2×g(f(製品バリエーション),f(開発スピード),f(特徴))
ここで、
g(param1, param2, param3){
if(param1 node==製品バリエーション){
return param1;
}
f(製品バリエーション)=過去のリリース製品の数+1
f(開発スピード)=f(製品バリエーション)/リリース期間の累計
f(特徴)=情報源ツリーの特徴語数
を示す。
すなわち、開発というキーワードに対しては、拡張関数の結果を2倍した値を、定量化マップに記載の配分先、配分率で分配し、それぞれのリーフに与える初期スコアを決定する。拡張関数は、3つのパラメータを引数にもち、各引数のリーフの型で返却される値が異なるよう機能する。製品バリエーションリーフの場合には、過去のリリース製品の数に1を足したものを、拡張関数の返却値とする。開発スピードリーフの場合には、各製品のリリース間隔の合計で製品数を割った値を、拡張関数の返却値とする。特徴リーフの場合には、情報源の特徴語数を、拡張関数の返却値とする。
このように、情報源価値推定部500により、単語定量化マップを用いて、情報源中に存在する行動とそれに付随する特徴語を組み合わせて、情報源の初期スコアを決定することができる。
図15は、本実施例における企業力推定部600を示すブロック図である。図15に示すように、企業力推定部600は、企業力計算部601と、情報源最終スコア格納部602を有する。
企業力計算部601は、企業力測定ツリーの最下層を構成するリーフに与えられた初期スコアが入力され、単語定量化マップ格納部505に格納された単語定量化マップの単語・ノード割り当て配分率と、企業力測定ツリー格納部507に格納された企業力測定ツリー情報から各ノードのスコアを算出し、企業力(最上位ノード)を算出する。そして、現在の企業力(スコアから過去の企業力(スコア)を引き算した値を情報源の最終スコアとして生成する。図16は、ノード構造及びリーフ構造を示す図である。図11乃至図13に示す企業力測定ツリーにおいて、各ノードの値は、下位のリーフ値又はノード値から算出され、ノード毎に算出方法を定義することができる。
企業力計算部601は、先ず、情報源がどの企業タイプに属するかを主体者辞書格納部502に格納された主体者辞書を用いて判定するとともに、単語定量化マップ格納部505に格納された単語定量化マップに記載された単語・ノード割り当て配分率に応じて、情報源定量化部が算出した初期スコアを該当企業タイプの該当ノードに配分する。単語・ノード割り当て配分率は、初期スコアを企業力測定ツリーのどのリーフに配分するか記載したものである。ここで、企業力測定ツリーは、主体者の企業タイプごとに企業特性が異なり、主体者の企業ごとにその特性値が異なるものとなる。このため、情報源から算出した初期スコアが同じでも、適用する主体者が異なれば、最終スコアは異なるという特性を有する。
主体者が顧客企業であれば、図11に示すように顧客企業向けに準備した企業力測定ツリーによって情報源を定量化する。顧客企業力測定ツリーは、「投資力」「サービス占有力」の子ノードから構成される。「投資力」ノードは、「投資積極性」「新規投資力」の子ノードから構成される。「投資積極性」は「流動資産」「固定資産」のリーフを有し、「新規投資力」は「純資産」「負債」のリーフを有する。「サービス占有力」ノードは、「地域性」「需要性」の子ノードを有する。さらに「地域性」ノードは、「サービス密度」「サービスエリア」リーフを有する。また「需要性」ノードは、「周期」「製品マッチング」リーフを有する。
それぞれのノード、リーフは初期値が1となっており、図14で示す単語・ノード対応表を用いてスコアを計算する。各企業タイプの各ノード・リーフは、情報源に含まれるワードを受け取り、ルールに従ってそのスコアを更新する。例えば、固定資産リーフや流動資産リーフの「スコア算出方法」列には、「情報源に記載のスコアをそのまま利用する」というルールが割り当てられている。情報源に「1000億円投資」という情報が掲載されていれば、固定資産リーフは額面を「1000」分増加させ、流動資産リーフは「1000」の額面分減少させる。上述したように、最下位のリーフは、情報源定量化部504によりその初期スコアが算出される。中間、及び最上位のノードは、下記の計算式により、企業力計算部601により、そのスコアを算出する。
中間ノード:レベル2
「投資積極性」ノードのスコア=「固定資産」リーフのスコア/「流動資産」リーフのスコア
「新規投資力」ノードのスコア=「純資産」リーフのスコア/「固定負債」リーフのスコア
「地域性」ノードのスコア=(α01×「サービス密度」リーフのスコア)+(α02×「サービスエリア」リーフのスコア)
「需要性」ノードのスコア=(β01×「周期」リーフのスコア)+(β02×「製品マッチング」リーフのスコア)
中間ノード:レベル1
「投資力」ノードのスコア=α11×「投資積極性」ノードのスコア×α12×「新規投資力」ノードのスコア
「サービス占有力」ノードのスコア=β11×「地域性」ノードのスコア×β12×「需要性」ノードのスコア
最上位ノード
「顧客企業のスコア」=α21×「投資力」ノードのスコア×β21×「サービス占有力」
ここで、α01からβ21までの重みは自由に設定できるようになっており、顧客企業型に属する企業力のうち重要視する特性を選択させることができる。各ノードのスコアは、次の計算式で求めることができる。
リーフのスコア(t+1)=情報源(t+1)の初期スコア
ノードのスコア(t+1)=ノードのスコア(t)+h(node_child1,node_child2,...,node_childN)
ここで、h()は、各ノードに自由に設定できる関数であり、具体的には、上述の「投資積極性」ノードのスコア=「固定資産」リーフのスコア/「流動資産」リーフのスコア
のような数式である。関数h()の値は、マイナスになることもあり、結果的に各ノードの値を減少させることも可能となっている。
そして、企業力計算部601は、上記のノードのスコアを顧客企業力測定ツリーに保存する。企業力計算部601は、主体者毎に異なる企業力測定ツリーを生成する。情報源が各企業に対応する企業力測定ツリーのノードのスコアを増加させるため、ニュースリリースの多い企業は、少ない企業に比べて企業力が蓄積される。情報源の最終スコアは、最上位ノードで得られるスコアから、過去の最上位ノードの値を減算したスコアに等しく、企業力計算部601は、最終スコアを情報源最終スコア格納部602に保存する。
同様に、主体者が競合企業であれば、図12に示すように競合企業向けに準備した企業力測定ツリーを基にして、情報源を定量化する。企業力測定ツリーは、「顧客利便性」「信用力」「販売力」「開発力」の子ノードから構成される。「顧客利便性」ノードは、「サポート拠点」の子リーフを有する。「信用力」ノードは、「格付け」、「納入実績」の子リーフを有する。「販売力」ノードは、「売り上げ実績」の子ノードを有する。「開発力」ノードは、「製品バリエーション」「開発スピード」「機能特徴」の子リーフを有する。それぞれのノード・リーフは初期スコアが1となっており、情報源の内容に応じて初期スコアを増加させる。上述したように、最下位のリーフは、情報源定量化部504が情報源の内容からスコアを直接的に計算する。例えば、情報源に「3つの製品を販売開始」という情報が掲載されていれば、情報源定量化部504は、図14を参照して製品バリエーションのリーフスコアを3増加させる。中間、及び最上位のノードは、下記の計算式により企業力計算部601が算出する。
中間ノード
「顧客利便性」ノードのスコア=(α11×「1/アクセス時間」リーフのスコア)+(β11×「サービス拠点数」リーフのスコア)+(γ11×「サポート要員数」リーフのスコア)
「信用力」ノードのスコア=(α21×「納入実績」リーフのスコア)+(β22×「格付け」リーフのスコア)
「開発力」ノードのスコア=(α31×「製品バリエーション」リーフのスコア)+(β32×「開発スピード」リーフのスコア)+(γ33×「機能特徴」リーフのスコア)
最上位ノード
「競合企業のスコア」=(α41×「顧客利便性」ノードのスコア)+(β42×「信用力」ノードのスコア)+(γ42×「販売力」ノードのスコア)
同様に、主体者が部品の納入業者であれば、図13に示すように部品納入企業向けに準備した企業力測定ツリーを基にして、情報源を定量化する。企業力測定ツリーは、「顧客利便性」「信用力」「開発力」の子ノードから構成される。「顧客利便性」ノードは、「納入可能数」「納期」リーフを有する。「信用力」ノードは、「納入実績」「格付け」リーフを有する。「開発力」ノードは、「部品バリエーション」「開発スピード」「部品最高性能順位」「差異化」リーフを有する。それぞれのノード・リーフは初期スコアが1となっており、情報源の内容に応じてスコアを増加させる。上述したように、情報源定量化部504は、例えば、情報源に「世界最速の部品を開発」という情報が入力されれば、部品最高性能順位リーフの初期スコアを2増加させる。中間、及び最上位のノードは、下記の計算式により企業力計算部601が算出する。
中間ノード
「顧客利便性」ノードのスコア=(α11×「納入可能数」リーフの値)+(β11×「納期」リーフのスコア)
「信用力」ノードのスコア=(α21×「納入実績」リーフのスコア)+(β22×「格付け」リーフのスコア)
「開発力」ノードのスコア=(α31×「部品バリエーション」リーフのスコア)+(β32×「開発スピード」リーフのスコア)+(γ33×「部品最高性能順位」リーフのスコア)
最上位ノード
「部品納入企業のスコア」=(α41×「顧客利便性」ノードのスコア)+(β42×「信用力」ノードのスコア)+(γ43×「開発力」ノードのスコア)
この企業力計算部601により、主体者辞書を用いて、情報源を顧客企業/競合企業/納入企業に分類し、企業タイプごとの評価テンプレート(企業力測定ツリー)を用いて、情報源の初期スコアを企業力の特質に配分し、過去の企業力を加味して情報源の最終スコアを定量化することができる。また、企業タイプごとの評価テンプレートは、各ノードやリーフにルールを持たせることができる構造になっており、情報源の値に対してルールを適用することによって、各ノードやリーフの値を計算することができる。さらに、この企業タイプごとの評価テンプレートは、ノード間を結ぶリンクに、「割合」により重み付けを与えることができる構造になっており、分析者が重要視する企業特性と、重要視しない企業特性を企業タイプごとに設定することができる。
次に、本実施例の動作について説明する。図17は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。本実施例は、未知の競合商品が市場にリリースされたことを検出する例である。前提として、"DW4000"は事業ドメインに合致した製品であることを、ドメイン辞書格納部302のドメイン辞書の「製品名」行、「語句1」列に登録しておく。(図8参照)
情報源として、例えば
"日本電気、光アクセス製品「DW4000」を発売"
という文字列がシステムに入力された場合について説明する。情報源裁断部100の形態素解析部102は、当該情報源の形態素解析を行い、この情報源を形態素へ分解することで、図18に示す形態素を得る。(ステップS100)。この形態素は、形態素蓄積部103に格納される。
書式解析部201は、形態素蓄積部103に格納された形態素集合に連続した名詞が出現する場合、これらを結合する。(ステップS200)。図19は、形態素の連結後を示す図である。次に、結合された連続名詞が、主体者なのか、製品名なのか、行動なのか、特徴語なのか判定するために、書式解析ルールを適用する(ステップS300)。
次に、書式解析ルール適用方法について説明する。書式解析部201は、形態素集合の連続名詞を結合し、形態素又は連続名詞から、書式ルールに従って、主体者、製品名、行動、特徴語、シノニムを抽出する。
先ず、製品名抽出方法について説明する。図20は、製品名抽出方法を示すフローチャートである。製品名を抽出する場合には、図20に示すように、順序付けされた形態素集合から、鍵括弧が存在するか判定し(ステップS301)、もし鍵括弧があればその鍵括弧内の形態素配列を抽出する(ステップS302)。そして、鍵括弧内の形態素配列に名詞又は記号のみが存在するか否か判定し(ステップS303)、英数字が連続しているものがあれば(ステップS304)、英字と数字の連続した名詞を結合する(ステップS305)。さらに、この鍵括弧内の形態素配列の中に商標記号が存在するか否かを判定し(ステップS306)、存在すれば商標記号を削除すると共に、商標記号前の名詞を商品名として製品名に登録し、商標記号後の名詞を特徴語して採用する(ステップS307)。以上により抽出された製品名が過去に製品名として登録されているかどうか判定し、(ステップS308)、製品名が過去に登録されており、括弧内に商標で分断された名詞が存在すれば、それを派生商品修飾語として要素単語格納部203の特徴語に登録し(ステップS309)、商品名が過去に登録されていなければ新製品名として要素単語格納部203の製品名に登録し(ステップS310)、製品名抽出フローを終了する。
図21は、主体者抽出方法を示すフローチャートである。図21に示すように、順序付けされた形態素集合において、行頭から句点まで名詞のみ存在するか否かを判定する(ステップS311)。名詞のみ存在する場合は、主体者として抽出する(ステップS312)。
一方、行頭から句点まで名詞のみではない場合、(株)、(有)の記号が存在するか否かを判定する(ステップS313)。存在する場合は、当該記号の前後名詞を主体者として抽出する(ステップS314)。また、(株)、(有)の記号が存在しない場合は、"が"又は"は"が存在するか否かを判定する(ステップS315)。存在する場合は、助詞の前の名詞を主体者として抽出する(ステップS316)。さらに、"が"又は"は"も存在しない場合は、発信元を主体者とする(ステップS317)。抽出した主体者は、要素単語格納部203に記録する。
図22は、行動抽出方法を示すフローチャートである。図21に示すように、順序付けされた形態素集合において、行末にサ変名詞があるか否かを判定する(ステップS321)。ある場合は、サ変名詞を含む連続名詞を行動として抽出する(ステップS322)。サ変名詞がない場合は、動詞が存在するか否かを判定する(ステップS323)。動詞が存在する場合は、最後に出現する動詞を行動として抽出する(ステップS324)。動詞が存在しない場合は、"発表"という行動を図5に示す要素単語格納部203の行動に追加する(ステップS325)
図23は、行動対象抽出方法を示すフローチャートである。図23に示すように、順序付けされた形態素集合において、行動が"納入"か否かが判断される(ステップS331)。なお、行動対象抽出処理は、行動抽出処理の後に実施される。抽出された行動が"納入"であれば、助詞"へ"、"に"の前の名詞を行動対象として抽出する(ステップS332)。行動が"納入"でない場合、"採用"か否かを判断する(ステップS333)。"採用"である場合は、主体者の企業を行動対象として抽出する(ステップS334)。抽出した行動は、要素単語格納部203に記録する。一方、行動が"採用"でもない場合は、処理を終了する(ステップS335)。
図24は、シノニム抽出方法を示すフローチャートである。図24に示すように、順序付けされた形態素集合において、括弧が存在するか否かを判断し(ステップS341)、括弧が存在する場合は、右括弧の前後にくる連続名詞1組を語源とそのシノニムとし、これを抽出する(ステップS342)。抽出した語源及びそのシノニムは、要素単語格納部203に記録する。一方、括弧が存在しない場合は、シノニムなしを要素単語格納部203に記録する(ステップS343)。
図25は、特徴語抽出方法を示すフローチャートである。図25に示すように、順序付けされた形態素集合において、他のルールを適用して分類不能な名詞があるか否かを判断する(ステップS351)。ある場合は、その名詞を特徴語として抽出し(ステップS352)、要素単語格納部203に記録する。
以上のように、図20に示す製品名抽出工程、図21で示す主体者抽出工程、図22で示す行動抽出工程、図23で示す行動対象抽出工程、図24で示すシノニム抽出工程、図25で示す特徴語抽出工程を経て、図26に示すような解析結果を得る(ステップS300)。すなわち、"日本電気、光アクセス製品「DW4000」を発売"という情報源から、
主体者:日本電気
製品名:DW4000
行動:発売
特徴語:光アクセス製品
という解析結果が得られる。
次に情報源価値推定部500の主体者判定部501は、情報源の中に例えば"納入"、"採用"といった行動を含むか否かで情報源が生産財に関するものであるか否かを判定する。そして、生産財に関するものと判定した情報源を構成する主体者、製品名、特徴語と、ドメイン辞書格納部508のドメイン辞書とを比較する。ドメイン辞書の単語と、情報源を構成する要素単語とが一部一致又は全部一致した場合に、当該情報源を適合情報源とする。本例においては、図29に示すドメイン辞書において、製品名"DW4000"が一致し、特徴語"光アクセス製品"がドメイン辞書の"光アクセス"と部分一致していることが分かるため、当該情報源を事業ドメインに合致した適合情報源であると判定し、当該情報源を適合情報源として適合情報源格納部に格納する。(ステップS400)。
次に、主体者判定部501が、ドメイン辞書を参照し、情報源から適合情報源を選別する方法について具体的に説明する。図27は、適合情報源選別方法を示すフローチャートである。情報源(ニュース情報源)として、
"オプト販売が光増幅をラマン方式とする「FX4200」をNEEへ納入"
という文字列が情報構造化装置10へ入力されるとする。情報構造化装置10は、図17のステップS100からステップS300まで実行し、図28に示す書式解析結果を得る。すると、主体者判定部501が情報源に含まれる要素単語と事業ドメイン辞書とを照合する。すなわち、図27に示すように、主体者判定部501は、情報源から、行動に対応する単語として"納入"、"採用"が含まれているか否かを検出する(ステップS401)。そして、"納入"、"採用"が含まれており、生産財に関する情報源と判断されたものに含まれる単語と、ドメイン辞書の各カテゴリの単語とをマッチングする(ステップS402)。
そして、1つ以上、一部又は全部一致するものが存在するか否かを判定し(ステップS403)、一致するものがあれば適合情報源として登録する(ステップS404)。次に、情報源の製品名・特徴語等であって、ドメイン情報に登録がないものはドメイン辞書へ追加する(ステップS405)。次いで、適合回数が所定の割合以上であるか否かが判定され(ステップS406)、所定の条件に合致する場合には、情報源の主体者をドメイン辞書へ追加する(ステップS407)。これにより、情報源を構成する"主体者"が、事業ドメインにおける専門業者か、又は総合メーカかを区別することができる。
そして、情報源定量化部504は、このような情報源が到着する毎に企業力測定ツリーの初期スコアを更新し(ステップS500)、企業力計算部601は、更新された初期スコアに基づき各ノードのスコアを算出する(ステップS800)。
次に、初期スコアの更新方法の具体例について説明する。本例においては、顧客企業の純資産が50億、負債が50億、固定資産が30億、流動資産が70億であるとする。情報源のニュースとして、
"ADDI、メトロ事業に向け第三者割当による100億円の増資"
という文字列が情報構造化装置31に入力されるとする。情報構造化装置10はステップS100からステップS400までを実行し、"メトロ"というキーワードによって、主体者判定部501が情報源が事業ドメインに合致していると判定する。そして、この情報源を適合情報源格納部に格納する(ステップS600)。
次に、主体者判定部501は、図9に示す主体者辞書を参照し、主体者"ADDI"が顧客企業であると判定し、情報源格納部503に顧客企業情報源として格納する。過去のニュースも考慮にいれて、主体者が専門業者か総合メーカかを判定するため、主体者が様々な適合情報源ツリーを開発している場合に、誤って異なる事業ドメインの新製品と判定することも減少し、この異なる事業ドメインの新製品を購入した顧客も、誤って新顧客として判定することも減少する。そして、情報源定量化部504は、この顧客企業情報源を読み出し、図13に示す顧客企業力測定ツリーと図14に示す単語定量化マップを元に、当該情報源の各要素単語の初期スコアを算出する(ステップS700)。
ここで、情報源入力前においては、企業力計算部601は、純資産が50、負債が50、固定資産が30、流動資産が70という初期スコアに基づき、その上位層のスコアを算出する。例えば、"投資積極性"のスコア=固定資産/流動資産のスコアで計算されるため、30/70≒0.43となり、"新規投資力"のスコア=純資産/負債で計算されるため、50/50=1となる。そして、"投資力"のスコア=α11×("投資積極性"ノードのスコア)×α12×("新規投資力"ノードのスコア)で計算されるため、α11=α12=1とすると、1×0.43×1×1=0.43となる。
サービス密度、サービスエリア、周期、製品マッチングの初期値を1、α01〜β21=1とすると、
"地域性"ノードのスコア=(α01×"サービス密度"リーフのスコア)+(α02×"サービスエリア"リーフのスコア)=2、
"需要性"ノードのスコア=(β01×"周期"リーフのスコア)+(β02×"製品マッチング"リーフのスコア)=2
"サービス占有力"ノードのスコア=β11×"地域性"ノードのスコア×β12×"需要性"ノードのスコア=4
となり、"顧客企業のスコア"=α21×"投資力"ノードのスコア×β21×"サービス占有力"=4.93と求まる。
そして、上記の情報源が到着すると、情報源定量化部504は、初期スコアを更新する。すなわち、上述の情報源には、"増資"という単語が含まれ、図14の単語・ノード対表に同じく"増資"というワードが含まれることから、ノード"純資産"の初期スコアを更新する。この場合、"純資産"リーフと同じく新規投資力ノードのリーフである"負債"リーフの割合は0であるため、スコア配分しない。すなわち、情報源に"100億円"という単語が含まれるため、"%s円"("%s円"は、"円"の前の数字をノードのスコアとすることを示す。)に対応する"100億"が、"純資産"の初期スコアとなる。
そして、企業力計算部601は、更新された初期スコアに基づき各ノードのスコアを算出する(ステップS800)。"新規投資力"は、情報源が到着後は150/50=3となる。
ADDIの増資ニュースが流れるたびに、"投資積極性"、"新規投資力"ノードの値が変化する。投資力は投資積極性と新規投資力の掛け算で求められ、係数α11及びα12の値をそれぞれ1とすれば、1.9×3.0=5.7が投資力ノードの値となる。もともと投資力ノードの値は0.42×1.0=0.42であったことから、増分の5.7−0.42=5.28が情報源のスコアであることがわかる。ここで、重みα11とα12は事業ドメインに応じて自由な値としてよい。
サービス占有力ノードのスコアは、α、βをいずれも1とすると、地域性のスコア×需要性のスコア=4、上記情報源到着前後での変化分は0である。企業力スコア=投資力かけるサービス占有力であり、情報源到着前後で、5.7×4−0.42×4=21.12が当該情報源のスコアとして求まる。
本実施例においては、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった会社の競合製品を発見し、購入対象として提示することができる。そして、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出し、分類することができる。また、ドメイン辞書を用いて、生産財かつターゲットとする事業ドメインに属している情報源のみ適合情報として抽出することができる。
さらに、企業力計算部601は、競合、顧客、納入企業ごとに定義した企業力測定ツリーを参照し、過去の情報源の価値を含んだ企業力を元に、今回の情報源によって生成される企業力を算出する。そして、情報源が与えられる前と後の企業力の差分を最終的な情報源のスコアとみなす。これにより、主体者辞書を用いて、情報源を顧客企業/競合企業/納入企業に分類し、企業タイプごとの評価テンプレートである企業力測定ツリーを用いて、情報源の初期スコアを企業力の特質に配分し、過去の企業力を加味して情報源の最終スコアを定量化することができる。
本発明の第2の実施例
次に、本発明の第2の実施例について説明する。本実施例は、分類装置が情報源選別部300及びグループ生成部400を有する点、並びに情報源再構築部200bがツリー生成部204及び情報源ツリー格納部205を有する点、情報源選別部300がドメイン辞書を有する点が第1の実施例と異なる。図29は、本実施例にかかる情報定量化装置20を示す図である。
情報定量化装置20は、分類装置21及び定量化装置22を有する。分類装置21は、情報源裁断部100、情報源再構築部200b、情報源選別部300及びグループ生成部400を有する。定量化装置22は、情報源価値推定部500b及び企業力推定部600bを有する。
情報源裁断部100は、第1の実施例と同様の構成を有するため説明は省略する。図30は本実施例の情報源再構築部200bを示す図である。本実施例にかかる情報源再構築部200bは、図30に示すように、情報源再構築部200bは、書式解析部201、書式ルール蓄積部202、要素単語格納部203、ツリー生成部204、及び情報源ツリー格納部205を有する。書式解析部201、書式ルール蓄積部202、及び要素単語格納部203は第1の実施例と同様の構成を有する。
ツリー生成部204は、繋がりのない要素単語から、主体者をルートする情報源ツリーを生成する。図31は、情報源ツリーを示す図である。図31に示すように、主体者名がルートノードとなり、商標を有する製品名がその子ノードとなっている。さらに、派生製品、アクション、特徴語が商標を有する製品名の子ノードとなっている。さらに、シノニム、特徴語が派生製品の子ノードとなり、アクションの対象がアクションの子ノードとなっている。この情報源ツリーは、下記のルールに従って生成される。
(1)主体者名をルートノードとする
(2)製品名は商標の関係で普遍性を有する単語である。製品名を企業名の子ノードとする
(3)派生製品名を、商標を有する製品名の子ノードとする
(4)企業の行動は、製品又は派生製品の子ノードとする
(5)納入先は、行動の子ノードとする
(6)特徴語は、製品名又は派生製品名の子ノードとする
(7)シノニムは、言い換え対象となったキーワードと同じレベルのノードとする
上記ルールに従って生成された情報源ツリーは、1件の情報源に対応する。生成された情報源ツリーは、情報源ツリー格納部205へ格納される。
この情報源再構築部200bにより、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出し、これらの要素単語からツリー構造を構築することができる。抽出された要素単語をツリー構造にすることで、要素単語を構造化した情報源ツリーを得ることができる。
図32は、本実施例における情報源選別部300を示すブロック図である。図32に示すように、情報源選別部300は、ツリー選別部301、ドメイン辞書格納部302、適合情報源ツリー格納部303、及び非適合情報源ツリー格納部を有する。これらの手段はそれぞれ概略次のように動作する。
ツリー選別部301は、ドメイン辞書格納部302のドメイン辞書を参照し、事業ドメインに適合するツリーのみを適合情報源ツリーとして選択する。具体的には、先ず、情報源ツリーの中に例えば"納入"、"採用"といった行動を含む言葉があれば、生産財に関する情報源であると判定する。上述の第1の実施例においては、情報源価値推定部500の主体者判定部501がドメイン辞書を参照し、情報源を適合情報源か非適合情報源か選別するものとして説明したが、本実施例においては、情報源を適合情報源か、又は非適合情報源かを選別する選別情報源選別部300を別途設けるものである。
次にツリー選別部301は、ドメイン辞書を参照し、生産財に関する情報源と判定された情報源ツリーを構成する要素単語、すなわち主体者、製品名、行動、特徴語、及びシノニムと、ドメイン辞書格納部302に格納されている事業ドメイン専門の企業名、製品名、及び特徴語とを比較する。
そして、ツリー選別部301は、生産財に関する情報源と判定された情報源ツリーの各要素単語とドメイン辞書の単語を比較して、マッチするものが1つ以上合った場合に、その情報源ツリーは事業ドメインに合致した生産財と判定し、適合情報源ツリー格納部303に格納し、マッチするものがない場合には、非適合情報源ツリー格納部304に格納する。そして、適合情報原ツリー格納部303に格納した情報原ツリーを構成する"製品名"、"特徴語"、及び"シノニム"のうち、ドメイン辞書に登録がないものをドメイン辞書格納部302のドメイン辞書へ登録する。上述したように、情報源ツリーを構成する"主体者"は、事業ドメインにおける専門業者と総合メーカを区別するため、情報源ツリーの各要素単語がドメイン辞書と適合又は非適合する個数を毎回測定する。同一主体者の情報源に関して、情報源の総数に対し、所定の割合th1(0<th1<1)以上の数の情報源が適合情報源ツリーであれば、総合メーカとして当該情報源ツリーの主体者をドメイン辞書の主体者カテゴリに登録し、所定の割合未満である場合は専門メーカとして主体者カテゴリに登録する。
図33は、本実施例におけるグループ生成部400を示すブロック図である。図33に示すように、グループ生成部400は、ツリー増殖部401、及び技術辞書格納部402を有する。これらの手段はそれぞれ概略次のように動作する。
ツリー増殖部401は、事業ドメインの生産財と判定されなかった情報源ツリーを非適合情報源ツリー格納部304から取得し、技術辞書格納部402の技術辞書を参照して事業ドメインに合致するものがないか検査することで、非適合情報源ツリーを適合情報源ツリーに昇格させる。
技術辞書は、技術用語とシノニムの集合を、その事業ドメインにおける上位概念・下位概念に基づき分類したものである。例えば、図34は製品構成をベースにした技術辞書である。この技術辞書では、生産財を生産するためのモジュール構成を元に、パーツに関する技術用語を最下位のノードに、パーツ集合から構成されるモジュール部分をその上位に、モジュールから構成される製品を最上位のノードに、といった階層構造を定義している。すなわち、最下位には、"光増幅"、"光アクセス"、"OC−12"、"SRM−16"が定義され、その上位に"DWDM"、"SONET/SDH"が定義され、最上位には、"光伝送装置"が定義されている。また、それぞれのノード間の距離も技術辞書作成時に設定する。図35は、技術辞書の構造を示す図である。同時に利用される用語同士は距離が短く、同時に利用されない用語は距離を長く置くように設定する。例えば"光増幅"と"光アクセス"との距離は0.6であり、"光増幅"と"SONET/SDH"の距離は2.3である。生産財にも様々なドメインがあるため、分析対象の事業ドメインに合致するものをあらかじめ準備しておく。
この技術辞書を使用することで、あるキーワードと同種のワードが含まれている場合であって、そのワードがキーワードに一致しない場合であっても、適合情報源とすることができる。よって、必要な情報が漏れてしまったりする可能性を低減し、新しい競合製品や、その特徴語を容易に追加することができる。
なお、本実施の形態においては技術辞書として説明するが、単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した単語辞書であればよい。例えば、生鮮食品業界の企業ニュースを取り扱う場合、技術辞書は、"食品"が最上位ノード、その下位ノードに"肉"、"魚"、更に"肉"の下位ノードに"豚肉"、"牛肉"、"鶏肉"などのノードを有するツリー辞書とすることも可能である。
先ず、事業ドメインに合致する生産財商品の特徴語をドメイン辞書格納部302のドメイン辞書から取得し、非適合情報源ツリーの特徴語と比較して、類似度を計算する。類似度は、上記技術辞書に基づき計算し、非適合情報源ツリーと技術辞書との距離が所定の閾値以下であれば非適合情報源ツリーを事業ドメインの生産財に関する情報と判定し、適合情報源ツリーとして適合情報源ツリー格納部303に格納する。すなわち、非適合情報源ツリーから、事業ドメインに適合する蓋然性が高いものを抽出し、適合情報源ツリー格納部303へ再登録する。そして、このとき、適合情報源ツリーに昇格した非適合情報源ツリーを構成する要素単語のうち、技術辞書に登録されていない単語を技術辞書に登録することで技術辞書を増殖する。さらに、ドメイン辞書格納部302に登録されていない特徴語や製品名は、新たにドメイン辞書格納部302に追記することでドメイン辞書を増殖する。
このツリー増殖部401により、ドメイン辞書を用いて非適合と判定された非適合情報源ツリーを、技術辞書を用いて適合ツリーに昇格させることができる。また、ツリー増殖部401は、既存のドメイン辞書や技術辞書を参照し、新たに適合情報源ツリーとして適合情報源ツリー格納部303に加えられたツリーに含まれる主体者や特徴語が既存のドメイン辞書や技術辞書に登録されているか判定する。もし登録されていなければ、新たにドメイン辞書や技術辞書に登録することで、ドメイン辞書や技術辞書にない単語を、ドメインに適合している情報源ツリーに含まれる要素単語を用いて増殖させることができる。
従来、生産財の製品企画を行うためにも、競合他社製品のベンチマーク、技術動向、市場動向などを収集する必要がある。このため、従来であれば例えばコンサルタントと共同で社外の外部環境調査を行う必要があった。また、製品企画に役立つ情報源として、インターネット上に散在しているホームページ、営業担当者が保持しているヒアリング情報、雑誌記事などを、漏れなく収集し纏めあげる作業は労力を要する。継続的に人が行う作業であるため、調査する人の力量に大きく依存し、客観的な情報に基づいて製品企画を行うことが困難であった。このため、生産財の製品企画においては、競合他社の新製品がリリースされたが、横並びの製品であるように見えてしまい、どのような差異化要因があるのか、分かりづらいという課題があった。
このような課題に対し、本実施例にかかる情報構造化装置10によれば、情報源から特徴語などの要素単語が抽出できるため、競合他社の新製品がどのような差異化要因を保持しているのか分かりやすくなるため、上記課題を解決することができる。また、情報源を、事業ドメイン辞書を参照するのみならず、非適合情報源ツリーと判断された情報源ツリーも技術辞書を参照することで適合情報源ツリーに昇格させることができ、情報源から漏れなく必要な情報源を抽出することができる。
図36は、本実施例にかかる情報源価値推定部を示す図である。図36に示すように、情報源価値推定部500bは、ドメイン辞書格納部を有さず、情報源再構築部2000の出力ではなく、グループ生成部400の出力が供給される点が第1の実施例と異なる。その他の点は第1の実施例と同様である。本実施例のドメイン辞書格納部は、情報源選別部300に設けられる。なお、本実施例においては、定量化装置22は、情報源ツリーを定量化するものとして説明するが、実施例1と同様、情報源のままツリー構造とせずに扱ってもよいことは言うまでもない。企業力測定部600bは、情報源ではなく情報源ツリーを受け取る以外、第1の実施例と同様である。
次に、図37のフローチャートを参照して、本発明の第2の実施例の動作について詳細に説明する。先ず、ツリー選別部301は、ドメイン辞書を参照し、情報源ツリーから適合情報源ツリーを選別する方法について具体的に説明する。情報源(ニュース情報源)として、
"オプト販売が光増幅をラマン方式とする「FX4200」をNEEへ納入"
という文字列が情報構造化装置10へ入力されるとする。情報構造化装置10は、図37のステップS100からステップS300まで実行し、図28に示す書式解析結果を得る。ツリー生成部204は、この書式解析結果から図38に示すような情報源ツリーを生成し、ツリー選別部301が情報源ツリーを構成する要素単語と事業ドメイン辞書とを照合する。すなわち、図27に示すように、ツリー選別部301は、情報源ツリーから、行動ノードに"納入"、"採用"が含まれているか否かを検出する(ステップS401)。"納入"、"採用"が含まれており、生産財に関する情報源ツリーと判断されたツリーを構成する単語と、ドメイン辞書の各カテゴリの単語とをマッチングする(ステップS402)。そして、1つ以上、一部又は全部一致するものが存在するか否かを判定し(ステップS403)、ツリーを適合情報源ツリーとして登録する(ステップS404)。
次に、ツリーの製品名・特徴語などであって、ドメイン情報に登録がないものはドメイン辞書へ追加する(ステップS405)。次いで、適合回数が所定の割合以上であるか否かが判定され(ステップS406)、所定の条件に合致する場合には、情報源ツリーの主体者をドメイン辞書へ追加する(ステップS407)。これにより、情報源ツリーを構成する"主体者"が、事業ドメインにおける専門業者か、又は総合メーカかを区別することができる。本例においては、図28に示す情報源ツリーを構成する要素単語と図8に示す事業ドメイン辞書とは部分一致もしないため、この事業ドメイン選別工程S400では、入力された情報源が事業ドメインに合致しないと判定される。合致しない場合は、非適当情報源ツリー格納部304に当該情報源ツリーを格納する。
次に、ツリー増殖部401が技術辞書を参照して、非適合情報源ツリー格納部304の情報ツリーから事業ドメイン候補を選別することで情報源ツリーを増殖すると共に技術辞書及びドメイン辞書の単語を増殖する(ステップS500)。図39は、情報源ツリーの増殖方法を示すフローチャートである。
図39に示すように、ツリー増殖部401は、先ず、図34に示す技術辞書の全ノードと、非適合情報源ツリー格納部304に格納された非適合情報源ツリーの各要素単語とを照合する(ステップS411)。本例においては、特徴語"光増幅"が技術辞書の一のノードと一致するため、事業ドメイン候補として列挙される。(ステップS412)そして、この"光増幅"とドメイン辞書の特徴語"光アクセス"との距離を、技術辞書を使用して計算する(ステップS413)。この場合、"光増幅"と"光アクセス"の距離は0.6である。ここでは閾値が1.5未満を事業ドメインとすると設定されているものとすると(ステップS414)、光増幅という特徴語を含む当該情報源もツリー増殖部401により事業ドメインに関連するものと判定される。そして、事業ドメインに関連するものと判定された非適合情報源ツリーを、適合情報源ツリー格納部303に格納する(ステップS415、ステップS600)。
そして、ツリー増殖部401は、この事業ドメインに関連するものと判定された非適合情報源ツリーに基づき、特徴語として「ラマン方式」を追加する(ステップS416)。また、ツリー増殖部401は、非適合情報源ツリーのうち、事業ドメインに関連するものと判定された情報源ツリーに基づき、技術辞書の光増幅ノードの子ノードとして、「ラマン方式」ノードを例えば固定距離0.1で追加する。この場合、このように自動増殖される単語については、システムの固定値を距離として設定することも可能であるが、例えば、追加する単語と、当該単語を追加される単語とのオリジナル文章(情報源)における位置関係に基づき算出すること等も可能である。また、適合回数が所定の割合以上であるか否かを判断し(ステップS417)、適合回数が所定の割合以上である場合には、ドメイン辞書の主体者として「オプト販売」を追加する。(ステップS418)。事業ドメインに合致する情報源の入力によって、自動的に事業ドメイン辞書及び技術辞書が増殖する。
次に、情報源価値推定部500bが情報源ツリー及び図14に示す単語定量化マップを参照し、企業力測定ツリーのリーフのスコア(初期スコア)を算出し、企業力計算部601は、その初期スコアに基づき各ノードのスコアを算出し、最上位ノードのスコア(企業力)を算出する(ステップS800)。
次に、他の動作例について説明する。ここでは、未知の競合商品が未知の顧客に納入されたことを検出する例を示す。なお、本実施例においては、図40に示す事業ドメイン辞書と、図41に示す技術辞書を利用するものとする。
情報源のニュースとして、
"タメシタ産業、ADDI向け最軽量「J703iU」を納入"
という文字列が情報構造化装置に入力されることとする。情報構造化装置は、情報構造化装置10と同様に、ステップS100からステップS300まで実行し、図42に示す書式解析結果を得る。そして、ツリー生成部204が情報源ツリーを生成する(ステップS360)。次に、図40に示す事業ドメイン辞書を参照し、この情報源ツリーが事業ドメインに属さないことを判定し(ステップS400b、S410)、図41に示す技術辞書を参照し、この情報源が事業ドメイン候補にならないことを判定する(ステップS500)。
次いで、情報源のニュースとして、
"タメシタ産業、ADDIへDWDM製品「ADDI5000」を納入"
という文字列が情報構造化装置20に入力されるとする。情報構造化装置20は同様にステップS100からステップS300まで実行し、図43に示す書式解析結果を得、情報源ツリーを生成する(ステップS360)。次に、"納入"や"採用"といった言葉を含む情報源が入力された場合は、ツリー選別部301が、図40に示す事業ドメイン辞書を参照し、当該情報源ツリーが事業ドメインに合致した適合情報源ツリーであるか否かを判定する(ステップS400)。
そして、情報源ツリーが非適合情報源ツリーである場合(ステップS410:Yes)、図41に示す技術辞書を参照し、この情報源がDWDMというキーワードで一致し、事業ドメインに属する製品との特徴語と比較して、閾値以下の距離であるため、事業ドメインに属すると判定する(ステップS500)。ここで、"タメシタ産業"は、事業ドメインに合致する適合情報源ツリー、及び合致しない適合情報源ツリーを有するため、事業ドメイン辞書の主体者として登録されないが、製品名及び特徴語は事業ドメイン辞書に登録される(図44)。
そして、情報源が入力される度に、第1の実施例と同様に、適合情報源ツリーまたは非適合情報源ツリーを判別し、ステップS700にて企業力測定ツリーのリーフの初期スコアを算出し、ステップS800にて、企業力を再度算出する。
本実施例においては、第1の実施例と同様、製品名や競合企業、さらには顧客企業が未知であっても、事業ドメインに合致する適合情報源ツリーであるか否かを、技術辞書を用いて判定する。このため、自社にとって脅威のある納入ニュースと、そうでないものを分類することが可能である。さらに、本実施例においては、主体者を分類することができるので、必要なカテゴリの企業情報を所望のタイミングで抽出し、表示等させることができる。
本発明の第3の実施例
以下に説明する第3の実施例乃至第7の実施例においては、それぞれ波及力計算部70
0、需要周期推定部800、潜在購買力推定部900、販売力推定部1000、競争力増強部品推定部1100を設ける。各ブロックは、それぞれ特定の企業力測定ツリーのリーフのスコアを更新する機能を備える。すなわち、波及力計算部700は、一の情報源が競合企業の企業力に与える波及力を算出すると共に、競合企業力測定ツリーの機能特徴リーフのスコアを更新する。需要周期推定部800は、製品の需要周期を推定すると共に、顧客企業力測定ツリーの周期リーフのスコアを更新する。潜在購買力推定部900は、顧客企業の潜在購買力を推定し、販売可能性が高い製品の機能及び価格を推定すると共に、顧客企業力測定ツリーの製品マッチングリーフのスコアを更新する。販売力推定部1000は、企業の販売力を推定すると共に、競合企業力測定ツリーの売り上げ実績リーフのスコアを更新する。競争力増強部品推定部1100は、競争力に影響のある部品を推定すると共に、部品納入企業力測定ツリーの差異化リーフのスコアを更新する。なお、以下の第3乃至第7の実施例においては、グループ生成部400が出力する適合情報源ツリーを使用して各処理を実行するものとして説明するが、情報源再構築部200が抽出した要素単語を使用して各処理を実行することも可能である。
先ず、本発明の第3の実施例について説明する。図45は、本実施例にかかる情報構造化装置30を示す図である。本実施例は、過去の情報源を辿ることで、現在の情報源の影響範囲を直接記載されていない企業にまで及ばせるものである。本情報構造化装置30は、図45に示すように、第2の実施例における情報構造化装置20に、定量化装置として波及力計算部700を更に設ける構成を有する。その他の構成は、第2の実施例と同様であり、その詳細な説明は省略する。本第3の実施例は、部品メーカが技術的優位性を有することを示す例である。
図46は、本実施例における波及力計算部700を示すブロック図である。図46に示すように、波及力計算部700は、納入業者の部品納入情報源選別部701、納入先企業抽出部702、特徴語列挙部703、近距離用語抽出部704、及び波及力計算部705を有する。この波及力計算部700は、情報源の影響範囲及び影響力を技術辞書を用いて推定する。情報源に含まれる特徴語が技術辞書に登録されていた場合、その特徴語と近い距離の別の特徴語を列挙する。情報源に含まれるターゲット企業が、列挙された特徴語に関連する商品を過去に開発していた場合に、技術的な距離から波及スコアを計算する。各ブロックについて詳述する。
部品納入情報源選別部701は、情報源ツリーの中から納入業者の部品納入情報源ツリーのみ抽出する。納入先企業抽出部702は、部品の納入先企業、すなわち部品を購入した競合企業を抽出し、その競合企業がリリースした製品のニュースを抽出する。特徴語列挙部703は、競合企業の製品リリース情報に含まれる特徴語を全て列挙する。近距離用語抽出部704は、部品の特徴語を含む技術用語が技術辞書にあるか調査し、ある閾値以下のものを全て列挙する。波及力計算部705は、特徴語列挙部703で列挙した単語集合と、近距離用語抽出部704で列挙した単語集合を比較し、一致するものがあれば納入部品が製品に採用された可能性が高いと判定する。波及力計算部705は、近距離用語抽出部704にて抽出した技術用語の距離の逆数(波及係数)と、部品納入企業力測定ツリーから求まる情報源価値を掛け合わせた波及力を、競合企業力測定ツリーを構成する機能特徴リーフの初期スコアに加算する。
このことにより、過去の情報源ツリーをたどることで、現在の情報源の影響範囲が直接記載されていない企業にまでは波及スコアを及ばせることができる。例えば、部品納入業者のニュースは、部品納入企業ツリー(図38)という閉じた系により、初期スコアを算出していたのに対し、競合企業ツリー(図37)に波及スコアを与える仕組みを導入することにより、すなわち、波及スコアを競合企業ツリーの機能特徴リーフに割り当てることにより、部品納入業者のニュースが競合企業ツリーのリーフ値に影響を及ぼすことができる。これらにより、情報源を事業ドメインに合致したものに分類し、合致した情報源のスコアのみを単語スコアと企業力スコアから算出することで、露出度の高い企業や商品を、新たな取引先として選別することができる。
図47のフローチャートを参照して、本発明の第3の実施例の動作について詳細に説明する。前提として、第2の実施例の結果増殖した事業ドメイン辞書(図34)と、技術辞書(図31)の値を利用する。
情報源のニュースとして、
"新川電工は、ラマン方式で世界最高レベルの増幅モジュール「A200R」を開発"
という文字列が情報構造化装置51に入力されるとする。情報構造化装置51はステップS100からステップS600まで実行し、技術辞書に"ラマン方式"というキーワードがあることから、この情報源が光事業ドメイン(適合情報源ツリー)であると判定する。主体者判定部501は、主体者が競合企業か納入企業か又は顧客企業かを判別するため、図49に示す主体者辞書を参照する。これにより、新川電工が納入企業であると判定し、情報源格納部503に、納入企業情報源ツリーとして格納する。
情報源定量化部504は、情報源格納部503の納入企業情報源ツリーを読み出し(ステップS421)、初期スコアを算出する(ステップS700)。図40に示す部品納入企業力測定ツリーと図41に示す単語・ノード対応表を元に定量化を行う。情報源ツリーには、「開発」というキーワードがあり、図40の単語・ノード対応表から、スコアが2倍にされることが記載されている。また、部品バリエーションリーフに0.4、開発スピードリーフに0.2、部品最高性能順位リーフに0.4の割合でスコアを分配するように記載がされている。全てのリーフは初期値として1が与えられている。事業ドメイン辞書を参照すると、過去にA200Rという製品はないことが分かるため、新製品であることが分かり、部品バリエーションリーフは下記の計算式で求めることができる。
部品バリエーションリーフの値=2×過去の部品バリエーションリーフの値×0.4=2×1×0.4=0.8
開発スピードリーフの値=2×前回の製品リリース次期からの経過時間(月)/12×0.2=2×1×0.2=0.2
部品最高性能順位リーフの値=2×{e^{−(order−1)}+1}×0.4=2×2×0.4=1.6
次に、企業力計算部601が最終スコアを算出する(ステップS800)。ここで、企業力計算部601は、情報源ツリーの主体者を判断し、主体者が顧客企業又は納入企業である場合にのみ最終スコアを算出する。主体者が競合企業である場合は、後述の波及力計算を行なってから最終スコアを算出する。本例においては、納入企業の情報源であるため、その最終スコアを算出する。すなわち、先ず、納入企業力測定ツリーにおける開発力ノードスコアは次のような計算式で求めることができる。
開発力=0.8+0.2+1.6=2.6
顧客利便性や信用力が初期値のまま1であり、中間ノードの係数α、β、γも値が1であったとすると、部品納入企業の企業力値は、
部品納入企業の値=顧客利便性+信用力+開発力=1+1+2.6=4.6
となる。情報源の入力前では、部品納入企業の値は合計3であったため、増加分4.6−3.0=1.6が情報源のスコア(価値)として求まる。
さらに情報源のニュースとして、
"新川電工、光増幅モジュール「A200R」をオプト販売に納入"
という文字列が情報構造化装置51に入力された場合には、情報構造化装置51はステップS100からステップS400まで実行し、図48に示す情報源ツリーを得る。そして、技術辞書に"光増幅"というキーワードがあることから、この情報源が光事業ドメイン(適合情報源ツリー)であると判定する(ステップS500、S600)。主体者判定部501は、主体者が競合企業か納入企業かを判別するため、図49に示す主体者辞書を参照する。これにより、新川電工が納入企業であると判定し、情報源格納部503に、納入企業情報源ツリーとして格納する。
そして、同様に、情報源定量化部504により初期スコアを算出し、企業力計算部601は主体者が競合企業以外の場合は、初期スコアに基づき最終スコアを算出する(ステップS700、800)。すなわち、主体者判定部501は、図29に示す主体者辞書を参照し、主体者"新川電工"が納入企業であると判定し、情報源格納部503に納入企業情報源ツリーとして格納する。そして、情報源定量化部504は、この納入企業情報源ツリーを読み出し、図40に示す納入企業力測定ツリーと図41に示す単語定量化マップを元に、当該情報源ツリーの各要素単語の初期スコアを算出する(ステップS700)。そして、企業力計算部601は、更新された初期スコアに基づき各ノードのスコアを算出する(ステップS800)。
次に、波及力計算部700により競合企業の企業力ツリーの機能特徴ノードのスコアに乗算する波及スコアを計算する(ステップS900)。波及力計算部700には、情報源価値推定部500と同様の情報源ツリーのデータが入力される。図50は、波及力算出方法の詳細を示すフローチャートである。先ず、部品納入情報源選別部701が適用情報源ツリーの集合から納入元企業(納入企業)の情報源ツリーを選別する(ステップS421)。次いで、納入先企業抽出部702は、抽出した情報源ツリーの主体者(納入元企業)の納入先企業(競合企業)に関する製品ニュースの情報源があるか否かを、適合情報源ツリー格納部303にて検索する(ステップS422)。ここでは、"新川電工"の納入先である"オプト販売"に関する製品ニュースがあるか否かを検索する。そして、"オプト販売は、μレーザを用いたロスレス光伝送装置「FX5000」を開発"の情報源があることを発見する。そして、特徴語列挙部703は、S422にて抽出された情報源(製品ニュース)から特徴語を抽出する(ステップS424)。ここでは、"μレーザ"、"ロスレス伝送装置"の特徴語を抽出する。
一方、近距離用語抽出部704は、技術辞書格納部402の技術辞書を参照し、S421で選別した納入元企業の情報源ツリーに含まれる特徴語と部分一致、又は完全一致の単語があるか否かを検索する(ステップS423)。ここでは、情報源ツリーにおける"光増幅モジュール"が図31に示す技術辞書に存在するか探索し、"DWDM"ノードの子ノードに"光増幅"ノードが存在することがわかる。これにより、光増幅の向上が、DWDMの向上になることが判明する。すなわち、技術辞書において、上位要素は下位要素から構成されるため、下位要素で優れた部品があれば、それに伴い上位要素の製品の差異化につながる。そして、部分一致又は完全一致した単語との距離が所定の閾値以下の単語を抽出する(ステップS425)。ここでは、"光増幅"から距離1.5以下を抽出するものとすると、"DWDM"(距離0.3)、"光アクセス"(距離0.6)、"光伝送装置"(距離1.3)の3つが抽出される。
波及力計算部705は、特徴語列挙部703が列挙した特徴語と、近距離用語抽出部が列挙した技術単語とを比較し(ステップS426)、一部又は全部が一致するものがあるか否かを判定し(ステップS427)、一致するものがある場合は、その波及スコアを計算する。ここでは、ステップS424で列挙された"ロスレス伝送装置"と、ステップS425で列挙された"光伝送装置"とにおいて。"伝送装置"で一致する。一致した場合、一致した記述単語と、情報源ツリーの単語と一致した技術用語との距離の逆数が波及係数となる。波及係数は、納入企業の情報源の価値に乗算され、この値が納入先企業(競合企業)の企業力測定ツリー(図39)における機能特徴リーフのスコアに加算される。すなわち、波及力計算部は、ステップS428にて、"光増幅"ノードと"光伝送装置"ノードとの距離1.3の逆数≒0.77を求める。
波及力=競合企業測定ツリーの機能特徴リーフの増加分スコア=波及係数×部品納入企業の情報源のスコア(価値)=0.77×1.6=1.232
こうして、機能特徴リーフの初期スコア1に波及力1.232が加算されて更新され、この更新された初期スコアに基づき、企業力計算部601が情報源のスコアを算出する。
本実施例においては、主体者企業辞書を用いることで生産財メーカ企業と部品メーカ企業を区別し、部品の特徴語から性能順位を推定するため、部品業者の技術優位性を測定することが可能になっている。また、部品の技術優位性のニュースと納入先(競合企業)のニュースを複合して評価するため、部品を採用している企業の技術優位性も更新することができる。さらに、波及力により競合企業の機能特徴リーフを増加させ、競合企業の企業力に影響を及ぼすことができる。
なお、本実施例においては、適合情報源ツリーから波及力を算出するものとして説明したが、波及力計算部700が技術辞書又は事業ドメイン辞書を参照し、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。
本発明の第4の実施例
次に、本発明の第4の実施例について説明する。本実施例は、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定するものである。上述の第4の実施例は、企業をフォーカスし、どの企業が活発に活動しているか等の企業力を測定するものであったのに対し、本実施例においては、商品にフォーカスをあて、どのような商品が売れているかを知ることで、例えば第3の実施例のどのような企業が活発かという情報と共に、商品開発にあたり、どのような視点をもって商品をつくるかを分析することができる。
図51は、本実施例における需要周期を示す図である。横軸に時間、縦軸に需要をとればある商品の需要周期を表すことができる。ここで、情報源から、ある商品Pを競合企業が納入した量D1及びある商品を顧客企業が購入した量D2を抽出し、両者を加算すれば、そのときの商品Pの需要がわかる。なお、加算する際には、競合企業の納入先が購入した顧客企業である場合を除いている。また、納入実績や購入実績などからどの企業が活発に活動しているかも判断することができ、本実施例においては、これらの情報を合わせて表示部に表示することが可能である。
図52は、本発明の第4の実施例にかかる情報構造化装置40を示す図である。本情報構造化装置40は、図52に示すように、第3の実施例における情報構造化装置30に、定量化装置42として需要周期推定部800を更に設ける構成を有する。その他の構成は、第3の実施例と同様であり、その詳細な説明は省略する。本実施例は、商品需要を推定すると共に、その推定結果を、図38に示す顧客企業力測定ツリーの周期リーフに反映させる。
図53は、本実施例における需要周期推定部800を示すブロック図である。図53に示すように、需要周期推定部800は、製品採用情報選別部801、製品納入情報選別部802、重複検知部803、月間累計カウンタ804、及び商品需要表示部805を有する。
需要周期推定部800は、顧客企業と競合企業のニュースが、市場全体の需要を予測するデータを生成するように動作する。分析した月におけるグラフの勾配に対し、sin関数を適用した値を、顧客企業力測定ツリーの周期リーフの値として採用する。
すなわち、需要周期推定部800の製品採用情報選別部801及び製品納入情報選別部802が、それぞれ顧客の生産財購入・採用ニュースと、競合他社の生産財販売・納入実績ニュースを、情報源格納部503から抽出する。重複検知部803は、製品採用情報選別部801が情報源格納部503から抽出した情報源ツリーに含まれる採用製品及び納入元を抽出し、製品納入情報選別部802が情報源格納部503から抽出した情報源ツリーに含まれる納入商品及び納入先を抽出し、製品名が一致するか否か、納入先と納入元が一致するか否かを判断する。同じ製品か否かの判定は、技術辞書の最上位ノードの子供ノード(DWDM又はSONET/SDH)以下の特徴語を含むか否かで判定することができる。一致する場合は、その分の製品納入量(採用量)を全体の納入量(採用量)から減じる。月間累計カウンタ804は、重複検知部803の検知結果に基づき、横軸に時間推移を、縦軸に同じ商品グループに分類されている商品の売り上げ実績をプロットし、図51に示すような商品需要周期グラフを生成する。これによって、周期的に発生する生産財の置き換え需要の傾向を予測し、これを商品需要表示部805にて表示することにより、ある商品グループの需要が下がっているのか、上がっているのかを製品毎に提示することができる。
さらに、企業力計算部601は、この需要勾配の数値を顧客企業力測定ツリーの周期の初期スコアに置き換える。需要周期推定部800によって、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定することができる。従来、競合他社のどの製品がどれだけ売れているのか、分かりづらく、また、顧客の反応が直接見えないため、どのような需要があるのか分かりづらいという課題があったが、本実施例によりこれを解決する。
図54のフローチャートを参照して、本発明の第4の実施例の動作について詳細に説明する。
"NEE、オプト販売の「FX4200」をアメリカ〜日本のバックボーン回線に採用"
というニュースが到着したとする。NEEは顧客企業であるため、製品採用情報選別部801により、この情報源格納部503からこの製品採用情報源ツリーが検出され(ステップS431)、採用製品及び納入元が列挙される(ステップS432)。本例では、採用製品が"FX4200"で、納入元は"オプト販売"となる。次に、製品納入情報選別部802が情報源格納部503に格納されている過去の情報源から、競合企業の製品納入情報源ツリーとして
"オプト販売が光増幅をラマン方式とする「FX4200」をNEEへ納入"
を検出し(ステップS433)、その納入商品の納入先を列挙する(ステップS434)。本例では、納入商品が"FX4200"で、納入先が"NEE"となる。
次いで、重複検知部803により、製品名、納入先、納入元が一致しているか判定される。全て一致の場合は、2つの情報源が重複したと判定する。本例では製品名が一致ため、2つの情報は1つの売り上げ(製品販売)として月別需要に加算する(ステップS436)。製品名、納入先、納入元のいずれも一致しない場合は、別個の需要・供給として月別需要に加算する(ステップS438)。同様に顧客企業の採用情報、及び競合企業の納入情報で製品売り上げを月別に計上する。例えば、4月が5売り上げ、5月が6売り上げ、6月が5売り上げという結果になったとする。この場合、4月から6月までの3ヶ月の売り上げ結果(需要)を用いてベジエ曲線を描く(ステップS437)。本例では、5月の増加率はsin(BezierFunction(5,6,5))=sin(0)=0となる。すなわち、需要は横ばい傾向であることが推定できる。このベジエ曲線を商品需要表示部805により表示する。
本実施例においては、顧客に関する情報と競合他社に関する情報を組み合わせ、及び情報源の等価性を用いることで商品需要の推定が可能となる。すなわち、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定することができる。
なお、本実施例においては、適合情報源ツリーを用いて需要周期を推定するものとして説明したが、需要周期推定部800がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。
本発明の第5の実施例
次に、本発明の第5の実施例について説明する。図55は、本発明の第5の実施例にかかる情報構造化装置50を示す図である。本実施例は、財務諸表と、顧客の生産財購入履歴、又は競合他社の販売実績から、顧客の潜在購買力を推定し、優良顧客を推定するものである。本実施例にかかる情報構造化装置50は、図55に示すように、第4の実施例における情報構造化装置40に、定量化装置52として潜在購買力推定部900を更に設ける構成を有する。その他の構成は、第4の実施例と同様であり、その詳細な説明は省略する。
図56は、本実施例における潜在購買力推定部900を示すブロック図である。図56に示すように、第4の実施例における需要周期推定部800の製品採用情報選別部801、製品納入情報選別部802、及び重複検知部803と共に潜在購買力推定部900を構成する。潜在購買力推定部900は、さらに、他社製品特徴語選別部904、自社類似製品選別部905、他社製品採用顧客選別部906、財務情報取得部907、投資実績計算部908、投資類似度計算部909、顧客集合選別部910、及び他社製品未採用顧客選別部911を有する。
この潜在購買力推定部900は、顧客の財務諸表から資産余裕度を算出するとともに、生産財の購買履歴を重ね合わせることで、どの資金レベルでどのような特徴の生産財を購入する顧客であるのか、購買特性を提示する。顧客企業の資金面の投資姿勢と、実際に購入した商品から、自社製品の販売がしやすい顧客企業を指標化し、企業力更新部が顧客企業の製品マッチング特性に加算する。このことにより、自社にとっての優良顧客のランキングを行い、財務諸表と、顧客の生産財購入履歴、又は競合他社の販売実績から、顧客の潜在購買力を推定することができる。これは、従来、生産財を購入する余力のある潜在的な顧客と、従来から取引関係にある顧客のどちらを優先すべきか分かりづらいという課題を解決する手段となる。
図57は、各企業の納入・購買実績のある商品の特徴を示す図である。図57では、一般に機能が高くなるほど、価格も高くなるものとしている。この情報構造化装置61を使用して構造化された情報を取得する企業を企業Aとする。企業Aは競合企業に属するものとする。顧客aはそれよりも低機能で低価格の製品を製造しており、顧客bは更に低機能で低価格の製品を製造している。競合企業B、Cは、企業Aとは異なる価格帯、機能の製品を製造し、それぞれ納入実績があるものとする。ここで、顧客企業が求めている機能及び価格の製品を製造しなければ製品を売ることができない。また、ライバル企業が既に製造し、納入実績がある製品と同様の製品は、既に製造されているため販売できる可能性が低い。すなわち、顧客企業が求めている機能及び価格であって、他の競合企業が製造していない製品を製造すれば販売できる可能性が高い。例えば、企業Aが高機能、高価格の製品を製造しようと計画する際に、この情報構造化装置61を使用して分析を行なうことで、より販売できる可能性が高い機能及び価格のものに製品を見直すことができる。
図56に戻って、製品採用情報選別部801は、情報源ツリーの中から、顧客企業の製品採用情報源ツリーを選別する。製品納入情報選別部802は、情報源ツリーの中から、競合企業の製品納入情報源ツリーを選別する。重複検知部803は、顧客企業の製品採用情報源ツリーと製品納入情報源ツリーの等価性を計算し、同じものと判定された場合には、どちらか一方の情報源ツリーを破棄する。
次に、他社製品特徴語選別部904は、顧客に採用実績のある製品の特徴語を情報源ツリーの中から抽出する。自社類似製品選別部905は、競合他社の採用実績のあった製品の特徴語を自社製品がもっているか否かを判定し、持っていればその自社製品をピックアップする。他社製品採用顧客選別部906は、主体者辞書から顧客リストを取り出すと共に重複検知部903から得た情報源ツリーのうち、他社製品を採用した顧客企業を製品別に列挙する。一方、財務情報取得部907は顧客企業の公開された財務情報を取得する。例えば四半期又は半期毎に公開される企業の財務報告書から財務情報を抽出したり、情報源の中に含まれる財務情報を抽出することで得ることができる。または、外部から入力するようにしてもよい。投資実績計算部908は固定資産への投資額を計算する。投資類似度計算部909は、固定資産/流動資産で求めた基準(投資姿勢)で顧客企業をソートする。顧客集合選別部910は、他社製品を購入した顧客リストと全ての顧客の投資姿勢リストを入力とし、投資姿勢が類似しており、他社製品を購入していない顧客を選別する。この場合、他社製品を採用した企業の前後1社ずつを全て列挙する。
他社製品未採用顧客選別部911は、また、納入実績のある他社製品の特徴語と自社製品の特徴語を比較し、機能類似度を(部品・完全マッチする語数/他社製品と自社製品の前特徴語数)によって算出する。また、投資姿勢類似度を1−e^(−(/|固定資産/流動資産−固定資産/流動資産|))で計算し、それぞれ掛け合わせた値を、図38に示す顧客企業力測定ツリーの製品マッチングリーフの初期スコアとする。
図58は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。図59は、本実施例の情報構造化装置により作成される表である。本実施例は、登録されている全顧客企業から、どのような製品が購入される蓋然性が高いかを推定し、その製品を購入する蓋然性が高い企業を選別する。まず、財務情報取得部907が図29示す主体者辞書から顧客企業リストを取得し、その顧客企業、例えば"ATT"、"リアル通信"、"OVOP"の財務諸表を得る(ステップS445)。具体的には、財務情報取得部907は、それぞれの顧客企業の固定資産及び流動資産を取得する。それぞれ固定資産が10億、40億、30億で、流動資産が10億、60億、50億であったとする。次に、投資実績計算部908は、各企業の固定資産への投資実績比率を固定資産/流動資産で求める。ここでは、1.0,0.67,0.6と求まる(ステップS446)。そして、投資類似度計算部909が各顧客企業をこの投資姿勢の値でソートすると(ステップS447)、図59に示すように、「OVOP(0.6)」「リアル通信(0.67)」「ATT(1.0)」の順となる。
一方、他社の納入・採用ニュースとして、それぞれ製品納入情報選択部902、製品採用情報選択部901により、
"オリオン、光アクセス製品の「OR2500」をOVOPに納入"、
"ATT、日本光伝送のメトロ製品「BB−P012」を採用"
というニュースから生成される情報源ツリーを新たに情報源格納部503から選択する(S441)。重複検知部903でこれらの情報源ツリーの重複検査をした後、他者製品特徴語選別部904により、前者の特徴語として"光アクセス製品"、後者の特徴語として"メトロ製品"を抽出する(S442)。次いで、自社類似製品選別部905は、情報源格納部503より、過去の自社製品のリリースニュース
"日本電気、光アクセス製品「DW4000」を発売"
を選択し、"DW4000"を抽出する。自社類似製品選別部905は、DW4000の特徴語と、OR2500、BB−P012の特徴語とを比較し、DW4000が他社の納入実績のある製品と類似すると判断する。これにより、DW4000は納入しやすい製品であることが推定される(ステップS443)。
次に、他社製品採用顧客選別部906は、納入実績がある納入先企業として、"OVOP"や"ATT"を記憶する。また、リアル通信が採用したニュースがなく、かつ競合企業が納品したニュースがないことから、"リアル通信"は実績がない状態と判定する(S444)。顧客集合選別部910は、投資類似度計算部909にてソートされた結果と、他社製尾品採用顧客選別部906にて採用された製品情報とが入力され図59のような表を作成する。この表より、"リアル通信"は投資実績比率が0.67で、"OVOP"と投資姿勢が類似していることが分かる。顧客集合選別部910は、この表において購入実績を有する顧客企業及びその前後1社を抽出して他社製品未採用顧客選別部911に入力する。本例の場合は、全ての顧客企業の情報がそれに該当する。他社製品未採用顧客選別部911には、自社類似製品選別部905より採用実績のある他社製品と類似の特徴を有する製品情報が供給され、表の自社製造の可否の欄が記述される。
これにより、"OVOP"は自社製品と同様の特徴語を有する光アクセス製品を購入済みであることが分かる。一方、リアル通信は、製品購入実績がなく、かつOVOPと投資姿勢が類似している。すなわち、リアル通信は、投資姿勢の類似しているOVOPが採用した製品を採用する可能性が高い。よって、"リアル通信"は自社製品の"DW4000"の販売候補先として有力な企業となる。他社製品未採用顧客選別部911は、このような他社製品を採用した顧客企業と投資姿勢が似ており、かつ他社製品を未だ採用していない別の顧客企業を抽出して図示せぬ表示部等に表示する(ステップS911)。
また、他社製品未採用顧客選別部911は、顧客企業"リアル通信"の図38に示す顧客企業力測定ツリーの製品マッチングリーフの値を下記のように算出する。
機能類似度=(部品・完全マッチする語数/他社製品と自社製品の前特徴語数)=1/1
投資姿勢類似度=1−e^(−(1/|固定資産/流動資産−固定資産/流動資産|))=1−e(−(1/|40/60−30/50|))=1−e^(−0.07)≒1
製品マッチングリーフのスコア=機能類似度×投資姿勢類似度=1
以上により、顧客企業力ツリーの製品マッチングの初期スコアを1に更新する。
なお、本実施例においては、適合情報源ツリーを用いて潜在購買力を推定するものとして説明したが、潜在購買力推定部900がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。また、潜在購買力推定部900は、自社製品と他社製品の特徴語を比較するため、情報源を適合情報源又は非適合情報源に分離しなくても本実施例を適用可能である。
本実施例によれば、顧客企業の投資意欲を公開されている財務諸表のうち、固定資産と流動資産を用いることで、顧客の投資姿勢の類似度を計算し、また顧客や競合他社の納入・採用実績ニュースから自社製品の受容性がありそうな未納入の企業を列挙するため、自社の製品を販売しやすい顧客の推定が可能となる。また、顧客企業の企業力をより正確に求めることができる。
本発明の第6の実施例
次に、本発明の第6の実施例について説明する。図60は、本発明の第6の実施例にかかる情報構造化装置60を示す図である。本実施例は、生産財の開発履歴と販売実績履歴を結びつけ、競合企業の収益性を推定するものである。本情報構造化装置60は、図60に示すように、第5の実施例における情報構造化装置50に、定量化装置52として販売力推定部1000を更に設ける構成を有する。その他の構成は、第5の実施例と同様であり、その詳細な説明は省略する。この第6の実施例は、競合企業の販売力を推定する例である。
図61(a)及び図61(b)は、それぞれ販売力と販売までの期間の関係、販売力と機能の関係を示すグラフ図である。図61に示すように、一般に、販売時期−開発完了(リリース)時期が短い方が販売力が高いと見ることができる。また、一般に機能が低いのに売れた場合は、機能が高くて売れた場合より販売力が高いと見ることができる。なお、機能は、単位価格当たりの機能、又は価格とすることも可能である。単位価格当たりの機能が少なくて売れている場合や、単位価格当たりの価格が高いのに売れている場合、販売力が高いと見ることができる。本実施例においては、このような製品の機能及び期間の情報に基づき、企業の販売力を推定する。
図62は、本実施例における販売力推定部1000を示すブロック図である。図62に示すように、第4の実施例における需要周期推定部800の製品採用情報選別部801、製品納入情報選別部802、及び重複検知部803と共に販売力推定部1000を構成する。販売力推定部1000は、さらに製品別特徴語収集部1004、製品開発情報選別部1005、平均特徴語数算出部1006及び競合製品販売率算出部1007を有する。
販売力推定部1000は、競合企業の営業力を予測するデータを生成するように動作し、競合企業の生産財開発リリースニュースと、その商品の納入実績ニュース、又は顧客の採用実績ニュースから販売力を計算する。
先ず、製品別特徴語収集部1004は競合商品ごと情報源をまとめ、各情報源に含まれる特徴語をカウントし、製品ごとの累計特徴語数αi(iは任意の製品)を求める。平均特徴語数算出部1006は、全ての製品の累計特徴語数と製品数から、1製品あたりの平均特徴語数βを算出する。平均数を求めることで、製品別特徴語収集部1004が収集した特徴がその業界の製品にとって多いのか少ないのかが判別することができる。
次に、製品採用情報選別部801及び製品納入情報選別部802が、それぞれ顧客の生産財購入・採用ニュースと、競合他社の生産財販売・納入実績ニュースのみを、情報源格納部503から抽出する。重複検知部803は、製品採用情報選別部801が情報源格納部503から抽出した情報源ツリーに含まれる採用製品及び納入元を抽出し、製品納入情報選別部802が情報源格納部503から抽出した情報源ツリーに含まれる納入商品及び納入先を抽出し、製品名が一致するか否か、納入先と納入元が一致するか否かを判断することで納入ニュースと採用ニュースの等価性を判断する。重複があればそれを破棄する。製品開発情報選別部1005は、重複検知部803から製品ごとのリリース時期及び販売量を受け取り、比率γi=(売り上げニュース数)/(納入時期−リリース時期)を算出する。これは、図61(a)に対応する。
競合製品販売率算出部1007は、平均特徴語算出部1006からのαi、βと、製品開発情報選別部1005からのγiとから、平均特徴語数/累計特徴語数×採用ニュース数/(納入時期−リリース時期)によって算出される販売率(販売力)を算出する。β/αは、その値が大きいほど機能が少ない、すなわち魅力が少ない商品を表す。β/α×γiが大きいと、魅力がないのにも関わらず販売までの期間が短いことを示し、すなわち、販売力が高いことを示す値となる。
この指標を企業力計算部601が競合企業力測定ツリーの売り上げ実績リーフに加算する。また、図61(a)に示すように、横軸に開発から販売までにかけた時間を、縦軸に売り上げ実績をプロットすることで、開発した商品を如何に効率よく販売に結び付けられているのかを図示せぬ表示部などにより提示することができる。このことにより、生産財の開発履歴と販売実績履歴を結びつけ、競合企業の収益性を推定することができる。そして、本実施例においては、競合他社の製品開発力と、自社の製品開発力の差が分かりづらいという従来の課題を解決する。
次に図63のフローチャートを参照して、本実施例の動作について詳細に説明する。先ず、製品別特徴語収集部1001が各競合商品のリリースニュースについて特徴語数を計測する。
"オプト販売は、μレーザを用いたロスレス光伝送装置「FX5000」を開発"
というリリースニュースが8月に格納された場合、製品別特徴語収集部1001は、特徴語として"μレーザ"、"ロスレス光伝送装置"の2つ(αi=2)を収集する。こうして全ての競合製品について特徴語数をそれぞれ収集する(ステップS451)。そして、平均特徴語算出部1002が、特徴語数を調査対象なった競合製品数で割る(ステップS452)。この場合、平均β=1.4という値が得られるとする。次に、
"オプト販売、「FX5000」をATTに納入"、
"オプト販売、ロスレス光伝送の「FX5000」をリアル通信に納入"
といったニュースが追加され、それぞれ10月、11月に格納されたとすると、製品採用情報選別部801、製品納入情報選別部802、及び重複検知部803により、この情報源から製品の情報を抽出する。そして、各競合商品について、納入・採用ニュース数を計算する(ステップS454)。
次に、製品開発情報選別部1005は、iを製品の番号として
比率γi=売り上げニュース数/(納入時期−開発時期)
を算出する。本例の場合は、10月、11月に納入された売り上げニュース数が各1であるため、
比率γi=1/(10−8)+1/(11−8)≒0.5+0.3=0.8
となる(ステップS455)。そして、競合製品販売率算出部1007は、
販売力=Σβ/αi×γi
を求める。本例において、"FX5000"の販売率は、1.4/2×0.8=0.56と求まる。営業販売力の特性として、特徴のない製品を開発してからすぐに納入した場合、高くなるという傾向がある。競合製品販売率算出部1007は、この販売力の値を競合企業力測定ツリーの売り上げ実績リーフに加算する。
なお、本実施例においては、適合情報源ツリーを用いて販売力を推定するものとして説明したが、販売力推定部1000がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。また、販売力推定部1000は、製品の平均特徴語数を利用するため、情報源を適合情報源又は非適合情報源に分離しなくても本実施例を適用可能である。
本実施例においては、開発製品の特徴数、その平均値、売り上げニュース数及び当該開発製品の開発から納入までの期間を指標として使用することで競合企業の販売力の推定が可能となる。また、求めた販売力を競合企業力測定ツリーの売り上げ実績リーフの値とすることで、競合企業力を販売力を加味した値に更新することができ、正確に推定することができる。
本発明の第7の実施例
次に、本発明の第7の実施例について説明する。図64は、本発明の第7の実施例にかかる情報構造化装置70を示す図である。本実施例は、顧客に採用されている生産財商品と、商品開発メーカへ納入されている部品を結びつけ、どの部品が商品の競争力となっているのか推定するものである。本情報構造化装置70は、図64に示すように、第6の実施例における情報構造化装置60に、定量化装置72として競争力増強部品推定部1100を更に設ける構成を有する。その他の構成は、第6の実施例と同様であり、その詳細な説明は省略する。第7の実施例は、優良部品を推定する例である。
図65は、本実施例における競争力増強部品推定部1100を示すブロック図である。図65に示すように、競争力増強部品推定部1100は、部品採用率上位企業選別部1101、競合企業製品納入実績計測部1102、及び部品貢献率算出部1103を有する。この競争力増強部品推定部1100は、上述した製品採用情報選別部801、製品納入情報選別部802及び重複検知部803の出力結果を利用している。
競争力増強部品推定部1100は、部品納入実績のニュース又は競合企業の部品採用ニュースと、競合企業の製品売り上げ実績又は顧客の商品採用実績を用いて、ある部品が競合企業の製品に組み込まれ、最終的に顧客へ販売された率を計算する。この指標は競争力増強部品推定部1100により、納入企業力測定ツリーの差異化リーフの初期スコアに加算するために企業力推定部600に入力される。また、横軸に納入した部品を、縦軸に顧客への納入実績をプロットすることで、どの部品が競争力を生み出す源泉となっているのかを提示する。このことにより、顧客に採用されている生産財商品と、商品開発メーカへ納入されている部品を結びつけ、どの部品が商品の競争力となっているのか推定することを実現する。これは、他社製品が採用している技術優位性が高い部品はどのようなものか分かりづらいという従来の課題を解決し、顧客に採用されている商品と、そのメーカに納入されている部品のマッピングを提示し、競争力の高い部品を抽出する。
部品採用率上位企業選別部1101は、納入業者の部品を採用している競合企業のうち、納入業者の部品占有率が高い企業を上位2社選択する。例えば、部品納入業者A1の販売実績ニュースと、納入先競合企業B1の採用ニュースから部品占有率を算出する場合について説明する。例えば納入先競合企業B1が納入業者A1の部品を採用したことを3回リリースし、納入先競合企業B1が別の納入業者A2の部品を採用したことを1回リリースしたら、部品納入業者A1にとって部品占有率が高い競合企業は納入先競合企業B1であることが分かる。
競合企業製品納入実績計測部1102は、各企業が開発した製品の顧客企業への採用率を、
採用率α=採用実績製品数/開発製品数
によって算出する。競合企業に納品してもそれを使用した製品が顧客企業に納品されていなければ、当該部品は採用されていないことになる。
部品貢献率算出部1103は、競合企業に納入した部品の関係性から、iを製品種別とすると
貢献率Pi=1/納入部品種数×採用率
で計算する。残りの上位1社に対しても同様に貢献率を算出し、前出の貢献率へ加算する。納入企業が保有する全ての部品について計算する。計算結果は、企業力計算部601に入力され、部品納入企業力測定ツリーの差異化リーフの初期スコアとして採用される。
図66のフローチャート及び図67のニュース関係図を参照して、本発明の第7の実施例の動作について詳細に説明する。利用するニュースは、
"新川電工が高濃度のμレーザを開発"、
"新川電工、小型の光増幅モジュールを開発"、
"新川電工は光クロスコネクト(XC)部品の供給を開始"
という新川電工の開発関係のニュース3件、
"新川電工、オリオンにμレーザを納入"、
"オリオン、新川電工の光増幅モジュールを全面的に採用"
という競合企業であるオリオンに対する部品供給ニュース2件、
"新川電工、日本光伝送にμレーザを納入"、
"新川電工、日本光伝送に光増幅モジュールを納入"、
"新川電工、XC部品を日本光伝送に納入"
という競合企業である日本光伝送に対する部品提供ニュース3件、
"新川電工、サクラ通にμレーザを納入"
という競合企業であるサクラ通に対する部品納品ニュース1件、
"オリオン、キャリアのATTにメトロ製品を納入"、
"リアル通信、オリオンのDWDM部を採用"
という顧客企業のオリオン製品の採用ニュース2件、
"日本光伝送、メトロ製品をOVOPに納入"
という顧客企業の日本光伝送製品の採用ニュース1件、
"サクラ通、アクセス製品のAX−1000をADDIに納入"
という顧客企業のサクラ通製品の採用ニュース1件である。これらのニュース関連図を示すと図67となる。
部品採用率上位企業選別部1101が納入部品ごとに納入先の競合企業を列挙する(ステップS461)。上記例においては、納入先の競合企業は、"オリオン"、"日本光伝送"、"サクラ通"が列挙される。そして、"新川電工"からの部品納入が多い企業は上位から、"日本光伝送"(3)、"オリオン"(2)、"サクラ通"(1)となり、このうち部品採用率上位企業選別部1101は上位2社を選択する(ステップS462)。競合企業製品納入実績計測部1102は、上位2社の顧客への納入実績ニュースを抽出する(ステップS463)。本例では、
"オリオン、キャリアのATTにメトロ製品を納入"、
"リアル通信、オリオンのDWDM部を採用"
の2件、及び
"日本光伝送、メトロ製品をOVOPに納入"
となる。
一方、競合企業製品納入実績計測部1102は、顧客への採用実績ニュース数を各部品ごとに算出する(ステップS464)。すなわち、部品が競合企業を経て、顧客へ到達するパスを列挙する。"μレーザ"に関しては、オリオン→ATT/リアル通信の2件と、日本光伝送→OVOPの1件が該当する。同様に光増幅も3件、XCは1件となる。オリオンの自社製品を3種類、日本光伝送の自社製品を2種類だとすると、オリオンが顧客に収めた実績は2種類の製品であるため、競合企業製品納入実績計測部1102は、採用率α(オリオン)=採用実績製品数/開発製品数=2/3、α(日本光伝送)=1/2を求める(ステップS465)。
次に、部品貢献率算出部1103は、競合企業に収めた実績のある各部品について貢献率Pi=α×(1/全部品)を計算する(ステップS466)。本例では、"オリオン"に納入されている製品は、"μレーザ"と"光増幅"の2つであるため、部品貢献率算出部1103は、下記のようにして部品貢献率Piを求める。
Pi(μレーザ)=(2/3)×1/2=1/3、
Pi(光増幅)=(2/3)×1/2=1/3
同様に日本光伝送に納入されている部品は、3種類であるため、
Pi+1(μレーザ)=(1/2)×1/3=1/6、
Pi+1(光増幅)=(1/2)×1/3=1/6、
Pi+1(XC)=(1/2)×1/3=1/6
となる。各企業ごとに算出した貢献率を、製品ごとに合計すると、
P(μレーザ)=1/3+1/6=1/2、
P(光増幅)=1/2、
P(XC)=1/6
となる(ステップS467)。よって、製品をこの値でソートすると、"μレーザ"、"光増幅"、"XC"の順となり、新川電工の製品のお勧めは"μレーザ"又は"光増幅"となる。
なお、本実施例においては、適合情報源ツリーを用いて競争力増強部品を推定するものとして説明したが、競争力増強部品推定部1100がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。
本実施例においては、関連ニュースの関係および納入実績を部品納入業者、競合企業、顧客企業の範囲で指標化することで、実績ベースの優良部品の推定が可能となる。また、求めた貢献率は、部品納入企業力測定ツリーにおける差異化リーフの初期スコアに置き換えられることで、部品の販売実績等の良否を反映した企業力の推定が可能となる。
以上、説明した本発明の第1乃至第7の実施例は下記の効果を奏する。すなわち、第1の効果は、未知の製品が事業ドメインと合致している競合商品であるかどうか、自動的に判定できることである。その理由は、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった競合製品を発見し、購入対象として提示することができるためである。さらに、過去の製品リリースニュース履歴、事業ドメインに合致していない製品をリリースする総合企業と、事業ドメインに合致した製品のみをリリースする専門業者を分類することによって、誤って異なる事業ドメインの新製品と判定することを低減する。
第2の効果は、事業ドメインに合致した競合企業を発見し、専門業者と総合メーカを区別できることである。その理由は、事業ドメインで普遍的な技術辞書を用いて、新製品リリースニュースの特徴語と比較するため、製品が事業ドメインに合致していることが判明し、さらに開発した企業名も取得できるからである。さらに、競合企業が扱う製品が事業ドメインに属する割合を計測し、閾値以上の割合で事業ドメインに合致する製品をリリースしているか判定できるからである。
第3の効果は、事業ドメインに合致した顧客企業を発見できることにある。その理由は、過去の製品納入ニュースから、事業ドメインの生産財を購入する企業を列挙し、まとめて提示することができるためである。これによって、過去に直接的に取引のない顧客を発見することができる。また、顧客企業の財務諸表を準備しておくことで、顧客の投資姿勢や余裕資金などを元に、優良顧客度合いを計算することで、どの顧客が生産財を購入しやすいか判定することができる。
第4の効果は、事業ドメインに関連したキーワードを自動収集できることにある。その理由は、事業ドメインに属すると判定した情報源から、同時に出現する単語動詞を関連の深い単語として記憶できるからである。新しい競合製品の特徴語を、事業ドメイン辞書や技術辞書に追加するため、自動的に事業ドメインの用語を増殖させることができ、人手でメンテナンスする工数を削減することができる。さらに増殖した特徴語も含めて、後から入力される情報源を比較するため、より広く製品を発見することが可能になる。また、ニュースの情報源に同時に出現するキーワードを、技術辞書の距離に反映させることによって、関連の深さに応じた技術ワードを自動構築できる。
第5の効果は、顧客・競合・部品納入企業の企業力の差を定量化できることにある。その理由は、顧客、競合、部品納入企業という3つのタイプに企業力を測定するテンプレートを用意し、情報源に含まれるキーワードと、単語・ノード対応表と、競合企業力測定ツリーの構造と、リーフ値計算式から、キーワードの持つインパクトを過去の企業活動に照らし合わせて計算するからである。また、直接的には部品納入業者のニュースでも、それを採用する企業への影響力も技術辞書を用いて定量化するため、より正確に波及効果も定量化することができる。
以上のような情報構造化処理は、専用コンピュータ、又はパーソナルコンピュータ(PC)などのコンピュータにより実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図68に示すように、コンピュータ2100は、CPU2101(Central Processing Unit)、ROM2102(Read Only Memory)及びRAM2103(Random Access Memory)を有し、これらがバス2104を介して相互に接続されている。尚、コンピュータを動作させるためのOSソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然備えているものとする。
バス2104には又、入出力インターフェース2105も接続されている。入出力インターフェース2105には、例えば、キーボード、マウス、センサなどよりなる入力部2106、CRT、LCDなどよりなるディスプレイ、並びにヘッドフォンやスピーカなどよりなる出力部2107、ハードディスクなどより構成される記憶部2108、モデム、ターミナルアダプタなどより構成される通信部2109などが接続されている。
CPU2101は、ROM2102に記憶されている各種プログラム、又は記憶部2108からRAM2103にロードされた各種プログラムに従って各種の処理を実行する。本実施例においては、例えば、情報源裁断処理、情報源再構築処理、情報源選別処理、グループ生成処理、情報源価値推定処理、波及力計算処理、企業力推定処理、需要周期推定処理、潜在購買力推定処理、販売力推定処理、又は競争力増強部品推定処理等の処理を実行する。RAM2103にはまた、CPU2101が各種の処理を実行する上において必要なデータなども適宜記憶される。
通信部2109は、例えば図示しないインターネットを介しての通信処理を行ったり、CPU2101から提供されたデータを送信したり、通信相手から受信したデータをCPU2101、RAM2103、記憶部2108に出力したりする。記憶部2108はCPU2101との間でやり取りし、情報の保存・消去を行う。通信部2109は又、他の装置との間で、アナログ信号又はディジタル信号の通信処理を行う。
入出力インターフェース2105は又、必要に応じてドライブ2110が接続され、例えば、磁気ディスク2111、光ディスク2112、フレキシブルディスク2113、又は半導体メモリ2114などが適宜装着され、それらから読み出されたコンピュータプログラムが必要に応じて記憶部2108にインストールされる。
なお、本発明は上述した実施例のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
例えば、上述の実施例では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。
本発明の第1の実施例にかかる情報構造化装置を示すブロック図である。 本発明の第1の実施例にかかる情報構造化装置における情報源裁断部を示すブロック図である。 情報源文字列の構成を示す図である。 本発明の第1の実施例にかかる情報構造化装置における形態素解析結果を示す図である。 本発明の第1の実施例にかかる情報構造化装置における情報源再構築部を示す図である。 本発明の第1の実施例にかかる情報構造化装置における情報源価値推定部を示すブロック図である。 本発明の第1の実施例にかかる情報構造化装置が使用するドメイン辞書の構造を示す図である。 本発明の第1の実施例にかかる情報構造化装置が使用するドメイン辞書の一例を示す図である。 本発明の第1の実施例にかかる情報構造化装置が参照する主体者辞書の構造を示す図である。 本発明の第1の実施例にかかる情報構造化装置が参照する単語定量化マップを示す図である。 本発明の第1の実施例にかかる情報構造化装置が参照する顧客企業力測定ツリーの構造を示す図である。 本発明の第1の実施例にかかる情報構造化装置が参照する競合企業力測定ツリーの構造を示す図である。 本発明の第1の実施例にかかる情報構造化装置が参照する部品納入企業力測定ツリーの構造を示す図である。 本発明の第1の実施例にかかる情報構造化装置が参照する単語定量化マップに含まれる単語・ノード対応表を示す図である。 本発明の第1の実施例にかかる情報構造化装置における企業力推定部を示すブロック図である。 ノード構造及びリーフ構造を示す図である。 本発明の第1の実施例にかかる情報構造化装置の動作を示すフローチャートである。 本発明の第1の実施例にかかる情報構造化装置における形態素解析結果の一例を示す図である。 本発明の第1の実施例にかかる情報構造化装置における情報再構築部が形態素を連結した後を示す図である。 本発明の第1の実施例にかかる情報構造化装置における製品名抽出方法を示すフローチャートである。 本発明の第1の実施例にかかる情報構造化装置における主体者抽出方法を示すフローチャートである。 本発明の第1の実施例にかかる情報構造化装置における行動抽出方法を示すフローチャートである。 本発明の第1の実施例にかかる情報構造化装置における行動対象抽出方法を示すフローチャートである。 本発明の第1の実施例にかかる情報構造化装置におけるシノニム抽出方法を示すフローチャートである。 本発明の第1の実施例にかかる情報構造化装置における特徴語抽出方法を示すフローチャートである。 本発明の第1の実施例にかかる情報構造化装置における情報源再構築部が書式ルールに従って、主体者、製品名、行動、特徴語、シノニムを抽出した結果を示す図である。 本発明の第1の実施例にかかる情報構造化装置における適合情報源ツリー選別方法を示すフローチャートである。 本発明の第1の実施例にかかる情報構造化装置における書式解析結果の一例を示す図である。 本発明の第2の実施例にかかる情報構造化装置を示す図である。 本発明の第2の実施例の情報源再構築部を示す図である。 本発明の第2の実施例にかかる情報構造化装置が生成する情報源ツリーを示す図である。 本発明の第2の実施例にかかる情報構造化装置における情報源選別部を示すブロック図である。 本発明の第2の実施例にかかる情報構造化装置におけるグループ生成部を示すブロック図である。 製品構成をベースにした技術辞書である。 本発明の第2の実施例にかかる情報構造化装置が使用する技術辞書の構造を示す図である。 本発明の第2の実施例にかかる情報源価値推定部を示す図である。 本発明の第2の実施例にかかる情報構造化装置の動作を示すフローチャートである。 本発明の第2の実施例にかかる情報構造化装置が生成した情報源ツリーの一例を示す図である。 本発明の第2の実施例にかかる情報構造化装置における情報源ツリーの増殖方法を示すフローチャートである。 本発明の第2の実施例の情報構造化装置が増殖した事業ドメイン辞書の一例を示す図である。 本発明の第2の実施例の情報構造化装置が増殖した技術辞書の一例を示す図である。 本発明の第2の実施例にかかる情報構造化装置における書式解析結果の一例を示す図である。 本発明の第2の実施例にかかる情報構造化装置における書式解析結果の一例を示す図である。 本発明の第2の実施例の情報構造化装置が増殖した事業ドメイン辞書の一例を示す図である。 本発明の第4の実施例にかかる情報構造化装置を示す図である。 本発明の第4の実施例における波及力計算部を示すブロック図である。 本発明の第4の実施例にかかる情報構造化装置の動作を示すフローチャートである。 本発明の第4の実施例にかかる情報構造化装置が参照する主体者辞書を示す図である。 本発明の第4の実施例にかかる情報構造化装置が生成した情報源ツリーの一例を示す図である。 本発明の第4の実施例にかかる情報構造化装置における波及力算出方法の詳細を示すフローチャートである。 ある商品の需要周期を示す図である。 本発明の第5の実施例にかかる情報構造化装置を示す図である。 本発明の第5の実施例における需要周期推定部を示すブロック図である。 本発明の第5の実施例にかかる情報構造化装置の動作を示すフローチャートである。 本発明の第6の実施例にかかる情報構造化装置を示す図である。 本発明の第6の実施例にかかる情報構造化装置における潜在購買力推定部を示すブロック図である。 製品の機能と価格のバランスを説明する図である。 本発明の第6の実施例にかかる情報構造化装置の動作を示すフローチャートである。 本発明の第6の実施例の情報構造化装置により作成される表である。 本発明の第7の実施例にかかる情報構造化装置を示す図である。 (a)は、販売力と期間の関係を示し、(b)は販売力と機能の関係を示す図である。 本発明の第7の実施例にかかる情報構造化装置における販売力推定部を示すブロック図である。 本発明の第7の実施例にかかる情報構造化装置の動作を示すフローチャートである。 本発明の第8の実施例にかかる情報構造化装置を示す図である。 本発明の第8の実施例にかかる情報構造化装置における競争力増強部品推定部を示すブロック図である。 本発明の第8の実施例にかかる情報構造化装置の動作を示すフローチャートである。 ニュース関係図を示す図である。 本発明の実施例にかかるコンピュータを示す図である。
符号の説明
10,20,30,40,50,60,70 情報構造化装置
11,21,31,41,51,61,71 分類装置
12,22,32,42,52,62,72 定量化装置
100 情報源裁断部
101 情報源蓄積部
102 形態素解析部
103 形態素蓄積部
200、200b 情報源再構築部
201 書式解析部
202 書式ルール蓄積部
203 要素単語格納部
204 ツリー生成部
205 情報源ツリー格納部
300 情報源選別部
301 ツリー選別部
302 ドメイン辞書格納部
303 適合情報源ツリー格納部
304 非適合情報源ツリー格納部
400 グループ生成部
401 ツリー増殖部
402 技術辞書格納部
500 情報源価値推定部
500、500b 情報源価値推定部
501 主体者判定部
502 主体者辞書格納部
503 情報源格納部
504 情報源定量化部
505 単語定量化マップ格納部
506 情報減初期スコア格納部
507 企業力測定ツリー格納部
508 ドメイン辞書格納部
600、600b 企業力推定部
601 企業力計算部
602 情報源最終スコア格納部
700 波及力計算部
701 部品納入情報源選別部
702 納入先企業抽出部
703 特徴語列挙部
704 近距離用語抽出部
705 波及力計算部
800 需要周期推定部
801 製品採用情報選別部
802 製品納入情報選別部
803 重複検知部
804 月間累計カウンタ
805 商品需要表示部
900 潜在購買力推定部
901 製品採用情報選択部
902 製品納入情報選択部
903 重複検知部
904 他社製品特徴語選別部
904 他者製品特徴後選別部
905 自社類似製品選別部
906 他社製品採用顧客選別部
906 他社製尾品採用顧客選別部
907 財務情報取得部
908 投資実績計算部
909 投資類似度計算部
910 顧客集合選別部
911 他社製品未採用顧客選別部
1000 販売力推定部
1001 製品別特徴語収集部
1002 平均特徴語算出部
1003 製品開発情報選別部
1004 製品別特徴語収集部
1005 製品開発情報選別部
1006 平均特徴語数算出部
1007 競合製品販売率算出部
1100 競争力増強部品推定部
1101 部品採用率上位企業選別部
1102 競合企業製品納入実績選別部
1102 競合企業製品納入実績計測部
1103 部品貢献率算出部
2100 コンピュータ
2101 CPU
2102 ROM
2103 RAM
2104 バス
2105 入出力インターフェース
2106 入力部
2107 出力部
2108 記憶部
2109 通信部
2110 ドライブ
2111 磁気ディスク
2112 光ディスク
2113 フレキシブルディスク
2114 半導体メモリ

Claims (35)

  1. 情報源を分割して単語を生成する情報源裁断部と、
    予め定められた書式ルールに従って前記単語を分類する情報源再構築部と、
    企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、前記情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定部と、
    前記初期スコアに基づき前記企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定部とを有し、
    前記企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出される、情報構造化装置。
  2. 前記企業力推定部は、前記情報源の入力による前記企業力の変化量を当該情報源のスコアとして算出する
    ことを特徴とする請求項1記載の情報構造化装置。
  3. 前記情報源価値推定部は、事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する判定部を有し、
    前記適合情報源を使用して企業力を算出する
    ことを特徴とする請求項1又は2記載の情報構造化装置。
  4. 前記情報源価値推定部は、主体者の種別が記述された主体者辞書を参照し、前記適合情報源の主体者の種別を判定する判定部を有し、
    主体者の種別毎に用意された前記企業力測定ツリーを使用して企業力を算出する
    ことを特徴とする請求項1乃至3のいずれか1項記載の情報構造化装置。
  5. 事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別部を更に有する
    ことを特徴とする請求項1又は2記載の情報構造化装置。
  6. 単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した単語辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成部を更に有する。
    ことを特徴とする請求項1、2又は5のいずれか1項記載の情報構造化装置。
  7. 前記情報源裁断部は、前記情報源を形態素に分割する形態素解析部を有する
    ことを特徴とする請求項1乃至6のいずれか1項記載の情報構造化装置。
  8. 前記情報源再構築部は、前記単語を組み合せ、主体者をルートとする情報源ツリーを形成する
    ことを特徴とする請求項1乃至7のいずれか1項記載の情報構造化装置。
  9. 前記情報源再構築部は、
    前記不可分要素を製品名、主体者、特徴語、及び行動に分類する書式解析部と、
    前記書式解析結果に基づき前記不可分要素に分断された情報源から前記情報源ツリーを生成するツリー生成部とを有する
    ことを特徴とする請求項8項記載の情報構造化装置。
  10. 前記書式解析部は、前記形態素のうち、連続する名詞を結合して要素単語を生成する
    ことを特徴とする請求項9項記載の情報構造化装置。
  11. 前記グループ生成部は、主体者が種別毎に分類された主体者辞書を参照し、前記適合情報源を主体者毎に分類する
    ことを特徴とする請求項6項記載の情報構造化装置。
  12. 前記情報源選別部は、前記適合情報源を構成する単語のうち、前記事業ドメイン辞書に存在しない単語を、当該事業ドメイン辞書に登録する
    ことを特徴とする請求項3又は5項記載の情報構造化装置。
  13. 前記グループ生成部は、前記適合情報源を構成する単語のうち、前記単語辞書に存在しない単語を、当該単語辞書に登録する
    ことを特徴とする請求項6項記載の情報構造化装置。
  14. 前記単語辞書は、単語間の類似度に基づき当該単語間の距離が設定されたものであって、
    前記単語辞書を参照し、納入元企業が主体者となる情報源に含まれる単語と、納入先企業に関する情報源に含まれる単語との距離に応じて、前記納入先企業に対する前記納入元企業の影響力を算出する波及力計算部を更に有する
    ことを特徴とする請求項6、11、又は13のいずれか1項記載の情報構造化装置。
  15. 顧客企業の製品採用情報源における製品及び納入元と、競合企業の製品納入情報源における製品及び納入先とに基づき当該製品の需要周期を推定する需要周期推定部を更に有する
    ことを特徴とする請求項1乃至14のいずれか1項記載の情報構造化装置。
  16. 顧客企業の財務情報と、顧客企業の製品購入履歴又は競合企業の製品販売実績とに基づき、当該顧客企業の潜在購買力を推定する潜在購買力推定部を更に有する
    ことを特徴とする請求項1乃至15のいずれか1項記載の情報構造化装置。
  17. 単語辞書は、技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書である
    ことを特徴とする請求項6、13、及び14のいずれか1項記載の情報構造化装置。
  18. 情報源を分割して単語を生成する情報源裁断工程と、
    予め定められた書式ルールに従って前記単語を分類する情報源再構築工程と、
    企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、前記情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定工程と、
    前記初期スコアに基づき前記企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定工程とを有し、
    前記企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出される、情報構造化方法。
  19. 前記企業力推定工程では、前記情報源の入力による前記企業力の変化量を当該情報源のスコアとして算出する
    ことを特徴とする請求項18記載の情報構造化方法。
  20. 前記情報源価値推定工程は、事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する判定工程を有し、
    前記適合情報源を使用して企業力を算出する
    ことを特徴とする請求項18又は19記載の情報構造化方法。
  21. 前記情報源価値推定工程は、主体者の種別が記述された主体者辞書を参照し、前記適合情報源の主体者の種別を判定する判定工程を有し、
    主体者の種別毎に用意された前記企業力測定ツリーを使用して企業力を算出する
    ことを特徴とする請求項18乃至20のいずれか1項記載の情報構造化方法。
  22. 事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別工程を更に有する
    ことを特徴とする請求項18又は19記載の情報構造化方法。
  23. 単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した単語辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成工程を更に有する。
    ことを特徴とする請求項18、19又は22のいずれか1項記載の情報構造化方法。
  24. 前記情報源裁断工程は、前記情報源を形態素に分割する形態素解析工程を有する
    ことを特徴とする請求項18乃至23のいずれか1項記載の情報構造化方法。
  25. 前記情報源再構築工程は、前記単語を組み合せ、主体者をルートとする情報源ツリーを形成する
    ことを特徴とする請求項18乃至24のいずれか1項記載の情報構造化方法。
  26. 前記情報源再構築工程は、
    前記不可分要素を製品名、主体者、特徴語、及び行動に分類する書式解析工程と、
    前記書式解析結果に基づき前記不可分要素に分断された情報源から前記情報源ツリーを生成するツリー生成工程とを有する
    ことを特徴とする請求項25項記載の情報構造化方法。
  27. 前記書式解析工程では、前記形態素のうち、連続する名詞を結合して要素単語を生成する
    ことを特徴とする請求項26項記載の情報構造化方法。
  28. 前記グループ生成工程では、主体者が種別毎に分類された主体者辞書を参照し、前記適合情報源を主体者毎に分類する
    ことを特徴とする請求項23項記載の情報構造化方法。
  29. 前記情報源選別工程では、前記適合情報源を構成する単語のうち、前記事業ドメイン辞書に存在しない単語を、当該事業ドメイン辞書に登録する
    ことを特徴とする請求項20又は22項記載の情報構造化方法。
  30. 前記グループ生成工程では、前記適合情報源を構成する単語のうち、前記単語辞書に存在しない単語を、当該単語辞書に登録する
    ことを特徴とする請求項23項記載の情報構造化方法。
  31. 前記単語辞書は、単語間の類似度に基づき当該単語間の距離が設定されたものであって、
    前記単語辞書を参照し、納入元企業が主体者となる情報源に含まれる単語と、納入先企業に関する情報源に含まれる単語との距離に応じて、前記納入先企業に対する前記納入元企業の影響力を算出する波及力計算工程を更に有する
    ことを特徴とする請求項28乃至30のいずれか1項記載の情報構造化方法。
  32. 顧客企業の製品採用情報源における製品及び納入元と、競合企業の製品納入情報源における製品及び納入先とに基づき当該製品の需要周期を推定する需要周期推定工程を更に有する
    ことを特徴とする請求項28乃至31のいずれか1項記載の情報構造化方法。
  33. 顧客企業の財務情報と、顧客企業の製品購入履歴又は競合企業の製品販売実績とに基づき、当該顧客企業の潜在購買力を推定する潜在購買力推定工程を更に有する
    ことを特徴とする請求項18乃至32のいずれか1項記載の情報構造化方法。
  34. 単語辞書は、技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書である
    ことを特徴とする請求項23、30、及び31のいずれか1項記載の情報構造化装置。
  35. 入力される情報源を構造化する処理をコンピュータに実行させるためのプログラムであって、
    情報源を分割して単語を生成する情報源裁断工程と、
    予め定められた書式ルールに従って前記単語を分類する情報源再構築工程と、
    企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が前記情報源に含まれる単語により定義された定義表と、前記情報源とを参照し、当該リーフのスコアを初期スコアとして算出する情報源価値推定工程と、
    前記初期スコアに基づき前記企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する企業力推定工程とを有し、
    前記企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出される、プログラム。
JP2007196661A 2007-07-27 2007-07-27 情報構造化装置、情報構造化方法、及びプログラム Pending JP2009032119A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007196661A JP2009032119A (ja) 2007-07-27 2007-07-27 情報構造化装置、情報構造化方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007196661A JP2009032119A (ja) 2007-07-27 2007-07-27 情報構造化装置、情報構造化方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2009032119A true JP2009032119A (ja) 2009-02-12

Family

ID=40402542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007196661A Pending JP2009032119A (ja) 2007-07-27 2007-07-27 情報構造化装置、情報構造化方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2009032119A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014514642A (ja) * 2011-03-24 2014-06-19 クレディビリティ コーポレーション 信用のスコアリングおよび報告

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014514642A (ja) * 2011-03-24 2014-06-19 クレディビリティ コーポレーション 信用のスコアリングおよび報告

Similar Documents

Publication Publication Date Title
JP7092315B2 (ja) 機械生成広告を作り出す自動システムおよび方法
Zhang et al. Mining millions of reviews: a technique to rank products based on importance of reviews
Sharma et al. Comparative Analysis of Online Fashion Retailers Using Customer Sentiment Analysis on Twitter
CN108154401A (zh) 用户画像刻画方法、装置、介质和计算设备
JP5253519B2 (ja) スマートテキストを生成するための方法、装置、及び記憶媒体
JP2008152321A (ja) 顧客セグメント推定装置
Wang et al. Customer-driven product design selection using web based user-generated content
Wang et al. Database submission—market dynamics and user-generated content about tablet computers
US11295328B2 (en) Intelligent prospect assessment
JP5018313B2 (ja) 情報構造化装置、情報構造化方法、及びプログラム
Kadre et al. Practical business analytics using SAS: A hands-on guide
JP2009053983A (ja) 情報構造化装置、情報構造化方法、及びプログラム
Avkiran Monitoring hotel performance
Namvar et al. An approach to optimised customer segmentation and profiling using RFM, LTV, and demographic features
JP2021043899A (ja) 価値観クラスター生成装置、コンピュータプログラム、価値観クラスター付与方法、データベース統合方法及び広告提供方法
Yuan et al. Can inconsistent media coverage increase hotel survival? The bright side of controversy
JP2009032119A (ja) 情報構造化装置、情報構造化方法、及びプログラム
JP2005100221A (ja) 投資判断支援情報提供装置および方法
Tekin et al. Big data concept in small and medium enterprises: how big data effects productivity
WO2021192232A1 (ja) 商品推薦システム、商品推薦装置、商品推薦方法、及び、商品推薦プログラムが格納された記録媒体
Sha et al. Modelling the dynamics of customer requirements considering their lability and sensitivity in product development
KR20210126473A (ko) 소비 데이터와 소셜 데이터를 이용한 소비동향 예측 지수 생성 방법과 이를 적용한 소비동향 예측 지수 생성 시스템 및 이를 위한 컴퓨터 프로그램
JP2009054106A (ja) 情報構造化装置、情報構造化方法、及びプログラム
Shikalgar et al. Online Review Mining for forecasting sales
Osada et al. The role of domain knowledge representation in requirements elicitation