JP2009032118A - Information structuring device, information structuring method, and program - Google Patents
Information structuring device, information structuring method, and program Download PDFInfo
- Publication number
- JP2009032118A JP2009032118A JP2007196659A JP2007196659A JP2009032118A JP 2009032118 A JP2009032118 A JP 2009032118A JP 2007196659 A JP2007196659 A JP 2007196659A JP 2007196659 A JP2007196659 A JP 2007196659A JP 2009032118 A JP2009032118 A JP 2009032118A
- Authority
- JP
- Japan
- Prior art keywords
- information source
- information
- product
- unit
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、入力された情報源を所定の規則に従って構造化する情報構造化装置、情報構造化方法及びプログラムに関し、特に、例えば情報源としてウェブ情報を使用し製品企画支援を行なう情報構造化装置、情報構造化方法及びプログラムに関する。 The present invention relates to an information structuring apparatus, an information structuring method, and a program for structuring an input information source according to a predetermined rule, and more particularly, for example, an information structuring apparatus that supports product planning using web information as an information source. The present invention relates to an information structuring method and a program.
企業が新商品のための製品企画を行う際、従来から市場の動向、他社の保有技術、自社の保有技術などを考慮に入れて行なわれていた。具体的には、事業ドメインの市場が伸びるのかどうか、売れている製品はどのようなものか、又は他社になく自社にある技術を生かすにはどうすればよいのか、といった検討がなされているのが通例である。 When a company plans a product for a new product, it has traditionally taken into account market trends, technologies owned by other companies, and proprietary technologies. Specifically, it is usually considered whether the market of the business domain is growing, what products are selling, or how to make use of the technology in-house that does not exist in other companies. It is.
一般消費者が購入する商品(消費財)の製品企画であれば、一般消費者に対するアンケート方式のマーケティングによって製品の特性などを決定することが多かった。近年では、クチコミサイト、Q&Aコミュニティ、ソーシャルネットワーキングサービス(SNS)、ブログ、COI(Community Of Interest)サイト等インターネット等を活用して消費者が内容を生成していく消費者発信型メディア/消費者生成メディア(Consumer Generated Media:CGM)を利用して、口コミ情報を集める仕組みも試行されている。 In the case of product planning for products (consumer goods) purchased by general consumers, the characteristics of the products are often determined by questionnaire-type marketing for general consumers. In recent years, consumer-generated media / consumer generation in which consumers use the Internet, such as word-of-mouth sites, Q & A communities, social networking services (SNS), blogs, COI (Community Of Interest) sites, etc. An attempt is being made to collect word-of-mouth information using media (Consumer Generated Media: CGM).
一方、企業が購入する商品(生産財)の商品企画の場合は、顧客の声によるマーケティングが困難である。その理由として、生産財を購入するのは企業であり購入者の母集団が少ないこと、購入対象となる生産財の種類、購入数は購入企業の投資戦略に関わる情報であり、部分的にしか公開されないためである。 On the other hand, in the case of product planning of products (production goods) purchased by a company, it is difficult to perform marketing based on customer feedback. The reason for this is that companies purchase production goods and the purchaser population is small, the types of production goods to be purchased, and the number of purchases are information related to the investment strategy of the purchasing company. It is because it is not made public.
ところで、自然言語で記述された文章を解析し、予め与えられた分野の情報を抽出し、文章に含まれる単語間の関係を含む情報を一定の形式で出力する情報抽出システムが特許文献1に開示されている。この特許文献1に記載の技術においては、形態素解析部は入力文章を形態素単位に語切りした後、構文情報と抽出すべき情報の分野に関するキーワード情報を各形態素に割り当てる。構文解析規則格納部は構文情報を利用して入力文の構文解析を行なう規則を格納し、キーワード関係計算規則格納部はキーワード情報によって構文解析規則を制御しながらキーワード間関係を示す意味構造を生成する規則を格納し、文書情報抽出部は構文解析規則とキーワード間関係規則を用いて形態素解析部から出力された形態素列をキーワード中心に解析し、キーワードとキーワード間関係からなる意味を出力するものである。
By the way,
さらに、特許文献2には、例えば商品やサービスの販売促進のための広告配信を効果的に行なうこと等を目的とし、販売促進の対象となる顧客の母集団の中から、特定の商品やサービスを実際に購入する可能性が高いと考えられる潜在顧客を選別する顧客選別方法が開示されている。この特許文献2に記載の技術は、テキストを含むファイルを自動的に分類する情報分類装置であって、ファイル格納手段が出力するファイルのテキスト部分を形態素解析してファイルの識別子と共に出力する形態素解析手段と、ファイルを分類するためのキーワードを格納するキーワード格納手段と、キーワード格納手段の出力と形態素解析手段の出力とを入力として形態素解析の結果の中からキーワードを収集してファイルの識別子と共に出力するキーワード収集手段と、利用者が最近の分類結果と異なる分類結果を要求するための入力手段と、入力手段の出力とキーワード収集手段の出力とを入力としてファイルの識別子をキーワードで分類して出力する情報分類手段と、情報分類手段の出力とファイル格納手段の出力とを入力として情報分類手段が分類した結果を利用者に提供するものである。
しかしながら、上述の特許文献1に記載の技術おいては、キーワード辞書に基づき情報を抽出するものであり、特許文献2に記載の技術においては、キーワードにより入力情報を分類するものであるため、いずれにおいても、キーワードとして登録していない場合、情報を抽出することができない。よって、あるキーワードと同種のワードが含まれている場合であっても、そのワードがキーワードに一致しなければ抽出されないため、必要な情報が漏れてしまう可能性が大きい。また、新しい競合製品や、その特徴語を追加する場合、人手でメンテナンスしなければならず、管理が煩雑であるという問題点がある。
However, in the technique described in
本発明は、このような問題点を解決するためになされたものであり、与えられた情報源から精度よく必要な情報を抽出し、分類することができる情報構造化装置、情報構造化方法及びプログラムを提供することを目的とする。 The present invention has been made to solve such problems, and an information structuring apparatus, an information structuring method, and an information structuring method that can accurately extract necessary information from a given information source and classify it. The purpose is to provide a program.
本発明に係る情報構造化装置は、情報源を分割して単語を生成する情報源裁断部と、予め定められた書式ルールに従って前記単語を分類する情報源再構築部と、事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別部と、技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成部とを有するものである。 In the information structuring apparatus according to the present invention, an information source cutting unit that divides an information source to generate a word, an information source reconstruction unit that classifies the word according to a predetermined format rule, and a business domain are registered. An information source selection section for selecting whether the information source is a conforming information source related to a production good or a non-conforming information source not related to a production good, and a technical term and its synonyms By referring to a technical dictionary in which the set is classified based on the superordinate concept and / or subordinate concept in the business domain, an information source having a high probability of producing goods is extracted from the non-conforming information sources, and is used as the conforming information source. A group generation unit.
また、本発明にかかる情報構造化方法は、上記の情報構造化処理を実行する方法であり、本発明にかかるプログラムは、上記の情報構造化処理をコンピュータに実行させるものである。 An information structuring method according to the present invention is a method for executing the above information structuring process, and a program according to the present invention causes a computer to execute the above information structuring process.
本発明によれば、与えられた情報源を分類し、構造化することで企業情報、製品情報、技術情報を整理することができる情報構造化装置、情報構造化方法及びプログラムを提供することができる。 According to the present invention, it is possible to provide an information structuring apparatus, an information structuring method, and a program capable of organizing company information, product information, and technical information by classifying and structuring given information sources. it can.
以下、本発明を適用した具体的な実施例について、図面を参照しながら詳細に説明する。本実施例にかかる情報構造化装置は、ウェブなどにおける企業情報、製品情報、技術情報を整理し、製品企画支援を行なうための装置であり、生産財メーカにとって優良顧客であるかどうかを、企業の投資欲から判定し、より購買力のある企業を発見する。また、他社への納入実績情報を商品に付加して提示することにより、信用ある他社が購入した生産財のみを選択することができ、購入者側の実績を元に商品比較をすることができる。さらに、ニュースという公開された情報から、新規顧客や新規部品納入業者を発見することにより、販路や部品供給の拡大を行うことができ、これによってボトルネックを解消することが可能となる。 Hereinafter, specific examples to which the present invention is applied will be described in detail with reference to the drawings. The information structuring apparatus according to the present embodiment is an apparatus for organizing corporate information, product information, and technical information on the web, etc., and providing product planning support. Judging from the desire to invest, discover companies with more purchasing power. In addition, it is possible to select only production goods purchased by a trusted other company by adding information on delivery results to other companies to the product and compare products based on the purchaser's performance. . Furthermore, by discovering new customers and new parts suppliers from published information such as news, it is possible to expand sales channels and parts supply, thereby eliminating bottlenecks.
ここで、本実施例においては、説明上、部品を製造している企業を部品納入企業、部品納入企業から部品が納入される企業を競合企業、競合企業が製品を納入する企業を顧客企業として説明する。そして、競合企業であるユーザが本システムを使用する場合を想定して説明を行なう。いうまでもなく、顧客企業間、部品納入企業間は互いに競合企業であるが、本実施例においては、部品納入企業、顧客企業ということとする。 Here, in this embodiment, for the sake of explanation, a company that manufactures parts is a parts delivery company, a company that delivers parts from a parts delivery company is a competitor, and a company that delivers products is a customer company. explain. A description will be given assuming that a user who is a competitor uses this system. Needless to say, the customer companies and the parts supplier companies are competitors, but in this embodiment, they are a parts supplier company and a customer company.
本発明の第1の実施例
図1は、本発明の第1の実施例にかかる情報構造化装置1を示す図である。図1に示すように、本実施例にかかる情報構造化装置1は、与えられた情報源を分類し、構造化するものであり、より具体的には、単文で表現されたニュースタイトルのような情報源を、分割・再構築ルールを用いて構造化し、過去の構造化済み情報源も用いて、企業情報、製品情報、技術情報を整理するものである。この情報構造化装置1は、情報源裁断部100、情報源再構築部200、情報源選別部300、及びグループ生成部400を有する。情報源裁断部100は、情報源の文字列を文法レベルの不可分要素に分割する。情報源再構築部200は、不可分要素を組み合わせて要素単語を生成する。情報源選別部300は、情報源の中から事業ドメインに合致するものを選別する。グループ生成部400は、技術的な視点から類似の情報源を選別する。以下に各ブロックについて詳細に説明する。
First Embodiment of the Invention FIG. 1 is a diagram showing an
図2は、本実施例における情報源裁断部100を示すブロック図である。図2に示すように、情報源裁断部100は、情報源(タイトル)蓄積部101、形態素解析部102、及び形態素蓄積部103を有する。これらの手段はそれぞれ概略次のように動作する。
FIG. 2 is a block diagram showing the information
情報源蓄積部101は、情報源文字列を保持している。情報源文字列は、図3で示すように、日時及び文字列の情報からなる。この情報源文字列は「、」を複数有し、「。」を1つ有するような短文である。
The information
形態素解析部102は、情報源である例えばタイトル文字列"日本電気、光アクセス製品「DW4000」を発売"のような1文で表現された文字列を、形態素(Morpheme)("日本電気","、","光","アクセス","製品","「","DW","4000","」","を","発売")に分割し、形態素解析を行う。形態素とはこれ以上に細かくすると意味がなくなってしまう最小の文字列をいう。形態素解析とは、対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)を使用し、自然言語で書かれた文を形態素の列に分割(分節処理(分かち書き))し、それぞれの品詞を判別する作業を指す。形態素解析された結果は、例えば、図4に示すように、単語、品詞、補助、読みからなるデータ形式で形態素蓄積部103に格納される。
The
図5は、本実施例における情報源再構築部200を示す図である。図5に示すように、情報源再構築部200は、書式解析部201、書式ルール蓄積部202、要素単語格納部203、及び情報源メタ情報格納部206を有する。これらの手段はそれぞれ概略次のように動作する。
FIG. 5 is a diagram illustrating the information
書式解析部201には、形態素蓄積部103から、情報源を形態素に分断された品詞集合が入力される。この品詞集合において連続した名詞を結合する。上述の例では、例えば"光"、"アクセス"、"製品"を連結して"光アクセス製品"とする。その後、書式ルール蓄積部202を参照して、情報源特有の表現にマッチするルール集合を取り出し、主体者、行動、製品名、特徴語などのキーワードを抽出することで、形態素集合から、製品名・主体者・行動・特徴語・シノニム(要素単語)を生成し、要素単語格納部203に格納する。要素単語格納部203に格納された要素単語は情報源毎に情報源メタ情報格納部206に格納される。
下記の書式ルールに従うと、
主体者:日本電気
製品名:DW4000
行動:発売
特徴語:光アクセス製品
という要素単語を生成する。
The
If you follow the formatting rules below,
Subject: NEC Product Name: DW4000
Action: Release feature word: Generate element word of Hikari Access product.
書式ルール蓄積部202に格納されているルールは下記のようなものがある。
1)製品/派生製品抽出ルール
(ア)かぎ括弧「」で囲まれている連続名詞を製品名として抽出する
(イ)英字+数字があれば、製品型番として抽出する
(ウ)マーク(R)の前にくる連続名詞を商標名として抽出する
(エ)過去に抽出された製品名との差分をとり、差分部分を派生製品名として抽出する
(オ)該当するものがなければ、製品名なしと判定し、抽出されない
The rules stored in the format
1) Product / derived product extraction rules (a) Extract consecutive nouns enclosed in angle brackets “” as product names (a) If there are English letters + numbers, extract them as product model numbers (c) Mark (R) Extract the continuous nouns that come before the product name as the trade name (d) Take the difference from the product name extracted in the past, and extract the difference part as the derived product name (e) If there is no corresponding, there is no product name Is not extracted
2)主体者抽出ルール
(ア)行頭から句点(、)までの範囲に、名詞しか出現しなかった場合には、最長一致の名詞を企業名とする
(イ)格助詞(「が」、「は」)の前にくる最長一致の名詞を企業名とする
(ウ)(株)、(有)の直後に来る最長一致の名詞を企業名とする
(エ)該当するものがなければ、情報源発信元サイトのURLから企業名を抜き出す
2) Subject extraction rule (a) When only nouns appear in the range from the beginning of a line to a punctuation point (,), the noun with the longest match is the company name. (A) Case particles ("GA", " The name of the longest matching noun that comes before “)” is the company name (C) Co., Ltd., and the longest matching noun that comes immediately after (Yes) is the company name. Extract company name from source URL
3)行動抽出ルール
(ア)行末のサ変名詞を、企業の行動とする
(イ)最後に出現する動詞を企業の行動とする
(ウ)該当するものがなければ、発表という行動を抽出する
3) Action extraction rules (a) The last variable noun is a company action (b) The last appearing verb is a company action (c) If there is no such thing, the action of announcement is extracted
4)行動対象ルール
(ア)行動が「納入」の場合は、助詞「へ」「に」の前にくる名詞を納入先企業とする
(イ)行動が「採用」の場合は、主体者として抽出された企業を納入先企業とする。
(ウ)該当するものがなければ、行動対象なしと判定し、抽出されない
4) Action target rule (a) When the action is “delivery”, the noun that comes before the particles “he” and “ni” is the delivery company. (B) When the action is “recruitment”, The extracted company is the delivery company.
(C) If there is no applicable item, it is determined that there is no action target and is not extracted.
5)シノニム抽出ルール
(ア)括弧「(」の前後にくる連続名詞1組を、キーワードとそのシノニムとして抽出する。
(イ)該当するものがなければ、シノニムなしと判定し、抽出されない
5) Synonym extraction rule (a) A set of consecutive nouns before and after the parenthesis “(” is extracted as a keyword and its synonym.
(B) If there is no applicable one, it is determined that there is no synonym and is not extracted.
6)特徴語抽出ルール
(ア)他のルール集合で漏れた連続名詞を、特徴語として抽出する。
6) Feature word extraction rule (a) A continuous noun leaked in another rule set is extracted as a feature word.
図6は、本実施例における情報源選別部300を示すブロック図である。図6に示すように、情報源選別部300は、情報源選別部301、ドメイン辞書格納部302、適合情報源格納部303、及び非適合情報源格納部304を有する。これらの手段はそれぞれ概略次のように動作する。
FIG. 6 is a block diagram showing the information
情報源選別部301は、ドメイン辞書格納部302のドメイン辞書を参照し、事業ドメインに適合する情報源のみを適合情報源として選択する。具体的には、先ず、情報源の中に例えば"納入"、"採用"といった行動を含む言葉があれば、生産財に関する情報源であると判定する。
The information
次に情報源選別部301は、ドメイン辞書を参照し、生産財に関する情報源と判定された情報源を構成する要素単語、すなわち主体者、製品名、行動、特徴語、及びシノニムと、ドメイン辞書格納部302に格納されている事業ドメイン専門の企業名、製品名、及び特徴語とを比較する。図7は、ドメイン辞書の構造を示す図、図8は、ドメイン辞書の一例を示す図である。ドメイン辞書には、主体者、製品名、特徴語などのカテゴリ別に、語句1列、語句2列、・・・と複数の語句列が登録されている。
Next, the information
そして、情報源選別部301は、生産財に関する情報源と判定された情報源の各要素単語とドメイン辞書の単語を比較して、マッチするものが1つ以上合った場合に、その情報源は事業ドメインに合致した生産財と判定し、適合情報源格納部303に格納し、マッチするものがない場合には、非適合情報源格納部304に格納する。そして、適合情報原格納部303に格納した情報源を構成する"製品名"、"特徴語"、及び"シノニム"のうち、ドメイン辞書に登録がないものをドメイン辞書格納部302のドメイン辞書へ登録する。情報源を構成する"主体者"は、事業ドメインにおける専門業者と総合メーカを区別するため、情報源の各要素単語がドメイン辞書と適合又は非適合する個数を毎回測定する。同一主体者の情報源に関して、情報源の総数に対し、所定の割合th1(0<th1<1)以上の数の情報源が適合情報源であれば、専門業者として当該情報源の主体者をドメイン辞書の主体者カテゴリに登録し、所定の割合未満である場合は総合メーカとして主体者カテゴリに登録する。
Then, the information
図9は、本実施例におけるグループ生成部400を示すブロック図である。図9に示すように、グループ生成部400は、情報源増殖部401、及び技術辞書格納部402を有する。これらの手段はそれぞれ概略次のように動作する。
FIG. 9 is a block diagram illustrating the
情報源増殖部401は、事業ドメインの生産財と判定されなかった情報源を非適合情報源格納部304から取得し、技術辞書格納部402の技術辞書を参照して事業ドメインに合致するものがないか検査することで、非適合情報源を適合情報源に昇格させる。
The information
技術辞書は、技術用語とシノニムの集合を、その事業ドメインにおける上位概念・下位概念に基づき分類したものである。例えば、図10は製品構成をベースにした技術辞書である。この技術辞書では、生産財を生産するためのモジュール構成を元に、パーツに関する技術用語を最下位のノードに、パーツ集合から構成されるモジュール部分をその上位に、モジュールから構成される製品を最上位のノードに、といった階層構造を定義している。すなわち、最下位には、"光増幅"、"光アクセス"、"OC−12"、"SRM−16"が定義され、その上位に"DWDM"、"SONET/SDH"が定義され、最上位には、"光伝送装置"が定義されている。また、それぞれのノード間の距離も技術辞書作成時に設定する。図11は、技術辞書の構造を示す図である。同時に利用される用語同士は距離が短く、同時に利用されない用語は距離を長く置くように設定する。例えば"光増幅"と"光アクセス"との距離は0.6であり、"光増幅"と"SONET/SDH"の距離は2.3である。生産財にも様々なドメインがあるため、分析対象の事業ドメインに合致するものをあらかじめ準備しておく。 The technical dictionary is a set of technical terms and synonyms classified based on the superordinate concepts and subordinate concepts in the business domain. For example, FIG. 10 is a technical dictionary based on the product configuration. In this technical dictionary, based on the module configuration for producing production goods, the technical terms related to parts are at the lowest node, the module part composed of parts is placed at the top, and the product composed of modules is the top. A hierarchical structure such as a higher node is defined. That is, “optical amplification”, “optical access”, “OC-12”, and “SRM-16” are defined at the bottom, and “DWDM” and “SONET / SDH” are defined at the top. Defines an “optical transmission device”. The distance between each node is also set when creating the technical dictionary. FIG. 11 is a diagram showing the structure of the technical dictionary. Terms that are used at the same time are set to have a short distance, and terms that are not used at the same time are set to have a long distance. For example, the distance between “optical amplification” and “optical access” is 0.6, and the distance between “optical amplification” and “SONET / SDH” is 2.3. Since production goods also have various domains, prepare items that match the business domain to be analyzed in advance.
なお、技術辞書のノード及びノード間の距離は図8、後述する図35に示す事業ドメインにあわせて自由に定義してよい。 The nodes of the technical dictionary and the distance between the nodes may be freely defined in accordance with the business domain shown in FIG. 8 and FIG. 35 described later.
この技術辞書を使用することで、あるキーワードと同種のワードが含まれている場合であって、そのワードがキーワードに一致しない場合であっても、適合情報源とすることができる。よって、必要な情報が漏れてしまったりする可能性を低減し、新しい競合製品や、その特徴語を容易に追加することができる。 By using this technical dictionary, even if a word of the same type as a certain keyword is included and the word does not match the keyword, it can be used as a compatible information source. Therefore, it is possible to reduce the possibility that necessary information is leaked, and to easily add new competitive products and their characteristic words.
なお、本実施の形態においては技術辞書として説明するが、単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した単語辞書であればよい。例えば、生鮮食品業界の企業ニュースを取り扱う場合、技術辞書は、"食品"が最上位ノード、その下位ノードに"肉"、"魚"、更に"肉"の下位ノードに"豚肉"、"牛肉"、"鶏肉"などのノードを有するツリー辞書とすることも可能である。 In the present embodiment, a technical dictionary will be described. However, any word dictionary in which a set of words and synonyms thereof is classified based on a higher concept and / or a lower concept in the business domain may be used. For example, when dealing with company news in the fresh food industry, the technical dictionary has a “food” at the top node, “meat” and “fish” at its lower nodes, and “pork” and “beef” at its lower nodes. It is also possible to make a tree dictionary having nodes such as “,“ chicken ”.
先ず、事業ドメインに合致する生産財商品の特徴語をドメイン辞書格納部302のドメイン辞書から取得し、非適合情報源の特徴語と比較して、類似度を計算する。類似度は、上記技術辞書に基づき計算し、非適合情報源と技術辞書との距離が所定の閾値以下であれば非適合情報源を事業ドメインの生産財に関する情報と判定し、適合情報源として適合情報源格納部303に格納する。すなわち、非適合情報源から、事業ドメインに適合する蓋然性が高いものを抽出し、適合情報源格納部303へ再登録する。そして、このとき、適合情報源に昇格した非適合情報源を構成する要素単語のうち、技術辞書に登録されていない単語を技術辞書に登録することで技術辞書を増殖する。さらに、ドメイン辞書格納部302に登録されていない特徴語や製品名は、新たにドメイン辞書格納部302に追記することでドメイン辞書を増殖する。
First, the feature words of the product goods that match the business domain are acquired from the domain dictionary in the domain
この情報源増殖部401により、ドメイン辞書を用いて非適合と判定された非適合情報源を、技術辞書を用いて適合情報源に昇格させることができる。また、情報源増殖部401は、既存のドメイン辞書や技術辞書を参照し、新たに適合情報源として適合情報源格納部303に加えられた情報源に含まれる主体者や特徴語が既存のドメイン辞書や技術辞書に登録されているか判定する。もし登録されていなければ、新たにドメイン辞書や技術辞書に登録することで、ドメイン辞書や技術辞書にない単語を、ドメインに適合している情報源に含まれる要素単語を用いて増殖させることができる。
The information
従来、生産財の製品企画を行うためにも、競合他社製品のベンチマーク、技術動向、市場動向などを収集する必要がある。このため、従来であれば例えばコンサルタントと共同で社外の外部環境調査を行う必要があった。また、製品企画に役立つ情報源として、インターネット上に散在しているホームページ、営業担当者が保持しているヒアリング情報、雑誌記事などを、漏れなく収集し纏めあげる作業は労力を要する。継続的に人が行う作業であるため、調査する人の力量に大きく依存し、客観的な情報に基づいて製品企画を行うことが困難であった。このため、生産財の製品企画においては、競合他社の新製品がリリースされたが、横並びの製品であるように見えてしまい、どのような差異化要因があるのか、分かりづらいという課題があった。 Conventionally, it is necessary to collect benchmarks, technology trends, market trends, etc. of competitor products in order to plan product for production goods. For this reason, conventionally, for example, it has been necessary to conduct an external external environmental survey in cooperation with a consultant. Moreover, as an information source useful for product planning, it is laborious to collect and collect homepages scattered on the Internet, interview information held by sales representatives, magazine articles, etc. without omission. Since it is a work that is continuously performed by a person, it depends heavily on the ability of the investigator and it is difficult to plan a product based on objective information. For this reason, in product planning for production goods, new products from competitors were released, but they seemed to be side-by-side products, and there was a problem that it was difficult to understand what differentiating factors were .
このような課題に対し、本実施例にかかる情報構造化装置1によれば、情報源から特徴語などの要素単語が抽出できるため、競合他社の新製品がどのような差異化要因を保持しているのか分かりやすくなるため、上記課題を解決することができる。また、情報源を、事業ドメイン辞書を参照するのみならず、非適合情報源と判断された情報源も技術辞書を参照することで、適合情報源に昇格させることができ、情報源から漏れなく必要な情報源を抽出することができる。
In response to such a problem, the
次に、本実施例の動作について説明する。図12は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。本実施例は、未知の競合商品が市場にリリースされたことを検出する例である。前提として、"DW4000"は事業ドメインに合致した製品であることを、ドメイン辞書格納部302のドメイン辞書の「製品名」行、「語句1」列に登録しておく。(図8参照)
Next, the operation of this embodiment will be described. FIG. 12 is a flowchart illustrating the operation of the information structuring apparatus according to the present embodiment. This example is an example of detecting that an unknown competitive product has been released to the market. As a premise, “DW4000” is registered in the “product name” row and “word /
情報源として、例えば
"日本電気、光アクセス製品「DW4000」を発売"
という文字列がシステムに入力された場合について説明する。情報源裁断部100の形態素解析部102は、当該情報源の形態素解析を行い、この情報源を形態素へ分解することで、図13に示す形態素を得る。(ステップS100)。この形態素は、形態素蓄積部103に格納される。
As an information source, for example
"NEC releases optical access product" DW4000 ""
A case where the character string "" is input to the system will be described. The
書式解析部201は、形態素蓄積部103に格納された形態素集合に連続した名詞が出現する場合、これらを結合する。(ステップS200)。図14は、形態素の連結後を示す図である。次に、結合された連続名詞が、主体者なのか、製品名なのか、行動なのか、特徴語なのか判定するために、書式解析ルールを適用する(ステップS300)。
When the continuous noun appears in the morpheme set stored in the
次に、書式解析ルール適用方法について説明する。書式解析部201は、形態素集合の連続名詞を結合し、形態素又は連続名詞から、書式ルールに従って、主体者、製品名、行動、特徴語、シノニムを抽出する。
Next, the format analysis rule application method will be described. The
先ず、製品名抽出方法について説明する。図15は、製品名抽出方法を示すフローチャートである。製品名を抽出する場合には、図15に示すように、順序付けされた形態素集合から、鍵括弧が存在するか判定し(ステップS301)、もし鍵括弧があればその鍵括弧内の形態素配列を抽出する(ステップS302)。そして、鍵括弧内の形態素配列に名詞又は記号のみが存在するか否か判定し(ステップS303)、英数字が連続しているものがあれば(ステップS304)、英字と数字の連続した名詞を結合する(ステップS305)。さらに、この鍵括弧内の形態素配列の中に商標記号が存在するか否かを判定し(ステップS306)、存在すれば商標記号を削除すると共に、商標記号前の名詞を商品名として製品名に登録し、商標記号後の名詞を特徴語して採用する(ステップS307)。以上により抽出された製品名が過去に製品名として登録されているかどうか判定し、(ステップS308)、製品名が過去に登録されており、括弧内に商標で分断された名詞が存在すれば、それを派生商品修飾語として要素単語格納部203の特徴語に登録し(ステップS309)、商品名が過去に登録されていなければ新製品名として要素単語格納部203の製品名に登録し(ステップS310)、製品名抽出フローを終了する。
First, the product name extraction method will be described. FIG. 15 is a flowchart showing a product name extraction method. When extracting the product name, as shown in FIG. 15, it is determined from the ordered morpheme set whether or not there is a key bracket (step S301). If there is a key bracket, the morpheme array in the key bracket is determined. Extract (step S302). Then, it is determined whether or not only nouns or symbols are present in the morpheme array in the brackets (step S303), and if there are consecutive alphanumeric characters (step S304), a noun in which letters and numbers are consecutive is determined. Combine (step S305). Further, it is determined whether or not a trademark symbol exists in the morpheme array in the brackets (step S306). If it exists, the trademark symbol is deleted, and the noun before the trademark symbol is used as the product name in the product name. The noun after the trademark symbol is registered and adopted as a feature word (step S307). It is determined whether or not the product name extracted in the above has been registered as a product name in the past (step S308), and if the product name has been registered in the past and there is a noun separated by a trademark in parentheses, It is registered in the feature word of the element
図16は、主体者抽出方法を示すフローチャートである。図16に示すように、順序付けされた形態素集合において、行頭から句点まで名詞のみ存在するか否かを判定する(ステップS311)。名詞のみ存在する場合は、主体者として抽出する(ステップS312)。 FIG. 16 is a flowchart showing the subject extraction method. As shown in FIG. 16, in the ordered morpheme set, it is determined whether or not only the noun exists from the beginning of the line to the punctuation point (step S311). If only the noun exists, it is extracted as the subject (step S312).
一方、行頭から句点まで名詞のみではない場合、(株)、(有)の記号が存在するか否かを判定する(ステップS313)。存在する場合は、当該記号の前後名詞を主体者として抽出する(ステップS314)。また、(株)、(有)の記号が存在しない場合は、"が"又は"は"が存在するか否かを判定する(ステップS315)。存在する場合は、助詞の前の名詞を主体者として抽出する。さらに、"が"又は"は"も存在しない場合は、発信元を主体者とする(ステップS317)。抽出した主体者は、要素単語格納部203に記録する。
On the other hand, if it is not only a noun from the beginning of a line to a punctuation point, it is determined whether or not (stock) and (present) symbols exist (step S313). If it exists, the noun before and after the symbol is extracted as the subject (step S314). If the symbols “stock” and “present” do not exist, it is determined whether “has” or “has” exists (step S315). If it exists, the noun before the particle is extracted as the subject. Further, when neither “ga” nor “ha” exists, the sender is set as the subject (step S317). The extracted subject is recorded in the element
図17は、行動抽出方法を示すフローチャートである。図17に示すように、順序付けされた形態素集合において、行末にサ変名詞があるか否かを判定する(ステップS321)。ある場合は、サ変名詞を含む連続名詞を行動として抽出する(ステップS322)。サ変名詞がない場合は、動詞が存在するか否かを判定する(ステップS323)。動詞が存在する場合は、最後に出現する動詞を行動として抽出する(ステップS324)。動詞が存在しない場合は、"発表"という行動を図5に示す要素単語格納部203の行動に追加する(ステップS325)
FIG. 17 is a flowchart showing the behavior extraction method. As shown in FIG. 17, in the ordered morpheme set, it is determined whether or not there is a saun noun at the end of the line (step S321). If there is, a continuous noun including a sa strange noun is extracted as an action (step S322). If there is no sa variable noun, it is determined whether or not a verb is present (step S323). If a verb exists, the last appearing verb is extracted as an action (step S324). If the verb does not exist, the action “announcement” is added to the action of the element
図18は、行動対象抽出方法を示すフローチャートである。図18に示すように、順序付けされた形態素集合において、行動が"納入"か否かが判断される(ステップS331)。なお、行動対象抽出処理は、行動抽出処理の後に実施される。抽出された行動が"納入"であれば、助詞"へ"、"に"の前の最長一致の名詞を行動対象として抽出する(ステップS332)。行動が"納入"でない場合、"採用"か否かを判断する(ステップS333)。"採用"である場合は、主体者の企業を行動対象として抽出する(ステップS334)。抽出した行動は、要素単語格納部203に記録する。一方、行動が"採用"でもない場合は、処理を終了する(ステップS335)。
FIG. 18 is a flowchart showing the action target extraction method. As shown in FIG. 18, it is determined whether or not the action is “delivery” in the ordered morpheme set (step S331). The action target extraction process is performed after the action extraction process. If the extracted action is “delivery”, the longest matching noun before “to” and “to” is extracted as an action target (step S332). If the action is not “delivery”, it is determined whether or not it is “adoption” (step S333). If “adopted”, the company of the subject is extracted as an action target (step S334). The extracted action is recorded in the element
図19は、シノニム抽出方法を示すフローチャートである。図19に示すように、順序付けされた形態素集合において、括弧が存在するか否かを判断し(ステップS341)、括弧が存在する場合は、右括弧の前後にくる連続名詞1組を語源とそのシノニムとし、これを抽出する(ステップS342)。抽出した語源及びそのシノニムは、要素単語格納部203に記録する。一方、括弧が存在しない場合は、シノニムなしを要素単語格納部203に記録する(ステップS343)。
FIG. 19 is a flowchart showing a synonym extraction method. As shown in FIG. 19, it is determined whether or not parentheses are present in the ordered morpheme set (step S341). If parentheses are present, a set of consecutive nouns that precede and follow the right parenthesis A synonym is extracted (step S342). The extracted word source and its synonym are recorded in the element
図20は、特徴語抽出方法を示すフローチャートである。図20に示すように、順序付けされた形態素集合において、他のルールを適用して分類不能な名詞があるか否かを判断する(ステップS351)。ある場合は、その名詞を特徴語として抽出し(ステップS352)、要素単語格納部203に記録する。
FIG. 20 is a flowchart showing the feature word extraction method. As shown in FIG. 20, it is determined whether there is a noun that cannot be classified by applying another rule in the ordered morpheme set (step S351). If there is, the noun is extracted as a feature word (step S352) and recorded in the element
以上のように、図15に示す製品名抽出工程、図16で示す主体者抽出工程、図17で示す行動抽出工程、図18で示す行動対象抽出工程、図19で示すシノニム抽出工程、図20で示す特徴語抽出工程を経て、図21に示すような解析結果を得る(ステップS300)。すなわち、"日本電気、光アクセス製品「DW4000」を発売"という情報源から、
主体者:日本電気
製品名:DW4000
行動:発売
特徴語:光アクセス製品
という解析結果が得られる。
As described above, the product name extracting step shown in FIG. 15, the subject extracting step shown in FIG. 16, the action extracting step shown in FIG. 17, the action target extracting step shown in FIG. 18, the synonym extracting step shown in FIG. Through the feature word extraction process indicated by (2), an analysis result as shown in FIG. 21 is obtained (step S300). In other words, from the information source “NEC releases optical access product“ DW4000 ””
Subject: NEC Product Name: DW4000
Action: Launch Feature word: The result of the analysis is an optical access product.
次に、情報源選別部301が、ドメイン辞書を参照し、情報源から適合情報源を選別する方法について具体的に説明する。情報源(ニュース情報源)として、
"オプト販売が光増幅をラマン方式とする「FX4200」をNEEへ納入"
という文字列が情報構造化装置1へ入力されるとする。情報構造化装置1は、上述と同様に、図12のステップS100からステップS300まで実行し、図22に示す書式解析結果を得る。
Next, a method in which the information
"Opto Sales Deliver" FX4200 "with Raman Method for Optical Amplification to NEE"
Is input to the
図23は、適合情報源選別方法を示すフローチャートである。情報源選別部301が情報源を構成する要素単語と事業ドメイン辞書とを照合する。すなわち、図23に示すように、情報源選別部301は、情報源から、行動ノードに"納入"、"採用"が含まれているか否かを検出する(ステップS401)。"納入"、"採用"が含まれており、生産財に関する情報源と判断された情報源を構成する単語と、ドメイン辞書の各カテゴリの単語とをマッチングする(ステップS402)。そして、1つ以上、一部又は全部一致するものが存在するか否かを判定し(ステップS403)、情報源を適合情報源として登録する(ステップS404)。
FIG. 23 is a flowchart showing a compatible information source selection method. The information
次に、情報源を構成する製品名・特徴語などであって、ドメイン情報に登録がないものはドメイン辞書へ追加する(ステップS405)。次いで、適合回数が所定の割合以上であるか否かが判定され(ステップS406)、所定の条件に合致する場合には、情報源の主体者をドメイン辞書へ追加する(ステップS407)。これにより、情報源を構成する"主体者"が、事業ドメインにおける専門業者か、又は総合メーカかを区別することができる。本例においては、図22に示す情報源を構成する要素単語と図8に示す事業ドメイン辞書とは部分一致もしないため、この事業ドメイン選別工程S400では、入力された情報源が事業ドメインに合致しないと判定される。合致しない場合は、非適当情報源格納部304に当該情報源を格納する。
Next, product names / characteristics constituting the information source that are not registered in the domain information are added to the domain dictionary (step S405). Next, it is determined whether or not the number of adaptations is equal to or greater than a predetermined ratio (step S406). If the predetermined number of conditions is met, the information source subject is added to the domain dictionary (step S407). Thereby, it is possible to distinguish whether the “subject” constituting the information source is a specialist in the business domain or a general manufacturer. In this example, the element words constituting the information source shown in FIG. 22 and the business domain dictionary shown in FIG. 8 do not partially match. Therefore, in this business domain selection step S400, the input information source matches the business domain. It is determined not to. If they do not match, the information source is stored in the unsuitable information
次に、情報源増殖部401が技術辞書を参照して、非適合情報源格納部304の情報源から事業ドメイン候補を選別することで情報源を増殖すると共に技術辞書及びドメイン辞書の単語を増殖する(ステップS500)。図24は、情報源の増殖方法を示すフローチャートである。
Next, the information
図24に示すように、情報源増殖部401は、先ず、図10に示す技術辞書の全ノードと、非適合情報源格納部304に格納された非適合情報源の各要素単語とを照合する(ステップS411)。本例においては、特徴語"光増幅"が技術辞書の一のノードと一致するため、事業ドメイン候補として列挙される。(ステップS412)そして、この"光増幅"とドメイン辞書の特徴語"光アクセス"との距離を、技術辞書を使用して計算する(ステップS413)。この場合、"光増幅"と"光アクセス"の距離は0.6である。ここでは閾値が1.5未満を事業ドメインとすると設定されているものとすると(ステップS414)、光増幅という特徴語を含む当該情報源も情報源増殖部401により事業ドメインに関連するものと判定される。そして、事業ドメインに関連するものと判定された非適合情報源を、適合情報源格納部303に格納する(ステップS415、ステップS600)。
As shown in FIG. 24, the information
そして、情報源増殖部401は、この事業ドメインに関連するものと判定された非適合情報源に基づき、特徴語として「ラマン方式」を追加する(ステップS416)。また、情報源増殖部401は、非適合情報源のうち、事業ドメインに関連するものと判定された情報源に基づき、技術辞書の光増幅ノードの子ノードとして、「ラマン方式」ノードを例えば固定距離0.1で追加する。この場合、このように自動増殖される単語については、システムの固定値を距離として設定することも可能であるが、例えば、追加する単語と、当該単語を追加される単語とのオリジナル文章(情報源)における位置関係に基づき算出すること等も可能である。また、適合回数が所定の割合以上であるか否かを判断し(ステップS417)、適合回数が所定の割合以上である場合には、ドメイン辞書の主体者として「オプト販売」を追加する。(ステップS418)。事業ドメインに合致する情報源の入力によって、自動的に事業ドメイン辞書及び技術辞書が増殖する。
Then, the information
次に、本発明の第1の実施例の効果について説明する。本実施例では、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった会社の競合製品を発見し、購入対象として提示することができる。そして、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出することができる。 Next, effects of the first exemplary embodiment of the present invention will be described. In this embodiment, the information source is decomposed into the subject, action, product name, and feature word, and compared with other information sources using the business domain dictionary and technical dictionary, so the competing product of the company that has been unknown until now Can be discovered and presented for purchase. Then, the morpheme sets of information sources are combined with continuous nouns, and the subject, product name, action, feature word, and synonym can be extracted by the format rule.
また、ドメイン辞書を用いて、生産財かつターゲットとする事業ドメインに属している情報源のみ適合情報として抽出することができる。さらに、ドメイン辞書を用いて非適合と判定された情報源を、技術辞書を用いて適合情報源として昇格させることができると共にドメイン辞書や技術辞書にない単語を、ドメインに適合している情報源の特徴語を用いて増殖させることができる。すなわち、新しい競合製品の特徴語を、事業ドメイン辞書や技術辞書に追加することができるため、新しく製品が発売になった時などにおいても自動的に事業ドメイン・技術辞書の用語を増殖させることができ、人手でメンテナンスする工数を削減することができる。さらに増殖した特徴語も含めて、後から入力される情報源を比較するため、より広く製品を発見することが可能になる。 In addition, by using a domain dictionary, only information sources belonging to a production domain and a target business domain can be extracted as relevant information. Furthermore, an information source that is determined to be non-conforming by using a domain dictionary can be promoted as a conforming information source by using a technical dictionary, and a word that does not exist in the domain dictionary or technical dictionary conforms to the domain. Can be propagated using the feature words. In other words, feature words of new competitive products can be added to the business domain dictionary and technical dictionary, so that the terms of the business domain / technical dictionary can be automatically expanded even when a new product is released. This can reduce the man-hours required for manual maintenance. Furthermore, since the information source inputted later is also compared including the feature word which grew, it becomes possible to discover a product more widely.
本発明の第1の実施例の変形例
次に、本発明の第2の実施例について説明する。本実施例は、情報源再構築部が情報源をツリー構造にするツリー生成部を有し、情報源選別部及びグループ生成部が情報源を情報源ツリーの状態で扱う点が第1の実施例と異なる。その他の点は、同様である。
Modification of the first embodiment of the present invention Next, a second embodiment of the present invention will be described. The first embodiment is that the information source reconstruction unit has a tree generation unit that makes the information source a tree structure, and the information source selection unit and the group generation unit handle the information source in the state of the information source tree. Different from the example. The other points are the same.
図25は、本発明の第1の実施例の変形例にかかる情報構造化装置1bを示す図である。図1に示すように、本変形例にかかる情報構造化装置1bは、情報源裁断部100、情報源再構築部200b、情報源選別部300b、及びグループ生成部400bを有する。
FIG. 25 is a diagram showing an
図26は、本実施例における情報源再構築部200bを示す図である。図26に示すように、情報源再構築部200bは、書式解析部201、書式ルール蓄積部202、要素単語格納部203、ツリー生成部204、及び情報源ツリー格納部205を有する。ツリー生成部204、及び情報源ツリー格納部205以外は第1の実施例と同様である。
FIG. 26 is a diagram illustrating the information
ツリー生成部204は繋がりのない要素単語から、主体者をルートする情報源ツリーを生成する。図27は、情報源ツリーを示す図である。図27に示すように、主体者名がルートノードとなり、商標を有する製品名がその子ノードとなっている。さらに、派生製品、アクション、特徴語が商標を有する製品名の子ノードとなっている。さらに、シノニム、特徴語が派生製品の子ノードとなり、アクションの対象がアクションの子ノードとなっている。この情報源ツリーは、下記のルールに従って生成される。
(1)主体者名をルートノードとする
(2)製品名は商標の関係で普遍性を有する単語である。製品名を企業名の子ノードとする
(3)派生製品名を、商標を有する製品名の子ノードとする
(4)企業の行動は、製品又は派生製品の子ノードとする
(5)納入先は、行動の子ノードとする
(6)特徴語は、製品名又は派生製品名の子ノードとする
(7)シノニムは、言い換え対象となったキーワードと同じレベルのノードとする
The
(1) The subject name is the root node. (2) The product name is a word having universality in relation to trademarks. The product name is a child node of the company name. (3) The derived product name is a child node of the product name having the trademark. (4) The company action is the child node of the product or derivative product. Is a child node of an action (6) A feature word is a child node of a product name or a derived product name (7) A synonym is a node at the same level as a keyword to be paraphrased
上記ルールに従って生成された情報源ツリーは、1件の情報源に対応する。生成された情報源ツリーは、情報源ツリー格納部205へ格納される。
The information source tree generated according to the above rule corresponds to one information source. The generated information source tree is stored in the information source
この情報源再構築部200bにより、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出し、これらの要素単語からツリー構造を構築することができる。抽出された要素単語をツリー構造にすることで、要素単語を構造化した情報源ツリーを得ることができる。
By this information
図28は、本実施例における情報源選別部300bを示すブロック図である。図28に示すように、情報源選別部300bは、ツリー選別部301b、ドメイン辞書格納部302、適合情報源ツリー格納部303、及び非適合情報源ツリー格納部304bを有する。情報源ではなく、情報源ツリーを扱う点が第1の実施例と異なる。
FIG. 28 is a block diagram showing the information
図29は、本実施例におけるグループ生成部400bを示すブロック図である。図29に示すように、グループ生成部400bは、ツリー増殖部401b、及び技術辞書格納部402を有する。情報源選別部300bと同様、情報源ではなく、情報源ツリーを扱う点が第1の実施例と異なる。
FIG. 29 is a block diagram illustrating the
次に、本実施例の動作について説明する。図30は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。上記と同様、 "DW4000"は事業ドメインに合致した製品であることを、ドメイン辞書格納部302のドメイン辞書の「製品名」行、「語句1」列に登録しておく。(図8参照)
Next, the operation of this embodiment will be described. FIG. 30 is a flowchart illustrating the operation of the information structuring apparatus according to the present embodiment. Similarly to the above, “DW4000” is registered in the “product name” row and “word /
そして、情報源として、
"日本電気、光アクセス製品「DW4000」を発売"
という文字列がシステムに入力された場合、情報源裁断部100は上述と同様に形態素解析を行い、図13に示す形態素を得る。(ステップS100)。そして、書式解析部201は、書式解析ルールを適用する(ステップS300)。その結果、図21に示すような解析結果を得る(ステップS300)。すなわち、"日本電気、光アクセス製品「DW4000」を発売"という情報源から、
主体者:日本電気
製品名:DW4000
行動:発売
特徴語:光アクセス製品
という解析結果が得られる。
And as an information source,
"NEC releases optical access product" DW4000 ""
Is input to the system, the information
Subject: NEC Product Name: DW4000
Action: Launch Feature word: The result of the analysis is an optical access product.
ツリー生成部204bは、この解析結果から、上述したように、図27に示す所定のルールに従って、図31に示すような情報源ツリーを生成する(ステップS360)。生成した情報源ツリーを、情報源ツリー格納部205bに格納する。そして、情報源選別部300bのツリー選別部301bは、情報源ツリーの中に例えば"納入"、"採用"といった行動を含むか否かで情報源ツリーが生産財に関するものであるか否かを判定する。そして、生産財に関するものと判定した情報源ツリーを構成する主体者、製品名、特徴語と、ドメイン辞書格納部302のドメイン辞書とを比較する。ドメイン辞書の単語と、情報源ツリーを構成する要素単語とが一部一致又は全部一致した場合に、当該情報源ツリーを適合情報源ツリーとする。本例においては、図8に示すドメイン辞書において、製品名"DW4000"が一致し、特徴語"光アクセス製品"がドメイン辞書の"光アクセス"と部分一致していることが分かるため、当該情報源を事業ドメインに合致した適合情報源ツリーであると判定し、当該情報源ツリーを適合情報源ツリーとして格納する。(ステップS400)。適合情報源ツリーと判定した情報源ツリーは、適合情報源ツリー格納部303に格納する。
From the analysis result, the tree generation unit 204b generates an information source tree as shown in FIG. 31 according to the predetermined rule shown in FIG. 27 as described above (step S360). The generated information source tree is stored in the information source tree storage unit 205b. Then, the
次に、ツリー選別部301が、ドメイン辞書を参照し、情報源ツリーから適合情報源ツリーを選別する方法について具体的に説明する。情報源(ニュース情報源)として、
"オプト販売が光増幅をラマン方式とする「FX4200」をNEEへ納入"
という文字列が情報構造化装置1bへ入力されるとする。情報構造化装置1bは、上述と同様に、図12のステップS100からステップS300まで実行し、図22に示す書式解析結果を得る。ツリー生成部204bは、この書式解析結果から図32に示すような情報源ツリーを生成し、ツリー選別部301bが情報源ツリーを構成する要素単語と事業ドメイン辞書とを照合する。本例においては、図22に示す情報源ツリーを構成する要素単語と図8に示す事業ドメイン辞書とは部分一致もしないため、この事業ドメイン選別工程では、入力された情報源が事業ドメインに合致しないと判定される。合致しない場合は、非適当情報源ツリー格納部304bに当該情報源ツリーを格納する。
Next, a method in which the
"Opto Sales Deliver" FX4200 "with Raman Method for Optical Amplification to NEE"
Is input to the
このように、情報源が非適合情報源ツリーである場合は(ステップS410:Yes)、ツリー増殖部401bが技術辞書を参照して、非適合情報源ツリー格納部304bの情報ツリーから事業ドメイン候補を選別することで情報源ツリーを増殖すると共に技術辞書及びドメイン辞書の単語を増殖する(ステップS500)。そして、事業ドメインに関連するものと判定された非適合情報源ツリーを、適合情報源ツリー格納部303bに格納する(ステップS600)。
Thus, when the information source is a non-conforming information source tree (step S410: Yes), the
本変形例においても、第1の実施例と同様、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった会社の競合製品を発見し、購入対象として提示することができる。そして、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出し、ツリー構造を構築することができる。 In this modified example, as in the first embodiment, the information source is decomposed into the subject, action, product name, and feature word, and compared with other information sources using the business domain dictionary and technical dictionary. It is possible to discover competing products of companies that were not known before and present them as purchase targets. Then, the morpheme sets of the information sources are combined with continuous nouns, and the subject, product name, action, feature word, and synonym are extracted according to the format rules, and a tree structure can be constructed.
本発明の第2の実施例
次に、本発明の第2の実施例について説明する。本実施例は、情報源選別部が主体者がどのようなカテゴリの企業であるかを判別するための主体者辞書を有する点が第1の実施例とは異なる。なお、以下の実施例においては、上述の変形例の如く、情報源を情報源ツリーとして扱う例について説明するが、情報源はツリー構造としなくともよいことは言うまでもない。図33は、本実施例にかかる情報源選別部を示す図である。なお、その他の構成については、第1の実施例と同様であり、その詳細な説明は、省略する。図33に示すように、情報源選別部300cのツリー選別部301は、適合情報源ツリーに分類する際に、更に主体者辞書305を参照し、各情報源ツリーの主体者毎に分類する。
Second Embodiment of the Invention Next, a second embodiment of the present invention will be described. This embodiment is different from the first embodiment in that the information source selection unit has a subject dictionary for determining what category the subject is a company. In the following embodiment, an example in which an information source is handled as an information source tree as in the above-described modification will be described, but it goes without saying that the information source does not have to have a tree structure. FIG. 33 is a diagram illustrating the information source selection unit according to the present embodiment. Other configurations are the same as those in the first embodiment, and a detailed description thereof will be omitted. As shown in FIG. 33, the
図34は、主体者辞書を示す図である。主体者辞書は、顧客企業:NEE、競合企業:タメシタ産業、部品納入企業:新川電工、など、企業のカテゴリと、その企業名からなる組で構成されている。ツリー選別部301は、情報源ツリーが顧客企業なのか、競合企業であるのか、部品納入企業であるのかを判定し、例えば競合企業の情報のみを抽出し、図示せぬ表示部に表示する等する。
FIG. 34 is a diagram showing a subject dictionary. The subject dictionary is composed of a combination of a company category and the company name, such as a customer company: NEE, a competitor company: Tameshita Industry, and a parts supplier company: Shinkawa Electric. The
次に、図12のフローチャートを参照して、本発明の第2の実施例の動作について詳細に説明する。本実施例では、未知の競合商品が未知の顧客に納入されたことを検出する例を示す。なお、本実施例においては、第1の実施例の結果増殖した事業ドメイン辞書(図35)と、技術辞書(図36)の値を利用するものとする。 Next, the operation of the second embodiment of the present invention will be described in detail with reference to the flowchart of FIG. In this embodiment, an example is shown in which it is detected that an unknown competitive product has been delivered to an unknown customer. In the present embodiment, the values of the business domain dictionary (FIG. 35) and the technical dictionary (FIG. 36) proliferated as a result of the first embodiment are used.
情報源のニュースとして、
"タメシタ産業、ADDI向け最軽量「J703iU」を納入"
という文字列が情報構造化装置に入力されることとする。情報構造化装置は、情報構造化装置1と同様に、ステップS100からステップS300まで実行し、図37に示す書式解析結果を得る。図35に示す事業ドメイン辞書を参照し、この情報源が事業ドメインに属さない、すなわち非適合情報源ツリーであると判定する(ステップS400)。そして、情報源が非適合情報源ツリーであるので(ステップS410)、図36に示す技術辞書を参照し、この情報源が事業ドメイン候補にならないことを判定する(ステップS500)。
As source news,
"Tameshita Industry Delivers Lightest" J703iU "for ADDI"
Is input to the information structuring apparatus. Similar to the
次いで、情報源のニュースとして、
"タメシタ産業、ADDIへDWDM製品「ADDI5000」を納入"
という文字列が情報構造化装置21に入力されるとする。情報構造化装置21は同様にステップS100からステップS300まで実行し、図38に示す書式解析結果を得る。そして、"納入"や"採用"といった言葉を含む情報源が入力された場合は、ツリー選別部301が、事業ドメイン辞書を参照し、当該情報源ツリーが事業ドメインに合致した適合情報源ツリーであるか否かを判定する(ステップS400)。本例においては、図35に示す事業ドメイン辞書を参照し、この情報源が事業ドメインに属さないことを判定する。
Then, as news of information sources,
"Tameshita Sangyo to deliver" DDI5000 "DWDM product to ADDI"
Is input to the information structuring apparatus 21. Similarly, the information structuring apparatus 21 executes steps S100 to S300 and obtains the format analysis result shown in FIG. When an information source including words such as “delivery” and “adoption” is input, the
情報源が非適合情報源ツリーであるので(ステップS410)、次に、図36に示す技術辞書を参照し、この情報源がDWDMというキーワードで一致し、事業ドメインに属する製品との特徴語と比較して、閾値以下の距離であるため、適合情報源ツリーであると判定する(ステップS500)。ここで、"タメシタ産業"という主体者は、事業ドメインに合致する適合情報源ツリー、及び合致しない適合情報源ツリーを有し、その割合が5割であり、事業ドメイン辞書の主体者として登録されるための条件を満たさないため、事業ドメイン辞書には登録されない。ただし、適合情報源ツリーと判定された情報源に含まれる製品名("ADDI15000")及び特徴語("DWDM製品")は事業ドメイン辞書に登録される(図39)。ここで、本実施例においては、図34に示す主体者辞書に基づき、ツリー選別部301が適合情報源ツリーを主体者毎に分類することができる。よって、例えば、競合他社の製品のみを情報構造化装置21に接続された表示手段(不図示)へ提示することができる。
Since the information source is a non-conforming information source tree (step S410), referring to the technical dictionary shown in FIG. 36, the information source matches with the keyword DWDM, and the feature word for the product belonging to the business domain In comparison, since the distance is equal to or smaller than the threshold, it is determined that the tree is a compatible information source tree (step S500). Here, the subject “Tameshita Sangyo” has a conforming information source tree that matches the business domain and a conforming information source tree that does not match, and the ratio is 50%, and is registered as the subject of the business domain dictionary. Is not registered in the business domain dictionary. However, the product name (“ADDI15000”) and the feature word (“DWDM product”) included in the information source determined to be the compatible information source tree are registered in the business domain dictionary (FIG. 39). Here, in this embodiment, based on the subject dictionary shown in FIG. 34, the
また、ニュースが事業ドメインに合致しているかどうかを主体者で判定することができる。専門業者の名前がニュースに含まれていた場合、技術辞書にない特徴語でも、事業ドメインに合致する製品であると判定したり、主体者による判定によって、ニュースに含まれる製品名も事業ドメインに適していると判定することができる。よって、それを購入した顧客を新顧客として認定することができる。また、総合メーカKを主体者に登録してしまうと、K製の洗濯機も、光ネットワーク製品だと誤判定したり、K製の洗濯機を大量に購入したコインランドリー業者がいた場合に、これを光事業ドメイン製品を購入した新規顧客と誤判定したりしてしまうが、総合メーカを主体者に登録せずに主体者判定することにより、あるメーカの製品は全て事業ドメインに合致するという動作をすることを防止する。 Also, the subject can determine whether the news matches the business domain. If the name of a specialist is included in the news, even if it is a feature word that is not in the technical dictionary, it is determined that the product matches the business domain. It can be determined that it is suitable. Therefore, the customer who purchased it can be authorized as a new customer. In addition, if the general manufacturer K is registered as the subject person, if a K laundry machine is erroneously determined to be an optical network product or there is a coin laundry company that has purchased a large number of K laundry machines, May be misidentified as a new customer who has purchased a HIKARI business domain product, but by determining the subject without registering the general manufacturer as the subject, all the products of a manufacturer match the business domain. Preventing you from doing.
本実施例においては、第1の実施例と同様、製品名や競合企業、さらには顧客企業が未知であっても、事業ドメインに合致する適合情報源ツリーであるか否かを、技術辞書を用いて判定する。このため、自社にとって脅威のある納入ニュースと、そうでないものを分類することが可能である。また、過去のニュースも考慮にいれて、主体者が専門業者か総合メーカかを判定するため、主体者が様々な適合情報源ツリーを開発している場合に、誤って異なる事業ドメインの新製品と判定することも減少し、この異なる事業ドメインの新製品を購入した顧客も、誤って新顧客として判定することも減少する。さらに、本実施例においては、主体者を分類することができるので、必要なカテゴリの企業情報を所望のタイミングで抽出し、表示等させることができる。 In this embodiment, as in the first embodiment, even if the product name, competitor, and customer company are unknown, the technical dictionary is used to determine whether the matching information source tree matches the business domain. Use to determine. For this reason, it is possible to classify delivery news that is threatening to the company and those that are not. In addition, in order to determine whether the subject is a specialist or a comprehensive manufacturer, taking into account past news, if the subject has developed various conforming information source trees, a new product in a different business domain will be mistakenly And a customer who has purchased a new product in this different business domain is also less likely to be erroneously determined as a new customer. Furthermore, in the present embodiment, since the subject can be classified, it is possible to extract company information of a necessary category at a desired timing and display it.
本発明の第3の実施例
次に、本発明の第3の実施例について説明する。図40は、本発明の第3の実施例にかかる情報構造化装置31を示す図である。第3の実施例は、顧客企業を動的に決定する例である。本情報構造化装置31は、図40に示すように、第1の実施例における情報構造化装置1に、更に定量化装置32を有する。定量化装置32は、情報源価値推定部500及び企業力推定部600を有する。その他の構成は、第1の実施例と同様であり、その詳細な説明は省略する。情報源価値推定部500は、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が情報源ツリーを構成する要素単語により定義された定義表(単語定量化マップ)と、情報源ツリーとを参照し、当該リーフのスコアを初期スコアとして算出する。企業力推定部600は、その初期スコアに基づき企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する。企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出されるものであるが、その詳細は後述する。次に、情報源価値推定部500及び企業力推定部600について詳述する。
Third Embodiment of the Invention Next, a third embodiment of the present invention will be described. FIG. 40 is a diagram showing an
図41は、本実施例における情報源価値推定部500を示すブロック図である。図41に示すように、情報源価値推定部500は、主体者判定部501と、主体者辞書格納部502と、主体者分類済み情報源格納部503と、情報源定量化部504と、単語定量化マップ格納部505と、情報減初期スコア格納部506と、企業力測定ツリー格納部507とを有する。
FIG. 41 is a block diagram showing the information source
主体者辞書格納部502は主体者辞書を格納する。主体者辞書は、上述の図34に示すように、カテゴリ、{顧客、競合、部品納入}と企業名(名前)との組からなる構造を有する。この主体者辞書の企業名には、競合企業の名前、顧客企業の名前、部品納入企業の名前が格納されている。
The subject person
主体者判定部501は、適合情報源ツリー格納部303を参照し、その主体者ノードと、主体者辞書格納部502の主体者辞書とを比較する。そして、適合情報源ツリーを、主体者で分類し、競合企業に関する競合企業情報源ツリー、顧客企業に関する顧客企業情報源ツリー、又は納入企業に関する納入企業情報源ツリーとして、情報源格納部503に格納する。
The
情報源定量化部504は、主体者別情報源ツリーと単語定量化マップ格納部505に格納された図42に示す構造の単語定量化マップから、後述する企業力測定ツリー格納部507に格納された企業力測定ツリーの最下層を構成するリーフのスコアを初期スコアとして算出する。
The information
先ず、図42に示す単語定量化マップについて説明すると、単語定量化マップは、情報源ツリーの「主体者」、「製品名」、「特徴語」、「アクション」、「アクションの対象」を組み合わせたルールと、それらに対応する初期スコア算出方法が記載されている。 First, the word quantification map shown in FIG. 42 will be described. The word quantification map is a combination of “subject”, “product name”, “feature word”, “action”, and “action target” in the information source tree. Rules and corresponding initial score calculation methods are described.
具体的には、計算を開始するためのトリガーとして働く「単語」列と、情報源ツリーからどのようにスコアを算出するか記載された「スコア算出方法」列、初期スコアの配分先を決定するための「配分企業」列、「配分リーフ」列、及び「配分率」列を有する。 Specifically, the “word” column that acts as a trigger for starting the calculation, the “score calculation method” column that describes how the score is calculated from the information source tree, and the initial score allocation destination are determined. And a “distribution company” column, an “allocation leaf” column, and an “allocation rate” column.
スコア算出方法としては大きく分けて4種類の算出方法を有する。1つめは固定値を与えるもので、ある単語が情報源に含まれていたら固定値で指定した値を初期スコアとして与える方式である。2つめは、配分先のリーフの値を用いて算出するもので、対象リーフが有する値を2倍、3倍するときに適用する方式である。3つ目は情報源ツリーが有する単語を組み合わせで計算するもので、"100億"、"増資"といった額面の値をスコアとして適用する方式である。4つ目は、外部算出部で定義する方式に従って算出するもので、複数の情報源を用いてスコアを算出する場合に適用する方式である。 There are roughly four types of score calculation methods. The first is a method of giving a fixed value. If a word is included in the information source, a value designated by the fixed value is given as an initial score. The second is to calculate using the value of the leaf of the distribution destination, and is a method applied when the value of the target leaf is doubled or tripled. The third method is to calculate the words of the information source tree in combination, and applies the face value such as “10 billion” and “capital increase” as the score. The fourth method is to calculate according to a method defined by an external calculation unit, and is a method applied when calculating a score using a plurality of information sources.
次に、企業力測定ツリーについて説明する。図43乃至図45は、それぞれ顧客企業力測定ツリー、競合企業力測定ツリー、部品納入企業力測定ツリーの構造を示す図である。企業力測定ツリー格納部507には、図43に示す競合企業向けの競合企業力測定ツリー、図44に示す顧客企業向けの顧客企業力測定ツリー、図45に示す部品納入企業向けの部品納入企業力測定ツリーの3種類の企業力測定ツリーが準備されている。図43乃至図45に示すように、企業力測定ツリーは、ノード構造とリーフ構造の2種類のデータ構造を有し、企業名をルートノードとし、各企業の競争力を表現するための企業特性ノードを階層的に有することが可能である。最下層は、情報源から生成した初期スコアを割り当てるためのリーフとなっている。リーフはノードを有することができない。
Next, the corporate strength measurement tree will be described. FIGS. 43 to 45 are diagrams showing the structures of a customer enterprise strength measurement tree, a competitive enterprise strength measurement tree, and a parts delivery enterprise strength measurement tree, respectively. The enterprise strength measurement
図46は、単語定量化マップに含まれる単語・ノード対応表を示す図である。情報源定量化部504は、この単語・ノード対応表におけるワード欄に一致する要素単語が主体者別情報源ツリーに含まれているか判別する。含まれている場合は、当該ワード欄に対応するタイプの企業力測定ツリーの最下層を構成するリーフ(ノード1〜ノード3)に対し、スコア欄に指定されているスコアを初期スコアとして設定する。例えば、主体者別情報源ツリーの主体者(タイプ)が競合企業であって、当該情報源ツリーに"展示"含まれる場合、"納入実績"リーフのスコア(初期スコア)を2とする。また、例えば、主体者別情報源ツリーの主体者(タイプ)が"競合企業又は納入企業"であって、当該情報源ツリーに"開発"含まれる場合、"製品バリエーション"、"開発スピード"、"機能特徴"、又は"部品バリエーション"、"開発スピード"、"部品最高性能順位"の各リーフのスコア(初期スコア)を2倍にし、それぞれ0.4、0.2、0.4を乗算する。このように、情報源価値推定部500により、単語定量化マップを用いて、情報源定量化部504は、情報源ツリー中に存在する行動とそれに付随する特徴語を組み合わせて、情報源の初期スコアを算出することができる。
FIG. 46 is a diagram showing a word / node correspondence table included in the word quantification map. The information
図47は、本実施例における企業力推定部600を示すブロック図である。図47に示すように、企業力推定部600は、企業力計算部601と、情報源最終スコア格納部602を有する。
FIG. 47 is a block diagram showing the corporate
企業力計算部601は、企業力測定ツリーの最下層を構成するリーフに与えられた初期スコアが入力され、単語定量化マップ格納部505に格納された単語定量化マップの単語・ノード割り当て配分率と、企業力測定ツリー格納部507に格納された企業力測定ツリー情報から各ノードのスコアを算出し、企業力(最上位ノード)を算出する。そして、現在の企業力(スコア)から過去の企業力(スコア)を引き算した値を情報源の最終スコアとして生成する。図48は、ノード構造及びリーフ構造を示す図である。図43乃至図45に示す企業力測定ツリーにおいて、各ノードの値は、下位のリーフ値又はノード値から算出され、ノード毎に算出方法を定義することができる。
The enterprise
企業力計算部601は、先ず、情報源ツリーがどの企業タイプに属するかを主体者辞書格納部502に格納された主体者辞書を用いて判定するとともに、単語定量化マップ格納部505に格納された単語定量化マップに記載された単語・ノード割り当て配分率に応じて、情報源定量化部が算出した初期スコアを該当企業タイプの該当ノードに配分する。単語・ノード割り当て配分率は、初期スコアを企業力測定ツリーのどのリーフに配分するか記載したものである。ここで、企業力測定ツリーは、主体者の企業タイプごとに企業特性が異なり、主体者の企業ごとにその特性値が異なるものとなる。このため、情報源から算出した初期スコアが同じでも、適用する主体者が異なれば、最終スコアは異なるという特性を有する。
The enterprise
主体者が顧客企業であれば、図44に示すように顧客企業向けに準備した企業力測定ツリーによって情報源を定量化する。顧客企業力測定ツリーは、「投資力」「サービス占有力」の子ノードから構成される。「投資力」ノードは、「投資積極性」「新規投資力」の子ノードから構成される。「投資積極性」は「流動資産」「固定資産」のリーフを有し、「新規投資力」は「純資産」「負債」のリーフを有する。「サービス占有力」ノードは、「地域性」「需要性」の子ノードを有する。さらに「地域性」ノードは、「サービス密度」「サービスエリア」リーフを有する。また「需要性」ノードは、「周期」「製品マッチング」リーフを有する。 If the subject is a customer company, as shown in FIG. 44, the information source is quantified by an enterprise strength measurement tree prepared for the customer company. The customer enterprise strength measurement tree is composed of child nodes of “investment power” and “service occupation power”. The “investment power” node includes child nodes of “investment aggressiveness” and “new investment power”. “Investment aggressiveness” has leaves of “current assets” and “fixed assets”, and “new investment power” has leaves of “net assets” and “liabilities”. The “service occupancy” node has child nodes of “regional” and “demand”. Furthermore, the “regional” node has “service density” and “service area” leaves. The “demand” node has a “cycle” and a “product matching” leaf.
それぞれのノード、リーフは初期値が1となっており、企業力計算部601は、図46で示す単語・ノード対応表を用いて各ノードのスコアを計算する。各企業タイプの各ノードやリーフは、情報源に含まれるワードを受け取り、ルールに従ってそのスコアを更新する。例えば、固定資産リーフや流動資産リーフの「スコア算出方法」列には、「情報源に記載のスコアをそのまま利用する」というルールが割り当てられている。情報源ツリーに「1000億円投資」という情報が掲載されていれば、固定資産リーフは額面を「1000億」分増加させ、流動資産リーフは「1000億」の額面分減少させる。上述したように、最下位のリーフは、情報源定量化部504によりその初期スコアが算出される。中間、及び最上位のノードは、下記の計算式により、企業力計算部601により、そのスコアを算出する。
中間ノード:レベル2
「投資積極性」ノードのスコア=「固定資産」リーフのスコア/「流動資産」リーフのスコア
「新規投資力」ノードのスコア=「純資産」リーフのスコア/「固定負債」リーフのスコア
「地域性」ノードのスコア=(α01×「サービス密度」リーフのスコア)+(α02×「サービスエリア」リーフのスコア)
「需要性」ノードのスコア=(β01×「周期」リーフのスコア)+(β02×「製品マッチング」リーフのスコア)
中間ノード:レベル1
「投資力」ノードのスコア=α11×「投資積極性」ノードのスコア×α12×「新規投資力」ノードのスコア
「サービス占有力」ノードのスコア=β11×「地域性」ノードのスコア×β12×「需要性」ノードのスコア
最上位ノード
「顧客企業のスコア」=α21×「投資力」ノードのスコア×β21×「サービス占有力」
The initial value of each node and leaf is 1, and the enterprise
Intermediate node:
“Investment aggressiveness” node score = “Fixed asset” leaf score / “Current asset” leaf score “New investment power” node score = “Net asset” leaf score / “Fixed debt” leaf score “Regional” Node score = (α01 × “service density” leaf score) + (α02 × “service area” leaf score)
“Demand” node score = (β01 × “period” leaf score) + (β02 × “product matching” leaf score)
Intermediate node:
“Investment power” node score = α11 × “Investment aggressiveness” node score × α12 × “New investment power” node score “Service occupancy” node score = β11 × “Regional” node score × β12 × “ “Demand” node score Top node “Customer company score” = α21 × “Investment power” node score × β21 × “Service occupancy”
ここで、α01からβ21までの重みは自由に設定できるようになっており、顧客企業型に属する企業力のうち重要視する特性を選択させることができる。各ノードのスコアは、次の計算式で求めることができる。
リーフのスコア(t+1)=情報源(t+1)の初期スコア
ノードのスコア(t+1)=ノードのスコア(t)+h(node_child1,node_child2,...,node_childN)
ここで、h()は、各ノードに自由に設定できる関数であり、具体的には、上述の「投資積極性」ノードのスコア=「固定資産」リーフのスコア/「流動資産」リーフのスコアのような数式である。関数h()の値は、マイナスになることもあり、結果的に各ノードの値を減少させることも可能となっている。
Here, the weights from α01 to β21 can be freely set, and it is possible to select important characteristics among the corporate strengths belonging to the customer enterprise type. The score of each node can be obtained by the following calculation formula.
Leaf score (t + 1) = initial score of information source (t + 1) node score (t + 1) = node score (t) + h (node_child1, node_child2, ..., node_childN)
Here, h () is a function that can be freely set for each node. Specifically, the score of the above-mentioned “investment aggressiveness” node = the score of the “fixed asset” leaf / the score of the “current asset” leaf It is a mathematical formula like this. The value of the function h () may be negative, and as a result, the value of each node can be decreased.
そして、企業力計算部601は、上記のノードのスコアを顧客企業力測定ツリーに保存する。企業力計算部601は、主体者毎に異なる企業力測定ツリーを生成する。情報源が各企業に対応する企業力測定ツリーのノードのスコアを増加させるため、ニュースリリースの多い企業は、少ない企業に比べて企業力が蓄積される。情報源の最終スコアは、最上位ノードで得られるスコアから、過去の最上位ノードの値を減算したスコアに等しく、企業力計算部601は、最終スコアを情報源最終スコア格納部602に保存する。
Then, the enterprise
同様に、主体者が競合企業であれば、図44に示すように競合企業向けに準備された企業力測定ツリーを基にして、情報源を定量化する。企業力測定ツリーは、「顧客利便性」「信用力」「販売力」「開発力」の子ノードから構成される。「顧客利便性」ノードは、「サポート拠点」の子リーフを有する。「信用力」ノードは、「格付け」、「納入実績」の子リーフを有する。「販売力」ノードは、「売り上げ実績」の子ノードを有する。「開発力」ノードは、「製品バリエーション」「開発スピード」「機能特徴」の子リーフを有する。それぞれのノード及びリーフは初期スコアが1となっており、情報源の内容に応じて初期スコアを増加させる。上述したように、最下位のリーフは、情報源定量化部504が情報源の内容からスコアを直接的に計算する。例えば、情報源に「3つの製品を販売開始」という情報が掲載されていれば、情報源定量化部504は、図46を参照して製品バリエーションのリーフスコアを3増加させる。中間、及び最上位のノードは、下記の計算式により企業力計算部601が算出する。
中間ノード
「顧客利便性」ノードのスコア=(α11×「1/アクセス時間」リーフのスコア)+(β11×「サービス拠点数」リーフのスコア)+(γ11×「サポート要員数」リーフのスコア)
「信用力」ノードのスコア=(α21×「納入実績」リーフのスコア)+(β22×「格付け」リーフのスコア)
「開発力」ノードのスコア=(α31×「製品バリエーション」リーフのスコア)+(β32×「開発スピード」リーフのスコア)+(γ33×「機能特徴」リーフのスコア)
最上位ノード
「競合企業のスコア」=(α41×「顧客利便性」ノードのスコア)+(β42×「信用力」ノードのスコア)+(γ42×「販売力」ノードのスコア)
Similarly, if the subject is a competitor, the information source is quantified based on a corporate strength measurement tree prepared for the competitor as shown in FIG. The corporate strength measurement tree is composed of child nodes of “customer convenience”, “credit strength”, “sales power”, and “development power”. The “customer convenience” node has a child leaf of “support base”. The “credit” node has child leaves of “rating” and “delivery record”. The “sales power” node has child nodes of “sales results”. The “development power” node has child leaves of “product variation”, “development speed”, and “functional characteristics”. Each node and leaf has an initial score of 1, and the initial score is increased according to the contents of the information source. As described above, for the lowest leaf, the information
Intermediate node “customer convenience” node score = (α11 × “1 / access time” leaf score) + (β11 × “number of service locations” leaf score) + (γ11 × “number of support personnel” leaf score)
“Credit” node score = (α21 × “delivery result” leaf score) + (β22 × “rating” leaf score)
Score of “development ability” node = (α31 × “product variation” leaf score) + (β32 × “development speed” leaf score) + (γ33 × “functional feature” leaf score)
Topmost node “competitor score” = (α41 × “customer convenience” node score) + (β42 × “credit” node score) + (γ42 × “sales power” node score)
同様に、主体者が部品の納入業者であれば、図45に示すように部品納入企業向けに準備した企業力測定ツリーを基にして、情報源を定量化する。企業力測定ツリーは、「顧客利便性」「信用力」「開発力」の子ノードから構成される。「顧客利便性」ノードは、「納入可能数」「納期」リーフを有する。「信用力」ノードは、「納入実績」「格付け」リーフを有する。「開発力」ノードは、「部品バリエーション」「開発スピード」「部品最高性能順位」「差異化」リーフを有する。それぞれのノード・リーフは初期スコアが1となっており、情報源の内容に応じてスコアを増加させる。上述したように、情報源定量化部504は、例えば、情報源に「世界最速の部品を開発」という情報が入力されれば、部品最高性能順位リーフの初期スコアを2増加させる。中間、及び最上位のノードは、下記の計算式により企業力計算部601が算出する。
Similarly, if the subject is a supplier of parts, the information sources are quantified based on the enterprise strength measurement tree prepared for the parts delivery company as shown in FIG. The enterprise strength measurement tree includes child nodes of “customer convenience”, “credit strength”, and “development ability”. The “customer convenience” node has a “number of deliverables” and a “delivery date” leaf. The “creditworthiness” node has a “delivery record” and “rating” leaf. The “development power” node has “part variation”, “development speed”, “part highest performance ranking”, and “differentiation” leaf. Each node and leaf has an initial score of 1, and the score is increased according to the contents of the information source. As described above, the information
中間ノード
「顧客利便性」ノードのスコア=(α11×「納入可能数」リーフの値)+(β11×「納期」リーフのスコア)
「信用力」ノードのスコア=(α21×「納入実績」リーフのスコア)+(β22×「格付け」リーフのスコア)
「開発力」ノードのスコア=(α31×「部品バリエーション」リーフのスコア)+(β32×「開発スピード」リーフのスコア)+(γ33×「部品最高性能順位」リーフのスコア)
Intermediate node “customer convenience” node score = (α11 × “delivery available” leaf value) + (β11 × “delivery date” leaf score)
“Credit” node score = (α21 × “delivery result” leaf score) + (β22 × “rating” leaf score)
Score of “development ability” node = (α31 × “part variation” leaf score) + (β32 × “development speed” leaf score) + (γ33 × “part highest performance ranking” leaf score)
最上位ノード
「部品納入企業のスコア」=(α41×「顧客利便性」ノードのスコア)+(β42×「信用力」ノードのスコア)+(γ43×「開発力」ノードのスコア)
なお、α、β、γの値は、事業ドメインに応じて自由が値に設定することができる。また、企業力計測ツリーを構成するリーフの計算式は自由に定義しなおしてよい。また、ノードの計算式は、リーフ間の掛け算、足し算、引き算、他の関数との組み合わせで実装してもよい。
Top node “parts supplier score” = (α41 × “customer convenience” node score) + (β42 × “credit” node score) + (γ43 × “development” node score)
Note that the values of α, β, and γ can be freely set according to the business domain. In addition, the calculation formulas of the leaves constituting the enterprise power measurement tree may be freely redefined. Further, the node calculation formula may be implemented by combining multiplication, addition, subtraction, and other functions between leaves.
企業力計算部601により、主体者辞書を用いて、ツリーを顧客企業/競合企業/納入企業に分類し、企業タイプごとの評価テンプレート(企業力測定ツリー)を用いて、情報源の初期スコアを企業力の特質に配分し、過去の企業力を加味して情報源の最終スコアを定量化することができる。また、企業タイプごとの評価テンプレートは、各ノードやリーフにルールを持たせることができる構造になっており、情報源の値に対してルールを適用することによって、各ノードやリーフの値を計算することができる。さらに、この企業タイプごとの評価テンプレートは、ノード間を結ぶリンクに、「割合」により重み付けを与えることができる構造になっており、分析者が重要視する企業特性と、重要視しない企業特性を企業タイプごとに設定することができる。
The enterprise
図49のフローチャートを参照して、本発明の第3の実施例の動作について詳細に説明する。前提として、第2の実施例の結果増殖した事業ドメイン辞書(図39)と、技術辞書(図36)の値を利用する。また、顧客企業の純資産が50億、負債が50億、固定資産が30億、流動資産が70億であるとする。 The operation of the third embodiment of the present invention will be described in detail with reference to the flowchart of FIG. As a premise, the values of the business domain dictionary (FIG. 39) and the technical dictionary (FIG. 36) which are propagated as a result of the second embodiment are used. Also assume that the client company has 5 billion net assets, 5 billion liabilities, 3 billion fixed assets, and 7 billion current assets.
情報源のニュースとして、
"ADDI、メトロ事業に向け第三者割当による100億円の増資"
という文字列が情報構造化装置31に入力される。情報構造化装置31は情報構造化装置1と同様にステップS100からステップS400までを実行し、"メトロ"というキーワードによって、情報源が事業ドメインに合致していると判定する。こうして図50に示す情報源ツリーを作成し、当該適合情報源ツリー格納部303に格納する(ステップS400)。
As source news,
"ADDI increases capital by 10 billion yen through third-party allotment for metro business"
Is input to the
次に、主体者判定部501は、図34に示す主体者辞書を参照し、主体者"ADDI"が顧客企業であると判定し、情報源格納部503に顧客企業情報源ツリーとして格納する。そして、情報源定量化部504は、この顧客企業情報源ツリーを読み出し、図45に示す顧客企業力測定ツリーと図46に示す単語定量化マップを元に、当該情報源ツリーの各要素単語の初期スコアを算出する(ステップS700)。
Next, the
ここで、情報源入力前においては、企業力計算部601は、純資産が50、負債が50、固定資産が30、流動資産が70という初期スコアに基づき、その上位層のスコアを算出する。例えば、"投資積極性"のスコア=固定資産/流動資産のスコアで計算されるため、30/70≒0.43となり、"新規投資力"のスコア=純資産/負債で計算されるため、50/50=1となる。そして、"投資力"のスコア=α11×("投資積極性"ノードのスコア)×α12×("新規投資力"ノードのスコア)で計算されるため、α11=α12=1とすると、1×0.43×1×1=0.43となる。
Here, before the information source is input, the enterprise
サービス密度、サービスエリア、周期、製品マッチングの初期値を1、α01〜β21=1とすると、
"地域性"ノードのスコア=(α01×"サービス密度"リーフのスコア)+(α02×"サービスエリア"リーフのスコア)=2、
"需要性"ノードのスコア=(β01×"周期"リーフのスコア)+(β02×"製品マッチング"リーフのスコア)=2
"サービス占有力"ノードのスコア=β11×"地域性"ノードのスコア×β12×"需要性"ノードのスコア=4
となり、"顧客企業のスコア"=α21×"投資力"ノードのスコア×β21×"サービス占有力"=4.93と求まる。
If the initial value of service density, service area, cycle, and product matching is 1, α01 to β21 = 1,
“Regional” node score = (α01 × “service density” leaf score) + (α02 × “service area” leaf score) = 2
“Demand” node score = (β01 × “period” leaf score) + (β02 × “product matching” leaf score) = 2
“Service Occupancy” node score = β11 × “Regional” node score × β12 × “Demand” node score = 4
Thus, “customer company score” = α21 × “investment power” node score × β21 × “service occupancy” = 4.93.
そして、上記の情報源が到着すると、情報源定量化部504は、初期スコアを更新する。すなわち、図50に示す情報源ツリーには、"増資"という単語が含まれ、図46の単語・ノード対応表に同じく"増資"というワードが含まれることから、ノード"純資産"の初期スコアを更新する。この場合、"純資産"リーフと同じく新規投資力ノードのリーフである"負債"リーフの割合は0であるため、スコア配分しない。すなわち、情報源ツリーに"100億円"という単語が含まれるため、"%s円"("%s円"は、"円"の前の数字をノードのスコアとすることを示す。)に対応する"100億"が、"純資産"の初期スコアとなる。
When the information source arrives, the information
そして、企業力計算部601は、更新された初期スコアに基づき各ノードのスコアを算出する(ステップS800)。"新規投資力"は、情報源が到着後は150/50=3となる。
The enterprise
ADDIの増資ニュースが流れるたびに、"投資積極性"、"新規投資力"ノードの値が変化する。投資力は投資積極性と新規投資力の掛け算で求められ、係数α11及びα12の値をそれぞれ1とすれば、1.9×3.0=5.7が投資力ノードの値となる。もともと投資力ノードの値は0.42×1.0=0.42であったことから、増分の5.7−0.42=5.28が変化分のスコアであることがわかる。ここで、重みα11とα12は事業ドメインに応じて自由な値としてよい。 Each time ADDI's capital increase news flows, the values of the “investment aggressiveness” and “new investment power” nodes change. The investment power is obtained by multiplying the investment aggressiveness and the new investment power. If the values of the coefficients α11 and α12 are 1, respectively, 1.9 × 3.0 = 5.7 is the value of the investment power node. Since the value of the investment power node was originally 0.42 × 1.0 = 0.42, it can be seen that the increment of 5.7−0.42 = 5.28 is the change score. Here, the weights α11 and α12 may be free values depending on the business domain.
サービス占有力ノードのスコアは、α、βをいずれも1とすると、地域性のスコア×需要性のスコア=4、上記情報源到着前後での変化分は0である。企業力スコア=投資力×サービス占有力であり、5.7×4=22.8が企業力となる。そして、情報源到着前後の企業力の変化分は5.7×4−0.42×4=21.12と求められ、この値が当該情報源のスコアとなる。 As for the score of the service occupancy node, if both α and β are 1, the regional score × demand score = 4, and the change before and after arrival of the information source is 0. The corporate strength score = investment power × service occupation power, and 5.7 × 4 = 22.8 is the corporate strength. The change in the corporate power before and after arrival of the information source is obtained as 5.7 × 4−0.42 × 4 = 21.12, and this value becomes the score of the information source.
本第3の実施例においては、企業力計算部601は、競合、顧客、納入企業ごとに定義した企業力測定ツリーを参照し、過去の情報源の価値を含んだ企業力を元に、今回の情報源によって生成される企業力を算出する。そして、情報源が与えられる前と後の企業力の差分を最終的な情報源のスコアとみなす。これにより、主体者辞書を用いて、ツリーを顧客企業/競合企業/納入企業に分類し、企業タイプごとの評価テンプレートを用いて、情報源の初期スコアを企業力の特質に配分し、過去の企業力を加味して情報源の最終スコアを定量化することができる。なお、本実施例においては、グループ生成部400からのデータを使用して情報源価値を推定し、企業力を推定するものとして説明したが、情報源再構築部200のデータを使用して情報源価値推定及び企業力推定を行なうことも可能である。
In the third embodiment, the enterprise
次に、本実施例の他の動作例について説明する。本例は、生産財メーカが技術的優位性を有することを示す例である。前提として、第2の実施例の結果増殖した事業ドメイン辞書(図39)と、技術辞書(図36)の値を利用する。 Next, another operation example of the present embodiment will be described. This example is an example showing that the producer of product goods has a technical advantage. As a premise, the values of the business domain dictionary (FIG. 39) and the technical dictionary (FIG. 36) which are propagated as a result of the second embodiment are used.
情報源のニュースとして、
"オプト販売は、μレーザを用いたロスレス光伝送装置「FX5000」を開発"
という文字列が情報構造化装置41に入力される。情報構造化装置41はステップS100からステップS400まで実行し、図51に示す情報源ツリーを得る。そして、図35に示す事業ドメイン辞書に"オプト販売"という主体者が主体者として登録されていることから、この情報源が光事業ドメインであると判定し、適合情報源ツリーに分類する(ステップS400)。
As source news,
"Opto Sales develops" FX5000 "lossless optical transmission device using μ laser"
Is input to the
次に、S700において、主体者判定部501は、図34に示す主体者辞書を参照し、主体者"オプト販売"が競合企業であると判定する。そして、情報源格納部503に競合企業情報源ツリーとして格納する。次に、情報源定量化部504は、情報源格納部503の競合企業情報源ツリーを読み出し、図44に示す競合企業力測定ツリーと図46に示す単語・ノード対応表を元に定量化を行う。すなわち、先ず、情報定量化部504により、各企業力測定ツリーの最下層を構成するリーフの初期スコアを算出する。
Next, in S700, the
ここで、全てのリーフは、初期スコアとして1が与えられている。競合情報源ツリーには、"開発"というキーワードがあり、図46の単語・ノード対応表から、各リーフスコアが2倍にされることが記載されている。開発力ノードに繋がる各リーフに、当該開発力ノードのスコアを算出する際の割合が定義されている。この割合の値の設定により、ノード間を結ぶリンクに重み付けを与えることができる構造になっており、分析者が重要視する企業特性と、重要視しない企業特性を企業タイプごとに設定できるようになっている。 Here, all the leaves are given 1 as an initial score. There is a keyword “development” in the competitive information source tree, and it is described from the word / node correspondence table in FIG. 46 that each leaf score is doubled. For each leaf connected to the development capability node, a ratio for calculating the score of the development capability node is defined. By setting the ratio value, the link between nodes can be weighted, and the company characteristics that the analyst considers important and the company characteristics that are not considered important can be set for each company type. It has become.
本例においては、開発というワードに対し、拡張関数が設定され、製品バリエーションリーフに0.4、開発スピードリーフに0.2、機能特徴に0.4の割合でスコアを分配するように記載がされている。
拡張関数:2×g(f(製品バリエーション),f(開発スピード),f(特徴))
ここで、
g(param1, param2, param3){
In this example, an extension function is set for the word “development”, and it is described that the score is distributed at a ratio of 0.4 for the product variation leaf, 0.2 for the development speed leaf, and 0.4 for the functional feature. Has been.
Extension function: 2 x g (f (product variation), f (development speed), f (feature))
here,
g (param1, param2, param3) {
if(param1 node==製品バリエーション){
return param1;
}
f(製品バリエーション)=過去のリリース製品の数+1
f(開発スピード)=f(製品バリエーション)/リリース期間の累計
f(特徴)=情報源ツリーの特徴語数
を示す。
if (param1 node == product variation) {
return param1;
}
f (product variation) = number of past released products + 1
f (development speed) = f (product variation) / cumulative release period f (feature) = number of feature words in the information source tree.
オプト製品は、過去に"FX4200"があるため、過去のリリース製品の数は1になる。よって、
f(製品バリエーション)=過去のリリース製品の数+1=2と求まる。
関数gは第1引数に、f(製品バリエーション)の値をそのまま採用するため、
2×g(f(製品バリエーション),f(開発スピード),f(特徴))
=2×f(製品バリエーション)
=2×2
=4
となる。そして単語定量化マップで製品バリエーションリーフへの配分割合が0.4であるため、
製品バリエーションリーフの値=4×0.4=1.6
となる。
Since the opt product has “FX4200” in the past, the number of past released products is one. Therefore,
f (product variation) = the number of past released products + 1 = 2.
Since function g adopts the value of f (product variation) as the first argument as it is,
2 x g (f (product variation), f (development speed), f (feature))
= 2 × f (product variation)
= 2 × 2
= 4
It becomes. And since the distribution ratio to the product variation leaf is 0.4 in the word quantification map,
Product variation leaf value = 4 x 0.4 = 1.6
It becomes.
すなわち、開発というキーワードに対しては、拡張関数の結果を2倍した値を、定量化マップに記載の配分先、配分率で分配し、それぞれのリーフに与える初期スコアを決定する。拡張関数は、3つのパラメータを引数にもち、各引数のリーフの型で返却される値が異なるよう機能する。製品バリエーションリーフの場合には、過去のリリース製品の数に1を足したものを、拡張関数の返却値とする。開発スピードリーフの場合には、各製品のリリース間隔の合計で製品数を割った値を、拡張関数の返却値とする。特徴リーフの場合には、情報源の特徴語数を、拡張関数の返却値とする。 That is, for the keyword “development”, a value obtained by doubling the result of the expansion function is distributed at the distribution destination and distribution rate described in the quantification map, and an initial score to be given to each leaf is determined. The extension function has three parameters as arguments and functions so that the value returned by the leaf type of each argument is different. In the case of the product variation leaf, the return value of the extension function is obtained by adding 1 to the number of past released products. In the case of the development speed leaf, the value obtained by dividing the number of products by the total release interval of each product is the return value of the extension function. In the case of a feature leaf, the number of feature words of the information source is used as the return value of the extension function.
また、オプト販売の前回の商品"FX4200"の情報源の図3に示す時刻情報から遡ると2年前にリリースされていることがわかり、開発スピード下記の計算式で求めことができる。
開発スピードリーフの値=2×オプト販売の全製品/リリース間隔×0.2=2×2/3 ×0.2=0.26
Further, it can be seen that the product was released two years ago from the time information shown in FIG. 3 of the information source of the previous product “FX4200” of Opt Sales, and the development speed can be calculated by the following calculation formula.
Value of development speed leaf = 2 × All products sold by Opt / Release interval × 0.2 = 2 × 2/3 × 0.2 = 0.26
さらに、"FX5000"は、特徴語として、"μレーザ"、"ロスレス光伝送装置"という2つの用語を含むことから、下記の計算式で求めることができる。
機能特徴リーフのスコア=2×特徴語数×0.4=2×2×0.4=1.6
Further, “FX5000” includes two terms “μ laser” and “lossless optical transmission device” as characteristic words, and can be obtained by the following calculation formula.
Score of functional feature leaf = 2 × number of feature words × 0.4 = 2 × 2 × 0.4 = 1.6
次に、企業力計算部601がこれらの初期スコアを使用して各ノードのスコアを算出する(ステップS800)。今回の情報源により、"オプト製品"が2種類になったとすると、リーフが有するスコアと情報源のスコアを掛け合わせ
開発力ノードのスコア=製品バリエーションリーフのスコア+開発スピードリーフのスコア+機能特徴リーフのスコア
=1×1.6+1×0.26+1×1.6
=3.46
と求められる。開発力ノードのスコアが初期値1だとした場合には、今回のスコアとの差分3.6−1.0=2.6が開発力ノードにおける情報源到着前後の増加分となる。顧客利便性、信用力、販売力の初期値を1とすると、
最上位ノード(企業力)のスコア=顧客利便性のスコア+信用力のスコア+販売力のスコア+開発力のスコア
=1+1+1+3.6
=6.6
となる。また、情報源到着前後での企業力の差は、6.6−4.6=2.6であり、この2.6が情報源の最終スコアとなる。
Next, the corporate
= 3.46
Is required. If the score of the development capability node is an
Top node (corporate power) score = customer convenience score + credit score + sales power score + development score = 1 + 1 + 1 + 3.6
= 6.6
It becomes. Also, the difference in corporate power before and after arrival of the information source is 6.6-4.6 = 2.6, and this 2.6 is the final score of the information source.
本実施例においては、情報源に含まれるキーワードと、単語・ノード対応表と、競合企業力測定ツリーの構造と、リーフ値計算式から、各企業の企業力を定量化することができる。さらに、キーワードが有するインパクト(企業力測定ツリーの最上位ノードの差分)を過去の企業活動に照らし合わせて計算するため、情報源のスコアを企業ごとに評価することが可能となる。 In the present embodiment, the enterprise power of each company can be quantified from the keywords included in the information source, the word / node correspondence table, the structure of the competitive enterprise strength measurement tree, and the leaf value calculation formula. Furthermore, since the impact (difference of the highest node of the corporate strength measurement tree) possessed by the keyword is calculated against the past corporate activity, the score of the information source can be evaluated for each enterprise.
本発明の第4の実施例
以下に説明する第4の実施例乃至第8の実施例においては、それぞれ波及力計算部700、需要周期推定部800、潜在購買力推定部900、販売力推定部1000、競争力増強部品推定部1100を設ける。各ブロックは、それぞれ特定の企業力測定ツリーのリーフのスコアを更新する機能を備える。すなわち、波及力計算部700は、一の情報源が競合企業の企業力に与える波及力を算出すると共に、競合企業力測定ツリーの機能特徴リーフのスコアを更新する。需要周期推定部800は、製品の需要周期を推定すると共に、顧客企業力測定ツリーの周期リーフのスコアを更新する。潜在購買力推定部900は、顧客企業の潜在購買力を推定し、販売可能性が高い製品の機能及び価格を推定すると共に、顧客企業力測定ツリーの製品マッチングリーフのスコアを更新する。販売力推定部1000は、企業の販売力を推定すると共に、競合企業力測定ツリーの売り上げ実績リーフのスコアを更新する。競争力増強部品推定部1100は、競争力に影響のある部品を推定すると共に、部品納入企業力測定ツリーの差異化リーフのスコアを更新する。なお、以下の第4乃至第8の実施例においては、グループ生成部400が出力する適合情報源ツリーを使用して各処理を実行するものとして説明するが、情報源再構築部200が抽出した要素単語を使用して各処理を実行することも可能である。先ず、本発明の第4の実施例について説明する。
Fourth Embodiment of the Invention In the fourth to eighth embodiments described below, a ripple
図52は、本実施例にかかる情報構造化装置41を示す図である。本実施例は、過去の情報源を辿ることで、現在の情報源の影響範囲を直接記載されていない企業にまで及ばせるものである。本情報構造化装置41は、図52に示すように、第3の実施例における情報構造化装置31に、定量化装置32として波及力計算部700を更に設ける構成を有する。その他の構成は、第3の実施例と同様であり、その詳細な説明は省略する。本第4の実施例は、部品メーカが技術的優位性を有することを示す例である。
FIG. 52 is a diagram illustrating the
図53は、本実施例における波及力計算部700を示すブロック図である。図53に示すように、波及力計算部700は、納入業者の部品納入情報源選別部701、納入先企業抽出部702、特徴語列挙部703、近距離用語抽出部704、及び波及力計算部705を有する。この波及力計算部700は、情報源の影響範囲及び影響力を技術辞書を用いて推定する。情報源に含まれる特徴語が技術辞書に登録されていた場合、その特徴語と近い距離の別の特徴語を列挙する。情報源に含まれるターゲット企業が、列挙された特徴語に関連する商品を過去に開発していた場合に、技術的な距離から波及スコアを計算する。各ブロックについて詳述する。
FIG. 53 is a block diagram illustrating the ripple
部品納入情報源選別部701は、情報源ツリーの中から納入業者の部品納入情報源ツリーのみ抽出する。納入先企業抽出部702は、部品の納入先企業、すなわち部品を購入した競合企業を抽出し、その競合企業がリリースした製品のニュースを抽出する。特徴語列挙部703は、競合企業の製品リリース情報に含まれる特徴語を全て列挙する。近距離用語抽出部704は、部品の特徴語を含む技術用語が技術辞書にあるか調査し、ある閾値以下のものを全て列挙する。波及力計算部705は、特徴語列挙部703で列挙した単語集合と、近距離用語抽出部704で列挙した単語集合を比較し、一致するものがあれば納入部品が製品に採用された可能性が高いと判定する。波及力計算部705は、近距離用語抽出部704にて抽出した技術用語の距離の逆数(波及係数)と、部品納入企業力測定ツリーから求まる情報源価値を掛け合わせた波及力を、競合企業力測定ツリーを構成する機能特徴リーフの初期スコアに加算する。
The parts delivery information
このことにより、過去の情報源ツリーをたどることで、現在の情報源の影響範囲が直接記載されていない企業にまでは波及スコアを及ばせることができる。例えば、部品納入業者のニュースは、部品納入企業ツリー(図45)という閉じた系により、初期スコアを算出していたのに対し、競合企業ツリー(図44)に波及スコアを与える仕組みを導入することにより、すなわち、波及スコアを競合企業ツリーの機能特徴リーフに割り当てることにより、部品納入業者のニュースが競合企業ツリーのリーフ値に影響を及ぼすことができる。これらにより、情報源を事業ドメインに合致したものに分類し、合致した情報源のスコアのみを単語スコアと企業力スコアから算出することで、露出度の高い企業や商品を、新たな取引先として選別することができる。 As a result, by following the past information source tree, it is possible to reach a ripple score to companies that do not directly describe the influence range of the current information source. For example, in the case of parts supplier news, an initial score is calculated by a closed system called a parts supplier company tree (FIG. 45), whereas a mechanism for giving a ripple score to a competitor company tree (FIG. 44) is introduced. In other words, by assigning the ripple score to the functional feature leaf of the competitor tree, the parts supplier news can affect the leaf value of the competitor tree. By classifying information sources into those that match the business domain, and calculating only the score of the matched information source from the word score and corporate strength score, companies and products with high exposure can be used as new business partners. Can be sorted.
図54のフローチャートを参照して、本発明の第4の実施例の動作について詳細に説明する。前提として、第2の実施例の結果増殖した事業ドメイン辞書(図39)と、技術辞書(図36)の値を利用する。 The operation of the fourth embodiment of the present invention will be described in detail with reference to the flowchart of FIG. As a premise, the values of the business domain dictionary (FIG. 39) and the technical dictionary (FIG. 36) which are propagated as a result of the second embodiment are used.
情報源のニュースとして、
"新川電工は、ラマン方式で世界最高レベルの増幅モジュール「A200R」を開発"
という文字列が情報構造化装置51に入力されるとする。情報構造化装置51はステップS100からステップS600まで実行し、技術辞書に"ラマン方式"というキーワードがあることから、この情報源が光事業ドメイン(適合情報源ツリー)であると判定する。主体者判定部501は、主体者が競合企業か納入企業か又は顧客企業かを判別するため、図56に示す主体者辞書を参照する。これにより、新川電工が納入企業であると判定し、情報源格納部503に、納入企業情報源ツリーとして格納する。
As source news,
"Shinkawa Electric develops the world's highest level amplification module" A200R "by Raman method"
Is input to the
情報源定量化部504は、情報源格納部503の納入企業情報源ツリーを読み出し(ステップS421)、初期スコアを算出する(ステップS700)。図45に示す部品納入企業力測定ツリーと図46に示す単語・ノード対応表を元に定量化を行う。情報源ツリーには、「開発」というキーワードがあり、図45の単語・ノード対応表から、スコアが2倍にされることが記載されている。また、製品バリエーションリーフに0.4、開発スピードリーフに0.2、部品最高性能順位リーフに0.4の割合でスコアを分配するように記載がされている。全てのリーフは初期値として1が与えられている。事業ドメイン辞書を参照すると、過去にA200Rという製品はないことが分かるため、新製品であることが分かり、部品バリエーションリーフは下記の計算式で求めることができる。
部品バリエーションリーフの値=2×過去の部品バリエーションリーフの値×0.4=2×1×0.4=0.8
開発スピードリーフの値=2×前回の製品リリース次期からの経過時間(月)/12×0.2=2×1×0.2=0.2
部品最高性能順位リーフの値=2×{e^{−(order−1)}+1}×0.4=2×2×0.4=1.6
The information
Component variation leaf value = 2 × Past component variation leaf value × 0.4 = 2 × 1 × 0.4 = 0.8
Development speed leaf value = 2 x Elapsed time from the previous product release (month) / 12 x 0.2 = 2 x 1 x 0.2 = 0.2
Value of component highest performance ranking leaf = 2 × {e ^ {− (order−1)} + 1} × 0.4 = 2 × 2 × 0.4 = 1.6
次に、企業力計算部601が最終スコアを算出する(ステップS800)。ここで、企業力計算部601は、情報源ツリーの主体者を判断し、主体者が顧客企業又は納入企業である場合にのみ最終スコアを算出する。主体者が競合企業である場合は、後述の波及力計算を行なってから最終スコアを算出する。本例においては、納入企業の情報源であるため、その最終スコアを算出する。すなわち、先ず、納入企業力測定ツリーにおける開発力ノードスコアは次のような計算式で求めることができる。
開発力=0.8+0.2+1.6=2.6
顧客利便性や信用力が初期値のまま1であり、中間ノードの係数α、β、γも値が1であったとすると、部品納入企業の企業力値は、
部品納入企業の値=顧客利便性+信用力+開発力=1+1+2.6=4.6
となる。情報源の入力前では、部品納入企業の値は合計3であったため、増加分4.6−3.0=1.6が情報源のスコア(価値)として求まる。
Next, the corporate
Development capability = 0.8 + 0.2 + 1.6 = 2.6
Assuming that the customer convenience and creditworthiness are 1 at the initial value, and the coefficients α, β, and γ of the intermediate nodes are also 1, the company power value of the parts delivery company is
Value of parts supplier = customer convenience + creditworthiness + development ability = 1 + 1 + 2.6 = 4.6
It becomes. Before the input of the information source, the value of the parts delivery company was 3 in total, so an increment of 4.6-3.0 = 1.6 is obtained as the score (value) of the information source.
さらに情報源のニュースとして、
"新川電工、光増幅モジュール「A200R」をオプト販売に納入"
という文字列が情報構造化装置51に入力された場合には、情報構造化装置51はステップS100からステップS400まで実行し、図56に示す情報源ツリーを得る。そして、技術辞書に"光増幅"というキーワードがあることから、この情報源が光事業ドメイン(適合情報源ツリー)であると判定する(ステップS500、S600)。主体者判定部501は、主体者が競合企業か納入企業かを判別するため、図55に示す主体者辞書を参照する。これにより、新川電工が納入企業であると判定し、情報源格納部503に、納入企業情報源ツリーとして格納する。
As news sources,
"Shinkawa Electric Co., Ltd. Delivered Optical Amplifier Module" A200R "to Opt Sales"
Is input to the
そして、同様に、情報源定量化部504により初期スコアを算出し、企業力計算部601は主体者が競合企業以外の場合は、初期スコアに基づき最終スコアを算出する(ステップS700、800)。すなわち、主体者判定部501は、図34に示す主体者辞書を参照し、主体者"新川電工"が納入企業であると判定し、情報源格納部503に納入企業情報源ツリーとして格納する。そして、情報源定量化部504は、この納入企業情報源ツリーを読み出し、図45に示す納入企業力測定ツリーと図46に示す単語定量化マップを元に、当該情報源ツリーの各要素単語の初期スコアを算出する(ステップS700)。そして、企業力計算部601は、更新された初期スコアに基づき各ノードのスコアを算出する(ステップS800)。
Similarly, the information
次に、波及力計算部700により競合企業の企業力ツリーの機能特徴ノードのスコアに乗算する波及スコアを計算する(ステップS900)。波及力計算部700には、情報源価値推定部500と同様の情報源ツリーのデータが入力される。図57は、波及力算出方法の詳細を示すフローチャートである。先ず、部品納入情報源選別部701が適用情報源ツリーの集合から納入元企業(納入企業)の情報源ツリーを選別する(ステップS421)。次いで、納入先企業抽出部702は、抽出した情報源ツリーの主体者(納入元企業)の納入先企業(競合企業)に関する製品ニュースの情報源があるか否かを、適合情報源ツリー格納部303にて検索する(ステップS422)。ここでは、"新川電工"の納入先である"オプト販売"に関する製品ニュースがあるか否かを検索する。そして、"オプト販売は、μレーザを用いたロスレス光伝送装置「FX5000」を開発"の情報源があることを発見する。そして、特徴語列挙部703は、S422にて抽出された情報源(製品ニュース)から特徴語を抽出する(ステップS424)。ここでは、"μレーザ"、"ロスレス伝送装置"の特徴語を抽出する。
Next, the ripple
一方、近距離用語抽出部704は、技術辞書格納部402の技術辞書を参照し、S421で選別した納入元企業の情報源ツリーに含まれる特徴語と部分一致、又は完全一致の単語があるか否かを検索する(ステップS423)。ここでは、情報源ツリーにおける"光増幅モジュール"が図36に示す技術辞書に存在するか探索し、"DWDM"ノードの子ノードに"光増幅"ノードが存在することがわかる。これにより、光増幅の向上が、DWDMの向上になることが判明する。すなわち、技術辞書において、上位要素は下位要素から構成されるため、下位要素で優れた部品があれば、それに伴い上位要素の製品の差異化につながる。そして、部分一致又は完全一致した単語との距離が所定の閾値以下の単語を抽出する(ステップS425)。ここでは、"光増幅"から距離1.5以下を抽出するものとすると、"DWDM"(距離0.3)、"光アクセス"(距離0.6)、"光伝送装置"(距離1.3)の3つが抽出される。
On the other hand, the short-range
波及力計算部705は、特徴語列挙部703が列挙した特徴語と、近距離用語抽出部が列挙した技術単語とを比較し(ステップS426)、一部又は全部が一致するものがあるか否かを判定し(ステップS427)、一致するものがある場合は、その波及スコアを計算する。ここでは、ステップS424で列挙された"ロスレス伝送装置"と、ステップS425で列挙された"光伝送装置"とにおいて。"伝送装置"で一致する。一致した場合、一致した記述単語と、情報源ツリーの単語と一致した技術用語との距離の逆数が波及係数となる。波及係数は、納入企業の情報源の価値に乗算され、この値が納入先企業(競合企業)の企業力測定ツリー(図44)における機能特徴リーフのスコアに加算される。すなわち、波及力計算部は、ステップS428にて、"光増幅"ノードと"光伝送装置"ノードとの距離1.3の逆数≒0.77を求める。
波及力=競合企業測定ツリーの機能特徴リーフの増加分スコア=波及係数×部品納入企業の情報源のスコア(価値)=0.77×1.6=1.232
The ripple
Ripple force = Functional feature of competitor measurement tree Increase score of leaf = Ripple coefficient × Score (value) of information source of parts supplier company = 0.77 × 1.6 = 1.232
こうして、機能特徴リーフの初期スコア1に波及力1.232が加算されて更新され、この更新された初期スコアに基づき、企業力計算部601が情報源のスコアを算出する。なお、本実施例においては、適合情報源ツリーから波及力を算出するものとして説明したが、波及力計算部700が技術辞書又は事業ドメイン辞書を参照し、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。
In this way, the
本実施例においては、主体者企業辞書を用いることで生産財メーカ企業と部品メーカ企業を区別し、部品の特徴語から性能順位を推定するため、部品業者の技術優位性を測定することが可能になっている。また、部品の技術優位性のニュースと納入先(競合企業)のニュースを複合して評価するため、部品を採用している企業の技術優位性も更新することができる。さらに、波及力により競合企業の機能特徴リーフを増加させ、競合企業の企業力に影響を及ぼすことができる。 In this example, by using the subject company dictionary, it is possible to measure the technical superiority of the parts supplier because it distinguishes between the producer goods company and the parts manufacturer company and estimates the performance ranking from the feature words of the parts. It has become. In addition, since the technical superiority news of parts and the news of the delivery destination (competitor) are evaluated in combination, the technical superiority of the companies adopting the parts can be updated. Furthermore, it is possible to increase the functional feature leaf of competitors by the ripple effect and influence the corporate strength of competitors.
本発明の第5の実施例
次に、本発明の第5の実施例について説明する。本実施例は、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定するものである。上述の第4の実施例は、企業をフォーカスし、どの企業が活発に活動しているか等の企業力を測定するものであったのに対し、本実施例においては、商品にフォーカスをあて、どのような商品が売れているかを知ることで、例えば第4の実施例のどのような企業が活発かという情報と共に、商品開発にあたり、どのような視点をもって商品をつくるかを分析することができる。
Fifth Embodiment of the Invention Next, a fifth embodiment of the present invention will be described. In this embodiment, the best selling products are listed from both the customer's production goods purchase history and the competitor's production goods sales history, and the replacement demand period is estimated. While the fourth embodiment described above focuses on companies and measures corporate power such as which companies are actively active, in this embodiment, the focus is on products. Knowing what products are being sold, for example, it is possible to analyze what kind of viewpoint the products are made with when developing products together with information on what kind of companies are active in the fourth embodiment. .
図58は、本実施例における需要周期を示す図である。横軸に時間、縦軸に需要をとればある商品の需要周期を表すことができる。ここで、情報源から、ある商品Pを競合企業が納入した量D1及びある商品を顧客企業が購入した量D2を抽出し、両者を加算すれば、そのときの商品Pの需要がわかる。なお、加算する際には、競合企業の納入先が購入した顧客企業である場合を除いている。また、納入実績や購入実績などからどの企業が活発に活動しているかも判断することができ、本実施例においては、これらの情報を合わせて表示部に表示することが可能である。 FIG. 58 is a diagram showing a demand cycle in the present embodiment. If time is taken on the horizontal axis and demand is taken on the vertical axis, the demand cycle of a product can be expressed. Here, from the information source, the quantity D1 of a certain product P delivered by a competitor and the quantity D2 of a customer company purchased a certain product are extracted and added together, so that the demand for the product P at that time can be known. In addition, when adding, the case where the delivery destination of a competitor is the customer company which purchased is excluded. In addition, it is possible to determine which company is actively working from the delivery record and purchase record, and in this embodiment, it is possible to display these information together on the display unit.
図59は、本発明の第5の実施例にかかる情報構造化装置51を示す図である。本情報構造化装置51は、図59に示すように、第4の実施例における情報構造化装置41に、定量化部52として需要周期推定部800を更に設ける構成を有する。その他の構成は、第4の実施例と同様であり、その詳細な説明は省略する。本実施例は、商品需要を推定すると共に、その推定結果を、図43に示す顧客企業力測定ツリーの周期リーフに反映させる。
FIG. 59 is a diagram showing an
図60は、本実施例における需要周期推定部800を示すブロック図である。図60に示すように、需要周期推定部800は、製品採用情報選別部801、製品納入情報選別部802、重複検知部803、月間累計カウンタ804、及び商品需要表示部805を有する。
FIG. 60 is a block diagram illustrating the demand
需要周期推定部800は、顧客企業と競合企業のニュースが、市場全体の需要を予測するデータを生成するように動作する。分析した月におけるグラフの勾配に対し、sin関数を適用した値を、顧客企業力測定ツリーの周期リーフの値として採用する。
The demand
すなわち、需要周期推定部800の製品採用情報選別部801及び製品納入情報選別部802が、それぞれ顧客の生産財購入・採用ニュースと、競合他社の生産財販売・納入実績ニュースを、情報源格納部503から抽出する。重複検知部803は、製品採用情報選別部801が情報源格納部503から抽出した情報源ツリーに含まれる採用製品及び納入元を抽出し、製品納入情報選別部802が情報源格納部503から抽出した情報源ツリーに含まれる納入商品及び納入先を抽出し、製品名が一致するか否か、納入先と納入元が一致するか否かを判断する。同じ製品か否かの判定は、技術辞書の最上位ノードの子供ノード(DWDM又はSONET/SDH)以下の特徴語を含むか否かで判定することができる。一致する場合は、その分の製品納入量(採用量)を全体の納入量(採用量)から減じる。月間累計カウンタ804は、重複検知部803の検知結果に基づき、横軸に時間推移を、縦軸に同じ商品グループに分類されている商品の売り上げ実績をプロットし、図58に示すような商品需要周期グラフを生成する。これによって、周期的に発生する生産財の置き換え需要の傾向を予測し、これを商品需要表示部805にて表示することにより、ある商品グループの需要が下がっているのか、上がっているのかを製品毎に提示することができる。
In other words, the product adoption
さらに、企業力計算部601は、この需要勾配の数値を顧客企業力測定ツリーの周期の初期スコアに置き換える。需要周期推定部800によって、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定することができる。従来、競合他社のどの製品がどれだけ売れているのか、分かりづらく、また、顧客の反応が直接見えないため、どのような需要があるのか分かりづらいという課題があったが、本実施例によりこれを解決する。
Furthermore, the enterprise
図61のフローチャートを参照して、本発明の第5の実施例の動作について詳細に説明する。
"NEE、オプト販売の「FX4200」をアメリカ〜日本のバックボーン回線に採用"
というニュースが到着したとする。NEEは顧客企業であるため、製品採用情報選別部801により、この情報源格納部503からこの製品採用情報源ツリーが検出され(ステップS431)、採用製品及び納入元が列挙される(ステップS432)。本例では、採用製品が"FX4200"で、納入元は"オプト販売"となる。次に、製品納入情報選別部802が情報源格納部503に格納されている過去の情報源から、競合企業の製品納入情報源ツリーとして
"オプト販売が光増幅をラマン方式とする「FX4200」をNEEへ納入"
を検出し(ステップS433)、その納入商品の納入先を列挙する(ステップS434)。本例では、納入商品が"FX4200"で、納入先が"NEE"となる。
The operation of the fifth embodiment of the present invention will be described in detail with reference to the flowchart of FIG.
"NEE adopts" FX4200 "sold by Opt for US-Japan backbone line"
The news arrives. Since NEE is a customer company, the product adoption
"Opto Sales Deliver" FX4200 "with Raman Method for Optical Amplification to NEE"
Are detected (step S433), and the delivery destinations of the delivered goods are listed (step S434). In this example, the delivered product is “FX4200” and the delivery destination is “NEE”.
次いで、重複検知部803により、製品名、納入先、納入元が一致しているか判定される。全て一致の場合は、2つの情報源が重複したと判定する。本例では製品名が一致ため、2つの情報は1つの売り上げ(製品販売)として月別需要に加算する(ステップS436)。製品名、納入先、納入元のいずれも一致しない場合は、別個の需要・供給として月別需要に加算する(ステップS438)。同様に顧客企業の採用情報、及び競合企業の納入情報で製品売り上げを月別に計上する。例えば、4月が5売り上げ、5月が6売り上げ、6月が5売り上げという結果になったとする。この場合、4月から6月までの3ヶ月の売り上げ結果(需要)を用いてベジエ曲線を描く(ステップS437)。本例では、5月の増加率はsin(BezierFunction(5,6,5))=sin(0)=0となる。すなわち、需要は横ばい傾向であることが推定できる。このベジエ曲線を商品需要表示部805により表示する。
Next, the
なお、本実施例においては、適合情報源ツリーを用いて需要周期を推定するものとして説明したが、需要周期推定部800がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。
In the present embodiment, the demand period is estimated using the conforming information source tree. However, the demand
本実施例においては、顧客に関する情報と競合他社に関する情報を組み合わせ、及び情報源の等価性を用いることで商品需要の推定が可能となる。すなわち、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定することができる。 In this embodiment, the demand for goods can be estimated by combining information about customers and information about competitors and using equivalence of information sources. That is, it is possible to list the best-selling products and estimate the replacement demand period from both the customer's production goods purchase history and the competitor's production goods sales history.
本発明の第6の実施例
次に、本発明の第6の実施例について説明する。図62は、本発明の第6の実施例にかかる情報構造化装置61を示す図である。本実施例は、財務諸表と、顧客の生産財購入履歴、又は競合他社の販売実績から、顧客の潜在購買力を推定し、優良顧客を推定するものである。本実施例にかかる情報構造化装置61は、図62に示すように、第5の実施例における情報構造化装置51に、定量化装置62として潜在購買力推定部900を更に設ける構成を有する。その他の構成は、第5の実施例と同様であり、その詳細な説明は省略する。
Sixth Embodiment of the Invention Next, a sixth embodiment of the present invention will be described. FIG. 62 is a diagram showing an
図63は、本実施例における潜在購買力推定部900を示すブロック図である。図63に示すように、第5の実施例における需要周期推定部800の製品採用情報選別部801、製品納入情報選別部802、及び重複検知部803と共に潜在購買力推定部900を構成する。潜在購買力推定部900は、さらに、他社製品特徴語選別部904、自社類似製品選別部905、他社製品採用顧客選別部906、財務情報取得部907、投資実績計算部908、投資類似度計算部909、顧客集合選別部910、及び他社製品未採用顧客選別部911を有する。
FIG. 63 is a block diagram showing a potential purchasing
この潜在購買力推定部900は、顧客の財務諸表から資産余裕度を算出するとともに、生産財の購買履歴を重ね合わせることで、どの資金レベルでどのような特徴の生産財を購入する顧客であるのか、購買特性を提示する。顧客企業の資金面の投資姿勢と、実際に購入した商品から、自社製品の販売がしやすい顧客企業を指標化し、企業力更新部が顧客企業の製品マッチング特性に加算する。このことにより、自社にとっての優良顧客のランキングを行い、財務諸表と、顧客の生産財購入履歴、又は競合他社の販売実績から、顧客の潜在購買力を推定することができる。これは、従来、生産財を購入する余力のある潜在的な顧客と、従来から取引関係にある顧客のどちらを優先すべきか分かりづらいという課題を解決する手段となる。
The potential purchasing
図64は、各企業の納入・購買実績のある商品の特徴を示す図である。図64では、一般に機能が高くなるほど、価格も高くなるものとしている。この情報構造化装置61を使用して構造化された情報を取得する企業を企業Aとする。企業Aは競合企業に属するものとする。顧客aはそれよりも低機能で低価格の製品を製造しており、顧客bは更に低機能で低価格の製品を製造している。競合企業B、Cは、企業Aとは異なる価格帯、機能の製品を製造し、それぞれ納入実績があるものとする。ここで、顧客企業が求めている機能及び価格の製品を製造しなければ製品を売ることができない。また、ライバル企業が既に製造し、納入実績がある製品と同様の製品は、既に製造されているため販売できる可能性が低い。すなわち、顧客企業が求めている機能及び価格であって、他の競合企業が製造していない製品を製造すれば販売できる可能性が高い。例えば、企業Aが高機能、高価格の製品を製造しようと計画する際に、この情報構造化装置61を使用して分析を行なうことで、より販売できる可能性が高い機能及び価格のものに製品を見直すことができる。
FIG. 64 is a diagram showing the characteristics of products with delivery / purchase results of each company. In FIG. 64, it is generally assumed that the higher the function, the higher the price. A company that acquires structured information using the
図63に戻って、製品採用情報選別部801は、情報源ツリーの中から、顧客企業の製品採用情報源ツリーを選別する。製品納入情報選別部802は、情報源ツリーの中から、競合企業の製品納入情報源ツリーを選別する。重複検知部803は、顧客企業の製品採用情報源ツリーと製品納入情報源ツリーの等価性を計算し、同じものと判定された場合には、どちらか一方の情報源ツリーを破棄する。
Returning to FIG. 63, the product adoption
次に、他社製品特徴語選別部904は、顧客に採用実績のある製品の特徴語を情報源ツリーの中から抽出する。自社類似製品選別部905は、競合他社の採用実績のあった製品の特徴語を自社製品がもっているか否かを判定し、持っていればその自社製品をピックアップする。他社製品採用顧客選別部906は、主体者辞書から顧客リストを取り出すと共に重複検知部903から得た情報源ツリーのうち、他社製品を採用した顧客企業を製品別に列挙する。一方、財務情報取得部907は顧客企業の公開された財務情報を取得する。例えば四半期又は半期毎に公開される企業の財務報告書から財務情報を抽出したり、情報源の中に含まれる財務情報を抽出することで得ることができる。または、外部から入力するようにしてもよい。投資実績計算部908は固定資産への投資額を計算する。投資類似度計算部909は、固定資産/流動資産で求めた基準(投資姿勢)で顧客企業をソートする。顧客集合選別部910は、他社製品を購入した顧客リストと全ての顧客の投資姿勢リストを入力とし、投資姿勢が類似しており、他社製品を購入していない顧客を選別する。この場合、他社製品を採用した企業の前後1社ずつを全て列挙する。
Next, another company's product feature
他社製品未採用顧客選別部911は、また、納入実績のある他社製品の特徴語と自社製品の特徴語を比較し、機能類似度を(部品・完全マッチする語数/他社製品と自社製品の前特徴語数)によって算出する。また、投資姿勢類似度を1−e^(−(/|固定資産/流動資産−固定資産/流動資産|))で計算し、それぞれ掛け合わせた値を、図43に示す顧客企業力測定ツリーの製品マッチングリーフの初期スコアとする。
The
図65は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。図66は、本実施例の情報構造化装置により作成される表である。本実施例は、登録されている全顧客企業から、どのような製品が購入される蓋然性が高いかを推定し、その製品を購入する蓋然性が高い企業を選別する。まず、財務情報取得部907が図34示す主体者辞書から顧客企業リストを取得し、その顧客企業、例えば"ATT"、"リアル通信"、"OVOP"の財務諸表を得る(ステップS445)。具体的には、財務情報取得部907は、それぞれの顧客企業の固定資産及び流動資産を取得する。それぞれ固定資産が10億、40億、30億で、流動資産が10億、60億、50億であったとする。次に、投資実績計算部908は、各企業の固定資産への投資実績比率を固定資産/流動資産で求める。ここでは、1.0,0.67,0.6と求まる(ステップS446)。そして、投資類似度計算部909が各顧客企業をこの投資姿勢の値でソートすると(ステップS447)、図66に示すように、「OVOP(0.6)」「リアル通信(0.67)」「ATT(1.0)」の順となる。
FIG. 65 is a flowchart illustrating the operation of the information structuring apparatus according to the present embodiment. FIG. 66 is a table created by the information structuring apparatus of this embodiment. In the present embodiment, it is estimated what products are likely to be purchased from all registered customer companies, and companies that are highly likely to purchase the products are selected. First, the financial
一方、他社の納入・採用ニュースとして、それぞれ製品納入情報選別部902、製品採用情報選択部901により、
"オリオン、光アクセス製品の「OR2500」をOVOPに納入"、
"ATT、日本光伝送のメトロ製品「BB−P012」を採用"
というニュースから生成される情報源ツリーを新たに情報源格納部503から選択する(S441)。重複検知部903でこれらの情報源ツリーの重複検査をした後、他者製品特徴語選別部904により、前者の特徴語として"光アクセス製品"、後者の特徴語として"メトロ製品"を抽出する(S442)。次いで、自社類似製品選別部905は、情報源格納部503より、過去の自社製品のリリースニュース
"日本電気、光アクセス製品「DW4000」を発売"
を選択し、"DW4000"を抽出する。自社類似製品選別部905は、DW4000の特徴語と、OR2500、BB−P012の特徴語とを比較し、DW4000が他社の納入実績のある製品と類似すると判断する。これにより、DW4000は納入しやすい製品であることが推定される(ステップS443)。
On the other hand, as delivery / adoption news of other companies, the product delivery information selection unit 902 and the product adoption information selection unit 901 respectively.
"Orion delivers" OR2500 "optical access product to OVOP",
"ATT adopts Nikko Hikari Metro product" BB-P012 ""
Is newly selected from the information source storage unit 503 (S441). After duplication inspection of these information source trees by the duplication detection unit 903, the “other products” feature
"NEC releases optical access product" DW4000 ""
And “DW4000” is extracted. The in-house similar
次に、他社製品採用顧客選別部906は、納入実績がある納入先企業として、"OVOP"や"ATT"を記憶する。また、リアル通信が採用したニュースがなく、かつ競合企業が納品したニュースがないことから、"リアル通信"は実績がない状態と判定する(S444)。顧客集合選別部910は、投資類似度計算部909にてソートされた結果と、他社製品採用顧客選別部906にて採用された製品情報とが入力され図66のような表を作成する。この表より、"リアル通信"は投資実績比率が0.67で、"OVOP"と投資姿勢が類似していることが分かる。顧客集合選別部910は、この表において購入実績を有する顧客企業及びその前後1社を抽出して他社製品未採用顧客選別部911に入力する。本例の場合は、全ての顧客企業の情報がそれに該当する。他社製品未採用顧客選別部911には、自社類似製品選別部905より採用実績のある他社製品と類似の特徴を有する製品情報が供給され、表の自社製造の可否の欄が記述される。
Next, the other company's product adoption
これにより、"OVOP"は自社製品と同様の特徴語を有する光アクセス製品を購入済みであることが分かる。一方、リアル通信は、製品購入実績がなく、かつOVOPと投資姿勢が類似している。すなわち、リアル通信は、投資姿勢の類似しているOVOPが採用した製品を採用する可能性が高い。よって、"リアル通信"は自社製品の"DW4000"の販売候補先として有力な企業となる。他社製品未採用顧客選別部911は、このような他社製品を採用した顧客企業と投資姿勢が似ており、かつ他社製品を未だ採用していない別の顧客企業を抽出して図示せぬ表示部等に表示する(ステップS911)。
As a result, it is understood that “OVOP” has already purchased an optical access product having the same characteristic word as that of its own product. On the other hand, real communication has no product purchase record and is similar in investment attitude to OVOP. In other words, real communication has a high possibility of adopting a product adopted by OVOP having a similar investment attitude. Therefore, “real communication” becomes a promising company as a sales candidate of “DW4000”, which is its own product. The other company product non-adopted
また、他社製品未採用顧客選別部911は、顧客企業"リアル通信"の図43に示す顧客企業力測定ツリーの製品マッチングリーフの値を下記のように算出する。
機能類似度=(部品・完全マッチする語数/他社製品と自社製品の前特徴語数)=1/1
投資姿勢類似度=1−e^(−(1/|固定資産/流動資産−固定資産/流動資産|))=1−e(−(1/|40/60−30/50|))=1−e^(−0.07)≒1
製品マッチングリーフのスコア=機能類似度×投資姿勢類似度=1
以上により、顧客企業力ツリーの製品マッチングの初期スコアを1に更新する。
Further, the other company product non-adopted
Functional similarity = (number of parts / perfect match words / number of previous feature words of other company's products and own products) = 1/1
Investment attitude similarity = 1−e ^ (− (1 / | fixed asset / current asset−fixed asset / current asset |)) = 1−e (− (1 / | 40 / 60−30 / 50 |)) = 1−e ^ (− 0.07) ≈1
Product matching leaf score = functional similarity x investment attitude similarity = 1
As a result, the initial score of product matching in the customer enterprise power tree is updated to 1.
なお、本実施例においては、適合情報源ツリーを用いて潜在購買力を推定するものとして説明したが、潜在購買力推定部900がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。また、潜在購買力推定部900は、自社製品と他社製品の特徴語を比較するため、情報源を適合情報源又は非適合情報源に分離しなくても本実施例を適用可能である。
In this embodiment, the potential purchasing power is estimated using the matching information source tree. However, the potential purchasing
本実施例によれば、顧客企業の投資意欲を公開されている財務諸表のうち、固定資産と流動資産を用いることで、顧客の投資姿勢の類似度を計算し、また顧客や競合他社の納入・採用実績ニュースから自社製品の受容性がありそうな未納入の企業を列挙するため、自社の製品を販売しやすい顧客の推定が可能となる。また、顧客企業の企業力をより正確に求めることができる。 According to the present embodiment, by using fixed assets and current assets in the financial statements publicly disclosed by the client companies, the similarity of the customer's investment attitude is calculated, and the customer and competitors deliver.・ Listing companies that have yet to be delivered that are likely to accept the company's products from the recruitment results news, making it possible to estimate customers who are likely to sell their products. In addition, the corporate strength of the client company can be determined more accurately.
本発明の第7の実施例
次に、本発明の第7の実施例について説明する。図67は、本発明の第7の実施例にかかる情報構造化装置71を示す図である。本実施例は、生産財の開発履歴と販売実績履歴を結びつけ、競合企業の収益性を推定するものである。本情報構造化装置71は、図67に示すように、第6の実施例における情報構造化装置61に、定量化装置72として販売力推定部1000を更に設ける構成を有する。その他の構成は、第6の実施例と同様であり、その詳細な説明は省略する。この第7の実施例は、競合企業の販売力を推定する例である。
Seventh Embodiment of the Invention Next, a seventh embodiment of the present invention will be described. FIG. 67 is a diagram showing an
図68(a)及び図68(b)は、それぞれ販売力と販売までの期間の関係、販売力と機能の関係を示すグラフ図である。図68に示すように、一般に、販売時期−開発完了(リリース)時期が短い方が販売力が高いと見ることができる。また、一般に機能が低いのに売れた場合は、機能が高くて売れた場合より販売力が高いと見ることができる。なお、機能は、単位価格当たりの機能、又は価格とすることも可能である。単位価格当たりの機能が少なくて売れている場合や、単位価格当たりの価格が高いのに売れている場合、販売力が高いと見ることができる。本実施例においては、このような製品の機能及び期間の情報に基づき、企業の販売力を推定する。 68 (a) and 68 (b) are graphs showing the relationship between sales force and the period until sales, and the relationship between sales force and function, respectively. As shown in FIG. 68, in general, it can be seen that the sales force is higher when the sales time-development completion (release) time is shorter. Also, in general, when a function is low but sold, it can be seen that the sales power is higher than when the function is high and sold. The function may be a function per unit price or a price. If there are few functions per unit price and it sells, or if the price per unit price is high, it can be seen that the sales power is high. In the present embodiment, the sales force of a company is estimated based on such product function and period information.
図69は、本実施例における販売力推定部1000を示すブロック図である。図69に示すように、第5の実施例における需要周期推定部800の製品採用情報選別部801、製品納入情報選別部802、及び重複検知部803と共に販売力推定部1000を構成する。販売力推定部1000は、さらに製品別特徴語収集部1004、製品開発情報選別部1005、平均特徴語数算出部1006及び競合製品販売率算出部1007を有する。
FIG. 69 is a block diagram showing the sales
販売力推定部1000は、競合企業の営業力を予測するデータを生成するように動作し、競合企業の生産財開発リリースニュースと、その商品の納入実績ニュース、又は顧客の採用実績ニュースから販売力を計算する。
The sales
先ず、製品別特徴語収集部1004は競合商品ごとに情報源をまとめ、各情報源に含まれる特徴語をカウントし、製品ごとの累計特徴語数αi(iは任意の製品)を求める。平均特徴語数算出部1006は、全ての製品の累計特徴語数と製品数から、1製品あたりの平均特徴語数βを算出する。平均数を求めることで、製品別特徴語収集部1004が収集した特徴がその業界の製品にとって多いのか少ないのかが判別することができる。
First, the product-specific feature
次に、製品採用情報選別部801及び製品納入情報選別部802が、それぞれ顧客の生産財購入・採用ニュースと、競合他社の生産財販売・納入実績ニュースのみを、情報源格納部503から抽出する。重複検知部803は、製品採用情報選別部801が情報源格納部503から抽出した情報源ツリーに含まれる採用製品及び納入元を抽出し、製品納入情報選別部802が情報源格納部503から抽出した情報源ツリーに含まれる納入商品及び納入先を抽出し、製品名が一致するか否か、納入先と納入元が一致するか否かを判断することで納入ニュースと採用ニュースの等価性を判断する。重複があればそれを破棄する。製品開発情報選別部1005は、重複検知部803から製品ごとのリリース時期及び販売量を受け取り、比率γi=(売り上げニュース数)/(納入時期−リリース時期)を算出する。これは、図68(a)に対応する。
Next, the product adoption
競合製品販売率算出部1007は、平均特徴語算出部1006からのαi、βと、製品開発情報選別部1005からのγiとから、平均特徴語数/累計特徴語数×採用ニュース数/(納入時期−リリース時期)によって算出される販売率(販売力)を算出する。β/αは、その値が大きいほど機能が少ない、すなわち魅力が少ない商品を表す。β/α×γiが大きいと、魅力がないのにも関わらず販売までの期間が短いことを示し、すなわち、販売力が高いことを示す値となる。
The competitive product sales
この指標を企業力計算部601が競合企業力測定ツリーの売り上げ実績リーフに加算する。また、図68(a)に示すように、横軸に開発から販売までにかけた時間を、縦軸に売り上げ実績をプロットすることで、開発した商品を如何に効率よく販売に結び付けられているのかを図示せぬ表示部などにより提示することができる。このことにより、生産財の開発履歴と販売実績履歴を結びつけ、競合企業の収益性を推定することができる。そして、本実施例においては、競合他社の製品開発力と、自社の製品開発力の差が分かりづらいという従来の課題を解決する。
The enterprise
次に図70のフローチャートを参照して、本実施例の動作について詳細に説明する。先ず、製品別特徴語収集部1001が各競合商品のリリースニュースについて特徴語数を計測する。
"オプト販売は、μレーザを用いたロスレス光伝送装置「FX5000」を開発"
というリリースニュースが8月に格納された場合、製品別特徴語収集部1001は、特徴語として"μレーザ"、"ロスレス光伝送装置"の2つ(αi=2)を収集する。こうして全ての競合製品について特徴語数をそれぞれ収集する(ステップS451)。そして、平均特徴語算出部1002が、特徴語数を調査対象なった競合製品数で割る(ステップS452)。この場合、平均β=1.4という値が得られるとする。次に、
"オプト販売、「FX5000」をATTに納入"、
"オプト販売、ロスレス光伝送の「FX5000」をリアル通信に納入"
といったニュースが追加され、それぞれ10月、11月に格納されたとすると、製品採用情報選別部801、製品納入情報選別部802、及び重複検知部803により、この情報源から製品の情報を抽出する。そして、各競合商品について、納入・採用ニュース数を計算する(ステップS454)。
Next, the operation of this embodiment will be described in detail with reference to the flowchart of FIG. First, the product-specific feature word collection unit 1001 measures the number of feature words for the release news of each competitive product.
"Opto Sales develops" FX5000 "lossless optical transmission device using μ laser"
Is stored in August, the product-specific feature word collection unit 1001 collects two (αi = 2) of “μ laser” and “lossless optical transmission device” as feature words. Thus, the number of feature words is collected for all competing products (step S451). Then, the average feature word calculation unit 1002 divides the number of feature words by the number of competing products that have been investigated (step S452). In this case, it is assumed that a value of average β = 1.4 is obtained. next,
"Opt sales, delivering" FX5000 "to ATT",
"Optical sales, lossless optical transmission" FX5000 "delivered to real communications"
If the news is added and stored in October and November, respectively, product information is extracted from this information source by the product adoption
次に、製品開発情報選別部1005は、iを製品の番号として
比率γi=売り上げニュース数/(納入時期−開発時期)
を算出する。本例の場合は、10月、11月に納入された売り上げニュース数が各1であるため、
比率γi=1/(10−8)+1/(11−8)≒0.5+0.3=0.8
となる(ステップS455)。そして、競合製品販売率算出部1007は、
販売力=Σβ/αi×γi
を求める。本例において、"FX5000"の販売率は、1.4/2×0.8=0.56と求まる。営業販売力の特性として、特徴のない製品を開発してからすぐに納入した場合、高くなるという傾向がある。競合製品販売率算出部1007は、この販売力の値により競合企業力測定ツリーの売り上げ実績リーフの値を更新する。
Next, the product development
Is calculated. In this example, the number of sales news delivered in October and November is 1 each.
Ratio γi = 1 / (10−8) + 1 / (11−8) ≈0.5 + 0.3 = 0.8
(Step S455). The competitive product sales
Sales force = Σβ / αi × γi
Ask for. In this example, the sales rate of “FX5000” is obtained as 1.4 / 2 × 0.8 = 0.56. As a characteristic of business sales power, there is a tendency that if a product with no features is developed and delivered immediately, it becomes higher. The competitive product sales
なお、本実施例においては、適合情報源ツリーを用いて販売力を推定するものとして説明したが、販売力推定部1000がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。また、販売力推定部1000は、製品の平均特徴語数を利用するため、情報源を適合情報源又は非適合情報源に分離しなくても本実施例を適用可能である。
In this embodiment, the sales force is estimated by using the compatible information source tree. However, the sales
本実施例においては、開発製品の特徴数、その平均値、売り上げニュース数及び当該開発製品の開発から納入までの期間を指標として使用することで競合企業の販売力の推定が可能となる。また、求めた販売力を競合企業力測定ツリーの売り上げ実績リーフの値とすることで、競合企業力を販売力を加味した値に更新することができ、正確に推定することができる。 In this embodiment, the sales force of a competitor can be estimated by using the number of features of the developed product, its average value, the number of sales news, and the period from development to delivery of the developed product as indices. Further, by setting the obtained sales force as the value of the sales performance leaf in the competitive enterprise strength measurement tree, the competitive enterprise strength can be updated to a value taking into account the sales capability, and can be accurately estimated.
本発明の第8の実施例
次に、本発明の第8の実施例について説明する。図71は、本発明の第8の実施例にかかる情報構造化装置81を示す図である。本実施例は、顧客に採用されている生産財商品と、商品開発メーカへ納入されている部品を結びつけ、どの部品が商品の競争力となっているのか推定するものである。本情報構造化装置81は、図71に示すように、第7の実施例における情報構造化装置71に、定量化装置82として競争力増強部品推定部1100を更に設ける構成を有する。その他の構成は、第7の実施例と同様であり、その詳細な説明は省略する。本第8の実施例は、優良部品を推定する例である。
Eighth Embodiment of the Invention Next, an eighth embodiment of the present invention will be described. FIG. 71 is a diagram showing an information structuring apparatus 81 according to the eighth example of the present invention. In the present embodiment, the product produced by the customer and the parts delivered to the product development maker are linked to estimate which part is the competitiveness of the product. As shown in FIG. 71, the information structuring apparatus 81 has a configuration in which a competitiveness enhancement
図72は、本実施例における競争力増強部品推定部1100を示すブロック図である。図72に示すように、競争力増強部品推定部1100は、部品採用率上位企業選別部1101、競合企業製品納入実績計測部1102、及び部品貢献率算出部1103を有する。この競争力増強部品推定部1100は、上述した製品採用情報選別部801、製品納入情報選別部802及び重複検知部803の出力結果を利用している。
FIG. 72 is a block diagram showing a competitiveness enhancement
競争力増強部品推定部1100は、部品納入実績のニュース又は競合企業の部品採用ニュースと、競合企業の製品売り上げ実績又は顧客の商品採用実績を用いて、ある部品が競合企業の製品に組み込まれ、最終的に顧客へ販売された率を計算する。この指標は競争力増強部品推定部1100により、納入企業力測定ツリーの差異化リーフの初期スコアに加算するために企業力推定部600に入力される。また、横軸に納入した部品を、縦軸に顧客への納入実績をプロットすることで、どの部品が競争力を生み出す源泉となっているのかを提示する。このことにより、顧客に採用されている生産財商品と、商品開発メーカへ納入されている部品を結びつけ、どの部品が商品の競争力となっているのか推定することを実現する。これは、他社製品が採用している技術優位性が高い部品はどのようなものか分かりづらいという従来の課題を解決し、顧客に採用されている商品と、そのメーカに納入されている部品のマッピングを提示し、競争力の高い部品を抽出する。
The competitiveness-enhancing
部品採用率上位企業選別部1101は、納入業者の部品を採用している競合企業のうち、納入業者の部品占有率が高い企業を上位2社選択する。例えば、部品納入業者A1の販売実績ニュースと、納入先競合企業B1の採用ニュースから部品占有率を算出する場合について説明する。例えば納入先競合企業B1が納入業者A1の部品を採用したことを3回リリースし、納入先競合企業B1が別の納入業者A2の部品を採用したことを1回リリースしたら、部品納入業者A1にとって部品占有率が高い競合企業は納入先競合企業B1であることが分かる。
The part adoption rate top
競合企業製品納入実績計測部1102は、各企業が開発した製品の顧客企業への採用率を、
採用率α=採用実績製品数/開発製品数
によって算出する。競合企業に納品してもそれを使用した製品が顧客企業に納品されていなければ、当該部品は採用されていないことになる。
Competitor product delivery
Adoption rate α = calculated by the number of products used / the number of products developed. Even if the product is delivered to the competitor, if the product using it is not delivered to the customer company, the part is not adopted.
部品貢献率算出部1103は、競合企業に納入した部品の関係性から、iを製品種別とすると
貢献率Pi=1/納入部品種数×採用率
で計算する。残りの上位1社に対しても同様に貢献率を算出し、前出の貢献率へ加算する。納入企業が保有する全ての部品について計算する。計算結果は、企業力計算部601に入力され、部品納入企業力測定ツリーの差異化リーフの初期スコアとして採用される。
The part contribution
図73のフローチャート及び図74のニュース関係図を参照して、本発明の第8の実施例の動作について詳細に説明する。利用するニュースは、
"新川電工が高濃度のμレーザを開発"、
"新川電工、小型の光増幅モジュールを開発"、
"新川電工は光クロスコネクト(XC)部品の供給を開始"
という新川電工の開発関係のニュース3件、
"新川電工、オリオンにμレーザを納入"、
"オリオン、新川電工の光増幅モジュールを全面的に採用"
という競合企業であるオリオンに対する部品供給ニュース2件、
"新川電工、日本光伝送にμレーザを納入"、
"新川電工、日本光伝送に光増幅モジュールを納入"、
"新川電工、XC部品を日本光伝送に納入"
という競合企業である日本光伝送に対する部品提供ニュース3件、
"新川電工、サクラ通にμレーザを納入"
という競合企業であるサクラ通に対する部品納品ニュース1件、
"オリオン、キャリアのATTにメトロ製品を納入"、
"リアル通信、オリオンのDWDM部を採用"
という顧客企業のオリオン製品の採用ニュース2件、
"日本光伝送、メトロ製品をOVOPに納入"
という顧客企業の日本光伝送製品の採用ニュース1件、
"サクラ通、アクセス製品のAX−1000をADDIに納入"
という顧客企業のサクラ通製品の採用ニュース1件である。これらのニュース関連図を示すと図74となる。
The operation of the eighth embodiment of the present invention will be described in detail with reference to the flowchart of FIG. 73 and the news relation diagram of FIG. News to use
"Shinkawa Electric develops high-concentration μ laser",
"Shinkawa Electric develops small optical amplification module",
"Shinkawa Electric starts supplying optical cross-connect (XC) parts"
3 news related to the development of Shinkawa Electric,
"Shinkawa Electric supplies μ laser to Orion",
"Orion fully adopts Shinkawa Electric's optical amplification module"
Two parts supply news for Orion, a competitor
"Shinkawa Electric Co., Ltd. Delivered μ Laser to Nippon Optical Transmission",
"Shinkawa Electric Co., Ltd. delivers optical amplification module to Nippon Optical Transmission",
"Shinkawa Electric Co., Ltd. delivers XC parts to Nippon Optical Transmission"
3 parts supply news for Nippon Kogyo, a competitor
"Shinkawa Electric supplies μ-laser to Sakura-dori"
One part delivery news for Sakura Tsuru, a competitor
"Orion delivers metro products to carrier ATT",
"Real communication uses Orion's DWDM part"
Two news stories about the adoption of Orion products
"Nippon Hikari Transmission and Metro products delivered to OVOP"
One news about the adoption of Nikko transmission products of a customer company,
"Sakura-Dori, Access product AX-1000 delivered to ADDI"
This is one news story about the adoption of Sakura products by a customer company. These news related diagrams are shown in FIG.
部品採用率上位企業選別部1101が納入部品ごとに納入先の競合企業を列挙する(ステップS461)。上記例においては、納入先の競合企業は、"オリオン"、"日本光伝送"、"サクラ通"が列挙される。そして、"新川電工"からの部品納入が多い企業は上位から、"日本光伝送"(3)、"オリオン"(2)、"サクラ通"(1)となり、このうち部品採用率上位企業選別部1101は上位2社を選択する(ステップS462)。競合企業製品納入実績計測部1102は、上位2社の顧客への納入実績ニュースを抽出する(ステップS463)。本例では、
"オリオン、キャリアのATTにメトロ製品を納入"、
"リアル通信、オリオンのDWDM部を採用"
の2件、及び
"日本光伝送、メトロ製品をOVOPに納入"
となる。
The component adoption rate higher-level
"Orion delivers metro products to carrier ATT",
"Real communication uses Orion's DWDM part"
2 cases, and
"Nippon Hikari Transmission and Metro products delivered to OVOP"
It becomes.
一方、競合企業製品納入実績計測部1102は、顧客への採用実績ニュース数を各部品ごとに算出する(ステップS464)。すなわち、部品が競合企業を経て、顧客へ到達するパスを列挙する。"μレーザ"に関しては、オリオン→ATT/リアル通信の2件と、日本光伝送→OVOPの1件が該当する。同様に光増幅も3件、XCは1件となる。オリオンの自社製品を3種類、日本光伝送の自社製品を2種類だとすると、オリオンが顧客に収めた実績は2種類の製品であるため、競合企業製品納入実績計測部1102は、採用率α(オリオン)=採用実績製品数/開発製品数=2/3、α(日本光伝送)=1/2を求める(ステップS465)。
On the other hand, the competitor product delivery
次に、部品貢献率算出部1103は、競合企業に収めた実績のある各部品について貢献率Pi=α×(1/全部品)を計算する(ステップS466)。本例では、"オリオン"に納入されている製品は、"μレーザ"と"光増幅"の2つであるため、部品貢献率算出部1103は、下記のようにして部品貢献率Piを求める。
Pi(μレーザ)=(2/3)×1/2=1/3、
Pi(光増幅)=(2/3)×1/2=1/3
同様に日本光伝送に納入されている部品は、3種類であるため、
Pi+1(μレーザ)=(1/2)×1/3=1/6、
Pi+1(光増幅)=(1/2)×1/3=1/6、
Pi+1(XC)=(1/2)×1/3=1/6
となる。各企業ごとに算出した貢献率を、製品ごとに合計すると、
P(μレーザ)=1/3+1/6=1/2、
P(光増幅)=1/2、
P(XC)=1/6
となる(ステップS467)。よって、製品をこの値でソートすると、"μレーザ"、"光増幅"、"XC"の順となり、新川電工の製品のお勧めは"μレーザ"又は"光増幅"となる。
Next, the component contribution
Pi (μ laser) = (2/3) × 1/2 = 1/3,
Pi (optical amplification) = (2/3) × 1/2 = 1/3
Similarly, there are three types of parts delivered to Nihon Kohtsu,
Pi + 1 (μ laser) = (1/2) × 1/3 = 1/6,
Pi + 1 (optical amplification) = (1/2) × 1/3 = 1/6,
Pi + 1 (XC) = (1/2) × 1/3 = 1/6
It becomes. When the contribution rate calculated for each company is totaled for each product,
P (μ laser) = 1/3 + 1/6 = 1/2,
P (light amplification) = 1/2,
P (XC) = 1/6
(Step S467). Therefore, when products are sorted by this value, the order is “μ laser”, “optical amplification”, and “XC”, and the recommended product of Shinkawa Electric is “μ laser” or “optical amplification”.
なお、本実施例においては、適合情報源ツリーを用いて競争力増強部品を推定するものとして説明したが、競争力増強部品推定部1100がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。
In the present embodiment, description has been made on the assumption that the competitiveness enhancing component is estimated using the matching information source tree. However, the competitiveness enhancing
本実施例においては、関連ニュースの関係および納入実績を部品納入業者、競合企業、顧客企業の範囲で指標化することで、実績ベースの優良部品の推定が可能となる。また、求めた貢献率は、部品納入企業力測定ツリーにおける差異化リーフの初期スコアに置き換えられることで、部品の販売実績等の良否を反映した企業力の推定が可能となる。 In this embodiment, the relationship between related news and delivery results is indexed in the range of parts suppliers, competitors, and customer companies, so that it is possible to estimate superior parts based on results. In addition, the calculated contribution rate is replaced with the initial score of the differentiated leaf in the component delivery company strength measurement tree, thereby making it possible to estimate the enterprise strength reflecting the quality of the sales performance of the components.
以上、説明した本発明の第1乃至第8の実施例は下記の効果を奏する。すなわち、
第1の効果は、未知の製品が事業ドメインと合致している競合商品であるかどうか、自動的に判定できることである。その理由は、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった競合製品を発見し、購入対象として提示することができるためである。さらに、過去の製品リリースニュース履歴、事業ドメインに合致していない製品をリリースする総合企業と、事業ドメインに合致した製品のみをリリースする専門業者を分類することによって、誤って異なる事業ドメインの新製品と判定することを低減する。
The first to eighth embodiments of the present invention described above have the following effects. That is,
The first effect is that it is possible to automatically determine whether an unknown product is a competing product that matches the business domain. The reason for this is that the information source is decomposed into the subject, action, product name, and feature word, and compared with other information sources using business domain dictionaries and technical dictionaries. This is because it can be presented as a purchase target. In addition, past product release news history, comprehensive companies that release products that do not match the business domain, and specialists that only release products that match the business domain, are mistakenly classified as new products in different business domains. Is reduced.
第2の効果は、事業ドメインに合致した競合企業を発見し、専門業者と総合メーカを区別できることである。その理由は、事業ドメインで普遍的な技術辞書を用いて、新製品リリースニュースの特徴語と比較するため、製品が事業ドメインに合致していることが判明し、さらに開発した企業名も取得できるからである。さらに、競合企業が扱う製品が事業ドメインに属する割合を計測し、閾値以上の割合で事業ドメインに合致する製品をリリースしているか判定できるからである。 The second effect is that it is possible to find competitors that match the business domain and to distinguish between specialists and general manufacturers. The reason is that the product is matched with the business domain using a universal technical dictionary in the business domain and compared with the feature words of the new product release news, and the name of the developed company can also be obtained. Because. Furthermore, it is because it is possible to measure whether a product handled by a competitor belongs to a business domain and determine whether a product matching the business domain is released at a rate equal to or higher than a threshold.
第3の効果は、事業ドメインに合致した顧客企業を発見できることにある。その理由は、過去の製品納入ニュースから、事業ドメインの生産財を購入する企業を列挙し、まとめて提示することができるためである。これによって、過去に直接的に取引のない顧客を発見することができる。また、顧客企業の財務諸表を準備しておくことで、顧客の投資姿勢や余裕資金などを元に、優良顧客度合いを計算することで、どの顧客が生産財を購入しやすいか判定することができる。 The third effect is that a client company that matches the business domain can be found. This is because companies that purchase production goods in the business domain can be listed from past product delivery news and presented together. As a result, it is possible to find a customer who has not made a direct transaction in the past. In addition, by preparing the financial statements of client companies, it is possible to determine which customers are likely to purchase production goods by calculating the level of excellent customers based on the investment attitude of the customers and surplus funds. it can.
第4の効果は、事業ドメインに関連したキーワードを自動収集できることにある。その理由は、事業ドメインに属すると判定した情報源から、同時に出現する単語動詞を関連の深い単語として記憶できるからである。新しい競合製品の特徴語を、事業ドメイン辞書や技術辞書に追加するため、自動的に事業ドメインの用語を増殖させることができ、人手でメンテナンスする工数を削減することができる。さらに増殖した特徴語も含めて、後から入力される情報源を比較するため、より広く製品を発見することが可能になる。また、ニュースの情報源に同時に出現するキーワードを、技術辞書の距離に反映させることによって、関連の深さに応じた技術ワードを自動構築できる。 The fourth effect is that keywords related to the business domain can be automatically collected. The reason is that word verbs appearing simultaneously from information sources determined to belong to the business domain can be stored as closely related words. Since feature words of new competitive products are added to the business domain dictionary and the technical dictionary, business domain terms can be automatically expanded, and the number of man-hours required for manual maintenance can be reduced. Furthermore, since the information source inputted later is also compared including the feature word which grew, it becomes possible to discover a product more widely. In addition, by reflecting the keywords that appear simultaneously in the news information source in the distance of the technical dictionary, it is possible to automatically construct a technical word corresponding to the depth of association.
第5の効果は、顧客・競合・部品納入企業の企業力の差を定量化できることにある。その理由は、顧客、競合、部品納入企業という3つのタイプに企業力を測定するテンプレートを用意し、情報源に含まれるキーワードと、単語・ノード対応表と、競合企業力測定ツリーの構造と、リーフ値計算式から、キーワードの持つインパクトを過去の企業活動に照らし合わせて計算するからである。また、直接的には部品納入業者のニュースでも、それを採用する企業への影響力も技術辞書を用いて定量化するため、より正確に波及効果も定量化することができる。 The fifth effect is that the difference in corporate power among customers, competitors, and parts suppliers can be quantified. The reason for this is that templates for measuring corporate strength are prepared for the three types of customers, competitors, and parts suppliers, keywords included in information sources, word / node correspondence tables, and competitive enterprise strength measurement tree structures, This is because the impact of keywords is calculated from the leaf value calculation formula against the past business activities. Further, since the influence on the company that employs the parts supplier is directly quantified using the technical dictionary, the ripple effect can be quantified more accurately.
以上のような情報構造化処理は、専用コンピュータ、又はパーソナルコンピュータ(PC)などのコンピュータにより実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図75に示すように、コンピュータ2100は、CPU2101(Central Processing Unit)、ROM2102(Read Only Memory)及びRAM2103(Random Access Memory)を有し、これらがバス2104を介して相互に接続されている。尚、コンピュータを動作させるためのOSソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然備えているものとする。
The information structuring process as described above can be realized by a computer such as a dedicated computer or a personal computer (PC). However, the computer does not need to be physically single, and a plurality of computers may be used when performing distributed processing. As shown in FIG. 75, the
バス2104には又、入出力インターフェース2105も接続されている。入出力インターフェース2105には、例えば、キーボード、マウス、センサなどよりなる入力部2106、CRT、LCDなどよりなるディスプレイ、並びにヘッドフォンやスピーカなどよりなる出力部2107、ハードディスクなどより構成される記憶部2108、モデム、ターミナルアダプタなどより構成される通信部2109などが接続されている。
An input /
CPU2101は、ROM2102に記憶されている各種プログラム、又は記憶部2108からRAM2103にロードされた各種プログラムに従って各種の処理を実行する。本実施例においては、例えば、情報源裁断処理、情報源再構築処理、情報源選別処理、グループ生成処理、情報源価値推定処理、波及力計算処理、企業力推定処理、需要周期推定処理、潜在購買力推定処理、販売力推定処理、又は競争力増強部品推定処理等の処理を実行する。RAM2103にはまた、CPU2101が各種の処理を実行する上において必要なデータなども適宜記憶される。
The
通信部2109は、例えば図示しないインターネットを介しての通信処理を行ったり、CPU2101から提供されたデータを送信したり、通信相手から受信したデータをCPU2101、RAM2103、記憶部2108に出力したりする。記憶部2108はCPU2101との間でやり取りし、情報の保存・消去を行う。通信部2109は又、他の装置との間で、アナログ信号又はディジタル信号の通信処理を行う。
For example, the
入出力インターフェース2105は又、必要に応じてドライブ2110が接続され、例えば、磁気ディスク2111、光ディスク2112、フレキシブルディスク2113、又は半導体メモリ2114などが適宜装着され、それらから読み出されたコンピュータプログラムが必要に応じて記憶部2108にインストールされる。
The input /
なお、本発明は上述した実施例のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。 It should be noted that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the present invention.
例えば、上述の実施例では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。 For example, in the above-described embodiments, the hardware configuration has been described. However, the present invention is not limited to this, and any processing can be realized by causing a CPU (Central Processing Unit) to execute a computer program. It is. In this case, the computer program can be provided by being recorded on a recording medium, or can be provided by being transmitted via the Internet or another transmission medium.
1,1b,21,31,41,51,61,71,81,91 情報構造化装置
2,12,22,32,43,53,63,72,82,92 定量化装置
100 情報源裁断部
101 情報源蓄積部
102 形態素解析部
103 形態素蓄積部
200 情報源再構築部
201 書式解析部
202 書式ルール蓄積部
203 要素単語格納部
204 ツリー生成部
205 情報源ツリー格納部
206 情報源メタ情報格納部
300,300b,300c 情報源選別部
301 情報源選別部
301b ツリー選別部
302 ドメイン辞書格納部
303 適合情報源格納部
303b 適合情報源ツリー格納部
304 非適合情報源格納部
304b 非適合情報源ツリー格納部
305 主体者辞書
400,400b グループ生成部
401 情報源増殖部
401b ツリー増殖部
402 技術辞書格納部
500 情報源価値推定部
501 主体者判定部
502 主体者辞書格納部
503 情報源格納部
504 情報源定量化部
505 単語定量化マップ格納部
506 情報減初期スコア格納部
507 企業力測定ツリー格納部
600 企業力推定部
601 企業力計算部
602 情報源最終スコア格納部
700 波及力計算部
701 部品納入情報源選別部
702 納入先企業抽出部
703 特徴語列挙部
704 近距離用語抽出部
705 波及力計算部
800 需要周期推定部
801 製品採用情報選別部
802 製品納入情報選別部
803 重複検知部
804 月間累計カウンタ
805 商品需要表示部
900 潜在購買力推定部
901 製品採用情報選択部
902 製品納入情報選別部
903 重複検知部
904 他社製品特徴語選別部
905 自社類似製品選別部
906 他社製品採用顧客選別部
907 財務情報取得部
908 投資実績計算部
909 投資類似度計算部
910 顧客集合選別部
911 他社製品未採用顧客選別部
1000 販売力推定部
1001 製品別特徴語収集部
1002 平均特徴語算出部
1003 製品開発情報選別部
1004 製品別特徴語収集部
1005 製品開発情報選別部
1006 平均特徴語数算出部
1007 競合製品販売率算出部
1100 競争力増強部品推定部
1101 部品採用率上位企業選別部
1102 競合企業製品納入実績選別部
1103 部品貢献率算出部
2100 コンピュータ
2101 CPU
2102 ROM
2103 RAM
2104 バス
2105 入出力インターフェース
2106 入力部
2107 出力部
2108 記憶部
2109 通信部
2110 ドライブ
2111 磁気ディスク
2112 光ディスク
2113 フレキシブルディスク
2114 半導体メモリ
1, 1b, 21, 31, 41, 51, 61, 71, 81, 91 Information structuring device 2, 12, 22, 32, 43, 53, 63, 72, 82, 92 Quantifying device 100 Information source cutting unit 101 Information Source Storage Unit 102 Morphological Analysis Unit 103 Morphological Storage Unit 200 Information Source Reconstruction Unit 201 Format Analysis Unit 202 Format Rule Storage Unit 203 Element Word Storage Unit 204 Tree Generation Unit 205 Information Source Tree Storage Unit 206 Information Source Meta Information Storage Unit 300, 300b, 300c Information source selection unit 301 Information source selection unit 301b Tree selection unit 302 Domain dictionary storage unit 303 Applicable information source storage unit 303b Applicable information source tree storage unit 304 Non-conforming information source storage unit 304b Non-conforming information source tree storage Unit 305 Subject dictionary 400, 400b Group generation unit 401 Information source multiplication unit 401b Tree multiplication unit 40 2 Technical dictionary storage unit 500 Information source value estimation unit 501 Subject determination unit 502 Subject dictionary storage unit 503 Information source storage unit 504 Information source quantification unit 505 Word quantification map storage unit 506 Information reduction initial score storage unit 507 Measurement tree storage unit 600 Enterprise power estimation unit 601 Enterprise power calculation unit 602 Information source final score storage unit 700 Ripple force calculation unit 701 Parts delivery information source selection unit 702 Delivery destination company extraction unit 703 Feature word enumeration unit 704 Short-range term extraction unit 705 Ripple calculation unit 800 Demand cycle estimation unit 801 Product adoption information selection unit 802 Product delivery information selection unit 803 Duplicate detection unit 804 Monthly cumulative counter 805 Product demand display unit 900 Potential purchasing power estimation unit 901 Product adoption information selection unit 902 Product delivery information Sorting unit 903 Duplicate detection unit 904 Competitor product feature word sorting unit 905 In-house similar product selection 906 Financial information acquisition unit 908 Investment performance calculation unit 909 Investment similarity calculation unit 910 Customer group selection unit 911 Other company product non-adopted customer selection unit 1000 Sales force estimation unit 1001 Product feature word collection unit 1002 Average feature word calculation unit 1003 Product development information selection unit 1004 Product-specific feature word collection unit 1005 Product development information selection unit 1006 Average feature word number calculation unit 1007 Competitive product sales rate calculation unit 1100 Competitiveness enhancement component estimation unit 1101 Component adoption rate top companies Sorting unit 1102 Competitor product delivery results sorting unit 1103 Part contribution rate calculation unit 2100 Computer 2101 CPU
2102 ROM
2103 RAM
2104
Claims (25)
予め定められた書式ルールに従って前記単語を分類する情報源再構築部と、
事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別部と、
単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した単語辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成部とを有する情報構造化装置。 An information source cutting unit that divides the information source to generate words;
An information source restructuring unit for classifying the word according to a predetermined format rule;
An information source selection unit that refers to a business domain dictionary in which business domains are registered, and selects the information source as a conforming information source related to a production good or a non-conformity information source not related to a production good;
Referring to a word dictionary in which a set of words and their synonyms is classified based on a superordinate concept and / or subordinate concept in the business domain, and extracting information sources having a high probability of producing goods from the non-conforming information sources, An information structuring apparatus having a group generation unit as a compatible information source.
ことを特徴とする請求項1記載の情報構造化装置。 The information structuring apparatus according to claim 1, wherein the information source cutting unit includes a morpheme analysis unit that divides the information source into morphemes.
ことを特徴とする請求項1又は2記載の情報構造化装置。 The information structuring apparatus according to claim 1, wherein the information source restructuring unit forms the information source tree having the subject as a root by combining the words.
前記不可分要素を製品名、主体者、特徴語、及び行動に分類する書式解析部と、
前記書式解析結果に基づき前記不可分要素に分断された情報源から前記情報源ツリーを生成するツリー生成部とを有する
ことを特徴とする請求項3項記載の情報構造化装置。 The information source reconstruction unit
A format analysis unit for classifying the inseparable elements into product names, subjects, feature words, and actions;
The information structuring apparatus according to claim 3, further comprising: a tree generation unit configured to generate the information source tree from the information source divided into the inseparable elements based on the format analysis result.
ことを特徴とする請求項4項記載の情報構造化装置。 The information structuring apparatus according to claim 4, wherein the format analysis unit generates an element word by combining consecutive nouns in the morpheme.
ことを特徴とする請求項1乃至5のいずれか1項記載の情報構造化装置。 The said group production | generation part refers to the subject person dictionary by which the subject person was classified for every classification, and classifies the said conformity information source for every subject person. The Claim 1 thru | or 5 characterized by the above-mentioned. Information structuring device.
ことを特徴とする請求項1乃至5のいずれか1項記載の情報構造化装置。 The said information source selection part registers the word which does not exist in the said business domain dictionary among the words which comprise the said conforming information source in the said business domain dictionary. The information structuring apparatus described.
ことを特徴とする請求項1乃至6のいずれか1項記載の情報構造化装置。 The information according to any one of claims 1 to 6, wherein the group generation unit registers, in the word dictionary, a word that does not exist in the word dictionary among words constituting the matching information source. Structured device.
前記単語辞書を参照し、納入元企業が主体者となる情報源に含まれる単語と、納入先企業に関する情報源に含まれる単語との距離に応じて、前記納入先企業に対する前記納入元企業の影響力を算出する波及力計算部を更に有する
ことを特徴とする請求項1乃至7のいずれか1項記載の情報構造化装置。 The word dictionary is a set of distances between words based on the similarity between words,
With reference to the word dictionary, according to the distance between the word included in the information source for which the supplier company is the subject and the word included in the information source regarding the destination company, The information structuring apparatus according to claim 1, further comprising a ripple force calculation unit that calculates an influence force.
ことを特徴とする請求項1乃至8のいずれか1項記載の情報構造化装置。 The system further comprises a demand cycle estimation unit for estimating a demand cycle of the product based on the product and delivery source in the product adoption information source of the customer company and the product and delivery destination in the product delivery information source of the competitor company. Item 9. The information structuring apparatus according to any one of Items 1 to 8.
ことを特徴とする請求項1乃至9のいずれか1項記載の情報構造化装置。 10. A potential purchasing power estimation unit for estimating the potential purchasing power of the customer company based on the financial information of the customer company and the product purchase history of the customer company or the product sales performance of the competitor company. The information structuring apparatus according to any one of the above.
ことを特徴とする請求項1乃至11のいずれか1項記載の情報構造化装置。 The information dictionary according to any one of claims 1 to 11, wherein the word dictionary is a technical dictionary in which a set of technical terms and synonyms thereof is classified based on a superordinate concept and / or a subordinate concept in the business domain. Structured device.
予め定められた書式ルールに従って前記単語を分類する情報源再構築工程と、
事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別工程と、
技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成工程とを有する情報構造化方法。 An information source cutting step of dividing the information source to generate words;
An information source reconstruction step of classifying the word according to a predetermined format rule;
An information source selection step of selecting a business domain dictionary in which business domains are registered and selecting the information source as a conforming information source related to a production good or a non-conformity information source not related to a production good;
Referring to a technical dictionary in which a set of technical terms and synonyms thereof is classified based on a superordinate concept and / or subordinate concept in the business domain, and extracting information sources having a high probability of producing goods from the non-conforming information sources; And an information structuring method including a group generation step as the matching information source.
ことを特徴とする請求項13記載の情報構造化方法。 The information structuring method according to claim 13, further comprising: a morpheme analysis unit that divides the information source into morphemes in the information source cutting step.
ことを特徴とする請求項13又は14記載の情報構造化方法。 The information structuring method according to claim 13 or 14, wherein, in the information source reconstruction step, the information source tree is formed by combining the words and having the subject as a root.
前記不可分要素を製品名、主体者、特徴語、及び行動に分類する書式解析工程と、
前記書式解析結果に基づき前記不可分要素に分断された情報源から前記情報源ツリーを生成するツリー生成工程とを有する
ことを特徴とする請求項15項記載の情報構造化方法。 The information source reconstruction step includes:
A format analysis step for classifying the inseparable elements into product names, subjects, feature words, and actions;
16. The information structuring method according to claim 15, further comprising: a tree generation step of generating the information source tree from the information source divided into the inseparable elements based on the format analysis result.
ことを特徴とする請求項16項記載の情報構造化方法。 The information structuring method according to claim 16, wherein in the format analysis step, element words are generated by combining consecutive nouns of the morphemes.
ことを特徴とする請求項13乃至17のいずれか1項記載の情報構造化方法。 The said information source selection process WHEREIN: The word which does not exist in the said business domain dictionary among the words which comprise the said conforming information source is registered into the said business domain dictionary. The any one of Claim 13 thru | or 17 characterized by the above-mentioned. Information structuring method described.
ことを特徴とする請求項13乃至18のいずれか1項記載の情報構造化方法。 19. The group generation process according to claim 13, wherein in the group generation step, the subject refers to a subject dictionary classified by type, and classifies the conforming information source for each subject. Information structuring method.
ことを特徴とする請求項13乃至19のいずれか1項記載の情報構造化方法。 The information according to any one of claims 13 to 19, wherein in the group generation step, a word that does not exist in the technical dictionary among words constituting the matching information source is registered in the technical dictionary. Structured method.
前記技術辞書を参照し、納入元企業が主体者となる情報源に含まれる単語と、納入先企業に関する情報源に含まれる単語との距離に応じて、前記納入先企業に対する前記納入元企業の影響力を算出する波及力計算工程を更に有する
ことを特徴とする請求項13乃至20のいずれか1項記載の情報構造化方法。 The technical dictionary has a distance between words set based on the similarity between words,
With reference to the technical dictionary, according to the distance between the word included in the information source for which the supplier company is the subject and the word included in the information source regarding the destination company, The information structuring method according to any one of claims 13 to 20, further comprising a ripple force calculation step of calculating influence.
ことを特徴とする請求項13乃至21のいずれか1項記載の情報構造化方法。 Further comprising a demand cycle estimation step of estimating a demand cycle of the product based on the product and delivery source in the product adoption information source of the customer company and the product and delivery destination in the product delivery information source of the competitor company. Item 22. The information structuring method according to any one of Items 13 to 21.
ことを特徴とする請求項13乃至22のいずれか1項記載の情報構造化方法。 23. A potential purchasing power estimation step for estimating the potential purchasing power of the customer company based on the financial information of the customer company and the product purchase history of the customer company or the product sales performance of the competitor company, further comprising: The information structuring method according to any one of the above.
ことを特徴とする請求項13乃至23のいずれか1項記載の情報構造化方法。 24. The information dictionary according to claim 13, wherein the word dictionary is a technical dictionary in which a set of technical terms and synonyms thereof is classified based on a higher concept and / or a lower concept in the business domain. Structured method.
情報源を分割して単語を生成する情報源裁断工程と、
予め定められた書式ルールに従って前記単語を分類する情報源再構築工程と、
事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別工程と、
技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成工程とを有するプログラム。 A program for causing a computer to execute processing for structuring an input information source,
An information source cutting step of dividing the information source to generate words;
An information source reconstruction step of classifying the word according to a predetermined format rule;
An information source selection step of selecting a business domain dictionary in which business domains are registered and selecting the information source as a conforming information source related to a production good or a non-conformity information source not related to a production good;
Referring to a technical dictionary in which a set of technical terms and synonyms thereof is classified based on a superordinate concept and / or subordinate concept in the business domain, and extracting information sources having a high probability of producing goods from the non-conforming information sources; A program including a group generation step as the matching information source.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007196659A JP5018313B2 (en) | 2007-07-27 | 2007-07-27 | Information structuring apparatus, information structuring method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007196659A JP5018313B2 (en) | 2007-07-27 | 2007-07-27 | Information structuring apparatus, information structuring method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009032118A true JP2009032118A (en) | 2009-02-12 |
JP5018313B2 JP5018313B2 (en) | 2012-09-05 |
Family
ID=40402541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007196659A Expired - Fee Related JP5018313B2 (en) | 2007-07-27 | 2007-07-27 | Information structuring apparatus, information structuring method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5018313B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014174465A (en) * | 2013-03-12 | 2014-09-22 | Ricoh Co Ltd | Information processor, information processing method and program |
JP2019016360A (en) * | 2018-07-26 | 2019-01-31 | 株式会社リコー | Information processing apparatus and information processing method, and program |
JP2019211846A (en) * | 2018-05-31 | 2019-12-12 | リンカーズ株式会社 | Technical information providing system |
CN111290677A (en) * | 2018-12-07 | 2020-06-16 | 中电长城(长沙)信息技术有限公司 | Self-service equipment navigation method and navigation system thereof |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0785071A (en) * | 1993-09-17 | 1995-03-31 | Nec Corp | Information extracting device |
JPH10283366A (en) * | 1997-04-09 | 1998-10-23 | Matsushita Electric Ind Co Ltd | Information classifying device |
JP2005135113A (en) * | 2003-10-29 | 2005-05-26 | Sony Corp | Electronic equipment, related word extracting method, and program |
-
2007
- 2007-07-27 JP JP2007196659A patent/JP5018313B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0785071A (en) * | 1993-09-17 | 1995-03-31 | Nec Corp | Information extracting device |
JPH10283366A (en) * | 1997-04-09 | 1998-10-23 | Matsushita Electric Ind Co Ltd | Information classifying device |
JP2005135113A (en) * | 2003-10-29 | 2005-05-26 | Sony Corp | Electronic equipment, related word extracting method, and program |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014174465A (en) * | 2013-03-12 | 2014-09-22 | Ricoh Co Ltd | Information processor, information processing method and program |
JP2019211846A (en) * | 2018-05-31 | 2019-12-12 | リンカーズ株式会社 | Technical information providing system |
JP2019016360A (en) * | 2018-07-26 | 2019-01-31 | 株式会社リコー | Information processing apparatus and information processing method, and program |
CN111290677A (en) * | 2018-12-07 | 2020-06-16 | 中电长城(长沙)信息技术有限公司 | Self-service equipment navigation method and navigation system thereof |
CN111290677B (en) * | 2018-12-07 | 2023-09-19 | 中电长城(长沙)信息技术有限公司 | Self-service equipment navigation method and navigation system thereof |
Also Published As
Publication number | Publication date |
---|---|
JP5018313B2 (en) | 2012-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7092315B2 (en) | Automated systems and methods for creating machine-generated ads | |
Li et al. | Discovering public sentiment in social media for predicting stock movement of publicly listed companies | |
Provost et al. | Data Science for Business: What you need to know about data mining and data-analytic thinking | |
O'Leary | Blog mining-review and extensions:“From each according to his opinion” | |
US20080097937A1 (en) | Distributed method for integrating data mining and text categorization techniques | |
JP5253519B2 (en) | Method, apparatus and storage medium for generating smart text | |
Wang et al. | Customer-driven product design selection using web based user-generated content | |
Lu et al. | Data science in the business environment: customer analytics case studies in SMEs | |
CN102402717A (en) | Data analysis facility and method | |
Sydow et al. | Diversity of editors and teams versus quality of cooperative work: experiments on Wikipedia | |
JP5018313B2 (en) | Information structuring apparatus, information structuring method, and program | |
Kadre et al. | Practical Business Analytics Using SAS: A Hands-on Guide | |
JP7065718B2 (en) | Judgment support device and judgment support method | |
Ha et al. | Job forecasting based on the patent information: a word embedding-based approach | |
Lin et al. | Converting consumer-generated content into an innovation resource: A user ideas processing framework in online user innovation communities | |
JP2009053983A (en) | Information structurization apparatus, information structurization method and program | |
JP2018142190A (en) | Decision assisting system and decision assisting method | |
Kayed et al. | Towards an ontology for software product quality attributes | |
Hazarika et al. | Are numeric ratings true representations of reviews? A study of inconsistency between reviews and ratings | |
JP2020201819A (en) | Business matching support device and business matching support method | |
KR102405503B1 (en) | Method for creating predictive market growth index using transaction data and social data, system for creating predictive market growth index using the same and computer program for the same | |
JP2009032119A (en) | Information structuring device, information structuring method, and program | |
Al-Obeidat et al. | A sentiment analysis approach of data volatility for consumer satisfaction in the fashion industry | |
Tekin et al. | Big data concept in small and medium enterprises: how big data effects productivity | |
Shikalgar et al. | Online Review Mining for forecasting sales |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100614 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120306 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120515 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120528 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |