JP2009032118A - Information structuring device, information structuring method, and program - Google Patents

Information structuring device, information structuring method, and program Download PDF

Info

Publication number
JP2009032118A
JP2009032118A JP2007196659A JP2007196659A JP2009032118A JP 2009032118 A JP2009032118 A JP 2009032118A JP 2007196659 A JP2007196659 A JP 2007196659A JP 2007196659 A JP2007196659 A JP 2007196659A JP 2009032118 A JP2009032118 A JP 2009032118A
Authority
JP
Japan
Prior art keywords
information source
information
product
unit
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007196659A
Other languages
Japanese (ja)
Other versions
JP5018313B2 (en
Inventor
Shigeaki Matsumoto
繁明 松元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007196659A priority Critical patent/JP5018313B2/en
Publication of JP2009032118A publication Critical patent/JP2009032118A/en
Application granted granted Critical
Publication of JP5018313B2 publication Critical patent/JP5018313B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information structuring device and an information structuring method and a program, for arranging enterprise information, product information and technical information by classifying and structuring applied information sources. <P>SOLUTION: This information structuring device 1 is provided with: an information source cutting part 100 for dividing information sources into indivisible elements in a grammar level; an information source reconstruction part 200 for forming an information source tree by combining the indivisible elements into a tree structure; and an information source discrimination part 300 for discriminating an adapted information source tree related with producer goods from an unadapted information source tree unrelated with producer goods by referring to a business domain dictionary in which business domains are registered. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、入力された情報源を所定の規則に従って構造化する情報構造化装置、情報構造化方法及びプログラムに関し、特に、例えば情報源としてウェブ情報を使用し製品企画支援を行なう情報構造化装置、情報構造化方法及びプログラムに関する。   The present invention relates to an information structuring apparatus, an information structuring method, and a program for structuring an input information source according to a predetermined rule, and more particularly, for example, an information structuring apparatus that supports product planning using web information as an information source. The present invention relates to an information structuring method and a program.

企業が新商品のための製品企画を行う際、従来から市場の動向、他社の保有技術、自社の保有技術などを考慮に入れて行なわれていた。具体的には、事業ドメインの市場が伸びるのかどうか、売れている製品はどのようなものか、又は他社になく自社にある技術を生かすにはどうすればよいのか、といった検討がなされているのが通例である。   When a company plans a product for a new product, it has traditionally taken into account market trends, technologies owned by other companies, and proprietary technologies. Specifically, it is usually considered whether the market of the business domain is growing, what products are selling, or how to make use of the technology in-house that does not exist in other companies. It is.

一般消費者が購入する商品(消費財)の製品企画であれば、一般消費者に対するアンケート方式のマーケティングによって製品の特性などを決定することが多かった。近年では、クチコミサイト、Q&Aコミュニティ、ソーシャルネットワーキングサービス(SNS)、ブログ、COI(Community Of Interest)サイト等インターネット等を活用して消費者が内容を生成していく消費者発信型メディア/消費者生成メディア(Consumer Generated Media:CGM)を利用して、口コミ情報を集める仕組みも試行されている。   In the case of product planning for products (consumer goods) purchased by general consumers, the characteristics of the products are often determined by questionnaire-type marketing for general consumers. In recent years, consumer-generated media / consumer generation in which consumers use the Internet, such as word-of-mouth sites, Q & A communities, social networking services (SNS), blogs, COI (Community Of Interest) sites, etc. An attempt is being made to collect word-of-mouth information using media (Consumer Generated Media: CGM).

一方、企業が購入する商品(生産財)の商品企画の場合は、顧客の声によるマーケティングが困難である。その理由として、生産財を購入するのは企業であり購入者の母集団が少ないこと、購入対象となる生産財の種類、購入数は購入企業の投資戦略に関わる情報であり、部分的にしか公開されないためである。   On the other hand, in the case of product planning of products (production goods) purchased by a company, it is difficult to perform marketing based on customer feedback. The reason for this is that companies purchase production goods and the purchaser population is small, the types of production goods to be purchased, and the number of purchases are information related to the investment strategy of the purchasing company. It is because it is not made public.

ところで、自然言語で記述された文章を解析し、予め与えられた分野の情報を抽出し、文章に含まれる単語間の関係を含む情報を一定の形式で出力する情報抽出システムが特許文献1に開示されている。この特許文献1に記載の技術においては、形態素解析部は入力文章を形態素単位に語切りした後、構文情報と抽出すべき情報の分野に関するキーワード情報を各形態素に割り当てる。構文解析規則格納部は構文情報を利用して入力文の構文解析を行なう規則を格納し、キーワード関係計算規則格納部はキーワード情報によって構文解析規則を制御しながらキーワード間関係を示す意味構造を生成する規則を格納し、文書情報抽出部は構文解析規則とキーワード間関係規則を用いて形態素解析部から出力された形態素列をキーワード中心に解析し、キーワードとキーワード間関係からなる意味を出力するものである。   By the way, Patent Document 1 discloses an information extraction system that analyzes a sentence described in a natural language, extracts information in a predetermined field, and outputs information including a relationship between words included in the sentence in a certain format. It is disclosed. In the technique described in Patent Document 1, the morpheme analysis unit divides an input sentence into morpheme units, and then assigns syntax information and keyword information related to the field of information to be extracted to each morpheme. The parsing rule storage unit stores rules for parsing input sentences using syntax information, and the keyword relation calculation rule storage unit generates semantic structures indicating keyword relationships while controlling parsing rules based on keyword information. The document information extraction unit analyzes the morpheme sequence output from the morpheme analysis unit using the parsing rules and the relationship rules between keywords, and outputs the meaning consisting of the keywords and the relationship between keywords. It is.

さらに、特許文献2には、例えば商品やサービスの販売促進のための広告配信を効果的に行なうこと等を目的とし、販売促進の対象となる顧客の母集団の中から、特定の商品やサービスを実際に購入する可能性が高いと考えられる潜在顧客を選別する顧客選別方法が開示されている。この特許文献2に記載の技術は、テキストを含むファイルを自動的に分類する情報分類装置であって、ファイル格納手段が出力するファイルのテキスト部分を形態素解析してファイルの識別子と共に出力する形態素解析手段と、ファイルを分類するためのキーワードを格納するキーワード格納手段と、キーワード格納手段の出力と形態素解析手段の出力とを入力として形態素解析の結果の中からキーワードを収集してファイルの識別子と共に出力するキーワード収集手段と、利用者が最近の分類結果と異なる分類結果を要求するための入力手段と、入力手段の出力とキーワード収集手段の出力とを入力としてファイルの識別子をキーワードで分類して出力する情報分類手段と、情報分類手段の出力とファイル格納手段の出力とを入力として情報分類手段が分類した結果を利用者に提供するものである。
特開平7−85071号公報 特開平10−283366号公報
Further, in Patent Document 2, for example, for the purpose of effectively distributing advertisements for sales promotion of products and services, a specific product or service is selected from a population of customers to be promoted. A customer screening method for screening potential customers who are considered highly likely to actually purchase the product is disclosed. The technology described in Patent Document 2 is an information classification device that automatically classifies a file containing text, and morphologically analyzes the text portion of the file output by the file storage means and outputs it together with the file identifier. A keyword storage means for storing a keyword for classifying a file, a keyword storage means, an output of the keyword storage means and an output of the morpheme analysis means, and collecting keywords from the result of the morpheme analysis and outputting them together with the file identifier Keyword collecting means, user input means for requesting a classification result different from the recent classification result, output of the input means and output of the keyword collecting means as input, and classifying the file identifiers by keyword Information classification means, information classification means output and file storage means output as inputs. And it provides a result of classification means classifies the user.
JP-A-7-85071 Japanese Patent Laid-Open No. 10-283366

しかしながら、上述の特許文献1に記載の技術おいては、キーワード辞書に基づき情報を抽出するものであり、特許文献2に記載の技術においては、キーワードにより入力情報を分類するものであるため、いずれにおいても、キーワードとして登録していない場合、情報を抽出することができない。よって、あるキーワードと同種のワードが含まれている場合であっても、そのワードがキーワードに一致しなければ抽出されないため、必要な情報が漏れてしまう可能性が大きい。また、新しい競合製品や、その特徴語を追加する場合、人手でメンテナンスしなければならず、管理が煩雑であるという問題点がある。   However, in the technique described in Patent Document 1 described above, information is extracted based on a keyword dictionary, and in the technique described in Patent Document 2, input information is classified based on keywords. However, if it is not registered as a keyword, information cannot be extracted. Therefore, even if a word of the same type as a certain keyword is included, if the word does not match the keyword, it is not extracted, so there is a high possibility that necessary information will be leaked. In addition, when adding a new competitive product or its feature word, there is a problem that maintenance must be performed manually, and management is complicated.

本発明は、このような問題点を解決するためになされたものであり、与えられた情報源から精度よく必要な情報を抽出し、分類することができる情報構造化装置、情報構造化方法及びプログラムを提供することを目的とする。   The present invention has been made to solve such problems, and an information structuring apparatus, an information structuring method, and an information structuring method that can accurately extract necessary information from a given information source and classify it. The purpose is to provide a program.

本発明に係る情報構造化装置は、情報源を分割して単語を生成する情報源裁断部と、予め定められた書式ルールに従って前記単語を分類する情報源再構築部と、事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別部と、技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成部とを有するものである。   In the information structuring apparatus according to the present invention, an information source cutting unit that divides an information source to generate a word, an information source reconstruction unit that classifies the word according to a predetermined format rule, and a business domain are registered. An information source selection section for selecting whether the information source is a conforming information source related to a production good or a non-conforming information source not related to a production good, and a technical term and its synonyms By referring to a technical dictionary in which the set is classified based on the superordinate concept and / or subordinate concept in the business domain, an information source having a high probability of producing goods is extracted from the non-conforming information sources, and is used as the conforming information source. A group generation unit.

また、本発明にかかる情報構造化方法は、上記の情報構造化処理を実行する方法であり、本発明にかかるプログラムは、上記の情報構造化処理をコンピュータに実行させるものである。   An information structuring method according to the present invention is a method for executing the above information structuring process, and a program according to the present invention causes a computer to execute the above information structuring process.

本発明によれば、与えられた情報源を分類し、構造化することで企業情報、製品情報、技術情報を整理することができる情報構造化装置、情報構造化方法及びプログラムを提供することができる。   According to the present invention, it is possible to provide an information structuring apparatus, an information structuring method, and a program capable of organizing company information, product information, and technical information by classifying and structuring given information sources. it can.

以下、本発明を適用した具体的な実施例について、図面を参照しながら詳細に説明する。本実施例にかかる情報構造化装置は、ウェブなどにおける企業情報、製品情報、技術情報を整理し、製品企画支援を行なうための装置であり、生産財メーカにとって優良顧客であるかどうかを、企業の投資欲から判定し、より購買力のある企業を発見する。また、他社への納入実績情報を商品に付加して提示することにより、信用ある他社が購入した生産財のみを選択することができ、購入者側の実績を元に商品比較をすることができる。さらに、ニュースという公開された情報から、新規顧客や新規部品納入業者を発見することにより、販路や部品供給の拡大を行うことができ、これによってボトルネックを解消することが可能となる。   Hereinafter, specific examples to which the present invention is applied will be described in detail with reference to the drawings. The information structuring apparatus according to the present embodiment is an apparatus for organizing corporate information, product information, and technical information on the web, etc., and providing product planning support. Judging from the desire to invest, discover companies with more purchasing power. In addition, it is possible to select only production goods purchased by a trusted other company by adding information on delivery results to other companies to the product and compare products based on the purchaser's performance. . Furthermore, by discovering new customers and new parts suppliers from published information such as news, it is possible to expand sales channels and parts supply, thereby eliminating bottlenecks.

ここで、本実施例においては、説明上、部品を製造している企業を部品納入企業、部品納入企業から部品が納入される企業を競合企業、競合企業が製品を納入する企業を顧客企業として説明する。そして、競合企業であるユーザが本システムを使用する場合を想定して説明を行なう。いうまでもなく、顧客企業間、部品納入企業間は互いに競合企業であるが、本実施例においては、部品納入企業、顧客企業ということとする。   Here, in this embodiment, for the sake of explanation, a company that manufactures parts is a parts delivery company, a company that delivers parts from a parts delivery company is a competitor, and a company that delivers products is a customer company. explain. A description will be given assuming that a user who is a competitor uses this system. Needless to say, the customer companies and the parts supplier companies are competitors, but in this embodiment, they are a parts supplier company and a customer company.

本発明の第1の実施例
図1は、本発明の第1の実施例にかかる情報構造化装置1を示す図である。図1に示すように、本実施例にかかる情報構造化装置1は、与えられた情報源を分類し、構造化するものであり、より具体的には、単文で表現されたニュースタイトルのような情報源を、分割・再構築ルールを用いて構造化し、過去の構造化済み情報源も用いて、企業情報、製品情報、技術情報を整理するものである。この情報構造化装置1は、情報源裁断部100、情報源再構築部200、情報源選別部300、及びグループ生成部400を有する。情報源裁断部100は、情報源の文字列を文法レベルの不可分要素に分割する。情報源再構築部200は、不可分要素を組み合わせて要素単語を生成する。情報源選別部300は、情報源の中から事業ドメインに合致するものを選別する。グループ生成部400は、技術的な視点から類似の情報源を選別する。以下に各ブロックについて詳細に説明する。
First Embodiment of the Invention FIG. 1 is a diagram showing an information structuring apparatus 1 according to a first embodiment of the present invention. As shown in FIG. 1, the information structuring apparatus 1 according to the present embodiment classifies and structures a given information source, and more specifically, as a news title expressed in a single sentence. Information sources are structured using division / reconstruction rules, and past structured information sources are used to organize company information, product information, and technical information. The information structuring apparatus 1 includes an information source cutting unit 100, an information source reconstruction unit 200, an information source selection unit 300, and a group generation unit 400. The information source cutting unit 100 divides the character string of the information source into inseparable elements at the grammar level. The information source reconstruction unit 200 generates element words by combining inseparable elements. The information source selection unit 300 selects information sources that match the business domain from the information sources. The group generation unit 400 selects similar information sources from a technical viewpoint. Each block will be described in detail below.

図2は、本実施例における情報源裁断部100を示すブロック図である。図2に示すように、情報源裁断部100は、情報源(タイトル)蓄積部101、形態素解析部102、及び形態素蓄積部103を有する。これらの手段はそれぞれ概略次のように動作する。   FIG. 2 is a block diagram showing the information source cutting unit 100 in this embodiment. As illustrated in FIG. 2, the information source cutting unit 100 includes an information source (title) storage unit 101, a morpheme analysis unit 102, and a morpheme storage unit 103. Each of these means generally operates as follows.

情報源蓄積部101は、情報源文字列を保持している。情報源文字列は、図3で示すように、日時及び文字列の情報からなる。この情報源文字列は「、」を複数有し、「。」を1つ有するような短文である。   The information source storage unit 101 holds an information source character string. As shown in FIG. 3, the information source character string includes date and time and character string information. This information source character string is a short sentence having a plurality of “,” and one “.”.

形態素解析部102は、情報源である例えばタイトル文字列"日本電気、光アクセス製品「DW4000」を発売"のような1文で表現された文字列を、形態素(Morpheme)("日本電気","、","光","アクセス","製品","「","DW","4000","」","を","発売")に分割し、形態素解析を行う。形態素とはこれ以上に細かくすると意味がなくなってしまう最小の文字列をいう。形態素解析とは、対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)を使用し、自然言語で書かれた文を形態素の列に分割(分節処理(分かち書き))し、それぞれの品詞を判別する作業を指す。形態素解析された結果は、例えば、図4に示すように、単語、品詞、補助、読みからなるデータ形式で形態素蓄積部103に格納される。   The morpheme analyzing unit 102 converts a character string expressed in one sentence such as a title character string “NEC, optical access product“ DW4000 ”to be released”, which is an information source, into a morpheme (“NEC”, ",", "Light", "access", "product", "" "," DW "," 4000 "," "" "," "," released ") and morpheme analysis. Is the smallest character string that is meaningless if it is made finer than this.The morphological analysis means knowledge of the target language grammar (gathering of grammar rules) and dictionary (word list with information such as parts of speech). Used to divide a sentence written in natural language into morpheme strings (segment processing (split writing)) and identify each part of speech.The result of morpheme analysis is, for example, as shown in FIG. , Stored in the morpheme storage unit 103 in a data format consisting of words, parts of speech, assistance, and reading It is.

図5は、本実施例における情報源再構築部200を示す図である。図5に示すように、情報源再構築部200は、書式解析部201、書式ルール蓄積部202、要素単語格納部203、及び情報源メタ情報格納部206を有する。これらの手段はそれぞれ概略次のように動作する。   FIG. 5 is a diagram illustrating the information source reconstruction unit 200 in the present embodiment. As illustrated in FIG. 5, the information source reconstruction unit 200 includes a format analysis unit 201, a format rule storage unit 202, an element word storage unit 203, and an information source meta information storage unit 206. Each of these means generally operates as follows.

書式解析部201には、形態素蓄積部103から、情報源を形態素に分断された品詞集合が入力される。この品詞集合において連続した名詞を結合する。上述の例では、例えば"光"、"アクセス"、"製品"を連結して"光アクセス製品"とする。その後、書式ルール蓄積部202を参照して、情報源特有の表現にマッチするルール集合を取り出し、主体者、行動、製品名、特徴語などのキーワードを抽出することで、形態素集合から、製品名・主体者・行動・特徴語・シノニム(要素単語)を生成し、要素単語格納部203に格納する。要素単語格納部203に格納された要素単語は情報源毎に情報源メタ情報格納部206に格納される。
下記の書式ルールに従うと、
主体者:日本電気
製品名:DW4000
行動:発売
特徴語:光アクセス製品
という要素単語を生成する。
The format analysis unit 201 receives the part of speech set obtained by dividing the information source into morphemes from the morpheme storage unit 103. Consecutive nouns are combined in this part-of-speech set. In the above example, for example, “optical”, “access”, and “product” are connected to form an “optical access product”. Thereafter, by referring to the format rule storage unit 202, a rule set that matches the expression specific to the information source is extracted, and keywords such as the subject, action, product name, and feature word are extracted, and the product name is extracted from the morpheme set. A subject, action, feature word, and synonym (element word) are generated and stored in the element word storage unit 203. The element words stored in the element word storage unit 203 are stored in the information source meta information storage unit 206 for each information source.
If you follow the formatting rules below,
Subject: NEC Product Name: DW4000
Action: Release feature word: Generate element word of Hikari Access product.

書式ルール蓄積部202に格納されているルールは下記のようなものがある。
1)製品/派生製品抽出ルール
(ア)かぎ括弧「」で囲まれている連続名詞を製品名として抽出する
(イ)英字+数字があれば、製品型番として抽出する
(ウ)マーク(R)の前にくる連続名詞を商標名として抽出する
(エ)過去に抽出された製品名との差分をとり、差分部分を派生製品名として抽出する
(オ)該当するものがなければ、製品名なしと判定し、抽出されない
The rules stored in the format rule storage unit 202 are as follows.
1) Product / derived product extraction rules (a) Extract consecutive nouns enclosed in angle brackets “” as product names (a) If there are English letters + numbers, extract them as product model numbers (c) Mark (R) Extract the continuous nouns that come before the product name as the trade name (d) Take the difference from the product name extracted in the past, and extract the difference part as the derived product name (e) If there is no corresponding, there is no product name Is not extracted

2)主体者抽出ルール
(ア)行頭から句点(、)までの範囲に、名詞しか出現しなかった場合には、最長一致の名詞を企業名とする
(イ)格助詞(「が」、「は」)の前にくる最長一致の名詞を企業名とする
(ウ)(株)、(有)の直後に来る最長一致の名詞を企業名とする
(エ)該当するものがなければ、情報源発信元サイトのURLから企業名を抜き出す
2) Subject extraction rule (a) When only nouns appear in the range from the beginning of a line to a punctuation point (,), the noun with the longest match is the company name. (A) Case particles ("GA", " The name of the longest matching noun that comes before “)” is the company name (C) Co., Ltd., and the longest matching noun that comes immediately after (Yes) is the company name. Extract company name from source URL

3)行動抽出ルール
(ア)行末のサ変名詞を、企業の行動とする
(イ)最後に出現する動詞を企業の行動とする
(ウ)該当するものがなければ、発表という行動を抽出する
3) Action extraction rules (a) The last variable noun is a company action (b) The last appearing verb is a company action (c) If there is no such thing, the action of announcement is extracted

4)行動対象ルール
(ア)行動が「納入」の場合は、助詞「へ」「に」の前にくる名詞を納入先企業とする
(イ)行動が「採用」の場合は、主体者として抽出された企業を納入先企業とする。
(ウ)該当するものがなければ、行動対象なしと判定し、抽出されない
4) Action target rule (a) When the action is “delivery”, the noun that comes before the particles “he” and “ni” is the delivery company. (B) When the action is “recruitment”, The extracted company is the delivery company.
(C) If there is no applicable item, it is determined that there is no action target and is not extracted.

5)シノニム抽出ルール
(ア)括弧「(」の前後にくる連続名詞1組を、キーワードとそのシノニムとして抽出する。
(イ)該当するものがなければ、シノニムなしと判定し、抽出されない
5) Synonym extraction rule (a) A set of consecutive nouns before and after the parenthesis “(” is extracted as a keyword and its synonym.
(B) If there is no applicable one, it is determined that there is no synonym and is not extracted.

6)特徴語抽出ルール
(ア)他のルール集合で漏れた連続名詞を、特徴語として抽出する。
6) Feature word extraction rule (a) A continuous noun leaked in another rule set is extracted as a feature word.

図6は、本実施例における情報源選別部300を示すブロック図である。図6に示すように、情報源選別部300は、情報源選別部301、ドメイン辞書格納部302、適合情報源格納部303、及び非適合情報源格納部304を有する。これらの手段はそれぞれ概略次のように動作する。   FIG. 6 is a block diagram showing the information source selection unit 300 in this embodiment. As illustrated in FIG. 6, the information source selection unit 300 includes an information source selection unit 301, a domain dictionary storage unit 302, a compatible information source storage unit 303, and a non-conforming information source storage unit 304. Each of these means generally operates as follows.

情報源選別部301は、ドメイン辞書格納部302のドメイン辞書を参照し、事業ドメインに適合する情報源のみを適合情報源として選択する。具体的には、先ず、情報源の中に例えば"納入"、"採用"といった行動を含む言葉があれば、生産財に関する情報源であると判定する。   The information source selection unit 301 refers to the domain dictionary in the domain dictionary storage unit 302 and selects only information sources that match the business domain as matching information sources. Specifically, first, if there are words including actions such as “delivery” and “adoption” in the information source, it is determined that the information source is related to the production goods.

次に情報源選別部301は、ドメイン辞書を参照し、生産財に関する情報源と判定された情報源を構成する要素単語、すなわち主体者、製品名、行動、特徴語、及びシノニムと、ドメイン辞書格納部302に格納されている事業ドメイン専門の企業名、製品名、及び特徴語とを比較する。図7は、ドメイン辞書の構造を示す図、図8は、ドメイン辞書の一例を示す図である。ドメイン辞書には、主体者、製品名、特徴語などのカテゴリ別に、語句1列、語句2列、・・・と複数の語句列が登録されている。   Next, the information source selection unit 301 refers to the domain dictionary, and element words constituting the information source determined as the information source related to the production goods, that is, the subject, the product name, the action, the feature word, the synonym, and the domain dictionary The business domain specialized company name, product name, and feature word stored in the storage unit 302 are compared. FIG. 7 is a diagram showing the structure of the domain dictionary, and FIG. 8 is a diagram showing an example of the domain dictionary. In the domain dictionary, a plurality of word strings, such as a word / phrase column, a word / phrase two column,..., Are registered for each category such as a subject, a product name, and a feature word.

そして、情報源選別部301は、生産財に関する情報源と判定された情報源の各要素単語とドメイン辞書の単語を比較して、マッチするものが1つ以上合った場合に、その情報源は事業ドメインに合致した生産財と判定し、適合情報源格納部303に格納し、マッチするものがない場合には、非適合情報源格納部304に格納する。そして、適合情報原格納部303に格納した情報源を構成する"製品名"、"特徴語"、及び"シノニム"のうち、ドメイン辞書に登録がないものをドメイン辞書格納部302のドメイン辞書へ登録する。情報源を構成する"主体者"は、事業ドメインにおける専門業者と総合メーカを区別するため、情報源の各要素単語がドメイン辞書と適合又は非適合する個数を毎回測定する。同一主体者の情報源に関して、情報源の総数に対し、所定の割合th1(0<th1<1)以上の数の情報源が適合情報源であれば、専門業者として当該情報源の主体者をドメイン辞書の主体者カテゴリに登録し、所定の割合未満である場合は総合メーカとして主体者カテゴリに登録する。   Then, the information source selection unit 301 compares each element word of the information source determined to be an information source related to the production goods and a word in the domain dictionary, and if one or more matches are found, the information source is It is determined as a production good that matches the business domain, and is stored in the conforming information source storage unit 303. If there is no match, it is stored in the nonconforming information source storage unit 304. Then, among the “product name”, “feature word”, and “synonym” constituting the information source stored in the conformity information original storage unit 303, those not registered in the domain dictionary are stored in the domain dictionary of the domain dictionary storage unit 302. sign up. The “subject” that constitutes the information source measures the number of times each element word of the information source matches or does not match the domain dictionary in order to distinguish the specialist from the general manufacturer in the business domain. Regarding information sources of the same subject, if the number of information sources equal to or greater than a predetermined ratio th1 (0 <th1 <1) with respect to the total number of information sources is a conforming information source, the subject of the information source is designated as a specialist. If it is registered in the subject category of the domain dictionary and less than a predetermined ratio, it is registered in the subject category as a general manufacturer.

図9は、本実施例におけるグループ生成部400を示すブロック図である。図9に示すように、グループ生成部400は、情報源増殖部401、及び技術辞書格納部402を有する。これらの手段はそれぞれ概略次のように動作する。   FIG. 9 is a block diagram illustrating the group generation unit 400 in the present embodiment. As illustrated in FIG. 9, the group generation unit 400 includes an information source multiplication unit 401 and a technical dictionary storage unit 402. Each of these means generally operates as follows.

情報源増殖部401は、事業ドメインの生産財と判定されなかった情報源を非適合情報源格納部304から取得し、技術辞書格納部402の技術辞書を参照して事業ドメインに合致するものがないか検査することで、非適合情報源を適合情報源に昇格させる。   The information source multiplication unit 401 obtains an information source that has not been determined as a business domain production good from the non-conforming information source storage unit 304, refers to the technical dictionary in the technical dictionary storage unit 402, and matches the business domain. Inspecting for non-conforming information sources is promoted to conforming information sources.

技術辞書は、技術用語とシノニムの集合を、その事業ドメインにおける上位概念・下位概念に基づき分類したものである。例えば、図10は製品構成をベースにした技術辞書である。この技術辞書では、生産財を生産するためのモジュール構成を元に、パーツに関する技術用語を最下位のノードに、パーツ集合から構成されるモジュール部分をその上位に、モジュールから構成される製品を最上位のノードに、といった階層構造を定義している。すなわち、最下位には、"光増幅"、"光アクセス"、"OC−12"、"SRM−16"が定義され、その上位に"DWDM"、"SONET/SDH"が定義され、最上位には、"光伝送装置"が定義されている。また、それぞれのノード間の距離も技術辞書作成時に設定する。図11は、技術辞書の構造を示す図である。同時に利用される用語同士は距離が短く、同時に利用されない用語は距離を長く置くように設定する。例えば"光増幅"と"光アクセス"との距離は0.6であり、"光増幅"と"SONET/SDH"の距離は2.3である。生産財にも様々なドメインがあるため、分析対象の事業ドメインに合致するものをあらかじめ準備しておく。   The technical dictionary is a set of technical terms and synonyms classified based on the superordinate concepts and subordinate concepts in the business domain. For example, FIG. 10 is a technical dictionary based on the product configuration. In this technical dictionary, based on the module configuration for producing production goods, the technical terms related to parts are at the lowest node, the module part composed of parts is placed at the top, and the product composed of modules is the top. A hierarchical structure such as a higher node is defined. That is, “optical amplification”, “optical access”, “OC-12”, and “SRM-16” are defined at the bottom, and “DWDM” and “SONET / SDH” are defined at the top. Defines an “optical transmission device”. The distance between each node is also set when creating the technical dictionary. FIG. 11 is a diagram showing the structure of the technical dictionary. Terms that are used at the same time are set to have a short distance, and terms that are not used at the same time are set to have a long distance. For example, the distance between “optical amplification” and “optical access” is 0.6, and the distance between “optical amplification” and “SONET / SDH” is 2.3. Since production goods also have various domains, prepare items that match the business domain to be analyzed in advance.

なお、技術辞書のノード及びノード間の距離は図8、後述する図35に示す事業ドメインにあわせて自由に定義してよい。   The nodes of the technical dictionary and the distance between the nodes may be freely defined in accordance with the business domain shown in FIG. 8 and FIG. 35 described later.

この技術辞書を使用することで、あるキーワードと同種のワードが含まれている場合であって、そのワードがキーワードに一致しない場合であっても、適合情報源とすることができる。よって、必要な情報が漏れてしまったりする可能性を低減し、新しい競合製品や、その特徴語を容易に追加することができる。   By using this technical dictionary, even if a word of the same type as a certain keyword is included and the word does not match the keyword, it can be used as a compatible information source. Therefore, it is possible to reduce the possibility that necessary information is leaked, and to easily add new competitive products and their characteristic words.

なお、本実施の形態においては技術辞書として説明するが、単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した単語辞書であればよい。例えば、生鮮食品業界の企業ニュースを取り扱う場合、技術辞書は、"食品"が最上位ノード、その下位ノードに"肉"、"魚"、更に"肉"の下位ノードに"豚肉"、"牛肉"、"鶏肉"などのノードを有するツリー辞書とすることも可能である。   In the present embodiment, a technical dictionary will be described. However, any word dictionary in which a set of words and synonyms thereof is classified based on a higher concept and / or a lower concept in the business domain may be used. For example, when dealing with company news in the fresh food industry, the technical dictionary has a “food” at the top node, “meat” and “fish” at its lower nodes, and “pork” and “beef” at its lower nodes. It is also possible to make a tree dictionary having nodes such as “,“ chicken ”.

先ず、事業ドメインに合致する生産財商品の特徴語をドメイン辞書格納部302のドメイン辞書から取得し、非適合情報源の特徴語と比較して、類似度を計算する。類似度は、上記技術辞書に基づき計算し、非適合情報源と技術辞書との距離が所定の閾値以下であれば非適合情報源を事業ドメインの生産財に関する情報と判定し、適合情報源として適合情報源格納部303に格納する。すなわち、非適合情報源から、事業ドメインに適合する蓋然性が高いものを抽出し、適合情報源格納部303へ再登録する。そして、このとき、適合情報源に昇格した非適合情報源を構成する要素単語のうち、技術辞書に登録されていない単語を技術辞書に登録することで技術辞書を増殖する。さらに、ドメイン辞書格納部302に登録されていない特徴語や製品名は、新たにドメイン辞書格納部302に追記することでドメイン辞書を増殖する。   First, the feature words of the product goods that match the business domain are acquired from the domain dictionary in the domain dictionary storage unit 302, and compared with the feature words of the non-conforming information source to calculate the similarity. The similarity is calculated based on the above technical dictionary, and if the distance between the non-conforming information source and the technical dictionary is equal to or less than a predetermined threshold, the non-conforming information source is determined to be information related to the production goods in the business domain and is used as the conforming information source. The information is stored in the compatible information source storage unit 303. That is, a non-conforming information source that has a high probability of conforming to the business domain is extracted and re-registered in the conforming information source storage unit 303. At this time, among the element words constituting the non-conforming information source promoted to the conforming information source, the technical dictionary is expanded by registering the word not registered in the technical dictionary in the technical dictionary. In addition, feature words and product names that are not registered in the domain dictionary storage unit 302 are newly added to the domain dictionary storage unit 302 to multiply the domain dictionary.

この情報源増殖部401により、ドメイン辞書を用いて非適合と判定された非適合情報源を、技術辞書を用いて適合情報源に昇格させることができる。また、情報源増殖部401は、既存のドメイン辞書や技術辞書を参照し、新たに適合情報源として適合情報源格納部303に加えられた情報源に含まれる主体者や特徴語が既存のドメイン辞書や技術辞書に登録されているか判定する。もし登録されていなければ、新たにドメイン辞書や技術辞書に登録することで、ドメイン辞書や技術辞書にない単語を、ドメインに適合している情報源に含まれる要素単語を用いて増殖させることができる。   The information source multiplication unit 401 can promote a non-conforming information source determined to be non-conforming using the domain dictionary to a conforming information source using the technical dictionary. Further, the information source multiplication unit 401 refers to an existing domain dictionary or technical dictionary, and a subject or a feature word included in the information source newly added to the matching information source storage unit 303 as a matching information source is an existing domain. Determine whether it is registered in a dictionary or technical dictionary. If it is not registered, newly registering it in the domain dictionary or technical dictionary can proliferate words that are not in the domain dictionary or technical dictionary using the element words included in the information source that matches the domain. it can.

従来、生産財の製品企画を行うためにも、競合他社製品のベンチマーク、技術動向、市場動向などを収集する必要がある。このため、従来であれば例えばコンサルタントと共同で社外の外部環境調査を行う必要があった。また、製品企画に役立つ情報源として、インターネット上に散在しているホームページ、営業担当者が保持しているヒアリング情報、雑誌記事などを、漏れなく収集し纏めあげる作業は労力を要する。継続的に人が行う作業であるため、調査する人の力量に大きく依存し、客観的な情報に基づいて製品企画を行うことが困難であった。このため、生産財の製品企画においては、競合他社の新製品がリリースされたが、横並びの製品であるように見えてしまい、どのような差異化要因があるのか、分かりづらいという課題があった。   Conventionally, it is necessary to collect benchmarks, technology trends, market trends, etc. of competitor products in order to plan product for production goods. For this reason, conventionally, for example, it has been necessary to conduct an external external environmental survey in cooperation with a consultant. Moreover, as an information source useful for product planning, it is laborious to collect and collect homepages scattered on the Internet, interview information held by sales representatives, magazine articles, etc. without omission. Since it is a work that is continuously performed by a person, it depends heavily on the ability of the investigator and it is difficult to plan a product based on objective information. For this reason, in product planning for production goods, new products from competitors were released, but they seemed to be side-by-side products, and there was a problem that it was difficult to understand what differentiating factors were .

このような課題に対し、本実施例にかかる情報構造化装置1によれば、情報源から特徴語などの要素単語が抽出できるため、競合他社の新製品がどのような差異化要因を保持しているのか分かりやすくなるため、上記課題を解決することができる。また、情報源を、事業ドメイン辞書を参照するのみならず、非適合情報源と判断された情報源も技術辞書を参照することで、適合情報源に昇格させることができ、情報源から漏れなく必要な情報源を抽出することができる。   In response to such a problem, the information structuring apparatus 1 according to the present embodiment can extract element words such as feature words from the information source, so what differentiating factors are retained by the new products of competitors. The above problem can be solved. In addition to referring to the business domain dictionary for information sources, information sources that are judged to be non-conforming information sources can be promoted to conforming information sources by referring to the technical dictionary, and there is no leakage from the information sources. Necessary information sources can be extracted.

次に、本実施例の動作について説明する。図12は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。本実施例は、未知の競合商品が市場にリリースされたことを検出する例である。前提として、"DW4000"は事業ドメインに合致した製品であることを、ドメイン辞書格納部302のドメイン辞書の「製品名」行、「語句1」列に登録しておく。(図8参照)   Next, the operation of this embodiment will be described. FIG. 12 is a flowchart illustrating the operation of the information structuring apparatus according to the present embodiment. This example is an example of detecting that an unknown competitive product has been released to the market. As a premise, “DW4000” is registered in the “product name” row and “word / phrase 1” column of the domain dictionary of the domain dictionary storage unit 302 so as to match the business domain. (See Figure 8)

情報源として、例えば
"日本電気、光アクセス製品「DW4000」を発売"
という文字列がシステムに入力された場合について説明する。情報源裁断部100の形態素解析部102は、当該情報源の形態素解析を行い、この情報源を形態素へ分解することで、図13に示す形態素を得る。(ステップS100)。この形態素は、形態素蓄積部103に格納される。
As an information source, for example
"NEC releases optical access product" DW4000 ""
A case where the character string "" is input to the system will be described. The morpheme analysis unit 102 of the information source cutting unit 100 performs morpheme analysis of the information source, and decomposes the information source into morphemes to obtain the morpheme shown in FIG. (Step S100). This morpheme is stored in the morpheme storage unit 103.

書式解析部201は、形態素蓄積部103に格納された形態素集合に連続した名詞が出現する場合、これらを結合する。(ステップS200)。図14は、形態素の連結後を示す図である。次に、結合された連続名詞が、主体者なのか、製品名なのか、行動なのか、特徴語なのか判定するために、書式解析ルールを適用する(ステップS300)。   When the continuous noun appears in the morpheme set stored in the morpheme storage unit 103, the format analysis unit 201 combines them. (Step S200). FIG. 14 is a diagram showing the connected morphemes. Next, a format analysis rule is applied to determine whether the combined continuous noun is a subject, a product name, an action, or a feature word (step S300).

次に、書式解析ルール適用方法について説明する。書式解析部201は、形態素集合の連続名詞を結合し、形態素又は連続名詞から、書式ルールに従って、主体者、製品名、行動、特徴語、シノニムを抽出する。   Next, the format analysis rule application method will be described. The format analysis unit 201 combines the continuous nouns of the morpheme set, and extracts the subject, the product name, the action, the feature word, and the synonym from the morpheme or the continuous noun according to the format rule.

先ず、製品名抽出方法について説明する。図15は、製品名抽出方法を示すフローチャートである。製品名を抽出する場合には、図15に示すように、順序付けされた形態素集合から、鍵括弧が存在するか判定し(ステップS301)、もし鍵括弧があればその鍵括弧内の形態素配列を抽出する(ステップS302)。そして、鍵括弧内の形態素配列に名詞又は記号のみが存在するか否か判定し(ステップS303)、英数字が連続しているものがあれば(ステップS304)、英字と数字の連続した名詞を結合する(ステップS305)。さらに、この鍵括弧内の形態素配列の中に商標記号が存在するか否かを判定し(ステップS306)、存在すれば商標記号を削除すると共に、商標記号前の名詞を商品名として製品名に登録し、商標記号後の名詞を特徴語して採用する(ステップS307)。以上により抽出された製品名が過去に製品名として登録されているかどうか判定し、(ステップS308)、製品名が過去に登録されており、括弧内に商標で分断された名詞が存在すれば、それを派生商品修飾語として要素単語格納部203の特徴語に登録し(ステップS309)、商品名が過去に登録されていなければ新製品名として要素単語格納部203の製品名に登録し(ステップS310)、製品名抽出フローを終了する。   First, the product name extraction method will be described. FIG. 15 is a flowchart showing a product name extraction method. When extracting the product name, as shown in FIG. 15, it is determined from the ordered morpheme set whether or not there is a key bracket (step S301). If there is a key bracket, the morpheme array in the key bracket is determined. Extract (step S302). Then, it is determined whether or not only nouns or symbols are present in the morpheme array in the brackets (step S303), and if there are consecutive alphanumeric characters (step S304), a noun in which letters and numbers are consecutive is determined. Combine (step S305). Further, it is determined whether or not a trademark symbol exists in the morpheme array in the brackets (step S306). If it exists, the trademark symbol is deleted, and the noun before the trademark symbol is used as the product name in the product name. The noun after the trademark symbol is registered and adopted as a feature word (step S307). It is determined whether or not the product name extracted in the above has been registered as a product name in the past (step S308), and if the product name has been registered in the past and there is a noun separated by a trademark in parentheses, It is registered in the feature word of the element word storage unit 203 as a derived product modifier (step S309), and if the product name has not been registered in the past, it is registered in the product name of the element word storage unit 203 as a new product name (step S309). S310), the product name extraction flow is terminated.

図16は、主体者抽出方法を示すフローチャートである。図16に示すように、順序付けされた形態素集合において、行頭から句点まで名詞のみ存在するか否かを判定する(ステップS311)。名詞のみ存在する場合は、主体者として抽出する(ステップS312)。   FIG. 16 is a flowchart showing the subject extraction method. As shown in FIG. 16, in the ordered morpheme set, it is determined whether or not only the noun exists from the beginning of the line to the punctuation point (step S311). If only the noun exists, it is extracted as the subject (step S312).

一方、行頭から句点まで名詞のみではない場合、(株)、(有)の記号が存在するか否かを判定する(ステップS313)。存在する場合は、当該記号の前後名詞を主体者として抽出する(ステップS314)。また、(株)、(有)の記号が存在しない場合は、"が"又は"は"が存在するか否かを判定する(ステップS315)。存在する場合は、助詞の前の名詞を主体者として抽出する。さらに、"が"又は"は"も存在しない場合は、発信元を主体者とする(ステップS317)。抽出した主体者は、要素単語格納部203に記録する。   On the other hand, if it is not only a noun from the beginning of a line to a punctuation point, it is determined whether or not (stock) and (present) symbols exist (step S313). If it exists, the noun before and after the symbol is extracted as the subject (step S314). If the symbols “stock” and “present” do not exist, it is determined whether “has” or “has” exists (step S315). If it exists, the noun before the particle is extracted as the subject. Further, when neither “ga” nor “ha” exists, the sender is set as the subject (step S317). The extracted subject is recorded in the element word storage unit 203.

図17は、行動抽出方法を示すフローチャートである。図17に示すように、順序付けされた形態素集合において、行末にサ変名詞があるか否かを判定する(ステップS321)。ある場合は、サ変名詞を含む連続名詞を行動として抽出する(ステップS322)。サ変名詞がない場合は、動詞が存在するか否かを判定する(ステップS323)。動詞が存在する場合は、最後に出現する動詞を行動として抽出する(ステップS324)。動詞が存在しない場合は、"発表"という行動を図5に示す要素単語格納部203の行動に追加する(ステップS325)   FIG. 17 is a flowchart showing the behavior extraction method. As shown in FIG. 17, in the ordered morpheme set, it is determined whether or not there is a saun noun at the end of the line (step S321). If there is, a continuous noun including a sa strange noun is extracted as an action (step S322). If there is no sa variable noun, it is determined whether or not a verb is present (step S323). If a verb exists, the last appearing verb is extracted as an action (step S324). If the verb does not exist, the action “announcement” is added to the action of the element word storage unit 203 shown in FIG. 5 (step S325).

図18は、行動対象抽出方法を示すフローチャートである。図18に示すように、順序付けされた形態素集合において、行動が"納入"か否かが判断される(ステップS331)。なお、行動対象抽出処理は、行動抽出処理の後に実施される。抽出された行動が"納入"であれば、助詞"へ"、"に"の前の最長一致の名詞を行動対象として抽出する(ステップS332)。行動が"納入"でない場合、"採用"か否かを判断する(ステップS333)。"採用"である場合は、主体者の企業を行動対象として抽出する(ステップS334)。抽出した行動は、要素単語格納部203に記録する。一方、行動が"採用"でもない場合は、処理を終了する(ステップS335)。   FIG. 18 is a flowchart showing the action target extraction method. As shown in FIG. 18, it is determined whether or not the action is “delivery” in the ordered morpheme set (step S331). The action target extraction process is performed after the action extraction process. If the extracted action is “delivery”, the longest matching noun before “to” and “to” is extracted as an action target (step S332). If the action is not “delivery”, it is determined whether or not it is “adoption” (step S333). If “adopted”, the company of the subject is extracted as an action target (step S334). The extracted action is recorded in the element word storage unit 203. On the other hand, if the action is not “adopt”, the process is terminated (step S335).

図19は、シノニム抽出方法を示すフローチャートである。図19に示すように、順序付けされた形態素集合において、括弧が存在するか否かを判断し(ステップS341)、括弧が存在する場合は、右括弧の前後にくる連続名詞1組を語源とそのシノニムとし、これを抽出する(ステップS342)。抽出した語源及びそのシノニムは、要素単語格納部203に記録する。一方、括弧が存在しない場合は、シノニムなしを要素単語格納部203に記録する(ステップS343)。   FIG. 19 is a flowchart showing a synonym extraction method. As shown in FIG. 19, it is determined whether or not parentheses are present in the ordered morpheme set (step S341). If parentheses are present, a set of consecutive nouns that precede and follow the right parenthesis A synonym is extracted (step S342). The extracted word source and its synonym are recorded in the element word storage unit 203. On the other hand, when there is no parenthesis, no synonym is recorded in the element word storage unit 203 (step S343).

図20は、特徴語抽出方法を示すフローチャートである。図20に示すように、順序付けされた形態素集合において、他のルールを適用して分類不能な名詞があるか否かを判断する(ステップS351)。ある場合は、その名詞を特徴語として抽出し(ステップS352)、要素単語格納部203に記録する。   FIG. 20 is a flowchart showing the feature word extraction method. As shown in FIG. 20, it is determined whether there is a noun that cannot be classified by applying another rule in the ordered morpheme set (step S351). If there is, the noun is extracted as a feature word (step S352) and recorded in the element word storage unit 203.

以上のように、図15に示す製品名抽出工程、図16で示す主体者抽出工程、図17で示す行動抽出工程、図18で示す行動対象抽出工程、図19で示すシノニム抽出工程、図20で示す特徴語抽出工程を経て、図21に示すような解析結果を得る(ステップS300)。すなわち、"日本電気、光アクセス製品「DW4000」を発売"という情報源から、
主体者:日本電気
製品名:DW4000
行動:発売
特徴語:光アクセス製品
という解析結果が得られる。
As described above, the product name extracting step shown in FIG. 15, the subject extracting step shown in FIG. 16, the action extracting step shown in FIG. 17, the action target extracting step shown in FIG. 18, the synonym extracting step shown in FIG. Through the feature word extraction process indicated by (2), an analysis result as shown in FIG. 21 is obtained (step S300). In other words, from the information source “NEC releases optical access product“ DW4000 ””
Subject: NEC Product Name: DW4000
Action: Launch Feature word: The result of the analysis is an optical access product.

次に、情報源選別部301が、ドメイン辞書を参照し、情報源から適合情報源を選別する方法について具体的に説明する。情報源(ニュース情報源)として、
"オプト販売が光増幅をラマン方式とする「FX4200」をNEEへ納入"
という文字列が情報構造化装置1へ入力されるとする。情報構造化装置1は、上述と同様に、図12のステップS100からステップS300まで実行し、図22に示す書式解析結果を得る。
Next, a method in which the information source selection unit 301 selects a compatible information source from the information sources with reference to the domain dictionary will be specifically described. As an information source (news information source)
"Opto Sales Deliver" FX4200 "with Raman Method for Optical Amplification to NEE"
Is input to the information structuring apparatus 1. The information structuring apparatus 1 executes steps S100 to S300 in FIG. 12 and obtains the format analysis result shown in FIG.

図23は、適合情報源選別方法を示すフローチャートである。情報源選別部301が情報源を構成する要素単語と事業ドメイン辞書とを照合する。すなわち、図23に示すように、情報源選別部301は、情報源から、行動ノードに"納入"、"採用"が含まれているか否かを検出する(ステップS401)。"納入"、"採用"が含まれており、生産財に関する情報源と判断された情報源を構成する単語と、ドメイン辞書の各カテゴリの単語とをマッチングする(ステップS402)。そして、1つ以上、一部又は全部一致するものが存在するか否かを判定し(ステップS403)、情報源を適合情報源として登録する(ステップS404)。   FIG. 23 is a flowchart showing a compatible information source selection method. The information source selection unit 301 collates the element words constituting the information source with the business domain dictionary. That is, as shown in FIG. 23, the information source selection unit 301 detects whether or not “delivery” and “adoption” are included in the action node from the information source (step S401). “Delivery” and “recruitment” are included, and the words constituting the information source determined to be the information source related to the production goods are matched with the words of each category in the domain dictionary (step S402). Then, it is determined whether or not one or more, a part or all of them are identical (step S403), and the information source is registered as a compatible information source (step S404).

次に、情報源を構成する製品名・特徴語などであって、ドメイン情報に登録がないものはドメイン辞書へ追加する(ステップS405)。次いで、適合回数が所定の割合以上であるか否かが判定され(ステップS406)、所定の条件に合致する場合には、情報源の主体者をドメイン辞書へ追加する(ステップS407)。これにより、情報源を構成する"主体者"が、事業ドメインにおける専門業者か、又は総合メーカかを区別することができる。本例においては、図22に示す情報源を構成する要素単語と図8に示す事業ドメイン辞書とは部分一致もしないため、この事業ドメイン選別工程S400では、入力された情報源が事業ドメインに合致しないと判定される。合致しない場合は、非適当情報源格納部304に当該情報源を格納する。   Next, product names / characteristics constituting the information source that are not registered in the domain information are added to the domain dictionary (step S405). Next, it is determined whether or not the number of adaptations is equal to or greater than a predetermined ratio (step S406). If the predetermined number of conditions is met, the information source subject is added to the domain dictionary (step S407). Thereby, it is possible to distinguish whether the “subject” constituting the information source is a specialist in the business domain or a general manufacturer. In this example, the element words constituting the information source shown in FIG. 22 and the business domain dictionary shown in FIG. 8 do not partially match. Therefore, in this business domain selection step S400, the input information source matches the business domain. It is determined not to. If they do not match, the information source is stored in the unsuitable information source storage unit 304.

次に、情報源増殖部401が技術辞書を参照して、非適合情報源格納部304の情報源から事業ドメイン候補を選別することで情報源を増殖すると共に技術辞書及びドメイン辞書の単語を増殖する(ステップS500)。図24は、情報源の増殖方法を示すフローチャートである。   Next, the information source multiplication unit 401 refers to the technical dictionary, and selects the business domain candidates from the information sources in the non-conforming information source storage unit 304, thereby proliferating the information sources and proliferating the words in the technical dictionary and the domain dictionary. (Step S500). FIG. 24 is a flowchart showing an information source proliferation method.

図24に示すように、情報源増殖部401は、先ず、図10に示す技術辞書の全ノードと、非適合情報源格納部304に格納された非適合情報源の各要素単語とを照合する(ステップS411)。本例においては、特徴語"光増幅"が技術辞書の一のノードと一致するため、事業ドメイン候補として列挙される。(ステップS412)そして、この"光増幅"とドメイン辞書の特徴語"光アクセス"との距離を、技術辞書を使用して計算する(ステップS413)。この場合、"光増幅"と"光アクセス"の距離は0.6である。ここでは閾値が1.5未満を事業ドメインとすると設定されているものとすると(ステップS414)、光増幅という特徴語を含む当該情報源も情報源増殖部401により事業ドメインに関連するものと判定される。そして、事業ドメインに関連するものと判定された非適合情報源を、適合情報源格納部303に格納する(ステップS415、ステップS600)。   As shown in FIG. 24, the information source multiplication unit 401 first collates all the nodes of the technical dictionary shown in FIG. 10 with each element word of the non-conforming information source stored in the non-conforming information source storage unit 304. (Step S411). In this example, since the feature word “light amplification” matches one node of the technical dictionary, it is listed as a business domain candidate. (Step S412) Then, the distance between this “optical amplification” and the domain dictionary feature word “optical access” is calculated using the technical dictionary (step S413). In this case, the distance between “optical amplification” and “optical access” is 0.6. Here, if the threshold is set to be less than 1.5 as the business domain (step S414), the information source including the characteristic word of optical amplification is also determined to be related to the business domain by the information source multiplication unit 401. Is done. Then, the non-conforming information source determined to be related to the business domain is stored in the conforming information source storage unit 303 (steps S415 and S600).

そして、情報源増殖部401は、この事業ドメインに関連するものと判定された非適合情報源に基づき、特徴語として「ラマン方式」を追加する(ステップS416)。また、情報源増殖部401は、非適合情報源のうち、事業ドメインに関連するものと判定された情報源に基づき、技術辞書の光増幅ノードの子ノードとして、「ラマン方式」ノードを例えば固定距離0.1で追加する。この場合、このように自動増殖される単語については、システムの固定値を距離として設定することも可能であるが、例えば、追加する単語と、当該単語を追加される単語とのオリジナル文章(情報源)における位置関係に基づき算出すること等も可能である。また、適合回数が所定の割合以上であるか否かを判断し(ステップS417)、適合回数が所定の割合以上である場合には、ドメイン辞書の主体者として「オプト販売」を追加する。(ステップS418)。事業ドメインに合致する情報源の入力によって、自動的に事業ドメイン辞書及び技術辞書が増殖する。   Then, the information source multiplication unit 401 adds “Raman method” as a feature word based on the non-conforming information source determined to be related to the business domain (step S416). Further, the information source multiplication unit 401 fixes, for example, a “Raman” node as a child node of the optical amplification node of the technical dictionary based on the information source determined to be related to the business domain among the non-conforming information sources. Add at a distance of 0.1. In this case, it is possible to set a fixed value of the system as a distance for the word that is automatically propagated in this way. For example, an original sentence (information) of the word to be added and the word to which the word is added is added. It is also possible to calculate based on the positional relationship in the (source). Further, it is determined whether or not the number of times of matching is equal to or greater than a predetermined ratio (step S417). If the number of times of matching is equal to or greater than the predetermined ratio, “opt sales” is added as the subject of the domain dictionary. (Step S418). Business domain dictionaries and technical dictionaries are automatically expanded by inputting information sources that match the business domain.

次に、本発明の第1の実施例の効果について説明する。本実施例では、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった会社の競合製品を発見し、購入対象として提示することができる。そして、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出することができる。   Next, effects of the first exemplary embodiment of the present invention will be described. In this embodiment, the information source is decomposed into the subject, action, product name, and feature word, and compared with other information sources using the business domain dictionary and technical dictionary, so the competing product of the company that has been unknown until now Can be discovered and presented for purchase. Then, the morpheme sets of information sources are combined with continuous nouns, and the subject, product name, action, feature word, and synonym can be extracted by the format rule.

また、ドメイン辞書を用いて、生産財かつターゲットとする事業ドメインに属している情報源のみ適合情報として抽出することができる。さらに、ドメイン辞書を用いて非適合と判定された情報源を、技術辞書を用いて適合情報源として昇格させることができると共にドメイン辞書や技術辞書にない単語を、ドメインに適合している情報源の特徴語を用いて増殖させることができる。すなわち、新しい競合製品の特徴語を、事業ドメイン辞書や技術辞書に追加することができるため、新しく製品が発売になった時などにおいても自動的に事業ドメイン・技術辞書の用語を増殖させることができ、人手でメンテナンスする工数を削減することができる。さらに増殖した特徴語も含めて、後から入力される情報源を比較するため、より広く製品を発見することが可能になる。   In addition, by using a domain dictionary, only information sources belonging to a production domain and a target business domain can be extracted as relevant information. Furthermore, an information source that is determined to be non-conforming by using a domain dictionary can be promoted as a conforming information source by using a technical dictionary, and a word that does not exist in the domain dictionary or technical dictionary conforms to the domain. Can be propagated using the feature words. In other words, feature words of new competitive products can be added to the business domain dictionary and technical dictionary, so that the terms of the business domain / technical dictionary can be automatically expanded even when a new product is released. This can reduce the man-hours required for manual maintenance. Furthermore, since the information source inputted later is also compared including the feature word which grew, it becomes possible to discover a product more widely.

本発明の第1の実施例の変形例
次に、本発明の第2の実施例について説明する。本実施例は、情報源再構築部が情報源をツリー構造にするツリー生成部を有し、情報源選別部及びグループ生成部が情報源を情報源ツリーの状態で扱う点が第1の実施例と異なる。その他の点は、同様である。
Modification of the first embodiment of the present invention Next, a second embodiment of the present invention will be described. The first embodiment is that the information source reconstruction unit has a tree generation unit that makes the information source a tree structure, and the information source selection unit and the group generation unit handle the information source in the state of the information source tree. Different from the example. The other points are the same.

図25は、本発明の第1の実施例の変形例にかかる情報構造化装置1bを示す図である。図1に示すように、本変形例にかかる情報構造化装置1bは、情報源裁断部100、情報源再構築部200b、情報源選別部300b、及びグループ生成部400bを有する。   FIG. 25 is a diagram showing an information structuring apparatus 1b according to a modification of the first embodiment of the present invention. As shown in FIG. 1, the information structuring apparatus 1b according to the present modification includes an information source cutting unit 100, an information source reconstruction unit 200b, an information source selection unit 300b, and a group generation unit 400b.

図26は、本実施例における情報源再構築部200bを示す図である。図26に示すように、情報源再構築部200bは、書式解析部201、書式ルール蓄積部202、要素単語格納部203、ツリー生成部204、及び情報源ツリー格納部205を有する。ツリー生成部204、及び情報源ツリー格納部205以外は第1の実施例と同様である。   FIG. 26 is a diagram illustrating the information source reconstruction unit 200b according to the present embodiment. As shown in FIG. 26, the information source reconstruction unit 200b includes a format analysis unit 201, a format rule storage unit 202, an element word storage unit 203, a tree generation unit 204, and an information source tree storage unit 205. Other than the tree generation unit 204 and the information source tree storage unit 205 are the same as those in the first embodiment.

ツリー生成部204は繋がりのない要素単語から、主体者をルートする情報源ツリーを生成する。図27は、情報源ツリーを示す図である。図27に示すように、主体者名がルートノードとなり、商標を有する製品名がその子ノードとなっている。さらに、派生製品、アクション、特徴語が商標を有する製品名の子ノードとなっている。さらに、シノニム、特徴語が派生製品の子ノードとなり、アクションの対象がアクションの子ノードとなっている。この情報源ツリーは、下記のルールに従って生成される。
(1)主体者名をルートノードとする
(2)製品名は商標の関係で普遍性を有する単語である。製品名を企業名の子ノードとする
(3)派生製品名を、商標を有する製品名の子ノードとする
(4)企業の行動は、製品又は派生製品の子ノードとする
(5)納入先は、行動の子ノードとする
(6)特徴語は、製品名又は派生製品名の子ノードとする
(7)シノニムは、言い換え対象となったキーワードと同じレベルのノードとする
The tree generation unit 204 generates an information source tree for rooting the subject from unconnected element words. FIG. 27 is a diagram showing an information source tree. As shown in FIG. 27, the subject name is the root node, and the product name having the trademark is its child node. Furthermore, derivative products, actions, and feature words are child nodes of product names having trademarks. Furthermore, synonyms and feature words are child nodes of the derived product, and the action target is a child node of the action. This information source tree is generated according to the following rules.
(1) The subject name is the root node. (2) The product name is a word having universality in relation to trademarks. The product name is a child node of the company name. (3) The derived product name is a child node of the product name having the trademark. (4) The company action is the child node of the product or derivative product. Is a child node of an action (6) A feature word is a child node of a product name or a derived product name (7) A synonym is a node at the same level as a keyword to be paraphrased

上記ルールに従って生成された情報源ツリーは、1件の情報源に対応する。生成された情報源ツリーは、情報源ツリー格納部205へ格納される。   The information source tree generated according to the above rule corresponds to one information source. The generated information source tree is stored in the information source tree storage unit 205.

この情報源再構築部200bにより、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出し、これらの要素単語からツリー構造を構築することができる。抽出された要素単語をツリー構造にすることで、要素単語を構造化した情報源ツリーを得ることができる。   By this information source reconstruction unit 200b, morpheme sets of information sources are combined with continuous nouns, subject, product name, action, feature word, and synonym are extracted by format rules, and a tree structure is constructed from these element words can do. By making the extracted element words into a tree structure, an information source tree in which the element words are structured can be obtained.

図28は、本実施例における情報源選別部300bを示すブロック図である。図28に示すように、情報源選別部300bは、ツリー選別部301b、ドメイン辞書格納部302、適合情報源ツリー格納部303、及び非適合情報源ツリー格納部304bを有する。情報源ではなく、情報源ツリーを扱う点が第1の実施例と異なる。   FIG. 28 is a block diagram showing the information source selection unit 300b in the present embodiment. As illustrated in FIG. 28, the information source selection unit 300b includes a tree selection unit 301b, a domain dictionary storage unit 302, a compatible information source tree storage unit 303, and a non-conforming information source tree storage unit 304b. The difference from the first embodiment is that the information source tree is handled instead of the information source.

図29は、本実施例におけるグループ生成部400bを示すブロック図である。図29に示すように、グループ生成部400bは、ツリー増殖部401b、及び技術辞書格納部402を有する。情報源選別部300bと同様、情報源ではなく、情報源ツリーを扱う点が第1の実施例と異なる。   FIG. 29 is a block diagram illustrating the group generation unit 400b in the present embodiment. As illustrated in FIG. 29, the group generation unit 400b includes a tree multiplication unit 401b and a technical dictionary storage unit 402. Similar to the information source selection unit 300b, it is different from the first embodiment in that an information source tree is handled instead of an information source.

次に、本実施例の動作について説明する。図30は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。上記と同様、 "DW4000"は事業ドメインに合致した製品であることを、ドメイン辞書格納部302のドメイン辞書の「製品名」行、「語句1」列に登録しておく。(図8参照)   Next, the operation of this embodiment will be described. FIG. 30 is a flowchart illustrating the operation of the information structuring apparatus according to the present embodiment. Similarly to the above, “DW4000” is registered in the “product name” row and “word / phrase 1” column of the domain dictionary of the domain dictionary storage unit 302 so as to match the business domain. (See Figure 8)

そして、情報源として、
"日本電気、光アクセス製品「DW4000」を発売"
という文字列がシステムに入力された場合、情報源裁断部100は上述と同様に形態素解析を行い、図13に示す形態素を得る。(ステップS100)。そして、書式解析部201は、書式解析ルールを適用する(ステップS300)。その結果、図21に示すような解析結果を得る(ステップS300)。すなわち、"日本電気、光アクセス製品「DW4000」を発売"という情報源から、
主体者:日本電気
製品名:DW4000
行動:発売
特徴語:光アクセス製品
という解析結果が得られる。
And as an information source,
"NEC releases optical access product" DW4000 ""
Is input to the system, the information source cutting unit 100 performs morphological analysis in the same manner as described above to obtain the morpheme shown in FIG. (Step S100). Then, the format analysis unit 201 applies the format analysis rule (step S300). As a result, an analysis result as shown in FIG. 21 is obtained (step S300). In other words, from the information source “NEC releases optical access product“ DW4000 ””
Subject: NEC Product Name: DW4000
Action: Launch Feature word: The result of the analysis is an optical access product.

ツリー生成部204bは、この解析結果から、上述したように、図27に示す所定のルールに従って、図31に示すような情報源ツリーを生成する(ステップS360)。生成した情報源ツリーを、情報源ツリー格納部205bに格納する。そして、情報源選別部300bのツリー選別部301bは、情報源ツリーの中に例えば"納入"、"採用"といった行動を含むか否かで情報源ツリーが生産財に関するものであるか否かを判定する。そして、生産財に関するものと判定した情報源ツリーを構成する主体者、製品名、特徴語と、ドメイン辞書格納部302のドメイン辞書とを比較する。ドメイン辞書の単語と、情報源ツリーを構成する要素単語とが一部一致又は全部一致した場合に、当該情報源ツリーを適合情報源ツリーとする。本例においては、図8に示すドメイン辞書において、製品名"DW4000"が一致し、特徴語"光アクセス製品"がドメイン辞書の"光アクセス"と部分一致していることが分かるため、当該情報源を事業ドメインに合致した適合情報源ツリーであると判定し、当該情報源ツリーを適合情報源ツリーとして格納する。(ステップS400)。適合情報源ツリーと判定した情報源ツリーは、適合情報源ツリー格納部303に格納する。   From the analysis result, the tree generation unit 204b generates an information source tree as shown in FIG. 31 according to the predetermined rule shown in FIG. 27 as described above (step S360). The generated information source tree is stored in the information source tree storage unit 205b. Then, the tree selection unit 301b of the information source selection unit 300b determines whether or not the information source tree is related to the production goods depending on whether or not the information source tree includes actions such as “delivery” and “adoption”. judge. Then, the subject, the product name, and the feature word constituting the information source tree determined to be related to the production goods are compared with the domain dictionary in the domain dictionary storage unit 302. When a word in the domain dictionary and an element word constituting the information source tree partially match or all match, the information source tree is determined as a matching information source tree. In this example, in the domain dictionary shown in FIG. 8, it can be seen that the product name “DW4000” matches and the feature word “optical access product” partially matches “optical access” in the domain dictionary. The source is determined to be a compatible information source tree that matches the business domain, and the information source tree is stored as a compatible information source tree. (Step S400). The information source tree determined to be the compatible information source tree is stored in the compatible information source tree storage unit 303.

次に、ツリー選別部301が、ドメイン辞書を参照し、情報源ツリーから適合情報源ツリーを選別する方法について具体的に説明する。情報源(ニュース情報源)として、
"オプト販売が光増幅をラマン方式とする「FX4200」をNEEへ納入"
という文字列が情報構造化装置1bへ入力されるとする。情報構造化装置1bは、上述と同様に、図12のステップS100からステップS300まで実行し、図22に示す書式解析結果を得る。ツリー生成部204bは、この書式解析結果から図32に示すような情報源ツリーを生成し、ツリー選別部301bが情報源ツリーを構成する要素単語と事業ドメイン辞書とを照合する。本例においては、図22に示す情報源ツリーを構成する要素単語と図8に示す事業ドメイン辞書とは部分一致もしないため、この事業ドメイン選別工程では、入力された情報源が事業ドメインに合致しないと判定される。合致しない場合は、非適当情報源ツリー格納部304bに当該情報源ツリーを格納する。
Next, a method in which the tree selection unit 301 selects a compatible information source tree from the information source tree with reference to the domain dictionary will be specifically described. As an information source (news information source)
"Opto Sales Deliver" FX4200 "with Raman Method for Optical Amplification to NEE"
Is input to the information structuring apparatus 1b. The information structuring apparatus 1b executes steps S100 to S300 in FIG. 12 and obtains the format analysis result shown in FIG. The tree generation unit 204b generates an information source tree as shown in FIG. 32 from the format analysis result, and the tree selection unit 301b collates the element words constituting the information source tree with the business domain dictionary. In this example, the element words constituting the information source tree shown in FIG. 22 and the business domain dictionary shown in FIG. 8 do not partially match. Therefore, in this business domain selection process, the input information source matches the business domain. It is determined not to. If they do not match, the information source tree is stored in the unsuitable information source tree storage unit 304b.

このように、情報源が非適合情報源ツリーである場合は(ステップS410:Yes)、ツリー増殖部401bが技術辞書を参照して、非適合情報源ツリー格納部304bの情報ツリーから事業ドメイン候補を選別することで情報源ツリーを増殖すると共に技術辞書及びドメイン辞書の単語を増殖する(ステップS500)。そして、事業ドメインに関連するものと判定された非適合情報源ツリーを、適合情報源ツリー格納部303bに格納する(ステップS600)。   Thus, when the information source is a non-conforming information source tree (step S410: Yes), the tree breeding unit 401b refers to the technical dictionary, and from the information tree of the non-conforming information source tree storage unit 304b, business domain candidates. The information source tree is propagated by selecting and the words of the technical dictionary and the domain dictionary are propagated (step S500). Then, the non-conforming information source tree determined to be related to the business domain is stored in the conforming information source tree storage unit 303b (step S600).

本変形例においても、第1の実施例と同様、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった会社の競合製品を発見し、購入対象として提示することができる。そして、情報源の形態素集合を連続名詞で結合し、書式ルールによって、主体者、製品名、行動、特徴語、シノニムを抽出し、ツリー構造を構築することができる。   In this modified example, as in the first embodiment, the information source is decomposed into the subject, action, product name, and feature word, and compared with other information sources using the business domain dictionary and technical dictionary. It is possible to discover competing products of companies that were not known before and present them as purchase targets. Then, the morpheme sets of the information sources are combined with continuous nouns, and the subject, product name, action, feature word, and synonym are extracted according to the format rules, and a tree structure can be constructed.

本発明の第2の実施例
次に、本発明の第2の実施例について説明する。本実施例は、情報源選別部が主体者がどのようなカテゴリの企業であるかを判別するための主体者辞書を有する点が第1の実施例とは異なる。なお、以下の実施例においては、上述の変形例の如く、情報源を情報源ツリーとして扱う例について説明するが、情報源はツリー構造としなくともよいことは言うまでもない。図33は、本実施例にかかる情報源選別部を示す図である。なお、その他の構成については、第1の実施例と同様であり、その詳細な説明は、省略する。図33に示すように、情報源選別部300cのツリー選別部301は、適合情報源ツリーに分類する際に、更に主体者辞書305を参照し、各情報源ツリーの主体者毎に分類する。
Second Embodiment of the Invention Next, a second embodiment of the present invention will be described. This embodiment is different from the first embodiment in that the information source selection unit has a subject dictionary for determining what category the subject is a company. In the following embodiment, an example in which an information source is handled as an information source tree as in the above-described modification will be described, but it goes without saying that the information source does not have to have a tree structure. FIG. 33 is a diagram illustrating the information source selection unit according to the present embodiment. Other configurations are the same as those in the first embodiment, and a detailed description thereof will be omitted. As shown in FIG. 33, the tree selection unit 301 of the information source selection unit 300c refers to the subject dictionary 305 when classifying the information source tree into the matching information source tree, and classifies the subject information for each subject in each information source tree.

図34は、主体者辞書を示す図である。主体者辞書は、顧客企業:NEE、競合企業:タメシタ産業、部品納入企業:新川電工、など、企業のカテゴリと、その企業名からなる組で構成されている。ツリー選別部301は、情報源ツリーが顧客企業なのか、競合企業であるのか、部品納入企業であるのかを判定し、例えば競合企業の情報のみを抽出し、図示せぬ表示部に表示する等する。   FIG. 34 is a diagram showing a subject dictionary. The subject dictionary is composed of a combination of a company category and the company name, such as a customer company: NEE, a competitor company: Tameshita Industry, and a parts supplier company: Shinkawa Electric. The tree selection unit 301 determines whether the information source tree is a customer company, a competitor company, or a parts delivery company, for example, extracts only the competitor company information and displays it on a display unit (not shown). To do.

次に、図12のフローチャートを参照して、本発明の第2の実施例の動作について詳細に説明する。本実施例では、未知の競合商品が未知の顧客に納入されたことを検出する例を示す。なお、本実施例においては、第1の実施例の結果増殖した事業ドメイン辞書(図35)と、技術辞書(図36)の値を利用するものとする。   Next, the operation of the second embodiment of the present invention will be described in detail with reference to the flowchart of FIG. In this embodiment, an example is shown in which it is detected that an unknown competitive product has been delivered to an unknown customer. In the present embodiment, the values of the business domain dictionary (FIG. 35) and the technical dictionary (FIG. 36) proliferated as a result of the first embodiment are used.

情報源のニュースとして、
"タメシタ産業、ADDI向け最軽量「J703iU」を納入"
という文字列が情報構造化装置に入力されることとする。情報構造化装置は、情報構造化装置1と同様に、ステップS100からステップS300まで実行し、図37に示す書式解析結果を得る。図35に示す事業ドメイン辞書を参照し、この情報源が事業ドメインに属さない、すなわち非適合情報源ツリーであると判定する(ステップS400)。そして、情報源が非適合情報源ツリーであるので(ステップS410)、図36に示す技術辞書を参照し、この情報源が事業ドメイン候補にならないことを判定する(ステップS500)。
As source news,
"Tameshita Industry Delivers Lightest" J703iU "for ADDI"
Is input to the information structuring apparatus. Similar to the information structuring apparatus 1, the information structuring apparatus executes steps S100 to S300 and obtains the format analysis result shown in FIG. With reference to the business domain dictionary shown in FIG. 35, it is determined that this information source does not belong to the business domain, that is, is a non-conforming information source tree (step S400). Since the information source is a non-conforming information source tree (step S410), the technical dictionary shown in FIG. 36 is referred to and it is determined that this information source is not a business domain candidate (step S500).

次いで、情報源のニュースとして、
"タメシタ産業、ADDIへDWDM製品「ADDI5000」を納入"
という文字列が情報構造化装置21に入力されるとする。情報構造化装置21は同様にステップS100からステップS300まで実行し、図38に示す書式解析結果を得る。そして、"納入"や"採用"といった言葉を含む情報源が入力された場合は、ツリー選別部301が、事業ドメイン辞書を参照し、当該情報源ツリーが事業ドメインに合致した適合情報源ツリーであるか否かを判定する(ステップS400)。本例においては、図35に示す事業ドメイン辞書を参照し、この情報源が事業ドメインに属さないことを判定する。
Then, as news of information sources,
"Tameshita Sangyo to deliver" DDI5000 "DWDM product to ADDI"
Is input to the information structuring apparatus 21. Similarly, the information structuring apparatus 21 executes steps S100 to S300 and obtains the format analysis result shown in FIG. When an information source including words such as “delivery” and “adoption” is input, the tree selection unit 301 refers to the business domain dictionary, and the information source tree is a conforming information source tree that matches the business domain. It is determined whether or not there is (step S400). In this example, with reference to the business domain dictionary shown in FIG. 35, it is determined that this information source does not belong to the business domain.

情報源が非適合情報源ツリーであるので(ステップS410)、次に、図36に示す技術辞書を参照し、この情報源がDWDMというキーワードで一致し、事業ドメインに属する製品との特徴語と比較して、閾値以下の距離であるため、適合情報源ツリーであると判定する(ステップS500)。ここで、"タメシタ産業"という主体者は、事業ドメインに合致する適合情報源ツリー、及び合致しない適合情報源ツリーを有し、その割合が5割であり、事業ドメイン辞書の主体者として登録されるための条件を満たさないため、事業ドメイン辞書には登録されない。ただし、適合情報源ツリーと判定された情報源に含まれる製品名("ADDI15000")及び特徴語("DWDM製品")は事業ドメイン辞書に登録される(図39)。ここで、本実施例においては、図34に示す主体者辞書に基づき、ツリー選別部301が適合情報源ツリーを主体者毎に分類することができる。よって、例えば、競合他社の製品のみを情報構造化装置21に接続された表示手段(不図示)へ提示することができる。   Since the information source is a non-conforming information source tree (step S410), referring to the technical dictionary shown in FIG. 36, the information source matches with the keyword DWDM, and the feature word for the product belonging to the business domain In comparison, since the distance is equal to or smaller than the threshold, it is determined that the tree is a compatible information source tree (step S500). Here, the subject “Tameshita Sangyo” has a conforming information source tree that matches the business domain and a conforming information source tree that does not match, and the ratio is 50%, and is registered as the subject of the business domain dictionary. Is not registered in the business domain dictionary. However, the product name (“ADDI15000”) and the feature word (“DWDM product”) included in the information source determined to be the compatible information source tree are registered in the business domain dictionary (FIG. 39). Here, in this embodiment, based on the subject dictionary shown in FIG. 34, the tree selection unit 301 can classify the compatible information source tree for each subject. Thus, for example, only competitor products can be presented to display means (not shown) connected to the information structuring device 21.

また、ニュースが事業ドメインに合致しているかどうかを主体者で判定することができる。専門業者の名前がニュースに含まれていた場合、技術辞書にない特徴語でも、事業ドメインに合致する製品であると判定したり、主体者による判定によって、ニュースに含まれる製品名も事業ドメインに適していると判定することができる。よって、それを購入した顧客を新顧客として認定することができる。また、総合メーカKを主体者に登録してしまうと、K製の洗濯機も、光ネットワーク製品だと誤判定したり、K製の洗濯機を大量に購入したコインランドリー業者がいた場合に、これを光事業ドメイン製品を購入した新規顧客と誤判定したりしてしまうが、総合メーカを主体者に登録せずに主体者判定することにより、あるメーカの製品は全て事業ドメインに合致するという動作をすることを防止する。   Also, the subject can determine whether the news matches the business domain. If the name of a specialist is included in the news, even if it is a feature word that is not in the technical dictionary, it is determined that the product matches the business domain. It can be determined that it is suitable. Therefore, the customer who purchased it can be authorized as a new customer. In addition, if the general manufacturer K is registered as the subject person, if a K laundry machine is erroneously determined to be an optical network product or there is a coin laundry company that has purchased a large number of K laundry machines, May be misidentified as a new customer who has purchased a HIKARI business domain product, but by determining the subject without registering the general manufacturer as the subject, all the products of a manufacturer match the business domain. Preventing you from doing.

本実施例においては、第1の実施例と同様、製品名や競合企業、さらには顧客企業が未知であっても、事業ドメインに合致する適合情報源ツリーであるか否かを、技術辞書を用いて判定する。このため、自社にとって脅威のある納入ニュースと、そうでないものを分類することが可能である。また、過去のニュースも考慮にいれて、主体者が専門業者か総合メーカかを判定するため、主体者が様々な適合情報源ツリーを開発している場合に、誤って異なる事業ドメインの新製品と判定することも減少し、この異なる事業ドメインの新製品を購入した顧客も、誤って新顧客として判定することも減少する。さらに、本実施例においては、主体者を分類することができるので、必要なカテゴリの企業情報を所望のタイミングで抽出し、表示等させることができる。   In this embodiment, as in the first embodiment, even if the product name, competitor, and customer company are unknown, the technical dictionary is used to determine whether the matching information source tree matches the business domain. Use to determine. For this reason, it is possible to classify delivery news that is threatening to the company and those that are not. In addition, in order to determine whether the subject is a specialist or a comprehensive manufacturer, taking into account past news, if the subject has developed various conforming information source trees, a new product in a different business domain will be mistakenly And a customer who has purchased a new product in this different business domain is also less likely to be erroneously determined as a new customer. Furthermore, in the present embodiment, since the subject can be classified, it is possible to extract company information of a necessary category at a desired timing and display it.

本発明の第3の実施例
次に、本発明の第3の実施例について説明する。図40は、本発明の第3の実施例にかかる情報構造化装置31を示す図である。第3の実施例は、顧客企業を動的に決定する例である。本情報構造化装置31は、図40に示すように、第1の実施例における情報構造化装置1に、更に定量化装置32を有する。定量化装置32は、情報源価値推定部500及び企業力推定部600を有する。その他の構成は、第1の実施例と同様であり、その詳細な説明は省略する。情報源価値推定部500は、企業の特質をツリー構造で表した企業力測定ツリーの最下層を構成するリーフのスコア算出方法が情報源ツリーを構成する要素単語により定義された定義表(単語定量化マップ)と、情報源ツリーとを参照し、当該リーフのスコアを初期スコアとして算出する。企業力推定部600は、その初期スコアに基づき企業力測定ツリーの最上層を構成するノードのスコアを企業力として算出する。企業力測定ツリーは、リーフ及びその上層のノードから構成され、各ノードのスコア算出方法が定義されたものであって、上層のスコアはその下層のスコアに基づき算出されるものであるが、その詳細は後述する。次に、情報源価値推定部500及び企業力推定部600について詳述する。
Third Embodiment of the Invention Next, a third embodiment of the present invention will be described. FIG. 40 is a diagram showing an information structuring apparatus 31 according to the third example of the present invention. The third embodiment is an example of dynamically determining a customer company. As shown in FIG. 40, the information structuring apparatus 31 further includes a quantification apparatus 32 in addition to the information structuring apparatus 1 in the first embodiment. The quantification device 32 includes an information source value estimation unit 500 and a company power estimation unit 600. Other configurations are the same as those of the first embodiment, and a detailed description thereof will be omitted. The information source value estimation unit 500 is a definition table (word quantification) in which leaf score calculation methods constituting the lowest layer of the enterprise strength measurement tree that represents the company characteristics in a tree structure are defined by element words constituting the information source tree. ) And the information source tree, the score of the leaf is calculated as an initial score. The enterprise power estimation unit 600 calculates the score of the node constituting the uppermost layer of the enterprise strength measurement tree as the enterprise strength based on the initial score. The enterprise strength measurement tree is composed of a leaf and its upper layer nodes, and the score calculation method for each node is defined. The upper layer score is calculated based on the lower layer score. Details will be described later. Next, the information source value estimation unit 500 and the enterprise power estimation unit 600 will be described in detail.

図41は、本実施例における情報源価値推定部500を示すブロック図である。図41に示すように、情報源価値推定部500は、主体者判定部501と、主体者辞書格納部502と、主体者分類済み情報源格納部503と、情報源定量化部504と、単語定量化マップ格納部505と、情報減初期スコア格納部506と、企業力測定ツリー格納部507とを有する。   FIG. 41 is a block diagram showing the information source value estimation unit 500 in the present embodiment. As shown in FIG. 41, the information source value estimation unit 500 includes a subject determination unit 501, a subject dictionary storage unit 502, a subject classified information source storage unit 503, an information source quantification unit 504, a word It has a quantification map storage unit 505, an information reduction initial score storage unit 506, and an enterprise strength measurement tree storage unit 507.

主体者辞書格納部502は主体者辞書を格納する。主体者辞書は、上述の図34に示すように、カテゴリ、{顧客、競合、部品納入}と企業名(名前)との組からなる構造を有する。この主体者辞書の企業名には、競合企業の名前、顧客企業の名前、部品納入企業の名前が格納されている。   The subject person dictionary storage unit 502 stores the subject person dictionary. As shown in FIG. 34 described above, the subject person dictionary has a structure including a set of a category, {customer, competition, parts delivery} and a company name (name). The name of the competitor, the name of the customer company, and the name of the parts delivery company are stored in the company name of the subject dictionary.

主体者判定部501は、適合情報源ツリー格納部303を参照し、その主体者ノードと、主体者辞書格納部502の主体者辞書とを比較する。そして、適合情報源ツリーを、主体者で分類し、競合企業に関する競合企業情報源ツリー、顧客企業に関する顧客企業情報源ツリー、又は納入企業に関する納入企業情報源ツリーとして、情報源格納部503に格納する。   The subject determination unit 501 refers to the matching information source tree storage unit 303 and compares the subject node with the subject dictionary in the subject dictionary storage unit 502. Then, the conforming information source tree is classified by the subject, and stored in the information source storage unit 503 as a competitor company information source tree for a competitor company, a customer company information source tree for a customer company, or a delivery company information source tree for a delivery company. To do.

情報源定量化部504は、主体者別情報源ツリーと単語定量化マップ格納部505に格納された図42に示す構造の単語定量化マップから、後述する企業力測定ツリー格納部507に格納された企業力測定ツリーの最下層を構成するリーフのスコアを初期スコアとして算出する。   The information source quantification unit 504 is stored in the corporate strength measurement tree storage unit 507, which will be described later, from the word quantification map having the structure shown in FIG. 42 stored in the subject information source tree and the word quantification map storage unit 505. The score of the leaf constituting the lowest layer of the corporate strength measurement tree is calculated as the initial score.

先ず、図42に示す単語定量化マップについて説明すると、単語定量化マップは、情報源ツリーの「主体者」、「製品名」、「特徴語」、「アクション」、「アクションの対象」を組み合わせたルールと、それらに対応する初期スコア算出方法が記載されている。   First, the word quantification map shown in FIG. 42 will be described. The word quantification map is a combination of “subject”, “product name”, “feature word”, “action”, and “action target” in the information source tree. Rules and corresponding initial score calculation methods are described.

具体的には、計算を開始するためのトリガーとして働く「単語」列と、情報源ツリーからどのようにスコアを算出するか記載された「スコア算出方法」列、初期スコアの配分先を決定するための「配分企業」列、「配分リーフ」列、及び「配分率」列を有する。   Specifically, the “word” column that acts as a trigger for starting the calculation, the “score calculation method” column that describes how the score is calculated from the information source tree, and the initial score allocation destination are determined. And a “distribution company” column, an “allocation leaf” column, and an “allocation rate” column.

スコア算出方法としては大きく分けて4種類の算出方法を有する。1つめは固定値を与えるもので、ある単語が情報源に含まれていたら固定値で指定した値を初期スコアとして与える方式である。2つめは、配分先のリーフの値を用いて算出するもので、対象リーフが有する値を2倍、3倍するときに適用する方式である。3つ目は情報源ツリーが有する単語を組み合わせで計算するもので、"100億"、"増資"といった額面の値をスコアとして適用する方式である。4つ目は、外部算出部で定義する方式に従って算出するもので、複数の情報源を用いてスコアを算出する場合に適用する方式である。   There are roughly four types of score calculation methods. The first is a method of giving a fixed value. If a word is included in the information source, a value designated by the fixed value is given as an initial score. The second is to calculate using the value of the leaf of the distribution destination, and is a method applied when the value of the target leaf is doubled or tripled. The third method is to calculate the words of the information source tree in combination, and applies the face value such as “10 billion” and “capital increase” as the score. The fourth method is to calculate according to a method defined by an external calculation unit, and is a method applied when calculating a score using a plurality of information sources.

次に、企業力測定ツリーについて説明する。図43乃至図45は、それぞれ顧客企業力測定ツリー、競合企業力測定ツリー、部品納入企業力測定ツリーの構造を示す図である。企業力測定ツリー格納部507には、図43に示す競合企業向けの競合企業力測定ツリー、図44に示す顧客企業向けの顧客企業力測定ツリー、図45に示す部品納入企業向けの部品納入企業力測定ツリーの3種類の企業力測定ツリーが準備されている。図43乃至図45に示すように、企業力測定ツリーは、ノード構造とリーフ構造の2種類のデータ構造を有し、企業名をルートノードとし、各企業の競争力を表現するための企業特性ノードを階層的に有することが可能である。最下層は、情報源から生成した初期スコアを割り当てるためのリーフとなっている。リーフはノードを有することができない。   Next, the corporate strength measurement tree will be described. FIGS. 43 to 45 are diagrams showing the structures of a customer enterprise strength measurement tree, a competitive enterprise strength measurement tree, and a parts delivery enterprise strength measurement tree, respectively. The enterprise strength measurement tree storage unit 507 includes a competitive enterprise strength measurement tree for the competitor shown in FIG. 43, a customer enterprise strength measurement tree for the customer enterprise shown in FIG. 44, and a component delivery company for the component supplier shown in FIG. Three types of enterprise strength measurement trees are prepared. As shown in FIG. 43 to FIG. 45, the enterprise strength measurement tree has two types of data structures, a node structure and a leaf structure, and uses the enterprise name as a root node, and enterprise characteristics for expressing the competitiveness of each enterprise. It is possible to have nodes hierarchically. The lowest layer is a leaf for assigning an initial score generated from an information source. A leaf cannot have nodes.

図46は、単語定量化マップに含まれる単語・ノード対応表を示す図である。情報源定量化部504は、この単語・ノード対応表におけるワード欄に一致する要素単語が主体者別情報源ツリーに含まれているか判別する。含まれている場合は、当該ワード欄に対応するタイプの企業力測定ツリーの最下層を構成するリーフ(ノード1〜ノード3)に対し、スコア欄に指定されているスコアを初期スコアとして設定する。例えば、主体者別情報源ツリーの主体者(タイプ)が競合企業であって、当該情報源ツリーに"展示"含まれる場合、"納入実績"リーフのスコア(初期スコア)を2とする。また、例えば、主体者別情報源ツリーの主体者(タイプ)が"競合企業又は納入企業"であって、当該情報源ツリーに"開発"含まれる場合、"製品バリエーション"、"開発スピード"、"機能特徴"、又は"部品バリエーション"、"開発スピード"、"部品最高性能順位"の各リーフのスコア(初期スコア)を2倍にし、それぞれ0.4、0.2、0.4を乗算する。このように、情報源価値推定部500により、単語定量化マップを用いて、情報源定量化部504は、情報源ツリー中に存在する行動とそれに付随する特徴語を組み合わせて、情報源の初期スコアを算出することができる。   FIG. 46 is a diagram showing a word / node correspondence table included in the word quantification map. The information source quantifying unit 504 determines whether an element word that matches the word column in the word / node correspondence table is included in the subject-specific information source tree. If it is included, the score specified in the score field is set as the initial score for the leaves (node 1 to node 3) that constitute the lowest layer of the enterprise ability measurement tree of the type corresponding to the word field. . For example, if the subject (type) of the information source tree by subject is a competitor and the information source tree includes “exhibition”, the score (initial score) of the “delivery record” leaf is set to 2. Also, for example, when the subject (type) of the information source tree by subject is “competitor or delivery company” and “development” is included in the information source tree, “product variation”, “development speed”, Double the score (initial score) of each “functional feature” or “part variation”, “development speed”, and “part highest performance ranking” and multiply by 0.4, 0.2, and 0.4 respectively. To do. As described above, the information source value estimation unit 500 uses the word quantification map to cause the information source quantification unit 504 to combine the action existing in the information source tree and the feature word associated therewith to obtain the initial information source. A score can be calculated.

図47は、本実施例における企業力推定部600を示すブロック図である。図47に示すように、企業力推定部600は、企業力計算部601と、情報源最終スコア格納部602を有する。   FIG. 47 is a block diagram showing the corporate strength estimation unit 600 in the present embodiment. As shown in FIG. 47, the enterprise power estimation unit 600 includes an enterprise power calculation unit 601 and an information source final score storage unit 602.

企業力計算部601は、企業力測定ツリーの最下層を構成するリーフに与えられた初期スコアが入力され、単語定量化マップ格納部505に格納された単語定量化マップの単語・ノード割り当て配分率と、企業力測定ツリー格納部507に格納された企業力測定ツリー情報から各ノードのスコアを算出し、企業力(最上位ノード)を算出する。そして、現在の企業力(スコア)から過去の企業力(スコア)を引き算した値を情報源の最終スコアとして生成する。図48は、ノード構造及びリーフ構造を示す図である。図43乃至図45に示す企業力測定ツリーにおいて、各ノードの値は、下位のリーフ値又はノード値から算出され、ノード毎に算出方法を定義することができる。   The enterprise power calculation unit 601 receives the initial score given to the leaves constituting the lowest layer of the enterprise strength measurement tree, and the word / node allocation allocation rate of the word quantification map stored in the word quantification map storage unit 505 Then, the score of each node is calculated from the enterprise strength measurement tree information stored in the enterprise strength measurement tree storage unit 507, and the enterprise strength (the highest node) is calculated. Then, a value obtained by subtracting the past corporate strength (score) from the current corporate strength (score) is generated as the final score of the information source. FIG. 48 is a diagram showing a node structure and a leaf structure. 43 to 45, the value of each node is calculated from a lower leaf value or node value, and a calculation method can be defined for each node.

企業力計算部601は、先ず、情報源ツリーがどの企業タイプに属するかを主体者辞書格納部502に格納された主体者辞書を用いて判定するとともに、単語定量化マップ格納部505に格納された単語定量化マップに記載された単語・ノード割り当て配分率に応じて、情報源定量化部が算出した初期スコアを該当企業タイプの該当ノードに配分する。単語・ノード割り当て配分率は、初期スコアを企業力測定ツリーのどのリーフに配分するか記載したものである。ここで、企業力測定ツリーは、主体者の企業タイプごとに企業特性が異なり、主体者の企業ごとにその特性値が異なるものとなる。このため、情報源から算出した初期スコアが同じでも、適用する主体者が異なれば、最終スコアは異なるという特性を有する。   The enterprise power calculation unit 601 first determines to which enterprise type the information source tree belongs using the subject dictionary stored in the subject dictionary storage unit 502 and is stored in the word quantification map storage unit 505. The initial score calculated by the information source quantification unit is distributed to the corresponding node of the corresponding company type according to the word / node allocation distribution rate described in the word quantification map. The word / node allocation allocation ratio describes which leaf of the enterprise strength measurement tree the initial score is allocated to. Here, the company characteristic measurement tree has different company characteristics for each company type of the subject, and has different characteristic values for each company of the subject. For this reason, even if the initial score calculated from the information source is the same, if the subject to be applied is different, the final score is different.

主体者が顧客企業であれば、図44に示すように顧客企業向けに準備した企業力測定ツリーによって情報源を定量化する。顧客企業力測定ツリーは、「投資力」「サービス占有力」の子ノードから構成される。「投資力」ノードは、「投資積極性」「新規投資力」の子ノードから構成される。「投資積極性」は「流動資産」「固定資産」のリーフを有し、「新規投資力」は「純資産」「負債」のリーフを有する。「サービス占有力」ノードは、「地域性」「需要性」の子ノードを有する。さらに「地域性」ノードは、「サービス密度」「サービスエリア」リーフを有する。また「需要性」ノードは、「周期」「製品マッチング」リーフを有する。   If the subject is a customer company, as shown in FIG. 44, the information source is quantified by an enterprise strength measurement tree prepared for the customer company. The customer enterprise strength measurement tree is composed of child nodes of “investment power” and “service occupation power”. The “investment power” node includes child nodes of “investment aggressiveness” and “new investment power”. “Investment aggressiveness” has leaves of “current assets” and “fixed assets”, and “new investment power” has leaves of “net assets” and “liabilities”. The “service occupancy” node has child nodes of “regional” and “demand”. Furthermore, the “regional” node has “service density” and “service area” leaves. The “demand” node has a “cycle” and a “product matching” leaf.

それぞれのノード、リーフは初期値が1となっており、企業力計算部601は、図46で示す単語・ノード対応表を用いて各ノードのスコアを計算する。各企業タイプの各ノードやリーフは、情報源に含まれるワードを受け取り、ルールに従ってそのスコアを更新する。例えば、固定資産リーフや流動資産リーフの「スコア算出方法」列には、「情報源に記載のスコアをそのまま利用する」というルールが割り当てられている。情報源ツリーに「1000億円投資」という情報が掲載されていれば、固定資産リーフは額面を「1000億」分増加させ、流動資産リーフは「1000億」の額面分減少させる。上述したように、最下位のリーフは、情報源定量化部504によりその初期スコアが算出される。中間、及び最上位のノードは、下記の計算式により、企業力計算部601により、そのスコアを算出する。
中間ノード:レベル2
「投資積極性」ノードのスコア=「固定資産」リーフのスコア/「流動資産」リーフのスコア
「新規投資力」ノードのスコア=「純資産」リーフのスコア/「固定負債」リーフのスコア
「地域性」ノードのスコア=(α01×「サービス密度」リーフのスコア)+(α02×「サービスエリア」リーフのスコア)
「需要性」ノードのスコア=(β01×「周期」リーフのスコア)+(β02×「製品マッチング」リーフのスコア)
中間ノード:レベル1
「投資力」ノードのスコア=α11×「投資積極性」ノードのスコア×α12×「新規投資力」ノードのスコア
「サービス占有力」ノードのスコア=β11×「地域性」ノードのスコア×β12×「需要性」ノードのスコア
最上位ノード
「顧客企業のスコア」=α21×「投資力」ノードのスコア×β21×「サービス占有力」
The initial value of each node and leaf is 1, and the enterprise power calculation unit 601 calculates the score of each node using the word / node correspondence table shown in FIG. Each node or leaf of each company type receives the word contained in the information source and updates its score according to the rules. For example, a rule “use the score described in the information source as it is” is assigned to the “score calculation method” column of the fixed asset leaf and the current asset leaf. If the information source tree contains information of “100 billion yen investment”, the fixed asset leaf will increase the face value by “100 billion” and the current asset leaf will reduce the face value by “100 billion”. As described above, the initial score of the lowest leaf is calculated by the information source quantification unit 504. The enterprise power calculation unit 601 calculates the scores of the middle and top nodes by the following calculation formula.
Intermediate node: Level 2
“Investment aggressiveness” node score = “Fixed asset” leaf score / “Current asset” leaf score “New investment power” node score = “Net asset” leaf score / “Fixed debt” leaf score “Regional” Node score = (α01 × “service density” leaf score) + (α02 × “service area” leaf score)
“Demand” node score = (β01 × “period” leaf score) + (β02 × “product matching” leaf score)
Intermediate node: Level 1
“Investment power” node score = α11 × “Investment aggressiveness” node score × α12 × “New investment power” node score “Service occupancy” node score = β11 × “Regional” node score × β12 × “ “Demand” node score Top node “Customer company score” = α21 × “Investment power” node score × β21 × “Service occupancy”

ここで、α01からβ21までの重みは自由に設定できるようになっており、顧客企業型に属する企業力のうち重要視する特性を選択させることができる。各ノードのスコアは、次の計算式で求めることができる。
リーフのスコア(t+1)=情報源(t+1)の初期スコア
ノードのスコア(t+1)=ノードのスコア(t)+h(node_child1,node_child2,...,node_childN)
ここで、h()は、各ノードに自由に設定できる関数であり、具体的には、上述の「投資積極性」ノードのスコア=「固定資産」リーフのスコア/「流動資産」リーフのスコアのような数式である。関数h()の値は、マイナスになることもあり、結果的に各ノードの値を減少させることも可能となっている。
Here, the weights from α01 to β21 can be freely set, and it is possible to select important characteristics among the corporate strengths belonging to the customer enterprise type. The score of each node can be obtained by the following calculation formula.
Leaf score (t + 1) = initial score of information source (t + 1) node score (t + 1) = node score (t) + h (node_child1, node_child2, ..., node_childN)
Here, h () is a function that can be freely set for each node. Specifically, the score of the above-mentioned “investment aggressiveness” node = the score of the “fixed asset” leaf / the score of the “current asset” leaf It is a mathematical formula like this. The value of the function h () may be negative, and as a result, the value of each node can be decreased.

そして、企業力計算部601は、上記のノードのスコアを顧客企業力測定ツリーに保存する。企業力計算部601は、主体者毎に異なる企業力測定ツリーを生成する。情報源が各企業に対応する企業力測定ツリーのノードのスコアを増加させるため、ニュースリリースの多い企業は、少ない企業に比べて企業力が蓄積される。情報源の最終スコアは、最上位ノードで得られるスコアから、過去の最上位ノードの値を減算したスコアに等しく、企業力計算部601は、最終スコアを情報源最終スコア格納部602に保存する。   Then, the enterprise strength calculation unit 601 stores the above-mentioned node scores in the customer enterprise strength measurement tree. The enterprise strength calculation unit 601 generates a different enterprise strength measurement tree for each subject. Since the information source increases the score of the node of the enterprise strength measurement tree corresponding to each enterprise, the enterprise with a lot of news releases accumulates the enterprise strength compared with the enterprise with few. The final score of the information source is equal to a score obtained by subtracting the value of the previous highest node from the score obtained at the highest node, and the enterprise power calculation unit 601 stores the final score in the information source final score storage unit 602. .

同様に、主体者が競合企業であれば、図44に示すように競合企業向けに準備された企業力測定ツリーを基にして、情報源を定量化する。企業力測定ツリーは、「顧客利便性」「信用力」「販売力」「開発力」の子ノードから構成される。「顧客利便性」ノードは、「サポート拠点」の子リーフを有する。「信用力」ノードは、「格付け」、「納入実績」の子リーフを有する。「販売力」ノードは、「売り上げ実績」の子ノードを有する。「開発力」ノードは、「製品バリエーション」「開発スピード」「機能特徴」の子リーフを有する。それぞれのノード及びリーフは初期スコアが1となっており、情報源の内容に応じて初期スコアを増加させる。上述したように、最下位のリーフは、情報源定量化部504が情報源の内容からスコアを直接的に計算する。例えば、情報源に「3つの製品を販売開始」という情報が掲載されていれば、情報源定量化部504は、図46を参照して製品バリエーションのリーフスコアを3増加させる。中間、及び最上位のノードは、下記の計算式により企業力計算部601が算出する。
中間ノード
「顧客利便性」ノードのスコア=(α11×「1/アクセス時間」リーフのスコア)+(β11×「サービス拠点数」リーフのスコア)+(γ11×「サポート要員数」リーフのスコア)
「信用力」ノードのスコア=(α21×「納入実績」リーフのスコア)+(β22×「格付け」リーフのスコア)
「開発力」ノードのスコア=(α31×「製品バリエーション」リーフのスコア)+(β32×「開発スピード」リーフのスコア)+(γ33×「機能特徴」リーフのスコア)
最上位ノード
「競合企業のスコア」=(α41×「顧客利便性」ノードのスコア)+(β42×「信用力」ノードのスコア)+(γ42×「販売力」ノードのスコア)
Similarly, if the subject is a competitor, the information source is quantified based on a corporate strength measurement tree prepared for the competitor as shown in FIG. The corporate strength measurement tree is composed of child nodes of “customer convenience”, “credit strength”, “sales power”, and “development power”. The “customer convenience” node has a child leaf of “support base”. The “credit” node has child leaves of “rating” and “delivery record”. The “sales power” node has child nodes of “sales results”. The “development power” node has child leaves of “product variation”, “development speed”, and “functional characteristics”. Each node and leaf has an initial score of 1, and the initial score is increased according to the contents of the information source. As described above, for the lowest leaf, the information source quantification unit 504 directly calculates a score from the contents of the information source. For example, if information “start sales of three products” is posted in the information source, the information source quantifying unit 504 increases the leaf score of the product variation by 3 with reference to FIG. The enterprise power calculation unit 601 calculates the middle and top nodes by the following calculation formula.
Intermediate node “customer convenience” node score = (α11 × “1 / access time” leaf score) + (β11 × “number of service locations” leaf score) + (γ11 × “number of support personnel” leaf score)
“Credit” node score = (α21 × “delivery result” leaf score) + (β22 × “rating” leaf score)
Score of “development ability” node = (α31 × “product variation” leaf score) + (β32 × “development speed” leaf score) + (γ33 × “functional feature” leaf score)
Topmost node “competitor score” = (α41 × “customer convenience” node score) + (β42 × “credit” node score) + (γ42 × “sales power” node score)

同様に、主体者が部品の納入業者であれば、図45に示すように部品納入企業向けに準備した企業力測定ツリーを基にして、情報源を定量化する。企業力測定ツリーは、「顧客利便性」「信用力」「開発力」の子ノードから構成される。「顧客利便性」ノードは、「納入可能数」「納期」リーフを有する。「信用力」ノードは、「納入実績」「格付け」リーフを有する。「開発力」ノードは、「部品バリエーション」「開発スピード」「部品最高性能順位」「差異化」リーフを有する。それぞれのノード・リーフは初期スコアが1となっており、情報源の内容に応じてスコアを増加させる。上述したように、情報源定量化部504は、例えば、情報源に「世界最速の部品を開発」という情報が入力されれば、部品最高性能順位リーフの初期スコアを2増加させる。中間、及び最上位のノードは、下記の計算式により企業力計算部601が算出する。   Similarly, if the subject is a supplier of parts, the information sources are quantified based on the enterprise strength measurement tree prepared for the parts delivery company as shown in FIG. The enterprise strength measurement tree includes child nodes of “customer convenience”, “credit strength”, and “development ability”. The “customer convenience” node has a “number of deliverables” and a “delivery date” leaf. The “creditworthiness” node has a “delivery record” and “rating” leaf. The “development power” node has “part variation”, “development speed”, “part highest performance ranking”, and “differentiation” leaf. Each node and leaf has an initial score of 1, and the score is increased according to the contents of the information source. As described above, the information source quantification unit 504, for example, increases the initial score of the component highest performance ranking leaf by 2 when information “develop the world's fastest component” is input to the information source. The enterprise power calculation unit 601 calculates the middle and top nodes by the following calculation formula.

中間ノード
「顧客利便性」ノードのスコア=(α11×「納入可能数」リーフの値)+(β11×「納期」リーフのスコア)
「信用力」ノードのスコア=(α21×「納入実績」リーフのスコア)+(β22×「格付け」リーフのスコア)
「開発力」ノードのスコア=(α31×「部品バリエーション」リーフのスコア)+(β32×「開発スピード」リーフのスコア)+(γ33×「部品最高性能順位」リーフのスコア)
Intermediate node “customer convenience” node score = (α11 × “delivery available” leaf value) + (β11 × “delivery date” leaf score)
“Credit” node score = (α21 × “delivery result” leaf score) + (β22 × “rating” leaf score)
Score of “development ability” node = (α31 × “part variation” leaf score) + (β32 × “development speed” leaf score) + (γ33 × “part highest performance ranking” leaf score)

最上位ノード
「部品納入企業のスコア」=(α41×「顧客利便性」ノードのスコア)+(β42×「信用力」ノードのスコア)+(γ43×「開発力」ノードのスコア)
なお、α、β、γの値は、事業ドメインに応じて自由が値に設定することができる。また、企業力計測ツリーを構成するリーフの計算式は自由に定義しなおしてよい。また、ノードの計算式は、リーフ間の掛け算、足し算、引き算、他の関数との組み合わせで実装してもよい。
Top node “parts supplier score” = (α41 × “customer convenience” node score) + (β42 × “credit” node score) + (γ43 × “development” node score)
Note that the values of α, β, and γ can be freely set according to the business domain. In addition, the calculation formulas of the leaves constituting the enterprise power measurement tree may be freely redefined. Further, the node calculation formula may be implemented by combining multiplication, addition, subtraction, and other functions between leaves.

企業力計算部601により、主体者辞書を用いて、ツリーを顧客企業/競合企業/納入企業に分類し、企業タイプごとの評価テンプレート(企業力測定ツリー)を用いて、情報源の初期スコアを企業力の特質に配分し、過去の企業力を加味して情報源の最終スコアを定量化することができる。また、企業タイプごとの評価テンプレートは、各ノードやリーフにルールを持たせることができる構造になっており、情報源の値に対してルールを適用することによって、各ノードやリーフの値を計算することができる。さらに、この企業タイプごとの評価テンプレートは、ノード間を結ぶリンクに、「割合」により重み付けを与えることができる構造になっており、分析者が重要視する企業特性と、重要視しない企業特性を企業タイプごとに設定することができる。   The enterprise power calculation unit 601 uses the subject dictionary to classify the tree into customer companies / competitors / delivery companies, and uses an evaluation template (enterprise power measurement tree) for each company type to determine the initial score of the information source. The final score of the information source can be quantified by allocating it to the characteristics of corporate strength and taking into account past corporate strength. In addition, the evaluation template for each company type has a structure that allows each node or leaf to have a rule. By applying the rule to the value of the information source, the value of each node or leaf is calculated. can do. Furthermore, the evaluation template for each company type has a structure that can give weights to the links connecting nodes by “ratio”, and the company characteristics that the analyst considers important and those that are not considered important. Can be set for each company type.

図49のフローチャートを参照して、本発明の第3の実施例の動作について詳細に説明する。前提として、第2の実施例の結果増殖した事業ドメイン辞書(図39)と、技術辞書(図36)の値を利用する。また、顧客企業の純資産が50億、負債が50億、固定資産が30億、流動資産が70億であるとする。   The operation of the third embodiment of the present invention will be described in detail with reference to the flowchart of FIG. As a premise, the values of the business domain dictionary (FIG. 39) and the technical dictionary (FIG. 36) which are propagated as a result of the second embodiment are used. Also assume that the client company has 5 billion net assets, 5 billion liabilities, 3 billion fixed assets, and 7 billion current assets.

情報源のニュースとして、
"ADDI、メトロ事業に向け第三者割当による100億円の増資"
という文字列が情報構造化装置31に入力される。情報構造化装置31は情報構造化装置1と同様にステップS100からステップS400までを実行し、"メトロ"というキーワードによって、情報源が事業ドメインに合致していると判定する。こうして図50に示す情報源ツリーを作成し、当該適合情報源ツリー格納部303に格納する(ステップS400)。
As source news,
"ADDI increases capital by 10 billion yen through third-party allotment for metro business"
Is input to the information structuring apparatus 31. The information structuring apparatus 31 executes steps S100 to S400 in the same manner as the information structuring apparatus 1, and determines that the information source matches the business domain by the keyword “metro”. Thus, the information source tree shown in FIG. 50 is created and stored in the relevant information source tree storage unit 303 (step S400).

次に、主体者判定部501は、図34に示す主体者辞書を参照し、主体者"ADDI"が顧客企業であると判定し、情報源格納部503に顧客企業情報源ツリーとして格納する。そして、情報源定量化部504は、この顧客企業情報源ツリーを読み出し、図45に示す顧客企業力測定ツリーと図46に示す単語定量化マップを元に、当該情報源ツリーの各要素単語の初期スコアを算出する(ステップS700)。   Next, the subject determination unit 501 refers to the subject dictionary shown in FIG. 34, determines that the subject “ADDI” is a customer company, and stores it in the information source storage unit 503 as a customer company information source tree. Then, the information source quantification unit 504 reads this customer company information source tree, and based on the customer company power measurement tree shown in FIG. 45 and the word quantification map shown in FIG. 46, each element word of the information source tree. An initial score is calculated (step S700).

ここで、情報源入力前においては、企業力計算部601は、純資産が50、負債が50、固定資産が30、流動資産が70という初期スコアに基づき、その上位層のスコアを算出する。例えば、"投資積極性"のスコア=固定資産/流動資産のスコアで計算されるため、30/70≒0.43となり、"新規投資力"のスコア=純資産/負債で計算されるため、50/50=1となる。そして、"投資力"のスコア=α11×("投資積極性"ノードのスコア)×α12×("新規投資力"ノードのスコア)で計算されるため、α11=α12=1とすると、1×0.43×1×1=0.43となる。   Here, before the information source is input, the enterprise strength calculation unit 601 calculates the upper layer score based on the initial score of 50 for net assets, 50 for liabilities, 30 for fixed assets, and 70 for current assets. For example, since “investment aggressiveness” score = fixed asset / current asset score, 30 / 70≈0.43, and “new investing power” score = net asset / liability, 50 = 1. Since the score of “investment power” = α11 × (score of “investment aggressiveness” node) × α12 × (score of “new investment power” node), if α11 = α12 = 1, 1 × 0 .43 × 1 × 1 = 0.43.

サービス密度、サービスエリア、周期、製品マッチングの初期値を1、α01〜β21=1とすると、
"地域性"ノードのスコア=(α01×"サービス密度"リーフのスコア)+(α02×"サービスエリア"リーフのスコア)=2、
"需要性"ノードのスコア=(β01×"周期"リーフのスコア)+(β02×"製品マッチング"リーフのスコア)=2
"サービス占有力"ノードのスコア=β11×"地域性"ノードのスコア×β12×"需要性"ノードのスコア=4
となり、"顧客企業のスコア"=α21×"投資力"ノードのスコア×β21×"サービス占有力"=4.93と求まる。
If the initial value of service density, service area, cycle, and product matching is 1, α01 to β21 = 1,
“Regional” node score = (α01 × “service density” leaf score) + (α02 × “service area” leaf score) = 2
“Demand” node score = (β01 × “period” leaf score) + (β02 × “product matching” leaf score) = 2
“Service Occupancy” node score = β11 × “Regional” node score × β12 × “Demand” node score = 4
Thus, “customer company score” = α21 × “investment power” node score × β21 × “service occupancy” = 4.93.

そして、上記の情報源が到着すると、情報源定量化部504は、初期スコアを更新する。すなわち、図50に示す情報源ツリーには、"増資"という単語が含まれ、図46の単語・ノード対応表に同じく"増資"というワードが含まれることから、ノード"純資産"の初期スコアを更新する。この場合、"純資産"リーフと同じく新規投資力ノードのリーフである"負債"リーフの割合は0であるため、スコア配分しない。すなわち、情報源ツリーに"100億円"という単語が含まれるため、"%s円"("%s円"は、"円"の前の数字をノードのスコアとすることを示す。)に対応する"100億"が、"純資産"の初期スコアとなる。   When the information source arrives, the information source quantification unit 504 updates the initial score. That is, since the word “capital increase” is included in the information source tree shown in FIG. 50 and the word “capital increase” is also included in the word / node correspondence table in FIG. 46, the initial score of the node “net asset” is set. Update. In this case, since the ratio of the “debt” leaf, which is the leaf of the new investment power node, is the same as the “net asset” leaf, the score is not allocated. That is, since the word “10 billion yen” is included in the information source tree, “% s yen” (“% s yen” indicates that the number before “yen” is used as the node score). The corresponding “10 billion” is the initial score for “Net assets”.

そして、企業力計算部601は、更新された初期スコアに基づき各ノードのスコアを算出する(ステップS800)。"新規投資力"は、情報源が到着後は150/50=3となる。   The enterprise power calculation unit 601 calculates the score of each node based on the updated initial score (step S800). “New investment power” is 150/50 = 3 after the information source arrives.

ADDIの増資ニュースが流れるたびに、"投資積極性"、"新規投資力"ノードの値が変化する。投資力は投資積極性と新規投資力の掛け算で求められ、係数α11及びα12の値をそれぞれ1とすれば、1.9×3.0=5.7が投資力ノードの値となる。もともと投資力ノードの値は0.42×1.0=0.42であったことから、増分の5.7−0.42=5.28が変化分のスコアであることがわかる。ここで、重みα11とα12は事業ドメインに応じて自由な値としてよい。   Each time ADDI's capital increase news flows, the values of the “investment aggressiveness” and “new investment power” nodes change. The investment power is obtained by multiplying the investment aggressiveness and the new investment power. If the values of the coefficients α11 and α12 are 1, respectively, 1.9 × 3.0 = 5.7 is the value of the investment power node. Since the value of the investment power node was originally 0.42 × 1.0 = 0.42, it can be seen that the increment of 5.7−0.42 = 5.28 is the change score. Here, the weights α11 and α12 may be free values depending on the business domain.

サービス占有力ノードのスコアは、α、βをいずれも1とすると、地域性のスコア×需要性のスコア=4、上記情報源到着前後での変化分は0である。企業力スコア=投資力×サービス占有力であり、5.7×4=22.8が企業力となる。そして、情報源到着前後の企業力の変化分は5.7×4−0.42×4=21.12と求められ、この値が当該情報源のスコアとなる。   As for the score of the service occupancy node, if both α and β are 1, the regional score × demand score = 4, and the change before and after arrival of the information source is 0. The corporate strength score = investment power × service occupation power, and 5.7 × 4 = 22.8 is the corporate strength. The change in the corporate power before and after arrival of the information source is obtained as 5.7 × 4−0.42 × 4 = 21.12, and this value becomes the score of the information source.

本第3の実施例においては、企業力計算部601は、競合、顧客、納入企業ごとに定義した企業力測定ツリーを参照し、過去の情報源の価値を含んだ企業力を元に、今回の情報源によって生成される企業力を算出する。そして、情報源が与えられる前と後の企業力の差分を最終的な情報源のスコアとみなす。これにより、主体者辞書を用いて、ツリーを顧客企業/競合企業/納入企業に分類し、企業タイプごとの評価テンプレートを用いて、情報源の初期スコアを企業力の特質に配分し、過去の企業力を加味して情報源の最終スコアを定量化することができる。なお、本実施例においては、グループ生成部400からのデータを使用して情報源価値を推定し、企業力を推定するものとして説明したが、情報源再構築部200のデータを使用して情報源価値推定及び企業力推定を行なうことも可能である。   In the third embodiment, the enterprise strength calculation unit 601 refers to the enterprise strength measurement tree defined for each competitor, customer, and delivery company, and based on the enterprise strength including the value of past information sources. Calculate the enterprise power generated by the information sources. The difference between the corporate power before and after the information source is given is regarded as the final information source score. This classifies the tree into customer companies / competitors / delivery companies using the subject dictionary, and assigns the initial score of the information source to the characteristics of the company power using the evaluation template for each company type. The final score of the information source can be quantified taking into account the corporate strength. In the present embodiment, the information source value is estimated using the data from the group generation unit 400 and the enterprise power is estimated. However, the information of the information source reconstruction unit 200 is used to obtain information. It is also possible to perform source value estimation and enterprise power estimation.

次に、本実施例の他の動作例について説明する。本例は、生産財メーカが技術的優位性を有することを示す例である。前提として、第2の実施例の結果増殖した事業ドメイン辞書(図39)と、技術辞書(図36)の値を利用する。   Next, another operation example of the present embodiment will be described. This example is an example showing that the producer of product goods has a technical advantage. As a premise, the values of the business domain dictionary (FIG. 39) and the technical dictionary (FIG. 36) which are propagated as a result of the second embodiment are used.

情報源のニュースとして、
"オプト販売は、μレーザを用いたロスレス光伝送装置「FX5000」を開発"
という文字列が情報構造化装置41に入力される。情報構造化装置41はステップS100からステップS400まで実行し、図51に示す情報源ツリーを得る。そして、図35に示す事業ドメイン辞書に"オプト販売"という主体者が主体者として登録されていることから、この情報源が光事業ドメインであると判定し、適合情報源ツリーに分類する(ステップS400)。
As source news,
"Opto Sales develops" FX5000 "lossless optical transmission device using μ laser"
Is input to the information structuring apparatus 41. The information structuring apparatus 41 executes steps S100 to S400 and obtains an information source tree shown in FIG. Then, since the subject “Opt Sales” is registered as the subject in the business domain dictionary shown in FIG. 35, it is determined that this information source is the optical business domain, and the information source is classified into the relevant information source tree (step). S400).

次に、S700において、主体者判定部501は、図34に示す主体者辞書を参照し、主体者"オプト販売"が競合企業であると判定する。そして、情報源格納部503に競合企業情報源ツリーとして格納する。次に、情報源定量化部504は、情報源格納部503の競合企業情報源ツリーを読み出し、図44に示す競合企業力測定ツリーと図46に示す単語・ノード対応表を元に定量化を行う。すなわち、先ず、情報定量化部504により、各企業力測定ツリーの最下層を構成するリーフの初期スコアを算出する。   Next, in S700, the subject determination unit 501 refers to the subject dictionary shown in FIG. 34 and determines that the subject “Opt Sales” is a competitor. Then, it is stored in the information source storage unit 503 as a competitor information source tree. Next, the information source quantification unit 504 reads the competitor company information source tree in the information source storage unit 503, and performs quantification based on the competitor company strength measurement tree shown in FIG. 44 and the word / node correspondence table shown in FIG. Do. That is, first, the information quantification unit 504 calculates the initial score of the leaves that constitute the lowest layer of each enterprise strength measurement tree.

ここで、全てのリーフは、初期スコアとして1が与えられている。競合情報源ツリーには、"開発"というキーワードがあり、図46の単語・ノード対応表から、各リーフスコアが2倍にされることが記載されている。開発力ノードに繋がる各リーフに、当該開発力ノードのスコアを算出する際の割合が定義されている。この割合の値の設定により、ノード間を結ぶリンクに重み付けを与えることができる構造になっており、分析者が重要視する企業特性と、重要視しない企業特性を企業タイプごとに設定できるようになっている。   Here, all the leaves are given 1 as an initial score. There is a keyword “development” in the competitive information source tree, and it is described from the word / node correspondence table in FIG. 46 that each leaf score is doubled. For each leaf connected to the development capability node, a ratio for calculating the score of the development capability node is defined. By setting the ratio value, the link between nodes can be weighted, and the company characteristics that the analyst considers important and the company characteristics that are not considered important can be set for each company type. It has become.

本例においては、開発というワードに対し、拡張関数が設定され、製品バリエーションリーフに0.4、開発スピードリーフに0.2、機能特徴に0.4の割合でスコアを分配するように記載がされている。
拡張関数:2×g(f(製品バリエーション),f(開発スピード),f(特徴))
ここで、
g(param1, param2, param3){
In this example, an extension function is set for the word “development”, and it is described that the score is distributed at a ratio of 0.4 for the product variation leaf, 0.2 for the development speed leaf, and 0.4 for the functional feature. Has been.
Extension function: 2 x g (f (product variation), f (development speed), f (feature))
here,
g (param1, param2, param3) {

if(param1 node==製品バリエーション){
return param1;
}
f(製品バリエーション)=過去のリリース製品の数+1
f(開発スピード)=f(製品バリエーション)/リリース期間の累計
f(特徴)=情報源ツリーの特徴語数
を示す。
if (param1 node == product variation) {
return param1;
}
f (product variation) = number of past released products + 1
f (development speed) = f (product variation) / cumulative release period f (feature) = number of feature words in the information source tree.

オプト製品は、過去に"FX4200"があるため、過去のリリース製品の数は1になる。よって、
f(製品バリエーション)=過去のリリース製品の数+1=2と求まる。

関数gは第1引数に、f(製品バリエーション)の値をそのまま採用するため、
2×g(f(製品バリエーション),f(開発スピード),f(特徴))
=2×f(製品バリエーション)
=2×2
=4
となる。そして単語定量化マップで製品バリエーションリーフへの配分割合が0.4であるため、
製品バリエーションリーフの値=4×0.4=1.6
となる。
Since the opt product has “FX4200” in the past, the number of past released products is one. Therefore,
f (product variation) = the number of past released products + 1 = 2.

Since function g adopts the value of f (product variation) as the first argument as it is,
2 x g (f (product variation), f (development speed), f (feature))
= 2 × f (product variation)
= 2 × 2
= 4
It becomes. And since the distribution ratio to the product variation leaf is 0.4 in the word quantification map,
Product variation leaf value = 4 x 0.4 = 1.6
It becomes.

すなわち、開発というキーワードに対しては、拡張関数の結果を2倍した値を、定量化マップに記載の配分先、配分率で分配し、それぞれのリーフに与える初期スコアを決定する。拡張関数は、3つのパラメータを引数にもち、各引数のリーフの型で返却される値が異なるよう機能する。製品バリエーションリーフの場合には、過去のリリース製品の数に1を足したものを、拡張関数の返却値とする。開発スピードリーフの場合には、各製品のリリース間隔の合計で製品数を割った値を、拡張関数の返却値とする。特徴リーフの場合には、情報源の特徴語数を、拡張関数の返却値とする。   That is, for the keyword “development”, a value obtained by doubling the result of the expansion function is distributed at the distribution destination and distribution rate described in the quantification map, and an initial score to be given to each leaf is determined. The extension function has three parameters as arguments and functions so that the value returned by the leaf type of each argument is different. In the case of the product variation leaf, the return value of the extension function is obtained by adding 1 to the number of past released products. In the case of the development speed leaf, the value obtained by dividing the number of products by the total release interval of each product is the return value of the extension function. In the case of a feature leaf, the number of feature words of the information source is used as the return value of the extension function.

また、オプト販売の前回の商品"FX4200"の情報源の図3に示す時刻情報から遡ると2年前にリリースされていることがわかり、開発スピード下記の計算式で求めことができる。
開発スピードリーフの値=2×オプト販売の全製品/リリース間隔×0.2=2×2/3 ×0.2=0.26
Further, it can be seen that the product was released two years ago from the time information shown in FIG. 3 of the information source of the previous product “FX4200” of Opt Sales, and the development speed can be calculated by the following calculation formula.
Value of development speed leaf = 2 × All products sold by Opt / Release interval × 0.2 = 2 × 2/3 × 0.2 = 0.26

さらに、"FX5000"は、特徴語として、"μレーザ"、"ロスレス光伝送装置"という2つの用語を含むことから、下記の計算式で求めることができる。
機能特徴リーフのスコア=2×特徴語数×0.4=2×2×0.4=1.6
Further, “FX5000” includes two terms “μ laser” and “lossless optical transmission device” as characteristic words, and can be obtained by the following calculation formula.
Score of functional feature leaf = 2 × number of feature words × 0.4 = 2 × 2 × 0.4 = 1.6

次に、企業力計算部601がこれらの初期スコアを使用して各ノードのスコアを算出する(ステップS800)。今回の情報源により、"オプト製品"が2種類になったとすると、リーフが有するスコアと情報源のスコアを掛け合わせ
開発力ノードのスコア=製品バリエーションリーフのスコア+開発スピードリーフのスコア+機能特徴リーフのスコア
=1×1.6+1×0.26+1×1.6
=3.46
と求められる。開発力ノードのスコアが初期値1だとした場合には、今回のスコアとの差分3.6−1.0=2.6が開発力ノードにおける情報源到着前後の増加分となる。顧客利便性、信用力、販売力の初期値を1とすると、
最上位ノード(企業力)のスコア=顧客利便性のスコア+信用力のスコア+販売力のスコア+開発力のスコア
=1+1+1+3.6
=6.6
となる。また、情報源到着前後での企業力の差は、6.6−4.6=2.6であり、この2.6が情報源の最終スコアとなる。
Next, the corporate strength calculation unit 601 calculates the score of each node using these initial scores (step S800). Assuming that there are two types of "Opto Products" due to this information source, the score of the development power node is multiplied by the score of the leaf and the score of the information source = product variation leaf score + development speed leaf score + functional characteristics Leaf score = 1 × 1.6 + 1 × 0.26 + 1 × 1.6
= 3.46
Is required. If the score of the development capability node is an initial value 1, a difference of 3.6-1.0 = 2.6 from the current score is an increase before and after arrival of the information source at the development capability node. If the initial value of customer convenience, creditworthiness, and sales power is 1,
Top node (corporate power) score = customer convenience score + credit score + sales power score + development score = 1 + 1 + 1 + 3.6
= 6.6
It becomes. Also, the difference in corporate power before and after arrival of the information source is 6.6-4.6 = 2.6, and this 2.6 is the final score of the information source.

本実施例においては、情報源に含まれるキーワードと、単語・ノード対応表と、競合企業力測定ツリーの構造と、リーフ値計算式から、各企業の企業力を定量化することができる。さらに、キーワードが有するインパクト(企業力測定ツリーの最上位ノードの差分)を過去の企業活動に照らし合わせて計算するため、情報源のスコアを企業ごとに評価することが可能となる。   In the present embodiment, the enterprise power of each company can be quantified from the keywords included in the information source, the word / node correspondence table, the structure of the competitive enterprise strength measurement tree, and the leaf value calculation formula. Furthermore, since the impact (difference of the highest node of the corporate strength measurement tree) possessed by the keyword is calculated against the past corporate activity, the score of the information source can be evaluated for each enterprise.

本発明の第4の実施例
以下に説明する第4の実施例乃至第8の実施例においては、それぞれ波及力計算部700、需要周期推定部800、潜在購買力推定部900、販売力推定部1000、競争力増強部品推定部1100を設ける。各ブロックは、それぞれ特定の企業力測定ツリーのリーフのスコアを更新する機能を備える。すなわち、波及力計算部700は、一の情報源が競合企業の企業力に与える波及力を算出すると共に、競合企業力測定ツリーの機能特徴リーフのスコアを更新する。需要周期推定部800は、製品の需要周期を推定すると共に、顧客企業力測定ツリーの周期リーフのスコアを更新する。潜在購買力推定部900は、顧客企業の潜在購買力を推定し、販売可能性が高い製品の機能及び価格を推定すると共に、顧客企業力測定ツリーの製品マッチングリーフのスコアを更新する。販売力推定部1000は、企業の販売力を推定すると共に、競合企業力測定ツリーの売り上げ実績リーフのスコアを更新する。競争力増強部品推定部1100は、競争力に影響のある部品を推定すると共に、部品納入企業力測定ツリーの差異化リーフのスコアを更新する。なお、以下の第4乃至第8の実施例においては、グループ生成部400が出力する適合情報源ツリーを使用して各処理を実行するものとして説明するが、情報源再構築部200が抽出した要素単語を使用して各処理を実行することも可能である。先ず、本発明の第4の実施例について説明する。
Fourth Embodiment of the Invention In the fourth to eighth embodiments described below, a ripple force calculation unit 700, a demand cycle estimation unit 800, a potential purchasing power estimation unit 900, and a sales force estimation unit 1000, respectively. A competitiveness enhancement component estimation unit 1100 is provided. Each block has a function of updating the score of a leaf of a specific enterprise strength measurement tree. In other words, the ripple force calculation unit 700 calculates the ripple force that one information source gives to the enterprise power of a competitor, and updates the score of the functional feature leaf of the competitor strength measurement tree. The demand cycle estimation unit 800 estimates the demand cycle of the product and updates the score of the cycle leaf of the customer enterprise strength measurement tree. The potential purchasing power estimation unit 900 estimates the potential purchasing power of a customer company, estimates the function and price of a product with high sales potential, and updates the score of the product matching leaf in the customer company power measurement tree. The sales force estimation unit 1000 estimates the sales force of the company and updates the score of the sales performance leaf in the competitive company power measurement tree. The competitiveness-enhancing component estimation unit 1100 estimates components that have an impact on competitiveness, and updates the score of the differentiated leaf in the component supplier enterprise strength measurement tree. In the following fourth to eighth embodiments, description will be made on the assumption that each process is executed using the matching information source tree output from the group generation unit 400, but the information source reconstruction unit 200 extracts it. It is also possible to execute each process using element words. First, a fourth embodiment of the present invention will be described.

図52は、本実施例にかかる情報構造化装置41を示す図である。本実施例は、過去の情報源を辿ることで、現在の情報源の影響範囲を直接記載されていない企業にまで及ばせるものである。本情報構造化装置41は、図52に示すように、第3の実施例における情報構造化装置31に、定量化装置32として波及力計算部700を更に設ける構成を有する。その他の構成は、第3の実施例と同様であり、その詳細な説明は省略する。本第4の実施例は、部品メーカが技術的優位性を有することを示す例である。   FIG. 52 is a diagram illustrating the information structuring apparatus 41 according to the present embodiment. In this embodiment, the range of influence of the current information source can be extended to companies that are not directly described by tracing past information sources. As shown in FIG. 52, the information structuring apparatus 41 has a configuration in which a ripple force calculation unit 700 is further provided as the quantification apparatus 32 in the information structuring apparatus 31 in the third embodiment. Other configurations are the same as those of the third embodiment, and detailed description thereof is omitted. The fourth embodiment is an example showing that a component manufacturer has a technical advantage.

図53は、本実施例における波及力計算部700を示すブロック図である。図53に示すように、波及力計算部700は、納入業者の部品納入情報源選別部701、納入先企業抽出部702、特徴語列挙部703、近距離用語抽出部704、及び波及力計算部705を有する。この波及力計算部700は、情報源の影響範囲及び影響力を技術辞書を用いて推定する。情報源に含まれる特徴語が技術辞書に登録されていた場合、その特徴語と近い距離の別の特徴語を列挙する。情報源に含まれるターゲット企業が、列挙された特徴語に関連する商品を過去に開発していた場合に、技術的な距離から波及スコアを計算する。各ブロックについて詳述する。   FIG. 53 is a block diagram illustrating the ripple force calculation unit 700 in the present embodiment. As shown in FIG. 53, the ripple force calculation unit 700 includes a supplier parts delivery information source selection unit 701, a destination company extraction unit 702, a feature word enumeration unit 703, a short-term term extraction unit 704, and a ripple force calculation unit. 705. The ripple force calculation unit 700 estimates the influence range and influence of an information source using a technical dictionary. When a feature word included in the information source is registered in the technical dictionary, another feature word at a distance close to the feature word is listed. When the target company included in the information source has developed products related to the listed feature words in the past, a ripple score is calculated from the technical distance. Each block will be described in detail.

部品納入情報源選別部701は、情報源ツリーの中から納入業者の部品納入情報源ツリーのみ抽出する。納入先企業抽出部702は、部品の納入先企業、すなわち部品を購入した競合企業を抽出し、その競合企業がリリースした製品のニュースを抽出する。特徴語列挙部703は、競合企業の製品リリース情報に含まれる特徴語を全て列挙する。近距離用語抽出部704は、部品の特徴語を含む技術用語が技術辞書にあるか調査し、ある閾値以下のものを全て列挙する。波及力計算部705は、特徴語列挙部703で列挙した単語集合と、近距離用語抽出部704で列挙した単語集合を比較し、一致するものがあれば納入部品が製品に採用された可能性が高いと判定する。波及力計算部705は、近距離用語抽出部704にて抽出した技術用語の距離の逆数(波及係数)と、部品納入企業力測定ツリーから求まる情報源価値を掛け合わせた波及力を、競合企業力測定ツリーを構成する機能特徴リーフの初期スコアに加算する。   The parts delivery information source selection unit 701 extracts only the parts delivery information source tree of the supplier from the information source tree. The delivery destination company extraction unit 702 extracts a delivery destination company of a part, that is, a competitor company that purchased the part, and extracts news of products released by the competitor company. The feature word enumeration unit 703 lists all the feature words included in the product release information of competitors. The short-term term extraction unit 704 checks whether a technical term including a feature word of a part exists in the technical dictionary, and enumerates all terms having a certain threshold value or less. The ripple force calculation unit 705 compares the word set enumerated by the feature word enumeration unit 703 and the word set enumerated by the short-range term extraction unit 704, and if there is a match, there is a possibility that the delivered part has been adopted for the product Is determined to be high. The ripple force calculation unit 705 calculates the ripple force obtained by multiplying the reciprocal of the distance of the technical term extracted by the short-term term extraction unit 704 (the ripple coefficient) by the information source value obtained from the parts delivery company strength measurement tree. Add to the initial score of the functional feature leaf that makes up the force measurement tree.

このことにより、過去の情報源ツリーをたどることで、現在の情報源の影響範囲が直接記載されていない企業にまでは波及スコアを及ばせることができる。例えば、部品納入業者のニュースは、部品納入企業ツリー(図45)という閉じた系により、初期スコアを算出していたのに対し、競合企業ツリー(図44)に波及スコアを与える仕組みを導入することにより、すなわち、波及スコアを競合企業ツリーの機能特徴リーフに割り当てることにより、部品納入業者のニュースが競合企業ツリーのリーフ値に影響を及ぼすことができる。これらにより、情報源を事業ドメインに合致したものに分類し、合致した情報源のスコアのみを単語スコアと企業力スコアから算出することで、露出度の高い企業や商品を、新たな取引先として選別することができる。   As a result, by following the past information source tree, it is possible to reach a ripple score to companies that do not directly describe the influence range of the current information source. For example, in the case of parts supplier news, an initial score is calculated by a closed system called a parts supplier company tree (FIG. 45), whereas a mechanism for giving a ripple score to a competitor company tree (FIG. 44) is introduced. In other words, by assigning the ripple score to the functional feature leaf of the competitor tree, the parts supplier news can affect the leaf value of the competitor tree. By classifying information sources into those that match the business domain, and calculating only the score of the matched information source from the word score and corporate strength score, companies and products with high exposure can be used as new business partners. Can be sorted.

図54のフローチャートを参照して、本発明の第4の実施例の動作について詳細に説明する。前提として、第2の実施例の結果増殖した事業ドメイン辞書(図39)と、技術辞書(図36)の値を利用する。   The operation of the fourth embodiment of the present invention will be described in detail with reference to the flowchart of FIG. As a premise, the values of the business domain dictionary (FIG. 39) and the technical dictionary (FIG. 36) which are propagated as a result of the second embodiment are used.

情報源のニュースとして、
"新川電工は、ラマン方式で世界最高レベルの増幅モジュール「A200R」を開発"
という文字列が情報構造化装置51に入力されるとする。情報構造化装置51はステップS100からステップS600まで実行し、技術辞書に"ラマン方式"というキーワードがあることから、この情報源が光事業ドメイン(適合情報源ツリー)であると判定する。主体者判定部501は、主体者が競合企業か納入企業か又は顧客企業かを判別するため、図56に示す主体者辞書を参照する。これにより、新川電工が納入企業であると判定し、情報源格納部503に、納入企業情報源ツリーとして格納する。
As source news,
"Shinkawa Electric develops the world's highest level amplification module" A200R "by Raman method"
Is input to the information structuring apparatus 51. The information structuring apparatus 51 executes steps S100 to S600, and determines that this information source is the optical business domain (conforming information source tree) because there is a keyword “Raman” in the technical dictionary. The subject determination unit 501 refers to the subject dictionary shown in FIG. 56 in order to determine whether the subject is a competitor, a delivery company, or a customer company. As a result, Shinkawa Electric is determined to be a delivery company, and is stored in the information source storage unit 503 as a delivery company information source tree.

情報源定量化部504は、情報源格納部503の納入企業情報源ツリーを読み出し(ステップS421)、初期スコアを算出する(ステップS700)。図45に示す部品納入企業力測定ツリーと図46に示す単語・ノード対応表を元に定量化を行う。情報源ツリーには、「開発」というキーワードがあり、図45の単語・ノード対応表から、スコアが2倍にされることが記載されている。また、製品バリエーションリーフに0.4、開発スピードリーフに0.2、部品最高性能順位リーフに0.4の割合でスコアを分配するように記載がされている。全てのリーフは初期値として1が与えられている。事業ドメイン辞書を参照すると、過去にA200Rという製品はないことが分かるため、新製品であることが分かり、部品バリエーションリーフは下記の計算式で求めることができる。
部品バリエーションリーフの値=2×過去の部品バリエーションリーフの値×0.4=2×1×0.4=0.8
開発スピードリーフの値=2×前回の製品リリース次期からの経過時間(月)/12×0.2=2×1×0.2=0.2
部品最高性能順位リーフの値=2×{e^{−(order−1)}+1}×0.4=2×2×0.4=1.6
The information source quantification unit 504 reads the delivery company information source tree in the information source storage unit 503 (step S421), and calculates an initial score (step S700). Quantification is performed based on the parts delivery company strength measurement tree shown in FIG. 45 and the word / node correspondence table shown in FIG. There is a keyword “development” in the information source tree, and it is described from the word / node correspondence table of FIG. 45 that the score is doubled. In addition, the score is distributed in a ratio of 0.4 for the product variation leaf, 0.2 for the development speed leaf, and 0.4 for the component highest performance ranking leaf. All leaves are given an initial value of 1. By referring to the business domain dictionary, it can be seen that there is no A200R product in the past, so it can be seen that it is a new product, and the component variation leaf can be obtained by the following calculation formula.
Component variation leaf value = 2 × Past component variation leaf value × 0.4 = 2 × 1 × 0.4 = 0.8
Development speed leaf value = 2 x Elapsed time from the previous product release (month) / 12 x 0.2 = 2 x 1 x 0.2 = 0.2
Value of component highest performance ranking leaf = 2 × {e ^ {− (order−1)} + 1} × 0.4 = 2 × 2 × 0.4 = 1.6

次に、企業力計算部601が最終スコアを算出する(ステップS800)。ここで、企業力計算部601は、情報源ツリーの主体者を判断し、主体者が顧客企業又は納入企業である場合にのみ最終スコアを算出する。主体者が競合企業である場合は、後述の波及力計算を行なってから最終スコアを算出する。本例においては、納入企業の情報源であるため、その最終スコアを算出する。すなわち、先ず、納入企業力測定ツリーにおける開発力ノードスコアは次のような計算式で求めることができる。
開発力=0.8+0.2+1.6=2.6
顧客利便性や信用力が初期値のまま1であり、中間ノードの係数α、β、γも値が1であったとすると、部品納入企業の企業力値は、
部品納入企業の値=顧客利便性+信用力+開発力=1+1+2.6=4.6
となる。情報源の入力前では、部品納入企業の値は合計3であったため、増加分4.6−3.0=1.6が情報源のスコア(価値)として求まる。
Next, the corporate strength calculation unit 601 calculates a final score (step S800). Here, the enterprise power calculation unit 601 determines the subject of the information source tree, and calculates the final score only when the subject is a customer company or a delivery company. If the subject is a competitor, the final score is calculated after calculating the ripple force described later. In this example, since it is an information source of a delivery company, its final score is calculated. That is, first, the development ability node score in the delivered company ability measurement tree can be obtained by the following calculation formula.
Development capability = 0.8 + 0.2 + 1.6 = 2.6
Assuming that the customer convenience and creditworthiness are 1 at the initial value, and the coefficients α, β, and γ of the intermediate nodes are also 1, the company power value of the parts delivery company is
Value of parts supplier = customer convenience + creditworthiness + development ability = 1 + 1 + 2.6 = 4.6
It becomes. Before the input of the information source, the value of the parts delivery company was 3 in total, so an increment of 4.6-3.0 = 1.6 is obtained as the score (value) of the information source.

さらに情報源のニュースとして、
"新川電工、光増幅モジュール「A200R」をオプト販売に納入"
という文字列が情報構造化装置51に入力された場合には、情報構造化装置51はステップS100からステップS400まで実行し、図56に示す情報源ツリーを得る。そして、技術辞書に"光増幅"というキーワードがあることから、この情報源が光事業ドメイン(適合情報源ツリー)であると判定する(ステップS500、S600)。主体者判定部501は、主体者が競合企業か納入企業かを判別するため、図55に示す主体者辞書を参照する。これにより、新川電工が納入企業であると判定し、情報源格納部503に、納入企業情報源ツリーとして格納する。
As news sources,
"Shinkawa Electric Co., Ltd. Delivered Optical Amplifier Module" A200R "to Opt Sales"
Is input to the information structuring apparatus 51, the information structuring apparatus 51 executes steps S100 to S400 to obtain the information source tree shown in FIG. Since there is a keyword “optical amplification” in the technical dictionary, it is determined that this information source is the optical business domain (compatible information source tree) (steps S500 and S600). The subject determination unit 501 refers to the subject dictionary shown in FIG. 55 in order to determine whether the subject is a competitor or a delivery company. As a result, Shinkawa Electric is determined to be a delivery company, and is stored in the information source storage unit 503 as a delivery company information source tree.

そして、同様に、情報源定量化部504により初期スコアを算出し、企業力計算部601は主体者が競合企業以外の場合は、初期スコアに基づき最終スコアを算出する(ステップS700、800)。すなわち、主体者判定部501は、図34に示す主体者辞書を参照し、主体者"新川電工"が納入企業であると判定し、情報源格納部503に納入企業情報源ツリーとして格納する。そして、情報源定量化部504は、この納入企業情報源ツリーを読み出し、図45に示す納入企業力測定ツリーと図46に示す単語定量化マップを元に、当該情報源ツリーの各要素単語の初期スコアを算出する(ステップS700)。そして、企業力計算部601は、更新された初期スコアに基づき各ノードのスコアを算出する(ステップS800)。   Similarly, the information source quantification unit 504 calculates an initial score, and the enterprise power calculation unit 601 calculates a final score based on the initial score when the subject is not a competitor (steps S700 and S800). That is, the subject determination unit 501 refers to the subject dictionary shown in FIG. 34, determines that the subject “Shinkawa Electric” is a delivery company, and stores it in the information source storage unit 503 as a delivery company information source tree. Then, the information source quantification unit 504 reads this delivery company information source tree, and based on the delivery company power measurement tree shown in FIG. 45 and the word quantification map shown in FIG. An initial score is calculated (step S700). The enterprise power calculation unit 601 calculates the score of each node based on the updated initial score (step S800).

次に、波及力計算部700により競合企業の企業力ツリーの機能特徴ノードのスコアに乗算する波及スコアを計算する(ステップS900)。波及力計算部700には、情報源価値推定部500と同様の情報源ツリーのデータが入力される。図57は、波及力算出方法の詳細を示すフローチャートである。先ず、部品納入情報源選別部701が適用情報源ツリーの集合から納入元企業(納入企業)の情報源ツリーを選別する(ステップS421)。次いで、納入先企業抽出部702は、抽出した情報源ツリーの主体者(納入元企業)の納入先企業(競合企業)に関する製品ニュースの情報源があるか否かを、適合情報源ツリー格納部303にて検索する(ステップS422)。ここでは、"新川電工"の納入先である"オプト販売"に関する製品ニュースがあるか否かを検索する。そして、"オプト販売は、μレーザを用いたロスレス光伝送装置「FX5000」を開発"の情報源があることを発見する。そして、特徴語列挙部703は、S422にて抽出された情報源(製品ニュース)から特徴語を抽出する(ステップS424)。ここでは、"μレーザ"、"ロスレス伝送装置"の特徴語を抽出する。   Next, the ripple force calculation unit 700 calculates a ripple score that is multiplied by the score of the functional feature node of the business force tree of the competitor (step S900). The information source tree data similar to the information source value estimation unit 500 is input to the ripple force calculation unit 700. FIG. 57 is a flowchart showing details of the ripple force calculation method. First, the parts delivery information source selection unit 701 selects an information source tree of a delivery source company (delivery company) from a set of applied information source trees (step S421). Next, the delivery destination company extraction unit 702 determines whether or not there is an information source of product news related to the delivery destination company (competitor) of the subject of the extracted information source tree (delivery source company). A search is made at 303 (step S422). Here, it is searched whether or not there is product news related to “Opt sales” to which “Shinkawa Electric” is delivered. Then, it is discovered that there is an information source of “Opto Sales develops lossless optical transmission device“ FX5000 ”using μ laser.” Then, the feature word enumeration unit 703 extracts the information source extracted in S422 ( Feature words are extracted from (product news) (step S424) Here, feature words of “μ laser” and “lossless transmission device” are extracted.

一方、近距離用語抽出部704は、技術辞書格納部402の技術辞書を参照し、S421で選別した納入元企業の情報源ツリーに含まれる特徴語と部分一致、又は完全一致の単語があるか否かを検索する(ステップS423)。ここでは、情報源ツリーにおける"光増幅モジュール"が図36に示す技術辞書に存在するか探索し、"DWDM"ノードの子ノードに"光増幅"ノードが存在することがわかる。これにより、光増幅の向上が、DWDMの向上になることが判明する。すなわち、技術辞書において、上位要素は下位要素から構成されるため、下位要素で優れた部品があれば、それに伴い上位要素の製品の差異化につながる。そして、部分一致又は完全一致した単語との距離が所定の閾値以下の単語を抽出する(ステップS425)。ここでは、"光増幅"から距離1.5以下を抽出するものとすると、"DWDM"(距離0.3)、"光アクセス"(距離0.6)、"光伝送装置"(距離1.3)の3つが抽出される。   On the other hand, the short-range term extraction unit 704 refers to the technical dictionary in the technical dictionary storage unit 402, and whether there is a word that partially matches or completely matches the feature word included in the information source tree of the supplier company selected in S421. Whether or not is searched (step S423). Here, it is found whether the “light amplification module” in the information source tree exists in the technical dictionary shown in FIG. 36, and it is found that the “light amplification” node exists as a child node of the “DWDM” node. Thereby, it is found that the improvement of optical amplification becomes the improvement of DWDM. That is, in the technical dictionary, the upper element is composed of lower elements, so if there is an excellent part in the lower element, it leads to the differentiation of the products of the upper element. Then, a word whose distance from the partially matched or completely matched word is not more than a predetermined threshold is extracted (step S425). Here, assuming that a distance of 1.5 or less is extracted from “optical amplification”, “DWDM” (distance 0.3), “optical access” (distance 0.6), and “optical transmission device” (distance 1. Three of 3) are extracted.

波及力計算部705は、特徴語列挙部703が列挙した特徴語と、近距離用語抽出部が列挙した技術単語とを比較し(ステップS426)、一部又は全部が一致するものがあるか否かを判定し(ステップS427)、一致するものがある場合は、その波及スコアを計算する。ここでは、ステップS424で列挙された"ロスレス伝送装置"と、ステップS425で列挙された"光伝送装置"とにおいて。"伝送装置"で一致する。一致した場合、一致した記述単語と、情報源ツリーの単語と一致した技術用語との距離の逆数が波及係数となる。波及係数は、納入企業の情報源の価値に乗算され、この値が納入先企業(競合企業)の企業力測定ツリー(図44)における機能特徴リーフのスコアに加算される。すなわち、波及力計算部は、ステップS428にて、"光増幅"ノードと"光伝送装置"ノードとの距離1.3の逆数≒0.77を求める。
波及力=競合企業測定ツリーの機能特徴リーフの増加分スコア=波及係数×部品納入企業の情報源のスコア(価値)=0.77×1.6=1.232
The ripple force calculation unit 705 compares the feature words enumerated by the feature word enumeration unit 703 with the technical words enumerated by the short-distance term extraction unit (step S426), and whether or not there is a partial or complete match. (Step S427), and if there is a match, the propagation score is calculated. Here, in the “lossless transmission apparatus” enumerated in step S424 and the “optical transmission apparatus” enumerated in step S425. Matches with "Transmission device". In the case of a match, the reciprocal of the distance between the matched description word and the technical term that matches the word in the information source tree is the ripple coefficient. The ripple coefficient is multiplied by the value of the information source of the delivery company, and this value is added to the score of the functional feature leaf in the enterprise strength measurement tree (FIG. 44) of the delivery destination company (competitor company). That is, in step S428, the ripple force calculation unit obtains the reciprocal of the distance 1.3 between the “optical amplification” node and the “optical transmission device” node≈0.77.
Ripple force = Functional feature of competitor measurement tree Increase score of leaf = Ripple coefficient × Score (value) of information source of parts supplier company = 0.77 × 1.6 = 1.232

こうして、機能特徴リーフの初期スコア1に波及力1.232が加算されて更新され、この更新された初期スコアに基づき、企業力計算部601が情報源のスコアを算出する。なお、本実施例においては、適合情報源ツリーから波及力を算出するものとして説明したが、波及力計算部700が技術辞書又は事業ドメイン辞書を参照し、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。   In this way, the initial value 1 of the functional feature leaf is updated by adding the ripple force 1.232, and based on the updated initial score, the enterprise power calculation unit 601 calculates the score of the information source. Although the present embodiment has been described on the assumption that the ripple force is calculated from the conforming information source tree, the ripple force calculating unit 700 refers to the technical dictionary or the business domain dictionary, and the conforming information source is derived from the information source tree or the information source. A tree or compatible information source may be extracted.

本実施例においては、主体者企業辞書を用いることで生産財メーカ企業と部品メーカ企業を区別し、部品の特徴語から性能順位を推定するため、部品業者の技術優位性を測定することが可能になっている。また、部品の技術優位性のニュースと納入先(競合企業)のニュースを複合して評価するため、部品を採用している企業の技術優位性も更新することができる。さらに、波及力により競合企業の機能特徴リーフを増加させ、競合企業の企業力に影響を及ぼすことができる。   In this example, by using the subject company dictionary, it is possible to measure the technical superiority of the parts supplier because it distinguishes between the producer goods company and the parts manufacturer company and estimates the performance ranking from the feature words of the parts. It has become. In addition, since the technical superiority news of parts and the news of the delivery destination (competitor) are evaluated in combination, the technical superiority of the companies adopting the parts can be updated. Furthermore, it is possible to increase the functional feature leaf of competitors by the ripple effect and influence the corporate strength of competitors.

本発明の第5の実施例
次に、本発明の第5の実施例について説明する。本実施例は、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定するものである。上述の第4の実施例は、企業をフォーカスし、どの企業が活発に活動しているか等の企業力を測定するものであったのに対し、本実施例においては、商品にフォーカスをあて、どのような商品が売れているかを知ることで、例えば第4の実施例のどのような企業が活発かという情報と共に、商品開発にあたり、どのような視点をもって商品をつくるかを分析することができる。
Fifth Embodiment of the Invention Next, a fifth embodiment of the present invention will be described. In this embodiment, the best selling products are listed from both the customer's production goods purchase history and the competitor's production goods sales history, and the replacement demand period is estimated. While the fourth embodiment described above focuses on companies and measures corporate power such as which companies are actively active, in this embodiment, the focus is on products. Knowing what products are being sold, for example, it is possible to analyze what kind of viewpoint the products are made with when developing products together with information on what kind of companies are active in the fourth embodiment. .

図58は、本実施例における需要周期を示す図である。横軸に時間、縦軸に需要をとればある商品の需要周期を表すことができる。ここで、情報源から、ある商品Pを競合企業が納入した量D1及びある商品を顧客企業が購入した量D2を抽出し、両者を加算すれば、そのときの商品Pの需要がわかる。なお、加算する際には、競合企業の納入先が購入した顧客企業である場合を除いている。また、納入実績や購入実績などからどの企業が活発に活動しているかも判断することができ、本実施例においては、これらの情報を合わせて表示部に表示することが可能である。   FIG. 58 is a diagram showing a demand cycle in the present embodiment. If time is taken on the horizontal axis and demand is taken on the vertical axis, the demand cycle of a product can be expressed. Here, from the information source, the quantity D1 of a certain product P delivered by a competitor and the quantity D2 of a customer company purchased a certain product are extracted and added together, so that the demand for the product P at that time can be known. In addition, when adding, the case where the delivery destination of a competitor is the customer company which purchased is excluded. In addition, it is possible to determine which company is actively working from the delivery record and purchase record, and in this embodiment, it is possible to display these information together on the display unit.

図59は、本発明の第5の実施例にかかる情報構造化装置51を示す図である。本情報構造化装置51は、図59に示すように、第4の実施例における情報構造化装置41に、定量化部52として需要周期推定部800を更に設ける構成を有する。その他の構成は、第4の実施例と同様であり、その詳細な説明は省略する。本実施例は、商品需要を推定すると共に、その推定結果を、図43に示す顧客企業力測定ツリーの周期リーフに反映させる。   FIG. 59 is a diagram showing an information structuring apparatus 51 according to the fifth example of the present invention. As shown in FIG. 59, the information structuring apparatus 51 has a configuration in which a demand cycle estimation unit 800 is further provided as the quantification unit 52 in the information structuring apparatus 41 in the fourth embodiment. Other configurations are the same as those of the fourth embodiment, and a detailed description thereof will be omitted. In the present embodiment, the demand for goods is estimated and the estimation result is reflected in the periodic leaf of the customer enterprise strength measurement tree shown in FIG.

図60は、本実施例における需要周期推定部800を示すブロック図である。図60に示すように、需要周期推定部800は、製品採用情報選別部801、製品納入情報選別部802、重複検知部803、月間累計カウンタ804、及び商品需要表示部805を有する。   FIG. 60 is a block diagram illustrating the demand cycle estimation unit 800 in the present embodiment. As shown in FIG. 60, the demand cycle estimation unit 800 includes a product adoption information selection unit 801, a product delivery information selection unit 802, a duplication detection unit 803, a monthly cumulative counter 804, and a product demand display unit 805.

需要周期推定部800は、顧客企業と競合企業のニュースが、市場全体の需要を予測するデータを生成するように動作する。分析した月におけるグラフの勾配に対し、sin関数を適用した値を、顧客企業力測定ツリーの周期リーフの値として採用する。   The demand cycle estimation unit 800 operates such that news of customer companies and competitors generates data for predicting demand in the entire market. A value obtained by applying the sine function to the gradient of the graph in the analyzed month is adopted as the value of the periodic leaf of the customer enterprise strength measurement tree.

すなわち、需要周期推定部800の製品採用情報選別部801及び製品納入情報選別部802が、それぞれ顧客の生産財購入・採用ニュースと、競合他社の生産財販売・納入実績ニュースを、情報源格納部503から抽出する。重複検知部803は、製品採用情報選別部801が情報源格納部503から抽出した情報源ツリーに含まれる採用製品及び納入元を抽出し、製品納入情報選別部802が情報源格納部503から抽出した情報源ツリーに含まれる納入商品及び納入先を抽出し、製品名が一致するか否か、納入先と納入元が一致するか否かを判断する。同じ製品か否かの判定は、技術辞書の最上位ノードの子供ノード(DWDM又はSONET/SDH)以下の特徴語を含むか否かで判定することができる。一致する場合は、その分の製品納入量(採用量)を全体の納入量(採用量)から減じる。月間累計カウンタ804は、重複検知部803の検知結果に基づき、横軸に時間推移を、縦軸に同じ商品グループに分類されている商品の売り上げ実績をプロットし、図58に示すような商品需要周期グラフを生成する。これによって、周期的に発生する生産財の置き換え需要の傾向を予測し、これを商品需要表示部805にて表示することにより、ある商品グループの需要が下がっているのか、上がっているのかを製品毎に提示することができる。   In other words, the product adoption information selection unit 801 and the product delivery information selection unit 802 of the demand cycle estimation unit 800 respectively provide customer production goods purchase / recruitment news and competitors' production goods sales / delivery result news as information source storage units. Extract from 503. The duplicate detection unit 803 extracts the adopted product and the delivery source included in the information source tree extracted from the information source storage unit 503 by the product adoption information selection unit 801, and the product delivery information selection unit 802 extracts from the information source storage unit 503. The delivery product and delivery destination included in the information source tree are extracted, and it is determined whether or not the product names match and the delivery destination and delivery source match. The determination as to whether or not they are the same product can be made based on whether or not they include feature words below the child node (DWDM or SONET / SDH) of the top node of the technical dictionary. If they match, the product delivery amount (adopted amount) is subtracted from the total delivered amount (adopted amount). The monthly cumulative counter 804 plots the time transition on the horizontal axis and the sales results of the products classified into the same product group on the vertical axis based on the detection result of the duplication detection unit 803, and the product demand as shown in FIG. Generate a periodic graph. As a result, the trend of replacement demand for production goods that occurs periodically is predicted and displayed on the product demand display unit 805 to determine whether the demand of a certain product group has decreased or increased. Can be presented every time.

さらに、企業力計算部601は、この需要勾配の数値を顧客企業力測定ツリーの周期の初期スコアに置き換える。需要周期推定部800によって、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定することができる。従来、競合他社のどの製品がどれだけ売れているのか、分かりづらく、また、顧客の反応が直接見えないため、どのような需要があるのか分かりづらいという課題があったが、本実施例によりこれを解決する。   Furthermore, the enterprise strength calculation unit 601 replaces the numerical value of the demand gradient with the initial score of the period of the customer enterprise strength measurement tree. The demand cycle estimation unit 800 can list the best-selling products and estimate the replacement demand period from both the customer's production goods purchase history and the competitor's production goods sales history. Conventionally, it has been difficult to understand how many products of competitors are selling, and it has been difficult to understand what kind of demand there is because the customer's reaction is not directly visible. To solve.

図61のフローチャートを参照して、本発明の第5の実施例の動作について詳細に説明する。
"NEE、オプト販売の「FX4200」をアメリカ〜日本のバックボーン回線に採用"
というニュースが到着したとする。NEEは顧客企業であるため、製品採用情報選別部801により、この情報源格納部503からこの製品採用情報源ツリーが検出され(ステップS431)、採用製品及び納入元が列挙される(ステップS432)。本例では、採用製品が"FX4200"で、納入元は"オプト販売"となる。次に、製品納入情報選別部802が情報源格納部503に格納されている過去の情報源から、競合企業の製品納入情報源ツリーとして
"オプト販売が光増幅をラマン方式とする「FX4200」をNEEへ納入"
を検出し(ステップS433)、その納入商品の納入先を列挙する(ステップS434)。本例では、納入商品が"FX4200"で、納入先が"NEE"となる。
The operation of the fifth embodiment of the present invention will be described in detail with reference to the flowchart of FIG.
"NEE adopts" FX4200 "sold by Opt for US-Japan backbone line"
The news arrives. Since NEE is a customer company, the product adoption information sorting unit 801 detects the product adoption information source tree from the information source storage unit 503 (step S431), and lists the adopted products and the delivery source (step S432). . In this example, the adopted product is “FX4200” and the delivery source is “Opt sales”. Next, the product delivery information selection unit 802 creates a product delivery information source tree of competitors from the past information sources stored in the information source storage unit 503.
"Opto Sales Deliver" FX4200 "with Raman Method for Optical Amplification to NEE"
Are detected (step S433), and the delivery destinations of the delivered goods are listed (step S434). In this example, the delivered product is “FX4200” and the delivery destination is “NEE”.

次いで、重複検知部803により、製品名、納入先、納入元が一致しているか判定される。全て一致の場合は、2つの情報源が重複したと判定する。本例では製品名が一致ため、2つの情報は1つの売り上げ(製品販売)として月別需要に加算する(ステップS436)。製品名、納入先、納入元のいずれも一致しない場合は、別個の需要・供給として月別需要に加算する(ステップS438)。同様に顧客企業の採用情報、及び競合企業の納入情報で製品売り上げを月別に計上する。例えば、4月が5売り上げ、5月が6売り上げ、6月が5売り上げという結果になったとする。この場合、4月から6月までの3ヶ月の売り上げ結果(需要)を用いてベジエ曲線を描く(ステップS437)。本例では、5月の増加率はsin(BezierFunction(5,6,5))=sin(0)=0となる。すなわち、需要は横ばい傾向であることが推定できる。このベジエ曲線を商品需要表示部805により表示する。   Next, the duplicate detection unit 803 determines whether the product name, delivery destination, and delivery source match. If all match, it is determined that the two information sources are duplicated. In this example, since the product names match, the two pieces of information are added to the monthly demand as one sale (product sales) (step S436). If none of the product name, delivery destination, and delivery source match, the monthly demand is added as a separate supply / demand (step S438). Similarly, sales of products are recorded on a monthly basis based on customer company recruitment information and competitors' delivery information. For example, suppose that April has 5 sales, May has 6 sales, and June has 5 sales. In this case, a Bezier curve is drawn using the sales results (demand) for three months from April to June (step S437). In this example, the increase rate in May is sin (BezierFunction (5,6,5)) = sin (0) = 0. That is, it can be estimated that the demand tends to be flat. This Bezier curve is displayed by the commodity demand display unit 805.

なお、本実施例においては、適合情報源ツリーを用いて需要周期を推定するものとして説明したが、需要周期推定部800がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。   In the present embodiment, the demand period is estimated using the conforming information source tree. However, the demand period estimating unit 800 refers to the domain dictionary or the technical dictionary and adapts from the information source tree or the information source. An information source tree or a compatible information source may be extracted.

本実施例においては、顧客に関する情報と競合他社に関する情報を組み合わせ、及び情報源の等価性を用いることで商品需要の推定が可能となる。すなわち、顧客の生産財購入履歴、競合他社の生産財販売履歴の双方から、売れ筋商品をリストアップするとともに、置き換え需要時期を推定することができる。   In this embodiment, the demand for goods can be estimated by combining information about customers and information about competitors and using equivalence of information sources. That is, it is possible to list the best-selling products and estimate the replacement demand period from both the customer's production goods purchase history and the competitor's production goods sales history.

本発明の第6の実施例
次に、本発明の第6の実施例について説明する。図62は、本発明の第6の実施例にかかる情報構造化装置61を示す図である。本実施例は、財務諸表と、顧客の生産財購入履歴、又は競合他社の販売実績から、顧客の潜在購買力を推定し、優良顧客を推定するものである。本実施例にかかる情報構造化装置61は、図62に示すように、第5の実施例における情報構造化装置51に、定量化装置62として潜在購買力推定部900を更に設ける構成を有する。その他の構成は、第5の実施例と同様であり、その詳細な説明は省略する。
Sixth Embodiment of the Invention Next, a sixth embodiment of the present invention will be described. FIG. 62 is a diagram showing an information structuring apparatus 61 according to the sixth example of the present invention. In the present embodiment, the potential purchasing power of a customer is estimated from the financial statements and the customer's production goods purchase history, or the sales performance of competitors, and a good customer is estimated. As shown in FIG. 62, the information structuring apparatus 61 according to the present embodiment has a configuration in which a potential purchasing power estimation unit 900 is further provided as the quantification apparatus 62 in the information structuring apparatus 51 in the fifth embodiment. Other configurations are the same as those of the fifth embodiment, and detailed description thereof is omitted.

図63は、本実施例における潜在購買力推定部900を示すブロック図である。図63に示すように、第5の実施例における需要周期推定部800の製品採用情報選別部801、製品納入情報選別部802、及び重複検知部803と共に潜在購買力推定部900を構成する。潜在購買力推定部900は、さらに、他社製品特徴語選別部904、自社類似製品選別部905、他社製品採用顧客選別部906、財務情報取得部907、投資実績計算部908、投資類似度計算部909、顧客集合選別部910、及び他社製品未採用顧客選別部911を有する。   FIG. 63 is a block diagram showing a potential purchasing power estimation unit 900 in the present embodiment. As shown in FIG. 63, the potential purchasing power estimation unit 900 is configured together with the product adoption information selection unit 801, the product delivery information selection unit 802, and the duplication detection unit 803 of the demand cycle estimation unit 800 in the fifth embodiment. The potential purchasing power estimation unit 900 further includes another company product feature word selection unit 904, own company similar product selection unit 905, other company product adoption customer selection unit 906, financial information acquisition unit 907, investment performance calculation unit 908, investment similarity calculation unit 909. , A customer group selection unit 910 and a non-adopted customer selection unit 911.

この潜在購買力推定部900は、顧客の財務諸表から資産余裕度を算出するとともに、生産財の購買履歴を重ね合わせることで、どの資金レベルでどのような特徴の生産財を購入する顧客であるのか、購買特性を提示する。顧客企業の資金面の投資姿勢と、実際に購入した商品から、自社製品の販売がしやすい顧客企業を指標化し、企業力更新部が顧客企業の製品マッチング特性に加算する。このことにより、自社にとっての優良顧客のランキングを行い、財務諸表と、顧客の生産財購入履歴、又は競合他社の販売実績から、顧客の潜在購買力を推定することができる。これは、従来、生産財を購入する余力のある潜在的な顧客と、従来から取引関係にある顧客のどちらを優先すべきか分かりづらいという課題を解決する手段となる。   The potential purchasing power estimation unit 900 calculates the asset margin from the customer's financial statements and superimposes the purchase histories of the production goods, so that it is the customer who purchases the production goods with what characteristics at what fund level. Presenting purchasing characteristics. Based on the investing attitude of the client company and the products actually purchased, the customer company that sells its own products is indexed, and the corporate strength renewal department adds it to the product matching characteristics of the customer company. As a result, it is possible to rank good customers for the company, and to estimate the potential purchasing power of the customer from the financial statements, the customer's production goods purchase history, or the sales performance of competitors. This is a means for solving the problem that it has been difficult to understand which of the potential customers who have the capacity to purchase production goods and the customers who have traditionally had business relationships.

図64は、各企業の納入・購買実績のある商品の特徴を示す図である。図64では、一般に機能が高くなるほど、価格も高くなるものとしている。この情報構造化装置61を使用して構造化された情報を取得する企業を企業Aとする。企業Aは競合企業に属するものとする。顧客aはそれよりも低機能で低価格の製品を製造しており、顧客bは更に低機能で低価格の製品を製造している。競合企業B、Cは、企業Aとは異なる価格帯、機能の製品を製造し、それぞれ納入実績があるものとする。ここで、顧客企業が求めている機能及び価格の製品を製造しなければ製品を売ることができない。また、ライバル企業が既に製造し、納入実績がある製品と同様の製品は、既に製造されているため販売できる可能性が低い。すなわち、顧客企業が求めている機能及び価格であって、他の競合企業が製造していない製品を製造すれば販売できる可能性が高い。例えば、企業Aが高機能、高価格の製品を製造しようと計画する際に、この情報構造化装置61を使用して分析を行なうことで、より販売できる可能性が高い機能及び価格のものに製品を見直すことができる。   FIG. 64 is a diagram showing the characteristics of products with delivery / purchase results of each company. In FIG. 64, it is generally assumed that the higher the function, the higher the price. A company that acquires structured information using the information structuring device 61 is referred to as company A. Company A is assumed to belong to a competitor. The customer a manufactures a product with a lower function and a lower price, and the customer b manufactures a product with a lower function and a lower price. It is assumed that competitors B and C manufacture products with different price ranges and functions from company A, and each has a delivery record. Here, the product cannot be sold unless the product of the function and price required by the client company is manufactured. In addition, a product similar to a product that has already been manufactured and delivered by a rival company is already manufactured and is unlikely to be sold. In other words, it is highly possible that a product that has a function and price required by a client company and that is not manufactured by another competitor can be sold. For example, when company A plans to manufacture a high-performance, high-priced product, analysis is performed using this information structuring device 61, so that the function and price are more likely to be sold. You can review the product.

図63に戻って、製品採用情報選別部801は、情報源ツリーの中から、顧客企業の製品採用情報源ツリーを選別する。製品納入情報選別部802は、情報源ツリーの中から、競合企業の製品納入情報源ツリーを選別する。重複検知部803は、顧客企業の製品採用情報源ツリーと製品納入情報源ツリーの等価性を計算し、同じものと判定された場合には、どちらか一方の情報源ツリーを破棄する。   Returning to FIG. 63, the product adoption information selection unit 801 selects the product adoption information source tree of the customer company from the information source tree. The product delivery information selection unit 802 selects a product delivery information source tree of a competitor from the information source tree. The duplicate detection unit 803 calculates the equivalence between the product adoption information source tree and the product delivery information source tree of the customer company, and when it is determined that they are the same, discards one of the information source trees.

次に、他社製品特徴語選別部904は、顧客に採用実績のある製品の特徴語を情報源ツリーの中から抽出する。自社類似製品選別部905は、競合他社の採用実績のあった製品の特徴語を自社製品がもっているか否かを判定し、持っていればその自社製品をピックアップする。他社製品採用顧客選別部906は、主体者辞書から顧客リストを取り出すと共に重複検知部903から得た情報源ツリーのうち、他社製品を採用した顧客企業を製品別に列挙する。一方、財務情報取得部907は顧客企業の公開された財務情報を取得する。例えば四半期又は半期毎に公開される企業の財務報告書から財務情報を抽出したり、情報源の中に含まれる財務情報を抽出することで得ることができる。または、外部から入力するようにしてもよい。投資実績計算部908は固定資産への投資額を計算する。投資類似度計算部909は、固定資産/流動資産で求めた基準(投資姿勢)で顧客企業をソートする。顧客集合選別部910は、他社製品を購入した顧客リストと全ての顧客の投資姿勢リストを入力とし、投資姿勢が類似しており、他社製品を購入していない顧客を選別する。この場合、他社製品を採用した企業の前後1社ずつを全て列挙する。   Next, another company's product feature word selection unit 904 extracts product feature words that have been adopted by customers from the information source tree. The in-house similar product selection unit 905 determines whether the in-house product has a feature word of a product that has been adopted by a competitor, and if so, picks up the in-house product. The third-party product adoption customer selection unit 906 extracts a customer list from the subject dictionary and lists, by product, customer companies that have adopted the third-party product from the information source tree obtained from the duplication detection unit 903. On the other hand, the financial information acquisition unit 907 acquires financial information published by the client company. For example, it can be obtained by extracting financial information from a company's financial report published every quarter or half year, or by extracting financial information contained in an information source. Or you may make it input from the outside. An investment performance calculation unit 908 calculates the amount of investment in fixed assets. The investment similarity calculation unit 909 sorts the client companies according to the standard (investment attitude) obtained from fixed assets / current assets. The customer group selection unit 910 receives a customer list that has purchased another company's products and an investment attitude list of all customers, and selects customers who have similar investment attitudes and have not purchased other company's products. In this case, enumerate all the companies before and after the company that adopted the products of other companies.

他社製品未採用顧客選別部911は、また、納入実績のある他社製品の特徴語と自社製品の特徴語を比較し、機能類似度を(部品・完全マッチする語数/他社製品と自社製品の前特徴語数)によって算出する。また、投資姿勢類似度を1−e^(−(/|固定資産/流動資産−固定資産/流動資産|))で計算し、それぞれ掛け合わせた値を、図43に示す顧客企業力測定ツリーの製品マッチングリーフの初期スコアとする。   The customer selection section 911 that has not yet adopted another company's product also compares the feature word of the other company's product that has been delivered with the feature word of the company's product, and determines the functional similarity (number of parts / perfect match words / number of other company's product The number of feature words is calculated. In addition, the investment attitude similarity is calculated by 1−e ^ (− (/ | fixed asset / current asset−fixed asset / current asset |)), and the multiplied values are shown in FIG. The initial score of the product matching leaf.

図65は、本実施例にかかる情報構造化装置の動作を示すフローチャートである。図66は、本実施例の情報構造化装置により作成される表である。本実施例は、登録されている全顧客企業から、どのような製品が購入される蓋然性が高いかを推定し、その製品を購入する蓋然性が高い企業を選別する。まず、財務情報取得部907が図34示す主体者辞書から顧客企業リストを取得し、その顧客企業、例えば"ATT"、"リアル通信"、"OVOP"の財務諸表を得る(ステップS445)。具体的には、財務情報取得部907は、それぞれの顧客企業の固定資産及び流動資産を取得する。それぞれ固定資産が10億、40億、30億で、流動資産が10億、60億、50億であったとする。次に、投資実績計算部908は、各企業の固定資産への投資実績比率を固定資産/流動資産で求める。ここでは、1.0,0.67,0.6と求まる(ステップS446)。そして、投資類似度計算部909が各顧客企業をこの投資姿勢の値でソートすると(ステップS447)、図66に示すように、「OVOP(0.6)」「リアル通信(0.67)」「ATT(1.0)」の順となる。   FIG. 65 is a flowchart illustrating the operation of the information structuring apparatus according to the present embodiment. FIG. 66 is a table created by the information structuring apparatus of this embodiment. In the present embodiment, it is estimated what products are likely to be purchased from all registered customer companies, and companies that are highly likely to purchase the products are selected. First, the financial information acquisition unit 907 acquires a customer company list from the subject dictionary shown in FIG. 34, and obtains financial statements of the customer companies, for example, “ATT”, “real communication”, and “OVOP” (step S445). Specifically, the financial information acquisition unit 907 acquires fixed assets and current assets of each customer company. The fixed assets are 1 billion, 4 billion and 3 billion, respectively, and the current assets are 1 billion, 6 billion and 5 billion. Next, the investment performance calculation unit 908 obtains the investment performance ratio of each company to the fixed assets as fixed assets / current assets. Here, 1.0, 0.67, and 0.6 are obtained (step S446). Then, when the investment similarity calculation unit 909 sorts each customer company by the value of the investment attitude (step S447), as shown in FIG. 66, “OVOP (0.6)” “Real communication (0.67)”. The order is “ATT (1.0)”.

一方、他社の納入・採用ニュースとして、それぞれ製品納入情報選別部902、製品採用情報選択部901により、
"オリオン、光アクセス製品の「OR2500」をOVOPに納入"、
"ATT、日本光伝送のメトロ製品「BB−P012」を採用"
というニュースから生成される情報源ツリーを新たに情報源格納部503から選択する(S441)。重複検知部903でこれらの情報源ツリーの重複検査をした後、他者製品特徴語選別部904により、前者の特徴語として"光アクセス製品"、後者の特徴語として"メトロ製品"を抽出する(S442)。次いで、自社類似製品選別部905は、情報源格納部503より、過去の自社製品のリリースニュース
"日本電気、光アクセス製品「DW4000」を発売"
を選択し、"DW4000"を抽出する。自社類似製品選別部905は、DW4000の特徴語と、OR2500、BB−P012の特徴語とを比較し、DW4000が他社の納入実績のある製品と類似すると判断する。これにより、DW4000は納入しやすい製品であることが推定される(ステップS443)。
On the other hand, as delivery / adoption news of other companies, the product delivery information selection unit 902 and the product adoption information selection unit 901 respectively.
"Orion delivers" OR2500 "optical access product to OVOP",
"ATT adopts Nikko Hikari Metro product" BB-P012 ""
Is newly selected from the information source storage unit 503 (S441). After duplication inspection of these information source trees by the duplication detection unit 903, the “other products” feature word selection unit 904 extracts “optical access product” as the former feature word and “metro product” as the latter feature word. (S442). Next, the self-similar product selection unit 905 receives the release news of past self-product from the information source storage unit 503.
"NEC releases optical access product" DW4000 ""
And “DW4000” is extracted. The in-house similar product selection unit 905 compares the feature word of DW4000 with the feature words of OR2500 and BB-P012, and determines that DW4000 is similar to a product that has been delivered by other companies. Thereby, it is estimated that DW4000 is a product that is easy to deliver (step S443).

次に、他社製品採用顧客選別部906は、納入実績がある納入先企業として、"OVOP"や"ATT"を記憶する。また、リアル通信が採用したニュースがなく、かつ競合企業が納品したニュースがないことから、"リアル通信"は実績がない状態と判定する(S444)。顧客集合選別部910は、投資類似度計算部909にてソートされた結果と、他社製品採用顧客選別部906にて採用された製品情報とが入力され図66のような表を作成する。この表より、"リアル通信"は投資実績比率が0.67で、"OVOP"と投資姿勢が類似していることが分かる。顧客集合選別部910は、この表において購入実績を有する顧客企業及びその前後1社を抽出して他社製品未採用顧客選別部911に入力する。本例の場合は、全ての顧客企業の情報がそれに該当する。他社製品未採用顧客選別部911には、自社類似製品選別部905より採用実績のある他社製品と類似の特徴を有する製品情報が供給され、表の自社製造の可否の欄が記述される。   Next, the other company's product adoption customer selection unit 906 stores “OVOP” and “ATT” as a delivery destination company having a delivery record. Further, since there is no news adopted by the real communication and there is no news delivered by the competitor, it is determined that the “real communication” has no record (S444). 66. The customer set sorting unit 910 receives the result sorted by the investment similarity calculation unit 909 and the product information adopted by the other company product adoption customer sorting unit 906, and creates a table as shown in FIG. From this table, it can be seen that “real communication” has an investment performance ratio of 0.67, and the investment attitude is similar to “OVOP”. The customer set sorting unit 910 extracts a customer company having a purchase record in this table and one company before and after that, and inputs it to the non-commercial product non-adopted customer sorting unit 911. In the case of this example, information of all customer companies corresponds to this. The other company product non-adopted customer selection unit 911 is supplied with product information having characteristics similar to those of other company products that have been used by the in-house similar product selection unit 905, and the column of whether or not the company can be manufactured in the table is described.

これにより、"OVOP"は自社製品と同様の特徴語を有する光アクセス製品を購入済みであることが分かる。一方、リアル通信は、製品購入実績がなく、かつOVOPと投資姿勢が類似している。すなわち、リアル通信は、投資姿勢の類似しているOVOPが採用した製品を採用する可能性が高い。よって、"リアル通信"は自社製品の"DW4000"の販売候補先として有力な企業となる。他社製品未採用顧客選別部911は、このような他社製品を採用した顧客企業と投資姿勢が似ており、かつ他社製品を未だ採用していない別の顧客企業を抽出して図示せぬ表示部等に表示する(ステップS911)。   As a result, it is understood that “OVOP” has already purchased an optical access product having the same characteristic word as that of its own product. On the other hand, real communication has no product purchase record and is similar in investment attitude to OVOP. In other words, real communication has a high possibility of adopting a product adopted by OVOP having a similar investment attitude. Therefore, “real communication” becomes a promising company as a sales candidate of “DW4000”, which is its own product. The other company product non-adopted customer selection unit 911 extracts another customer company that has a similar investment attitude to that of the customer company that has adopted such other company's product and has not yet adopted the other company's product, and a display unit that is not shown in the drawing. (Step S911).

また、他社製品未採用顧客選別部911は、顧客企業"リアル通信"の図43に示す顧客企業力測定ツリーの製品マッチングリーフの値を下記のように算出する。
機能類似度=(部品・完全マッチする語数/他社製品と自社製品の前特徴語数)=1/1
投資姿勢類似度=1−e^(−(1/|固定資産/流動資産−固定資産/流動資産|))=1−e(−(1/|40/60−30/50|))=1−e^(−0.07)≒1
製品マッチングリーフのスコア=機能類似度×投資姿勢類似度=1
以上により、顧客企業力ツリーの製品マッチングの初期スコアを1に更新する。
Further, the other company product non-adopted customer selection unit 911 calculates the value of the product matching leaf of the customer company strength measurement tree shown in FIG. 43 of the customer company “real communication” as follows.
Functional similarity = (number of parts / perfect match words / number of previous feature words of other company's products and own products) = 1/1
Investment attitude similarity = 1−e ^ (− (1 / | fixed asset / current asset−fixed asset / current asset |)) = 1−e (− (1 / | 40 / 60−30 / 50 |)) = 1−e ^ (− 0.07) ≈1
Product matching leaf score = functional similarity x investment attitude similarity = 1
As a result, the initial score of product matching in the customer enterprise power tree is updated to 1.

なお、本実施例においては、適合情報源ツリーを用いて潜在購買力を推定するものとして説明したが、潜在購買力推定部900がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。また、潜在購買力推定部900は、自社製品と他社製品の特徴語を比較するため、情報源を適合情報源又は非適合情報源に分離しなくても本実施例を適用可能である。   In this embodiment, the potential purchasing power is estimated using the matching information source tree. However, the potential purchasing power estimation unit 900 refers to the domain dictionary or the technical dictionary and matches from the information source tree or the information source. An information source tree or a compatible information source may be extracted. In addition, since the potential purchasing power estimation unit 900 compares the characteristic words of the company's product and the other company's product, the present embodiment can be applied without separating the information source into a conforming information source or a non-conforming information source.

本実施例によれば、顧客企業の投資意欲を公開されている財務諸表のうち、固定資産と流動資産を用いることで、顧客の投資姿勢の類似度を計算し、また顧客や競合他社の納入・採用実績ニュースから自社製品の受容性がありそうな未納入の企業を列挙するため、自社の製品を販売しやすい顧客の推定が可能となる。また、顧客企業の企業力をより正確に求めることができる。   According to the present embodiment, by using fixed assets and current assets in the financial statements publicly disclosed by the client companies, the similarity of the customer's investment attitude is calculated, and the customer and competitors deliver.・ Listing companies that have yet to be delivered that are likely to accept the company's products from the recruitment results news, making it possible to estimate customers who are likely to sell their products. In addition, the corporate strength of the client company can be determined more accurately.

本発明の第7の実施例
次に、本発明の第7の実施例について説明する。図67は、本発明の第7の実施例にかかる情報構造化装置71を示す図である。本実施例は、生産財の開発履歴と販売実績履歴を結びつけ、競合企業の収益性を推定するものである。本情報構造化装置71は、図67に示すように、第6の実施例における情報構造化装置61に、定量化装置72として販売力推定部1000を更に設ける構成を有する。その他の構成は、第6の実施例と同様であり、その詳細な説明は省略する。この第7の実施例は、競合企業の販売力を推定する例である。
Seventh Embodiment of the Invention Next, a seventh embodiment of the present invention will be described. FIG. 67 is a diagram showing an information structuring apparatus 71 according to the seventh example of the present invention. In this embodiment, the development history and sales history of production goods are combined to estimate the profitability of a competitor. As shown in FIG. 67, the information structuring apparatus 71 has a configuration in which a sales force estimation unit 1000 is further provided as a quantifying apparatus 72 in the information structuring apparatus 61 in the sixth embodiment. Other configurations are the same as those of the sixth embodiment, and a detailed description thereof will be omitted. The seventh embodiment is an example in which the sales force of a competitor is estimated.

図68(a)及び図68(b)は、それぞれ販売力と販売までの期間の関係、販売力と機能の関係を示すグラフ図である。図68に示すように、一般に、販売時期−開発完了(リリース)時期が短い方が販売力が高いと見ることができる。また、一般に機能が低いのに売れた場合は、機能が高くて売れた場合より販売力が高いと見ることができる。なお、機能は、単位価格当たりの機能、又は価格とすることも可能である。単位価格当たりの機能が少なくて売れている場合や、単位価格当たりの価格が高いのに売れている場合、販売力が高いと見ることができる。本実施例においては、このような製品の機能及び期間の情報に基づき、企業の販売力を推定する。   68 (a) and 68 (b) are graphs showing the relationship between sales force and the period until sales, and the relationship between sales force and function, respectively. As shown in FIG. 68, in general, it can be seen that the sales force is higher when the sales time-development completion (release) time is shorter. Also, in general, when a function is low but sold, it can be seen that the sales power is higher than when the function is high and sold. The function may be a function per unit price or a price. If there are few functions per unit price and it sells, or if the price per unit price is high, it can be seen that the sales power is high. In the present embodiment, the sales force of a company is estimated based on such product function and period information.

図69は、本実施例における販売力推定部1000を示すブロック図である。図69に示すように、第5の実施例における需要周期推定部800の製品採用情報選別部801、製品納入情報選別部802、及び重複検知部803と共に販売力推定部1000を構成する。販売力推定部1000は、さらに製品別特徴語収集部1004、製品開発情報選別部1005、平均特徴語数算出部1006及び競合製品販売率算出部1007を有する。   FIG. 69 is a block diagram showing the sales force estimation unit 1000 in the present embodiment. As shown in FIG. 69, the sales force estimation unit 1000 is configured together with the product adoption information selection unit 801, the product delivery information selection unit 802, and the duplication detection unit 803 of the demand cycle estimation unit 800 in the fifth embodiment. The sales force estimation unit 1000 further includes a product-specific feature word collection unit 1004, a product development information selection unit 1005, an average feature word number calculation unit 1006, and a competitive product sales rate calculation unit 1007.

販売力推定部1000は、競合企業の営業力を予測するデータを生成するように動作し、競合企業の生産財開発リリースニュースと、その商品の納入実績ニュース、又は顧客の採用実績ニュースから販売力を計算する。   The sales force estimation unit 1000 operates to generate data for predicting the sales force of a competitor, and the sales force is estimated based on the product development release news of the competitor, the delivery history news of the product, or the customer adoption history news. Calculate

先ず、製品別特徴語収集部1004は競合商品ごとに情報源をまとめ、各情報源に含まれる特徴語をカウントし、製品ごとの累計特徴語数αi(iは任意の製品)を求める。平均特徴語数算出部1006は、全ての製品の累計特徴語数と製品数から、1製品あたりの平均特徴語数βを算出する。平均数を求めることで、製品別特徴語収集部1004が収集した特徴がその業界の製品にとって多いのか少ないのかが判別することができる。   First, the product-specific feature word collection unit 1004 collects information sources for each competitive product, counts the feature words included in each information source, and obtains the cumulative feature word number αi (i is an arbitrary product) for each product. The average feature word number calculation unit 1006 calculates the average feature word number β per product from the cumulative feature word number and the product number of all products. By obtaining the average number, it is possible to determine whether the features collected by the product-specific feature word collection unit 1004 are more or less for products in the industry.

次に、製品採用情報選別部801及び製品納入情報選別部802が、それぞれ顧客の生産財購入・採用ニュースと、競合他社の生産財販売・納入実績ニュースのみを、情報源格納部503から抽出する。重複検知部803は、製品採用情報選別部801が情報源格納部503から抽出した情報源ツリーに含まれる採用製品及び納入元を抽出し、製品納入情報選別部802が情報源格納部503から抽出した情報源ツリーに含まれる納入商品及び納入先を抽出し、製品名が一致するか否か、納入先と納入元が一致するか否かを判断することで納入ニュースと採用ニュースの等価性を判断する。重複があればそれを破棄する。製品開発情報選別部1005は、重複検知部803から製品ごとのリリース時期及び販売量を受け取り、比率γi=(売り上げニュース数)/(納入時期−リリース時期)を算出する。これは、図68(a)に対応する。   Next, the product adoption information sorting unit 801 and the product delivery information sorting unit 802 respectively extract only the production product purchase / recruitment news of the customer and the production product sales / delivery result news of the competitors from the information source storage unit 503. . The duplicate detection unit 803 extracts the adopted product and the delivery source included in the information source tree extracted from the information source storage unit 503 by the product adoption information selection unit 801, and the product delivery information selection unit 802 extracts from the information source storage unit 503. The delivery products and delivery destinations included in the information source tree are extracted, and the equivalence between the delivery news and the recruitment news is determined by determining whether the product names match and whether the delivery destination and the delivery source match. to decide. Discard any duplicates. The product development information selection unit 1005 receives the release time and the sales amount for each product from the duplication detection unit 803, and calculates the ratio γi = (number of sales news) / (delivery time−release time). This corresponds to FIG.

競合製品販売率算出部1007は、平均特徴語算出部1006からのαi、βと、製品開発情報選別部1005からのγiとから、平均特徴語数/累計特徴語数×採用ニュース数/(納入時期−リリース時期)によって算出される販売率(販売力)を算出する。β/αは、その値が大きいほど機能が少ない、すなわち魅力が少ない商品を表す。β/α×γiが大きいと、魅力がないのにも関わらず販売までの期間が短いことを示し、すなわち、販売力が高いことを示す値となる。   The competitive product sales rate calculation unit 1007 calculates the average feature word number / cumulative feature word number × adopted news number / (delivery time−from the average feature word calculation unit 1006 and αi, β from the product development information selection unit 1005. The sales rate (sales power) calculated by the release time is calculated. β / α represents a product having a smaller function, that is, less attractive as the value is larger. When β / α × γi is large, it indicates that the period until the sale is short in spite of being unattractive, that is, a value indicating that the sales force is high.

この指標を企業力計算部601が競合企業力測定ツリーの売り上げ実績リーフに加算する。また、図68(a)に示すように、横軸に開発から販売までにかけた時間を、縦軸に売り上げ実績をプロットすることで、開発した商品を如何に効率よく販売に結び付けられているのかを図示せぬ表示部などにより提示することができる。このことにより、生産財の開発履歴と販売実績履歴を結びつけ、競合企業の収益性を推定することができる。そして、本実施例においては、競合他社の製品開発力と、自社の製品開発力の差が分かりづらいという従来の課題を解決する。   The enterprise strength calculation unit 601 adds this index to the sales performance leaf of the competitive enterprise strength measurement tree. As shown in FIG. 68 (a), how efficiently the developed product is linked to sales by plotting the time from development to sales on the horizontal axis and the sales record on the vertical axis. Can be presented by a display unit (not shown). As a result, it is possible to link the development history of the production goods and the sales performance history and estimate the profitability of the competitor. In this embodiment, the conventional problem that it is difficult to understand the difference between the product development capability of competitors and the product development capability of the company is solved.

次に図70のフローチャートを参照して、本実施例の動作について詳細に説明する。先ず、製品別特徴語収集部1001が各競合商品のリリースニュースについて特徴語数を計測する。
"オプト販売は、μレーザを用いたロスレス光伝送装置「FX5000」を開発"
というリリースニュースが8月に格納された場合、製品別特徴語収集部1001は、特徴語として"μレーザ"、"ロスレス光伝送装置"の2つ(αi=2)を収集する。こうして全ての競合製品について特徴語数をそれぞれ収集する(ステップS451)。そして、平均特徴語算出部1002が、特徴語数を調査対象なった競合製品数で割る(ステップS452)。この場合、平均β=1.4という値が得られるとする。次に、
"オプト販売、「FX5000」をATTに納入"、
"オプト販売、ロスレス光伝送の「FX5000」をリアル通信に納入"
といったニュースが追加され、それぞれ10月、11月に格納されたとすると、製品採用情報選別部801、製品納入情報選別部802、及び重複検知部803により、この情報源から製品の情報を抽出する。そして、各競合商品について、納入・採用ニュース数を計算する(ステップS454)。
Next, the operation of this embodiment will be described in detail with reference to the flowchart of FIG. First, the product-specific feature word collection unit 1001 measures the number of feature words for the release news of each competitive product.
"Opto Sales develops" FX5000 "lossless optical transmission device using μ laser"
Is stored in August, the product-specific feature word collection unit 1001 collects two (αi = 2) of “μ laser” and “lossless optical transmission device” as feature words. Thus, the number of feature words is collected for all competing products (step S451). Then, the average feature word calculation unit 1002 divides the number of feature words by the number of competing products that have been investigated (step S452). In this case, it is assumed that a value of average β = 1.4 is obtained. next,
"Opt sales, delivering" FX5000 "to ATT",
"Optical sales, lossless optical transmission" FX5000 "delivered to real communications"
If the news is added and stored in October and November, respectively, product information is extracted from this information source by the product adoption information selection unit 801, the product delivery information selection unit 802, and the duplication detection unit 803. Then, the number of delivery / adoption news is calculated for each competing product (step S454).

次に、製品開発情報選別部1005は、iを製品の番号として
比率γi=売り上げニュース数/(納入時期−開発時期)
を算出する。本例の場合は、10月、11月に納入された売り上げニュース数が各1であるため、
比率γi=1/(10−8)+1/(11−8)≒0.5+0.3=0.8
となる(ステップS455)。そして、競合製品販売率算出部1007は、
販売力=Σβ/αi×γi
を求める。本例において、"FX5000"の販売率は、1.4/2×0.8=0.56と求まる。営業販売力の特性として、特徴のない製品を開発してからすぐに納入した場合、高くなるという傾向がある。競合製品販売率算出部1007は、この販売力の値により競合企業力測定ツリーの売り上げ実績リーフの値を更新する。
Next, the product development information selection unit 1005 sets the ratio γi = number of sales news / (delivery time−development time), where i is the product number.
Is calculated. In this example, the number of sales news delivered in October and November is 1 each.
Ratio γi = 1 / (10−8) + 1 / (11−8) ≈0.5 + 0.3 = 0.8
(Step S455). The competitive product sales rate calculation unit 1007
Sales force = Σβ / αi × γi
Ask for. In this example, the sales rate of “FX5000” is obtained as 1.4 / 2 × 0.8 = 0.56. As a characteristic of business sales power, there is a tendency that if a product with no features is developed and delivered immediately, it becomes higher. The competitive product sales rate calculation unit 1007 updates the value of the sales performance leaf of the competitive enterprise strength measurement tree with the value of the sales power.

なお、本実施例においては、適合情報源ツリーを用いて販売力を推定するものとして説明したが、販売力推定部1000がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。また、販売力推定部1000は、製品の平均特徴語数を利用するため、情報源を適合情報源又は非適合情報源に分離しなくても本実施例を適用可能である。   In this embodiment, the sales force is estimated by using the compatible information source tree. However, the sales force estimation unit 1000 refers to the domain dictionary or the technical dictionary and matches the information from the information source tree or the information source. An information source tree or a compatible information source may be extracted. Further, since the sales force estimation unit 1000 uses the average number of feature words of the product, the present embodiment can be applied without separating the information source into the conforming information source or the non-conforming information source.

本実施例においては、開発製品の特徴数、その平均値、売り上げニュース数及び当該開発製品の開発から納入までの期間を指標として使用することで競合企業の販売力の推定が可能となる。また、求めた販売力を競合企業力測定ツリーの売り上げ実績リーフの値とすることで、競合企業力を販売力を加味した値に更新することができ、正確に推定することができる。   In this embodiment, the sales force of a competitor can be estimated by using the number of features of the developed product, its average value, the number of sales news, and the period from development to delivery of the developed product as indices. Further, by setting the obtained sales force as the value of the sales performance leaf in the competitive enterprise strength measurement tree, the competitive enterprise strength can be updated to a value taking into account the sales capability, and can be accurately estimated.

本発明の第8の実施例
次に、本発明の第8の実施例について説明する。図71は、本発明の第8の実施例にかかる情報構造化装置81を示す図である。本実施例は、顧客に採用されている生産財商品と、商品開発メーカへ納入されている部品を結びつけ、どの部品が商品の競争力となっているのか推定するものである。本情報構造化装置81は、図71に示すように、第7の実施例における情報構造化装置71に、定量化装置82として競争力増強部品推定部1100を更に設ける構成を有する。その他の構成は、第7の実施例と同様であり、その詳細な説明は省略する。本第8の実施例は、優良部品を推定する例である。
Eighth Embodiment of the Invention Next, an eighth embodiment of the present invention will be described. FIG. 71 is a diagram showing an information structuring apparatus 81 according to the eighth example of the present invention. In the present embodiment, the product produced by the customer and the parts delivered to the product development maker are linked to estimate which part is the competitiveness of the product. As shown in FIG. 71, the information structuring apparatus 81 has a configuration in which a competitiveness enhancement component estimation unit 1100 is further provided as the quantification apparatus 82 in the information structuring apparatus 71 in the seventh embodiment. Other configurations are the same as those of the seventh embodiment, and detailed description thereof is omitted. The eighth embodiment is an example in which excellent parts are estimated.

図72は、本実施例における競争力増強部品推定部1100を示すブロック図である。図72に示すように、競争力増強部品推定部1100は、部品採用率上位企業選別部1101、競合企業製品納入実績計測部1102、及び部品貢献率算出部1103を有する。この競争力増強部品推定部1100は、上述した製品採用情報選別部801、製品納入情報選別部802及び重複検知部803の出力結果を利用している。   FIG. 72 is a block diagram showing a competitiveness enhancement component estimation unit 1100 in the present embodiment. As shown in FIG. 72, the competitiveness-enhancing component estimation unit 1100 includes a component adoption rate higher-ranking company selection unit 1101, a competitor company product delivery performance measurement unit 1102, and a component contribution rate calculation unit 1103. The competitiveness enhancement component estimation unit 1100 uses the output results of the product adoption information selection unit 801, the product delivery information selection unit 802, and the duplication detection unit 803 described above.

競争力増強部品推定部1100は、部品納入実績のニュース又は競合企業の部品採用ニュースと、競合企業の製品売り上げ実績又は顧客の商品採用実績を用いて、ある部品が競合企業の製品に組み込まれ、最終的に顧客へ販売された率を計算する。この指標は競争力増強部品推定部1100により、納入企業力測定ツリーの差異化リーフの初期スコアに加算するために企業力推定部600に入力される。また、横軸に納入した部品を、縦軸に顧客への納入実績をプロットすることで、どの部品が競争力を生み出す源泉となっているのかを提示する。このことにより、顧客に採用されている生産財商品と、商品開発メーカへ納入されている部品を結びつけ、どの部品が商品の競争力となっているのか推定することを実現する。これは、他社製品が採用している技術優位性が高い部品はどのようなものか分かりづらいという従来の課題を解決し、顧客に採用されている商品と、そのメーカに納入されている部品のマッピングを提示し、競争力の高い部品を抽出する。   The competitiveness-enhancing part estimation unit 1100 uses a part delivery result news or a competitor's part adoption news and a competitor's product sales record or a customer's product adoption record to incorporate a part into a competitor's product, Calculate the rate of final sales to customers. This index is input by the competitiveness-enhancing component estimation unit 1100 to the enterprise strength estimation unit 600 to be added to the initial score of the differentiated leaf of the delivered enterprise strength measurement tree. In addition, by plotting the parts delivered on the horizontal axis and the delivery results to customers on the vertical axis, it is shown which parts are the source of competitiveness. As a result, it is possible to link the product produced by the customer and the parts delivered to the product development maker and estimate which parts are competitive with the product. This solves the conventional problem that it is difficult to understand the parts with high technological advantages adopted by other companies' products, and the products used by customers and the parts delivered to the manufacturers Present mapping and extract highly competitive parts.

部品採用率上位企業選別部1101は、納入業者の部品を採用している競合企業のうち、納入業者の部品占有率が高い企業を上位2社選択する。例えば、部品納入業者A1の販売実績ニュースと、納入先競合企業B1の採用ニュースから部品占有率を算出する場合について説明する。例えば納入先競合企業B1が納入業者A1の部品を採用したことを3回リリースし、納入先競合企業B1が別の納入業者A2の部品を採用したことを1回リリースしたら、部品納入業者A1にとって部品占有率が高い競合企業は納入先競合企業B1であることが分かる。   The part adoption rate top company selection unit 1101 selects the top two companies having a high part occupancy ratio of the supplier from among the competitors adopting the parts of the supplier. For example, a case will be described in which the part occupancy rate is calculated from the sales performance news of the parts supplier A1 and the adoption news of the supplier competitor B1. For example, if the supplier competitor B1 releases the adoption of the parts of the supplier A1 three times and the supplier competitor B1 releases the adoption of the parts of another supplier A2 once, the parts supplier A1 It can be seen that the competitor with a high component occupancy is the supplier competitor B1.

競合企業製品納入実績計測部1102は、各企業が開発した製品の顧客企業への採用率を、
採用率α=採用実績製品数/開発製品数
によって算出する。競合企業に納品してもそれを使用した製品が顧客企業に納品されていなければ、当該部品は採用されていないことになる。
Competitor product delivery performance measurement department 1102 determines the adoption rate of products developed by each company to customer companies,
Adoption rate α = calculated by the number of products used / the number of products developed. Even if the product is delivered to the competitor, if the product using it is not delivered to the customer company, the part is not adopted.

部品貢献率算出部1103は、競合企業に納入した部品の関係性から、iを製品種別とすると
貢献率Pi=1/納入部品種数×採用率
で計算する。残りの上位1社に対しても同様に貢献率を算出し、前出の貢献率へ加算する。納入企業が保有する全ての部品について計算する。計算結果は、企業力計算部601に入力され、部品納入企業力測定ツリーの差異化リーフの初期スコアとして採用される。
The part contribution rate calculation unit 1103 calculates the contribution rate Pi = 1 / the number of delivered parts × the adoption rate from the relationship between the parts delivered to the competitor, where i is the product type. The contribution rate is calculated in the same way for the remaining top one company and added to the previous contribution rate. Calculate all parts owned by the supplier. The calculation result is input to the enterprise power calculation unit 601 and adopted as the initial score of the differentiated leaf of the component delivery enterprise power measurement tree.

図73のフローチャート及び図74のニュース関係図を参照して、本発明の第8の実施例の動作について詳細に説明する。利用するニュースは、
"新川電工が高濃度のμレーザを開発"、
"新川電工、小型の光増幅モジュールを開発"、
"新川電工は光クロスコネクト(XC)部品の供給を開始"
という新川電工の開発関係のニュース3件、
"新川電工、オリオンにμレーザを納入"、
"オリオン、新川電工の光増幅モジュールを全面的に採用"
という競合企業であるオリオンに対する部品供給ニュース2件、
"新川電工、日本光伝送にμレーザを納入"、
"新川電工、日本光伝送に光増幅モジュールを納入"、
"新川電工、XC部品を日本光伝送に納入"
という競合企業である日本光伝送に対する部品提供ニュース3件、
"新川電工、サクラ通にμレーザを納入"
という競合企業であるサクラ通に対する部品納品ニュース1件、
"オリオン、キャリアのATTにメトロ製品を納入"、
"リアル通信、オリオンのDWDM部を採用"
という顧客企業のオリオン製品の採用ニュース2件、
"日本光伝送、メトロ製品をOVOPに納入"
という顧客企業の日本光伝送製品の採用ニュース1件、
"サクラ通、アクセス製品のAX−1000をADDIに納入"
という顧客企業のサクラ通製品の採用ニュース1件である。これらのニュース関連図を示すと図74となる。
The operation of the eighth embodiment of the present invention will be described in detail with reference to the flowchart of FIG. 73 and the news relation diagram of FIG. News to use
"Shinkawa Electric develops high-concentration μ laser",
"Shinkawa Electric develops small optical amplification module",
"Shinkawa Electric starts supplying optical cross-connect (XC) parts"
3 news related to the development of Shinkawa Electric,
"Shinkawa Electric supplies μ laser to Orion",
"Orion fully adopts Shinkawa Electric's optical amplification module"
Two parts supply news for Orion, a competitor
"Shinkawa Electric Co., Ltd. Delivered μ Laser to Nippon Optical Transmission",
"Shinkawa Electric Co., Ltd. delivers optical amplification module to Nippon Optical Transmission",
"Shinkawa Electric Co., Ltd. delivers XC parts to Nippon Optical Transmission"
3 parts supply news for Nippon Kogyo, a competitor
"Shinkawa Electric supplies μ-laser to Sakura-dori"
One part delivery news for Sakura Tsuru, a competitor
"Orion delivers metro products to carrier ATT",
"Real communication uses Orion's DWDM part"
Two news stories about the adoption of Orion products
"Nippon Hikari Transmission and Metro products delivered to OVOP"
One news about the adoption of Nikko transmission products of a customer company,
"Sakura-Dori, Access product AX-1000 delivered to ADDI"
This is one news story about the adoption of Sakura products by a customer company. These news related diagrams are shown in FIG.

部品採用率上位企業選別部1101が納入部品ごとに納入先の競合企業を列挙する(ステップS461)。上記例においては、納入先の競合企業は、"オリオン"、"日本光伝送"、"サクラ通"が列挙される。そして、"新川電工"からの部品納入が多い企業は上位から、"日本光伝送"(3)、"オリオン"(2)、"サクラ通"(1)となり、このうち部品採用率上位企業選別部1101は上位2社を選択する(ステップS462)。競合企業製品納入実績計測部1102は、上位2社の顧客への納入実績ニュースを抽出する(ステップS463)。本例では、
"オリオン、キャリアのATTにメトロ製品を納入"、
"リアル通信、オリオンのDWDM部を採用"
の2件、及び
"日本光伝送、メトロ製品をOVOPに納入"
となる。
The component adoption rate higher-level company selection unit 1101 lists competitors as delivery destinations for each delivered part (step S461). In the above example, “Orion”, “Nippon Optical Transmission”, and “Sakura-dori” are listed as the competitors of the delivery destination. The companies that deliver the most parts from "Shinkawa Electric" are from the top, "Nippon Hikari Transmission" (3), "Orion" (2), "Sakura-dori" (1). The unit 1101 selects the top two companies (step S462). The competitor product delivery record measuring unit 1102 extracts delivery record news for the top two customers (step S463). In this example,
"Orion delivers metro products to carrier ATT",
"Real communication uses Orion's DWDM part"
2 cases, and
"Nippon Hikari Transmission and Metro products delivered to OVOP"
It becomes.

一方、競合企業製品納入実績計測部1102は、顧客への採用実績ニュース数を各部品ごとに算出する(ステップS464)。すなわち、部品が競合企業を経て、顧客へ到達するパスを列挙する。"μレーザ"に関しては、オリオン→ATT/リアル通信の2件と、日本光伝送→OVOPの1件が該当する。同様に光増幅も3件、XCは1件となる。オリオンの自社製品を3種類、日本光伝送の自社製品を2種類だとすると、オリオンが顧客に収めた実績は2種類の製品であるため、競合企業製品納入実績計測部1102は、採用率α(オリオン)=採用実績製品数/開発製品数=2/3、α(日本光伝送)=1/2を求める(ステップS465)。   On the other hand, the competitor product delivery record measuring unit 1102 calculates the number of adoption record news to the customer for each part (step S464). That is, the paths for parts to reach customers through competitors are listed. Regarding “μ laser”, two cases of Orion → ATT / real communication and one case of Nippon Optical Transmission → OVOP are applicable. Similarly, there are 3 cases of light amplification and 1 case of XC. Assuming that there are three types of Orion's own products and two types of Nihon Kohtsu's own products, there are two types of products that Orion has received in its customers. ) = Number of products employed / number of products developed = 2/3, α (Nippon Optical Transmission) = 1/2 is obtained (step S465).

次に、部品貢献率算出部1103は、競合企業に収めた実績のある各部品について貢献率Pi=α×(1/全部品)を計算する(ステップS466)。本例では、"オリオン"に納入されている製品は、"μレーザ"と"光増幅"の2つであるため、部品貢献率算出部1103は、下記のようにして部品貢献率Piを求める。
Pi(μレーザ)=(2/3)×1/2=1/3、
Pi(光増幅)=(2/3)×1/2=1/3
同様に日本光伝送に納入されている部品は、3種類であるため、
Pi+1(μレーザ)=(1/2)×1/3=1/6、
Pi+1(光増幅)=(1/2)×1/3=1/6、
Pi+1(XC)=(1/2)×1/3=1/6
となる。各企業ごとに算出した貢献率を、製品ごとに合計すると、
P(μレーザ)=1/3+1/6=1/2、
P(光増幅)=1/2、
P(XC)=1/6
となる(ステップS467)。よって、製品をこの値でソートすると、"μレーザ"、"光増幅"、"XC"の順となり、新川電工の製品のお勧めは"μレーザ"又は"光増幅"となる。
Next, the component contribution rate calculation unit 1103 calculates the contribution rate Pi = α × (1 / all components) for each component that has a track record in the competitors (step S466). In this example, since there are two products delivered to “Orion”, “μ laser” and “optical amplification”, the component contribution rate calculation unit 1103 obtains the component contribution rate Pi as follows. .
Pi (μ laser) = (2/3) × 1/2 = 1/3,
Pi (optical amplification) = (2/3) × 1/2 = 1/3
Similarly, there are three types of parts delivered to Nihon Kohtsu,
Pi + 1 (μ laser) = (1/2) × 1/3 = 1/6,
Pi + 1 (optical amplification) = (1/2) × 1/3 = 1/6,
Pi + 1 (XC) = (1/2) × 1/3 = 1/6
It becomes. When the contribution rate calculated for each company is totaled for each product,
P (μ laser) = 1/3 + 1/6 = 1/2,
P (light amplification) = 1/2,
P (XC) = 1/6
(Step S467). Therefore, when products are sorted by this value, the order is “μ laser”, “optical amplification”, and “XC”, and the recommended product of Shinkawa Electric is “μ laser” or “optical amplification”.

なお、本実施例においては、適合情報源ツリーを用いて競争力増強部品を推定するものとして説明したが、競争力増強部品推定部1100がドメイン辞書又は技術辞書を参照して、情報源ツリー又は情報源から適合情報源ツリー又は適合情報源を抽出するようにしてもよい。   In the present embodiment, description has been made on the assumption that the competitiveness enhancing component is estimated using the matching information source tree. However, the competitiveness enhancing component estimation unit 1100 refers to the domain dictionary or the technical dictionary, and the information source tree or You may make it extract a suitable information source tree or a suitable information source from an information source.

本実施例においては、関連ニュースの関係および納入実績を部品納入業者、競合企業、顧客企業の範囲で指標化することで、実績ベースの優良部品の推定が可能となる。また、求めた貢献率は、部品納入企業力測定ツリーにおける差異化リーフの初期スコアに置き換えられることで、部品の販売実績等の良否を反映した企業力の推定が可能となる。   In this embodiment, the relationship between related news and delivery results is indexed in the range of parts suppliers, competitors, and customer companies, so that it is possible to estimate superior parts based on results. In addition, the calculated contribution rate is replaced with the initial score of the differentiated leaf in the component delivery company strength measurement tree, thereby making it possible to estimate the enterprise strength reflecting the quality of the sales performance of the components.

以上、説明した本発明の第1乃至第8の実施例は下記の効果を奏する。すなわち、
第1の効果は、未知の製品が事業ドメインと合致している競合商品であるかどうか、自動的に判定できることである。その理由は、情報源を主体者、行動、製品名、特徴語と分解し、事業ドメイン辞書や技術辞書を用いて他の情報源と比較するため、今まで無名であった競合製品を発見し、購入対象として提示することができるためである。さらに、過去の製品リリースニュース履歴、事業ドメインに合致していない製品をリリースする総合企業と、事業ドメインに合致した製品のみをリリースする専門業者を分類することによって、誤って異なる事業ドメインの新製品と判定することを低減する。
The first to eighth embodiments of the present invention described above have the following effects. That is,
The first effect is that it is possible to automatically determine whether an unknown product is a competing product that matches the business domain. The reason for this is that the information source is decomposed into the subject, action, product name, and feature word, and compared with other information sources using business domain dictionaries and technical dictionaries. This is because it can be presented as a purchase target. In addition, past product release news history, comprehensive companies that release products that do not match the business domain, and specialists that only release products that match the business domain, are mistakenly classified as new products in different business domains. Is reduced.

第2の効果は、事業ドメインに合致した競合企業を発見し、専門業者と総合メーカを区別できることである。その理由は、事業ドメインで普遍的な技術辞書を用いて、新製品リリースニュースの特徴語と比較するため、製品が事業ドメインに合致していることが判明し、さらに開発した企業名も取得できるからである。さらに、競合企業が扱う製品が事業ドメインに属する割合を計測し、閾値以上の割合で事業ドメインに合致する製品をリリースしているか判定できるからである。   The second effect is that it is possible to find competitors that match the business domain and to distinguish between specialists and general manufacturers. The reason is that the product is matched with the business domain using a universal technical dictionary in the business domain and compared with the feature words of the new product release news, and the name of the developed company can also be obtained. Because. Furthermore, it is because it is possible to measure whether a product handled by a competitor belongs to a business domain and determine whether a product matching the business domain is released at a rate equal to or higher than a threshold.

第3の効果は、事業ドメインに合致した顧客企業を発見できることにある。その理由は、過去の製品納入ニュースから、事業ドメインの生産財を購入する企業を列挙し、まとめて提示することができるためである。これによって、過去に直接的に取引のない顧客を発見することができる。また、顧客企業の財務諸表を準備しておくことで、顧客の投資姿勢や余裕資金などを元に、優良顧客度合いを計算することで、どの顧客が生産財を購入しやすいか判定することができる。   The third effect is that a client company that matches the business domain can be found. This is because companies that purchase production goods in the business domain can be listed from past product delivery news and presented together. As a result, it is possible to find a customer who has not made a direct transaction in the past. In addition, by preparing the financial statements of client companies, it is possible to determine which customers are likely to purchase production goods by calculating the level of excellent customers based on the investment attitude of the customers and surplus funds. it can.

第4の効果は、事業ドメインに関連したキーワードを自動収集できることにある。その理由は、事業ドメインに属すると判定した情報源から、同時に出現する単語動詞を関連の深い単語として記憶できるからである。新しい競合製品の特徴語を、事業ドメイン辞書や技術辞書に追加するため、自動的に事業ドメインの用語を増殖させることができ、人手でメンテナンスする工数を削減することができる。さらに増殖した特徴語も含めて、後から入力される情報源を比較するため、より広く製品を発見することが可能になる。また、ニュースの情報源に同時に出現するキーワードを、技術辞書の距離に反映させることによって、関連の深さに応じた技術ワードを自動構築できる。   The fourth effect is that keywords related to the business domain can be automatically collected. The reason is that word verbs appearing simultaneously from information sources determined to belong to the business domain can be stored as closely related words. Since feature words of new competitive products are added to the business domain dictionary and the technical dictionary, business domain terms can be automatically expanded, and the number of man-hours required for manual maintenance can be reduced. Furthermore, since the information source inputted later is also compared including the feature word which grew, it becomes possible to discover a product more widely. In addition, by reflecting the keywords that appear simultaneously in the news information source in the distance of the technical dictionary, it is possible to automatically construct a technical word corresponding to the depth of association.

第5の効果は、顧客・競合・部品納入企業の企業力の差を定量化できることにある。その理由は、顧客、競合、部品納入企業という3つのタイプに企業力を測定するテンプレートを用意し、情報源に含まれるキーワードと、単語・ノード対応表と、競合企業力測定ツリーの構造と、リーフ値計算式から、キーワードの持つインパクトを過去の企業活動に照らし合わせて計算するからである。また、直接的には部品納入業者のニュースでも、それを採用する企業への影響力も技術辞書を用いて定量化するため、より正確に波及効果も定量化することができる。   The fifth effect is that the difference in corporate power among customers, competitors, and parts suppliers can be quantified. The reason for this is that templates for measuring corporate strength are prepared for the three types of customers, competitors, and parts suppliers, keywords included in information sources, word / node correspondence tables, and competitive enterprise strength measurement tree structures, This is because the impact of keywords is calculated from the leaf value calculation formula against the past business activities. Further, since the influence on the company that employs the parts supplier is directly quantified using the technical dictionary, the ripple effect can be quantified more accurately.

以上のような情報構造化処理は、専用コンピュータ、又はパーソナルコンピュータ(PC)などのコンピュータにより実現可能である。但し、コンピュータは、物理的に単一である必要はなく、分散処理を実行する場合には、複数であってもよい。図75に示すように、コンピュータ2100は、CPU2101(Central Processing Unit)、ROM2102(Read Only Memory)及びRAM2103(Random Access Memory)を有し、これらがバス2104を介して相互に接続されている。尚、コンピュータを動作させるためのOSソフトなどは、説明を省略するが、この情報処理装置を構築するコンピュータも当然備えているものとする。   The information structuring process as described above can be realized by a computer such as a dedicated computer or a personal computer (PC). However, the computer does not need to be physically single, and a plurality of computers may be used when performing distributed processing. As shown in FIG. 75, the computer 2100 has a CPU 2101 (Central Processing Unit), a ROM 2102 (Read Only Memory), and a RAM 2103 (Random Access Memory), which are connected to each other via a bus 2104. Although explanation of OS software for operating the computer is omitted, it is assumed that a computer for constructing the information processing apparatus is also provided.

バス2104には又、入出力インターフェース2105も接続されている。入出力インターフェース2105には、例えば、キーボード、マウス、センサなどよりなる入力部2106、CRT、LCDなどよりなるディスプレイ、並びにヘッドフォンやスピーカなどよりなる出力部2107、ハードディスクなどより構成される記憶部2108、モデム、ターミナルアダプタなどより構成される通信部2109などが接続されている。   An input / output interface 2105 is also connected to the bus 2104. The input / output interface 2105 includes, for example, an input unit 2106 made up of a keyboard, mouse, sensor, etc., a display made up of a CRT, LCD, etc., an output unit 2107 made up of headphones, speakers, etc., a storage unit 2108 made up of a hard disk, etc. A communication unit 2109 including a modem and a terminal adapter is connected.

CPU2101は、ROM2102に記憶されている各種プログラム、又は記憶部2108からRAM2103にロードされた各種プログラムに従って各種の処理を実行する。本実施例においては、例えば、情報源裁断処理、情報源再構築処理、情報源選別処理、グループ生成処理、情報源価値推定処理、波及力計算処理、企業力推定処理、需要周期推定処理、潜在購買力推定処理、販売力推定処理、又は競争力増強部品推定処理等の処理を実行する。RAM2103にはまた、CPU2101が各種の処理を実行する上において必要なデータなども適宜記憶される。   The CPU 2101 executes various processes according to various programs stored in the ROM 2102 or various programs loaded from the storage unit 2108 to the RAM 2103. In the present embodiment, for example, information source cutting processing, information source reconstruction processing, information source selection processing, group generation processing, information source value estimation processing, ripple power calculation processing, enterprise power estimation processing, demand cycle estimation processing, latency Processing such as purchasing power estimation processing, sales power estimation processing, or competitiveness enhancement component estimation processing is executed. The RAM 2103 also appropriately stores data necessary for the CPU 2101 to execute various processes.

通信部2109は、例えば図示しないインターネットを介しての通信処理を行ったり、CPU2101から提供されたデータを送信したり、通信相手から受信したデータをCPU2101、RAM2103、記憶部2108に出力したりする。記憶部2108はCPU2101との間でやり取りし、情報の保存・消去を行う。通信部2109は又、他の装置との間で、アナログ信号又はディジタル信号の通信処理を行う。   For example, the communication unit 2109 performs communication processing via the Internet (not shown), transmits data provided from the CPU 2101, and outputs data received from a communication partner to the CPU 2101, the RAM 2103, and the storage unit 2108. A storage unit 2108 communicates with the CPU 2101 to save and erase information. The communication unit 2109 also performs communication processing of analog signals or digital signals with other devices.

入出力インターフェース2105は又、必要に応じてドライブ2110が接続され、例えば、磁気ディスク2111、光ディスク2112、フレキシブルディスク2113、又は半導体メモリ2114などが適宜装着され、それらから読み出されたコンピュータプログラムが必要に応じて記憶部2108にインストールされる。   The input / output interface 2105 is also connected to a drive 2110 as necessary. For example, a magnetic disk 2111, an optical disk 2112, a flexible disk 2113, or a semiconductor memory 2114 is appropriately mounted, and a computer program read from them is required. Is installed in the storage unit 2108 accordingly.

なお、本発明は上述した実施例のみに限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。   It should be noted that the present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the scope of the present invention.

例えば、上述の実施例では、ハードウェアの構成として説明したが、これに限定されるものではなく、任意の処理を、CPU(Central Processing Unit)にコンピュータプログラムを実行させることにより実現することも可能である。この場合、コンピュータプログラムは、記録媒体に記録して提供することも可能であり、また、インターネットその他の伝送媒体を介して伝送することにより提供することも可能である。   For example, in the above-described embodiments, the hardware configuration has been described. However, the present invention is not limited to this, and any processing can be realized by causing a CPU (Central Processing Unit) to execute a computer program. It is. In this case, the computer program can be provided by being recorded on a recording medium, or can be provided by being transmitted via the Internet or another transmission medium.

本発明の第1の実施例にかかる情報構造化装置を示す図である。It is a figure which shows the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における情報源裁断部を示すブロック図である。It is a block diagram which shows the information source cutting part in the information structuring apparatus concerning 1st Example of this invention. 情報源文字列の構成を示す図である。It is a figure which shows the structure of an information source character string. 本発明の第1の実施例にかかる情報構造化装置における形態素解析結果を示す図である。It is a figure which shows the morphological analysis result in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における情報源再構築部を示す図である。It is a figure which shows the information source reconstruction part in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における情報源選別部を示すブロック図である。It is a block diagram which shows the information source selection part in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置が使用するドメイン辞書の構造を示す図である。It is a figure which shows the structure of the domain dictionary which the information structuring apparatus concerning 1st Example of this invention uses. 本発明の第1の実施例にかかる情報構造化装置が使用するドメイン辞書の一例を示す図である。It is a figure which shows an example of the domain dictionary which the information structuring apparatus concerning 1st Example of this invention uses. 本発明の第1の実施例にかかる情報構造化装置におけるグループ生成部を示すブロック図である。It is a block diagram which shows the group production | generation part in the information structuring apparatus concerning 1st Example of this invention. 製品構成をベースにした技術辞書を示す図である。It is a figure which shows the technical dictionary based on a product structure. 本発明の第1の実施例にかかる情報構造化装置が使用する技術辞書の構造を示す図である。It is a figure which shows the structure of the technical dictionary which the information structuring apparatus concerning 1st Example of this invention uses. 本発明の第1の実施例にかかる情報構造化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における形態素解析結果の一例を示す図である。It is a figure which shows an example of the morphological analysis result in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における情報再構築部が形態素を連結した後を示す図である。It is a figure which shows after the information reconstruction part in the information structuring apparatus concerning 1st Example of this invention connected the morpheme. 本発明の第1の実施例にかかる情報構造化装置における製品名抽出方法を示すフローチャートである。It is a flowchart which shows the product name extraction method in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における主体者抽出方法を示すフローチャートである。It is a flowchart which shows the subject extraction method in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における行動抽出方法を示すフローチャートである。It is a flowchart which shows the action extraction method in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における行動対象抽出方法を示すフローチャートである。It is a flowchart which shows the action target extraction method in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置におけるシノニム抽出方法を示すフローチャートである。It is a flowchart which shows the synonym extraction method in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における特徴語抽出方法を示すフローチャートである。It is a flowchart which shows the feature word extraction method in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における情報源再構築部が書式ルールに従って、主体者、製品名、行動、特徴語、シノニムを抽出した結果を示す図である。It is a figure which shows the result which the information source reconstruction part in the information structuring apparatus concerning 1st Example of this invention extracted the subject, the product name, the action, the characteristic word, and the synonym according to the format rule. 本発明の第1の実施例にかかる情報構造化装置における書式解析結果の一例を示す図である。It is a figure which shows an example of the format analysis result in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における適合情報源ツリー選別方法を示すフローチャートである。It is a flowchart which shows the suitable information source tree selection method in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置における情報源ツリーの増殖方法を示すフローチャートである。It is a flowchart which shows the propagation method of the information source tree in the information structuring apparatus concerning 1st Example of this invention. 本発明の第1の実施例の変形例にかかる情報構造化装置を示す図である。It is a figure which shows the information structuring apparatus concerning the modification of the 1st Example of this invention. 本発明の第1の実施例の変形例にかかる情報構造化装置における情報源再構築部を示す図である。It is a figure which shows the information source reconstruction part in the information structuring apparatus concerning the modification of the 1st Example of this invention. 本発明の第1の実施例の変形例にかかる情報構造化装置が生成する情報源ツリーを示す図である。It is a figure which shows the information source tree which the information structuring apparatus concerning the modification of the 1st Example of this invention produces | generates. 本発明の第1の実施例の変形例にかかる情報構造化装置における情報源選別部を示すブロック図である。It is a block diagram which shows the information source selection part in the information structuring apparatus concerning the modification of the 1st Example of this invention. 本発明の第1の実施例の変形例におけるグループ生成部を示すブロック図である。It is a block diagram which shows the group production | generation part in the modification of the 1st Example of this invention. 本発明の第1の実施例の変形例にかかる情報構造化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information structuring apparatus concerning the modification of the 1st Example of this invention. 本発明の第1の実施例にかかる情報構造化装置が生成した情報源ツリーの一例を示す図である。It is a figure which shows an example of the information source tree which the information structuring apparatus concerning 1st Example of this invention produced | generated. 本発明の第1の実施例にかかる情報構造化装置が生成した情報源ツリーの一例を示す図である。It is a figure which shows an example of the information source tree which the information structuring apparatus concerning 1st Example of this invention produced | generated. 本発明の第2の実施例にかかる情報構造化装置における情報源選別部を示すブロック図である。It is a block diagram which shows the information source selection part in the information structuring apparatus concerning 2nd Example of this invention. 本発明の第2の実施例にかかる情報構造化装置が参照する主体者辞書の構造を示す図である。It is a figure which shows the structure of the subject dictionary which the information structuring apparatus concerning 2nd Example of this invention refers. 本発明の情報構造化装置が増殖した事業ドメイン辞書の一例を示す図である。It is a figure which shows an example of the business domain dictionary which the information structuring apparatus of this invention expanded. 本発明の情報構造化装置が増殖した技術辞書の一例を示す図である。It is a figure which shows an example of the technical dictionary which the information structuring apparatus of this invention expanded. 本発明の第2の実施例にかかる情報構造化装置における書式解析結果の一例を示す図である。It is a figure which shows an example of the format analysis result in the information structuring apparatus concerning 2nd Example of this invention. 本発明の第2の実施例にかかる情報構造化装置における書式解析結果の一例を示す図である。It is a figure which shows an example of the format analysis result in the information structuring apparatus concerning 2nd Example of this invention. 本発明の第2の実施例の情報構造化装置が増殖した事業ドメイン辞書の一例を示す図である。It is a figure which shows an example of the business domain dictionary which the information structuring apparatus of 2nd Example of this invention propagated. 本発明の第3の実施例にかかる情報構造化装置を示す図である。It is a figure which shows the information structuring apparatus concerning the 3rd Example of this invention. 本発明の第3の実施例にかかる情報構造化装置における情報源価値推定部を示すブロック図である。It is a block diagram which shows the information source value estimation part in the information structuring apparatus concerning the 3rd Example of this invention. 本発明の第3の実施例にかかる情報構造化装置が参照する単語定量化マップを示す図である。It is a figure which shows the word quantification map which the information structuring apparatus concerning the 3rd Example of this invention refers. 本発明の第3の実施例にかかる情報構造化装置が参照する顧客企業力測定ツリーの構造を示す図である。It is a figure which shows the structure of the customer enterprise power measurement tree which the information structuring apparatus concerning 3rd Example of this invention refers. 本発明の第3の実施例にかかる情報構造化装置が参照する競合企業力測定ツリーの構造を示す図である。It is a figure which shows the structure of the competitive enterprise power measurement tree which the information structuring apparatus concerning 3rd Example of this invention refers. 本発明の第3の実施例にかかる情報構造化装置が参照する部品納入企業力測定ツリーの構造を示す図である。It is a figure which shows the structure of the parts delivery company power measurement tree which the information structuring apparatus concerning 3rd Example of this invention refers. 本発明の第3の実施例にかかる情報構造化装置が参照する単語定量化マップに含まれる単語・ノード対応表を示す図である。It is a figure which shows the word and node correspondence table contained in the word quantification map which the information structuring apparatus concerning 3rd Example of this invention refers. 本発明の第3の実施例にかかる情報構造化装置における企業力推定部を示すブロック図である。It is a block diagram which shows the enterprise power estimation part in the information structuring apparatus concerning the 3rd Example of this invention. ノード構造及びリーフ構造を示す図である。It is a figure which shows a node structure and a leaf structure. 本発明の第3の実施例にかかる情報構造化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information structuring apparatus concerning the 3rd Example of this invention. 本発明の第3の実施例にかかる情報構造化装置が生成した情報源ツリーの一例を示す図である。It is a figure which shows an example of the information source tree which the information structuring apparatus concerning the 3rd Example of this invention produced | generated. 本発明の第3の実施例にかかる情報構造化装置が生成した情報源ツリーの一例を示す図である。It is a figure which shows an example of the information source tree which the information structuring apparatus concerning the 3rd Example of this invention produced | generated. 本発明の第4の実施例にかかる情報構造化装置を示す図である。It is a figure which shows the information structuring apparatus concerning the 4th Example of this invention. 本発明の第4の実施例における波及力計算部を示すブロック図である。It is a block diagram which shows the ripple force calculation part in the 4th Example of this invention. 本発明の第4の実施例にかかる情報構造化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information structuring apparatus concerning the 4th Example of this invention. 本発明の第4の実施例にかかる情報構造化装置が参照する主体者辞書を示す図である。It is a figure which shows the subject dictionary which the information structuring apparatus concerning the 4th Example of this invention refers. 本発明の第4の実施例にかかる情報構造化装置が生成した情報源ツリーの一例を示す図である。It is a figure which shows an example of the information source tree which the information structuring apparatus concerning the 4th Example of this invention produced | generated. 本発明の第4の実施例にかかる情報構造化装置における波及力算出方法の詳細を示すフローチャートである。It is a flowchart which shows the detail of the ripple force calculation method in the information structuring apparatus concerning the 4th Example of this invention. ある商品の需要周期を示す図である。It is a figure which shows the demand cycle of a certain goods. 本発明の第5の実施例にかかる情報構造化装置を示す図である。It is a figure which shows the information structuring apparatus concerning the 5th Example of this invention. 本発明の第5の実施例における需要周期推定部を示すブロック図である。It is a block diagram which shows the demand period estimation part in the 5th Example of this invention. 本発明の第5の実施例にかかる情報構造化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information structuring apparatus concerning the 5th Example of this invention. 本発明の第6の実施例にかかる情報構造化装置を示す図である。It is a figure which shows the information structuring apparatus concerning the 6th Example of this invention. 本発明の第6の実施例にかかる情報構造化装置における潜在購買力推定部を示すブロック図である。It is a block diagram which shows the potential purchasing power estimation part in the information structuring apparatus concerning the 6th Example of this invention. 製品の機能と価格のバランスを説明する図である。It is a figure explaining the balance of the function and price of a product. 本発明の第6の実施例にかかる情報構造化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information structuring apparatus concerning the 6th Example of this invention. 本発明の第6の実施例の情報構造化装置により作成される表である。It is a table | surface produced with the information structuring apparatus of the 6th Example of this invention. 本発明の第7の実施例にかかる情報構造化装置を示す図である。It is a figure which shows the information structuring apparatus concerning the 7th Example of this invention. (a)は、販売力と期間の関係を示し、(b)は販売力と機能の関係を示す図である。(A) shows the relationship between the sales force and the period, and (b) shows the relationship between the sales force and the function. 本発明の第7の実施例にかかる情報構造化装置における販売力推定部を示すブロック図である。It is a block diagram which shows the sales force estimation part in the information structuring apparatus concerning the 7th Example of this invention. 本発明の第7の実施例にかかる情報構造化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information structuring apparatus concerning the 7th Example of this invention. 本発明の第8の実施例にかかる情報構造化装置を示す図である。It is a figure which shows the information structuring apparatus concerning the 8th Example of this invention. 本発明の第8の実施例にかかる情報構造化装置における競争力増強部品推定部を示すブロック図である。It is a block diagram which shows the competitiveness increase component estimation part in the information structuring apparatus concerning the 8th Example of this invention. 本発明の第8の実施例にかかる情報構造化装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the information structuring apparatus concerning the 8th Example of this invention. ニュース関係図を示す図である。It is a figure which shows a news relation figure. 本発明の実施例にかかるコンピュータを示す図である。It is a figure which shows the computer concerning the Example of this invention.

符号の説明Explanation of symbols

1,1b,21,31,41,51,61,71,81,91 情報構造化装置
2,12,22,32,43,53,63,72,82,92 定量化装置
100 情報源裁断部
101 情報源蓄積部
102 形態素解析部
103 形態素蓄積部
200 情報源再構築部
201 書式解析部
202 書式ルール蓄積部
203 要素単語格納部
204 ツリー生成部
205 情報源ツリー格納部
206 情報源メタ情報格納部
300,300b,300c 情報源選別部
301 情報源選別部
301b ツリー選別部
302 ドメイン辞書格納部
303 適合情報源格納部
303b 適合情報源ツリー格納部
304 非適合情報源格納部
304b 非適合情報源ツリー格納部
305 主体者辞書
400,400b グループ生成部
401 情報源増殖部
401b ツリー増殖部
402 技術辞書格納部
500 情報源価値推定部
501 主体者判定部
502 主体者辞書格納部
503 情報源格納部
504 情報源定量化部
505 単語定量化マップ格納部
506 情報減初期スコア格納部
507 企業力測定ツリー格納部
600 企業力推定部
601 企業力計算部
602 情報源最終スコア格納部
700 波及力計算部
701 部品納入情報源選別部
702 納入先企業抽出部
703 特徴語列挙部
704 近距離用語抽出部
705 波及力計算部
800 需要周期推定部
801 製品採用情報選別部
802 製品納入情報選別部
803 重複検知部
804 月間累計カウンタ
805 商品需要表示部
900 潜在購買力推定部
901 製品採用情報選択部
902 製品納入情報選別部
903 重複検知部
904 他社製品特徴語選別部
905 自社類似製品選別部
906 他社製品採用顧客選別部
907 財務情報取得部
908 投資実績計算部
909 投資類似度計算部
910 顧客集合選別部
911 他社製品未採用顧客選別部
1000 販売力推定部
1001 製品別特徴語収集部
1002 平均特徴語算出部
1003 製品開発情報選別部
1004 製品別特徴語収集部
1005 製品開発情報選別部
1006 平均特徴語数算出部
1007 競合製品販売率算出部
1100 競争力増強部品推定部
1101 部品採用率上位企業選別部
1102 競合企業製品納入実績選別部
1103 部品貢献率算出部
2100 コンピュータ
2101 CPU
2102 ROM
2103 RAM
2104 バス
2105 入出力インターフェース
2106 入力部
2107 出力部
2108 記憶部
2109 通信部
2110 ドライブ
2111 磁気ディスク
2112 光ディスク
2113 フレキシブルディスク
2114 半導体メモリ
1, 1b, 21, 31, 41, 51, 61, 71, 81, 91 Information structuring device 2, 12, 22, 32, 43, 53, 63, 72, 82, 92 Quantifying device 100 Information source cutting unit 101 Information Source Storage Unit 102 Morphological Analysis Unit 103 Morphological Storage Unit 200 Information Source Reconstruction Unit 201 Format Analysis Unit 202 Format Rule Storage Unit 203 Element Word Storage Unit 204 Tree Generation Unit 205 Information Source Tree Storage Unit 206 Information Source Meta Information Storage Unit 300, 300b, 300c Information source selection unit 301 Information source selection unit 301b Tree selection unit 302 Domain dictionary storage unit 303 Applicable information source storage unit 303b Applicable information source tree storage unit 304 Non-conforming information source storage unit 304b Non-conforming information source tree storage Unit 305 Subject dictionary 400, 400b Group generation unit 401 Information source multiplication unit 401b Tree multiplication unit 40 2 Technical dictionary storage unit 500 Information source value estimation unit 501 Subject determination unit 502 Subject dictionary storage unit 503 Information source storage unit 504 Information source quantification unit 505 Word quantification map storage unit 506 Information reduction initial score storage unit 507 Measurement tree storage unit 600 Enterprise power estimation unit 601 Enterprise power calculation unit 602 Information source final score storage unit 700 Ripple force calculation unit 701 Parts delivery information source selection unit 702 Delivery destination company extraction unit 703 Feature word enumeration unit 704 Short-range term extraction unit 705 Ripple calculation unit 800 Demand cycle estimation unit 801 Product adoption information selection unit 802 Product delivery information selection unit 803 Duplicate detection unit 804 Monthly cumulative counter 805 Product demand display unit 900 Potential purchasing power estimation unit 901 Product adoption information selection unit 902 Product delivery information Sorting unit 903 Duplicate detection unit 904 Competitor product feature word sorting unit 905 In-house similar product selection 906 Financial information acquisition unit 908 Investment performance calculation unit 909 Investment similarity calculation unit 910 Customer group selection unit 911 Other company product non-adopted customer selection unit 1000 Sales force estimation unit 1001 Product feature word collection unit 1002 Average feature word calculation unit 1003 Product development information selection unit 1004 Product-specific feature word collection unit 1005 Product development information selection unit 1006 Average feature word number calculation unit 1007 Competitive product sales rate calculation unit 1100 Competitiveness enhancement component estimation unit 1101 Component adoption rate top companies Sorting unit 1102 Competitor product delivery results sorting unit 1103 Part contribution rate calculation unit 2100 Computer 2101 CPU
2102 ROM
2103 RAM
2104 Bus 2105 Input / output interface 2106 Input unit 2107 Output unit 2108 Storage unit 2109 Communication unit 2110 Drive 2111 Magnetic disk 2112 Optical disk 2113 Flexible disk 2114 Semiconductor memory

Claims (25)

情報源を分割して単語を生成する情報源裁断部と、
予め定められた書式ルールに従って前記単語を分類する情報源再構築部と、
事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別部と、
単語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した単語辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成部とを有する情報構造化装置。
An information source cutting unit that divides the information source to generate words;
An information source restructuring unit for classifying the word according to a predetermined format rule;
An information source selection unit that refers to a business domain dictionary in which business domains are registered, and selects the information source as a conforming information source related to a production good or a non-conformity information source not related to a production good;
Referring to a word dictionary in which a set of words and their synonyms is classified based on a superordinate concept and / or subordinate concept in the business domain, and extracting information sources having a high probability of producing goods from the non-conforming information sources, An information structuring apparatus having a group generation unit as a compatible information source.
前記情報源裁断部は、前記情報源を形態素に分割する形態素解析部を有する
ことを特徴とする請求項1記載の情報構造化装置。
The information structuring apparatus according to claim 1, wherein the information source cutting unit includes a morpheme analysis unit that divides the information source into morphemes.
前記情報源再構築部は、前記単語を組み合せ、主体者をルートとする情報源ツリーを形成する
ことを特徴とする請求項1又は2記載の情報構造化装置。
The information structuring apparatus according to claim 1, wherein the information source restructuring unit forms the information source tree having the subject as a root by combining the words.
前記情報源再構築部は、
前記不可分要素を製品名、主体者、特徴語、及び行動に分類する書式解析部と、
前記書式解析結果に基づき前記不可分要素に分断された情報源から前記情報源ツリーを生成するツリー生成部とを有する
ことを特徴とする請求項3項記載の情報構造化装置。
The information source reconstruction unit
A format analysis unit for classifying the inseparable elements into product names, subjects, feature words, and actions;
The information structuring apparatus according to claim 3, further comprising: a tree generation unit configured to generate the information source tree from the information source divided into the inseparable elements based on the format analysis result.
前記書式解析部は、前記形態素のうち、連続する名詞を結合して要素単語を生成する
ことを特徴とする請求項4項記載の情報構造化装置。
The information structuring apparatus according to claim 4, wherein the format analysis unit generates an element word by combining consecutive nouns in the morpheme.
前記グループ生成部は、主体者が種別毎に分類された主体者辞書を参照し、前記適合情報源を主体者毎に分類する
ことを特徴とする請求項1乃至5のいずれか1項記載の情報構造化装置。
The said group production | generation part refers to the subject person dictionary by which the subject person was classified for every classification, and classifies the said conformity information source for every subject person. The Claim 1 thru | or 5 characterized by the above-mentioned. Information structuring device.
前記情報源選別部は、前記適合情報源を構成する単語のうち、前記事業ドメイン辞書に存在しない単語を、当該事業ドメイン辞書に登録する
ことを特徴とする請求項1乃至5のいずれか1項記載の情報構造化装置。
The said information source selection part registers the word which does not exist in the said business domain dictionary among the words which comprise the said conforming information source in the said business domain dictionary. The information structuring apparatus described.
前記グループ生成部は、前記適合情報源を構成する単語のうち、前記単語辞書に存在しない単語を、当該単語辞書に登録する
ことを特徴とする請求項1乃至6のいずれか1項記載の情報構造化装置。
The information according to any one of claims 1 to 6, wherein the group generation unit registers, in the word dictionary, a word that does not exist in the word dictionary among words constituting the matching information source. Structured device.
前記単語辞書は、単語間の類似度に基づき当該単語間の距離が設定されたものであって、
前記単語辞書を参照し、納入元企業が主体者となる情報源に含まれる単語と、納入先企業に関する情報源に含まれる単語との距離に応じて、前記納入先企業に対する前記納入元企業の影響力を算出する波及力計算部を更に有する
ことを特徴とする請求項1乃至7のいずれか1項記載の情報構造化装置。
The word dictionary is a set of distances between words based on the similarity between words,
With reference to the word dictionary, according to the distance between the word included in the information source for which the supplier company is the subject and the word included in the information source regarding the destination company, The information structuring apparatus according to claim 1, further comprising a ripple force calculation unit that calculates an influence force.
顧客企業の製品採用情報源における製品及び納入元と、競合企業の製品納入情報源における製品及び納入先とに基づき当該製品の需要周期を推定する需要周期推定部を更に有する
ことを特徴とする請求項1乃至8のいずれか1項記載の情報構造化装置。
The system further comprises a demand cycle estimation unit for estimating a demand cycle of the product based on the product and delivery source in the product adoption information source of the customer company and the product and delivery destination in the product delivery information source of the competitor company. Item 9. The information structuring apparatus according to any one of Items 1 to 8.
顧客企業の財務情報と、顧客企業の製品購入履歴又は競合企業の製品販売実績とに基づき、当該顧客企業の潜在購買力を推定する潜在購買力推定部を更に有する
ことを特徴とする請求項1乃至9のいずれか1項記載の情報構造化装置。
10. A potential purchasing power estimation unit for estimating the potential purchasing power of the customer company based on the financial information of the customer company and the product purchase history of the customer company or the product sales performance of the competitor company. The information structuring apparatus according to any one of the above.
単語辞書は、技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書である
ことを特徴とする請求項1乃至11のいずれか1項記載の情報構造化装置。
The information dictionary according to any one of claims 1 to 11, wherein the word dictionary is a technical dictionary in which a set of technical terms and synonyms thereof is classified based on a superordinate concept and / or a subordinate concept in the business domain. Structured device.
情報源を分割して単語を生成する情報源裁断工程と、
予め定められた書式ルールに従って前記単語を分類する情報源再構築工程と、
事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別工程と、
技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成工程とを有する情報構造化方法。
An information source cutting step of dividing the information source to generate words;
An information source reconstruction step of classifying the word according to a predetermined format rule;
An information source selection step of selecting a business domain dictionary in which business domains are registered and selecting the information source as a conforming information source related to a production good or a non-conformity information source not related to a production good;
Referring to a technical dictionary in which a set of technical terms and synonyms thereof is classified based on a superordinate concept and / or subordinate concept in the business domain, and extracting information sources having a high probability of producing goods from the non-conforming information sources; And an information structuring method including a group generation step as the matching information source.
前記情報源裁断工程では、前記情報源を形態素に分割する形態素解析部を有する
ことを特徴とする請求項13記載の情報構造化方法。
The information structuring method according to claim 13, further comprising: a morpheme analysis unit that divides the information source into morphemes in the information source cutting step.
前記情報源再構築工程では、前記単語を組み合せ、主体者をルートとする情報源ツリーを形成する
ことを特徴とする請求項13又は14記載の情報構造化方法。
The information structuring method according to claim 13 or 14, wherein, in the information source reconstruction step, the information source tree is formed by combining the words and having the subject as a root.
前記情報源再構築工程は、
前記不可分要素を製品名、主体者、特徴語、及び行動に分類する書式解析工程と、
前記書式解析結果に基づき前記不可分要素に分断された情報源から前記情報源ツリーを生成するツリー生成工程とを有する
ことを特徴とする請求項15項記載の情報構造化方法。
The information source reconstruction step includes:
A format analysis step for classifying the inseparable elements into product names, subjects, feature words, and actions;
16. The information structuring method according to claim 15, further comprising: a tree generation step of generating the information source tree from the information source divided into the inseparable elements based on the format analysis result.
前記書式解析工程では、前記形態素のうち、連続する名詞を結合して要素単語を生成する
ことを特徴とする請求項16項記載の情報構造化方法。
The information structuring method according to claim 16, wherein in the format analysis step, element words are generated by combining consecutive nouns of the morphemes.
前記情報源選別工程では、前記適合情報源を構成する単語のうち、前記事業ドメイン辞書に存在しない単語を、当該事業ドメイン辞書に登録する
ことを特徴とする請求項13乃至17のいずれか1項記載の情報構造化方法。
The said information source selection process WHEREIN: The word which does not exist in the said business domain dictionary among the words which comprise the said conforming information source is registered into the said business domain dictionary. The any one of Claim 13 thru | or 17 characterized by the above-mentioned. Information structuring method described.
前記グループ生成工程では、主体者が種別毎に分類された主体者辞書を参照し、前記適合情報源を主体者毎に分類する
ことを特徴とする請求項13乃至18のいずれか1項記載の情報構造化方法。
19. The group generation process according to claim 13, wherein in the group generation step, the subject refers to a subject dictionary classified by type, and classifies the conforming information source for each subject. Information structuring method.
前記グループ生成工程では、前記適合情報源を構成する単語のうち、前記技術辞書に存在しない単語を、当該技術辞書に登録する
ことを特徴とする請求項13乃至19のいずれか1項記載の情報構造化方法。
The information according to any one of claims 13 to 19, wherein in the group generation step, a word that does not exist in the technical dictionary among words constituting the matching information source is registered in the technical dictionary. Structured method.
前記技術辞書は、単語間の類似度に基づき当該単語間の距離が設定されたものであって、
前記技術辞書を参照し、納入元企業が主体者となる情報源に含まれる単語と、納入先企業に関する情報源に含まれる単語との距離に応じて、前記納入先企業に対する前記納入元企業の影響力を算出する波及力計算工程を更に有する
ことを特徴とする請求項13乃至20のいずれか1項記載の情報構造化方法。
The technical dictionary has a distance between words set based on the similarity between words,
With reference to the technical dictionary, according to the distance between the word included in the information source for which the supplier company is the subject and the word included in the information source regarding the destination company, The information structuring method according to any one of claims 13 to 20, further comprising a ripple force calculation step of calculating influence.
顧客企業の製品採用情報源における製品及び納入元と、競合企業の製品納入情報源における製品及び納入先とに基づき当該製品の需要周期を推定する需要周期推定工程を更に有する
ことを特徴とする請求項13乃至21のいずれか1項記載の情報構造化方法。
Further comprising a demand cycle estimation step of estimating a demand cycle of the product based on the product and delivery source in the product adoption information source of the customer company and the product and delivery destination in the product delivery information source of the competitor company. Item 22. The information structuring method according to any one of Items 13 to 21.
顧客企業の財務情報と、顧客企業の製品購入履歴又は競合企業の製品販売実績とに基づき、当該顧客企業の潜在購買力を推定する潜在購買力推定工程を更に有する
ことを特徴とする請求項13乃至22のいずれか1項記載の情報構造化方法。
23. A potential purchasing power estimation step for estimating the potential purchasing power of the customer company based on the financial information of the customer company and the product purchase history of the customer company or the product sales performance of the competitor company, further comprising: The information structuring method according to any one of the above.
単語辞書は、技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書である
ことを特徴とする請求項13乃至23のいずれか1項記載の情報構造化方法。
24. The information dictionary according to claim 13, wherein the word dictionary is a technical dictionary in which a set of technical terms and synonyms thereof is classified based on a higher concept and / or a lower concept in the business domain. Structured method.
入力される情報源を構造化する処理をコンピュータに実行させるためのプログラムであって、
情報源を分割して単語を生成する情報源裁断工程と、
予め定められた書式ルールに従って前記単語を分類する情報源再構築工程と、
事業ドメインが登録された事業ドメイン辞書を参照して、前記情報源が生産財に関するものである適合情報源か、生産財に関するものではない非適合情報源かに選別する情報源選別工程と、
技術用語及びそのシノニムの集合を、その事業ドメインにおける上位概念及び/又は下位概念に基づき分類した技術辞書を参照し、前記非適合情報源の中から生産財に関する蓋然性が高い情報源を抽出し、前記適合情報源とするグループ生成工程とを有するプログラム。
A program for causing a computer to execute processing for structuring an input information source,
An information source cutting step of dividing the information source to generate words;
An information source reconstruction step of classifying the word according to a predetermined format rule;
An information source selection step of selecting a business domain dictionary in which business domains are registered and selecting the information source as a conforming information source related to a production good or a non-conformity information source not related to a production good;
Referring to a technical dictionary in which a set of technical terms and synonyms thereof is classified based on a superordinate concept and / or subordinate concept in the business domain, and extracting information sources having a high probability of producing goods from the non-conforming information sources; A program including a group generation step as the matching information source.
JP2007196659A 2007-07-27 2007-07-27 Information structuring apparatus, information structuring method, and program Expired - Fee Related JP5018313B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007196659A JP5018313B2 (en) 2007-07-27 2007-07-27 Information structuring apparatus, information structuring method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007196659A JP5018313B2 (en) 2007-07-27 2007-07-27 Information structuring apparatus, information structuring method, and program

Publications (2)

Publication Number Publication Date
JP2009032118A true JP2009032118A (en) 2009-02-12
JP5018313B2 JP5018313B2 (en) 2012-09-05

Family

ID=40402541

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007196659A Expired - Fee Related JP5018313B2 (en) 2007-07-27 2007-07-27 Information structuring apparatus, information structuring method, and program

Country Status (1)

Country Link
JP (1) JP5018313B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014174465A (en) * 2013-03-12 2014-09-22 Ricoh Co Ltd Information processor, information processing method and program
JP2019016360A (en) * 2018-07-26 2019-01-31 株式会社リコー Information processing apparatus and information processing method, and program
JP2019211846A (en) * 2018-05-31 2019-12-12 リンカーズ株式会社 Technical information providing system
CN111290677A (en) * 2018-12-07 2020-06-16 中电长城(长沙)信息技术有限公司 Self-service equipment navigation method and navigation system thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785071A (en) * 1993-09-17 1995-03-31 Nec Corp Information extracting device
JPH10283366A (en) * 1997-04-09 1998-10-23 Matsushita Electric Ind Co Ltd Information classifying device
JP2005135113A (en) * 2003-10-29 2005-05-26 Sony Corp Electronic equipment, related word extracting method, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0785071A (en) * 1993-09-17 1995-03-31 Nec Corp Information extracting device
JPH10283366A (en) * 1997-04-09 1998-10-23 Matsushita Electric Ind Co Ltd Information classifying device
JP2005135113A (en) * 2003-10-29 2005-05-26 Sony Corp Electronic equipment, related word extracting method, and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014174465A (en) * 2013-03-12 2014-09-22 Ricoh Co Ltd Information processor, information processing method and program
JP2019211846A (en) * 2018-05-31 2019-12-12 リンカーズ株式会社 Technical information providing system
JP2019016360A (en) * 2018-07-26 2019-01-31 株式会社リコー Information processing apparatus and information processing method, and program
CN111290677A (en) * 2018-12-07 2020-06-16 中电长城(长沙)信息技术有限公司 Self-service equipment navigation method and navigation system thereof
CN111290677B (en) * 2018-12-07 2023-09-19 中电长城(长沙)信息技术有限公司 Self-service equipment navigation method and navigation system thereof

Also Published As

Publication number Publication date
JP5018313B2 (en) 2012-09-05

Similar Documents

Publication Publication Date Title
JP7092315B2 (en) Automated systems and methods for creating machine-generated ads
Li et al. Discovering public sentiment in social media for predicting stock movement of publicly listed companies
Provost et al. Data Science for Business: What you need to know about data mining and data-analytic thinking
O'Leary Blog mining-review and extensions:“From each according to his opinion”
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
JP5253519B2 (en) Method, apparatus and storage medium for generating smart text
Wang et al. Customer-driven product design selection using web based user-generated content
Lu et al. Data science in the business environment: customer analytics case studies in SMEs
CN102402717A (en) Data analysis facility and method
Sydow et al. Diversity of editors and teams versus quality of cooperative work: experiments on Wikipedia
JP5018313B2 (en) Information structuring apparatus, information structuring method, and program
Kadre et al. Practical Business Analytics Using SAS: A Hands-on Guide
JP7065718B2 (en) Judgment support device and judgment support method
Ha et al. Job forecasting based on the patent information: a word embedding-based approach
Lin et al. Converting consumer-generated content into an innovation resource: A user ideas processing framework in online user innovation communities
JP2009053983A (en) Information structurization apparatus, information structurization method and program
JP2018142190A (en) Decision assisting system and decision assisting method
Kayed et al. Towards an ontology for software product quality attributes
Hazarika et al. Are numeric ratings true representations of reviews? A study of inconsistency between reviews and ratings
JP2020201819A (en) Business matching support device and business matching support method
KR102405503B1 (en) Method for creating predictive market growth index using transaction data and social data, system for creating predictive market growth index using the same and computer program for the same
JP2009032119A (en) Information structuring device, information structuring method, and program
Al-Obeidat et al. A sentiment analysis approach of data volatility for consumer satisfaction in the fashion industry
Tekin et al. Big data concept in small and medium enterprises: how big data effects productivity
Shikalgar et al. Online Review Mining for forecasting sales

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100614

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120424

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120528

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees