JP2001117904A - Predictive diagnostic device for predicting device - Google Patents

Predictive diagnostic device for predicting device

Info

Publication number
JP2001117904A
JP2001117904A JP29487499A JP29487499A JP2001117904A JP 2001117904 A JP2001117904 A JP 2001117904A JP 29487499 A JP29487499 A JP 29487499A JP 29487499 A JP29487499 A JP 29487499A JP 2001117904 A JP2001117904 A JP 2001117904A
Authority
JP
Japan
Prior art keywords
records
value
certainty
predictive
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP29487499A
Other languages
Japanese (ja)
Inventor
Yoshie Inada
由江 稲田
Satoshi Inano
聡 稲野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP29487499A priority Critical patent/JP2001117904A/en
Publication of JP2001117904A publication Critical patent/JP2001117904A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To prevent the number of records from being scattered between the threshold values of the result predicted by a predicting device and to directly effectively utilize a predictive diagnostic device for business. SOLUTION: This device is provided with an output part for displaying a predictive diagnostic graph by preparing a certainty table concerning plural predictive values and respective certainties having the intervals of cumulative values for the number of random records generated by the predicting device equipped with a predictive value generating part and a certainty generating part concerning the specified attribute of a new record while using a lot of records containing plural kinds of attribute information, a means for setting the cumulative value for the ideal number of records having fixed intervals concerning the cumulative value for the number of records, and a means for determining the threshold value of the certainty corresponding to the set cumulative value for the ideal number of records.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は予測装置の予測診断
装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a prediction diagnosis device for a prediction device.

【0002】予測装置は大量の過去(既知)のデータ
(レコード)を用いて,未知のデータについてその属性
(カテゴリ)について種々の予測を行うものである。そ
して,予測装置により予測した結果を用いて,その内容
から何が分かるかを解析する装置が予測装置の予測診断
装置である。
[0002] A prediction device uses a large amount of past (known) data (records) to perform various predictions on attributes (categories) of unknown data. A device that analyzes what can be understood from the contents using the result predicted by the prediction device is a prediction diagnosis device of the prediction device.

【0003】予測装置では,各レコードのデータについ
て既知のデータに近似するデータを利用して指定された
項目について予測を行って,その予測値と実際の値に近
い度合いを表す確信度を表す値を含めた予測結果を発生
し,各予測値についてのレコード数の累積値を含めた予
測診断グラフを作成する方法が用いられている。
[0003] The prediction device predicts a designated item using data that is close to known data for each record data, and provides a value indicating a certainty factor indicating a degree close to the predicted value and the actual value. Is used to generate a prediction result including the total number of records for each predicted value and to generate a predicted diagnosis graph including the cumulative value of the number of records for each predicted value.

【0004】[0004]

【従来の技術】図7は従来の予測診断装置による予測結
果テーブルを表す。このテーブルの中の列のa〜eは,
多数の人物に関するレコードのデータであり,aはそれ
ぞれ異なる人物に対応するレコードの番号(この例では
行方向に0〜4の番号だけを示す)を表し,bは各レコ
ードに対応する人物の年齢,cは職業,dは性別を表
し,eは各番号の人物についての実際(既知)の値を表
す。この例では実際の値eとして,1または2の2値の
何れかであるが,この値としては,例えば,運転免許を
得ているか否か,喫煙者か否か等の2値で表す事象につ
いて何れに属したかを示しているが,3値以上の多数の
カテゴリの中の何れかの値をとる例もある。
2. Description of the Related Art FIG. 7 shows a prediction result table by a conventional prediction diagnosis apparatus. The columns ae in this table are:
Data of records related to a large number of persons, a represents the number of a record corresponding to each different person (in this example, only the numbers 0 to 4 are shown in the row direction), and b represents the age of the person corresponding to each record. , C represent occupations, d represents gender, and e represents actual (known) values for the person of each number. In this example, the actual value e is either one of two values, 1 or 2. For example, an event represented by a binary value such as whether or not a driver's license is obtained or whether or not a smoker is used. It is shown to which of the categories belongs, but there is also an example in which any one of many categories of three or more values is taken.

【0005】図7のf〜h は予測結果のデータであり,
fは各人物に類似した既知のレコードのデータに基づい
た予測値であり,この例はeに示すものと同じカテゴリ
に関する予測値であり,1または2の何れかの値をと
る。gはfに示す予測値が1となる確率を表す予測値1
の確信度,hはfに示す予測値が2となる確率を表す予
測値2の確信度である。例えば,レコード番号1の場
合,年齢30,主婦,実際の値が2で,予測値1の確信
度が0.2で,予測値2の確信度が0.8であるため,
予測値は2(予測値の確信度の一番大きいもの)とな
り,この時の実際の値も2である。
[0005] f to h in FIG. 7 are data of prediction results.
f is a predicted value based on data of a known record similar to each person, and in this example, is a predicted value related to the same category as that shown in e, and takes either 1 or 2. g is a predicted value 1 representing a probability that the predicted value indicated by f becomes 1
And h is the certainty of the predicted value 2 representing the probability that the predicted value indicated by f becomes 2. For example, in the case of record number 1, the age 30, the housewife, the actual value is 2, the confidence of predicted value 1 is 0.2, and the confidence of predicted value 2 is 0.8,
The predicted value is 2 (the highest confidence value of the predicted value), and the actual value at this time is also 2.

【0006】図8は従来の予測診断装置の確信度閾値テ
ーブルである。このテーブルは,上記図7のような予測
装置による予測結果が得られると,予測値の確信度の閾
値を一定の大きさに決めて,決定した閾値に対応して図
8のようにレコード数の累積と正答数(予測値に対する
実際の値が一致した数)の累積を表す確信度閾値テーブ
ルを作成する。このテーブルにおいて,確信度の閾値が
0.9の場合,確信度が0.9以上となるレコード数の
累積は10個で,正答数(この場合は予測値1を正答と
する)の累積は1である。また,確信度の閾値が0.8
以上の場合,レコード数の累積(0.9以上を含む)は
15で,正答数の累積は5である。以下,同様に各確信
度の閾値に対応してレコード数の累積,正答数の累積の
数値が得られ,確信度の閾値を0とした場合,レコード
数の累積は100(全レコード数)で,正答数(予測値
1)の累積は40である。
FIG. 8 is a certainty threshold table of the conventional predictive diagnosis apparatus. When a prediction result obtained by the prediction device as shown in FIG. 7 is obtained, the threshold of the certainty factor of the predicted value is determined to a certain size, and the number of records corresponding to the determined threshold is calculated as shown in FIG. And a confidence threshold table representing the accumulation of the number of correct answers and the number of correct answers (the number of actual values that match the predicted value) is created. In this table, when the certainty threshold is 0.9, the accumulation of the number of records having the certainty of 0.9 or more is 10, and the accumulation of the number of correct answers (in this case, the predicted value 1 is the correct answer) is It is one. If the confidence threshold is 0.8
In the above case, the cumulative number of records (including 0.9 or more) is 15, and the cumulative number of correct answers is 5. Hereinafter, similarly, the numerical values of the accumulation of the number of records and the accumulation of the number of correct answers are obtained corresponding to the threshold of each certainty. When the threshold of the certainty is set to 0, the accumulation of the number of records is 100 (the total number of records). , The number of correct answers (predicted value 1) is 40.

【0007】図9は従来の予測診断グラフである。この
予測診断グラフは上記図8に示す確信度閾値テーブルを
用いて行われ,二次元グラフを用いて表したもので,横
軸がレコード数の累積(累計)を表し,最大値が上記図
7の例に対応した累積(=100)に対応し,縦軸が正
答数の累積を表し,最大値が上記図8の例に対応した累
積(=40)に対応する。そして,図9のグラフの原点
と対角を結ぶ点線は,予測診断グラフを使用しないでラ
ンダムに求めた場合のレコード数の累積数に対応する正
答数を表し,実線の曲線は,上記図8に示す各確信度の
閾値に対応した正答数(予測値1)をグラフ上にプロッ
トして結線したものである。また,確信度の閾値の数は
ユーザが指定し,その間隔は〔0,1〕を等分して決定
していた。そのため,閾値におけるレコード数はまばら
となり,予測診断グラフにおけるX軸方向のレコード数
の累積値に偏り(数値が飛躍)ができていた。例えば,
ダイレクトメールを一定数発送する場合に,対象となる
多数の人物の中から目的に対して正答となる予測値の確
信度が所定値以上となる累積が望んだ数に達するよう予
測を行う場合に累積値に偏りがあると,累積値の中間の
値について誤差が生じる。
FIG. 9 is a conventional predictive diagnosis graph. This predictive diagnosis graph is performed using the certainty threshold table shown in FIG. 8 and is expressed using a two-dimensional graph. The horizontal axis represents the accumulation (total) of the number of records, and the maximum value is the maximum value in FIG. 8 corresponds to the accumulation (= 100), the vertical axis represents the accumulation of the number of correct answers, and the maximum value corresponds to the accumulation (= 40) corresponding to the example of FIG. The dotted line connecting the origin and the diagonal of the graph in FIG. 9 represents the number of correct answers corresponding to the cumulative number of records when randomly obtained without using the predictive diagnosis graph, and the solid line curve represents the curve in FIG. The number of correct answers (predicted value 1) corresponding to each certainty threshold shown in FIG. 7 is plotted on a graph and connected. Also, the number of thresholds of the certainty factor is specified by the user, and the interval is determined by equally dividing [0, 1]. For this reason, the number of records at the threshold value is sparse, and the cumulative value of the number of records in the X-axis direction in the predictive diagnosis graph is biased (the numerical value jumps). For example,
When sending a certain number of direct mails, when predicting so that the degree of certainty of the predicted value that is the correct answer from the target among a large number of target persons reaches a desired number or more, the confidence level of the predicted value reaches a desired value or more. If there is a bias in the accumulated value, an error occurs for a value intermediate between the accumulated values.

【0008】[0008]

【発明が解決しようとする課題】上記した図9に示す従
来の予測診断グラフは,レコード数と正答数の情報のみ
の解析であり,これらの情報だけでは直接実際のビジネ
ス(コスト,収入,利益等の要素を含む)における予測
のコスト評価に活用できないという問題があった。
The conventional predictive diagnosis graph shown in FIG. 9 described above is an analysis of only the information on the number of records and the number of correct answers, and the actual business (cost, income, profit Etc.) cannot be used for the cost evaluation of prediction.

【0009】また,確信度の閾値の等分決定では,閾値
間のレコード数(サンプル数あるいはデータ数)がまば
らになってしまい,予測診断グラフにおいて滑らかな曲
線が作成できず,予測結果の精密な診断が困難になると
いう問題があった。具体的には,例えば,ダイレクトメ
ールを一定数発送する例を想定すると,対象となる多数
の人物の中から目的に対して正答となる予測値の確信度
が所定値以上となる累積が望んだ数に達するよう予測を
行った場合に,間隔がまばらになると予測結果の診断が
正確にできない。
In the determination of the certainty threshold equally, the number of records (the number of samples or the number of data) between the thresholds becomes sparse, and a smooth curve cannot be created in the predictive diagnosis graph. There is a problem that difficult diagnosis becomes difficult. Specifically, for example, assuming an example in which a certain number of direct mails are sent out, it is desired that, from among a large number of target persons, a certainty value of a predicted value that is a correct answer to a purpose be accumulated to a predetermined value or more. When the prediction is performed to reach the number, if the intervals are sparse, the prediction result cannot be accurately diagnosed.

【0010】本発明は予測装置の予測診断装置を直接ビ
ジネスで活用できること及び予測結果の閾値間のレコー
ド数がまばらにならないようにする予測診断装置を提供
することを目的とする。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a predictive diagnostic apparatus which can directly use a predictive diagnostic apparatus of a predictive apparatus in business and which prevents the number of records between thresholds of predictive results from being sparse.

【0011】[0011]

【課題を解決するための手段】図1は本発明の第1の原
理構成であり,予測診断装置による理想レコード数に対
応する確信度を作成するための原理構成を示し,図1の
A.は構成図,B.は第1の原理による確信度閾値テー
ブルの例である。
FIG. 1 shows a first principle configuration of the present invention, and shows a principle configuration for creating a certainty factor corresponding to the ideal number of records by a predictive diagnosis apparatus. Is a configuration diagram. Is an example of a certainty threshold table according to the first principle.

【0012】図1のA.において,1は予測装置,1a
は既知のデータを利用して新たに発生したレコードにつ
いて予測値を生成する予測値生成部,1bは予測値の確
信度を生成する確信度生成部,2は予測診断装置,2a
は確信度閾値決定部,2bは予測診断グラフ出力部,3
はテーブル格納部,3aは確信度閾値テーブル,3bは
理想レコード数の累積に対応した確信度閾値テーブル,
4は入力部,5は表示,印字等を行う出力部である。
FIG. Where 1 is a prediction device, 1a
Is a predicted value generation unit that generates a predicted value for a newly generated record using known data, 1b is a certainty factor generation unit that generates a certainty factor of the predicted value, 2 is a predictive diagnosis device, 2a
Is a confidence threshold decision unit, 2b is a predictive diagnosis graph output unit, 3
Is a table storage unit, 3a is a certainty threshold table, 3b is a certainty threshold table corresponding to the accumulation of the ideal number of records,
Reference numeral 4 denotes an input unit, and reference numeral 5 denotes an output unit for performing display, printing, and the like.

【0013】従来は確信度の閾値を均等な間隔に設定
し,その閾値に対してレコード数の累積及び正答数の累
積を求めていたが,本発明の第1の原理構成ではレコー
ド数の累積を均等に設定してこれを理想レコード数と
し,各理想レコード数に対応して新たな確信度の閾値を
決定して,確信度閾値テーブルを作成して予測診断グラ
フを表示する。
Conventionally, the threshold of certainty is set at equal intervals, and the accumulation of the number of records and the accumulation of the number of correct answers are obtained for the threshold. However, in the first principle configuration of the present invention, the accumulation of the number of records is performed. Are set equally, and this is set as the number of ideal records. A new threshold of certainty is determined in accordance with each ideal record number, a certainty threshold table is created, and a prediction diagnosis graph is displayed.

【0014】図1のA.において,予測装置1の予測値
生成部1aにより各レコードについて予測値を生成し,
各予測値に対して確信度が確信度生成部1bにおいて生
成され,予め決められた予測値を正答とする。こうして
各レコードの属性と予測値,予測値の確信度等を含む従
来と同様の確信度閾値テーブル(上記図8参照)が求め
られると,予測診断装置2において確信度の閾値に対し
て,レコード数の累積,正答数の累積を含む従来と同様
の確信度閾値テーブル3a(図1のB.の(1)参照)が
求められる。このテーブルに対し,入力部4から理想の
累積レコード数(確信度の閾値に対応するレコード数の
累積)として等間隔となる複数の値を設定すると,確信
度閾値決定部2aは,等間隔の理想のレコード数の各累
積値に対し,各理想の累積レコード数が確信度閾値テー
ブル3aから誤差が一定値以下となる累積レコード数が
あればそれに対応する確信度閾値を選択し,誤差が設定
した値を越えると一番近い累積レコード数に対応する確
信度の閾値により補間を行って新たな確信度閾値を求
め,累積レコード数を設定することで,累積レコード数
の誤差が設定した値以内になると新たな確信度閾値が設
定された理想累積レコード数対応の確信度閾値テーブル
3b(図1のB.(2) 参照)が得られる。この確信度閾
値テーブル3bの内容は予測診断グラフ出力部2bから
出力部5に出力される。この表示内容を参照すること
で,等間隔の理想の累積レコード数に対する確信度閾値
を直ちに知ることができる。なお,テーブル3bにおい
て,各理想の累積レコード数に対応する正答数の累積は
求めない。
FIG. In, a predicted value is generated for each record by the predicted value generation unit 1a of the prediction device 1,
A certainty factor is generated for each predicted value in the certainty factor generating unit 1b, and a predetermined predicted value is used as a correct answer. When a confidence level threshold table (see FIG. 8) similar to that of the related art including the attribute of each record, the predicted value, the predicted value confidence level, and the like is obtained, the prediction diagnostic apparatus 2 compares the record with the confidence level threshold. A confidence level threshold table 3a (see (1) in FIG. 1B) similar to the conventional one including the accumulation of the numbers and the accumulation of the number of correct answers is obtained. When a plurality of values having equal intervals are set as the ideal cumulative number of records (accumulation of the number of records corresponding to the certainty threshold) from the input unit 4 in this table, the certainty threshold determination unit 2a For each cumulative value of the ideal number of records, if there is a cumulative number of records for which the error is equal to or less than a certain value from the certainty threshold table 3a, the corresponding certainty threshold is selected and the error is set. When the value exceeds the value, the new confidence threshold is obtained by interpolation using the confidence threshold corresponding to the nearest cumulative record number, and the cumulative record number error is within the set value by setting the cumulative record number. Then, a confidence threshold table 3b (see B. (2) in FIG. 1) corresponding to the ideal cumulative record number in which a new confidence threshold is set is obtained. The contents of the certainty threshold table 3b are output from the predictive diagnosis graph output unit 2b to the output unit 5. By referring to this display content, the certainty threshold for the ideal number of cumulative records at equal intervals can be immediately known. In the table 3b, the accumulation of the number of correct answers corresponding to each ideal cumulative number of records is not obtained.

【0015】図2は本発明の第2の原理構成であり,予
測診断装置によるレコードの収入(予算),コスト,利
益を得るための構成を示し,図2のA.は構成図,B.
は第2の原理による確信度閾値テーブルの例である。
FIG. 2 shows a second principle configuration of the present invention, showing a configuration for obtaining income (budget), cost, and profit of a record by the predictive diagnosis apparatus. Is a configuration diagram.
Is an example of a certainty threshold table according to the second principle.

【0016】図2において,1,1a,1b,2,2
a,2b,3〜5の各符号は上記図1と同じであり,1
は予測装置,1aは予測値生成部,1bは確信度生成部
である。2は予測診断装置,2aは確信度閾値決定部,
2bは予測診断グラフ出力部,2cは収入コスト設定
部,2dは予算希望収入設定部,2eは最大利益検出
部,2fはレコード数検出部である。また,テーブル格
納部3内の3cは本発明の第2の原理構成により新たな
項目が追加された確信度閾値テーブルである。
In FIG. 2, 1, 1a, 1b, 2, 2
Reference numerals a, 2b, and 3 to 5 are the same as those in FIG.
Denotes a prediction device, 1a denotes a predicted value generation unit, and 1b denotes a certainty factor generation unit. 2 is a predictive diagnosis device, 2a is a certainty threshold determination unit,
2b is a prediction diagnosis graph output unit, 2c is an income cost setting unit, 2d is a budget desired income setting unit, 2e is a maximum profit detection unit, and 2f is a record number detection unit. Reference numeral 3c in the table storage unit 3 is a certainty threshold table to which new items are added according to the second principle configuration of the present invention.

【0017】本発明の第2の原理構成では確信度閾値テ
ーブルを用いて収入とコスト及びこれに関連して利益を
表す予測診断グラフを表すことができるようにしたもの
である。
In the second principle configuration of the present invention, a predictive diagnostic graph showing income, cost and related profit can be represented by using a certainty threshold table.

【0018】図2のA.の構成では,上記図1のB.の
(2) に示す理想の累積レコード数に対する確信度閾値テ
ーブルについて,入力部4から1レコードに対するコス
トc(1レコードを処理するのに必要な費用であり,一
定の収入に対する割合とする)を設定する。このコスト
cを用いて各確信度閾値についてそれぞれのレコード数
の累積値に対応する総コストが求められ,更に正答数の
累積値が収入として得られる。また,収入−コスト=利
益として各確信度閾値毎の利益を求める。この結果は図
2のB.に示すような予測診断テーブル3cが得られ,
予測診断グラフ出力部2bを駆動することにより出力部
5に縦軸が収入(正答数の累積に対応),コスト,利益
を表し,横軸が予算(レコード数の累積に対応)を表す
二次元のグラフとして表示される。ここで最大利益検出
部2eを駆動すると,予測診断テーブル3cの複数の各
確信度閾値毎の利益の中から最大値となる確信度閾値を
検出する。また,予算希望収入設定部2dに入力部4か
ら予算・希望収入の設定を行うと,レコード数検出部2
fが予測診断テーブル3c内を検索して,設定された収
入に対応するレコード数の累積値(処理対象とするレコ
ード数)を求める。これにより,レコードのコストc,
予算・希望収入の設定に対して,最適な処理対象とする
レコード数を簡単に求めることができる。
FIG. In the configuration of FIG. of
For the certainty threshold table for the ideal number of cumulative records shown in (2), the input unit 4 sets the cost c per record (the cost required to process one record, which is assumed to be a percentage of a certain income). I do. Using this cost c, the total cost corresponding to the cumulative value of the number of records for each certainty threshold is obtained, and the cumulative value of the number of correct answers is obtained as income. In addition, the profit for each certainty threshold is calculated as income-cost = profit. This result is shown in FIG. The prediction diagnosis table 3c as shown in FIG.
By driving the predictive diagnosis graph output unit 2b, the output unit 5 has a two-dimensional vertical axis representing income (corresponding to the cumulative number of correct answers), cost, and profit, and a horizontal axis representing a budget (corresponding to the cumulative number of records). Is displayed as a graph. Here, when the maximum profit detecting unit 2e is driven, a certainty threshold having the maximum value is detected from the profits for each of the plurality of certainty thresholds in the prediction diagnosis table 3c. When the budget / desired income is set from the input unit 4 to the budget desired income setting unit 2d, the record number detection unit 2d
f searches the prediction diagnosis table 3c to determine the cumulative value of the number of records corresponding to the set income (the number of records to be processed). As a result, the cost of the record c,
For the setting of the budget and desired income, the optimum number of records to be processed can be easily obtained.

【0019】[0019]

【発明の実施の形態】図3は本発明による理想のレコー
ド数の累積に対応する確信度閾値決定のための処理フロ
ーであり,上記図1のA.に示す第1の原理構成の中の
確信度閾値決定部2aの機能に相当する。この処理フロ
ーは,CPU(中央処理装置),メモリ,表示装置(デ
ィスプレイ),入力装置(キーボード,マウス等)等を
備えた情報処理装置(図示省略)において実行される。
FIG. 3 is a processing flow for determining a certainty threshold corresponding to the accumulation of the ideal number of records according to the present invention. Corresponds to the function of the certainty threshold determination unit 2a in the first principle configuration shown in FIG. This processing flow is executed in an information processing device (not shown) including a CPU (central processing unit), a memory, a display device (display), an input device (keyboard, mouse, etc.).

【0020】図4は本発明の予測診断装置による確信度
閾値テーブルの具体例である。
FIG. 4 is a specific example of a certainty threshold table by the predictive diagnosis apparatus of the present invention.

【0021】従来の確信度閾値テーブルに理想レコード
数の累積の項目を追加し,理想レコード数の累積を基に
新たな確信度閾値を決定し,グラフを作成する処理を開
始すると,最初に理想レコード数の累積を作成する(図
3のS1)。新たな閾値を決定する際に,レコード数の
累積(Nir:i=1,2,…,n)と理想レコード数
の累積(Nid:i=1,2,…,n)の最小誤差数
(p)を設定する(図3のS2)。pの値としては,例
えば“2”を設定することができる。
When an item of accumulation of the ideal number of records is added to the conventional certainty threshold table, a new certainty threshold is determined based on the accumulation of the ideal number of records, and a graph creation process is started. An accumulation of the number of records is created (S1 in FIG. 3). When determining a new threshold, the minimum error number (Nir: i = 1, 2,..., N) of the number of records (Nir: i = 1, 2,. p) is set (S2 in FIG. 3). As the value of p, for example, “2” can be set.

【0022】図4に示す具体例では,従来の方法により
一定間隔の値である各確信度の閾値(Riで表し,i=
1,2,…,n)に対して,ランダムな値であるレコー
ド数の累積(Nir)が得られ,それぞれに対応した正
答数の累積が求められた閾値テーブルが作成されている
ところに,新たな項目として理想レコード数の累積(N
id)が設けられ,その内容として等間隔の値(10,
20,30,…,100)が設定されている。
In the specific example shown in FIG. 4, the threshold value of each certainty factor (represented by Ri, i =
, N), a threshold value table is created in which the cumulative number of records (Nir), which is a random value, is obtained, and the cumulative number of correct answers corresponding to each is obtained. Cumulative number of ideal records (N
id) are provided, and the contents thereof are equally spaced values (10,
20, 30,..., 100) are set.

【0023】この後,新たに求めた確信度閾値の累積レ
コード数が,設定した誤差値以下になるまで繰り返し確
信度閾値を求める。先ず,i=1に設定し(図3のS
3),閾値テーブルのi(=1)番目の確信度の閾値の
選択を開始する(同S4)。すなわち,全ての閾値を設
定したか判別し(図3のS5),全ての閾値について設
定した場合は処理を終了するが,設定してない場合は,
理想のレコード数の累積(Nid)に一番近いレコード
数の累積(Njr)を探索し,その確信度の閾値(Rj
で表す)を求める(図3のS6)。図4の例では,理想
レコード数の累積(Nid)に近い確信度の閾値を,R
1から順にRnに向けて求める。
Thereafter, a certainty threshold is repeatedly obtained until the cumulative number of records of the newly obtained certainty threshold becomes equal to or less than a set error value. First, i = 1 is set (S in FIG. 3).
3), the selection of the threshold of the i (= 1) th certainty factor in the threshold table is started (S4). That is, it is determined whether all the thresholds have been set (S5 in FIG. 3). If all the thresholds have been set, the process ends.
The accumulation (Njr) of the number of records closest to the accumulation of the ideal number of records (Nid) is searched, and the certainty threshold (Rj
Is obtained (S6 in FIG. 3). In the example of FIG. 4, the threshold value of the certainty factor close to the accumulation (Nid) of the ideal number of records is R
Obtained in order from 1 toward Rn.

【0024】新たに求めた閾値の累積レコード数と理想
レコード数の累積レコード数との差が,設定された誤差
(p)を越えたか判別し(図3のS7),越えない場合
(誤差以下の場合)はその閾値(Ri)を新しい閾値
(Rj)として設定する(図3S8)。この後は,iを
+1として次の閾値を設定し(図3のS9),上記S4
に戻り同様の処理を繰り返す。
It is determined whether the difference between the newly obtained threshold cumulative number of records and the ideal number of cumulative records exceeds the set error (p) (S7 in FIG. 3). Is set as the new threshold (Rj) (S8 in FIG. 3). Thereafter, i is set to +1 and the next threshold value is set (S9 in FIG. 3).
And the same processing is repeated.

【0025】また,S7において反対に累積レコード数
と理想レコード数の累積との差が設定誤差以上の場合
は,一番近い確信度の閾値の累積レコード数の累積と理
想累積レコード数の累積大小を判別し(図3のS1
0),前後の確信度の閾値と補間することによって新た
な確信度の閾値を設定する(図3のS11,S12)。
すなわち,理想累積レコード数の累積の方が大きい場合
は,新しい閾値(Rj)と後の確信度の閾値(Rj+1 )と
により補間を行い,累積レコード数の累積の方が大きい
場合は,新しい閾値(Rj)と前の確信度の閾値(Rj-1
)とにより補間を行う。続いて,新しいレコード数の
累積(Njr) を設定し(図3のS13),S7に戻り,
設定したレコード数の累積(Njr) と理想レコード数の
累積レコード数(Njd)との差が,設定された誤差
(p)を越えたか判別して,以下上記と同様の処理が実
行される。
On the other hand, if the difference between the cumulative number of records and the cumulative number of ideal records is equal to or larger than the set error in S7, the cumulative number of cumulative records of the closest certainty threshold and the cumulative size of the cumulative number of ideal records are determined. (S1 in FIG. 3)
0), a new certainty factor threshold is set by interpolating with the preceding and following certainty factor thresholds (S11 and S12 in FIG. 3).
That is, when the accumulation of the ideal cumulative record is larger, interpolation is performed using the new threshold (Rj) and the threshold of the certainty factor (Rj + 1) later. The new threshold (Rj) and the previous confidence threshold (Rj-1
) To perform interpolation. Subsequently, a new record number accumulation (Njr) is set (S13 in FIG. 3), and the process returns to S7.
It is determined whether the difference between the set number of records (Njr) and the ideal number of records (Njd) exceeds a set error (p), and the same processing as described above is performed.

【0026】図4の例では,i=1の場合は理想レコー
ド数の累積=10(N1d) であり,これはレコード数の
累積=10(N1r) と同じであるため確信度の閾値は
0.9となる。また,i=2の場合は理想レコード数の
累積=20(N2d) であり,これに対応するレコード数
の累積=19(N3r)に最も誤差が小さい(20−19
=1)ため,このレコード数の累積19が設定され,確
信度の閾値はN3rに対応する0.7(R3)となる。こ
の他の理想レコード数(N3d=30,N4d=40,…,
Nnd=100)については図示省略されている。なお,
図4の中の正答数の累積については,新たに求めた確信
度の閾値以上のレコード数の累積である。
In the example of FIG. 4, when i = 1, the accumulation of the ideal number of records = 10 (N1d), which is the same as the accumulation of the number of records = 10 (N1r). .9. When i = 2, the accumulation of the ideal number of records = 20 (N2d), and the accumulation of the corresponding number of records = 19 (N3r) has the smallest error (20-19).
= 1), the accumulated number 19 of records is set, and the threshold value of the certainty factor is 0.7 (R3) corresponding to N3r. Other ideal record numbers (N3d = 30, N4d = 40,...,
Nnd = 100) is not shown. In addition,
The accumulation of the number of correct answers in FIG. 4 is the accumulation of the number of records equal to or greater than the newly obtained certainty threshold.

【0027】図5は本発明によるコスト,収入,利益の
各項目を追加した予測診断装置の確信度閾値テーブルを
表し,上記図2に示す本発明の第2の原理構成により作
成することができる。
FIG. 5 shows a certainty threshold table of the predictive diagnosis apparatus to which the items of cost, income and profit according to the present invention are added, and can be created by the second principle configuration of the present invention shown in FIG. .

【0028】図2の予測診断装置2の確信度閾値決定部
2aにより,収入コスト設定部2c,予算希望収入設定
部2dの各部の処理により追加されたコスト,収入,利
益の各項目を含む確信度閾値テーブルが作成される。す
なわち,確信度閾値決定部2aにより,レコード数の累
積値(Nirで表す項目,上記図4に示す理想レコード数
の累積値の10,20,30,…の値またはその値に近
似した値)に対応した確信度の閾値(Aで表す項目)を
決定し,正答数の累積(Ndで表す項目)が設定されて
いる。このテーブルに対し,(B)で表す3つの項目
(コスト,収入,利益)が追加され,その中のコスト
(cで表す)として収入に対する割合が設定され,この
例では,c=0.3(収入の30%がコスト)が設定さ
れている。この場合,レコード数の累積(Nr)=10
に対してコストは0.3×10=3であり,この時の収
入は正答数の累積=1であるから,1×1=1となる。
The certainty threshold determining unit 2a of the predictive diagnosis apparatus 2 shown in FIG. 2 includes the cost, income, and profit items added by the processes of the income cost setting unit 2c and the desired budget income setting unit 2d. A degree threshold table is created. That is, the confidence value threshold value determining unit 2a uses the cumulative value of the number of records (the item represented by Nir, the value of 10, 20, 30,... Of the cumulative value of the ideal number of records shown in FIG. 4 or a value close to the value). Are determined, and the accumulation of the number of correct answers (the item represented by Nd) is set. In this table, three items (cost, income, profit) represented by (B) are added, and the ratio to income is set as the cost (represented by c). In this example, c = 0.3 (30% of income is cost). In this case, the cumulative number of records (Nr) = 10
The cost is 0.3 × 10 = 3, and the income at this time is 1 × 1 = 1 because the cumulative number of correct answers = 1.

【0029】次のレコード数の累積(Nr)=19に対
してコストは,0.3×19=5.7であり,この時の
収入は正答数の累積=7であるから1×7=7となる。
以下,図示省略されているが同様に各レコード数の累積
に対してコスト,収入が求められて,追加された各項目
を含む確信度閾値テーブルが作成される。
The cost is 0.3 × 19 = 5.7 for the next accumulation of the number of records (Nr) = 19, and the income at this time is the accumulation of the number of correct answers = 7. It becomes 7.
Hereinafter, although not shown, costs and incomes are similarly obtained for the accumulation of the number of records, and a certainty threshold table including the added items is created.

【0030】このように作成された,確信度閾値テーブ
ルは予測診断グラフ出力部の処理によりグラフとして表
示するよう処理され,表示装置に表示することができ
る。そのグラフにより「収入」と「コスト」と「利益=
収入−コスト」がグラフで表示され,特に最大利益が得
られるレコード数の累積値が容易に見出すことができ
る。
The certainty threshold table thus created is processed by the processing of the predictive diagnosis graph output unit so as to be displayed as a graph, and can be displayed on a display device. According to the graph, “Income”, “Cost” and “Profit =
"Income-Cost" is displayed in a graph, and in particular, the cumulative value of the number of records at which the maximum profit can be obtained can be easily found.

【0031】図6は本発明による予測診断グラフの構成
を示す。このグラフは上記図5に示す確信度閾値テーブ
ルに対応し,縦軸は正答数の累積(Nd)を表すと共
に,収入(または予算),コスト,及び利益を表し,横
軸はレコード数の累積を表す。そして,コストについて
は,レコード数の累積に比例し直線で表すコストライン
により各レコード数の累積値に応じたコストが分かる。
また,収入は正答数の累積に比例し,図のような曲線の
特性を持つ収入ラインとして表示される。
FIG. 6 shows the configuration of a predictive diagnosis graph according to the present invention. This graph corresponds to the certainty threshold table shown in FIG. 5. The vertical axis represents the cumulative number of correct answers (Nd), the income (or budget), the cost, and the profit. The horizontal axis represents the cumulative number of records. Represents As for the cost, the cost corresponding to the cumulative value of each record number can be known from a cost line represented by a straight line in proportion to the cumulative number of records.
The income is proportional to the cumulative number of correct answers, and is displayed as an income line having a curve characteristic as shown in the figure.

【0032】更に,図6では各レコード数の累積値に対
応した確信度の閾値に応じて,円の直径を変えて表現し
ており,レコード数の累積値が10に対して,閾値0.
9に対応して大きな円で表し,レコード数の累積値が1
9に対して,閾値0.7に対応した円というように,閾
値に対応して変化している。なお,確信度を円の図形の
大きさにより表示せずに,四角形や三角形等の多角形の
図形の大きさにより表示するようにしても良い。
Further, in FIG. 6, the diameter of the circle is changed according to the certainty threshold corresponding to the accumulated value of the number of records.
9 is represented by a large circle, and the cumulative number of records is 1
9 changes corresponding to the threshold value, such as a circle corresponding to the threshold value 0.7. Instead of displaying the certainty factor according to the size of a circle figure, it may be displayed according to the size of a polygonal figure such as a quadrangle or a triangle.

【0033】このような予測診断グラフを表示すること
で,希望収入(予算)の額に対応する高さの水平な線を
引くと,収入ラインと交差する点が決まり,その点の横
軸の座標により,その収入を得るためのレコード数の累
積が求められ,更にその点の縦軸の線とコストラインと
交差点の縦軸座標により対応するコストが分かり,その
コストの値を引いた残りの縦軸の長さにより利益が求め
られる。
By displaying such a predictive diagnosis graph, when a horizontal line having a height corresponding to the amount of desired income (budget) is drawn, a point intersecting with the income line is determined, and the horizontal axis of the point is determined. From the coordinates, the cumulative number of records to obtain the income is obtained, and the corresponding cost is found from the vertical axis line of that point, the cost line, and the vertical axis coordinate of the intersection, and the remaining cost after subtracting the cost value is obtained. Profit is determined by the length of the vertical axis.

【0034】[0034]

【発明の効果】本発明によれば予測装置により発生する
情報以外の情報を予測診断装置に対して追加する手段を
設け,その情報を用いて各種のビジネスに直結した予測
診断を行い,予測診断結果をグラフによって可視表示す
ることで予測結果を簡単に診断することが可能となる。
According to the present invention, a means for adding information other than the information generated by the prediction device to the prediction diagnosis device is provided, and the information is used to perform a prediction diagnosis directly related to various businesses. By visually displaying the results graphically, it is possible to easily diagnose the prediction results.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の原理構成を示す図である。FIG. 1 is a diagram showing a first principle configuration of the present invention.

【図2】本発明の第2の原理構成を示す図である。FIG. 2 is a diagram showing a second principle configuration of the present invention.

【図3】本発明による理想のレコード数の累積に対応す
る確信度閾値決定の処理フローを示す図である。
FIG. 3 is a diagram showing a processing flow for determining a certainty threshold corresponding to the accumulation of an ideal number of records according to the present invention.

【図4】本発明の予測診断装置による確信度閾値テーブ
ルの具体例を示す図である。
FIG. 4 is a diagram showing a specific example of a certainty threshold table by the predictive diagnosis apparatus of the present invention.

【図5】本発明によるコスト,収入,利益の各項目を追
加した予測診断装置の確信度閾値テーブルを表す図であ
る。
FIG. 5 is a diagram illustrating a certainty threshold table of the predictive diagnosis apparatus to which each item of cost, income, and profit is added according to the present invention.

【図6】本発明による予測診断グラフの構成を示す図で
ある。
FIG. 6 is a diagram showing a configuration of a predictive diagnosis graph according to the present invention.

【図7】従来の予測診断装置による予測結果テーブルを
表す図である。
FIG. 7 is a diagram showing a prediction result table by a conventional prediction diagnosis device.

【図8】従来の予測診断装置の確信度閾値テーブルを示
す図である。
FIG. 8 is a diagram showing a certainty threshold table of the conventional predictive diagnosis apparatus.

【図9】従来の予測診断グラフを示す図である。FIG. 9 is a diagram showing a conventional predictive diagnosis graph.

【符号の説明】[Explanation of symbols]

1 予測装置 1a 予測値生成部 1b 確信度生成部 2 予測診断装置 2a 確信度閾値決定部 2b 予測診断グラフ出力部 3 テーブル格納部 3a 確信度閾値テーブル 3b 理想レコード数の累積に対応した確信度閾値
テーブル 4 入力部 5 出力部
DESCRIPTION OF SYMBOLS 1 Prediction apparatus 1a Predicted value generation part 1b Confidence generation part 2 Prediction diagnostic device 2a Confidence threshold determination part 2b Prediction diagnosis graph output part 3 Table storage part 3a Confidence threshold table 3b Confidence threshold corresponding to accumulation of ideal number of records Table 4 Input unit 5 Output unit

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B049 AA01 AA06 BB00 CC00 DD01 DD05 EE00 EE01 EE03 EE05 FF03 FF09  ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5B049 AA01 AA06 BB00 CC00 DD01 DD05 EE00 EE01 EE03 EE05 FF03 FF09

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 複数の属性情報を含む多数のレコードを
用いて,新たなレコードについて特定の属性について予
測値生成部と確信度生成部とを備えた予測装置により生
成するランダムなレコード数の累積値の間隔を持つ複数
の予測値とそれぞれの確信度について確信度テーブルを
作成して予測診断グラフの表示を行う出力部を備えた予
測診断装置において,前記レコード数の累積値を一定の
間隔を持つ理想のレコード数の累積値を設定する手段,
及び設定された理想のレコード数の累積値に対応する確
信度の閾値を決定する手段を備えることを特徴とする予
測装置の予測診断装置。
1. A method for accumulating the number of random records generated by a prediction device having a predicted value generation unit and a certainty factor generation unit for a specific attribute of a new record by using a large number of records including a plurality of pieces of attribute information. In a predictive diagnosis apparatus having an output unit for creating a confidence table for a plurality of predicted values having value intervals and respective confidences and displaying a predicted diagnosis graph, the cumulative value of the number of records is determined by a predetermined interval. Means to set the cumulative value of the ideal number of records
And a means for determining a certainty factor threshold value corresponding to the set cumulative value of the ideal number of records.
【請求項2】 請求項1において,前記予測診断装置に
対し,1レコードに係わるコストと収入を設定する手
段,及び前記設定されたコストと収入及びその差をレコ
ード数の一定の累積毎に算出して表示する手段を備え,
予測装置によって得られた予測結果を診断することを特
徴とする予測装置の予測診断装置。
2. A method according to claim 1, wherein said predictive diagnosis apparatus sets a cost and an income for one record, and calculates the set cost and the income and a difference between them for every fixed accumulation of the number of records. Means for displaying
A prediction diagnosis device for a prediction device, wherein a diagnosis result obtained by the prediction device is diagnosed.
【請求項3】 請求項2において,前記確信度テーブル
から予測診断グラフの表示を行う出力部は,前記コスト
と収入を設定する手段により設定されたコストと収入の
値と,収入−コスト=利益値を分割して可視表示するこ
とを特徴とする予測装置の予測診断装置。
3. An output unit for displaying a predictive diagnosis graph from the certainty factor table according to claim 2, wherein the cost and income values set by the cost and income setting means, and income−cost = profit A predictive diagnostic device for a predictive device, wherein a value is divided and displayed visually.
【請求項4】 請求項2において,前記予測診断グラフ
の表示を行う出力部は,各確信度を円または四角形等の
図形を用いて現し,確信度の大小に応じて前記図形の大
きさを決定して表示することを特徴とする予測装置の予
測診断装置。
4. An output unit for displaying the predictive diagnosis graph according to claim 2, wherein each confidence factor is represented by using a figure such as a circle or a rectangle, and the size of the figure is determined according to the magnitude of the confidence degree. A prediction diagnosis device for a prediction device, characterized in that it is determined and displayed.
JP29487499A 1999-10-18 1999-10-18 Predictive diagnostic device for predicting device Withdrawn JP2001117904A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29487499A JP2001117904A (en) 1999-10-18 1999-10-18 Predictive diagnostic device for predicting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29487499A JP2001117904A (en) 1999-10-18 1999-10-18 Predictive diagnostic device for predicting device

Publications (1)

Publication Number Publication Date
JP2001117904A true JP2001117904A (en) 2001-04-27

Family

ID=17813377

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29487499A Withdrawn JP2001117904A (en) 1999-10-18 1999-10-18 Predictive diagnostic device for predicting device

Country Status (1)

Country Link
JP (1) JP2001117904A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015201166A (en) * 2014-04-04 2015-11-12 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America Evaluation result display method, evaluation result display device, and evaluation result display program
JP2018073060A (en) * 2016-10-27 2018-05-10 オークマ株式会社 Diagnostic result display method in diagnostic apparatus and diagnostic apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015201166A (en) * 2014-04-04 2015-11-12 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America Evaluation result display method, evaluation result display device, and evaluation result display program
JP2018073060A (en) * 2016-10-27 2018-05-10 オークマ株式会社 Diagnostic result display method in diagnostic apparatus and diagnostic apparatus

Similar Documents

Publication Publication Date Title
Conner et al. Using Euclidean distances to assess nonrandom habitat use
US6877012B2 (en) Method and system for database management for data mining
US20110145156A1 (en) Method and System for Acquiring High Quality Non-Expert Knowledge from an On-Demand Workforce
US20090055337A1 (en) Methods and system to compare different options in a decision making process
CN106649832B (en) Estimation method and device based on missing data
US20110191282A1 (en) Evaluating Statistical Significance Of Test Statistics Using Placebo Actions
Theilhaber et al. Bayesian estimation of fold-changes in the analysis of gene expression: the PFOLD algorithm
Dogan et al. Eye tracking for screening design parameters in adjective-based design of yacht hull
CN110716774B (en) Data driving method, system and storage medium for brain of financial business data
CN112950218A (en) Business risk assessment method and device, computer equipment and storage medium
CN112839047B (en) Asset vulnerability scanning method, device, equipment and medium on cloud platform
Khoshnevis et al. Prioritizing ground‐motion validation metrics using semisupervised and supervised learning
Iturrieta et al. Implementing non‐Poissonian forecasts of distributed seismicity into the 2022 Aotearoa New Zealand National Seismic Hazard Model
US20030028504A1 (en) Method and system for isolating features of defined clusters
JP2001117904A (en) Predictive diagnostic device for predicting device
Ameyaw et al. How to evaluate classifier performance in the presence of additional effects: A new POD-based approach allowing certification of machine learning approaches
CN111091416A (en) Method and device for predicting probability of hotel purchase robot
Romero et al. A Long-Term Evaluation of Adaptive Interface Design for Mobile Transit Information
US11068716B2 (en) Information processing method and information processing system
US11210329B2 (en) Methods and systems to estimate recall while screening an ordered list of bibliographic references
WO2016006021A1 (en) Data analysis device, control method for data analysis device, and control program for data analysis device
Carlis et al. RSQRT: An heuristic for estimating the number of clusters to report
US20240029899A1 (en) Cycle Thresholds in Machine Learning for Forecasting Infection Counts
US11455274B2 (en) Method and system for analyzing data in a database
JP2005141508A (en) Device, program and method for estimating deficiency data

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070109