JP7386203B2 - Information processing device and information processing method - Google Patents
Information processing device and information processing method Download PDFInfo
- Publication number
- JP7386203B2 JP7386203B2 JP2021079487A JP2021079487A JP7386203B2 JP 7386203 B2 JP7386203 B2 JP 7386203B2 JP 2021079487 A JP2021079487 A JP 2021079487A JP 2021079487 A JP2021079487 A JP 2021079487A JP 7386203 B2 JP7386203 B2 JP 7386203B2
- Authority
- JP
- Japan
- Prior art keywords
- project
- prediction model
- information processing
- estimated cost
- explanatory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 24
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 64
- 238000012549 training Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000003066 decision tree Methods 0.000 claims description 7
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 description 23
- 230000006866 deterioration Effects 0.000 description 10
- 238000000034 method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000011835 investigation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
特許法第30条第2項適用 (1)令和2年10月28日に城代佳範、中屋文江、西山大輔、栗原義人が公開 (2)令和2年11月24日に営業統括本部が公開Article 30,
本発明は、情報処理装置および情報処理方法に関する。 The present invention relates to an information processing device and an information processing method.
近年、デジタルトランスフォーメーション(DX:Digital Transformation)推進の技術開発が盛んであり、その一環として、ソフトウェア開発等のプロジェクトの状態監視が重要視されている。状態監視は、重点監視と広域監視の2つに分けることができる。重点監視は、管理部署によるプロジェクトの監視である。広域監視は、全プロジェクトを対象にし、所定のツールを利用した監視である。状態監視では、まず、ツールに入力された原価などのデータに基づく広域監視で失敗の可能性や失敗時の影響が大きいと判断されたプロジェクトを重点監視の対象とする。次に、管理部署による支援により、重点監視の対象となるプロジェクトの悪化防止や改善を図る。 In recent years, technological development to promote digital transformation (DX) has been active, and as part of this, monitoring of the status of projects such as software development has become important. Status monitoring can be divided into two types: focused monitoring and wide area monitoring. Priority monitoring is project monitoring by the management department. Wide-area monitoring is monitoring that covers all projects and uses predetermined tools. In status monitoring, projects that are determined to have a high probability of failure or a large impact in the event of failure are targeted for priority monitoring through wide-area monitoring based on data such as costs entered into the tool. Next, with support from the management department, efforts will be made to prevent deterioration and improve projects that are subject to priority monitoring.
従来の広域監視は、原価が見積を超えるなどの問題が顕在化してから該当のプロジェクトを抽出するものであった。プロジェクトを成功に導くという目的に照らし合わせれば、問題が顕在化していない早期の段階でプロジェクトの悪化予兆を検知することが好ましい。しかし、従来の広域監視では、問題が顕在化していない早期の段階でプロジェクトの悪化予兆を検知することが困難であるという問題があった。 Conventional wide-area monitoring involves identifying projects after problems such as costs exceeding estimates become apparent. In light of the objective of leading the project to success, it is preferable to detect signs of deterioration in the project at an early stage before any problems have become apparent. However, with conventional wide-area monitoring, there is a problem in that it is difficult to detect signs of project deterioration at an early stage before problems have manifested.
また、従来の広域監視では、懸念されるプロジェクトを本当に重点監視の対象とするか否かの判断のための調査が行われる。調査は、例えば、プロジェクトの規模や見積原価超過額などの調査である。しかし、このような調査は多大な人的コストがかかっていた。このため、受注金額が大きいプロジェクトなど、状況が悪化した場合の影響が大きいプロジェクトが優先的に対応され、小規模なプロジェクトを含むすべてのプロジェクトを対象とした監視は行われないのが現状である。つまり、従来の広域監視では、重点監視の対象とすべきプロジェクトの判断に人的コストが大きいという問題があった。 Furthermore, in conventional wide-area monitoring, an investigation is conducted to determine whether or not a project of concern should really be targeted for priority monitoring. The investigation is, for example, an investigation into the scale of the project and the estimated cost excess. However, such investigations required a large amount of human resources. For this reason, priority is given to projects that would have a large impact if the situation worsens, such as projects with large order amounts, and currently monitoring is not conducted for all projects, including small-scale projects. . In other words, conventional wide-area monitoring has had the problem of high human cost in determining which projects should be targeted for priority monitoring.
なお、特許文献1には、ソフトウェア開発のリスクに繋がる要因の特定を可能にする発明が開示されている。
Note that
本発明は、このような事情に鑑みて、広域監視にて、プロジェクトの悪化予兆を早期に検知するとともに、重点監視の対象にするか否かの判断の人的コストを低減することを課題とする。 In view of these circumstances, the present invention aims to detect signs of deterioration of a project at an early stage through wide-area monitoring, and to reduce the human cost of determining whether or not to target a project for priority monitoring. do.
前記課題を解決する本発明は、
終了した第1プロジェクトの監視情報で訓練した予測モデルを生成する生成部と、
仕掛かりの第2プロジェクトの説明変数を前記予測モデルに入力し、前記説明変数を用いた判定条件を組み合わせた複数の決定木を利用し、多数決をとって前記第2プロジェクトの見積原価推定超過の予測値を出力するとともに、SHAP(Shapley Additive exPlanations)アルゴリズムを用いて求めた、前記予測値に対する説明変数の寄与率に従い、前記予測値の根拠となる説明変数を出力する予測部とを備える情報処理装置である。
The present invention for solving the above problems includes:
a generation unit that generates a predictive model trained using the monitoring information of the completed first project;
Input the explanatory variables of the second project in progress into the prediction model , use multiple decision trees that combine judgment conditions using the explanatory variables, and take a majority vote to determine whether the estimated cost of the second project exceeds the estimated cost. An information processing unit that outputs a predicted value and also outputs an explanatory variable that is the basis of the predicted value according to the contribution rate of the explanatory variable to the predicted value, which is determined using the SHAP (Shapley Additive exPlanations) algorithm. It is a device.
また、本発明は、
情報処理装置が、
終了した第1プロジェクトの監視情報で訓練した予測モデルを生成するステップと、
仕掛かりの第2プロジェクトの説明変数を前記予測モデルに入力し、前記説明変数を用いた判定条件を組み合わせた複数の決定木を利用し、多数決をとって前記第2プロジェクトの見積原価推定超過の予測値を出力するとともに、を出力するとともに、SHAPアルゴリズムを用いて求めた、前記予測値に対する説明変数の寄与率に従い、前記予測値の根拠となる説明変数を出力するステップを実行する情報処理方法である。
Moreover, the present invention
The information processing device
a step of generating a predictive model trained with the monitoring information of the completed first project;
Input the explanatory variables of the second project in progress into the prediction model , use multiple decision trees that combine judgment conditions using the explanatory variables, and take a majority vote to determine whether the estimated cost of the second project exceeds the estimated cost. An information processing method comprising: outputting a predicted value; and outputting an explanatory variable that is a basis for the predicted value according to a contribution rate of the explanatory variable to the predicted value, which is determined using the SHAP algorithm. It is.
本発明によれば、広域監視にて、プロジェクトの悪化予兆を早期に検知するとともに、重点監視の対象にするか否かの判断の人的コストを低減することができる。 According to the present invention, it is possible to detect signs of deterioration of a project at an early stage through wide-area monitoring, and to reduce the human cost of determining whether or not to target a project for intensive monitoring.
≪第1実施形態≫
[構成]
図1に示す情報処理装置100は、広域監視により仕掛かりのプロジェクトの悪化予兆を検知するコンピュータである。情報処理装置100は、入力部、出力部、制御部、および、記憶部といったハードウェアを備える。例えば、制御部がCPU(Central Processing Unit)から構成される場合、その制御部を含むコンピュータによる情報処理は、CPUによるプログラム実行処理で実現される。また、そのコンピュータに含まれる記憶部は、CPUの指令により、そのコンピュータの機能を実現するためのさまざまなプログラムを記憶する。これによりソフトウェアとハードウェアの協働が実現される。前記プログラムは、記録媒体に記録したり、ネットワークを経由したりすることで提供可能となる。出力部は、画面表示をする表示部の機能を含めてもよい。
≪First embodiment≫
[composition]
The
プロジェクトとは、所定の目的を達成するための業務をいう。プロジェクトは、終了済の過去のプロジェクトと、仕掛かりのプロジェクトに分類できる。本実施形態では、過去のプロジェクトを「第1プロジェクト」と呼び、仕掛かりのプロジェクトを「第2プロジェクト」と呼ぶ。また、過去のプロジェクトと仕掛かりのプロジェクトを区別しない場合は、単に、「プロジェクト」と呼ぶ。 A project is a task to achieve a predetermined purpose. Projects can be classified into past projects that have been completed and projects that are still in progress. In this embodiment, a past project is called a "first project" and a project in progress is called a "second project." Furthermore, when past projects and in-progress projects are not distinguished, they are simply referred to as "projects."
図1に示すように、情報処理装置100は、生成部1と、予測部2を備えている。また、情報処理装置100は、第1プロジェクトDB3と、第2プロジェクトDB4を記憶している。
As shown in FIG. 1, the
生成部1は、機械学習で第2プロジェクトの実推原価を予測するための予測モデルを生成する。実推原価は、第2プロジェクト終了時までに発生する原価の推定値である。なお、原価には、製造原価や売上原価など複数種類存在するが、本実施形態では、原価とは、特定の目的を達成するために消費される経済的資源を貨幣で測定したものとし、製造原価や売上原価などを含む語として説明する。
予測部2は、生成部1が生成した予測モデルを用いて、対象の第2プロジェクトの実推原価を予測する。
第1プロジェクトDB3は、第1プロジェクトの監視情報を第1プロジェクトごとに記憶するデータベースである。
第2プロジェクトDB4は、第2プロジェクトの監視情報を第2プロジェクトごとに記憶するデータベースである。
The
The
The first project DB3 is a database that stores monitoring information of the first project for each first project.
The second project DB4 is a database that stores monitoring information of the second project for each second project.
<プロジェクトの監視情報>
プロジェクトの監視情報は、プロジェクトの状況を監視するための情報である。第1プロジェクトの監視情報は、例えば、作番情報と、説明変数と、目的変数とから構成できる。
<Project monitoring information>
Project monitoring information is information for monitoring the status of a project. The monitoring information for the first project can be composed of, for example, production number information, explanatory variables, and objective variables.
作番情報は、第1プロジェクトを識別する情報である。例えば、作番情報は、作番と、進捗率(%)と、作番名を含むが、これらに限定されない。
作番は、第1プロジェクトの識別子であり、例えば、文字数字列で表現できる。
進捗率は、第1プロジェクトの進捗を定量的に示すパラメータである。
作番名は、第1プロジェクトの名称であり、例えば、観念可能な言葉で表現できる。
The production number information is information that identifies the first project. For example, the production number information includes, but is not limited to, the production number, the progress rate (%), and the production number name.
The production number is an identifier of the first project, and can be expressed, for example, as a string of alphanumeric characters.
The progress rate is a parameter that quantitatively indicates the progress of the first project.
The production number name is the name of the first project, and can be expressed, for example, in conceivable words.
説明変数は、第1プロジェクトの状態を表現する変数である。説明変数は複数種類存在する。説明変数は、例えば、作業開始時期、作業終了時期、実績原価、見通し原価、見積原価、担当者、作業時間、実績工数を含むがこれらに限定されない。例えば、Borutaを用いて説明変数候補を抽出し、その中から最適な説明変数を選択することができるが、説明変数の選択方法はこれに限定されない。
作業開始時期は、第1プロジェクトの開始時期(年月日)である。
作業終了時期は、第1プロジェクトの終了時期(年月日)である。
実績原価は、作業開始時期から所定時期までの間に発生した原価である。
見通し原価は、所定時期から作業終了時期までに発生することが見込まれる原価である。
見積原価は、作業開始時期から作業終了時期までに発生することが見込まれる原価である。
担当者は、第1プロジェクトを担当した者(複数可)である。
作業時間は、作業開始時期から所定時期までの間に、各担当者が第1プロジェクトの作業に費やした時間である。
実績工数は、第1プロジェクトを構成する全工数のうち、作業開始時期から所定時期までの間に完了した工数である。
なお、所定時期は、作業開始時期と作業終了時期までの間の任意の時期である。
The explanatory variable is a variable that expresses the state of the first project. There are multiple types of explanatory variables. Examples of explanatory variables include, but are not limited to, work start time, work end time, actual cost, estimated cost, estimated cost, person in charge, work time, and actual man-hours. For example, explanatory variable candidates can be extracted using Boruta, and the optimal explanatory variables can be selected from among them, but the method for selecting explanatory variables is not limited to this.
The work start time is the start time (year, month, and day) of the first project.
The work end time is the end time (year, month, and day) of the first project.
Actual costs are costs incurred from the start of work to a predetermined time.
Forecast costs are costs that are expected to be incurred from a predetermined period until the end of the work.
Estimated costs are costs that are expected to be incurred from the start of work to the end of work.
The person in charge is the person(s) in charge of the first project.
The work time is the time that each person in charge spent working on the first project between the work start time and a predetermined time.
The actual number of man-hours is the number of man-hours completed between the work start time and a predetermined time, out of all the man-hours constituting the first project.
Note that the predetermined time is any time between the work start time and the work end time.
目的変数は、説明変数に依存する変数である。目的変数は、例えば、第1プロジェクト終了時での実績原価となる、最終実績原価とすることができるが、これに限定されない。 The objective variable is a variable that depends on the explanatory variable. The target variable can be, for example, the final actual cost, which is the actual cost at the end of the first project, but is not limited thereto.
(進捗率のこと)
進捗率は、例えば、時期的基準で算出できる。例えば、プロジェクトの作業開始時期から作業終了時期までの期間が30日間であり、対象時期が作業開始時期から15日目であった場合、進捗率は50%となる。第1プロジェクトは終了した過去のプロジェクトであるため、現時点での進捗率は100%である。ここで、第1プロジェクトの説明変数は、進捗率に応じて変化する値とすることができる。第1プロジェクトの監視情報は、進捗率ごとの説明変数の集合として構成できる。
(progress rate)
The progress rate can be calculated on a temporal basis, for example. For example, if the period from the start of work to the end of a project is 30 days, and the target period is the 15th day from the start of work, the progress rate will be 50%. Since the first project is a completed past project, the current progress rate is 100%. Here, the explanatory variable of the first project can be a value that changes depending on the progress rate. The monitoring information for the first project can be configured as a set of explanatory variables for each progress rate.
例えば、説明変数としての実績原価は、進捗率0%~100%のあらゆる値での実績原価の集合となる。進捗率X%の実績原価は、作業開始時期から進捗率X%相当の時期までの間に発生した原価となる。また、説明変数としての見通し原価は、進捗率0%~100%のあらゆる値での見通し原価の集合となる。進捗率X%の見通し原価は、進捗率X%相当の時期から作業終了時期までの間に発生することが見込まれる原価となる。なお、作業開始時期や作業終了時期などのように、進捗率に応じて変化しない説明変数も存在するが、そのような説明変数は、進捗率に応じて同じ値をとる定数として扱うことが好ましい。 For example, the actual cost as an explanatory variable is a set of actual costs at all values from 0% to 100% progress rate. Actual costs at a progress rate of X% are costs incurred from the start of work to the time corresponding to a progress rate of X%. In addition, the projected cost as an explanatory variable is a set of projected costs at all values from 0% to 100% progress rate. The projected cost at a progress rate of X% is the cost that is expected to be incurred between the time corresponding to the progress rate of X% and the time at which the work is completed. Note that there are explanatory variables that do not change depending on the progress rate, such as work start time and work end time, but it is preferable to treat such explanatory variables as constants that take the same value depending on the progress rate. .
一方、第2プロジェクトの監視情報は、例えば、作番情報と、説明変数とから構成できる。 On the other hand, the monitoring information for the second project can be composed of, for example, production number information and explanatory variables.
作番情報は、第2プロジェクトを識別する情報である。例えば、作番情報は、作番と、進捗率(%)と、作番名を含むが、これらに限定されない。
作番は、第2プロジェクトの識別子であり、例えば、文字数字列で表現できる。
進捗率は、第2プロジェクトの進捗を定量的に示すパラメータである。
作番名は、第2プロジェクトの名称であり、例えば、観念可能な言葉で表現できる。
The production number information is information that identifies the second project. For example, the production number information includes, but is not limited to, the production number, the progress rate (%), and the production number name.
The production number is an identifier of the second project, and can be expressed, for example, as a string of letters and numbers.
The progress rate is a parameter that quantitatively indicates the progress of the second project.
The production number name is the name of the second project, and can be expressed, for example, in conceivable words.
説明変数は、第2プロジェクトの状態を表現する変数である。説明変数は複数種類存在する。説明変数は、例えば、作業開始時期、作業終了時期、実績原価、見通し原価、見積原価、担当者、作業時間、実績工数を含むがこれらに限定されない。例えば、Borutaを用いて説明変数候補を抽出し、その中から最適な説明変数を選択することができるが、説明変数の選択方法はこれに限定されない。
作業開始時期は、第2プロジェクトの開始時期(年月日)である。
作業終了時期は、第2プロジェクトの終了時期(年月日)である。
実績原価は、作業開始時期から所定時期までの間に発生した原価である。
見通し原価は、所定時期から作業終了時期までに発生することが見込まれる原価である。
見積原価は、作業開始時期から作業終了時期までに発生することが見込まれる原価である。
担当者は、第2プロジェクトを担当している者(複数可)である。
作業時間は、作業開始時期から所定時期までの間に、各担当者が第2プロジェクトの作業に費やした時間である。
実績工数は、第2プロジェクトを構成する全工数のうち、作業開始時期から所定時期までの間に完了した工数である。
なお、所定時期は、作業開始時期と作業終了時期までの間の現在である。
また、すでに説明した、第2プロジェクトの実推原価は、第2プロジェクトの実績原価と見通し原価との和である。
The explanatory variable is a variable that expresses the state of the second project. There are multiple types of explanatory variables. Examples of explanatory variables include, but are not limited to, work start time, work end time, actual cost, estimated cost, estimated cost, person in charge, work time, and actual man-hours. For example, explanatory variable candidates can be extracted using Boruta, and the optimal explanatory variables can be selected from among them, but the method for selecting explanatory variables is not limited to this.
The work start time is the start time (year, month, and day) of the second project.
The work end time is the end time (year, month, and day) of the second project.
Actual costs are costs incurred from the start of work to a predetermined time.
Forecast costs are costs that are expected to be incurred from a predetermined period until the end of the work.
Estimated costs are costs that are expected to be incurred from the start of work to the end of work.
The person in charge is the person(s) in charge of the second project.
The work time is the time that each person in charge spent working on the second project from the start of work to a predetermined time.
The actual number of man-hours is the number of man-hours completed between the work start time and a predetermined time, out of all the man-hours constituting the second project.
Note that the predetermined time is the current time between the work start time and the work end time.
Moreover, the actual estimated cost of the second project, which has already been explained, is the sum of the actual cost and the estimated cost of the second project.
第2プロジェクトの進捗率は、作業開始時期から作業終了時期までの期間と、作業開始時期から現在までの期間の比として算出できる。現在に相当する進捗率X%の実績原価は、作業開始時期から現在までの間に発生した原価となる。また、現在に相当する進捗率X%の見通し原価は、現在から作業終了時期までの間に発生することが見込まれる原価となる。なお、作業開始時期や作業終了時期などのように、進捗率に応じて変化しない説明変数も存在するが、そのような説明変数は、進捗率に応じて同じ値をとる定数として扱うことが好ましい。 The progress rate of the second project can be calculated as the ratio of the period from the work start time to the work end time and the period from the work start time to the present. Actual costs at a progress rate of X% corresponding to the current time are costs incurred from the start of work to the present. Further, the projected cost at a progress rate of X% corresponding to the current cost is the cost that is expected to be incurred between the current time and the end of the work. Note that there are explanatory variables that do not change depending on the progress rate, such as work start time and work end time, but it is preferable to treat such explanatory variables as constants that take the same value depending on the progress rate. .
<予測モデル>
(訓練)
生成部1は、例えば、ランダムフォレストに用いる複数の決定木を組み合わせて予測モデルを生成できる。ランダムフォレストは、機械学習アルゴリズムであり、複数の決定木を利用し、多数決をとって予測するアンサンブル学習アルゴリズムである。決定木は、例えば、説明変数を用いた判定条件を組み合わせたツリー状のロジックとして構成できる。判定条件は、適宜設計でき、例えば、担当者の1日の作業時間の平均が5時間以上か否か、などとすることができる。
<Prediction model>
(training)
For example, the
生成部1は、第1プロジェクトの監視情報を訓練データとして用いて、予測モデルを訓練できる。例えば、第1プロジェクトごとに、第1プロジェクトの監視情報のうち進捗率50%相当の時期での説明変数を予測モデルの入力とすることができる。また、第1プロジェクトの監視情報の目的変数に基づく値を予測モデルの出力とすることができる。例えば、第1プロジェクトの最終実績原価から見積原価を引いた見積原価超過の値を予測モデルの出力とすることができる。生成部1は、所定数の第1プロジェクトの監視情報を用いて予測モデルを訓練する。
The
ここで、生成部1は、予測モデルを複数用意し、予測モデルの出力を複数段階の出力とすることができる。例えば、生成部1は、第1予測モデルと第2予測モデルを用意する。第1予測モデルの入力は、すべての第1プロジェクトの監視情報を対象にし、当該監視情報のうち進捗率50%相当の時期での説明変数とすることができる。また、第1予測モデルの出力は、第1プロジェクトの最終実績原価から見積原価を引いた見積原価超過があった(0M(0円)より大きい)か否かとすることができる。次に、第2予測モデルの入力は、第1予測モデルの出力で見積原価超過があった第1プロジェクトの監視情報を対象にし、当該監視情報のうち進捗率50%相当の時期での説明変数とすることができる。また、第2予測モデルの出力は、見積原価超過が1M(100万円)以上であるか否かとすることができる。結果的に、予測モデルの出力を、見積原価超過が0M以下、0Mより大きいかつ1M未満、1M以上、の3値に分類できる。
Here, the
(予測)
予測部2は、訓練済みの予測モデルを用いて、予測対象の第2プロジェクトの実推原価を予測する。例えば、予測部2は、第2プロジェクトの監視情報のうち、現在、つまり所定の進捗率(50%以上が好ましいが、50%未満でもよい)相当の時期での説明変数を予測モデルに入力する。すると、予測部2は、実推原価に基づく値を予測モデルの出力として取得できる。例えば、予測部2は、実推原価から見積原価を引いた見積原価推定超過の値を取得できる。
(prediction)
The
予測モデルが、上記した第1予測モデル、第2予測モデルである場合、予測部2は、予測対象の第2プロジェクトの監視情報のうち、現在での説明変数を第1予測モデルに入力する。すると、予測部2は、第1予測モデルの出力として、見積原価推定超過があった(0M(0円)より大きい)か否かを示す値を取得できる。見積原価推定超過があった場合、予測部2は、当該第2プロジェクトの監視情報のうち、現在での説明変数を第2予測モデルに入力する。すると、予測部2は、第2予測モデルの出力として、見積原価推定超過が1M(100万円)以上であるか否かを示す値を取得できる。結果的に、見積原価推定超過を0M以下、0Mより大きいかつ1M未満、1M以上、の3値に分類できる。
なお、1Mは例示であり、1Mより大きい値でもよいし、1Mより小さい値でもよい。
When the prediction model is the above-described first prediction model or second prediction model, the
Note that 1M is an example and may be a value larger than 1M or a value smaller than 1M.
予測部2は、予測モデルの出力を含む情報を出力できる。例えば、情報処理装置100の表示部は、図2に示すような予測部2の出力情報を画面表示できる。図2に示すように、予測部2の出力情報は、「予測結果」と、「作番情報」と、「予測結果の説明変数と特徴」を列とし、第2プロジェクトを行とする表形式とすることができる。
The
「予測結果」は、予測モデルの出力内容を示す。「予測結果」は、「項番」と、「予測値」と、「確信度」から構成される。
「項番」は、第2プロジェクトごとに付される行番号である。
「予測値」は、予測モデルがすでに説明した第1予測モデルと第2予測モデルの組み合わせであるときの、見積原価推定超過の3値分類に従う結果である。「1:100万円以上超過」は、1M以上に対応する。「2:100万円未満超過」は、0Mより大きいかつ1M未満に対応する。「3:問題なし」は、0M以下に対応する。
「確信度」は、予測の信頼度であり0%~100%で示される。例えば、確信度は、バギングを用いて求めることができるが、これに限定されない。
“Prediction result” indicates the output content of the prediction model. “Prediction result” is composed of “item number”, “prediction value”, and “confidence level”.
“Item number” is a line number assigned to each second project.
The "predicted value" is the result according to the three-value classification of estimated cost estimation excess when the predictive model is a combination of the first predictive model and the second predictive model described above. "1: Exceeding 1 million yen or more" corresponds to 1 million yen or more. “2: Exceeding less than 1 million yen” corresponds to a value greater than 0M and less than 1M. “3: No problem” corresponds to 0M or less.
"Confidence" is the reliability of prediction and is expressed from 0% to 100%. For example, the confidence level can be determined using bagging, but is not limited thereto.
「作番情報」は、第2プロジェクトの監視情報の作番情報と同じである。
「予測結果の説明変数と特徴」は、「予測結果」に寄与する説明変数を示す。「予測結果の説明変数と特徴」は、「説明変数一覧」と、「特徴ランキング」から構成される。
「説明変数一覧」は、第2プロジェクトの監視情報の説明変数と同じである。
「特徴ランキング」は、「予測結果」に寄与する説明変数の順位を示す。順位が高いほど、その説明変数の予測値の出力に対する寄与率が大きい。例えば、各変数の寄与率は、SHAP(Shapley Additive exPlanations)アルゴリズムを用いて求めることができるが、これに限定されない。
The "production number information" is the same as the production number information in the monitoring information of the second project.
"Explanatory variables and features of prediction results" indicate explanatory variables that contribute to the "prediction results." “Explanatory variables and features of prediction results” consists of “list of explanatory variables” and “feature ranking”.
The "list of explanatory variables" is the same as the explanatory variables of the monitoring information of the second project.
"Feature ranking" indicates the ranking of explanatory variables that contribute to the "prediction result." The higher the rank, the greater the contribution of that explanatory variable to the predicted value output. For example, the contribution rate of each variable can be determined using the SHAP (Shapley Additive exPlanations) algorithm, but is not limited thereto.
第1実施形態によれば、見積原価推定超過が1M以上となる第2プロジェクトを抽出できる。よって、広域監視にて、プロジェクトの悪化予兆を早期に検知することができる。 According to the first embodiment, it is possible to extract a second project in which the estimated cost exceeds 1M or more. Therefore, signs of deterioration in the project can be detected early through wide-area monitoring.
(重点監視の対象にするか否かの判断)
図2の出力情報を知得した管理部署は、見積原価推定超過が1M以上となる第2プロジェクトを重点監視の対象とするか否かを判断する。従来では、プロジェクトの悪化予兆をAIで検知したとしても、AIの予測結果の根拠はブラックボックス化されていた。このため、管理部署は、AIの予測結果に対して、プロジェクトの悪化予兆の要因を追跡することが容易でなく、重点監視の対象とするか否かの判断に多大な人的コストを要していた。
(Decision on whether or not to be subject to intensive monitoring)
The management department that has learned the output information in FIG. 2 determines whether or not to target the second project in which the estimated cost exceeds 1M or more to be subject to priority monitoring. Previously, even if AI detected signs of deterioration in a project, the basis for the AI's prediction results was a black box. For this reason, it is difficult for management departments to track down factors that indicate signs of project deterioration based on AI prediction results, and it takes a great deal of human cost to decide whether or not to target them for priority monitoring. was.
図2の「特徴ランキング」は、見積原価推定超過が1M以上になった根拠を提示しているといえる。管理部署は、「特徴ランキング」を参照し、見積原価推定超過が1M以上という予測に大きく寄与する説明変数を容易に特定できる。その結果、該当の第2プロジェクトを重点監視の対象にするか否かの判断が容易になり、重点監視の対象にするか否かの判断の人的コストを低減することができる。 It can be said that the "feature ranking" in FIG. 2 presents the basis for why the estimated cost exceeds 1M or more. The management department can easily identify explanatory variables that greatly contribute to the prediction that the estimated cost exceeds 1M or more by referring to the "feature ranking." As a result, it becomes easier to determine whether or not to target the second project for priority monitoring, and it is possible to reduce the human cost for determining whether or not to target the second project for priority monitoring.
[処理]
情報処理装置100が実行する処理は、図3に示すとおりである。つまり、まず、生成部1が予測モデルを生成する(ステップS1)。次に、生成部1が、所定の進捗率における第1プロジェクトの監視情報を用いて、予測モデルを訓練する(ステップS2)。次に、予測部2が、予測モデルを用いて、対象の第2プロジェクトの見積原価推定超過の予測値と、予測値に寄与する説明変数を予測根拠として出力する(ステップS3)。管理部署は、予測根拠から、悪化予兆を示す第2プロジェクトを重点監視の対象とするか否かを判断する。
[process]
The processing executed by the
≪第2実施形態≫
第2実施形態の説明の際、第1実施形態との相違する点について説明し、重複する点は説明を省略する。第1実施形態では、訓練データとなる第1プロジェクトの監視情報の説明変数は進捗率50%相当の時期での説明変数であった。第2実施形態では、訓練データに用いる第1プロジェクトの説明変数の時期を定期化する。
≪Second embodiment≫
When describing the second embodiment, points that are different from the first embodiment will be explained, and explanations of overlapping points will be omitted. In the first embodiment, the explanatory variables of the monitoring information of the first project serving as training data are explanatory variables at a time when the progress rate is equivalent to 50%. In the second embodiment, the timing of explanatory variables of the first project used for training data is regularized.
例えば、第1プロジェクトの期間、つまり、作業開始時期から作業終了時期までの期間がおよそ数カ月に及ぶ場合、訓練データに用いる説明変数の時期、つまり、訓練日(学習日)を毎月25日に設定する。
よって、作番Aの第1プロジェクトの作業開始時期が4/15であり、作業終了時期が6/30である場合、作番Aの第1プロジェクトの訓練日は、4/25と5/25となる。つまり、作番Aの第1プロジェクトの監視情報のうち4/25での説明変数(4/25相当の進捗率での説明変数)と、5/25での説明変数(5/25相当の進捗率での説明変数)の計2回分を予測モデルの入力とする。
また、作番Bの第1プロジェクトの作業開始時期が5/1であり、作業終了時期が9/15である場合、作番Bの第1プロジェクトの訓練日は、5/25,6/25,7/25,8/25となる。つまり、作番Bの第1プロジェクトの監視情報のうち5/25での説明変数(5/25相当の進捗率での説明変数)と、6/25での説明変数(6/25相当の進捗率での説明変数)と、7/25での説明変数(7/25相当の進捗率での説明変数)と、8/25での説明変数(8/25相当の進捗率での説明変数)の計4回分を予測モデルの入力とする。
また、作番Cの第1プロジェクトの作業開始時期が6/1であり、作業終了時期が7/10である場合、作番Cの第1プロジェクトの訓練日は、6/25となる。つまり、作番Cの第1プロジェクトの監視情報のうち6/25での説明変数(6/25相当の進捗率での説明変数)の計1回分を予測モデルの入力とする。
For example, if the period of the first project, that is, the period from the start of work to the end of work, is approximately several months, the time of the explanatory variable used for training data, that is, the training date (learning day), is set to the 25th of every month. do.
Therefore, if the work start time of the first project of crop number A is 4/15 and the work end time is 6/30, the training dates of the first project of crop number A are 4/25 and 5/25. becomes. In other words, among the monitoring information of the first project of production number A, the explanatory variable at 4/25 (an explanatory variable at a progress rate equivalent to 4/25) and the explanatory variable at 5/25 (an explanatory variable at a progress rate equivalent to 5/25) A total of two explanatory variables (explanatory variables) are input to the prediction model.
In addition, if the work start time of the first project of crop number B is 5/1 and the work end time is 9/15, the training dates of the first project of crop number B are 5/25 and 6/25. , 7/25, 8/25. In other words, among the monitoring information of the first project of production number B, the explanatory variable at 5/25 (an explanatory variable at a progress rate equivalent to 5/25) and the explanatory variable at 6/25 (an explanatory variable at a progress rate equivalent to 6/25) explanatory variable at 7/25 (explanatory variable at progress rate equivalent to 7/25), explanatory variable at 8/25 (explanatory variable at progress rate equivalent to 8/25) A total of four times are used as input for the prediction model.
Further, if the work start time of the first project of production number C is 6/1 and the work end time is July 10, the training date of the first project of production number C is 6/25. That is, a total of one explanatory variable at 6/25 (an explanatory variable at a progress rate equivalent to 6/25) of the monitoring information for the first project of production number C is input to the prediction model.
結果的に、第1プロジェクトの大部分に対して、複数種類の進捗率での説明変数が予測モデルに入力される。このようにして訓練された予測モデルを用いて、予測部2が第2プロジェクトの実推原価を予測する。この場合、第2プロジェクトの進捗率が低進捗率(例えば、30%程度)であり、低進捗率相当の時期での説明変数を予測モデルに入力したとしても、予測部2が出力した予測値の確信度(図2参照)が十分に高いことが確認された。
As a result, for most of the first project, explanatory variables with multiple types of progress rates are input into the prediction model. Using the prediction model trained in this way, the
第2実施形態によれば、訓練日を定期化し、同じ第1プロジェクトについて複数種類の進捗率での説明変数を予測モデルに入力することができる。これにより、第2プロジェクトの実推原価の予測を早期化できる。
また、訓練日を定期化することで、すべての第1プロジェクトを対象にした予測モデルへの入力を体系化でき、訓練に要する処理を簡易にできる。
According to the second embodiment, training days can be regularized, and explanatory variables at multiple types of progress rates can be input into the prediction model for the same first project. As a result, the actual estimated cost of the second project can be predicted earlier.
Furthermore, by regularizing the training dates, input to the prediction model for all the first projects can be systematized, and the processing required for training can be simplified.
[変形例]
(a):第1、第2実施形態では、進捗率をプロジェクトの期間を用いた時期的基準で算出した。しかし、例えば、進徳率は、プロジェクトで取り組む作業の達成度から算出してもよい。
(b):第1実施形態では、第1プロジェクトごとに、第1プロジェクトの監視情報のうち進捗率50%相当の時期での説明変数を予測モデルの入力とした。しかし、例えば、第1プロジェクトごとに、50%以外の任意の同じ進捗率相当の時期での説明変数を予測モデルの入力としてもよい。また、第1プロジェクトごとに異なる進捗率相当の時期での説明変数を予測モデルに入力してもよい。
(c):第2実施形態では、訓練日を定期化することで、同じ第1プロジェクトに対して、複数種類の進捗率を実質的に選択し、選択した進捗率での説明変数を予測モデルに入力した。しかし、例えば、情報処理装置100のユーザが入力部を操作して、同じ第1プロジェクトに対して、任意の進捗率を複数種類選択し、選択した進捗率での説明変数を予測モデルに入力してもよい。
[Modified example]
(a): In the first and second embodiments, the progress rate was calculated on a timing basis using the project period. However, for example, the progress rate may be calculated from the degree of accomplishment of the work undertaken in the project.
(b): In the first embodiment, for each first project, explanatory variables at a time corresponding to a progress rate of 50% among the monitoring information of the first project are input to the prediction model. However, for example, for each first project, explanatory variables at any period corresponding to the same progress rate other than 50% may be input to the prediction model. Furthermore, explanatory variables at times corresponding to different progress rates for each first project may be input into the prediction model.
(c): In the second embodiment, by regularizing the training days, multiple types of progress rates can be effectively selected for the same first project, and the explanatory variables at the selected progress rates can be used as predictive models. entered. However, for example, the user of the
(d):本実施形態で説明した種々の技術を適宜組み合わせた技術を実現することもできる。
(e):本実施形態で説明したソフトウェアをハードウェアとして実現することもでき、ハードウェアをソフトウェアとして実現することもできる。
(f):その他、ハードウェア、ソフトウェア、フローチャートなどについて、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
(d): It is also possible to realize a technique that combines the various techniques described in this embodiment as appropriate.
(e): The software described in this embodiment can be implemented as hardware, and the hardware can also be implemented as software.
(f): Other changes may be made as appropriate to the hardware, software, flowcharts, etc. without departing from the spirit of the present invention.
100 情報処理装置
1 生成部
2 予測部
3 第1プロジェクトDB
4 第2プロジェクトDB
100
4 2nd project DB
Claims (6)
仕掛かりの第2プロジェクトの説明変数を前記予測モデルに入力し、前記説明変数を用いた判定条件を組み合わせた複数の決定木を利用し、多数決をとって前記第2プロジェクトの見積原価推定超過の予測値を出力するとともに、SHAP(Shapley Additive exPlanations)アルゴリズムを用いて求めた、前記予測値に対する説明変数の寄与率に従い、前記予測値の根拠となる説明変数を出力する予測部とを備える情報処理装置。 a generation unit that generates a predictive model trained using the monitoring information of the completed first project;
Input the explanatory variables of the second project in progress into the prediction model , use multiple decision trees that combine judgment conditions using the explanatory variables, and take a majority vote to determine whether the estimated cost of the second project exceeds the estimated cost. An information processing unit that outputs a predicted value and also outputs an explanatory variable that is the basis of the predicted value according to the contribution rate of the explanatory variable to the predicted value, which is determined using the SHAP (Shapley Additive exPlanations) algorithm. Device.
終了した第1プロジェクトの監視情報で訓練した予測モデルを生成するステップと、
仕掛かりの第2プロジェクトの説明変数を前記予測モデルに入力し、前記説明変数を用いた判定条件を組み合わせた複数の決定木を利用し、多数決をとって前記第2プロジェクトの見積原価推定超過の予測値を出力するとともに、を出力するとともに、SHAPアルゴリズムを用いて求めた、前記予測値に対する説明変数の寄与率に従い、前記予測値の根拠となる説明変数を出力するステップを実行する情報処理方法。 The information processing device
a step of generating a predictive model trained with the monitoring information of the completed first project;
Input the explanatory variables of the second project in progress into the prediction model , use multiple decision trees that combine judgment conditions using the explanatory variables, and take a majority vote to determine whether the estimated cost of the second project exceeds the estimated cost. An information processing method comprising: outputting a predicted value; and outputting an explanatory variable that is a basis for the predicted value according to a contribution rate of the explanatory variable to the predicted value, which is determined using the SHAP algorithm. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021079487A JP7386203B2 (en) | 2021-05-10 | 2021-05-10 | Information processing device and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021079487A JP7386203B2 (en) | 2021-05-10 | 2021-05-10 | Information processing device and information processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022173656A JP2022173656A (en) | 2022-11-22 |
JP7386203B2 true JP7386203B2 (en) | 2023-11-24 |
Family
ID=84144475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021079487A Active JP7386203B2 (en) | 2021-05-10 | 2021-05-10 | Information processing device and information processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7386203B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7544794B2 (en) | 2022-12-06 | 2024-09-03 | 株式会社日立社会情報サービス | Information processing device and information processing method |
JP7367253B1 (en) * | 2023-05-26 | 2023-10-23 | 株式会社日立社会情報サービス | Information processing device and information processing method |
JP7422265B1 (en) | 2023-10-20 | 2024-01-25 | 株式会社日立社会情報サービス | Information processing device and information processing method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012181739A (en) | 2011-03-02 | 2012-09-20 | Ntt Data Corp | Man-hour estimation device, man-hour estimation method, and man-hour estimation program |
JP2014235654A (en) | 2013-06-04 | 2014-12-15 | 株式会社東芝 | Risk evaluation device |
JP2019148973A (en) | 2018-02-27 | 2019-09-05 | 株式会社日立ソリューションズ・クリエイト | Project evaluation device, project evaluation method, and project evaluation program |
-
2021
- 2021-05-10 JP JP2021079487A patent/JP7386203B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012181739A (en) | 2011-03-02 | 2012-09-20 | Ntt Data Corp | Man-hour estimation device, man-hour estimation method, and man-hour estimation program |
JP2014235654A (en) | 2013-06-04 | 2014-12-15 | 株式会社東芝 | Risk evaluation device |
JP2019148973A (en) | 2018-02-27 | 2019-09-05 | 株式会社日立ソリューションズ・クリエイト | Project evaluation device, project evaluation method, and project evaluation program |
Also Published As
Publication number | Publication date |
---|---|
JP2022173656A (en) | 2022-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7386203B2 (en) | Information processing device and information processing method | |
Cho et al. | Development of a new technology product evaluation model for assessing commercialization opportunities using Delphi method and fuzzy AHP approach | |
US20030187767A1 (en) | Optimal allocation of budget among marketing programs | |
KR102037480B1 (en) | Success analysis system of business using investor relations information | |
Duncan et al. | Probabilistic modeling of a sales funnel to prioritize leads | |
CN111311338A (en) | User value prediction method and user value prediction model training method | |
Giudici et al. | Modelling operational losses: a Bayesian approach | |
JPWO2008126182A1 (en) | Business analysis program and business analysis device | |
Mortensen et al. | Predicting and defining B2B sales success with machine learning | |
Kinnunen et al. | Business case analysis in new product development | |
Mathews | Innovation portfolio architecture—Part 2: Attribute selection and valuation | |
CN114202243A (en) | Engineering project management risk early warning method and system based on random forest | |
Zhang et al. | Multi-period vehicle routing problem with time windows for drug distribution in the epidemic situation | |
JP7488718B2 (en) | Project sign detection device and project sign detection method | |
Ibraigheeth et al. | Software project failures prediction using logistic regression modeling | |
JP7367253B1 (en) | Information processing device and information processing method | |
JP7422265B1 (en) | Information processing device and information processing method | |
JP7544794B2 (en) | Information processing device and information processing method | |
JP7554730B2 (en) | Information processing device and information processing method | |
CN113379212B (en) | Logistics information platform default risk assessment method, device, equipment and medium based on blockchain | |
Ling et al. | Maximum profit mining and its application in software development | |
KR102639188B1 (en) | Dynamic price decision method and dynamic price decision system based on deep learning | |
Galarneau-Vincent et al. | Foreseeing the worst: Forecasting electricity DART spikes | |
JPWO2022201512A5 (en) | Order prediction device, order prediction method, learning device, learning method, and program | |
Bekhradi et al. | Decision support for R&D activities of innovative technologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210525 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20210525 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20210608 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230320 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230320 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230620 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7386203 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |