JP6805313B2 - 特定装置、特定方法及び特定プログラム - Google Patents
特定装置、特定方法及び特定プログラム Download PDFInfo
- Publication number
- JP6805313B2 JP6805313B2 JP2019184112A JP2019184112A JP6805313B2 JP 6805313 B2 JP6805313 B2 JP 6805313B2 JP 2019184112 A JP2019184112 A JP 2019184112A JP 2019184112 A JP2019184112 A JP 2019184112A JP 6805313 B2 JP6805313 B2 JP 6805313B2
- Authority
- JP
- Japan
- Prior art keywords
- label
- record
- score
- feature amount
- classification label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
まず、図1を用いて、第1の実施形態に係る分析システムについて説明する。図1は、第1の実施形態に係る分析システムの構成の一例を示す図である。図1に示すように、分析システム1は、分析装置30及び特定装置50を有する。
図2を用いて、分析装置30の構成について説明する。図2は、第1の実施形態に係る分析装置の構成の一例を示す図である。図2に示すように、分析装置30は、ワークステーションやパソコン等の汎用コンピュータで実現され、入力部31と、出力部32と、通信制御部33と、記憶部34と、制御部35とを備える。
図5を用いて、特定装置50の構成について説明する。図5は、第1の実施形態に係る特定装置の構成の一例を示す図である。図5に示すように、特定装置50は、ワークステーションやパソコン等の汎用コンピュータで実現され、入力部51と、出力部52と、通信制御部53と、記憶部54と、制御部55とを備える。
Classifier/Recommenderに基づいて分類ラベルを付与する場合、分類器は、レコードのそれぞれについて、分類ラベルごとにスコアを計算し、分類ラベルのうち対応するスコアが最も高い分類ラベルを付与する。このとき、抽出部552は、スコアのうち、最も高いスコアと、2番目に高いスコアとの差が所定の閾値以上であるレコードを抽出することができる。具体的には、図7に示すように、抽出部552は、1位のスコアと、2位以降のスコアとの関係に基づく抽出条件を用いてレコードの抽出を行う。図7は、第1の実施形態に係る抽出条件について説明するための図である。
(抽出条件1−1)
S_1−S_2≧(S_max−S_min)*M
(抽出条件1−2)
S_1−S_k≦(S_max−S_min)*N
かつ
S_k−S_(k+1)≧(S_max−S_min)*M
かつ
k≦L/P
一方、Anomalyに基づいて分類ラベルを付与する場合、分類器は、スコアが閾値以上であるか否かによってレコードを分類する。このとき、抽出部552は、レコードから、スコアが第1の閾値以上であるレコード、及び、スコアが第2の閾値以下であるレコードを抽出することができる。第1の閾値及び第2の閾値は、分類器で用いられた閾値を基に計算される値である。具体的には、図11に示すように、抽出部552は、スコアと閾値との関係に基づく抽出条件を用いてレコードの抽出を行う。図11は、第1の実施形態に係る抽出条件について説明するための図である。また、ここでは、分類器は、スコアが閾値以上であるレコードを異常とし、スコアが閾値未満であるレコードを正常として分類するものとする。
(抽出条件2−1)
(S_n−threshold)≧(S_max−S_min)*M
(抽出条件2−2)
(threshold−S_n)≧(S_max−S_min)*M
(抽出条件2−1´)
S_n≧(S_max−S_min)*M+threshold
(抽出条件2−2´)
S_n≦−(S_max−S_min)*M+threshold
図25を用いて、第1の実施形態に係る特定装置50の処理の流れについて説明する。図25は、第1の実施形態に係る特定装置の処理の流れを示すフローチャートである。図25に示すように、判定部551は、レコードごとに正分類であるか誤分類であるかを判定する(ステップS101)。抽出部552は、「自信を持って分類された」レコード、つまり、所定の確度より高い確度で分類ラベルが付与されたと推定されるレコードを抽出する(ステップS102)。
判定部551は、分類器によって計算されたスコアに基づく分類ラベルと、あらかじめ設定された正解ラベルと、が付与されたレコードのそれぞれについて、分類ラベルと正解ラベルとが一致するか否かを判定する。また、抽出部552は、スコア、及びスコアに関する統計量の少なくともいずれかに基づいて、レコードから、所定の確度より高い確度で分類ラベルが付与されたと推定されるレコードを抽出する。また、計算部553は、抽出部552によって抽出されたレコードのうち、判定部551によって分類ラベルと正解ラベルとが一致しないと判定されたレコードの特徴量に基づいて、特徴量ごと、又はレコードごとに、正解ラベルと異なる分類ラベルが付与されたことへの影響の大きさを示す値を計算する。このように、特徴量又はレコードごとの誤分類への影響を値によって表すことにより、誤分類の要因を特定することが可能となる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
一実施形態として、特定装置50は、パッケージソフトウェアやオンラインソフトウェアとして上記の要因特定を実行する特定プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の特定プログラムを情報処理装置に実行させることにより、情報処理装置を特定装置50として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
20 テスト用データ
30 分析装置
40 分類結果
50 特定装置
60 特定した要因
31、51 入力部
32、52 出力部
33、53 通信制御部
34、54 記憶部
35、55 制御部
351 選択部
352 計算部
353 決定部
354 検証部
551 判定部
552 抽出部
553 計算部
Claims (5)
- 分類器によって計算されたスコアに基づく分類ラベルと、あらかじめ設定された正解ラベルと、が付与されたレコードのそれぞれについて、前記分類ラベルと前記正解ラベルとが一致するか否かを判定する判定部と、
前記スコア、及び前記スコアに関する統計量の少なくともいずれかに基づいて、前記レコードから、所定の確度より高い確度で前記分類ラベルが付与されたと推定されるレコードを抽出する抽出部と、
前記抽出部によって抽出されたレコードのうち、前記判定部によって前記分類ラベルと前記正解ラベルとが一致しないと判定されたレコードの特徴量に基づいて、前記特徴量ごとに、前記正解ラベルと異なる前記分類ラベルが付与されたことへの影響の大きさを示す値を計算する計算部と、
を有することを特徴とする特定装置。 - 特徴量が設定されたレコードであって、分類器によって前記特徴量を基に計算されたスコアに基づく分類ラベルと、あらかじめ設定された正解ラベルと、が付与されたレコードのそれぞれについて、前記分類ラベルと前記正解ラベルとが一致するか否かを判定する判定部と、
前記スコア、及び前記スコアに関する統計量の少なくともいずれかに基づいて、前記レコードから、所定の確度より高い確度で前記分類ラベルが付与されたと推定されるレコードを抽出する抽出部と、
前記抽出部によって抽出されたレコードのうち、前記判定部によって前記分類ラベルと前記正解ラベルとが一致しないと判定されたレコードの特徴量に基づいて、前記特徴量ごと、又は前記レコードごとに、前記正解ラベルと異なる前記分類ラベルが付与されたことへの影響の大きさを示す値を計算する計算部と、
を有することを特徴とする特定装置。 - 特定装置によって実行される特定方法であって、
分類器によって計算されたスコアに基づく分類ラベルと、あらかじめ設定された正解ラベルと、が付与されたレコードのそれぞれについて、前記分類ラベルと前記正解ラベルとが一致するか否かを判定する判定工程と、
前記スコア、及び前記スコアに関する統計量の少なくともいずれかに基づいて、前記レコードから、所定の確度より高い確度で前記分類ラベルが付与されたと推定されるレコードを抽出する抽出工程と、
前記抽出工程によって抽出されたレコードのうち、前記判定工程によって前記分類ラベルと前記正解ラベルとが一致しないと判定されたレコードの特徴量に基づいて、前記特徴量ごとに、前記正解ラベルと異なる前記分類ラベルが付与されたことへの影響の大きさを示す値を計算する計算工程と、
を含んだことを特徴とする特定方法。 - 特定装置によって実行される特定方法であって、
特徴量が設定されたレコードであって、分類器によって前記特徴量を基に計算されたスコアに基づく分類ラベルと、あらかじめ設定された正解ラベルと、が付与されたレコードのそれぞれについて、前記分類ラベルと前記正解ラベルとが一致するか否かを判定する判定工程と、
前記スコア、及び前記スコアに関する統計量の少なくともいずれかに基づいて、前記レコードから、所定の確度より高い確度で前記分類ラベルが付与されたと推定されるレコードを抽出する抽出工程と、
前記抽出工程によって抽出されたレコードのうち、前記判定工程によって前記分類ラベルと前記正解ラベルとが一致しないと判定されたレコードの特徴量に基づいて、前記特徴量ごと、又は前記レコードごとに、前記正解ラベルと異なる前記分類ラベルが付与されたことへの影響の大きさを示す値を計算する計算工程と、
を含んだことを特徴とする特定方法。 - コンピュータを、請求項1又は2に記載の特定装置として機能させるための特定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019184112A JP6805313B2 (ja) | 2019-10-04 | 2019-10-04 | 特定装置、特定方法及び特定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019184112A JP6805313B2 (ja) | 2019-10-04 | 2019-10-04 | 特定装置、特定方法及び特定プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017091188A Division JP6611268B2 (ja) | 2017-05-01 | 2017-05-01 | 特定装置、分析システム、特定方法及び特定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020009494A JP2020009494A (ja) | 2020-01-16 |
JP6805313B2 true JP6805313B2 (ja) | 2020-12-23 |
Family
ID=69152011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019184112A Active JP6805313B2 (ja) | 2019-10-04 | 2019-10-04 | 特定装置、特定方法及び特定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6805313B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3602084B2 (ja) * | 2001-09-28 | 2004-12-15 | 株式会社東芝 | データベース管理装置 |
WO2013001893A1 (ja) * | 2011-06-28 | 2013-01-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 主観的な階層クラスタリングにおける特徴量ごとの重みを求める情報処理装置、方法、およびプログラム |
-
2019
- 2019-10-04 JP JP2019184112A patent/JP6805313B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020009494A (ja) | 2020-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10839314B2 (en) | Automated system for development and deployment of heterogeneous predictive models | |
JP6585654B2 (ja) | 判定装置、分析システム、判定方法および判定プログラム | |
US20210103858A1 (en) | Method and system for model auto-selection using an ensemble of machine learning models | |
US20230385333A1 (en) | Method and system for building training database using automatic anomaly detection and automatic labeling technology | |
CN110135505B (zh) | 图像分类方法、装置、计算机设备及计算机可读存储介质 | |
CN111931809A (zh) | 数据的处理方法、装置、存储介质及电子设备 | |
CN110909758A (zh) | 计算机可读记录介质、学习方法和学习装置 | |
CN113537630A (zh) | 业务预测模型的训练方法及装置 | |
CN113377484A (zh) | 弹窗处理方法及装置 | |
JP6588495B2 (ja) | 分析システム、設定方法および設定プログラム | |
CN114139636A (zh) | 异常作业处理方法及装置 | |
CN114281932A (zh) | 工单质检模型的训练方法、装置、设备及存储介质 | |
JP6577516B2 (ja) | 判定装置、分析システム、判定方法および判定プログラム | |
JP6611268B2 (ja) | 特定装置、分析システム、特定方法及び特定プログラム | |
JP6659618B2 (ja) | 分析装置、分析方法及び分析プログラム | |
CN110458383B (zh) | 需求处理服务化的实现方法、装置及计算机设备、存储介质 | |
JP6805313B2 (ja) | 特定装置、特定方法及び特定プログラム | |
JP6577515B2 (ja) | 分析装置、分析方法及び分析プログラム | |
JP6588494B2 (ja) | 抽出装置、分析システム、抽出方法及び抽出プログラム | |
US20220230028A1 (en) | Determination method, non-transitory computer-readable storage medium, and information processing device | |
JP7424373B2 (ja) | 分析装置、分析方法及び分析プログラム | |
CN113641823A (zh) | 文本分类模型训练、文本分类方法、装置、设备及介质 | |
CN113296836A (zh) | 训练模型的方法、测试方法、装置、电子设备及存储介质 | |
US20200265270A1 (en) | Mutual neighbors | |
CN112598118B (zh) | 有监督学习的标注异常处理方法、装置、存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6805313 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |