JP2023042582A - サンプル分析の方法、電子装置、記憶媒体、及びプログラム製品 - Google Patents
サンプル分析の方法、電子装置、記憶媒体、及びプログラム製品 Download PDFInfo
- Publication number
- JP2023042582A JP2023042582A JP2022145976A JP2022145976A JP2023042582A JP 2023042582 A JP2023042582 A JP 2023042582A JP 2022145976 A JP2022145976 A JP 2022145976A JP 2022145976 A JP2022145976 A JP 2022145976A JP 2023042582 A JP2023042582 A JP 2023042582A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- sample set
- samples
- annotation data
- target model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000004458 analytical method Methods 0.000 title claims abstract description 69
- 238000003860 storage Methods 0.000 title claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000004590 computer program Methods 0.000 claims abstract description 16
- 238000012549 training Methods 0.000 claims description 50
- 238000012216 screening Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 43
- 238000009826 distribution Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 13
- 238000010801 machine learning Methods 0.000 description 12
- 230000002547 anomalous effect Effects 0.000 description 11
- 230000002452 interceptive effect Effects 0.000 description 11
- 238000013145 classification model Methods 0.000 description 8
- 238000010200 validation analysis Methods 0.000 description 8
- 241000282326 Felis catus Species 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003749 cleanliness Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003116 impacting effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
- G06V10/7784—Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/091—Active learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Abstract
【解決手段】サンプル分析の方法は、関連付けられたアノテーションデータを有するサンプルセットを取得することと、対象モデルを用いてサンプルセットを処理することによって、サンプルセットに対する予測データと、予測データの信頼度とを決定することと、予測データとアノテーションデータとの比較に基づいて対象モデルの精度を決定することと、誤ってアノテーションされた可能性がある候補サンプルを、精度と信頼度に基づいてサンプルセットの中から決定することと、を含む。
【選択図】図5
Description
[例示的環境]
[誤ってアノテーションされたサンプルの分析]
[異常分布サンプルの分析]
[干渉サンプルの分析]
[例示的プロセス]
[例示的デバイス]
Claims (15)
- 関連付けられたアノテーションデータを有するサンプルセットを取得することと、
対象モデルを用いて前記サンプルセットを処理することによって、前記サンプルセットに対する予測データと、前記予測データの信頼度とを決定することと、
前記予測データと前記アノテーションデータとの比較に基づいて、前記対象モデルの精度を決定することと、
誤ってアノテーションされた可能性がある候補サンプルを、前記精度と前記信頼度に基づいて前記サンプルセットの中から決定することと、
を含む、
サンプル分析の方法。 - 前記サンプルセットと前記アノテーションデータを用いて前記対象モデルに学習させる、
請求項1に記載の方法。 - 前記サンプルセットと前記アノテーションデータを用いて前記対象モデルに学習させることによって、前記サンプルセットを第1サンプルサブセットと第2サンプルサブセットに分割することと、
半教師あり学習に基づいて、前記第2サンプルサブセットのアノテーションデータを考慮せずに、前記第1サンプルサブセットのアノテーションデータと、前記第2サンプルサブセットとを用いて前記対象モデルに再学習させることと、
に基づいて、前記対象モデルに学習させる、
請求項1に記載の方法。 - 前記サンプルセットと前記アノテーションデータを用いて前記対象モデルに学習させることによって、前記サンプルセットを第1サンプルサブセットと第2サンプルサブセットに分割することは、
前記サンプルセットと前記アノテーションデータを用いて前記対象モデルに学習させることによって、前記サンプルセットに関連付けられた不確実性メトリックを決定することと、
前記不確実性メトリックに基づいて、前記サンプルセットを前記第1サンプルサブセットと前記第2サンプルサブセットに分割することと、
を含む、
請求項3に記載の方法。 - 前記サンプルセットと前記アノテーションデータを用いて前記対象モデルに学習させることによって、前記サンプルセットを第1サンプルサブセットと第2サンプルサブセットに分割することは、
前記サンプルセットと前記アノテーションデータを用いて前記対象モデルに学習させることによって、前記サンプルセットに関連付けられた学習損失を決定することと、
前記サンプルセットに関連付けられた学習損失を、分類器を用いて処理し、前記サンプルセットを前記第1サンプルサブセットと前記第2サンプルサブセットに分割することと、
を含む、
請求項3に記載の方法。 - 前記候補サンプルを前記サンプルセットの中から決定することは、
前記精度と、前記サンプルセットの数とに基づいて、対象数を決定することと、
前記信頼度に基づいて前記サンプルセットの中から前記対象数の前記候補サンプルを決定することと、
を含む、
請求項1に記載の方法。 - 前記アノテーションデータは、前記サンプルセットに関連付けられた対象カテゴリのラベル、タスクカテゴリのラベル、行動カテゴリのラベルのうちの少なくとも1つを含む、
請求項1に記載の方法。 - 前記サンプルセットは複数の画像サンプルを含み、
前記アノテーションデータは画像サンプルの分類ラベルを示す、
請求項1に記載の方法。 - 前記サンプルセットのサンプルは、少なくとも1つのオブジェクトを含み、
前記アノテーションデータは、前記少なくとも1つのオブジェクトについてのアノテーション情報を含む、
請求項1に記載の方法。 - 前記信頼度は、前記予測データと、対応する前記アノテーションデータとの差に基づいて決定される、
請求項1に記載の方法。 - 前記候補サンプルが誤ってアノテーションされた可能性があることを示すために、前記候補サンプルに関連付けられたサンプル情報を提供することをさらに含む、
請求項1に記載の方法。 - 前記候補サンプルについてのフィードバック情報を取得することと、
前記フィードバック情報に基づいて前記候補サンプルのアノテーションデータを更新することと、
をさらに含む、
請求項1に記載の方法。 - 少なくとも1つのプロセッサーと、
前記少なくとも1つのプロセッサーに結合され、前記少なくとも1つのプロセッサーによって実行されるための命令を格納する少なくとも1つのメモリと
を備え、
前記命令が前記少なくとも1つのプロセッサーによって実行された場合、請求項1~12のいずれか1項に記載の方法を実行する、
電子装置。 - 請求項1~12のいずれか1項に記載の方法を実行するためのコンピュータ可読プログラム命令が格納された、
コンピュータ可読記憶媒体。 - 請求項1~12のいずれか1項に記載の方法を実行するためのコンピュータ可読プログラム命令を含む、
コンピュータプログラム製品。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111075280.9 | 2021-09-14 | ||
CN202111075280.9A CN115810135A (zh) | 2021-09-14 | 2021-09-14 | 样本分析的方法、电子设备、存储介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023042582A true JP2023042582A (ja) | 2023-03-27 |
Family
ID=85479848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022145976A Pending JP2023042582A (ja) | 2021-09-14 | 2022-09-14 | サンプル分析の方法、電子装置、記憶媒体、及びプログラム製品 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230077830A1 (ja) |
JP (1) | JP2023042582A (ja) |
CN (1) | CN115810135A (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114443849B (zh) * | 2022-02-09 | 2023-10-27 | 北京百度网讯科技有限公司 | 一种标注样本选取方法、装置、电子设备和存储介质 |
CN116502912B (zh) * | 2023-04-23 | 2024-01-30 | 甘肃省人民医院 | 药用植物潜在分布探测方法、装置、存储介质及电子设备 |
CN117313900B (zh) * | 2023-11-23 | 2024-03-08 | 全芯智造技术有限公司 | 用于数据处理的方法、设备和介质 |
CN117313899B (zh) * | 2023-11-23 | 2024-02-23 | 全芯智造技术有限公司 | 用于数据处理的方法、设备和介质 |
-
2021
- 2021-09-14 CN CN202111075280.9A patent/CN115810135A/zh active Pending
-
2022
- 2022-09-13 US US17/943,762 patent/US20230077830A1/en active Pending
- 2022-09-14 JP JP2022145976A patent/JP2023042582A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
CN115810135A (zh) | 2023-03-17 |
US20230077830A1 (en) | 2023-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023042582A (ja) | サンプル分析の方法、電子装置、記憶媒体、及びプログラム製品 | |
US11645554B2 (en) | Method and apparatus for recognizing a low-quality article based on artificial intelligence, device and medium | |
US10891540B2 (en) | Adaptive neural network management system | |
US20190354810A1 (en) | Active learning to reduce noise in labels | |
WO2021051560A1 (zh) | 文本分类方法和装置、电子设备、计算机非易失性可读存储介质 | |
WO2019025945A1 (en) | SYSTEM AND METHOD FOR INCREMENTAL ANNOTATION OF DATA SETS | |
CN109189767B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN111523640B (zh) | 神经网络模型的训练方法和装置 | |
WO2020253127A1 (zh) | 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质 | |
WO2020238353A1 (zh) | 数据处理方法和装置、存储介质及电子装置 | |
US10650315B2 (en) | Automatic segmentation of data derived from learned features of a predictive statistical model | |
US20220092407A1 (en) | Transfer learning with machine learning systems | |
US11954893B2 (en) | Negative sampling algorithm for enhanced image classification | |
JP7448562B2 (ja) | 人工知能のための希な訓練データへの対処 | |
EP3620982B1 (en) | Sample processing method and device | |
CN111753863A (zh) | 一种图像分类方法、装置、电子设备及存储介质 | |
CN112149754B (zh) | 一种信息的分类方法、装置、设备及存储介质 | |
CN114298050A (zh) | 模型的训练方法、实体关系抽取方法、装置、介质、设备 | |
CN110059743B (zh) | 确定预测的可靠性度量的方法、设备和存储介质 | |
WO2022194049A1 (zh) | 一种对象处理方法及装置 | |
US20230360364A1 (en) | Compositional Action Machine Learning Mechanisms | |
US11941376B2 (en) | AI differentiation based HW-optimized intelligent software development tools for developing intelligent devices | |
CN111814813A (zh) | 神经网络训练和图像分类方法与装置 | |
US20220309292A1 (en) | Growing labels from semi-supervised learning | |
CN115809412A (zh) | 样本分析的方法、电子设备、存储介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240130 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240326 |