JPWO2020229923A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2020229923A5 JPWO2020229923A5 JP2021567901A JP2021567901A JPWO2020229923A5 JP WO2020229923 A5 JPWO2020229923 A5 JP WO2020229923A5 JP 2021567901 A JP2021567901 A JP 2021567901A JP 2021567901 A JP2021567901 A JP 2021567901A JP WO2020229923 A5 JPWO2020229923 A5 JP WO2020229923A5
- Authority
- JP
- Japan
- Prior art keywords
- data
- computer
- classes
- data set
- implemented method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims 12
- 238000002372 labelling Methods 0.000 claims 4
- 238000004590 computer program Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
Claims (19)
- 予測クラスへの未知の入力データの分類のために使用可能なモデルを構築するように訓練データを用いて訓練される分類器システムと、
前記予測クラス内の十分に提示されていないクラスの決定のために適合された評価器エンジンであって、予測の信頼レベル分布を用いる、前記評価器エンジンと、
追加のソースからの関連データの抽出のために適合された抽出器エンジンであって、前記関連データは決定された前記十分に提示されていないクラスに関連する、前記抽出器エンジンと、
前記関連データからデータ・セットを選択するために適合された類似性エンジンであって、前記関連データの特徴と前記十分に提示されていないクラスに対する代表のデータ・セットの特徴とを比較するためにも適合された、前記類似性エンジンと、
前記評価器エンジンと前記抽出器エンジンと前記類似性エンジンとをトリガするように適合された再帰ユニットであって、前記評価器エンジンが前記選択されたデータ・セットを信頼閾値レベルより高い信頼レベルで分類するまで前記選択されたデータ・セットを入力データとして扱う、前記再帰ユニットと、
を備えるコンピュータ・システム。 - 前記入力データは画像データである、請求項1に記載のコンピュータ・システム。
- 前記画像データは、ビデオ・データから抽出される、請求項2に記載のコンピュータ・システム。
- 前記十分に提示されていないクラスの前記決定は、前記予測クラスと他のクラスとの差の関数に基づく、請求項1または2に記載のコンピュータ・システム。
- 前記関連データは、前記訓練データおよび通常の入力データに対して外部のデータである、請求項1ないし3のいずれか一項に記載のコンピュータ・システム。
- 前記評価器が信頼閾値レベルより高い信頼レベルで前記選択されたデータ・セットを分類した場合に、前記選択されたデータ・セットを追加訓練データ・セットとしてラベル付けするように適合されたラベル付けユニット
をさらに備える、請求項1ないし4のいずれか一項に記載のコンピュータ・システム。 - 前記ラベル付けユニットは、前記十分に提示されていないクラスに関する前記ラベルで前記追加訓練データ・セットに注釈を付けるようにも適合された、請求項6に記載のコンピュータ・システム。
- 前記再帰ユニットは、予め規定された数の再帰が発生した場合に前記トリガすることを停止するように適合された、請求項1ないし7のいずれか一項に記載のコンピュータ・システム。
- 前記評価器エンジンおよび前記抽出器エンジンの少なくともいずれか一方は、ナレッジ・グラフ・システムに接続される、請求項1ないし8のいずれか一項に記載のコンピュータ・システム。
- コンピュータが実施する方法であって、
予測クラスへの未知の入力データの分類のために使用可能なモデルを構築するように訓練データを用いて訓練された分類器システムを提供することと、
予測の信頼レベル分布を決定することによって、前記予測クラス内の十分に提示されていないクラスを決定することと、
追加のソースから関連データを抽出することであって、前記関連データは決定された前記十分に提示されていないクラスに関連する、前記抽出することと、
前記関連データの特徴と、前記十分に提示されていないクラスに対する代表のデータ・セットの特徴とを比較することによって、前記関連データからデータ・セットを選択することと、
前記選択されたデータ・セットが信頼閾値レベルより高い信頼レベルで分類されるまで、前記選択されたデータ・セットを入力データとして扱うことによって、前記評価すること、前記抽出すること、および前記選択することを反復することと
を含む、コンピュータが実施する方法。 - 前記入力データは画像データである、請求項10に記載のコンピュータが実施する方法。
- 前記画像データは、ビデオ・データから抽出される、請求項11に記載のコンピュータが実施する方法。
- 前記十分に提示されていないクラスを決定することは、前記予測クラスと他のクラスとの差の関数に基づく、請求項10ないし12のいずれか一項に記載のコンピュータが実施する方法。
- 前記関連データは、前記訓練データおよび通常の入力データに対して外部のデータである、請求項10ないし13のいずれか一項に記載のコンピュータが実施する方法。
- 前記選択されたデータ・セットが信頼閾値レベルより高い信頼レベルで分類された場合に、前記選択されたデータ・セットを追加訓練データ・セットとしてラベル付けすること
をさらに含む、請求項10ないし14のいずれか一項に記載のコンピュータが実施する方法。 - 前記ラベル付けすることは、
前記十分に提示されていないクラスに関する前記ラベルで前記追加訓練データ・セットに注釈を付けること
をさらに含む、請求項15に記載のコンピュータが実施する方法。 - 前記反復することは、予め規定された数の再帰が発生した場合に停止される、請求項10ないし16のいずれか一項に記載のコンピュータが実施する方法。
- 前記評価することおよび前記抽出することの少なくともいずれか一方は、ナレッジ・グラフ・システムにアクセスすることを含む、請求項10ないし17のいずれか一項に記載のコンピュータが実施する方法。
- コンピュータに、請求項10ないし18のいずれか一項に記載の方法を実行させる、コンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/410,192 | 2019-05-13 | ||
US16/410,192 US11176429B2 (en) | 2019-05-13 | 2019-05-13 | Counter rare training date for artificial intelligence |
PCT/IB2020/054000 WO2020229923A1 (en) | 2019-05-13 | 2020-04-28 | Counter rare training date for artificial intelligence |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2022531974A JP2022531974A (ja) | 2022-07-12 |
JPWO2020229923A5 true JPWO2020229923A5 (ja) | 2022-10-04 |
JP7448562B2 JP7448562B2 (ja) | 2024-03-12 |
Family
ID=73231556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021567901A Active JP7448562B2 (ja) | 2019-05-13 | 2020-04-28 | 人工知能のための希な訓練データへの対処 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11176429B2 (ja) |
JP (1) | JP7448562B2 (ja) |
CN (1) | CN113826113A (ja) |
DE (1) | DE112020001034T5 (ja) |
WO (1) | WO2020229923A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11615266B2 (en) * | 2019-11-02 | 2023-03-28 | Perceptive Automata, Inc. | Adaptive sampling of stimuli for training of machine learning based models for predicting hidden context of traffic entities for navigating autonomous vehicles |
US20220012535A1 (en) * | 2020-07-08 | 2022-01-13 | Vmware, Inc. | Augmenting Training Data Sets for ML Classifiers Using Classification Metadata |
US11782988B2 (en) * | 2020-09-21 | 2023-10-10 | Spotify Ab | Query understanding methods and systems |
CN112926429A (zh) * | 2021-02-19 | 2021-06-08 | 百果园技术(新加坡)有限公司 | 机审模型训练、视频机审方法、装置、设备及存储介质 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5872865A (en) | 1995-02-08 | 1999-02-16 | Apple Computer, Inc. | Method and system for automatic classification of video images |
US7327885B2 (en) | 2003-06-30 | 2008-02-05 | Mitsubishi Electric Research Laboratories, Inc. | Method for detecting short term unusual events in videos |
US7792353B2 (en) * | 2006-10-31 | 2010-09-07 | Hewlett-Packard Development Company, L.P. | Retraining a machine-learning classifier using re-labeled training samples |
JP5335536B2 (ja) * | 2009-04-23 | 2013-11-06 | キヤノン株式会社 | 情報処理装置及び情報処理方法 |
US8478052B1 (en) | 2009-07-17 | 2013-07-02 | Google Inc. | Image classification |
US9251185B2 (en) * | 2010-12-15 | 2016-02-02 | Girish Kumar | Classifying results of search queries |
US8774515B2 (en) | 2011-04-20 | 2014-07-08 | Xerox Corporation | Learning structured prediction models for interactive image labeling |
US9727821B2 (en) | 2013-08-16 | 2017-08-08 | International Business Machines Corporation | Sequential anomaly detection |
US20160092789A1 (en) | 2014-09-29 | 2016-03-31 | International Business Machines Corporation | Category Oversampling for Imbalanced Machine Learning |
JP6489005B2 (ja) * | 2015-12-18 | 2019-03-27 | キヤノンマーケティングジャパン株式会社 | 情報処理システム、情報処理方法、プログラム |
WO2017158058A1 (en) | 2016-03-15 | 2017-09-21 | Imra Europe Sas | Method for classification of unique/rare cases by reinforcement learning in neural networks |
JP7071054B2 (ja) * | 2017-01-20 | 2022-05-18 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
US10546232B2 (en) | 2017-07-04 | 2020-01-28 | Microsoft Technology Licensing, Llc | Image recognition with promotion of underrepresented classes |
WO2019051359A1 (en) * | 2017-09-08 | 2019-03-14 | The General Hospital Corporation | SYSTEM AND METHOD FOR AUTOMATICALLY LABELING AND ANNOUNTING NON-STRUCTURED MEDICAL DATA SETS |
WO2019104217A1 (en) * | 2017-11-22 | 2019-05-31 | The Trustees Of Columbia University In The City Of New York | System method and computer-accessible medium for classifying breast tissue using a convolutional neural network |
US11265168B2 (en) * | 2018-03-07 | 2022-03-01 | Private Identity Llc | Systems and methods for privacy-enabled biometric processing |
US10878296B2 (en) * | 2018-04-12 | 2020-12-29 | Discovery Communications, Llc | Feature extraction and machine learning for automated metadata analysis |
WO2019241155A1 (en) * | 2018-06-11 | 2019-12-19 | Arterys Inc. | Simulating abnormalities in medical images with generative adversarial networks |
EP3899954A4 (en) * | 2018-12-21 | 2022-09-14 | BioNTech US Inc. | METHODS AND SYSTEMS FOR PREDICTING HLA CLASS II SPECIFIC EPITOPES AND CHARACTERIZING CD4+ T CELLS |
US20220198316A1 (en) * | 2020-12-17 | 2022-06-23 | Exceed AI Ltd, Tel-Aviv | Systems and Methods for Automatic Extraction of Classification Training Data |
-
2019
- 2019-05-13 US US16/410,192 patent/US11176429B2/en active Active
-
2020
- 2020-04-28 CN CN202080033660.3A patent/CN113826113A/zh active Pending
- 2020-04-28 WO PCT/IB2020/054000 patent/WO2020229923A1/en active Application Filing
- 2020-04-28 JP JP2021567901A patent/JP7448562B2/ja active Active
- 2020-04-28 DE DE112020001034.1T patent/DE112020001034T5/de active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210241175A1 (en) | Methods and apparatus for management of a machine-learning model to adapt to changes in landscape of potentially malicious artifacts | |
US11645554B2 (en) | Method and apparatus for recognizing a low-quality article based on artificial intelligence, device and medium | |
EP3284029B1 (en) | Recurrent neural networks for malware analysis | |
CN111967302B (zh) | 视频标签的生成方法、装置及电子设备 | |
CN107729468B (zh) | 基于深度学习的答案抽取方法及系统 | |
CN109547423B (zh) | 一种基于机器学习的web恶意请求深度检测系统及方法 | |
Song et al. | Semi-automatic video annotation based on active learning with multiple complementary predictors | |
Fonseca et al. | Addressing missing labels in large-scale sound event recognition using a teacher-student framework with loss masking | |
US20220108184A1 (en) | Method and device for training a machine learning system | |
CN111898129B (zh) | 基于Two-Head异常检测模型的恶意代码样本筛选器及方法 | |
Qamar Bhatti et al. | Explicit content detection system: An approach towards a safe and ethical environment | |
CN113826113A (zh) | 用于人工智能的对罕见训练数据计数 | |
CN110019776A (zh) | 文章分类方法及装置、存储介质 | |
CN113971776A (zh) | 视听事件定位方法和系统 | |
CN115641529A (zh) | 基于上下文建模与背景抑制的弱监督时序行为检测方法 | |
Nikolopoulos et al. | Evidence-driven image interpretation by combining implicit and explicit knowledge in a bayesian network | |
CN111191033A (zh) | 一种基于分类效用的开集分类方法 | |
CN114266251A (zh) | 恶意域名检测方法、装置、电子设备及存储介质 | |
CN114692623A (zh) | 一种环境类网络舆情的情感分析方法 | |
CN111475648B (zh) | 一种文本分类模型生成方法、文本分类方法及装置、设备 | |
JPWO2020229923A5 (ja) | ||
Xie et al. | Discovering meaningful multimedia patterns with audio-visual concepts and associated text | |
CN112052453A (zh) | 基于Relief算法的webshell检测方法及装置 | |
CN117011751A (zh) | 使用变换器网络分割视频图像序列 | |
CN115238707A (zh) | 基于词向量语义分析的执法视频评价方法及装置 |