JPWO2020229923A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2020229923A5
JPWO2020229923A5 JP2021567901A JP2021567901A JPWO2020229923A5 JP WO2020229923 A5 JPWO2020229923 A5 JP WO2020229923A5 JP 2021567901 A JP2021567901 A JP 2021567901A JP 2021567901 A JP2021567901 A JP 2021567901A JP WO2020229923 A5 JPWO2020229923 A5 JP WO2020229923A5
Authority
JP
Japan
Prior art keywords
data
computer
classes
data set
implemented method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021567901A
Other languages
English (en)
Other versions
JP7448562B2 (ja
JP2022531974A (ja
Publication date
Priority claimed from US16/410,192 external-priority patent/US11176429B2/en
Application filed filed Critical
Publication of JP2022531974A publication Critical patent/JP2022531974A/ja
Publication of JPWO2020229923A5 publication Critical patent/JPWO2020229923A5/ja
Application granted granted Critical
Publication of JP7448562B2 publication Critical patent/JP7448562B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (19)

  1. 測クラスへの未知の入力データの分類のために使用可能なモデルを構築するように訓練データを用いて訓練される分類器システムと、
    前記予測クラス内の十分に提示されていないクラスの決定のために適合された評価器エンジンであって、予測の信頼レベル分布を用いる、前記評価器エンジンと、
    追加のソースからの関連データの抽出のために適合された抽出器エンジンであって、前記関連データは決定された前記十分に提示されていないクラスに関連する、前記抽出器エンジンと、
    前記関連データからデータ・セットを選択するために適合された類似性エンジンであって、前記関連データの特徴と前記十分に提示されていないクラスに対する代表のデータ・セットの特徴とを比較するためにも適合された、前記類似性エンジンと、
    前記評価器エンジンと前記抽出器エンジンと前記類似性エンジンとをトリガするように適合された再帰ユニットであって、前記評価器エンジンが前記選択されたデータ・セットを信頼閾値レベルより高い信頼レベルで分類するまで前記選択されたデータ・セットを入力データとして扱う、前記再帰ユニットと、
    を備えるコンピュータ・システム。
  2. 前記入力データは画像データである、請求項1に記載のコンピュータ・システム。
  3. 前記画像データは、ビデオ・データから抽出される、請求項2に記載のコンピュータ・システム。
  4. 前記十分に提示されていないクラスの前記決定は、前記予測クラスと他のクラスとの差の関数に基づく、請求項1または2に記載のコンピュータ・システム。
  5. 前記関連データは、前記訓練データおよび通常の入力データに対して外部のデータである、請求項1ないし3のいずれか一項に記載のコンピュータ・システム。
  6. 前記評価器が信頼閾値レベルより高い信頼レベルで前記選択されたデータ・セットを分類した場合に、前記選択されたデータ・セットを追加訓練データ・セットとしてラベル付けするように適合されたラベル付けユニット
    をさらに備える、請求項1ないし4のいずれか一項に記載のコンピュータ・システム。
  7. 前記ラベル付けユニットは、前記十分に提示されていないクラスに関する前記ラベルで前記追加訓練データ・セットに注釈を付けるようにも適合された、請求項6に記載のコンピュータ・システム。
  8. 前記再帰ユニットは、予め規定された数の再帰が発生した場合に前記トリガすることを停止するように適合された、請求項1ないし7のいずれか一項に記載のコンピュータ・システム。
  9. 前記評価器エンジンおよび前記抽出器エンジンの少なくともいずれか一方は、ナレッジ・グラフ・システムに接続される、請求項1ないし8のいずれか一項に記載のコンピュータ・システム。
  10. コンピュータが実施する方法であって、
    予測クラスへの未知の入力データの分類のために使用可能なモデルを構築するように訓練データを用いて訓練された分類器システムを提供することと、
    予測の信頼レベル分布を決定することによって、前記予測クラス内の十分に提示されていないクラスを決定することと、
    追加のソースから関連データを抽出することであって、前記関連データは決定された前記十分に提示されていないクラスに関連する、前記抽出することと、
    前記関連データの特徴と、前記十分に提示されていないクラスに対する代表のデータ・セットの特徴とを比較することによって、前記関連データからデータ・セットを選択することと、
    前記選択されたデータ・セットが信頼閾値レベルより高い信頼レベルで分類されるまで、前記選択されたデータ・セットを入力データとして扱うことによって、前記評価すること、前記抽出すること、および前記選択することを反復することと
    を含む、コンピュータが実施する方法。
  11. 前記入力データは画像データである、請求項10に記載のコンピュータが実施する方法。
  12. 前記画像データは、ビデオ・データから抽出される、請求項11に記載のコンピュータが実施する方法。
  13. 前記十分に提示されていないクラスを決定することは、前記予測クラスと他のクラスとの差の関数に基づく、請求項10ないし12のいずれか一項に記載のコンピュータが実施する方法。
  14. 前記関連データは、前記訓練データおよび通常の入力データに対して外部のデータである、請求項10ないし13のいずれか一項に記載のコンピュータが実施する方法。
  15. 前記選択されたデータ・セットが信頼閾値レベルより高い信頼レベルで分類された場合に、前記選択されたデータ・セットを追加訓練データ・セットとしてラベル付けすること
    をさらに含む、請求項10ないし14のいずれか一項に記載のコンピュータが実施する方法。
  16. 前記ラベル付けすることは、
    前記十分に提示されていないクラスに関する前記ラベルで前記追加訓練データ・セットに注釈を付けること
    をさらに含む、請求項15に記載のコンピュータが実施する方法。
  17. 前記反復することは、予め規定された数の再帰が発生した場合に停止される、請求項10ないし16のいずれか一項に記載のコンピュータが実施する方法。
  18. 前記評価することおよび前記抽出することの少なくともいずれか一方は、ナレッジ・グラフ・システムにアクセスすることを含む、請求項10ないし17のいずれか一項に記載のコンピュータが実施する方法。
  19. コンピュータに、請求項10ないし18のいずれか一項に記載の方法を実行させる、コンピュータ・プログラム。
JP2021567901A 2019-05-13 2020-04-28 人工知能のための希な訓練データへの対処 Active JP7448562B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/410,192 2019-05-13
US16/410,192 US11176429B2 (en) 2019-05-13 2019-05-13 Counter rare training date for artificial intelligence
PCT/IB2020/054000 WO2020229923A1 (en) 2019-05-13 2020-04-28 Counter rare training date for artificial intelligence

Publications (3)

Publication Number Publication Date
JP2022531974A JP2022531974A (ja) 2022-07-12
JPWO2020229923A5 true JPWO2020229923A5 (ja) 2022-10-04
JP7448562B2 JP7448562B2 (ja) 2024-03-12

Family

ID=73231556

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021567901A Active JP7448562B2 (ja) 2019-05-13 2020-04-28 人工知能のための希な訓練データへの対処

Country Status (5)

Country Link
US (1) US11176429B2 (ja)
JP (1) JP7448562B2 (ja)
CN (1) CN113826113A (ja)
DE (1) DE112020001034T5 (ja)
WO (1) WO2020229923A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11615266B2 (en) * 2019-11-02 2023-03-28 Perceptive Automata, Inc. Adaptive sampling of stimuli for training of machine learning based models for predicting hidden context of traffic entities for navigating autonomous vehicles
US20220012535A1 (en) * 2020-07-08 2022-01-13 Vmware, Inc. Augmenting Training Data Sets for ML Classifiers Using Classification Metadata
US11782988B2 (en) * 2020-09-21 2023-10-10 Spotify Ab Query understanding methods and systems
CN112926429A (zh) * 2021-02-19 2021-06-08 百果园技术(新加坡)有限公司 机审模型训练、视频机审方法、装置、设备及存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5872865A (en) 1995-02-08 1999-02-16 Apple Computer, Inc. Method and system for automatic classification of video images
US7327885B2 (en) 2003-06-30 2008-02-05 Mitsubishi Electric Research Laboratories, Inc. Method for detecting short term unusual events in videos
US7792353B2 (en) * 2006-10-31 2010-09-07 Hewlett-Packard Development Company, L.P. Retraining a machine-learning classifier using re-labeled training samples
JP5335536B2 (ja) * 2009-04-23 2013-11-06 キヤノン株式会社 情報処理装置及び情報処理方法
US8478052B1 (en) 2009-07-17 2013-07-02 Google Inc. Image classification
US9251185B2 (en) * 2010-12-15 2016-02-02 Girish Kumar Classifying results of search queries
US8774515B2 (en) 2011-04-20 2014-07-08 Xerox Corporation Learning structured prediction models for interactive image labeling
US9727821B2 (en) 2013-08-16 2017-08-08 International Business Machines Corporation Sequential anomaly detection
US20160092789A1 (en) 2014-09-29 2016-03-31 International Business Machines Corporation Category Oversampling for Imbalanced Machine Learning
JP6489005B2 (ja) * 2015-12-18 2019-03-27 キヤノンマーケティングジャパン株式会社 情報処理システム、情報処理方法、プログラム
WO2017158058A1 (en) 2016-03-15 2017-09-21 Imra Europe Sas Method for classification of unique/rare cases by reinforcement learning in neural networks
JP7071054B2 (ja) * 2017-01-20 2022-05-18 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
US10546232B2 (en) 2017-07-04 2020-01-28 Microsoft Technology Licensing, Llc Image recognition with promotion of underrepresented classes
WO2019051359A1 (en) * 2017-09-08 2019-03-14 The General Hospital Corporation SYSTEM AND METHOD FOR AUTOMATICALLY LABELING AND ANNOUNTING NON-STRUCTURED MEDICAL DATA SETS
WO2019104217A1 (en) * 2017-11-22 2019-05-31 The Trustees Of Columbia University In The City Of New York System method and computer-accessible medium for classifying breast tissue using a convolutional neural network
US11265168B2 (en) * 2018-03-07 2022-03-01 Private Identity Llc Systems and methods for privacy-enabled biometric processing
US10878296B2 (en) * 2018-04-12 2020-12-29 Discovery Communications, Llc Feature extraction and machine learning for automated metadata analysis
WO2019241155A1 (en) * 2018-06-11 2019-12-19 Arterys Inc. Simulating abnormalities in medical images with generative adversarial networks
EP3899954A4 (en) * 2018-12-21 2022-09-14 BioNTech US Inc. METHODS AND SYSTEMS FOR PREDICTING HLA CLASS II SPECIFIC EPITOPES AND CHARACTERIZING CD4+ T CELLS
US20220198316A1 (en) * 2020-12-17 2022-06-23 Exceed AI Ltd, Tel-Aviv Systems and Methods for Automatic Extraction of Classification Training Data

Similar Documents

Publication Publication Date Title
US20210241175A1 (en) Methods and apparatus for management of a machine-learning model to adapt to changes in landscape of potentially malicious artifacts
US11645554B2 (en) Method and apparatus for recognizing a low-quality article based on artificial intelligence, device and medium
EP3284029B1 (en) Recurrent neural networks for malware analysis
CN111967302B (zh) 视频标签的生成方法、装置及电子设备
CN107729468B (zh) 基于深度学习的答案抽取方法及系统
CN109547423B (zh) 一种基于机器学习的web恶意请求深度检测系统及方法
Song et al. Semi-automatic video annotation based on active learning with multiple complementary predictors
Fonseca et al. Addressing missing labels in large-scale sound event recognition using a teacher-student framework with loss masking
US20220108184A1 (en) Method and device for training a machine learning system
CN111898129B (zh) 基于Two-Head异常检测模型的恶意代码样本筛选器及方法
Qamar Bhatti et al. Explicit content detection system: An approach towards a safe and ethical environment
CN113826113A (zh) 用于人工智能的对罕见训练数据计数
CN110019776A (zh) 文章分类方法及装置、存储介质
CN113971776A (zh) 视听事件定位方法和系统
CN115641529A (zh) 基于上下文建模与背景抑制的弱监督时序行为检测方法
Nikolopoulos et al. Evidence-driven image interpretation by combining implicit and explicit knowledge in a bayesian network
CN111191033A (zh) 一种基于分类效用的开集分类方法
CN114266251A (zh) 恶意域名检测方法、装置、电子设备及存储介质
CN114692623A (zh) 一种环境类网络舆情的情感分析方法
CN111475648B (zh) 一种文本分类模型生成方法、文本分类方法及装置、设备
JPWO2020229923A5 (ja)
Xie et al. Discovering meaningful multimedia patterns with audio-visual concepts and associated text
CN112052453A (zh) 基于Relief算法的webshell检测方法及装置
CN117011751A (zh) 使用变换器网络分割视频图像序列
CN115238707A (zh) 基于词向量语义分析的执法视频评价方法及装置