JP2020533692A5 - - Google Patents

Download PDF

Info

Publication number
JP2020533692A5
JP2020533692A5 JP2020513922A JP2020513922A JP2020533692A5 JP 2020533692 A5 JP2020533692 A5 JP 2020533692A5 JP 2020513922 A JP2020513922 A JP 2020513922A JP 2020513922 A JP2020513922 A JP 2020513922A JP 2020533692 A5 JP2020533692 A5 JP 2020533692A5
Authority
JP
Japan
Prior art keywords
question
training data
answer
classifier
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020513922A
Other languages
English (en)
Other versions
JP2020533692A (ja
JP7052016B2 (ja
Filing date
Publication date
Priority claimed from US15/705,596 external-priority patent/US10387572B2/en
Application filed filed Critical
Publication of JP2020533692A publication Critical patent/JP2020533692A/ja
Publication of JP2020533692A5 publication Critical patent/JP2020533692A5/ja
Application granted granted Critical
Publication of JP7052016B2 publication Critical patent/JP7052016B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (19)

  1. 自然言語分類器において使用される訓練データを更新するためのコンピュータ実施方法であって、
    前記訓練データをメモリに読み出すことであり、前記訓練データは第1の質問グループおよび第2の質問グループを含み、各質問は、回答と関連付けられる、前記読み出すことと、
    前記第1の質問グループおよび前記第2の質問グループの各質問について、質問に対する前記回答を含む回答クラスを決定することであり、前記回答クラスは、前記質問の各々と関連付けられているクラス・ラベルを有し、前記質問の各々は、それぞれの回答クラスに分類される、前記決定することと、
    前記第1の質問グループおよび前記第2の質問グループ、ならびに、それぞれ第1のクラシファイアおよび第2のクラシファイアにおいて使用するための対応する回答クラスを含む、第1の訓練データおよび第2の訓練データを生成することと、
    前記第2のクラシファイアによって前記第1の質問グループの各質問を分類し、前記第1のクラシファイアによって前記第2の質問グループの各質問を分類することであり、各質問は、対応する回答クラスに分類され、前記第1のクラシファイアおよび前記第2のクラシファイアによる分類は各々、それぞれの分類結果を生成する、前記分類することと、
    前記分類結果に基づいて前記第1の訓練データおよび前記第2の訓練データのうちの1つまたは複数を更新することと、
    それぞれ、前記第1のクラシファイアおよび前記第2のクラシファイアにおいて使用するための、更新された第1の訓練データおよび第2の訓練データを生成することと
    を含む、コンピュータ実施方法。
  2. それぞれ、前記更新された第1の訓練データおよび第2の訓練データに基づいて前記第1のクラシファイアおよび前記第2のクラシファイアのうちの一方を更新することをさらに含む、請求項1に記載のコンピュータ実施方法。
  3. 前記分類すること、前記第1の訓練データおよび前記第2の訓練データを前記更新すること、ならびに、前記第1のクラシファイアおよび前記第2のクラシファイアのうちの一方を前記更新することが、マッチングの程度が所定の閾値を超えるまで反復され、前記マッチングの程度は、前記分類の前と後の両方において、前記第1の質問グループおよび前記第2の質問グループのうちの一方の各質問に関して、前記回答を含む前記回答クラスについて決定される、請求項2に記載のコンピュータ実施方法。
  4. 前記分類すること、前記第1の訓練データおよび前記第2の訓練データを前記更新すること、ならびに、前記第1のクラシファイアおよび前記第2のクラシファイアのうちの一方を前記更新することが、連続するマッチングの程度の間の差が所定の閾値を超えなくなるまで反復され、前記マッチングの程度は、前記分類の前と後の両方において、前記第1の質問グループおよび前記第2の質問グループのうちの一方の各質問に関して、前記回答を含む前記回答クラスについて決定される、請求項2に記載のコンピュータ実施方法。
  5. 前記分類すること、前記第1の訓練データおよび前記第2の訓練データを前記更新すること、ならびに、前記第1のクラシファイアおよび前記第2のクラシファイアのうちの一方を前記更新することが、マッチングの程度の移動平均値が所定の閾値を超えるまで反復され、前記マッチングの程度は、前記分類の前と後の両方において、前記第1の質問グループおよび前記第2の質問グループのうちの一方の各質問に関して、前記回答を含む前記回答クラスについて決定される、請求項2に記載のコンピュータ実施方法。
  6. 前記分類結果が、それぞれ前記第1のクラシファイアおよび前記第2のクラシファイアによる対応する回答クラスに関する各質問の前記分類に対応する信頼度値を含み、前記第1の訓練データおよび前記第2の訓練データのうちの1つまたは複数を更新することは、信頼度値が所定の閾値を超えるときに行われる、請求項1に記載のコンピュータ実施方法。
  7. 質問に対する前記回答を含む回答クラスを決定することは、
    前記質問に対する前記回答を含む各回答クラスの信頼度値を決定することと、
    相対信頼度値が最も高い前記回答クラス、および、対応する信頼度値が所定の閾値を超える前記回答クラスのうちの一方に基づいて、前記回答クラスを決定することと
    を含む、請求項1に記載のコンピュータ実施方法。
  8. 前記分類結果が、それぞれ前記第1のクラシファイアおよび前記第2のクラシファイアによる対応する回答クラスに関する各質問の前記分類に対応する信頼度値を含み、前記第1の訓練データおよび前記第2の訓練データのうちの1つまたは複数を更新することは、
    対応する信頼度値が所定の閾値を超える場合、質問を1つの回答クラスから別の回答クラスへと再分類することを含む、請求項1に記載のコンピュータ実施方法。
  9. それぞれ、前記更新された第1の訓練データおよび第2の訓練データのうちの一方に基づいて前記第1のクラシファイアおよび前記第2のクラシファイアのうちの1つまたは複数を更新することをさらに含む、請求項1に記載のコンピュータ実施方法。
  10. 質問グループを前記第1の質問グループおよび前記第2の質問グループに分割することと、
    各質問を前記回答と関連付けることと
    をさらに含む、請求項1に記載のコンピュータ実施方法。
  11. 前記分類結果が、それぞれ前記第1のクラシファイアおよび前記第2のクラシファイアによる対応する回答クラスに関する各質問の前記分類に対応する信頼度値を含み、各質問を前記回答と関連付けることは、所定の閾値を超えない最低の相対信頼度値を含む対応する回答クラスに関する質問の分類が行われるまで反復される、請求項10に記載のコンピュータ実施方法。
  12. 前記分類結果が、それぞれ前記第1のクラシファイアおよび前記第2のクラシファイアによる対応する回答クラスに関する各質問の前記分類に対応する信頼度値を含み、各質問を前記回答と前記関連付けることは、
    検索エンジンおよび回答コーパスのうちの1つまたは複数を使用することを含む、請求項10に記載のコンピュータ実施方法。
  13. 前記回答が、最高の相対信頼度値を有する回答クラスのものであり、前記回答が、前記検索エンジンおよび前記回答コーパスのうちの1つまたは複数を使用して識別される、請求項12に記載のコンピュータ実施方法。
  14. 各質問を前記回答と前記関連付けることが、最低の相対信頼度値を超える相対信頼度値を含む対応する回答クラスに関する質問の分類が行われるまで反復される、請求項11に記載のコンピュータ実施方法。
  15. 自然言語分類器において使用される訓練データを更新するためのコンピュータ・システムであって、
    1つまたは複数のコンピュータ・プロセッサと、1つまたは複数のコンピュータ可読記憶媒体と、前記1つまたは複数のコンピュータ・プロセッサのうちの少なくとも1つによって実行するための、前記コンピュータ可読記憶媒体のうちの1つまたは複数に記憶されているプログラム命令とを備え、前記プログラム命令は、前記1つまたは複数のコンピュータ・プロセッサのうちの前記少なくとも1つによって実行されると、前記コンピュータ・システムに、訓練データを更新するための方法を実施させ、前記方法は、
    前記訓練データをメモリに読み出すことであり、前記訓練データは第1の質問グループおよび第2の質問グループを含み、各質問は、回答と関連付けられる、前記読み出すことと、
    前記第1の質問グループおよび前記第2の質問グループの各質問について、質問に対する前記回答を含む回答クラスを決定することであり、前記回答クラスは、前記質問の各々と関連付けられているクラス・ラベルを有し、前記質問の各々は、それぞれの回答クラスに分類される、前記決定することと、
    前記第1の質問グループおよび前記第2の質問グループ、ならびに、それぞれ第1のクラシファイアおよび第2のクラシファイアにおいて使用するための対応する回答クラスを含む、第1の訓練データおよび第2の訓練データを生成することと、
    前記第2のクラシファイアによって前記第1の質問グループの各質問を分類し、前記第1のクラシファイアによって前記第2の質問グループの各質問を分類することであり、各質問は、対応する回答クラスに分類され、前記第1のクラシファイアおよび前記第2のクラシファイアによる分類は各々、それぞれの分類結果を生成する、前記分類することと、
    前記分類結果に基づいて前記第1の訓練データおよび前記第2の訓練データのうちの1つまたは複数を更新することと、
    それぞれ、前記第1のクラシファイアおよび前記第2のクラシファイアにおいて使用するための、更新された第1の訓練データおよび第2の訓練データを生成することと
    を含む、コンピュータ・システム。
  16. 前記方法が、
    それぞれ、前記更新された第1の訓練データおよび第2の訓練データに基づいて前記第1のクラシファイアおよび前記第2のクラシファイアのうちの一方を更新することをさらに含む、請求項15に記載のコンピュータ・システム。
  17. コンピュータ・プログラムであって、
    1つまたは複数のコンピュータ可読記憶デバイスと、コンピュータ・システムの少なくとも1つまたは複数のコンピュータ・プロセッサによって実行するための、前記1つまたは複数のコンピュータ可読記憶デバイスのうちの少なくとも1つに記憶されているプログラム命令とを備え、前記プログラム命令は、前記1つまたは複数のコンピュータ・プロセッサのうちの前記少なくとも1つによって実行されると、前記コンピュータ・システムに、訓練データを更新するための方法を実施させ、前記方法は、
    前記訓練データをメモリに読み出すことであり、前記訓練データは第1の質問グループおよび第2の質問グループを含み、各質問は、回答と関連付けられる、前記読み出すことと、
    前記第1の質問グループおよび前記第2の質問グループの各質問について、質問に対する前記回答を含む回答クラスを決定することであり、前記回答クラスは、前記質問の各々と関連付けられているクラス・ラベルを有し、前記質問の各々は、それぞれの回答クラスに分類される、前記決定することと、
    前記第1の質問グループおよび前記第2の質問グループ、ならびに、それぞれ第1のクラシファイアおよび第2のクラシファイアにおいて使用するための対応する回答クラスを含む、第1の訓練データおよび第2の訓練データを生成することと、
    前記第2のクラシファイアによって前記第1の質問グループの各質問を分類し、前記第1のクラシファイアによって前記第2の質問グループの各質問を分類することであり、各質問は、対応する回答クラスに分類され、前記第1のクラシファイアおよび前記第2のクラシファイアによる分類は各々、それぞれの分類結果を生成する、前記分類することと、
    前記分類結果に基づいて前記第1の訓練データおよび前記第2の訓練データのうちの1つまたは複数を更新することと、
    それぞれ、前記第1のクラシファイアおよび前記第2のクラシファイアにおいて使用するための、更新された第1の訓練データおよび第2の訓練データを生成することと
    を含む、コンピュータ・プログラム。
  18. 前記方法が、
    それぞれ、前記更新された第1の訓練データおよび第2の訓練データに基づいて前記第1のクラシファイアおよび前記第2のクラシファイアのうちの一方を更新することをさらに含む、請求項17に記載のコンピュータ・プログラム。
  19. 請求項18に記載の前記コンピュータ・プログラムを、コンピュータ可読記録媒体に記録した、記録媒体。
JP2020513922A 2017-09-15 2018-09-13 訓練データを更新するための方法、システム、およびコンピュータ・プログラム Active JP7052016B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US15/705,596 US10387572B2 (en) 2017-09-15 2017-09-15 Training data update
US15/705,596 2017-09-15
US15/845,031 US10372826B2 (en) 2017-09-15 2017-12-18 Training data update
US15/845,031 2017-12-18
PCT/IB2018/057011 WO2019053629A1 (en) 2017-09-15 2018-09-13 UPDATE OF LEARNING DATA

Publications (3)

Publication Number Publication Date
JP2020533692A JP2020533692A (ja) 2020-11-19
JP2020533692A5 true JP2020533692A5 (ja) 2021-01-07
JP7052016B2 JP7052016B2 (ja) 2022-04-11

Family

ID=65720294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020513922A Active JP7052016B2 (ja) 2017-09-15 2018-09-13 訓練データを更新するための方法、システム、およびコンピュータ・プログラム

Country Status (6)

Country Link
US (4) US10387572B2 (ja)
JP (1) JP7052016B2 (ja)
CN (1) CN111095234A (ja)
DE (1) DE112018005167T5 (ja)
GB (1) GB2580805A (ja)
WO (1) WO2019053629A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10387572B2 (en) 2017-09-15 2019-08-20 International Business Machines Corporation Training data update
US10467640B2 (en) 2017-11-29 2019-11-05 Qualtrics, Llc Collecting and analyzing electronic survey responses including user-composed text
CN109919317B (zh) * 2018-01-11 2024-06-04 华为技术有限公司 一种机器学习模型训练方法和装置
CN110949458B (zh) * 2019-11-27 2021-11-12 交控科技股份有限公司 基于微服务架构的轨道交通运维管理系统
CN111858875B (zh) * 2020-05-09 2024-06-07 北京嘀嘀无限科技发展有限公司 智能交互方法、装置、设备及存储介质
US11756663B2 (en) * 2020-07-27 2023-09-12 Kpn Innovations, Llc. Method of and system for determining a prioritized instruction set for a user
CN111967581B (zh) * 2020-08-06 2023-10-31 平安科技(深圳)有限公司 分群模型的解释方法、装置、计算机设备和存储介质
CN111949769B (zh) * 2020-08-23 2024-03-12 云知声智能科技股份有限公司 一种增强阅读理解系统鲁棒性的方法及装置
US11080484B1 (en) * 2020-10-08 2021-08-03 Omniscient Neurotechnology Pty Limited Natural language processing of electronic records
CN112541109B (zh) * 2020-12-22 2023-10-24 北京百度网讯科技有限公司 答案摘要抽取方法及装置、电子设备、可读介质、产品
US20220215034A1 (en) * 2021-01-05 2022-07-07 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
CN112733932A (zh) * 2021-01-08 2021-04-30 北京匠数科技有限公司 基于训练数据相似度聚合的模型加速训练方法及装置
CN112948560A (zh) * 2021-03-23 2021-06-11 平安科技(深圳)有限公司 佛学问答数据生成方法、装置、计算机设备及存储介质
CN114238598A (zh) * 2021-12-07 2022-03-25 北京妙医佳健康科技集团有限公司 一种问答系统及其标注、审核与模型训练的方法

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7925492B2 (en) * 2004-01-06 2011-04-12 Neuric Technologies, L.L.C. Method for determining relationships through use of an ordered list between processing nodes in an emulated human brain
US6289513B1 (en) * 1999-06-01 2001-09-11 Isaac Bentwich Interactive application generation and text processing
US7269545B2 (en) * 2001-03-30 2007-09-11 Nec Laboratories America, Inc. Method for retrieving answers from an information retrieval system
US7657935B2 (en) * 2001-08-16 2010-02-02 The Trustees Of Columbia University In The City Of New York System and methods for detecting malicious email transmission
US7489812B2 (en) * 2002-06-07 2009-02-10 Dynamic Digital Depth Research Pty Ltd. Conversion and encoding techniques
US7734554B2 (en) * 2005-10-27 2010-06-08 Hewlett-Packard Development Company, L.P. Deploying a document classification system
US8407160B2 (en) 2006-11-15 2013-03-26 The Trustees Of Columbia University In The City Of New York Systems, methods, and media for generating sanitized data, sanitizing anomaly detection models, and/or generating sanitized anomaly detection models
US8010410B2 (en) 2006-12-29 2011-08-30 Ebay Inc. Method and system for listing categorization
US9342588B2 (en) 2007-06-18 2016-05-17 International Business Machines Corporation Reclassification of training data to improve classifier accuracy
WO2009084620A1 (ja) 2007-12-27 2009-07-09 Canon Kabushiki Kaisha トナー及び二成分系現像剤
JP5206044B2 (ja) * 2008-03-17 2013-06-12 株式会社リコー 省エネ小粒径トナーの製造方法及び製造装置
US10482114B2 (en) * 2008-03-27 2019-11-19 Oath Inc. System and method for maintenance of questions and answers through collaborative and community editing
US20090306967A1 (en) * 2008-06-09 2009-12-10 J.D. Power And Associates Automatic Sentiment Analysis of Surveys
CN102903008B (zh) * 2011-07-29 2016-05-18 国际商业机器公司 用于计算机问答的方法及系统
US9213686B2 (en) * 2011-10-04 2015-12-15 Wfh Properties Llc System and method for managing a form completion process
JP5825676B2 (ja) * 2012-02-23 2015-12-02 国立研究開発法人情報通信研究機構 ノン・ファクトイド型質問応答システム及びコンピュータプログラム
US20140006012A1 (en) * 2012-07-02 2014-01-02 Microsoft Corporation Learning-Based Processing of Natural Language Questions
US20140067816A1 (en) * 2012-08-29 2014-03-06 Microsoft Corporation Surfacing entity attributes with search results
US9471559B2 (en) 2012-12-10 2016-10-18 International Business Machines Corporation Deep analysis of natural language questions for question answering system
US9390378B2 (en) 2013-03-28 2016-07-12 Wal-Mart Stores, Inc. System and method for high accuracy product classification with limited supervision
JP6328463B2 (ja) 2013-11-01 2018-05-23 ローランド株式会社 鍵盤装置
US9286910B1 (en) 2014-03-13 2016-03-15 Amazon Technologies, Inc. System for resolving ambiguous queries based on user context
US20150278264A1 (en) * 2014-03-31 2015-10-01 International Business Machines Corporation Dynamic update of corpus indices for question answering system
JP6173972B2 (ja) 2014-06-10 2017-08-02 株式会社東芝 検出装置、修正システム、検出方法およびプログラム
CN104166643A (zh) 2014-08-19 2014-11-26 南京金娃娃软件科技有限公司 一种智能问答系统中的对话行为分析方法
CN105447031A (zh) * 2014-08-28 2016-03-30 百度在线网络技术(北京)有限公司 训练样本的标注方法及装置
CN104182767B (zh) * 2014-09-05 2018-03-13 西安电子科技大学 主动学习和邻域信息相结合的高光谱图像分类方法
US9720963B2 (en) * 2014-11-05 2017-08-01 International Business Machines Corporation Answer category data classifying using dynamic thresholds
US9792549B2 (en) 2014-11-21 2017-10-17 International Business Machines Corporation Extraction of semantic relations using distributional relation detection
KR102415503B1 (ko) * 2015-08-21 2022-07-01 삼성전자주식회사 분류기 학습 방법 및 객체 검출 방법
CN106778796B (zh) * 2016-10-20 2020-04-21 江苏大学 基于混合式协同训练的人体动作识别方法及系统
CN106844530A (zh) * 2016-12-29 2017-06-13 北京奇虎科技有限公司 一种问答对分类模型的训练方法和装置
US10387572B2 (en) 2017-09-15 2019-08-20 International Business Machines Corporation Training data update

Similar Documents

Publication Publication Date Title
JP2020533692A5 (ja)
GB2580805A (en) Training data update
CN110472642B (zh) 基于多级注意力的细粒度图像描述方法及系统
JP6928371B2 (ja) 分類器、分類器の学習方法、分類器における分類方法
KR102068249B1 (ko) 얼굴의 키 포인트들에 대한 포지셔닝 방법 및 장치
US20150120624A1 (en) Apparatus and method for information processing
CN108228704A (zh) 识别风险内容的方法及装置、设备
WO2023109208A1 (zh) 小样本目标检测方法及装置
CN116134454A (zh) 用于使用知识蒸馏训练神经网络模型的方法和系统
US10867216B2 (en) Devices, systems, and methods for detecting unknown objects
KR102370910B1 (ko) 딥러닝 기반 소수 샷 이미지 분류 장치 및 방법
US11829848B2 (en) Adding negative classes for training classifier
GB2587942A (en) Layered stochastic anonymization of data
KR20200082490A (ko) 기계 학습 데이터 선택 방법 및 장치
TWI711934B (zh) 嵌入結果的解釋方法和裝置
JP6230987B2 (ja) 言語モデル作成装置、言語モデル作成方法、プログラム、および記録媒体
CN115393625A (zh) 从粗略标记进行图像分段的半监督式训练
US10311338B1 (en) Learning method, learning device for detecting lanes on the basis of CNN and testing method, testing device using the same
US20210365719A1 (en) System and method for few-shot learning
JP7389389B2 (ja) 処理装置、処理方法および処理プログラム
Hang et al. Open world plant image identification based on convolutional neural network
WO2023093372A1 (zh) 生成文本的方法和装置
CN111680132A (zh) 一种用于互联网文本信息的噪声过滤和自动分类方法
JP2020107185A (ja) 画像認識装置、画像認識方法及びプログラム
Ali Ahmed et al. Plant identification with large number of classes: Sabanciu-gebzetu system in plantclef 2017