JP2017531255A - 出力分布による生徒dnnの学習 - Google Patents
出力分布による生徒dnnの学習 Download PDFInfo
- Publication number
- JP2017531255A JP2017531255A JP2017513728A JP2017513728A JP2017531255A JP 2017531255 A JP2017531255 A JP 2017531255A JP 2017513728 A JP2017513728 A JP 2017513728A JP 2017513728 A JP2017513728 A JP 2017513728A JP 2017531255 A JP2017531255 A JP 2017531255A
- Authority
- JP
- Japan
- Prior art keywords
- dnn
- student
- teacher
- model
- dnn model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Business, Economics & Management (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
[0039] これから、HMMの状態放出確率密度関数p(x|o=s)は、状態事後確率P(o=s|x)を
ここで、P(o=s)は、状態sの事前確率であり、p(x)は状態に独立であり、評価の間に脱落させることができる。
[0041] これより図3に移り、大きい方の教師DNNから小さい方の生徒DNNを学習させるシステム300の態様について、本発明の実施形態にしたがって例示的に示す。システム例300は、教師DNN302と、それよりも小さい生徒DNN301とを含む。生徒DNN301は、そのレイヤー341の各々の上に教師DNN302よりも少ないノードを有することが図示されている。既に説明したように、本発明の一実施形態では、教師DNN302は、訓練済みDNNモデルを含み、この訓練済みDNNモデルは、当業者には周知である標準的な技法(図2に関係付けて説明した技法のような)にしたがって訓練されればよい。他の実施形態では、教師DNNは、図1の訓練コンポーネント126に関係付けて説明したように訓練されてもよい。いずれの場合でも、正しい教師(即ち、訓練済み教師DNN)があり、この教師から生徒DNNを学習させると仮定する。更に、生徒DNN301および教師DNN302は、それぞれ、ある数の隠れレイヤー341および342を有するCD−DMM−HMMとして具体化することができる。図3に示す実施形態では、生徒DNN301は出力分布351を有し、教師DNN302は、同じサイズの出力分布352を有するが、生徒DNN301自体は教師DNN302よりも小さい。
[0061] 方法500の実施形態は、訓練された教師DNNに接近するように、生徒DNNを学習させるので、生徒DNNのパラメーターのみが最適化される。したがって、以上のKL発散を最小化することは、交差エントロピーを最小化することと同等となる。
[0063] 一実施形態では、ステップ555は、訓練データーの全域掃引が既に行われたか否かも判定する。行われており(訓練データーの全てが少なくとも1回は使用された場合)、そして収束に達した(または、誤差信号がもはや小さくなっていない)場合、方法500は570に進む。しかし、データーの全てが未だ適用されていない場合、方法500はステップ560に進み、この実施形態では、繰り返す。
通例、コンピューティング・デバイス700は、種々のコンピューター読み取り可能媒体を含む。コンピューター読み取り可能媒体は、コンピューティング・デバイス700によってアクセスすることができるあらゆる入手可能な媒体とすることができ、揮発性および不揮発性双方の媒体、リムーバブルおよび非リムーバブル媒体を含む。一例として、そして限定ではなく、コンピューター読み取り可能媒体は、コンピューター記憶媒体および通信媒体を含むことができる。コンピューター記憶媒体は、揮発性および不揮発性の双方、リムーバブルおよび非リムーバブル媒体を含み、コンピューター読み取り可能命令、データー構造、プログラム・モジュール、または他のデーターというような情報の格納のための任意の方法または技術で実現される。コンピューター記憶媒体は、RAM、ROM、EEPROM、フラッシュ・メモリーまたは他のメモリー技術、CD−ROM、ディジタル・バーサタイル・ディスク(DVD)または他の光ディスク・ストレージ、磁気カセット、磁気テープ、磁気ディスク・ストレージまたは他の磁気記憶デバイス、あるいは所望の情報を格納するために使用することができ更にコンピューティング・デバイス700によってアクセスすることができる任意の他の媒体を含むが、これらに限定されるのではない。コンピューター記憶媒体は、信号自体を含まない。通信媒体は、通例、コンピューター読み取り可能命令、データー構造、プログラム・モジュール、または他のデーターを、搬送波または他の移送メカニズムのような変調データー信号内に具体化し、任意の情報配信媒体を含む。「変調データー信号」という用語は、当該信号内に情報を符合化するような形で、その特性の1つ以上が設定または変更された信号を意味する。一例として、そして限定ではなく、通信媒体は、有線ネットワークまたは直接有線接続のような有線媒体と、音響、RF、赤外線、および他のワイヤレス媒体のようなワイヤレス媒体とを含む。以上の内任意のものの組み合わせも、コンピューター読み取り可能媒体の範囲内に含まれてしかるべきである。
Claims (10)
- コンピューター実行可能命令が具体化されている1つ以上のコンピューター読み取り可能媒体であって、プロセッサーとメモリーとを有するコンピューティング・システムによって前記コンピューター実行可能命令が実行されると、前記コンピューティング・システムに、コンピューティング・デバイス上におけるデプロイメントのためにDNNクラシファイアを生成する方法を実行させ、前記方法が、
第1DNNモデルを教師DNNモデルとして決定するステップと、
第2DNNモデルを生徒DNNモデルとして初期化するステップと、
1組のラベルなし訓練データーを受け取るステップと、
ある回数の繰り返しにおいて、
(a)前記1組の訓練データーの内の部分集合を使用して、前記教師DNNモデルの教師出力分布と、前記生徒DNNモデルの生徒出力分布とを判定するステップと、
(b)前記生徒出力分布対前記教師出力分布の評価を判定するステップであって、前記評価が差を含む、ステップと、
(c)前記評価に基づいて、前記差を最小化するように前記生徒DNNモデルを更新するステップと、
前記生徒DNNモデルを訓練済みDNNクラシファイアとして供給するステップであって、前記ある回数の繰り返しが、前記判定された評価に基づく、ステップと、
を含む、1つ以上のコンピューター読み取り可能媒体。 - 請求項1に記載の1つ以上のコンピューター読み取り可能媒体において、前記生徒出力分布対前記教師出力分布の評価を判定するステップが、前記生徒出力分布と前記教師出力分布との間の収束を判定するステップを含み、前記ある回数の繰り返しが、前記収束が判定するまでにステップ(a)から(c)までを実行した回数である、1つ以上のコンピューター読み取り可能媒体。
- 請求項1に記載の1つ以上のコンピューター読み取り可能媒体において、前記生徒出力分布対前記教師出力分布の評価を判定するために、カルバック・ライブラー発散を使用し、前記判定された評価が誤差信号を含み、前記生徒DNNモデルが、前記誤差信号に基づいて、逆伝搬を使用して更新され、前記教師出力分布および前記生徒出力分布が、前記部分集合のデーターを使用して、順方向伝搬によって判定される、1つ以上のコンピューター読み取り可能媒体。
- 請求項1に記載の1つ以上のコンピューター読み取り可能媒体において、前記第1DNNモデルが集合DNNモデルを含み、前記第2DNNモデルが、前記第1DNNモデルに基づいて初期化されるか、またはランダムな重み値によって初期化され、前記第2DNNモデルがCD−DNN−HMMフレームワークの一部である、1つ以上のコンピューター読み取り可能媒体。
- 請求項1に記載の1つ以上のコンピューター読み取り可能媒体において、前記1組の訓練データーの内の前記部分集合が、ミニバッチを含み、前記1組の訓練データーの全てが使用され終えるまで、前記ある回数の繰り返しの各繰り返しに、データーの異なるミニバッチが使用される、1つ以上のコンピューター読み取り可能媒体。
- クライアント・デバイス上にデプロイされ、請求項1に記載のコンピューター実行可能命令を前記コンピューティング・システムによって実行することによって生成される、DNNクラシファイア。
- コンピューター・システム上におけるクラシファイアとしてのデプロイメントのために訓練済みDNNモデルを生成するためのコンピューター実装方法であって、
集合DNNモデルにおけるサブDNNとして含ませる複数のDNNモデルを決定するステップと、
前記サブDNNを使用して前記集合DNNモデルを組み立てることによって、複数のサブDNNの各々を集合メンバーとするステップと、
前記集合DNNモデルを訓練するステップと、
生徒DNNモデルを初期化するステップと、
前記訓練済み集合DNNモデルを教師DNNとして使用して、前記生徒DNNモデルを訓練するステップと、
前記生徒DNNモデルをDNNクラシファイアとして供給するステップと、
を含む、コンピューター実装方法。 - 請求項7に記載のコンピューター実装方法において、集合DNNモデルにおけるサブDNNとして含ませる前記複数のDNNモデルが、前記コンピューター・システム上にデプロイされる前記DNNクラシファイアに意図される用途に基づいて決定され、前記サブDNNが、(a)異なる非線形ユニットを有するDNNモデル、(b)異なる構造タイプを有するDNNモデル、(c)異なる訓練計画にしたがって訓練されたDNNモデル、(d)異なるトポロジーを有するDNNモデル、または(e)異なるデーターによって訓練されたDNNモデルを含む、コンピューター実装方法。
- 請求項7に記載のコンピューター実装方法において、前記集合DNNモデルを訓練するステップが、交差エントロピー基準、シーケンシャル基準、最少二乗誤差基準、または非負制約がある最少二乗誤差基準を使用して、学習済みの係数の組み合わせによって前記集合メンバーの出力分布を組み合わせるステップを含む、コンピューター実装方法。
- 請求項7に記載のコンピューター実装方法において、前記生徒DNNモデルを訓練するステップが、
(a)ラベルなし訓練データーのミニバッチを受け取るステップと、
(b)ミニバッチを使用して、前記生徒DNNモデルおよび前記教師DNNモデルにおける前記ミニバッチの順方向伝搬によって、前記教師DNNモデルの教師出力分布と、前記生徒DNNモデルの生徒出力分布とを判定するステップと、
(c)前記生徒出力分布対前記教師出力分布の評価を判定するステップであて、前記評価が誤差信号を含む、ステップと、
(d)前記評価に基づいて、前記生徒出力分布および前記教師出力分布が収束を達成したか否か判定するステップであって、
(i)前記生徒出力分布および前記教師出力分布が収束したと判定された場合、前記生徒DNNモデルを前記クライアント・デバイス上におけるデプロイメントのために供給するステップと、
(ii)前記生徒出力分布および前記教師出力分布が収束していないと判定された場合、前記判定された評価に基づいて、前記生徒DNNモデルを更新し、ステップ(a)から(d)までを繰り返すステップと、
を含む、コンピューター実装方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2014/086397 WO2016037350A1 (en) | 2014-09-12 | 2014-09-12 | Learning student dnn via output distribution |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017531255A true JP2017531255A (ja) | 2017-10-19 |
JP6612855B2 JP6612855B2 (ja) | 2019-11-27 |
Family
ID=55455064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513728A Expired - Fee Related JP6612855B2 (ja) | 2014-09-12 | 2014-09-12 | 出力分布による生徒dnnの学習 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11429860B2 (ja) |
EP (1) | EP3192012A4 (ja) |
JP (1) | JP6612855B2 (ja) |
CN (1) | CN106170800A (ja) |
BR (1) | BR112017003893A8 (ja) |
RU (1) | RU2666631C2 (ja) |
WO (1) | WO2016037350A1 (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019028746A (ja) * | 2017-07-31 | 2019-02-21 | 株式会社東芝 | ネットワーク係数圧縮装置、ネットワーク係数圧縮方法およびプログラム |
WO2019116985A1 (ja) * | 2017-12-13 | 2019-06-20 | 日立オートモティブシステムズ株式会社 | 演算システム、サーバ、車載装置 |
WO2019138897A1 (ja) * | 2018-01-10 | 2019-07-18 | ソニー株式会社 | 学習装置および方法、並びにプログラム |
JP2019133626A (ja) * | 2018-01-29 | 2019-08-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及び情報処理システム |
JP2019159654A (ja) * | 2018-03-12 | 2019-09-19 | 国立研究開発法人情報通信研究機構 | 時系列情報の学習システム、方法およびニューラルネットワークモデル |
WO2019235311A1 (ja) * | 2018-06-06 | 2019-12-12 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及びIoTデバイス |
JP2020027604A (ja) * | 2018-08-09 | 2020-02-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法、及び情報処理システム |
JP2020201727A (ja) * | 2019-06-11 | 2020-12-17 | 株式会社デンソーアイティーラボラトリ | 品質管理方法 |
JPWO2021044591A1 (ja) * | 2019-09-05 | 2021-03-11 | ||
WO2021111831A1 (ja) * | 2019-12-06 | 2021-06-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理システム及び情報処理装置 |
WO2021111832A1 (ja) * | 2019-12-06 | 2021-06-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理システム及び情報処理装置 |
JP2022006174A (ja) * | 2021-03-25 | 2022-01-12 | 北京百度網訊科技有限公司 | モデルをトレーニングするための方法、装置、デバイス、媒体、およびプログラム製品 |
JP7464560B2 (ja) | 2021-03-30 | 2024-04-09 | Kddi株式会社 | 骨格推定装置、端末、サーバ及びプログラム |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10417525B2 (en) | 2014-09-22 | 2019-09-17 | Samsung Electronics Co., Ltd. | Object recognition with reduced neural network weight precision |
US11062228B2 (en) | 2015-07-06 | 2021-07-13 | Microsoft Technoiogy Licensing, LLC | Transfer learning techniques for disparate label sets |
JP6679898B2 (ja) * | 2015-11-24 | 2020-04-15 | 富士通株式会社 | キーワード検出装置、キーワード検出方法及びキーワード検出用コンピュータプログラム |
US9842106B2 (en) * | 2015-12-04 | 2017-12-12 | Mitsubishi Electric Research Laboratories, Inc | Method and system for role dependent context sensitive spoken and textual language understanding with neural networks |
CN105513591B (zh) * | 2015-12-21 | 2019-09-03 | 百度在线网络技术(北京)有限公司 | 用lstm循环神经网络模型进行语音识别的方法和装置 |
US9621678B1 (en) * | 2016-01-13 | 2017-04-11 | Linkedin Corporation | Delivering and displaying content feeds on smartwatch devices |
US10810482B2 (en) | 2016-08-30 | 2020-10-20 | Samsung Electronics Co., Ltd | System and method for residual long short term memories (LSTM) network |
US10466714B2 (en) * | 2016-09-01 | 2019-11-05 | Ford Global Technologies, Llc | Depth map estimation with stereo images |
WO2018051841A1 (ja) * | 2016-09-16 | 2018-03-22 | 日本電信電話株式会社 | モデル学習装置、その方法、及びプログラム |
US10255910B2 (en) * | 2016-09-16 | 2019-04-09 | Apptek, Inc. | Centered, left- and right-shifted deep neural networks and their combinations |
CN109952581A (zh) * | 2016-09-28 | 2019-06-28 | D5A1有限责任公司 | 用于机器学习系统的学习教练 |
JP2018060268A (ja) * | 2016-10-03 | 2018-04-12 | 株式会社日立製作所 | 認識装置および学習システム |
CA3040775A1 (en) * | 2016-10-18 | 2018-04-26 | Minute School Inc. | Systems and methods for providing tailored educational materials |
WO2018093926A1 (en) * | 2016-11-15 | 2018-05-24 | Google Llc | Semi-supervised training of neural networks |
KR20180070103A (ko) | 2016-12-16 | 2018-06-26 | 삼성전자주식회사 | 인식 방법 및 인식 장치 |
CN108243216B (zh) | 2016-12-26 | 2020-02-14 | 华为技术有限公司 | 数据处理的方法、端侧设备、云侧设备与端云协同系统 |
JP6690568B2 (ja) * | 2017-02-01 | 2020-04-28 | 株式会社デンソー | 能力評価システムおよび能力評価装置 |
US11620511B2 (en) | 2017-02-17 | 2023-04-04 | Canary Capital Llc | Solution for training a neural network system |
CN108461080A (zh) * | 2017-02-21 | 2018-08-28 | 中兴通讯股份有限公司 | 一种基于hlstm模型的声学建模方法和装置 |
US20180260695A1 (en) * | 2017-03-07 | 2018-09-13 | Qualcomm Incorporated | Neural network compression via weak supervision |
KR102399535B1 (ko) * | 2017-03-23 | 2022-05-19 | 삼성전자주식회사 | 음성 인식을 위한 학습 방법 및 장치 |
US11915152B2 (en) * | 2017-03-24 | 2024-02-27 | D5Ai Llc | Learning coach for machine learning system |
US10795836B2 (en) * | 2017-04-17 | 2020-10-06 | Microsoft Technology Licensing, Llc | Data processing performance enhancement for neural networks using a virtualized data iterator |
WO2018195848A1 (en) * | 2017-04-27 | 2018-11-01 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for route planning |
US11195093B2 (en) | 2017-05-18 | 2021-12-07 | Samsung Electronics Co., Ltd | Apparatus and method for student-teacher transfer learning network using knowledge bridge |
US11410044B2 (en) | 2017-05-20 | 2022-08-09 | Google Llc | Application development platform and software development kits that provide comprehensive machine learning services |
EP3602413B1 (en) | 2017-05-20 | 2022-10-19 | Google LLC | Projection neural networks |
US10885900B2 (en) | 2017-08-11 | 2021-01-05 | Microsoft Technology Licensing, Llc | Domain adaptation in speech recognition via teacher-student learning |
KR102036968B1 (ko) * | 2017-10-19 | 2019-10-25 | 한국과학기술원 | 전문화에 기반한 신뢰성 높은 딥러닝 앙상블 방법 및 장치 |
WO2019096754A1 (en) * | 2017-11-20 | 2019-05-23 | Koninklijke Philips N.V. | Training first and second neural network models |
US11328210B2 (en) * | 2017-12-29 | 2022-05-10 | Micron Technology, Inc. | Self-learning in distributed architecture for enhancing artificial neural network |
CN108228782B (zh) * | 2017-12-29 | 2020-04-21 | 山东科技大学 | 一种基于深度学习的隐含关系发现方法 |
EP3518152A1 (en) * | 2018-01-29 | 2019-07-31 | Panasonic Intellectual Property Corporation of America | Information processing method and information processing system |
US10643602B2 (en) * | 2018-03-16 | 2020-05-05 | Microsoft Technology Licensing, Llc | Adversarial teacher-student learning for unsupervised domain adaptation |
WO2019183144A1 (en) | 2018-03-19 | 2019-09-26 | Coffing Daniel L | Processing natural language arguments and propositions |
US10522038B2 (en) | 2018-04-19 | 2019-12-31 | Micron Technology, Inc. | Systems and methods for automatically warning nearby vehicles of potential hazards |
CN112602098A (zh) * | 2018-05-08 | 2021-04-02 | 谷歌有限责任公司 | 对比序列到序列数据选择器 |
GB2573809B (en) * | 2018-05-18 | 2020-11-04 | Emotech Ltd | Speaker Recognition |
US10699194B2 (en) * | 2018-06-01 | 2020-06-30 | DeepCube LTD. | System and method for mimicking a neural network without access to the original training dataset or the target model |
US11907854B2 (en) | 2018-06-01 | 2024-02-20 | Nano Dimension Technologies, Ltd. | System and method for mimicking a neural network without access to the original training dataset or the target model |
US10839791B2 (en) | 2018-06-27 | 2020-11-17 | International Business Machines Corporation | Neural network-based acoustic model with softening target-layer |
WO2020005471A1 (en) * | 2018-06-29 | 2020-01-02 | D5Ai Llc | Using back propagation computation as data |
US10460235B1 (en) * | 2018-07-06 | 2019-10-29 | Capital One Services, Llc | Data model generation using generative adversarial networks |
WO2020018279A1 (en) * | 2018-07-16 | 2020-01-23 | D5Ai Llc | Building ensembles for deep learning by parallel data splitting |
CA3106394C (en) * | 2018-07-16 | 2023-09-26 | Element Ai Inc. | Selecting unlabeled data objects to be processed |
US11610108B2 (en) | 2018-07-27 | 2023-03-21 | International Business Machines Corporation | Training of student neural network with switched teacher neural networks |
US11741355B2 (en) * | 2018-07-27 | 2023-08-29 | International Business Machines Corporation | Training of student neural network with teacher neural networks |
US10885277B2 (en) | 2018-08-02 | 2021-01-05 | Google Llc | On-device neural networks for natural language understanding |
US11094326B2 (en) * | 2018-08-06 | 2021-08-17 | Cisco Technology, Inc. | Ensemble modeling of automatic speech recognition output |
WO2020046719A1 (en) * | 2018-08-31 | 2020-03-05 | D5Ai Llc | Self-supervised back propagation for deep learning |
WO2020051500A1 (en) * | 2018-09-06 | 2020-03-12 | Coffing Daniel L | System for providing dialogue guidance |
EP3850781A4 (en) | 2018-09-14 | 2022-05-04 | Coffing, Daniel L. | FACT MANAGEMENT SYSTEM |
KR20200045128A (ko) * | 2018-10-22 | 2020-05-04 | 삼성전자주식회사 | 모델 학습 방법 및 장치, 및 데이터 인식 방법 |
CN111105008A (zh) * | 2018-10-29 | 2020-05-05 | 富士通株式会社 | 模型训练方法、数据识别方法和数据识别装置 |
CN111144574B (zh) * | 2018-11-06 | 2023-03-24 | 北京嘀嘀无限科技发展有限公司 | 使用指导者模型训练学习者模型的人工智能系统和方法 |
EP3884434A4 (en) * | 2018-11-19 | 2022-10-19 | Deeplite Inc. | SYSTEM AND METHOD FOR DETERMINING AUTOMATED DESIGN SPACE FOR DEEP NEURAL NETWORKS |
CN109783824B (zh) * | 2018-12-17 | 2023-04-18 | 北京百度网讯科技有限公司 | 基于翻译模型的翻译方法、装置及存储介质 |
KR20200084431A (ko) * | 2018-12-26 | 2020-07-13 | 삼성전자주식회사 | 신경망 기반의 데이터 처리 방법, 신경망 트레이닝 방법 및 그 장치들 |
DE102019101617A1 (de) * | 2019-01-23 | 2020-07-23 | Rockwell Collins Deutschland Gmbh | Vorrichtung und Verfahren zum Trainieren eines Neuronalen Netzwerks |
JP7261022B2 (ja) * | 2019-01-30 | 2023-04-19 | キヤノン株式会社 | 情報処理システム、端末装置及びその制御方法、プログラム、記憶媒体 |
US11410475B2 (en) | 2019-01-31 | 2022-08-09 | Micron Technology, Inc. | Autonomous vehicle data recorders |
US11373466B2 (en) | 2019-01-31 | 2022-06-28 | Micron Technology, Inc. | Data recorders of autonomous vehicles |
US11526680B2 (en) | 2019-02-14 | 2022-12-13 | Google Llc | Pre-trained projection networks for transferable natural language representations |
US11694088B2 (en) * | 2019-03-13 | 2023-07-04 | Cortica Ltd. | Method for object detection using knowledge distillation |
KR102033136B1 (ko) * | 2019-04-03 | 2019-10-16 | 주식회사 루닛 | 준지도 학습 기반의 기계학습 방법 및 그 장치 |
CN110009052B (zh) * | 2019-04-11 | 2022-11-18 | 腾讯科技(深圳)有限公司 | 一种图像识别的方法、图像识别模型训练的方法及装置 |
US11170789B2 (en) * | 2019-04-16 | 2021-11-09 | Microsoft Technology Licensing, Llc | Attentive adversarial domain-invariant training |
US11586930B2 (en) * | 2019-04-16 | 2023-02-21 | Microsoft Technology Licensing, Llc | Conditional teacher-student learning for model training |
US11790264B2 (en) * | 2019-06-19 | 2023-10-17 | Google Llc | Systems and methods for performing knowledge distillation |
US11017177B2 (en) * | 2019-06-27 | 2021-05-25 | Conduent Business Services, Llc | Neural network systems and methods for target identification from text |
US11928587B2 (en) | 2019-08-14 | 2024-03-12 | Google Llc | Base station-user equipment messaging regarding deep neural networks |
US11755884B2 (en) | 2019-08-20 | 2023-09-12 | Micron Technology, Inc. | Distributed machine learning with privacy protection |
US11636334B2 (en) | 2019-08-20 | 2023-04-25 | Micron Technology, Inc. | Machine learning with feature obfuscation |
US11392796B2 (en) | 2019-08-20 | 2022-07-19 | Micron Technology, Inc. | Feature dictionary for bandwidth enhancement |
WO2021045748A1 (en) | 2019-09-04 | 2021-03-11 | Google Llc | Neural network formation configuration feedback for wireless communications |
US20210117799A1 (en) * | 2019-10-17 | 2021-04-22 | EMC IP Holding Company LLC | Monitoring performance of a storage system using paired neural networks |
KR20210060146A (ko) | 2019-11-18 | 2021-05-26 | 삼성전자주식회사 | 딥 뉴럴 네트워크 모델을 이용한 데이터 처리 방법 및 장치, 딥 뉴럴 네트워크 모델을 학습시키는 학습 방법 및 장치 |
US11886991B2 (en) | 2019-11-27 | 2024-01-30 | Google Llc | Machine-learning architectures for broadcast and multicast communications |
US11487944B1 (en) * | 2019-12-09 | 2022-11-01 | Asapp, Inc. | System, method, and computer program for obtaining a unified named entity recognition model with the collective predictive capabilities of teacher models with different tag sets using marginal distillation |
CN112949671B (zh) * | 2019-12-11 | 2023-06-30 | 中国科学院声学研究所 | 一种基于无监督特征优化的信号分类方法及系统 |
US11689940B2 (en) * | 2019-12-13 | 2023-06-27 | Google Llc | Machine-learning architectures for simultaneous connection to multiple carriers |
JP7396040B2 (ja) * | 2019-12-27 | 2023-12-12 | 日本電気株式会社 | 画像分析装置、画像分析方法及びコンピュータプログラム |
US11797565B2 (en) | 2019-12-30 | 2023-10-24 | Paypal, Inc. | Data validation using encode values |
US11687778B2 (en) | 2020-01-06 | 2023-06-27 | The Research Foundation For The State University Of New York | Fakecatcher: detection of synthetic portrait videos using biological signals |
US11900260B2 (en) * | 2020-03-05 | 2024-02-13 | Huawei Technologies Co., Ltd. | Methods, devices and media providing an integrated teacher-student system |
US20210295171A1 (en) * | 2020-03-19 | 2021-09-23 | Nvidia Corporation | Future trajectory predictions in multi-actor environments for autonomous machine applications |
US20210334644A1 (en) * | 2020-04-27 | 2021-10-28 | Nvidia Corporation | Neural network training technique |
US11669428B2 (en) * | 2020-05-19 | 2023-06-06 | Paypal, Inc. | Detection of matching datasets using encode values |
US11663472B2 (en) | 2020-06-29 | 2023-05-30 | Google Llc | Deep neural network processing for a user equipment-coordination set |
CN111754985B (zh) * | 2020-07-06 | 2023-05-02 | 上海依图信息技术有限公司 | 一种语音识别模型的训练以及语音识别的方法和装置 |
US11961003B2 (en) | 2020-07-08 | 2024-04-16 | Nano Dimension Technologies, Ltd. | Training a student neural network to mimic a mentor neural network with inputs that maximize student-to-mentor disagreement |
CN112183577A (zh) * | 2020-08-31 | 2021-01-05 | 华为技术有限公司 | 一种半监督学习模型的训练方法、图像处理方法及设备 |
CN112487899B (zh) * | 2020-11-19 | 2023-04-07 | 武汉高德飞行器科技有限公司 | 基于无人机的目标识别方法、系统、存储介质及电子设备 |
CN112528109B (zh) * | 2020-12-01 | 2023-10-27 | 科大讯飞(北京)有限公司 | 一种数据分类方法、装置、设备及存储介质 |
US11792501B2 (en) | 2020-12-17 | 2023-10-17 | Motorola Solutions, Inc. | Device, method and system for installing video analytics parameters at a video analytics engine |
CN112819155B (zh) * | 2021-01-22 | 2022-09-16 | 中国人民解放军国防科技大学 | 应用于边缘设备的深度神经网络模型分级压缩方法及装置 |
US20220292345A1 (en) * | 2021-03-12 | 2022-09-15 | Nec Corporation | Distributionally robust model training |
US11521639B1 (en) | 2021-04-02 | 2022-12-06 | Asapp, Inc. | Speech sentiment analysis using a speech sentiment classifier pretrained with pseudo sentiment labels |
US20220335303A1 (en) * | 2021-04-16 | 2022-10-20 | Md Akmal Haidar | Methods, devices and media for improving knowledge distillation using intermediate representations |
US20220355211A1 (en) * | 2021-05-04 | 2022-11-10 | Sony Interactive Entertainment Inc. | Controller action recognition from video frames using machine learning |
CN113450612B (zh) * | 2021-05-17 | 2022-10-28 | 云南电网有限责任公司 | 一种应用于继电保护培训的成套教学装置的开发方法 |
US11763803B1 (en) | 2021-07-28 | 2023-09-19 | Asapp, Inc. | System, method, and computer program for extracting utterances corresponding to a user problem statement in a conversation between a human agent and a user |
US20230040181A1 (en) * | 2021-08-03 | 2023-02-09 | Samsung Electronics Co., Ltd. | System and method for improving named entity recognition |
US20230368786A1 (en) * | 2022-05-12 | 2023-11-16 | Samsung Electronics Co., Ltd. | System and method for accent-agnostic frame-level wake word detection |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7835910B1 (en) * | 2003-05-29 | 2010-11-16 | At&T Intellectual Property Ii, L.P. | Exploiting unlabeled utterances for spoken language understanding |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100486735B1 (ko) | 2003-02-28 | 2005-05-03 | 삼성전자주식회사 | 최적구획 분류신경망 구성방법과 최적구획 분류신경망을이용한 자동 레이블링방법 및 장치 |
US7280987B2 (en) | 2004-03-26 | 2007-10-09 | Halliburton Energy Services, Inc. | Genetic algorithm based selection of neural network ensemble for processing well logging data |
US7613665B2 (en) | 2005-06-24 | 2009-11-03 | Halliburton Energy Services, Inc. | Ensembles of neural networks with different input sets |
US20070083365A1 (en) * | 2005-10-06 | 2007-04-12 | Dts, Inc. | Neural network classifier for separating audio sources from a monophonic audio signal |
US9916538B2 (en) * | 2012-09-15 | 2018-03-13 | Z Advanced Computing, Inc. | Method and system for feature detection |
US9418334B2 (en) | 2012-12-06 | 2016-08-16 | Nuance Communications, Inc. | Hybrid pre-training of deep belief networks |
CN103971690A (zh) * | 2013-01-28 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 一种声纹识别方法和装置 |
CN103456299B (zh) * | 2013-08-01 | 2016-06-15 | 百度在线网络技术(北京)有限公司 | 一种控制语音识别的方法和装置 |
CN103400577B (zh) * | 2013-08-01 | 2015-09-16 | 百度在线网络技术(北京)有限公司 | 多语种语音识别的声学模型建立方法和装置 |
CN103544705B (zh) * | 2013-10-25 | 2016-03-02 | 华南理工大学 | 一种基于深度卷积神经网络的图像质量测试方法 |
CN103886305B (zh) * | 2014-04-08 | 2017-01-25 | 中国人民解放军国防科学技术大学 | 面向基层治安、维稳及反恐的特异人脸搜索方法 |
CN103955702B (zh) * | 2014-04-18 | 2017-02-15 | 西安电子科技大学 | 基于深度rbf网络的sar图像地物分类方法 |
CN103945533B (zh) * | 2014-05-15 | 2016-08-31 | 济南嘉科电子技术有限公司 | 基于大数据的无线实时位置定位方法 |
US9653093B1 (en) * | 2014-08-19 | 2017-05-16 | Amazon Technologies, Inc. | Generative modeling of speech using neural networks |
-
2014
- 2014-09-12 BR BR112017003893A patent/BR112017003893A8/pt not_active IP Right Cessation
- 2014-09-12 WO PCT/CN2014/086397 patent/WO2016037350A1/en active Application Filing
- 2014-09-12 JP JP2017513728A patent/JP6612855B2/ja not_active Expired - Fee Related
- 2014-09-12 RU RU2017107352A patent/RU2666631C2/ru active
- 2014-09-12 CN CN201480068343.XA patent/CN106170800A/zh active Pending
- 2014-09-12 EP EP14901677.6A patent/EP3192012A4/en not_active Ceased
-
2015
- 2015-09-14 US US14/853,485 patent/US11429860B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7835910B1 (en) * | 2003-05-29 | 2010-11-16 | At&T Intellectual Property Ii, L.P. | Exploiting unlabeled utterances for spoken language understanding |
Non-Patent Citations (1)
Title |
---|
LEI JIMMY BA, RICH CARUANA: "Do Deep Nets Really Need to be Deep?", ARXIV:1312.6184, vol. v5, JPN7018002952, 21 February 2014 (2014-02-21), US, pages 1 - 6, XP055314937 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019028746A (ja) * | 2017-07-31 | 2019-02-21 | 株式会社東芝 | ネットワーク係数圧縮装置、ネットワーク係数圧縮方法およびプログラム |
WO2019116985A1 (ja) * | 2017-12-13 | 2019-06-20 | 日立オートモティブシステムズ株式会社 | 演算システム、サーバ、車載装置 |
JP2019106059A (ja) * | 2017-12-13 | 2019-06-27 | 日立オートモティブシステムズ株式会社 | 演算システム、サーバ、車載装置 |
US11427141B2 (en) | 2017-12-13 | 2022-08-30 | Hitachi Astemo, Ltd. | Computing system, server and on-vehicle device |
WO2019138897A1 (ja) * | 2018-01-10 | 2019-07-18 | ソニー株式会社 | 学習装置および方法、並びにプログラム |
JP7058202B2 (ja) | 2018-01-29 | 2022-04-21 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法及び情報処理システム |
JP2019133626A (ja) * | 2018-01-29 | 2019-08-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及び情報処理システム |
JP2019159654A (ja) * | 2018-03-12 | 2019-09-19 | 国立研究開発法人情報通信研究機構 | 時系列情報の学習システム、方法およびニューラルネットワークモデル |
JP7070894B2 (ja) | 2018-03-12 | 2022-05-18 | 国立研究開発法人情報通信研究機構 | 時系列情報の学習システム、方法およびニューラルネットワークモデル |
WO2019235311A1 (ja) * | 2018-06-06 | 2019-12-12 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及びIoTデバイス |
JP7171478B2 (ja) | 2018-08-09 | 2022-11-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、及び情報処理システム |
JP2020027604A (ja) * | 2018-08-09 | 2020-02-20 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法、及び情報処理システム |
JP7161974B2 (ja) | 2019-06-11 | 2022-10-27 | 株式会社デンソーアイティーラボラトリ | 品質管理方法 |
JP2020201727A (ja) * | 2019-06-11 | 2020-12-17 | 株式会社デンソーアイティーラボラトリ | 品質管理方法 |
JPWO2021044591A1 (ja) * | 2019-09-05 | 2021-03-11 | ||
JP7405145B2 (ja) | 2019-09-05 | 2023-12-26 | 日本電気株式会社 | モデル生成装置、モデル生成方法、及び、プログラム |
WO2021111832A1 (ja) * | 2019-12-06 | 2021-06-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理システム及び情報処理装置 |
WO2021111831A1 (ja) * | 2019-12-06 | 2021-06-10 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 情報処理方法、情報処理システム及び情報処理装置 |
JP2022006174A (ja) * | 2021-03-25 | 2022-01-12 | 北京百度網訊科技有限公司 | モデルをトレーニングするための方法、装置、デバイス、媒体、およびプログラム製品 |
JP7291183B2 (ja) | 2021-03-25 | 2023-06-14 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | モデルをトレーニングするための方法、装置、デバイス、媒体、およびプログラム製品 |
JP7464560B2 (ja) | 2021-03-30 | 2024-04-09 | Kddi株式会社 | 骨格推定装置、端末、サーバ及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US11429860B2 (en) | 2022-08-30 |
CN106170800A (zh) | 2016-11-30 |
EP3192012A4 (en) | 2018-01-17 |
US20160078339A1 (en) | 2016-03-17 |
BR112017003893A2 (pt) | 2017-12-05 |
BR112017003893A8 (pt) | 2017-12-26 |
WO2016037350A1 (en) | 2016-03-17 |
RU2017107352A (ru) | 2018-09-07 |
JP6612855B2 (ja) | 2019-11-27 |
EP3192012A1 (en) | 2017-07-19 |
RU2017107352A3 (ja) | 2018-09-07 |
RU2666631C2 (ru) | 2018-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6612855B2 (ja) | 出力分布による生徒dnnの学習 | |
US11144831B2 (en) | Regularized neural network architecture search | |
US20210256403A1 (en) | Recommendation method and apparatus | |
US10546066B2 (en) | End-to-end learning of dialogue agents for information access | |
CN109859743B (zh) | 音频识别方法、系统和机器设备 | |
CN110443351B (zh) | 生成映像的自然语言描述 | |
US9818409B2 (en) | Context-dependent modeling of phonemes | |
WO2018211140A1 (en) | Data efficient imitation of diverse behaviors | |
CN107112005A (zh) | 深度神经支持向量机 | |
US20140164299A1 (en) | Hybrid pre-training of deep belief networks | |
EP3766019A1 (en) | Hybrid quantum-classical generative modes for learning data distributions | |
CN108604311B (zh) | 利用层级式外部存储器的增强神经网络 | |
CN111989696A (zh) | 具有顺序学习任务的域中的可扩展持续学习的神经网络 | |
US10832036B2 (en) | Meta-learning for facial recognition | |
Dimitriadis et al. | Federated transfer learning with dynamic gradient aggregation | |
CN114626518A (zh) | 使用深度聚类的知识蒸馏 | |
US11875809B2 (en) | Speech denoising via discrete representation learning | |
US11488007B2 (en) | Building of custom convolution filter for a neural network using an automated evolutionary process | |
US20210042625A1 (en) | Performance of neural networks using learned specialized transformation functions | |
US20220414445A1 (en) | Neural networks with analog and digital modules | |
US11443748B2 (en) | Metric learning of speaker diarization | |
KR20230141828A (ko) | 적응형 그래디언트 클리핑을 사용하는 신경 네트워크들 | |
US20240020553A1 (en) | Interactive electronic device for performing functions of providing responses to questions from users and real-time conversation with the users using models learned by deep learning technique and operating method thereof | |
WO2023014373A1 (en) | System and methods for training machine-learned models for use in computing environments with limited resources | |
KR20200063315A (ko) | 음성 인식을 위한 음향 모델 학습 장치 및 그 학습 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170815 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20171004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191002 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6612855 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |