JP2023550725A - 効率的なトレーニングのための可変長入力による半ソートバッチ処理 - Google Patents
効率的なトレーニングのための可変長入力による半ソートバッチ処理 Download PDFInfo
- Publication number
- JP2023550725A JP2023550725A JP2023528496A JP2023528496A JP2023550725A JP 2023550725 A JP2023550725 A JP 2023550725A JP 2023528496 A JP2023528496 A JP 2023528496A JP 2023528496 A JP2023528496 A JP 2023528496A JP 2023550725 A JP2023550725 A JP 2023550725A
- Authority
- JP
- Japan
- Prior art keywords
- length
- samples
- variable length
- training
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 62
- 238000012545 processing Methods 0.000 title description 42
- 238000000034 method Methods 0.000 claims abstract description 17
- 238000013528 artificial neural network Methods 0.000 claims abstract description 9
- 238000010801 machine learning Methods 0.000 claims description 57
- 238000009826 distribution Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 8
- 238000010200 validation analysis Methods 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 5
- 238000003058 natural language processing Methods 0.000 claims description 5
- 238000003786 synthesis reaction Methods 0.000 claims description 5
- 230000003094 perturbing effect Effects 0.000 claims description 3
- 238000009827 uniform distribution Methods 0.000 claims description 3
- 238000010923 batch production Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 6
- 230000015654 memory Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 241001112258 Moca Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
- Character Discrimination (AREA)
Abstract
Description
Claims (20)
- 一時的信号ではない少なくとも1つのコンピュータストレージであって、少なくとも1つのプロセッサによって、
各機械学習(ML)トレーニングサンプルの長さの各数値表現をランダムに摂動させて、各疑似長を確立し、
前記MLトレーニングサンプルを疑似長によってソートし、かつ、
前記MLトレーニングサンプルの前記ソートから導出されたMLトレーニングサンプルのバッチを入力することによって少なくとも1つのMLモデルをトレーニングする
ように実行可能な命令を含む、前記コンピュータストレージ
を含む、デバイス。 - 前記命令が、前記MLトレーニングサンプルの少なくとも一部の長さの各数値表現をランダムに摂動させるように実行可能である、請求項1に記載のデバイス。
- 前記命令が、前記MLトレーニングサンプルのすべての長さの各数値表現をランダムに摂動させるように実行可能である、請求項1に記載のデバイス。
- 前記MLトレーニングサンプルが可変長を有する、請求項1に記載のデバイス。
- 前記MLサンプルが可変長波形を含み、前記MLモデルが自動音声認識(ASR)用に構成される、請求項4に記載のデバイス。
- 前記MLサンプルが可変長のフレーズを含み、前記MLモデルが自然言語処理用に構成される、請求項4に記載のデバイス。
- 前記MLサンプルが可変長のテキスト文字列を含み、前記MLモデルが音声合成用に構成される、請求項4に記載のデバイス。
- 前記命令が、それぞれの各数値表現にランダム化された各値を追加することによって少なくとも部分的に、長さの前記各数値表現をランダムに摂動させるように実行可能である、請求項1に記載のデバイス。
- ランダム化された各値が、前記MLサンプルの中の最長サンプル長と最短サンプル長との差の2分の1を引いたものと、前記最長サンプル長と前記最短サンプル長との前記差の2分の1を足したものとの間の値の分布からランダムに選択される、請求項8に記載のデバイス。
- ランダム化された各値が、前記最長サンプル長と前記最短サンプル長との前記差の2分の1を引いたものと、前記最長サンプル長と前記最短サンプル長との前記差の2分の1を足したものとの間の値の前記分布にランダム化係数を乗じたものからランダムに選択される、請求項9に記載のデバイス。
- 前記値の分布が、平均ゼロである、請求項9に記載のデバイス。
- 前記分布が均一な分布である、請求項11に記載のデバイス。
- 前記命令を実行する前記少なくとも1つのプロセッサを含む、請求項1に記載のデバイス。
- 擬似長をレンダリングするために、可変長トレーニングサンプルの実際の長さをランダムに摂動させることと、
可変長トレーニングサンプルの配置をレンダリングするために前記疑似長を使用して前記可変長トレーニングサンプルを配置することと、
可変長トレーニングサンプルの前記配置を使用して、少なくとも1つの機械学習(ML)モデルをトレーニングすることと
を含む、方法。 - 非訓練データからの予測をレンダリングするために前記MLモデルを使用することを含む、請求項14に記載の方法。
- 前記可変長トレーニングサンプルが可変長波形を含み、前記MLモデルが自動音声認識(ASR)のために構成される、請求項14に記載の方法。
- 前記可変長トレーニングサンプルが可変長のフレーズを含み、前記MLモデルが自然言語処理用に構成される、請求項14に記載の方法。
- 前記可変長トレーニングサンプルが可変長テキスト文字列を含み、前記MLモデルが音声合成用に構成される、請求項14に記載の方法。
- 少なくとも1つのプロセッサであって、
実サンプル長とランダム化された長さの各組み合わせに基づいて、各長さごとに複数の可変長サンプルを配置し、
トレーニングフェーズ、推論フェーズ、検証フェーズ、またはテスト、推論、及び検証の任意の組み合わせで、それぞれの各長さごとに配置された前記可変長サンプルを少なくとも1つのニューラルネットワークに入力し、かつ、
前記サンプルに少なくとも部分的に基づいて、前記少なくとも1つのニューラルネットワークを実行する
ように適合された、前記少なくとも1つのプロセッサ
を含む、装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063113164P | 2020-11-12 | 2020-11-12 | |
US63/113,164 | 2020-11-12 | ||
US17/107,362 US11615782B2 (en) | 2020-11-12 | 2020-11-30 | Semi-sorted batching with variable length input for efficient training |
US17/107,362 | 2020-11-30 | ||
PCT/US2021/058848 WO2022103884A1 (en) | 2020-11-12 | 2021-11-10 | Semi-sorted batching with variable length input for efficient training |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023550725A true JP2023550725A (ja) | 2023-12-05 |
JP7544975B2 JP7544975B2 (ja) | 2024-09-03 |
Family
ID=81454650
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023528496A Active JP7544975B2 (ja) | 2020-11-12 | 2021-11-10 | 効率的なトレーニングのための可変長入力による半ソートバッチ処理 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11615782B2 (ja) |
EP (1) | EP4244845A4 (ja) |
JP (1) | JP7544975B2 (ja) |
CN (1) | CN116670695A (ja) |
WO (1) | WO2022103884A1 (ja) |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7630986B1 (en) * | 1999-10-27 | 2009-12-08 | Pinpoint, Incorporated | Secure data interchange |
WO2002057946A1 (en) * | 2001-01-18 | 2002-07-25 | The Board Of Trustees Of The University Of Illinois | Method for optimizing a solution set |
US7729889B2 (en) * | 2005-11-15 | 2010-06-01 | Agilent Technologies, Inc. | Random sample timing method and system using same |
US7853081B2 (en) * | 2007-04-02 | 2010-12-14 | British Telecommunications Public Limited Company | Identifying data patterns |
US9183237B2 (en) * | 2008-07-10 | 2015-11-10 | Nodality, Inc. | Methods and apparatus related to gate boundaries within a data space |
JP2011059815A (ja) | 2009-09-07 | 2011-03-24 | Sony Corp | 情報処理装置、情報処理方法、及び、プログラム |
US8965822B2 (en) * | 2011-05-11 | 2015-02-24 | Ari M. Frank | Discovering and classifying situations that influence affective response |
US9047568B1 (en) * | 2012-09-20 | 2015-06-02 | Brain Corporation | Apparatus and methods for encoding of sensory data using artificial spiking neurons |
US9292789B2 (en) * | 2012-03-02 | 2016-03-22 | California Institute Of Technology | Continuous-weight neural networks |
US20170212210A1 (en) * | 2014-07-17 | 2017-07-27 | Origin Wireless, Inc. | Wireless positioning systems |
US9002102B2 (en) * | 2012-12-21 | 2015-04-07 | Hewlett-Packard Development Company, L.P. | Generating training documents |
KR102160659B1 (ko) * | 2013-03-18 | 2020-09-28 | 더 트러스티스 오브 컬럼비아 유니버시티 인 더 시티 오브 뉴욕 | 하드웨어-기반 마이크로-아키텍처 데이터를 이용한 이상 프로그램 실행의 검출 |
CN105247532B (zh) * | 2013-03-18 | 2019-05-31 | 纽约市哥伦比亚大学理事会 | 使用硬件特征的对异常进程的无监督的检测 |
US9317252B2 (en) | 2013-10-25 | 2016-04-19 | Ixia | Methods, systems, and computer readable media for selecting numbers from multiple ranges |
US10062035B1 (en) | 2013-12-12 | 2018-08-28 | Google Llc | Using variable length representations for machine learning statistics |
WO2016029172A1 (en) * | 2014-08-22 | 2016-02-25 | D-Wave Systems Inc. | Systems and methods for problem solving, useful for example in quantum computing |
US10031887B2 (en) * | 2014-09-09 | 2018-07-24 | D-Wave Systems Inc. | Systems and methods for improving the performance of a quantum processor via reduced readouts |
CN106485192B (zh) | 2015-09-02 | 2019-12-06 | 富士通株式会社 | 用于图像识别的神经网络的训练方法和装置 |
US11698990B2 (en) * | 2016-04-29 | 2023-07-11 | Privitar Limited | Computer-implemented privacy engineering system and method |
US10034407B2 (en) | 2016-07-22 | 2018-07-24 | Intel Corporation | Storage sled for a data center |
US9972339B1 (en) * | 2016-08-04 | 2018-05-15 | Amazon Technologies, Inc. | Neural network based beam selection |
WO2018075400A1 (en) * | 2016-10-19 | 2018-04-26 | Sas Institute Inc. | Advanced control systems for machines |
US10013441B1 (en) * | 2017-02-13 | 2018-07-03 | Sas Institute Inc. | Distributed data set indexing |
US10769522B2 (en) * | 2017-02-17 | 2020-09-08 | Wipro Limited | Method and system for determining classification of text |
US11361763B1 (en) * | 2017-09-01 | 2022-06-14 | Amazon Technologies, Inc. | Detecting system-directed speech |
US10943171B2 (en) * | 2017-09-01 | 2021-03-09 | Facebook, Inc. | Sparse neural network training optimization |
US10679129B2 (en) * | 2017-09-28 | 2020-06-09 | D5Ai Llc | Stochastic categorical autoencoder network |
WO2019099494A1 (en) * | 2017-11-14 | 2019-05-23 | Tagnos, Inc. | Use of historic and contemporary tracking data to improve healthcare facility operations |
US10628124B2 (en) * | 2018-03-22 | 2020-04-21 | Advanced Micro Devices, Inc. | Stochastic rounding logic |
US11294944B2 (en) * | 2018-06-03 | 2022-04-05 | Apple Inc. | Correction and completion of search queries |
WO2019241619A1 (en) * | 2018-06-14 | 2019-12-19 | Behavioral Signal Technologies, Inc. | Deep actionable behavioral profiling and shaping |
US11392828B2 (en) * | 2018-09-24 | 2022-07-19 | Salesforce.Com, Inc. | Case object context embeddings for machine learning training of case context |
US11170761B2 (en) * | 2018-12-04 | 2021-11-09 | Sorenson Ip Holdings, Llc | Training of speech recognition systems |
US11106789B2 (en) * | 2019-03-05 | 2021-08-31 | Microsoft Technology Licensing, Llc | Dynamic cybersecurity detection of sequence anomalies |
US10930263B1 (en) * | 2019-03-28 | 2021-02-23 | Amazon Technologies, Inc. | Automatic voice dubbing for media content localization |
US11615305B2 (en) * | 2019-05-22 | 2023-03-28 | Royal Bank Of Canada | System and method for machine learning architecture with variational hyper-RNN |
US11436302B2 (en) * | 2019-06-07 | 2022-09-06 | International Business Machines Corporation | Electronic system for computing items of an outer product matrix |
US11671263B2 (en) * | 2019-08-30 | 2023-06-06 | T-Mobile Usa, Inc. | Cryptographically securing data files in a collaborative environment |
CN110556100B (zh) | 2019-09-10 | 2021-09-17 | 思必驰科技股份有限公司 | 端到端语音识别模型的训练方法及系统 |
CN112488742A (zh) * | 2019-09-12 | 2021-03-12 | 北京三星通信技术研究有限公司 | 用户属性信息的预测方法、装置、电子设备及存储介质 |
CN110992974B (zh) * | 2019-11-25 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 语音识别方法、装置、设备以及计算机可读存储介质 |
US11875116B2 (en) * | 2019-12-20 | 2024-01-16 | Intuit Inc. | Machine learning models with improved semantic awareness |
US10761809B1 (en) * | 2020-03-12 | 2020-09-01 | Katholieke Universiteit Leuven | Random number generator |
US11586652B2 (en) * | 2020-05-18 | 2023-02-21 | International Business Machines Corporation | Variable-length word embedding |
US11587620B2 (en) * | 2020-06-05 | 2023-02-21 | Samsung Electronics Co., Ltd. | Automatic program voltage selection network |
US11853793B2 (en) * | 2020-10-09 | 2023-12-26 | Samsung Electronics Co., Ltd. | Methods and system for on-device AI model parameter run-time protection |
US11442995B2 (en) * | 2020-10-21 | 2022-09-13 | Servicenow, Inc. | Filtering of log search results based on automated analysis |
US11960993B2 (en) * | 2020-11-10 | 2024-04-16 | Equifax Inc. | Machine-learning techniques involving monotonic recurrent neural networks |
-
2020
- 2020-11-30 US US17/107,362 patent/US11615782B2/en active Active
-
2021
- 2021-11-10 WO PCT/US2021/058848 patent/WO2022103884A1/en active Application Filing
- 2021-11-10 CN CN202180076665.9A patent/CN116670695A/zh active Pending
- 2021-11-10 EP EP21892762.2A patent/EP4244845A4/en active Pending
- 2021-11-10 JP JP2023528496A patent/JP7544975B2/ja active Active
-
2023
- 2023-03-23 US US18/189,145 patent/US11915685B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20230326452A1 (en) | 2023-10-12 |
WO2022103884A1 (en) | 2022-05-19 |
US11615782B2 (en) | 2023-03-28 |
US20220148569A1 (en) | 2022-05-12 |
US11915685B2 (en) | 2024-02-27 |
CN116670695A (zh) | 2023-08-29 |
EP4244845A1 (en) | 2023-09-20 |
EP4244845A4 (en) | 2024-09-04 |
JP7544975B2 (ja) | 2024-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017166449A1 (zh) | 机器学习模型生成方法和装置 | |
KR20210090123A (ko) | 분산형 모델 트레이닝 방법, 관련 장치 및 컴퓨터 프로그램 | |
WO2019108923A1 (en) | Neural architecture search using a performance prediction neural network | |
US12062227B2 (en) | Systems and methods for progressive learning for machine-learned models to optimize training speed | |
WO2019084560A1 (en) | SEARCH FOR NEURONAL ARCHITECTURES | |
WO2023024252A1 (zh) | 网络模型训练方法、装置、电子设备及可读存储介质 | |
AU2021236965B2 (en) | Automatically generating diverse text | |
US20230080230A1 (en) | Method for generating federated learning model | |
EP4267267A1 (en) | Adaptive audio mixing | |
CN116821684B (zh) | 大语言模型的训练方法、装置、设备和介质 | |
WO2021052163A1 (zh) | 语音合成模型的生成方法、装置、设备及计算机可读存储介质 | |
WO2020106871A1 (en) | Image processing neural networks with dynamic filter activation | |
CN110415182B (zh) | 眼底oct影像增强方法、装置、设备及存储介质 | |
US20240152809A1 (en) | Efficient machine learning model architecture selection | |
JP7544975B2 (ja) | 効率的なトレーニングのための可変長入力による半ソートバッチ処理 | |
JP7096361B2 (ja) | ミニバッチ学習装置とその作動プログラム、作動方法、および画像処理装置 | |
JP2022028670A (ja) | 表示される認識テキストの決定方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム | |
CN116932707A (zh) | 使用神经网络生成会话响应 | |
US20240355101A1 (en) | Systems and Methods for Progressive Learning for Machine-Learned Models to Optimize Training Speed | |
JP7167355B2 (ja) | 学習装置、学習装置の作動方法、学習装置の作動プログラム | |
US20220108221A1 (en) | Systems And Methods For Parameter Sharing To Reduce Computational Costs Of Training Machine-Learned Models | |
US20200372407A1 (en) | Systems and Methods for Reducing Idleness in a Machine-Learning Training System Using Data Echoing | |
US20240355017A1 (en) | Text-Based Real Image Editing with Diffusion Models | |
WO2022015390A1 (en) | Hardware-optimized neural architecture search | |
KR20230118014A (ko) | 긴 문서 요약을 위한 모델 글로벌화 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230512 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7544975 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |