JP7167640B2 - 最適化装置、最適化方法、およびプログラム - Google Patents
最適化装置、最適化方法、およびプログラム Download PDFInfo
- Publication number
- JP7167640B2 JP7167640B2 JP2018210243A JP2018210243A JP7167640B2 JP 7167640 B2 JP7167640 B2 JP 7167640B2 JP 2018210243 A JP2018210243 A JP 2018210243A JP 2018210243 A JP2018210243 A JP 2018210243A JP 7167640 B2 JP7167640 B2 JP 7167640B2
- Authority
- JP
- Japan
- Prior art keywords
- signal processing
- parameter
- value
- evaluation
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims description 101
- 238000000034 method Methods 0.000 title claims description 43
- 238000012545 processing Methods 0.000 claims description 172
- 238000011156 evaluation Methods 0.000 claims description 64
- 230000006870 function Effects 0.000 description 7
- 230000015654 memory Effects 0.000 description 6
- 238000013500 data storage Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Stored Programmes (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
・雑音抑圧量
・雑音推定に用いる時定数
・音声の冒頭で雑音推定する場合の時間区間
・音声区間と非音声区間を分ける閾値
・出力ゲイン
・周波数分析の分解能
<構成>
図1に例示するように、本実施形態の最適化装置1は、制御部101、入力部102、定義ファイル記憶部103、初期化部104、パラメータファイル記憶部105、データ記憶部106、評価部107、最適化経過記憶部108、生成部109、コーディング部110、およびデコーディング部111を有する。最適化装置1は、制御部101の制御の下で各処理を実行する。
最適化処理の前提として、以下の事前処理が実行される。
パラメータの最適化処理の対象となる信号処理の対象データおよび終了条件が入力部102に入力され、データ記憶部106に格納される。最適化処理の対象となる信号処理の内容に限定はなく、パラメータによって処理内容が規定されるものであればどのようなものであってもよい。このような信号処理の例は、音声認識処理、音声信号強調処理、ノイズキャンセル処理、信号分離処理、画像認識処理、符号化処理、機械学習処理などである。また終了条件にも限定はない。例えば、最適化処理が所定時間以上実行されたこと、最適化処理が所定回数以上繰り返されたこと、信号処理の評価値の変化が所定値以下となったことなどを終了条件とする。
・信号処理用パラメータを構成する要素(パラメータ)である「パラメータ要素」の名前
・パラメータ要素の変数型
・信号処理用パラメータのうち、最適化処理によって値を変更するパラメータ要素とその値の最大値と最小値
・信号処理用パラメータのうち、値が固定されたパラメータ要素とその値
次に、図1から図3を参照し、本実施形態の最適化処理について説明する。
まず、最適化装置1(図1)の制御部101が、最適化処理の繰り返し回数(世代数)を表すループカウンタ値iを1に初期化する(ステップS101a)。
上述の実施形態では、信号処理用パラメータの属性を定義した定義ファイルを最適化装置1に入力し、初期化部104、コーディング部110、およびデコーディング部111が、この定義ファイルに基づいて、信号処理用パラメータの初期値の設定(ステップS104)、第1信号処理用パラメータ値から第1外部パラメータ値へのコーディング(ステップS110a)、および第2外部パラメータ値から第2信号処理用パラメータ値へのデコーディング(ステップS109c)を行った。このような構成により、信号処理用パラメータの構造ごとに初期化部104、コーディング部110、およびデコーディング部111を再設計する必要がなくなる。例えば、信号処理を行うソフトウェアを更改してパラメータ構造が変化した場合でも、初期化部104、コーディング部110、およびデコーディング部111を実装するアルゴリズムを更改する必要がない。すなわち、定義ファイルに定義された属性に従って各処理を実行するように、汎用的に初期化部104、コーディング部110、およびデコーディング部111を設計しておくことができ、定義ファイルを変更するだけで様々なデータ構造の信号処理用パラメータの最適化を行うことができる。
本発明は上述の実施形態に限定されるものではない。例えば、上述の実施形態では初期化部104が信号処理用パラメータの初期値を設定したが、信号処理用パラメータの初期値が人手で設定されてもよい。
107 評価部
109 生成部
110 コーディング部
111 デコーディング部
108 最適化経過記憶部
Claims (8)
- 信号処理を規定する信号処理用パラメータである第1信号処理用パラメータ値を用いた前記信号処理の評価結果を表す評価値を得る評価部と、
少なくとも、前記信号処理用パラメータの構造を規定した定義ファイルに基づき、前記第1信号処理用パラメータ値を、外部パラメータである第1外部パラメータ値に変換するコーディング部と、
前記評価値および前記第1外部パラメータ値に基づいて、前記第1外部パラメータ値と値の異なる前記外部パラメータである第2外部パラメータ値を生成する生成部と、
前記定義ファイルに基づき、前記第2外部パラメータ値を前記信号処理用パラメータである第2信号処理用パラメータ値に変換するデコーディング部と、
を有する最適化装置。 - 請求項1の最適化装置であって、
前記外部パラメータは、予め定められたメタヒューリスティクスな方法で最適化が可能なパラメータである、最適化装置。 - 請求項1または2の最適化装置であって、
前記デコーディング部で得られた前記第2信号処理用パラメータ値を新たな前記第1信号処理用パラメータ値に設定して、前記評価部の処理と前記コーディング部の処理と前記生成部の処理と前記デコーディング部の処理とを再び実行する、最適化装置。 - 請求項3の最適化装置であって、
前記第1信号処理用パラメータ値を用いた前記信号処理の前記評価値を蓄積する最適化経過記憶部を有し、
前記生成部は、前記最適化経過記憶部に蓄積された前記評価値に基づいて前記第2外部パラメータ値を生成する、最適化装置。 - 請求項4の最適化装置であって、
前記最適化経過記憶部は、
前記評価部の処理の繰り返し回数に対応する情報と、前記評価部の処理で用いられた前記第1信号処理用パラメータ値に対応する識別情報と、前記第1信号処理用パラメータ値を用いた前記信号処理の評価結果を表す前記評価値と、を対応付けて蓄積するか、または、
前記評価部の処理で用いられた前記第1信号処理用パラメータ値に対応し、かつ、前記評価部の処理の繰り返し回数を表す情報を含む識別情報と、前記第1信号処理用パラメータ値を用いた前記信号処理の評価結果を表す前記評価値と、を対応付けて蓄積する、
最適化装置。 - 請求項4または5の最適化装置であって、
前記最適化経過記憶部に蓄積された前記評価値を用い、前記評価部の処理と前記コーディング部の処理と前記生成部の処理と前記デコーディング部の処理とを実行する、最適化装置。 - 評価部が、信号処理を規定する信号処理用パラメータである第1信号処理用パラメータ値を用いた前記信号処理の評価結果を表す評価値を得る評価ステップと、
コーディング部が、少なくとも、前記信号処理用パラメータの構造を規定した定義ファイルに基づき、前記第1信号処理用パラメータ値を、外部パラメータである第1外部パラメータ値に変換するコーディングステップと、
生成部が、前記評価値および前記第1外部パラメータ値に基づいて、前記第1外部パラメータ値と値の異なる前記外部パラメータである第2外部パラメータ値を生成する生成ステップと、
デコーディング部が、前記定義ファイルに基づき、前記第2外部パラメータ値を前記信号処理用パラメータである第2信号処理用パラメータ値に変換するデコーディングステップと、
を有する最適化方法。 - 請求項1から6の何れかの最適化装置としてコンピュータを機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018210243A JP7167640B2 (ja) | 2018-11-08 | 2018-11-08 | 最適化装置、最適化方法、およびプログラム |
PCT/JP2019/041821 WO2020095707A1 (ja) | 2018-11-08 | 2019-10-25 | 最適化装置、最適化方法、およびプログラム |
US17/289,703 US20220005471A1 (en) | 2018-11-08 | 2019-10-25 | Optimization apparatus, optimization method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018210243A JP7167640B2 (ja) | 2018-11-08 | 2018-11-08 | 最適化装置、最適化方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020076874A JP2020076874A (ja) | 2020-05-21 |
JP7167640B2 true JP7167640B2 (ja) | 2022-11-09 |
Family
ID=70611998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018210243A Active JP7167640B2 (ja) | 2018-11-08 | 2018-11-08 | 最適化装置、最適化方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220005471A1 (ja) |
JP (1) | JP7167640B2 (ja) |
WO (1) | WO2020095707A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112020002820T5 (de) | 2019-06-12 | 2022-02-24 | Jtekt Corporation | Wälzlagerprüfvorrichtung und Verfahren zum Prüfen eines Wälzlagers |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000348010A (ja) | 1999-06-02 | 2000-12-15 | Fujitsu Ltd | 最適解探索装置及び方法並びにプログラム記録媒体 |
US20030014248A1 (en) | 2001-04-27 | 2003-01-16 | Csem, Centre Suisse D'electronique Et De Microtechnique Sa | Method and system for enhancing speech in a noisy environment |
WO2009110578A1 (ja) | 2008-03-03 | 2009-09-11 | 日本電信電話株式会社 | 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体 |
JP2013122508A (ja) | 2011-12-09 | 2013-06-20 | Tetsutsugu Tamura | 音声認識装置及びプログラム |
JP2017134197A (ja) | 2016-01-27 | 2017-08-03 | 日本電信電話株式会社 | パラメータ調整システム、パラメータ調整方法、プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5091945A (en) * | 1989-09-28 | 1992-02-25 | At&T Bell Laboratories | Source dependent channel coding with error protection |
US7761392B2 (en) * | 2006-10-31 | 2010-07-20 | Motorola, Inc. | Configurable infinite logic signal processing network and genetic computing method of designing the same |
JP5954750B2 (ja) * | 2014-06-30 | 2016-07-20 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 情報処理装置、情報処理方法、及びプログラム |
CN104821168B (zh) * | 2015-04-30 | 2017-03-29 | 北京京东方多媒体科技有限公司 | 一种语音识别方法及装置 |
-
2018
- 2018-11-08 JP JP2018210243A patent/JP7167640B2/ja active Active
-
2019
- 2019-10-25 US US17/289,703 patent/US20220005471A1/en active Pending
- 2019-10-25 WO PCT/JP2019/041821 patent/WO2020095707A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000348010A (ja) | 1999-06-02 | 2000-12-15 | Fujitsu Ltd | 最適解探索装置及び方法並びにプログラム記録媒体 |
US20030014248A1 (en) | 2001-04-27 | 2003-01-16 | Csem, Centre Suisse D'electronique Et De Microtechnique Sa | Method and system for enhancing speech in a noisy environment |
WO2009110578A1 (ja) | 2008-03-03 | 2009-09-11 | 日本電信電話株式会社 | 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体 |
JP2013122508A (ja) | 2011-12-09 | 2013-06-20 | Tetsutsugu Tamura | 音声認識装置及びプログラム |
JP2017134197A (ja) | 2016-01-27 | 2017-08-03 | 日本電信電話株式会社 | パラメータ調整システム、パラメータ調整方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020076874A (ja) | 2020-05-21 |
US20220005471A1 (en) | 2022-01-06 |
WO2020095707A1 (ja) | 2020-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10891944B2 (en) | Adaptive and compensatory speech recognition methods and devices | |
EP3340129B1 (en) | Artificial neural network class-based pruning | |
US11157384B2 (en) | Methods, systems, articles of manufacture and apparatus for code review assistance for dynamically typed languages | |
EP4383136A2 (en) | Population based training of neural networks | |
WO2020159572A1 (en) | System and method for information extraction with character level features | |
US11068655B2 (en) | Text recognition based on training of models at a plurality of training nodes | |
WO2023005386A1 (zh) | 模型训练方法和装置 | |
US20200379807A1 (en) | Method, device, and computer program product for managing jobs in processing system | |
CN110490304B (zh) | 一种数据处理方法及设备 | |
JP7167640B2 (ja) | 最適化装置、最適化方法、およびプログラム | |
US11719796B2 (en) | System and method for ultrasonic signal noise removal using a deep neural network | |
CN113990347A (zh) | 一种信号处理方法、计算机设备及存储介质 | |
US11526690B2 (en) | Learning device, learning method, and computer program product | |
KR102520240B1 (ko) | 비음수 행렬 인수분해를 이용하는 데이터 증강 방법 및 장치 | |
US11755671B2 (en) | Projecting queries into a content item embedding space | |
JP6633556B2 (ja) | 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム | |
CN111241159A (zh) | 确定任务执行时间的方法及装置 | |
US11288097B2 (en) | Automated hardware resource optimization | |
JP6067760B2 (ja) | パラメータ決定装置、パラメータ決定方法、およびプログラム | |
CN113672215B (zh) | 深度学习分布式训练适配方法和装置 | |
US20230252360A1 (en) | Efficient optimization of machine learning models | |
US11934950B2 (en) | Apparatus and method for embedding sentence feature vector | |
CN118506099A (zh) | 一种基于生成域对齐的医学超声影像识别方法 | |
CN114625853A (zh) | 一种文本处理方法、装置、电子设备及计算机存储介质 | |
JP6211995B2 (ja) | 言語モデル作成装置、言語モデル作成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220315 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220511 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220927 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221010 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7167640 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |