JPH06161496A - 家電製品のリモコン命令語を認識するための音声認識システム - Google Patents

家電製品のリモコン命令語を認識するための音声認識システム

Info

Publication number
JPH06161496A
JPH06161496A JP5209702A JP20970293A JPH06161496A JP H06161496 A JPH06161496 A JP H06161496A JP 5209702 A JP5209702 A JP 5209702A JP 20970293 A JP20970293 A JP 20970293A JP H06161496 A JPH06161496 A JP H06161496A
Authority
JP
Japan
Prior art keywords
voice
value
output
recognition system
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5209702A
Other languages
English (en)
Inventor
Ho-Sun Chung
鎬 宣 鄭
Soo-Yong Lee
秀 龍 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SK Hynix Inc
Original Assignee
Goldstar Electron Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goldstar Electron Co Ltd filed Critical Goldstar Electron Co Ltd
Publication of JPH06161496A publication Critical patent/JPH06161496A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Selective Calling Equipment (AREA)

Abstract

(57)【要約】 【目的】 テレビジョンとビデオテ−プレコ−ダのリモ
コン音声命令語を認識する音声認識システムを提供す
る。 【構成】 使用者により入力される音声を入力するため
のマイクロホンと、前記マイクロホンを通じて入力され
る音声を分析するための音声分析器と、前記音声分析器
からの音声の音声区間を検出し時間軸正規化及び二進化
を遂行するための回路と、前記回路からの二進化デ−タ
を入力し学習を遂行し音声認識結果を出力する多層神経
回路網から構成されている。 【効果】 これにより、音声の認識率が高められる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声認識システムに係
り、特に家電製品のリモコン音声命令語を認識する音声
認識システムに関する。
【0002】
【従来の技術】現在の大部分の音声認識システムは人間
が自然に発音した音声を認識し、音声特性の多様な変化
を受容するために多くの計算を必要としたので、その実
用性や妥当性に問題があり、実時間の音声認識が難しい
問題点があった。このような音声認識のようなパタ−ン
認識の一般的な問題が解決できる方法として提示されて
いるのが神経回路網モデルである。
【0003】音声認識のようなパタ−ン認識分野で様々
な神経網モデルが提案され、その中多層パ−セプトロン
(perceptron)が広く利用されている。しかしながら、
学習の際エラ−値が徐々に減少しながら再びエラ−値が
増加する局部的な最小化(local minima)に陥りエラ−
値を正しい値と判断する場合があり、学習時間が長いと
いう短所がある。又、ハ−ドウェアの構成が現在の技術
では困難なので実際応用分野へ実現しにくかった。本発
明の発明者により提案された多層神経回路網はこのよう
な短所を解決するためのものであり、文字認識、音声認
識等主にパタ−ン認識分野への適用が期待されている。
【0004】
【発明が解決しようとする課題】本発明の目的はエラ−
が最小化できる多層神経回路網を利用した家電製品のリ
モコン命令語を認識する音声認識システムを提供するこ
とである。
【0005】
【課題を解決するための手段】このような目的を達成す
るために本発明は家電製品のリモコン命令語を認識する
ための音声認識システムにおいて、使用者により入力さ
れる音声を入力するためのマイクロホンと、前記マイク
ロホンを通じて入力される音声を分析するための音声分
析手段と、前記音声分析手段からの音声の音声区間を検
出し時間軸正規化及び二進化を遂行するための手段と、
前記手段からの二進化デ−タを入力し学習を遂行し音声
認識結果を出力する多層神経回路網から構成されたこと
を特徴とする。
【0006】
【作用】多層神経回路網を利用してテレビジョンとビデ
オテ−プレコ−ダのリモコン音声命令語を認識する。
【0007】
【実施例】以下、添付した図面に基づき本発明を詳細に
説明する。本発明に適用される多層神経回路網の学習ア
ルゴリズムを説明すれば次の通りである。段階1、全て
のノ−ド間の加重値を初期化する。
【0008】段階2、入力とこれに対応する出力を提示
する。段階3、各ノ−ドで入力と加重値の乗の和を求め
ハ−ドリミット非線形の関数により出力を発生する。
【0009】
【数1】
【0010】段階4、出力ノ−ドでの出力を望む出力値
と比べ誤差を計算し誤差値による加重値変化分を貯蔵す
る。 ΔWji=(Dj −Oj ) ・・・(3) ΔWji:加重値の変化量 Dj :j番目ノ−ドの望む出力値 Oj :j番目ノ−ドの出力値 段階5、段階2から段階4までの過程を全ての入力に対
し遂行し全ての出力値が望む値と等しければ学習を終
え、そうでなければ変形される前の加重値と加重値変化
分の和の和をそれぞれの加重値に加える。
【0011】
【数2】
【0012】段階6、段階2から5までを一定の回数反
復した後望む結果が出ない時は層を増加させた後、前の
層での出力と元の入力を新たな入力とし段階2から段階
5までを繰り返す。即ち、前記多層神経回路網の学習ア
ルゴリズムでシナプスの加重値はハ−ドウェア具現を鑑
み整数値を持たせ、ハ−ドリミット関数(hard-limit f
unction )をニュ−ロンでの伝達関数に利用し二進数の
入出力を持たせ、もし前の層での学習が成功しなかった
ら層を増加し出力値と望む出力値が同一になるまで学習
を遂行する規則を有している。
【0013】図1に本発明による多層神経回路網を使用
した家電製品のリモコン命令語の認識システムを示す。
図1において、音声を入力するためのマイクロホン20
0、前記マイクロホン200を通じた音声の特徴を抽出
するための音声分析器210、前記音声分析器210を
通過した音声の音声区間を検出、時間軸正規化、二進化
を遂行する手段220、前記手段220の二進化デ−タ
を入力し学習を遂行し音声認識結果240を出力する多
層神経回路網230から構成されている。
【0014】本発明によるリモコンは図1に示した構造
を有し、認識された音声に対応するリモコン出力信号を
発射し家電製品を動作させる。又、前記認識された音声
信号は画面上にディスプレイされる。図2は本発明の実
験に用いられた認識対象単語を示す。図2において、認
識対象単語はTVとVTR命令語23個と数字音“ヨン
(韓国語で0)”から“ク(韓国語で9)”までを使用
した。図3は認識対象単語“電源”の音声区間検出後の
デ−タを示す。
【0015】本発明では16チャネル帯域フィルタ−バ
ンクの出力を利用したので音声区間を16個の周波数帯
域F1−F16に分けて表す。音声デ−タの分析周期は
16msと設定し分析が完了したデ−タで音声区間検出
は一フレ−ムのエネルギ−が定めたスレショルドより大
きい連続的なフレ−ムを音声区間と定めた。音声区間検
出されたデ−タの時間軸正規化は同じ単語でも発声の長
さが異なるので2〜3音節単語の平均値の30フレ−ム
で時間軸正規化をした。この際正規化は基準フレ−ムよ
り大きい単語の時は比例的にフレ−ムを削除し、小さい
時は比例的にその前のフレ−ムをコピ−する方法を使用
した。
【0016】図4(A)〜図4(C)は本発明による二
進化方法を説明するためのものである。図4(A)は隣
接した二つの周波数帯域、例えば第1及び第2周波数帯
域の中で、第1周波数帯域のエナルギ−レベルが前記第
1周波数帯域に隣接した第2周波数帯域のエネルギ−レ
ベルより大きければ、前記第1周波数帯域に“1”の値
を、そうでなければ“0”の値を割り当てる方法を適用
した。
【0017】図4(B)は一周波数帯域のエネルギ−レ
ベルが前記周波数帯域両側の二周波数帯域のエネルギ−
レベルより大きい際前記周波数帯域に“1”を割り当
て、そうでなければ“0”を割り当てる方法を適用し
た。図4(C)は音声区間と分離されたデ−タで一定の
比率で正規化した後、次の定められたスレショルドより
大きい際“1”を割り当て、そうでなければ“0”を割
り当てる方法を適用した。
【0018】図5は図4(A)に示した方法により前記
図3に示したデ−タの二進化を遂行した結果を示す表で
ある。図6は図4(C)に示した方法により前記図3に
示したデ−タの二進化を遂行した結果を示す表である。
前記図5、図6に示した二進化の結果は多層神経回路網
の入力として使用される。多層神経回路網は前記二進化
した値を入力し前記アルゴリズムを遂行する。
【0019】図7は本発明による音声区間検出され時間
軸正規化したデ−タが処理される過程を示す。図7にお
いて、前記音声区間検出され時間軸正規化したデ−タは
前述した三つの方法による二進化回路300により二進
化され、前記二進化したデ−タは三つの多層神経回路網
310によりそれぞれ学習が遂行され前記学習により得
られたデ−タはそれぞれの最大値出力回路320により
最大値が出力され前記最大値出力回路320の結果を総
合し最終的な認識値を出力する最終値認識回路330か
ら構成されている。
【0020】即ち、上のような方法を使用した理由はそ
れぞれ異なる二進化方法で音声の特性が明瞭に表現で
き、更によい認識率を得るためのものである。又、本発
明では更によい学習結果を得るための方法を提示する。
図8は本発明で提示する更によい学習方法を示す。図8
は一つの多層神経回路網に所定数の副回路網を有しその
副回路網も又それらの副回路網を持つ方法で認識率を高
めるために提案された方法である。
【0021】音声認識システムは二進化した信号を入力
し学習を遂行する神経回路網400、前記神経回路網4
00に連結された副回路網410より構成されている。
そして、前記副回路網はそれらの副回路網が持てる。即
ち、神経回路網で判断の曖昧した出力は副回路網410
で学習され最終結果を出力し副回路網410でも判断の
曖昧した出力は再びその次の副回路網で学習が成される
方法で学習が遂行される。
【0022】例えば、数字認識においてもし“イル(韓
国語で1)”と“チル(韓国語で7)”、“サム(韓国
語で3)”と“パル(韓国語で8)”、“ユク(韓国語
で6)”と“ク(韓国語で9)”がその音声を認識しに
くい曖昧した数字とすれば、それらの数字に対しもう一
度学習を遂行する。即ち、前記方法は学習の認識率を増
加させるために本発明で提案された。
【0023】図8はソフトウェアでTVとVTR命令語
をシミュレ−ションした結果を示し、コンピュ−タ−モ
ニタ−に示される画面である。一人の話者により発音さ
れた各モジュ−ル当たり約300個のデ−タを多層神経
回路網の学習デ−タに使用し、総10個のモジュ−ルで
システムを構成した。認識にかかる時間は約 0.2秒で実
時間システムが構成できた。学習の後、学習デ−タは1
00%の認識率を見せ、試験デ−タに対しては90%以
上の高い認識率を示した。
【0024】
【発明の効果】本発明による音声認識システムと音声認
識方法は音声の認識率が高められる。
【図面の簡単な説明】
【図1】本発明による多層神経回路網を用いた家電製品
のリモコン命令語認識システムのブロック図である。
【図2】本発明の認識実験に使用された認識対象単語を
示す図である。
【図3】認識対象単語“電源”の音声区間検出後のデ−
タを示す図である。
【図4】(A)−(C)は本発明による二進化方法を説
明するためのものである。
【図5】図4(A)に示した方法により前記図3に示し
たデ−タの二進化を遂行した結果を表す表である。
【図6】図4(C)に示した方法により前記図3に示し
たデ−タの二進化を遂行した結果を表す表である。
【図7】本発明による音声区間検出され時間軸正規化し
たデ−タの処理される過程を示すブロック図である。
【図8】本発明による音声認識システムの認識率を向上
させるための多層神経回路網の学習方法を示す図であ
る。
【図9】TVとVTR命令語に対する音声認識をソフト
ウェアシミュレ−ションした結果を示す図である。
【符号の説明】
200 マイクロホン 210 音声分析器 220 時間軸正規化二進化手段 230 多層神経回路網 240 結果 300 二進化(タイプ1) 310,400,410 神経回路網 320 最大値出力回路 330 最終値認識回路

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 家電製品のリモコン命令語を認識するた
    めの音声認識システムにおいて、 使用者により入力される音声を入力するためのマイクロ
    ホンと、 前記マイクロホンを通じて入力される音声を分析するた
    めの音声分析手段と、 前記音声分析手段からの音声の音声区間を検出し時間軸
    正規化及び二進化を遂行するための手段と、 前記音声分析手段からの二進化デ−タを入力し学習を遂
    行し音声認識結果を出力する多層神経回路網から構成さ
    れたことを特徴とする音声認識システム。
  2. 【請求項2】 前記音声分析手段は、 前記音声区間検出され時間軸正規化したデ−タの第1周
    波数帯域の出力が前記第1周波数帯域に隣接した第2周
    波数帯域の出力より大きければ前記第1周波数帯域に第
    1状態の値を割り当て、そうでなければ第2状態の値を
    割り当てる第1手段と、 前記音声区間検出され時間軸正規化したデ−タの第1周
    波数帯域の出力が前記第1周波数帯域の隣接した両側の
    周波数帯域の出力より大きい際前記第1周波数帯域に第
    1状態の値を割り当て、そうでなければ第2状態の値を
    割り当てる第2手段と、 前記音声区間検出され時間軸正規化したデ−タを一定の
    比率で正規化した後、定められたスレショルドより大き
    い時第1状態の値を割り当て、そうでなければ第2状態
    の値を割り当てる第3手段をそれぞれ通過するよう構成
    されたことを特徴とする請求項1記載の音声認識システ
    ム。
  3. 【請求項3】 前記多層神経回路網は前記第1、第2、
    第3手段に各々連結された第1、第2、第3多層神経回
    路網を有しそれぞれの多層神経回路網の結果を統合しそ
    の結果を出力することを特徴とする請求項2記載の音声
    認識システム。
  4. 【請求項4】 前記第1、第2、第3多層神経回路網は
    それぞれの所定の段階を有する所定数の副神経回路網を
    持ち副神経回路網の出力を統合し出力することを特徴と
    する請求項3記載の音声認識システム。
  5. 【請求項5】 前記多層神経回路網の学習方法は全ての
    ノ−ド間の加重値を初期化する第1段階と、 入力とこれに対応する出力を提示する第2段階と、 各ノ−ドで入力の加重値の和を求めハ−ドリミット非線
    形の関数により出力を発生する第3段階と、 出力ノ−ドで出力を望む出力値と比べ誤差を計算し誤差
    値による加重値の変化分を貯蔵する第4段階と、 前記第2段階から第4段階までの過程を全ての入力に対
    して遂行し全ての出力値が望む値と等しければ学習を終
    え、そうでなければこの際の加重値変化分の和を各加重
    値にそれぞれ加える第5段階と、 前記過程を一定の回数繰り返した後望む結果が出ない時
    は層を増加させた後、前の層での出力と元の入力を新し
    い入力にして段階2から反復する第6段階からなること
    を特徴とする請求項3記載の音声認識システム。
JP5209702A 1992-08-27 1993-08-24 家電製品のリモコン命令語を認識するための音声認識システム Pending JPH06161496A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR15484/1992 1992-08-27
KR1019920015484A KR100202425B1 (ko) 1992-08-27 1992-08-27 가전제품의 리모콘 명령어를 인식하기 위한 음성 인식 시스템

Publications (1)

Publication Number Publication Date
JPH06161496A true JPH06161496A (ja) 1994-06-07

Family

ID=19338592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5209702A Pending JPH06161496A (ja) 1992-08-27 1993-08-24 家電製品のリモコン命令語を認識するための音声認識システム

Country Status (5)

Country Link
US (1) US5471557A (ja)
JP (1) JPH06161496A (ja)
KR (1) KR100202425B1 (ja)
DE (1) DE4328752B4 (ja)
FR (1) FR2695246B1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030034443A (ko) * 2001-10-23 2003-05-09 삼성전자주식회사 음성 인식 사용자 인터페이스 제어 장치 및 방법
KR20030047153A (ko) * 2001-12-08 2003-06-18 임소영 음성인식을 적용한 전자 기기의 신방식 유저 인터페이스시스템 및 방법
US6996077B1 (en) 1997-07-03 2006-02-07 Kabushiki Kaisha Toshiba Satellite broadcasting system

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5904697A (en) * 1995-02-24 1999-05-18 Heartport, Inc. Devices and methods for performing a vascular anastomosis
DE19705471C2 (de) * 1997-02-13 1998-04-09 Sican F & E Gmbh Sibet Verfahren und Schaltungsanordnung zur Spracherkennung und zur Sprachsteuerung von Vorrichtungen
DE19754382A1 (de) * 1997-12-08 1999-06-10 Siemens Nixdorf Inf Syst Gerätekombination aus Fernseh- und Rechnerteil mit Zugriff zu einem Kommunikationsnetz sowie Fernbedienung dafür
US7266498B1 (en) * 1998-12-18 2007-09-04 Intel Corporation Method and apparatus for reducing conflicts between speech-enabled applications sharing speech menu
JP3979556B2 (ja) * 1998-12-22 2007-09-19 パイオニア株式会社 番組選択装置及び番組選択方法
US6397186B1 (en) 1999-12-22 2002-05-28 Ambush Interactive, Inc. Hands-free, voice-operated remote control transmitter
ES2273870T3 (es) * 2000-07-28 2007-05-16 Koninklijke Philips Electronics N.V. Sistema para controlar una aparato con instrucciones de voz.
US7006969B2 (en) * 2000-11-02 2006-02-28 At&T Corp. System and method of pattern recognition in very high-dimensional space
US7369993B1 (en) 2000-11-02 2008-05-06 At&T Corp. System and method of pattern recognition in very high-dimensional space
US6845357B2 (en) * 2001-07-24 2005-01-18 Honeywell International Inc. Pattern recognition using an observable operator model
WO2003017252A1 (de) * 2001-08-13 2003-02-27 Knittel, Jochen Verfahren und vorrichtung zum erkennen einer phonetischen lautfolge oder zeichenfolge
US20080147579A1 (en) * 2006-12-14 2008-06-19 Microsoft Corporation Discriminative training using boosted lasso
CN103679185B (zh) * 2012-08-31 2017-06-16 富士通株式会社 卷积神经网络分类器系统、其训练方法、分类方法和用途
KR102392087B1 (ko) 2017-07-10 2022-04-29 삼성전자주식회사 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2558682B2 (ja) * 1987-03-13 1996-11-27 株式会社東芝 知的ワ−クステ−シヨン
DE3819178A1 (de) * 1987-06-04 1988-12-22 Ricoh Kk Spracherkennungsverfahren und -einrichtung
US5136653A (en) * 1988-01-11 1992-08-04 Ezel, Inc. Acoustic recognition system using accumulate power series
US5214745A (en) * 1988-08-25 1993-05-25 Sutherland John G Artificial neural device utilizing phase orientation in the complex number domain to encode and decode stimulus response patterns
GB8908205D0 (en) * 1989-04-12 1989-05-24 Smiths Industries Plc Speech recognition apparatus and methods
GB8911461D0 (en) * 1989-05-18 1989-07-05 Smiths Industries Plc Temperature adaptors
US5086479A (en) * 1989-06-30 1992-02-04 Hitachi, Ltd. Information processing system using neural network learning function
DE4031421C2 (de) * 1989-10-05 1995-08-24 Ricoh Kk Musteranpassungssystem für eine Spracherkennungseinrichtung
JPH03123399A (ja) * 1989-10-06 1991-05-27 Ricoh Co Ltd 音声認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6996077B1 (en) 1997-07-03 2006-02-07 Kabushiki Kaisha Toshiba Satellite broadcasting system
KR20030034443A (ko) * 2001-10-23 2003-05-09 삼성전자주식회사 음성 인식 사용자 인터페이스 제어 장치 및 방법
KR20030047153A (ko) * 2001-12-08 2003-06-18 임소영 음성인식을 적용한 전자 기기의 신방식 유저 인터페이스시스템 및 방법

Also Published As

Publication number Publication date
FR2695246B1 (fr) 1996-06-21
DE4328752B4 (de) 2004-08-05
FR2695246A1 (fr) 1994-03-04
US5471557A (en) 1995-11-28
DE4328752A1 (de) 1994-03-03
KR100202425B1 (ko) 1999-06-15

Similar Documents

Publication Publication Date Title
JP7337953B2 (ja) 音声認識方法及び装置、ニューラルネットワークの訓練方法及び装置、並びにコンピュータープログラム
WO2021143327A1 (zh) 语音识别方法、装置和计算机可读存储介质
JPH06161496A (ja) 家電製品のリモコン命令語を認識するための音声認識システム
US5566270A (en) Speaker independent isolated word recognition system using neural networks
KR0173923B1 (ko) 다층구조 신경망을 이용한 음소 분할 방법
CN111161715A (zh) 一种基于序列分类的特定声音事件检索与定位的方法
CN115641543A (zh) 一种多模态抑郁情绪识别方法及装置
US20230267950A1 (en) Audio signal generation model and training method using generative adversarial network
Illium et al. Surgical mask detection with convolutional neural networks and data augmentations on spectrograms
CN113241092A (zh) 基于双注意力机制和多阶段混合卷积网络声源分离方法
JP3014177B2 (ja) 話者適応音声認識装置
Sagi et al. A biologically motivated solution to the cocktail party problem
CN116467416A (zh) 一种基于图神经网络的多模态对话情感识别方法及系统
CN106910494A (zh) 一种音频识别方法和装置
Mulimani et al. A deep neural network-driven feature learning method for polyphonic acoustic event detection from real-life recordings
Sunny et al. Feature extraction methods based on linear predictive coding and wavelet packet decomposition for recognizing spoken words in malayalam
CN112951270B (zh) 语音流利度检测的方法、装置和电子设备
CN106971731B (zh) 一种声纹识别的修正方法
Ashurov et al. Classification of Environmental Sounds Through Spectrogram-Like Images Using Dilation-Based CNN
Zheng et al. Exploring Multi-task Learning Based Gender Recognition and Age Estimation for Class-imbalanced Data.
Helmi et al. Speech recognition with fuzzy neural network for discrete words
CN114333802B (zh) 语音处理方法、装置、电子设备及计算机可读存储介质
Koteswararao et al. An Efficient Optimal Reconstruction Based Speech Separation Based on Hybrid Deep Learning Technique.
KR0185755B1 (ko) 신경회로망을 이용한 음성인식 시스템
CN117012220A (zh) 语音处理方法、装置、电子设备及存储介质