JP2017076127A - 音響モデル入力データの正規化装置及び方法と、音声認識装置 - Google Patents
音響モデル入力データの正規化装置及び方法と、音声認識装置 Download PDFInfo
- Publication number
- JP2017076127A JP2017076127A JP2016202591A JP2016202591A JP2017076127A JP 2017076127 A JP2017076127 A JP 2017076127A JP 2016202591 A JP2016202591 A JP 2016202591A JP 2016202591 A JP2016202591 A JP 2016202591A JP 2017076127 A JP2017076127 A JP 2017076127A
- Authority
- JP
- Japan
- Prior art keywords
- window
- frame
- normalization
- acoustic model
- normalizing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000010606 normalization Methods 0.000 claims description 125
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000007781 pre-processing Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims 1
- 230000005236 sound signal Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
- Image Analysis (AREA)
Abstract
Description
120 音響点数計算部
130 言語点数計算部
140 解析部
Claims (26)
- 認識する音声のフレームデータから、音響モデルに入力するフレームデータのウィンドウを抽出するウィンドウ抽出部と、
前記音響モデルに入力するフレームデータを前記抽出されたウィンドウ単位で正規化する正規化部と、
を含む音響モデル入力データの正規化装置。 - 前記ウィンドウ抽出部は、
前記認識する音声のフレームデータの各フレームが入力される間に、前記認識する音声のフレームデータから所定個数のフレーム単位で連続してウィンドウを抽出する請求項1に記載の音響モデル入力データの正規化装置。 - 前記正規化部は、
現在ウィンドウの両側に追加されたパディングフレームが存在すれば、現在ウィンドウに属したフレームと前記パディングフレームとを共に正規化する請求項1又は2に記載の音響モデル入力データの正規化装置。 - 前記正規化部は、
現在ウィンドウに属したフレームを正規化するとき、前記現在ウィンドウの以前ウィンドウに属したフレームを考慮して正規化する請求項1乃至3のいずれか一項に記載の音響モデル入力データの正規化装置。 - 前記正規化部は、
前記現在ウィンドウに属するフレームを正規化するとき、前記以前ウィンドウに属したフレームの個数が十分ではない場合、練習データのフレームをさらに考慮して正規化する請求項4に記載の音響モデル入力データの正規化装置。 - 前記正規化部は、
前記現在ウィンドウ及び以前ウィンドウに属するフレームの総個数が基準値よりも小さい場合、前記総個数と基準値との差に該当する個数のフレームを前記練習データから獲得する請求項5に記載の音響モデル入力データの正規化装置。 - 前記正規化部は、
抽出されたウィンドウに属するフレームデータに対する平均が0、標準偏差が1になるように正規化する請求項1乃至6のいずれか一項に記載の音響モデル入力データの正規化装置。 - 認識する音声のフレームデータから、音響モデルに入力するフレームデータのウィンドウを抽出する段階と、
前記音響モデルに入力するフレームデータを前記抽出されたウィンドウ単位で正規化する段階と、
を含む音響モデル入力データの正規化方法。 - 前記ウィンドウを抽出する段階は、
前記認識する音声のフレームデータの各フレームが入力される間に、前記認識する音声のフレームデータから所定個数のフレーム単位で連続してウィンドウを抽出する請求項8に記載の音響モデル入力データの正規化方法。 - 前記正規化する段階は、
現在ウィンドウの両側に追加されたパディングフレームが存在すれば、現在ウィンドウに属したフレームと前記パディングフレームとを共に正規化する請求項8又は9に記載の音響モデル入力データの正規化方法。 - 前記正規化する段階は、
現在ウィンドウに属したフレームを正規化するとき、前記現在ウィンドウの以前ウィンドウに属したフレームを考慮して正規化する請求項8乃至10のいずれか一項に記載の音響モデル入力データの正規化方法。 - 前記正規化する段階は、
前記現在ウィンドウに属するフレームを正規化するとき、前記以前ウィンドウに属したフレームの個数が十分ではない場合、練習データのフレームをさらに考慮して正規化する請求項11に記載の音響モデル入力データの正規化方法。 - 前記正規化する段階は、
現在ウィンドウが抽出されれば、前記現在ウィンドウ及び以前ウィンドウに属するフレームの総個数と基準値とを比較する段階と、
前記比較の結果、総個数が基準値よりも小さければ、前記総個数と基準値との差に該当する個数のフレームを前記練習データから獲得する段階と、
を含む請求項12に記載の音響モデル入力データの正規化方法。 - 前記正規化する段階は、
抽出されたウィンドウに属するフレームデータに対する平均が0、標準偏差が1になるように正規化する請求項8乃至13のいずれか一項に記載の音響モデル入力データの正規化方法。 - プロセッサに、請求項8乃至14のいずれか一項に記載の方法を実行させるコンピュータプログラム。
- 認識する音声のフレームデータから音響モデルに入力するフレームデータのウィンドウを抽出し、前記抽出されるウィンドウ単位で正規化を行う前処理部と、
多層構造ニューラルネットワークに基づく音響モデルを用いて、前記正規化が行われたウィンドウ単位で音響点数を計算する音響点数計算部と、
前記ウィンドウ単位で計算される音響点数を解析して、前記認識する音声の認識結果を出力する解析部と、
を含む音声認識装置。 - 前記前処理部は、
現在ウィンドウを正規化するとき、前記現在ウィンドウの以前ウィンドウに属したフレームを考慮して正規化する請求項16に記載の音声認識装置。 - 前記前処理部は、
前記以前ウィンドウに属したフレームの個数が十分ではない場合、練習データのフレームをさらに考慮して、前記現在ウィンドウを正規化する請求項17に記載の音声認識装置。 - 前記解析部は、
前記認識する音声の入力が進行する途中で、既定の基準を満足するか、ユーザの入力があれば、現在ウィンドウの認識結果を前記認識する音声全体に対する最終認識結果として出力する請求項16乃至18のいずれか一項に記載の音声認識装置。 - 前記多層構造ニューラルネットワークは、双方向再帰型多層構造ニューラルネットワークである請求項16乃至19のいずれか一項に記載の音声認識装置。
- 言語モデルを用いて言語点数を計算する言語点数計算部をさらに含み、
前記解析部は、
前記解析された点数及び言語点数を基にして、前記認識結果を出力する請求項16乃至18のいずれか一項に記載の音声認識装置。 - 認識する音声のフレームデータから、音響モデルに入力するフレームデータのウィンドウを抽出するウィンドウ抽出部と、
音声認識が可能な十分な量のフレームデータに基づいて、前記音響モデルに入力するフレームデータを正規化する正規化部と、
を含む音響モデル入力データの正規化装置。 - 前記正規化部は、
最初に抽出されたウィンドウから現在抽出されたウィンドウまでのあらゆるウィンドウのフレームに基づいて、前記フレームデータを正規化する請求項22に記載の音響モデル入力データの正規化装置。 - 前記正規化部は、
最初に抽出されたウィンドウから現在抽出されたウィンドウのあらゆるフレーム及び練習データのフレームに基づいて、前記フレームデータを正規化する請求項22に記載の音響モデル入力データの正規化装置。 - 前記練習データのフレームの個数は、前記最初に抽出されたウィンドウから現在抽出されたウィンドウまでのあらゆるウィンドウのフレームの総個数と音声認識が可能な最小限の個数を示す基準値との差と同一である請求項24に記載の音響モデル入力データの正規化装置。
- 前記正規化部は、
ウィンドウが抽出される度に現在抽出されたウィンドウのフレームを正規化する請求項22に記載の音響モデル入力データの正規化装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150144947A KR102192678B1 (ko) | 2015-10-16 | 2015-10-16 | 음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치 |
KR10-2015-0144947 | 2015-10-16 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017076127A true JP2017076127A (ja) | 2017-04-20 |
JP6875819B2 JP6875819B2 (ja) | 2021-05-26 |
Family
ID=57136789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016202591A Active JP6875819B2 (ja) | 2015-10-16 | 2016-10-14 | 音響モデル入力データの正規化装置及び方法と、音声認識装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9972305B2 (ja) |
EP (1) | EP3157004B1 (ja) |
JP (1) | JP6875819B2 (ja) |
KR (1) | KR102192678B1 (ja) |
CN (1) | CN106601240B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018186028A1 (ja) | 2017-04-06 | 2018-10-11 | アルプス電気株式会社 | シフト装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10242696B2 (en) | 2016-10-11 | 2019-03-26 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications |
US10475471B2 (en) * | 2016-10-11 | 2019-11-12 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications using a neural network |
IT201900015506A1 (it) | 2019-09-03 | 2021-03-03 | St Microelectronics Srl | Procedimento di elaborazione di un segnale elettrico trasdotto da un segnale vocale, dispositivo elettronico, rete connessa di dispositivi elettronici e prodotto informatico corrispondenti |
CN114061568B (zh) * | 2021-11-30 | 2023-11-14 | 北京信息科技大学 | 基于地磁数据的飞行体转速测量方法、装置及系统 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5093899A (en) | 1988-09-17 | 1992-03-03 | Sony Corporation | Neural network with normalized learning constant for high-speed stable learning |
JP2699447B2 (ja) | 1988-09-17 | 1998-01-19 | ソニー株式会社 | 信号処理装置 |
US5502790A (en) | 1991-12-24 | 1996-03-26 | Oki Electric Industry Co., Ltd. | Speech recognition method and system using triphones, diphones, and phonemes |
WO1995030193A1 (en) | 1994-04-28 | 1995-11-09 | Motorola Inc. | A method and apparatus for converting text into audible signals using a neural network |
US5621848A (en) | 1994-06-06 | 1997-04-15 | Motorola, Inc. | Method of partitioning a sequence of data frames |
KR100202424B1 (ko) | 1995-12-08 | 1999-06-15 | 정호선 | 실시간 음성인식방법 |
JP4394752B2 (ja) | 1996-10-02 | 2010-01-06 | エスアールアイ インターナショナル | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム |
JP2996926B2 (ja) | 1997-03-11 | 2000-01-11 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 音素シンボルの事後確率演算装置及び音声認識装置 |
US5913194A (en) | 1997-07-14 | 1999-06-15 | Motorola, Inc. | Method, device and system for using statistical information to reduce computation and memory requirements of a neural network based speech synthesis system |
US6317710B1 (en) | 1998-08-13 | 2001-11-13 | At&T Corp. | Multimedia search apparatus and method for searching multimedia content using speaker detection by audio data |
US6173258B1 (en) | 1998-09-09 | 2001-01-09 | Sony Corporation | Method for reducing noise distortions in a speech recognition system |
US6308155B1 (en) | 1999-01-20 | 2001-10-23 | International Computer Science Institute | Feature extraction for automatic speech recognition |
US6947890B1 (en) | 1999-05-28 | 2005-09-20 | Tetsuro Kitazoe | Acoustic speech recognition method and system using stereo vision neural networks with competition and cooperation |
US6453284B1 (en) | 1999-07-26 | 2002-09-17 | Texas Tech University Health Sciences Center | Multiple voice tracking system and method |
DE19957221A1 (de) | 1999-11-27 | 2001-05-31 | Alcatel Sa | Exponentielle Echo- und Geräuschabsenkung in Sprachpausen |
US7197456B2 (en) | 2002-04-30 | 2007-03-27 | Nokia Corporation | On-line parametric histogram normalization for noise robust speech recognition |
KR20040100592A (ko) | 2003-05-23 | 2004-12-02 | 엘지전자 주식회사 | 이동 기기에서의 실시간 화자독립가변어 음성인식 방법 |
US7480615B2 (en) | 2004-01-20 | 2009-01-20 | Microsoft Corporation | Method of speech recognition using multimodal variational inference with switching state space models |
JP4358229B2 (ja) * | 2004-07-09 | 2009-11-04 | 日本電信電話株式会社 | 信号検出システム、信号検出サーバ、信号検出方法及びプログラム |
US7590529B2 (en) | 2005-02-04 | 2009-09-15 | Microsoft Corporation | Method and apparatus for reducing noise corruption from an alternative sensor signal during multi-sensory speech enhancement |
US7496548B1 (en) | 2005-09-26 | 2009-02-24 | Quintura, Inc. | Neural network for electronic search applications |
US20070249406A1 (en) * | 2006-04-20 | 2007-10-25 | Sony Ericsson Mobile Communications Ab | Method and system for retrieving information |
EP2363852B1 (en) | 2010-03-04 | 2012-05-16 | Deutsche Telekom AG | Computer-based method and system of assessing intelligibility of speech represented by a speech signal |
AU2012217153B2 (en) | 2011-02-14 | 2015-07-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
CN103548015B (zh) * | 2011-03-28 | 2017-05-17 | 新加坡科技研究局 | 索引用于文件检索的文件的方法及装置 |
DE102012200512B4 (de) | 2012-01-13 | 2013-11-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Berechnen von Lautsprechersignalen für eine Mehrzahl von Lautsprechern unter Verwendung einer Verzögerung im Frequenzbereich |
US8725498B1 (en) | 2012-06-20 | 2014-05-13 | Google Inc. | Mobile speech recognition with explicit tone features |
US8527276B1 (en) | 2012-10-25 | 2013-09-03 | Google Inc. | Speech synthesis using deep neural networks |
EP2731030A1 (en) * | 2012-11-13 | 2014-05-14 | Samsung Electronics Co., Ltd | Music information searching method and apparatus thereof |
KR20140066640A (ko) * | 2012-11-23 | 2014-06-02 | 삼성전자주식회사 | 다국어 음향 모델 구축 장치 및 이의 다국어 음향 모델 구축 방법, 그리고 그 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능 매체 |
US9153231B1 (en) * | 2013-03-15 | 2015-10-06 | Amazon Technologies, Inc. | Adaptive neural network speech recognition models |
US9466292B1 (en) * | 2013-05-03 | 2016-10-11 | Google Inc. | Online incremental adaptation of deep neural networks using auxiliary Gaussian mixture models in speech recognition |
US9202462B2 (en) | 2013-09-30 | 2015-12-01 | Google Inc. | Key phrase detection |
US9715660B2 (en) | 2013-11-04 | 2017-07-25 | Google Inc. | Transfer learning for deep neural network based hotword detection |
US9665823B2 (en) | 2013-12-06 | 2017-05-30 | International Business Machines Corporation | Method and system for joint training of hybrid neural networks for acoustic modeling in automatic speech recognition |
CN104008751A (zh) * | 2014-06-18 | 2014-08-27 | 周婷婷 | 一种基于bp神经网络的说话人识别方法 |
US9613624B1 (en) * | 2014-06-25 | 2017-04-04 | Amazon Technologies, Inc. | Dynamic pruning in speech recognition |
US9653093B1 (en) * | 2014-08-19 | 2017-05-16 | Amazon Technologies, Inc. | Generative modeling of speech using neural networks |
US10540957B2 (en) | 2014-12-15 | 2020-01-21 | Baidu Usa Llc | Systems and methods for speech transcription |
US10580401B2 (en) | 2015-01-27 | 2020-03-03 | Google Llc | Sub-matrix input for neural network layers |
US9600231B1 (en) * | 2015-03-13 | 2017-03-21 | Amazon Technologies, Inc. | Model shrinking for embedded keyword spotting |
US9740678B2 (en) * | 2015-06-25 | 2017-08-22 | Intel Corporation | Method and system of automatic speech recognition with dynamic vocabularies |
CN105096939B (zh) * | 2015-07-08 | 2017-07-25 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法和装置 |
CN105632501B (zh) * | 2015-12-30 | 2019-09-03 | 中国科学院自动化研究所 | 一种基于深度学习技术的自动口音分类方法及装置 |
CN105590625A (zh) * | 2016-03-18 | 2016-05-18 | 上海语知义信息技术有限公司 | 声学模型自适应方法及系统 |
CN105976812B (zh) * | 2016-04-28 | 2019-04-26 | 腾讯科技(深圳)有限公司 | 一种语音识别方法及其设备 |
-
2015
- 2015-10-16 KR KR1020150144947A patent/KR102192678B1/ko active IP Right Grant
-
2016
- 2016-10-06 US US15/286,999 patent/US9972305B2/en active Active
- 2016-10-14 JP JP2016202591A patent/JP6875819B2/ja active Active
- 2016-10-14 EP EP16193988.9A patent/EP3157004B1/en active Active
- 2016-10-17 CN CN201610900674.6A patent/CN106601240B/zh active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018186028A1 (ja) | 2017-04-06 | 2018-10-11 | アルプス電気株式会社 | シフト装置 |
Also Published As
Publication number | Publication date |
---|---|
KR20170045041A (ko) | 2017-04-26 |
CN106601240A (zh) | 2017-04-26 |
EP3157004A1 (en) | 2017-04-19 |
CN106601240B (zh) | 2021-10-01 |
EP3157004B1 (en) | 2018-07-25 |
US9972305B2 (en) | 2018-05-15 |
JP6875819B2 (ja) | 2021-05-26 |
KR102192678B1 (ko) | 2020-12-17 |
US20170110115A1 (en) | 2017-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102413692B1 (ko) | 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치 | |
US11848008B2 (en) | Artificial intelligence-based wakeup word detection method and apparatus, device, and medium | |
US10074363B2 (en) | Method and apparatus for keyword speech recognition | |
Wang et al. | First Step Towards End-to-End Parametric TTS Synthesis: Generating Spectral Parameters with Neural Attention. | |
US8478591B2 (en) | Phonetic variation model building apparatus and method and phonetic recognition system and method thereof | |
US20190266998A1 (en) | Speech recognition method and device, computer device and storage medium | |
CN109313892B (zh) | 稳健的语言识别方法和系统 | |
JP6875819B2 (ja) | 音響モデル入力データの正規化装置及び方法と、音声認識装置 | |
CN113707125B (zh) | 一种多语言语音合成模型的训练方法及装置 | |
CN109686383B (zh) | 一种语音分析方法、装置及存储介质 | |
WO2022134894A1 (zh) | 语音识别方法、装置、计算机设备及存储介质 | |
JP2017058674A (ja) | 音声認識のための装置及び方法、変換パラメータ学習のための装置及び方法、コンピュータプログラム並びに電子機器 | |
US20180047387A1 (en) | System and method for generating accurate speech transcription from natural speech audio signals | |
US20090024390A1 (en) | Multi-Class Constrained Maximum Likelihood Linear Regression | |
US11676572B2 (en) | Instantaneous learning in text-to-speech during dialog | |
CN112017633B (zh) | 语音识别方法、装置、存储介质及电子设备 | |
CN109697978B (zh) | 用于生成模型的方法和装置 | |
CN114999463B (zh) | 语音识别方法、装置、设备及介质 | |
Rahman et al. | Arabic Speech Recognition: Advancement and Challenges | |
US12100388B2 (en) | Method and apparatus for training speech recognition model, electronic device and storage medium | |
CN114387950A (zh) | 语音识别方法、装置、设备和存储介质 | |
CN113920987A (zh) | 一种语音识别的方法、装置、设备及存储介质 | |
Tripathi et al. | Multilingual and multimode phone recognition system for Indian languages | |
JP2020173441A (ja) | 音声認識方法及び装置 | |
CN116844555A (zh) | 车辆语音交互的方法及装置、车辆、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200609 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210423 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6875819 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE Ref document number: 6875819 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |