JP7291099B2 - 音声認識方法及び装置 - Google Patents
音声認識方法及び装置 Download PDFInfo
- Publication number
- JP7291099B2 JP7291099B2 JP2020067912A JP2020067912A JP7291099B2 JP 7291099 B2 JP7291099 B2 JP 7291099B2 JP 2020067912 A JP2020067912 A JP 2020067912A JP 2020067912 A JP2020067912 A JP 2020067912A JP 7291099 B2 JP7291099 B2 JP 7291099B2
- Authority
- JP
- Japan
- Prior art keywords
- special
- neural network
- speech recognition
- sequence
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 65
- 238000013528 artificial neural network Methods 0.000 claims description 104
- 239000013598 vector Substances 0.000 claims description 87
- 238000013527 convolutional neural network Methods 0.000 claims description 11
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 19
- 238000000605 extraction Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 13
- 239000000284 extract Substances 0.000 description 10
- 230000015654 memory Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000012141 concentrate Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/197—Probabilistic grammars, e.g. word n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Description
Claims (22)
- 音声認識装置が実施するエンドツーエンド人工神経網音声認識方法において、
話者の特殊音声を予め取得するステップと、
前記話者の予め決められた特殊シーケンスを受信し、この直後に前記話者の入力シーケンスを受信するステップであって、前記入力シーケンスは前記話者の入力音声に対応し、前記予め決められた特殊シーケンスには前記話者の予め取得した特殊音声が含まれる、受信するステップと、
人工神経網を用いて前記特殊シーケンス及び前記入力シーケンスを認識するステップと、
前記特殊シーケンス及び前記認識結果に基づいて、前記入力シーケンスを認識するステップと、
を含むエンドツーエンド人工神経網音声認識方法。 - 前記入力シーケンスは、前記入力音声又は前記入力音声から抽出されたベクトルを含む、請求項1に記載のエンドツーエンド人工神経網音声認識方法。
- 前記特殊シーケンスは、前記話者の予め決められた音声又は前記予め決められた音声から抽出された少なくとも1つのベクトルを含む、請求項1に記載のエンドツーエンド人工神経網音声認識方法。
- 前記特殊シーケンスは、前記話者の予め決められた音声である、請求項1に記載のエンドツーエンド人工神経網音声認識方法。
- 前記特殊シーケンスは「hi」という音声である、請求項1に記載のエンドツーエンド人工神経網音声認識方法。
- 前記特殊シーケンス及び前記入力シーケンスを認識するステップは、
前記特殊シーケンス及び前記入力シーケンスを符号化し、符号化された特徴を生成するステップと、
前記符号化された特徴に基づいて前記特殊シーケンスに対応する1つ以上の特殊トークンを出力するステップと、
前記符号化された特徴及び前記特殊トークンに基づいて、前記入力シーケンスに対応する1つ以上の出力トークンを決定するステップと、
を含む、請求項1に記載のエンドツーエンド人工神経網音声認識方法。 - 前記特殊トークンは、前記話者の予め決められた音声に対応するテキストを含む、請求項6に記載のエンドツーエンド人工神経網音声認識方法。
- 前記特殊シーケンス及び前記入力シーケンスを認識するステップは、
前記特殊シーケンス及び前記入力シーケンスを符号化し、符号化された特徴を生成するステップと、
前記符号化された特徴及び前記特殊シーケンスに対応する特殊トークンに基づいて、前記入力シーケンスに対応する1つ以上の出力トークンを決定するステップと、
を含む、請求項1に記載のエンドツーエンド人工神経網音声認識方法。 - 前記特殊シーケンス及び前記入力シーケンスを認識するステップは、前記特殊シーケンス及び前記入力シーケンスをエンコーダ-デコーダ構造のエンドツーエンド(End-to-End)人工神経網に入力し、前記特殊シーケンス及び前記入力シーケンスに対応する音声認識の結果を出力するステップを含む、請求項1に記載のエンドツーエンド人工神経網音声認識方法。
- 前記エンコーダ-デコーダ構造のエンドツーエンド人工神経網のデコーダは、ステップごとのエンコーダーから算出された情報に基づいて、以前のステップの音声認識の結果に従属して前記音声認識の結果を出力する、請求項9に記載のエンドツーエンド人工神経網音声認識方法。
- 前記人工神経網は、循環神経網(RNN:Recurrent Neural Network)、畳み込み神経網(CNN:Convolutional Neural Network)及び自己注意神経網(SANN:Self-Attention Neural Network)のうち少なくとも1つを含む、請求項9に記載のエンドツーエンド人工神経網音声認識方法。
- 前記入力シーケンスを認識するステップは、前記特殊シーケンス及び前記入力シーケンスに対応する音声認識の結果から、前記特殊シーケンスに対応する音声認識の結果を除くステップを含む、請求項1に記載のエンドツーエンド人工神経網音声認識方法。
- 前記特殊シーケンスは、前記話者の予め取得した特殊音声から抽出された少なくとも1つの特徴ベクトルを含み、
前記特殊シーケンス及び前記入力シーケンスを認識するステップは、
前記特殊シーケンス及び前記入力シーケンスをエンコーダ-デコーダ構造のエンドツーエンド人工神経網のエンコーダに入力して符号化された特徴を生成するステップと、
前記符号化された特徴に基づいて前記特徴ベクトルに対応する特殊トークンを出力するステップと、
を含み、
前記人工神経網は、前記特徴ベクトルが入力されれば、前記特殊トークンを出力するように学習される、請求項1に記載のエンドツーエンド人工神経網音声認識方法。 - 前記入力シーケンスにノイズだけが含まれている場合、前記特殊シーケンス以後の前記入力シーケンスをEOSトークンとして認識するステップをさらに含む、請求項1に記載のエンドツーエンド人工神経網音声認識方法。
- ハードウェアと結合して請求項1~請求項14のいずれか1項に記載のエンドツーエンド人工神経網音声認識方法を実行させるために媒体に格納されたコンピュータプログラム。
- プロセッサを含み、該プロセッサに請求項1~14のいずれか一項に記載のエンドツーエンド人工神経網音声認識方法を実行させる音声認識装置。
- 音声認識装置が実施するエンドツーエンド人工神経網音声認識方法において、
話者の特殊音声を予め取得するステップと、
該取得するステップの後に、前記話者の前記特殊音声を受信し、この直後に前記話者の入力音声を受信するステップと、
前記特殊音声とこの直後に受信した前記入力音声とを含む音声から特徴ベクトルを抽出するステップと、
前記特徴ベクトルを符号化し、符号化された特徴を生成するステップと、
前記符号化された特徴及び以前に取得した前記特殊音声の認識結果に基づいて出力トークンを決定するステップと、
を含む、エンドツーエンド人工神経網音声認識方法。 - 前記特殊音声に対応する特殊トークンを前記出力トークンとして出力するステップをさらに含む、請求項17に記載のエンドツーエンド人工神経網音声認識方法。
- 前記特殊トークンを出力するために入力トークン及び前記符号化された特徴を復号化するステップをさらに含む、請求項18に記載のエンドツーエンド人工神経網音声認識方法。
- 前記特殊音声を含む認識結果から前記特殊トークンを除去するステップと、
前記入力音声に対応する現在の認識結果を出力するステップと、
をさらに含む、請求項18に記載のエンドツーエンド人工神経網音声認識方法。 - 前記特殊トークンに基づいて次の出力トークンの候補の確率を予測するステップと、
前記確率に基づいて次の出力トークンを決定するステップと、
前記次の出力トークンを次の入力トークンとして決定するステップと、
をさらに含む、請求項18に記載のエンドツーエンド人工神経網音声認識方法。 - 前記特徴ベクトルを符号化し、符号化された特徴を生成するステップは、前記特徴ベクトルの次元を変換して前記符号化された特徴を生成するステップを含む、請求項17に記載のエンドツーエンド人工神経網音声認識方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2019-0040120 | 2019-04-05 | ||
KR20190040120 | 2019-04-05 | ||
KR10-2019-0141750 | 2019-11-07 | ||
KR1020190141750A KR20200117826A (ko) | 2019-04-05 | 2019-11-07 | 음성 인식 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020173441A JP2020173441A (ja) | 2020-10-22 |
JP7291099B2 true JP7291099B2 (ja) | 2023-06-14 |
Family
ID=70049874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020067912A Active JP7291099B2 (ja) | 2019-04-05 | 2020-04-03 | 音声認識方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (2) | US11501761B2 (ja) |
EP (1) | EP3719797B1 (ja) |
JP (1) | JP7291099B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11501761B2 (en) * | 2019-04-05 | 2022-11-15 | Samsung Electronics Co., Ltd. | Method and apparatus for speech recognition |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018136493A (ja) | 2017-02-23 | 2018-08-30 | 富士通株式会社 | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 |
US20180261225A1 (en) | 2017-03-13 | 2018-09-13 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for Multichannel End-to-End Speech Recognition |
WO2019026313A1 (ja) | 2017-08-02 | 2019-02-07 | パナソニックIpマネジメント株式会社 | 情報処理装置、音声認識システム、及び、情報処理方法 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4195267B2 (ja) | 2002-03-14 | 2008-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声認識装置、その音声認識方法及びプログラム |
US7574358B2 (en) | 2005-02-28 | 2009-08-11 | International Business Machines Corporation | Natural language system and method based on unisolated performance metric |
WO2010019831A1 (en) | 2008-08-14 | 2010-02-18 | 21Ct, Inc. | Hidden markov model for speech processing with training method |
US10170114B2 (en) | 2013-05-30 | 2019-01-01 | Promptu Systems Corporation | Systems and methods for adaptive proper name entity recognition and understanding |
KR20140147587A (ko) | 2013-06-20 | 2014-12-30 | 한국전자통신연구원 | Wfst를 이용한 음성 끝점 검출 장치 및 방법 |
US10438581B2 (en) | 2013-07-31 | 2019-10-08 | Google Llc | Speech recognition using neural networks |
US9286883B1 (en) | 2013-09-26 | 2016-03-15 | Amazon Technologies, Inc. | Acoustic echo cancellation and automatic speech recognition with random noise |
KR102158315B1 (ko) | 2013-10-14 | 2020-09-21 | 삼성전자주식회사 | 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법 |
US9378735B1 (en) | 2013-12-19 | 2016-06-28 | Amazon Technologies, Inc. | Estimating speaker-specific affine transforms for neural network based speech recognition systems |
US9842592B2 (en) * | 2014-02-12 | 2017-12-12 | Google Inc. | Language models using non-linguistic context |
KR101610161B1 (ko) | 2014-11-26 | 2016-04-08 | 현대자동차 주식회사 | 음성인식 시스템 및 그 방법 |
DE102015003136A1 (de) * | 2015-03-11 | 2016-09-15 | Kuka Roboter Gmbh | Roboterlagerung |
KR102585228B1 (ko) | 2015-03-13 | 2023-10-05 | 삼성전자주식회사 | 음성 인식 시스템 및 방법 |
US9818409B2 (en) | 2015-06-19 | 2017-11-14 | Google Inc. | Context-dependent modeling of phonemes |
US9799327B1 (en) | 2016-02-26 | 2017-10-24 | Google Inc. | Speech recognition with attention-based recurrent neural networks |
US10431205B2 (en) * | 2016-04-27 | 2019-10-01 | Conduent Business Services, Llc | Dialog device with dialog support generated using a mixture of language models combined using a recurrent neural network |
JP6727607B2 (ja) | 2016-06-09 | 2020-07-22 | 国立研究開発法人情報通信研究機構 | 音声認識装置及びコンピュータプログラム |
US10832664B2 (en) * | 2016-08-19 | 2020-11-10 | Google Llc | Automated speech recognition using language models that selectively use domain-specific model components |
US11080591B2 (en) | 2016-09-06 | 2021-08-03 | Deepmind Technologies Limited | Processing sequences using convolutional neural networks |
US20180174576A1 (en) | 2016-12-21 | 2018-06-21 | Google Llc | Acoustic-to-word neural network speech recognizer |
US11164570B2 (en) | 2017-01-17 | 2021-11-02 | Ford Global Technologies, Llc | Voice assistant tracking and activation |
US10657955B2 (en) | 2017-02-24 | 2020-05-19 | Baidu Usa Llc | Systems and methods for principled bias reduction in production speech models |
CN107054144B (zh) | 2017-04-28 | 2020-03-06 | 北京新能源汽车股份有限公司 | 一种电动汽车的控制方法、装置及电动汽车 |
US10170112B2 (en) * | 2017-05-11 | 2019-01-01 | Google Llc | Detecting and suppressing voice queries |
TWI767000B (zh) | 2017-05-20 | 2022-06-11 | 英商淵慧科技有限公司 | 產生波形之方法及電腦儲存媒體 |
CN107180632A (zh) | 2017-06-19 | 2017-09-19 | 微鲸科技有限公司 | 语音控制方法、装置及可读存储介质 |
US10770094B2 (en) | 2018-01-09 | 2020-09-08 | Intel IP Corporation | Routing audio streams based on semantically generated result sets |
US11501761B2 (en) * | 2019-04-05 | 2022-11-15 | Samsung Electronics Co., Ltd. | Method and apparatus for speech recognition |
JP7234415B2 (ja) * | 2019-05-06 | 2023-03-07 | グーグル エルエルシー | 音声認識のためのコンテキストバイアス |
US11373639B2 (en) * | 2019-12-12 | 2022-06-28 | Mitsubishi Electric Research Laboratories, Inc. | System and method for streaming end-to-end speech recognition with asynchronous decoders pruning prefixes using a joint label and frame information in transcribing technique |
US11626103B2 (en) * | 2020-02-28 | 2023-04-11 | Rovi Guides, Inc. | Methods for natural language model training in natural language understanding (NLU) systems |
US11393455B2 (en) * | 2020-02-28 | 2022-07-19 | Rovi Guides, Inc. | Methods for natural language model training in natural language understanding (NLU) systems |
US11893983B2 (en) * | 2021-06-23 | 2024-02-06 | International Business Machines Corporation | Adding words to a prefix tree for improving speech recognition |
-
2020
- 2020-02-11 US US16/787,701 patent/US11501761B2/en active Active
- 2020-03-26 EP EP20165895.2A patent/EP3719797B1/en active Active
- 2020-04-03 JP JP2020067912A patent/JP7291099B2/ja active Active
-
2022
- 2022-11-14 US US17/986,000 patent/US12073825B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018136493A (ja) | 2017-02-23 | 2018-08-30 | 富士通株式会社 | 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法 |
US20180261225A1 (en) | 2017-03-13 | 2018-09-13 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for Multichannel End-to-End Speech Recognition |
WO2019026313A1 (ja) | 2017-08-02 | 2019-02-07 | パナソニックIpマネジメント株式会社 | 情報処理装置、音声認識システム、及び、情報処理方法 |
Non-Patent Citations (2)
Title |
---|
Linhao Dong et al.,Speech-Transformer: A No-Recurrence Sequence-to-Sequence Model for Speech Recognition,2018 IEEE International Conference on Acoustics, Speech and Signal Processing,2018年04月,p.5884-5888 |
河原 達也,音声認識技術の変遷と最先端-深層学習によるEnd-to-Endモデル-,日本音響学会誌,2018年07月,第74巻,第7号,p.381-386 |
Also Published As
Publication number | Publication date |
---|---|
US20230076073A1 (en) | 2023-03-09 |
JP2020173441A (ja) | 2020-10-22 |
EP3719797B1 (en) | 2021-11-10 |
US11501761B2 (en) | 2022-11-15 |
US20200320983A1 (en) | 2020-10-08 |
US12073825B2 (en) | 2024-08-27 |
EP3719797A1 (en) | 2020-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6980119B2 (ja) | 音声認識方法、並びにその装置、デバイス、記憶媒体及びプログラム | |
CN112102815B (zh) | 语音识别方法、装置、计算机设备和存储介质 | |
KR102413692B1 (ko) | 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치 | |
US8275616B2 (en) | System for detecting speech interval and recognizing continuous speech in a noisy environment through real-time recognition of call commands | |
CN112435653B (zh) | 语音识别方法、装置和电子设备 | |
CN111640456B (zh) | 叠音检测方法、装置和设备 | |
CN115004296A (zh) | 基于审议模型的两轮端到端言语辨识 | |
JP2021184087A (ja) | サウンド特徴に対する音響モデル条件付け | |
CN112017633B (zh) | 语音识别方法、装置、存储介质及电子设备 | |
KR20170007107A (ko) | 음성인식 시스템 및 방법 | |
CN112397058A (zh) | 解码方法、训练方法以及语音识别设备 | |
CN113674733A (zh) | 用于说话时间估计的方法和设备 | |
CN114038457A (zh) | 用于语音唤醒的方法、电子设备、存储介质和程序 | |
KR20210009593A (ko) | 강인한 음성인식을 위한 음향 및 언어모델링 정보를 이용한 음성 끝점 검출 방법 및 장치 | |
JP7329393B2 (ja) | 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、学習装置、学習方法及び学習プログラム | |
JP5342629B2 (ja) | 男女声識別方法、男女声識別装置及びプログラム | |
JP7291099B2 (ja) | 音声認識方法及び装置 | |
Hwang et al. | End-to-end speech endpoint detection utilizing acoustic and language modeling knowledge for online low-latency speech recognition | |
CN113327596A (zh) | 语音识别模型的训练方法、语音识别方法和装置 | |
KR20210081166A (ko) | 다국어 음성 환경에서의 언어 식별 장치 및 방법 | |
KR102382191B1 (ko) | 음성 감정 인식 및 합성의 반복 학습 방법 및 장치 | |
KR102295860B1 (ko) | 상향식 주의집중과 하향식 주의집중 인공신경망을 이용한 음성 감정 인식 방법 및 장치 | |
KR101229108B1 (ko) | 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법 | |
KR20200117826A (ko) | 음성 인식 방법 및 장치 | |
CN115273862A (zh) | 语音处理的方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230602 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7291099 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |