JP2018151413A - 音声認識装置、音声認識方法およびプログラム - Google Patents
音声認識装置、音声認識方法およびプログラム Download PDFInfo
- Publication number
- JP2018151413A JP2018151413A JP2017045210A JP2017045210A JP2018151413A JP 2018151413 A JP2018151413 A JP 2018151413A JP 2017045210 A JP2017045210 A JP 2017045210A JP 2017045210 A JP2017045210 A JP 2017045210A JP 2018151413 A JP2018151413 A JP 2018151413A
- Authority
- JP
- Japan
- Prior art keywords
- symbol
- search
- output
- route
- additional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 19
- 239000013598 vector Substances 0.000 claims abstract description 58
- 238000004364 calculation method Methods 0.000 claims abstract description 29
- 239000000945 filler Substances 0.000 claims abstract description 24
- 230000007704 transition Effects 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 7
- 230000010365 information processing Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 20
- 230000005236 sound signal Effects 0.000 description 15
- 230000001755 vocal effect Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 238000000605 extraction Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 210000002784 stomach Anatomy 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 230000015654 memory Effects 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 3
- 206010011224 Cough Diseases 0.000 description 2
- 240000005499 Sasa Species 0.000 description 2
- 206010048232 Yawning Diseases 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 206010011469 Crying Diseases 0.000 description 1
- 241001282135 Poromitra oscitans Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 206010041232 sneezing Diseases 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/54—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/086—Recognition of spelled words
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】音声認識装置は、算出部と、探索部とを備える。算出部は、音声信号に基づきスコアベクトル列を算出する。探索部は、予め登録された探索モデルを探索することによりスコアベクトル列における尤もらしい音響スコアが得られる入力記号を辿る経路を検出し、探索モデルにおける検出した経路に割り当てられた出力記号を出力する。記号集合は、認識対象の音韻を表す認識対象記号と、フィラー、非流暢性および非言語音の少なくとも1つを表す付加記号とを、入力記号として含む。探索モデルは、1以上の入力記号が並んだ入力記号列と、出力記号とが割り当てられた複数の経路を含む。探索部は、尤もらしい音響スコアが得られる入力記号として、付加記号を受理した場合、受理した付加記号を含むスコアベクトルの次のスコアベクトルから、新しい出力記号に対応する経路の探索を開始する。
【選択図】図1
Description
まず、実施の形態で用いる用語について説明する。
図1は、実施形態に係る音声認識装置10の構成を示す図である。音声認識装置10は、特徴抽出部22と、音響モデル記憶部24と、スコア算出部26と、探索モデル記憶部28と、探索部30とを備える。
つぎに、英語を認識するためのWFSTを探索モデルに用いた場合の処理を図4から図10を参照して説明する。
22 特徴抽出部
24 音響モデル記憶部
26 スコア算出部
28 探索モデル記憶部
30 探索部
42 入力層
44 中間層
46 出力層
101 CPU
102 操作部
103 表示部
104 マイクロフォン
105 ROM
106 RAM
107 記憶部
108 通信装置
109 バス
Claims (14)
- 音声信号に含まれる言語情報を表す出力記号を出力する音声認識装置であって、
前記音声信号に基づき、予め定められた記号集合の要素である入力記号毎の音響スコアを含むスコアベクトルが並んだスコアベクトル列を算出する算出部と、
予め登録された探索モデルを探索することにより前記スコアベクトル列における尤もらしい前記音響スコアが得られる前記入力記号を辿る経路を検出し、前記探索モデルにおける検出した経路に割り当てられた前記出力記号を出力する探索部と、
を備え、
前記記号集合は、認識対象の音韻を表す認識対象記号と、フィラー、非流暢性および非言語音の少なくとも1つを表す付加記号とを、前記入力記号として含み、
前記探索モデルは、1以上の前記入力記号が並んだ入力記号列と、前記出力記号とが割り当てられた複数の経路を含み、
前記探索部は、尤もらしい前記音響スコアが得られる前記入力記号として、前記付加記号を受理した場合、受理した前記付加記号を含む前記スコアベクトルの次の前記スコアベクトルから、新しい前記出力記号に対応する経路の探索を開始する
音声認識装置。 - 前記探索部は、前記付加記号を受理した場合、探索位置を、前記探索モデルに含まれる経路の開始点に移動させる
請求項1に記載の音声認識装置。 - 前記探索モデルは、有限状態トランスデューサであり、
前記探索部は、前記付加記号を受理した場合、経路の状態を、前記有限状態トランスデューサにおける開始状態に遷移させる
請求項2に記載の音声認識装置。 - 前記探索部は、前記付加記号を受理した場合、探索位置を、前記探索モデルに含まれる経路の終了点に移動させる
請求項1に記載の音声認識装置。 - 前記探索モデルは、有限状態トランスデューサであり、
前記探索部は、前記付加記号を受理した場合、経路の状態を、前記有限状態トランスデューサにおける終了状態に遷移させる
請求項4に記載の音声認識装置。 - 前記探索部は、前記付加記号を受理した場合、前記出力記号を出力しないまたは空を表す前記出力記号を出力する
請求項1から5の何れか1項に記載の音声認識装置。 - 前記探索部は、前記付加記号を受理した場合、前記付加記号を表す記号を出力する
請求項1から5の何れか1項に記載の音声認識装置。 - 前記探索部は、前記付加記号を受理した場合、経路の開始位置から前記付加記号を受理するまでに受理した前記入力記号列を出力する
請求項1から5の何れか1項に記載の音声認識装置。 - 前記探索部は、前記付加記号を受理した場合、前記付加記号を受理する直前までに辿った経路に継続した経路の前記出力記号を出力する
請求項1から5の何れか1項に記載の音声認識装置。 - 前記探索部は、
前記付加記号を受理した場合、前記付加記号を受理する直前までに辿った経路に継続した経路が、1つに確定しているか否かを検出し、
経路が1つに確定している場合、確定している経路に割り当てられた前記出力記号を出力し、
経路が1つに確定していない場合、前記出力記号を出力しないまたは空を表す前記出力記号を出力する
請求項1から5の何れか1項に記載の音声認識装置。 - 前記探索モデルには、前記付加記号を受理する経路が予め追加されている
請求項1から10の何れか1項に記載の音声認識装置。 - 前記探索モデルには、前記付加記号を受理する経路が追加されておらず、
前記探索部は、経路の探索を進める毎に、前記付加記号を受理したか否かを判断する
請求項1から10の何れか1項に記載の音声認識装置。 - 音声信号に含まれる言語情報を表す出力記号を出力する音声認識方法であって、
前記音声信号に基づき、予め定められた記号集合の要素である入力記号毎の音響スコアを含むスコアベクトルが並んだスコアベクトル列を算出し、
予め登録された探索モデルを探索することにより前記スコアベクトル列における尤もらしい前記音響スコアが得られる前記入力記号を辿る経路を検出し、前記探索モデルにおける検出した経路に割り当てられた前記出力記号を出力し、
前記記号集合は、認識対象の音韻を表す認識対象記号と、フィラー、非流暢性および非言語音の少なくとも1つを表す付加記号とを、前記入力記号として含み、
前記探索モデルは、1以上の前記入力記号が並んだ入力記号列と、前記出力記号とが割り当てられた複数の経路を含み、
尤もらしい前記音響スコアが得られる前記入力記号として、前記付加記号を受理した場合、受理した前記付加記号を含む前記スコアベクトルの次の前記スコアベクトルから、新しい前記出力記号に対応する経路の探索を開始する
音声認識方法。 - 情報処理装置を、音声信号に含まれる言語情報を表す出力記号を出力する音声認識装置として機能させるためのプログラムであって、
前記情報処理装置を、
前記音声信号に基づき、予め定められた記号集合の要素である入力記号毎の音響スコアを含むスコアベクトルが並んだスコアベクトル列を算出する算出部と、
予め登録された探索モデルを探索することにより前記スコアベクトル列における尤もらしい前記音響スコアが得られる前記入力記号を辿る経路を検出し、前記探索モデルにおける検出した経路に割り当てられた前記出力記号を出力する探索部と、
して機能させ、
前記記号集合は、認識対象の音韻を表す認識対象記号と、フィラー、非流暢性および非言語音の少なくとも1つを表す付加記号とを、前記入力記号として含み、
前記探索モデルは、1以上の前記入力記号が並んだ入力記号列と、前記出力記号とが割り当てられた複数の経路を含み、
前記探索部は、尤もらしい前記音響スコアが得られる前記入力記号として、前記付加記号を受理した場合、受理した前記付加記号を含む前記スコアベクトルの次の前記スコアベクトルから、新しい前記出力記号に対応する経路の探索を開始する
プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017045210A JP6599914B2 (ja) | 2017-03-09 | 2017-03-09 | 音声認識装置、音声認識方法およびプログラム |
US15/689,775 US10553205B2 (en) | 2017-03-09 | 2017-08-29 | Speech recognition device, speech recognition method, and computer program product |
CN201710760251.3A CN108573713B (zh) | 2017-03-09 | 2017-08-30 | 语音识别装置、语音识别方法以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017045210A JP6599914B2 (ja) | 2017-03-09 | 2017-03-09 | 音声認識装置、音声認識方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018151413A true JP2018151413A (ja) | 2018-09-27 |
JP6599914B2 JP6599914B2 (ja) | 2019-10-30 |
Family
ID=63445563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017045210A Active JP6599914B2 (ja) | 2017-03-09 | 2017-03-09 | 音声認識装置、音声認識方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10553205B2 (ja) |
JP (1) | JP6599914B2 (ja) |
CN (1) | CN108573713B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022074509A (ja) * | 2020-11-04 | 2022-05-18 | 株式会社東芝 | 差分抽出装置、方法及びプログラム |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110179466A (zh) * | 2019-06-03 | 2019-08-30 | 珠海涵辰科技有限公司 | 基于智能终端的灾后呼吸检测系统 |
CN112116908B (zh) * | 2020-11-18 | 2021-02-23 | 北京声智科技有限公司 | 唤醒音频确定方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009031810A (ja) * | 2008-09-29 | 2009-02-12 | Mitsubishi Electric Information Systems Corp | オペレータ業務支援システム |
JP2012226068A (ja) * | 2011-04-19 | 2012-11-15 | Honda Motor Co Ltd | 対話装置 |
JP2015121709A (ja) * | 2013-12-24 | 2015-07-02 | 株式会社東芝 | デコーダ、デコード方法およびプログラム |
JP2016057986A (ja) * | 2014-09-11 | 2016-04-21 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3698511B2 (ja) | 1996-12-11 | 2005-09-21 | 沖電気工業株式会社 | 音声認識方法 |
US7050975B2 (en) * | 2002-07-23 | 2006-05-23 | Microsoft Corporation | Method of speech recognition using time-dependent interpolation and hidden dynamic value classes |
CN100495535C (zh) * | 2003-02-19 | 2009-06-03 | 松下电器产业株式会社 | 语音识别装置及语音识别方法 |
US8244522B2 (en) | 2007-05-22 | 2012-08-14 | Honda Motor Co., Ltd. | Language understanding device |
CN101727903B (zh) * | 2008-10-29 | 2011-10-19 | 中国科学院自动化研究所 | 基于多特征和多系统融合的发音质量评估和错误检测方法 |
US20120215528A1 (en) * | 2009-10-28 | 2012-08-23 | Nec Corporation | Speech recognition system, speech recognition request device, speech recognition method, speech recognition program, and recording medium |
TWI420510B (zh) * | 2010-05-28 | 2013-12-21 | Ind Tech Res Inst | 可調整記憶體使用空間之語音辨識系統與方法 |
KR20120066530A (ko) * | 2010-12-14 | 2012-06-22 | 한국전자통신연구원 | 언어 모델 가중치 추정 방법 및 이를 위한 장치 |
CN104143328B (zh) | 2013-08-15 | 2015-11-25 | 腾讯科技(深圳)有限公司 | 一种关键词检测方法和装置 |
EP2862164B1 (en) | 2013-08-23 | 2017-05-31 | Nuance Communications, Inc. | Multiple pass automatic speech recognition |
US9953632B2 (en) * | 2014-04-17 | 2018-04-24 | Qualcomm Incorporated | Keyword model generation for detecting user-defined keyword |
CN105529027B (zh) * | 2015-12-14 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
-
2017
- 2017-03-09 JP JP2017045210A patent/JP6599914B2/ja active Active
- 2017-08-29 US US15/689,775 patent/US10553205B2/en active Active
- 2017-08-30 CN CN201710760251.3A patent/CN108573713B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009031810A (ja) * | 2008-09-29 | 2009-02-12 | Mitsubishi Electric Information Systems Corp | オペレータ業務支援システム |
JP2012226068A (ja) * | 2011-04-19 | 2012-11-15 | Honda Motor Co Ltd | 対話装置 |
JP2015121709A (ja) * | 2013-12-24 | 2015-07-02 | 株式会社東芝 | デコーダ、デコード方法およびプログラム |
JP2016057986A (ja) * | 2014-09-11 | 2016-04-21 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022074509A (ja) * | 2020-11-04 | 2022-05-18 | 株式会社東芝 | 差分抽出装置、方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20180261210A1 (en) | 2018-09-13 |
US10553205B2 (en) | 2020-02-04 |
JP6599914B2 (ja) | 2019-10-30 |
CN108573713A (zh) | 2018-09-25 |
CN108573713B (zh) | 2022-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5282737B2 (ja) | 音声認識装置および音声認識方法 | |
US10319373B2 (en) | Information processing device, information processing method, computer program product, and recognition system | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
US7983912B2 (en) | Apparatus, method, and computer program product for correcting a misrecognized utterance using a whole or a partial re-utterance | |
JP6585022B2 (ja) | 音声認識装置、音声認識方法およびプログラム | |
CN108091334B (zh) | 识别装置、识别方法以及存储介质 | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
KR101587866B1 (ko) | 음성 인식용 발음사전 확장 장치 및 방법 | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
KR20160122542A (ko) | 발음 유사도 측정 방법 및 장치 | |
CN111369974B (zh) | 一种方言发音标注方法、语言识别方法及相关装置 | |
JP6235280B2 (ja) | 音声同時処理装置、方法およびプログラム | |
JP6599914B2 (ja) | 音声認識装置、音声認識方法およびプログラム | |
CN113362817B (zh) | 声音识别纠错装置、声音识别纠错方法以及声音识别纠错程序 | |
US10042345B2 (en) | Conversion device, pattern recognition system, conversion method, and computer program product | |
CN112331229A (zh) | 语音检测方法、装置、介质和计算设备 | |
JP2015201215A (ja) | 機械翻訳装置、方法、およびプログラム | |
US20180012602A1 (en) | System and methods for pronunciation analysis-based speaker verification | |
US20230360633A1 (en) | Speech processing techniques | |
JP2010169973A (ja) | 外国語学習支援システム、及びプログラム | |
JP2011014021A (ja) | 文字情報提示制御装置及びプログラム | |
JP2000056795A (ja) | 音声認識装置 | |
EP0987681B1 (en) | Speech recognition method and apparatus | |
JP2003162524A (ja) | 言語処理装置 | |
JP2000056793A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180912 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191003 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6599914 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |