JP2007256482A - 音声認識装置、音声認識方法、及びコンピュータプログラム - Google Patents
音声認識装置、音声認識方法、及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2007256482A JP2007256482A JP2006079052A JP2006079052A JP2007256482A JP 2007256482 A JP2007256482 A JP 2007256482A JP 2006079052 A JP2006079052 A JP 2006079052A JP 2006079052 A JP2006079052 A JP 2006079052A JP 2007256482 A JP2007256482 A JP 2007256482A
- Authority
- JP
- Japan
- Prior art keywords
- word
- recognition
- speech
- utterance
- reference time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000004590 computer program Methods 0.000 title claims abstract description 21
- 238000000605 extraction Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 12
- 238000001514 detection method Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 240000004270 Colocasia esculenta var. antiquorum Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Navigation (AREA)
Abstract
【解決手段】音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とする。言語モデルに関する情報、音声認識用文法に基づいて変換される認識候補単語列、及び単語列の末尾の単語が最終単語であるか否かを示す情報を記憶しておき、言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出する。抽出された認識候補単語列の末尾の単語が最終単語であると判断された場合、基準時間より短時間で音声認識結果を出力し、最終単語ではないと判断された場合、基準時間経過時に音声認識結果を出力する。
【選択図】図3
Description
図1は、本発明の実施の形態1に係る音声認識装置1の構成を示すブロック図である。音声認識装置1は、装置全体を制御するCPU等の制御手段11、本発明の実施の形態1に係る音声認識装置1で実行可能なコンピュータプログラム101及びデータ等の各種情報を記録したCD−ROM等の記録媒体102から各種情報を読み取るCD−ROMドライブ等の補助記憶手段12、補助記憶手段12により読み取った各種情報を記録するハードディスク等の記録手段13を備えている。制御手段11が、記録手段13から本発明に係るコンピュータプログラム101及びデータ等の各種情報を読み取り、情報を一時的に記憶するRAM等の記憶手段14に記憶させてコンピュータプログラム101に含まれる各種手順を実行することで、コンピュータは、本発明に係る音声認識装置1として動作する。
以下、実施の形態2に係る音声認識装置1を示す図面に基づいて詳述する。本発明の実施の形態2に係る音声認識装置1の構成は、実施の形態1と同様であることから、同一の符号を付することにより詳細な説明を省略する。本実施の形態2では、抽出された認識候補単語列を、後続の音声の有無にかかわらず基準時間Taよりも短い時間Tbで外部へ出力し、後続する音声がなかった場合には、既に出力した認識候補単語列で確定する旨を外部へ出力するのみで、早期に出力した分だけ音声認識結果を早期に出力する点で実施の形態1とは相違する。
以下、実施の形態3に係る音声認識装置1を示す図面に基づいて詳述する。本発明の実施の形態3に係る音声認識装置1の構成は、実施の形態1と同様であることから、同一の符号を付することにより詳細な説明を省略する。本実施の形態3では、音声として情報を受け付ける区間の単語群、例えば姓名の苗字部分、名前部分、住所の郵便番号、市町村名、地番等を識別する情報に対応付けて、最終単語となる確率Pi(iは自然数)を統計的に算出して記憶しておき、算出した確率Piに基づいて、後続の文字が存在するか否かを判断する基準となる基準時間Tを算出する点において、実施の形態1と相違する。なお、確率Piは、単語群ごとではなく、認識語彙ごとに算出しても良い。また、全ユーザに対する確率であっても良いし、ユーザごとに異なる確率、あついは両確率の中間値のように両確率から新たに算出するものであっても良い。
T=Pi・Tb+(1−Pi)・Ta ・・・ (数1)
以下、実施の形態4に係る音声認識装置1を示す図面に基づいて詳述する。本発明の実施の形態4に係る音声認識装置1の構成は、実施の形態1と同様であることから、同一の符号を付することにより詳細な説明を省略する。本実施の形態4では、音声として情報を受け付ける区間の単語群が認識候補単語列の末尾の単語である場合、実際に最終の音声であるか否かを判断する基準となる基準時間Tを、単語群ごとに記憶しておく点において、実施の形態1と相違する。なお、基準時間Tは、単語群ごとに記憶しておくことに限定されるものではなく、認識語彙ごとに記憶しておいても良い。
11 制御手段
13 記録手段
14 記憶手段
18 音声データ入力手段
101 コンピュータプログラム
102 記録媒体
131 音声認識用言語モデル記憶部
132 認識語彙辞書
Claims (10)
- 音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とする音声認識装置において、
言語モデルに関する情報を記憶する言語モデル記憶手段と、
音声認識用文法に基づいて変換される認識候補単語列、及び単語列の末尾の単語が最終単語であるか否かを示す情報を記憶する記憶手段と、
前記言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出する認識候補抽出手段と、
抽出された認識候補単語列から発話末尾の単語が最終単語であるか否かを判断する最終単語判断手段と、
該最終単語判断手段で最終単語であると判断された場合、前記基準時間より短時間で音声認識結果を出力し、最終単語ではないと判断された場合、前記基準時間内に新たな音声データが存在しないときに音声認識結果を出力する認識結果出力手段と
を備えることを特徴とする音声認識装置。 - 前記認識候補抽出手段で抽出された認識候補単語列が更新されたか否かを判断する手段と、
該手段で更新されたと判断した場合、前記認識候補単語列を外部へ出力する認識候補出力手段と、
無音区間の継続時間が前記基準時間に到達したか否かを判断する手段と、
該手段で到達したと判断した場合、到達時点での認識候補単語列を外部へ出力する手段と
を備えることを特徴とする請求項1記載の音声認識装置。 - 音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とする音声認識装置において、
言語モデルに関する情報を記憶する言語モデル記憶手段と、
前記言語モデルに含まれる認識語彙を単語群に分類して記憶する手段と、
認識候補単語列の末尾の単語を単語群と対応付けて記憶する手段と、
前記単語群ごとの最終単語になる確率を記憶する手段と、
前記言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出する認識候補抽出手段と、
抽出された認識候補単語列の末尾の単語が対応する単語群の最終単語になる確率に基づいて、前記基準時間を変更する手段と、
前記基準時間内に新たな音声データが存在しないときに音声認識結果を出力する認識結果出力手段と
を備えることを特徴とする音声認識装置。 - 音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とする音声認識装置において、
言語モデルに関する情報を記憶する言語モデル記憶手段と、
前記言語モデルに含まれる認識語彙を単語群に分類して記憶する手段と、
認識候補単語列の末尾の単語を単語群と対応付けて記憶する手段と、
前記単語群ごとに前記基準時間を記憶する手段と、
前記言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出する認識候補抽出手段と、
抽出された認識候補単語列の末尾の単語が対応する単語群の基準時間内に新たな音声データが存在しないときに音声認識結果を出力する認識結果出力手段と
を備えることを特徴とする音声認識装置。 - 音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とする音声認識方法において、
言語モデルに関する情報を記憶し、
音声認識用文法に基づいて変換される認識候補単語列、及び単語列の末尾の単語が最終単語であるか否かを示す情報を記憶し、
前記言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出し、
抽出された認識候補単語列から発話末尾の単語が最終単語であるか否かを判断し、
最終単語であると判断された場合、前記基準時間より短時間で音声認識結果を出力し、最終単語ではないと判断された場合、前記基準時間内に新たな音声データが存在しないときに音声認識結果を出力することを特徴とする音声認識方法。 - 音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とする音声認識方法において、
言語モデルに関する情報を記憶し、
前記言語モデルに含まれる認識語彙を単語群に分類して記憶し、
認識候補単語列の末尾の単語を単語群と対応付けて記憶し、
前記単語群ごとの最終単語になる確率を記憶し、
前記言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出し、
抽出された認識候補単語列の末尾の単語が対応する単語群の最終単語になる確率に基づいて、前記基準時間を変更し、
前記基準時間内に新たな音声データが存在しないときに音声認識結果を出力することを特徴とする音声認識方法。 - 音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とする音声認識方法において、
言語モデルに関する情報を記憶し、
前記言語モデルに含まれる認識語彙を単語群に分類して記憶し、
認識候補単語列の末尾の単語を単語群と対応付けて記憶し、
前記単語群ごとに前記基準時間を記憶し、
前記言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出し、
抽出された認識候補単語列の末尾の単語が対応する単語群の基準時間内に新たな音声データが存在しないときに音声認識結果を出力することを特徴とする音声認識方法。 - 音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とするコンピュータで実行することが可能なコンピュータプログラムにおいて、
前記コンピュータを、
言語モデルに関する情報を記憶する言語モデル記憶手段、
音声認識用文法に基づいて変換される認識候補単語列、及び単語列の末尾の単語が最終単語であるか否かを示す情報を記憶する記憶手段、
前記言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出する認識候補抽出手段、
抽出された認識候補単語列から発話末尾の単語が最終単語であるか否かを判断する最終単語判断手段、
該最終単語判断手段で最終単語であると判断された場合、前記基準時間より短時間で音声認識結果を出力し、最終単語ではないと判断された場合、前記基準時間内に新たな音声データが存在しないときに音声認識結果を出力する認識結果出力手段
として機能させることを特徴とするコンピュータプログラム。 - 音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とするコンピュータで実行することが可能なコンピュータプログラムにおいて、
前記コンピュータを、
言語モデルに関する情報を記憶する言語モデル記憶手段、
前記言語モデルに含まれる認識語彙を単語群に分類して記憶する手段、
認識候補単語列の末尾の単語を単語群と対応付けて記憶する手段、
前記単語群ごとの最終単語になる確率を記憶する手段、
前記言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出する認識候補抽出手段、
抽出された認識候補単語列の末尾の単語が対応する単語群の最終単語になる確率に基づいて、前記基準時間を変更する手段、
前記基準時間内に新たな音声データが存在しないときに音声認識結果を出力する認識結果出力手段
として機能させることを特徴とするコンピュータプログラム。 - 音声データを受け付け、発話部分の後の無音区間の継続時間が発話の終了を判断する基準となる基準時間に到達するまで音声認識結果の出力待ち状態とするコンピュータで実行することが可能なコンピュータプログラムにおいて、
前記コンピュータを、
言語モデルに関する情報を記憶する言語モデル記憶手段、
前記言語モデルに含まれる認識語彙を単語群に分類して記憶する手段、
認識候補単語列の末尾の単語を単語群と対応付けて記憶する手段、
前記単語群ごとに前記基準時間を記憶する手段、
前記言語モデルに基づいて、受け付けた音声データに対応する認識候補単語列を抽出する認識候補抽出手段、
抽出された認識候補単語列の末尾の単語が対応する単語群の基準時間内に新たな音声データが存在しないときに音声認識結果を出力する認識結果出力手段
として機能させることを特徴とするコンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006079052A JP4906379B2 (ja) | 2006-03-22 | 2006-03-22 | 音声認識装置、音声認識方法、及びコンピュータプログラム |
US11/475,003 US7805304B2 (en) | 2006-03-22 | 2006-06-27 | Speech recognition apparatus for determining final word from recognition candidate word sequence corresponding to voice data |
CN2006101077186A CN101042866B (zh) | 2006-03-22 | 2006-07-20 | 语音识别设备及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006079052A JP4906379B2 (ja) | 2006-03-22 | 2006-03-22 | 音声認識装置、音声認識方法、及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007256482A true JP2007256482A (ja) | 2007-10-04 |
JP4906379B2 JP4906379B2 (ja) | 2012-03-28 |
Family
ID=38534643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006079052A Expired - Fee Related JP4906379B2 (ja) | 2006-03-22 | 2006-03-22 | 音声認識装置、音声認識方法、及びコンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7805304B2 (ja) |
JP (1) | JP4906379B2 (ja) |
CN (1) | CN101042866B (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011259127A (ja) * | 2010-06-08 | 2011-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 通話単位検出装置、方法及びプログラム |
JP2013545133A (ja) * | 2010-10-29 | 2013-12-19 | 安徽科大訊飛信息科技股▲分▼有限公司 | 録音の終了点自動検出のための方法及びシステム |
WO2016103809A1 (ja) * | 2014-12-25 | 2016-06-30 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
KR20170012333A (ko) * | 2014-05-27 | 2017-02-02 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 통화 중 번역 |
WO2018135743A1 (ko) * | 2017-01-17 | 2018-07-26 | 삼성전자주식회사 | 발화 완료 감지 방법 및 이를 구현한 전자 장치 |
JP2019195149A (ja) * | 2018-05-05 | 2019-11-07 | ナレルシステム株式会社 | グループ音声通信と過去音声確認のためのコンピュータシステム、コンピュータプログラム及び方法 |
JPWO2021014612A1 (ja) * | 2019-07-24 | 2021-01-28 | ||
CN113179444A (zh) * | 2021-04-20 | 2021-07-27 | 浙江工业大学 | 一种基于语音识别的音字同步方法 |
WO2024010284A1 (ko) * | 2022-07-06 | 2024-01-11 | 삼성전자주식회사 | 끝점 검출 시간 결정 방법 및 상기 방법을 수행하는 전자 장치 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8706487B2 (en) * | 2006-12-08 | 2014-04-22 | Nec Corporation | Audio recognition apparatus and speech recognition method using acoustic models and language models |
US20090198490A1 (en) * | 2008-02-06 | 2009-08-06 | International Business Machines Corporation | Response time when using a dual factor end of utterance determination technique |
JP2009288523A (ja) * | 2008-05-29 | 2009-12-10 | Toshiba Corp | 音声認識装置及びその方法 |
US9135809B2 (en) * | 2008-06-20 | 2015-09-15 | At&T Intellectual Property I, Lp | Voice enabled remote control for a set-top box |
US8478592B2 (en) * | 2008-07-08 | 2013-07-02 | Nuance Communications, Inc. | Enhancing media playback with speech recognition |
JP5393816B2 (ja) * | 2012-02-08 | 2014-01-22 | 株式会社Nttドコモ | 情報検索装置および情報検索方法 |
KR20140089871A (ko) * | 2013-01-07 | 2014-07-16 | 삼성전자주식회사 | 대화형 서버, 그 제어 방법 및 대화형 시스템 |
US20160055847A1 (en) * | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
US9652017B2 (en) * | 2014-12-17 | 2017-05-16 | Qualcomm Incorporated | System and method of analyzing audio data samples associated with speech recognition |
US10134425B1 (en) * | 2015-06-29 | 2018-11-20 | Amazon Technologies, Inc. | Direction-based speech endpointing |
US10121471B2 (en) * | 2015-06-29 | 2018-11-06 | Amazon Technologies, Inc. | Language model speech endpointing |
CN105139849B (zh) * | 2015-07-22 | 2017-05-10 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
US20170069309A1 (en) * | 2015-09-03 | 2017-03-09 | Google Inc. | Enhanced speech endpointing |
CN105513586A (zh) * | 2015-12-18 | 2016-04-20 | 百度在线网络技术(北京)有限公司 | 语音识别结果的显示方法和装置 |
JP2018116206A (ja) * | 2017-01-20 | 2018-07-26 | アルパイン株式会社 | 音声認識装置、音声認識方法及び音声認識システム |
CN107146602B (zh) * | 2017-04-10 | 2020-10-02 | 北京猎户星空科技有限公司 | 一种语音识别方法、装置及电子设备 |
KR102068182B1 (ko) * | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
US10929754B2 (en) | 2017-06-06 | 2021-02-23 | Google Llc | Unified endpointer using multitask and multidomain learning |
WO2018226779A1 (en) * | 2017-06-06 | 2018-12-13 | Google Llc | End of query detection |
US11100935B2 (en) | 2018-06-05 | 2021-08-24 | Samsung Electronics Co., Ltd. | Voice assistant device and method thereof |
EP3811360A4 (en) | 2018-06-21 | 2021-11-24 | Magic Leap, Inc. | PORTABLE SYSTEM VOICE PROCESSING |
EP3931827A4 (en) | 2019-03-01 | 2022-11-02 | Magic Leap, Inc. | INPUT DETERMINATION FOR A VOICE PROCESSING ENGINE |
JP7336537B2 (ja) * | 2019-04-16 | 2023-08-31 | グーグル エルエルシー | 組み合わせで行うエンドポイント決定と自動音声認識 |
EP3956883A4 (en) * | 2019-04-19 | 2022-12-21 | Magic Leap, Inc. | VOICE RECOGNITION ENGINE INPUT IDENTIFICATION |
US11328740B2 (en) | 2019-08-07 | 2022-05-10 | Magic Leap, Inc. | Voice onset detection |
CN110534109B (zh) * | 2019-09-25 | 2021-12-14 | 深圳追一科技有限公司 | 语音识别方法、装置、电子设备及存储介质 |
US11917384B2 (en) | 2020-03-27 | 2024-02-27 | Magic Leap, Inc. | Method of waking a device using spoken voice commands |
CN111640423B (zh) * | 2020-05-29 | 2023-10-13 | 北京声智科技有限公司 | 一种词边界估计方法、装置及电子设备 |
US11620993B2 (en) * | 2021-06-09 | 2023-04-04 | Merlyn Mind, Inc. | Multimodal intent entity resolver |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63217399A (ja) * | 1987-03-05 | 1988-09-09 | シャープ株式会社 | 音声区間検出装置 |
JPH06250689A (ja) * | 1993-02-23 | 1994-09-09 | Toshiba Corp | 音声認識装置 |
JPH10240290A (ja) * | 1996-12-27 | 1998-09-11 | N T T Data Tsushin Kk | 音声認識処理方法、音声認識システム及び記録媒体 |
JP2002091489A (ja) * | 2000-09-13 | 2002-03-27 | Alpine Electronics Inc | 音声認識装置 |
JP2002341891A (ja) * | 2001-05-14 | 2002-11-29 | Nec Corp | 音声認識装置および音声認識方法 |
JP2004037803A (ja) * | 2002-07-03 | 2004-02-05 | Nippon Telegr & Teleph Corp <Ntt> | 応答制御装置、方法及び応答制御プログラム、記録媒体 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2158849C (en) * | 1993-03-25 | 2000-09-05 | Kevin Joseph Power | Speech recognition with pause detection |
JP3004883B2 (ja) | 1994-10-18 | 2000-01-31 | ケイディディ株式会社 | 終話検出方法及び装置並びに連続音声認識方法及び装置 |
US5991720A (en) * | 1996-05-06 | 1999-11-23 | Matsushita Electric Industrial Co., Ltd. | Speech recognition system employing multiple grammar networks |
US5936940A (en) * | 1996-08-22 | 1999-08-10 | International Business Machines Corporation | Adaptive rate-based congestion control in packet networks |
JP3578587B2 (ja) * | 1997-03-28 | 2004-10-20 | 株式会社リコー | 音声認識装置および音声認識方法 |
US6490251B2 (en) * | 1997-04-14 | 2002-12-03 | Nortel Networks Limited | Method and apparatus for communicating congestion information among different protocol layers between networks |
EP1376999A1 (en) * | 2002-06-21 | 2004-01-02 | BRITISH TELECOMMUNICATIONS public limited company | Spoken alpha-numeric sequence entry system with repair mode |
CN1468001A (zh) * | 2002-06-27 | 2004-01-14 | 上海汉唐科技有限公司 | 基于因特网的媒体流自适应传输方法 |
US20040186819A1 (en) * | 2003-03-18 | 2004-09-23 | Aurilab, Llc | Telephone directory information retrieval system and method |
KR100499388B1 (ko) * | 2003-06-16 | 2005-07-04 | 엘지전자 주식회사 | 멀티 보코더의 메모리 구조 및 메모리 관리 방법 |
JP4433704B2 (ja) | 2003-06-27 | 2010-03-17 | 日産自動車株式会社 | 音声認識装置および音声認識用プログラム |
CN1671124B (zh) * | 2004-03-19 | 2011-10-19 | 清华大学 | 通信终端装置、通信终端接收方法、通信系统、网关 |
US7610199B2 (en) * | 2004-09-01 | 2009-10-27 | Sri International | Method and apparatus for obtaining complete speech signals for speech recognition applications |
-
2006
- 2006-03-22 JP JP2006079052A patent/JP4906379B2/ja not_active Expired - Fee Related
- 2006-06-27 US US11/475,003 patent/US7805304B2/en not_active Expired - Fee Related
- 2006-07-20 CN CN2006101077186A patent/CN101042866B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63217399A (ja) * | 1987-03-05 | 1988-09-09 | シャープ株式会社 | 音声区間検出装置 |
JPH06250689A (ja) * | 1993-02-23 | 1994-09-09 | Toshiba Corp | 音声認識装置 |
JPH10240290A (ja) * | 1996-12-27 | 1998-09-11 | N T T Data Tsushin Kk | 音声認識処理方法、音声認識システム及び記録媒体 |
JP2002091489A (ja) * | 2000-09-13 | 2002-03-27 | Alpine Electronics Inc | 音声認識装置 |
JP2002341891A (ja) * | 2001-05-14 | 2002-11-29 | Nec Corp | 音声認識装置および音声認識方法 |
JP2004037803A (ja) * | 2002-07-03 | 2004-02-05 | Nippon Telegr & Teleph Corp <Ntt> | 応答制御装置、方法及び応答制御プログラム、記録媒体 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011259127A (ja) * | 2010-06-08 | 2011-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 通話単位検出装置、方法及びプログラム |
JP2013545133A (ja) * | 2010-10-29 | 2013-12-19 | 安徽科大訊飛信息科技股▲分▼有限公司 | 録音の終了点自動検出のための方法及びシステム |
US9330667B2 (en) | 2010-10-29 | 2016-05-03 | Iflytek Co., Ltd. | Method and system for endpoint automatic detection of audio record |
KR20170012333A (ko) * | 2014-05-27 | 2017-02-02 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 통화 중 번역 |
JP2017525167A (ja) * | 2014-05-27 | 2017-08-31 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 通話中翻訳 |
KR102377350B1 (ko) | 2014-05-27 | 2022-03-21 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 통화 중 번역 |
US10720154B2 (en) | 2014-12-25 | 2020-07-21 | Sony Corporation | Information processing device and method for determining whether a state of collected sound data is suitable for speech recognition |
WO2016103809A1 (ja) * | 2014-12-25 | 2016-06-30 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
JPWO2016103809A1 (ja) * | 2014-12-25 | 2017-10-05 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
US11211048B2 (en) | 2017-01-17 | 2021-12-28 | Samsung Electronics Co., Ltd. | Method for sensing end of speech, and electronic apparatus implementing same |
WO2018135743A1 (ko) * | 2017-01-17 | 2018-07-26 | 삼성전자주식회사 | 발화 완료 감지 방법 및 이를 구현한 전자 장치 |
JP2019195149A (ja) * | 2018-05-05 | 2019-11-07 | ナレルシステム株式会社 | グループ音声通信と過去音声確認のためのコンピュータシステム、コンピュータプログラム及び方法 |
JPWO2021014612A1 (ja) * | 2019-07-24 | 2021-01-28 | ||
JP7409381B2 (ja) | 2019-07-24 | 2024-01-09 | 日本電信電話株式会社 | 発話区間検出装置、発話区間検出方法、プログラム |
CN113179444A (zh) * | 2021-04-20 | 2021-07-27 | 浙江工业大学 | 一种基于语音识别的音字同步方法 |
WO2024010284A1 (ko) * | 2022-07-06 | 2024-01-11 | 삼성전자주식회사 | 끝점 검출 시간 결정 방법 및 상기 방법을 수행하는 전자 장치 |
Also Published As
Publication number | Publication date |
---|---|
CN101042866B (zh) | 2012-07-04 |
US20070225982A1 (en) | 2007-09-27 |
US7805304B2 (en) | 2010-09-28 |
JP4906379B2 (ja) | 2012-03-28 |
CN101042866A (zh) | 2007-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4906379B2 (ja) | 音声認識装置、音声認識方法、及びコンピュータプログラム | |
JP4816409B2 (ja) | 認識辞書システムおよびその更新方法 | |
KR100998566B1 (ko) | 음성인식을 이용한 언어 번역 방법 및 장치 | |
JP3782943B2 (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
KR101616054B1 (ko) | 음성 검출 장치 및 방법 | |
JP5200712B2 (ja) | 音声認識装置、音声認識方法及びコンピュータプログラム | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP4236597B2 (ja) | 音声認識装置、音声認識プログラムおよび記録媒体。 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
JP2010078877A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
CN110189750B (zh) | 词语检测系统、词语检测方法以及记录介质 | |
JPH10274996A (ja) | 音声認識装置 | |
JP2012003090A (ja) | 音声認識装置および音声認識方法 | |
JP2010054574A (ja) | 話者交替推定装置、話者識別装置、及びコンピュータプログラム | |
JP4987530B2 (ja) | 音声認識辞書作成装置および音声認識装置 | |
JP4610451B2 (ja) | 音声認識装置及びプログラム | |
JP6852029B2 (ja) | ワード検出システム、ワード検出方法及びワード検出プログラム | |
JP7035476B2 (ja) | 音声処理プログラム、音声処理装置、及び音声処理方法 | |
JPH11202895A (ja) | 音声認識システムと方法およびそのプログラムを記録した記録媒体 | |
CN112997247A (zh) | 利用大数据的最佳语言模型生成方法及用于其的装置 | |
JP5336788B2 (ja) | 音声認識装置およびプログラム | |
KR101830210B1 (ko) | 적어도 하나의 의미론적 유닛의 집합을 개선하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 | |
JP2001125897A (ja) | 言語学習装置およびその方法 | |
JP2005070330A (ja) | 音声認識装置及びプログラム | |
JP2003050595A (ja) | 音声認識装置及び方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080820 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100903 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100928 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111004 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20111012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120110 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150120 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4906379 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |