JP4786384B2 - 音声処理装置、音声処理方法および音声処理プログラム - Google Patents
音声処理装置、音声処理方法および音声処理プログラム Download PDFInfo
- Publication number
- JP4786384B2 JP4786384B2 JP2006086513A JP2006086513A JP4786384B2 JP 4786384 B2 JP4786384 B2 JP 4786384B2 JP 2006086513 A JP2006086513 A JP 2006086513A JP 2006086513 A JP2006086513 A JP 2006086513A JP 4786384 B2 JP4786384 B2 JP 4786384B2
- Authority
- JP
- Japan
- Prior art keywords
- error factor
- response
- speech
- voice
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 140
- 238000003672 processing method Methods 0.000 title claims description 7
- 230000004044 response Effects 0.000 claims description 197
- 238000000034 method Methods 0.000 claims description 173
- 238000001514 detection method Methods 0.000 claims description 122
- 238000013519 translation Methods 0.000 claims description 64
- 238000004891 communication Methods 0.000 claims description 18
- 238000010187 selection method Methods 0.000 claims 4
- 238000010586 diagram Methods 0.000 description 25
- 238000004364 calculation method Methods 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000007257 malfunction Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Description
第1の実施の形態にかかる音声処理装置は、音声処理対象の発話の音響的な誤り要因を検出し、誤り要因の内容に応じて応答ユーザを切り替えるものである。
次に、誤り要因検出部103は、すべてのフレームを処理したか否かを判断し(ステップS611)、すべてのフレームを処理していない場合は(ステップS611:NO)、次のフレームの音響特徴を抽出して処理を繰り返す(ステップS604)。
第2の実施の形態にかかる音声処理装置は、第1言語で発話された発話内容の音声認識結果を第2言語に翻訳して対話相手に出力する音声翻訳処理において、音声処理時に発生した音響的な誤り要因を検出し、誤り要因の内容に応じて応答ユーザを切り替えるものである。
第3の実施の形態にかかる音声処理装置は、提示された音声認識結果から、対話相手が誤りの存在する箇所を指摘し、指摘された範囲内で発話の音響的な誤り要因を検出するものである。
第4の実施の形態にかかる音声処理装置は、検出された誤り要因の履歴を記憶し、記憶された誤り要因の履歴を参照して、誤り発生時の応答方法を切り分けるものである。
第5の実施の形態にかかる音声処理装置は、検出した誤り要因に対応した応答を実行する際、対話相手に対して応答の実行状況を提示するものである。
52 ROM
53 RAM
54 通信I/F
61 バス
100 音声処理装置
101 入力受付部
102 音声認識部
103 誤り要因検出部
104 解決手段決定部
105 応答ユーザ選択部
106 応答実行部
110 表示部
121 音声入力部
122 通信部
130 記憶部
131 規則テーブル
900 音声処理装置
906 応答実行部
907 翻訳部
1101 表示画面
1102、1104 表示フィールド
1201 表示画面
1202 表示フィールド
1300 音声処理装置
1303 誤り要因検出部
1308 誤り箇所同定部
1501 表示画面
1502、1503、1504 表示フィールド
1601 表示画面
1602 日本語
1603 表示フィールド
1604 下線
1701 表示画面
1702 表示フィールド
1801 表示画面
1802、1803 表示フィールド
1901 表示画面
1902 表示フィールド
2000 音声処理装置
2004 解決手段決定部
2005 応答ユーザ選択部
2030 記憶部
2031 規則テーブル
2032 履歴管理テーブル
2501 表示画面
2502、2503 表示フィールド
Claims (17)
- 音声の入力を受付ける入力受付手段と、
前記入力受付手段が受付けた前記音声を認識する音声認識手段と、
前記音声認識手段が前記音声を認識した際に発生した誤り要因を検出する誤り要因検出手段と、
音声認識の誤り要因と、音声認識で誤りが発生したときの応答方法と、前記入力受付手段が受付けた音声を発話したユーザを表す第1ユーザおよび前記入力受付手段が受付けた音声を発話していないユーザを表す第2ユーザのいずれかを表す応答ユーザとを対応づけた規則を格納する規則記憶手段と、
前記誤り要因検出手段が検出した前記誤り要因に対応づけられた前記応答方法を前記規則記憶手段から選択する応答方法選択手段と、
前記誤り要因検出手段が検出した前記誤り要因に対応づけられた前記応答ユーザを前記規則記憶手段から選択する応答ユーザ選択手段と、
前記応答ユーザ選択手段が選択した前記応答ユーザに対して、前記応答方法選択手段が選択した前記応答方法により前記応答を実行する応答実行手段と、
を備えたことを特徴とする音声処理装置。 - 前記音声認識手段が前記音声を認識した結果のうち、誤りが存在する部分の指定の入力を受付ける誤り箇所受付手段をさらに備え、
前記誤り要因検出手段は、前記誤り箇所受付手段が受付けた前記部分の指定から、前記音声認識手段が前記音声を認識した際に発生した前記誤り要因を検出することを特徴とする請求項1に記載の音声処理装置。 - 検出された前記誤り要因の履歴を格納する履歴記憶手段と、
前記誤り要因検出手段が前記誤り要因を検出したときに、前記履歴記憶手段から前記履歴を取得する取得手段と、をさらに備え、
前記規則記憶手段は、前記履歴に関する予め定められた条件と、前記誤り要因と、前記応答方法と、前記応答ユーザとを対応づけた前記規則を格納し、
前記取得手段は、取得した前記履歴に関する前記条件を取得し、
前記応答方法選択手段は、前記取得手段が取得した前記条件と前記誤り要因検出手段が検出した前記誤り要因とに対応づけられた前記応答方法を前記規則記憶手段から選択し、
前記応答ユーザ選択手段は、前記取得手段が取得した前記条件と前記誤り要因検出手段が検出した前記誤り要因とに対応づけられた前記応答ユーザを前記規則記憶手段から選択することを特徴とする請求項1に記載の音声処理装置。 - 前記規則記憶手段は、誤りの検出対象となる前記音声の前に入力された前記音声を認識した際に発生した前記誤り要因と、誤りの検出対象となる前記音声を認識した際に発生した前記誤り要因との関係を表す前記条件を対応づけた前記規則を格納することを特徴とする請求項3に記載の音声処理装置。
- 前記音声認識手段が認識した第1の言語による前記音声の認識結果を第2の言語に翻訳する翻訳手段をさらに備え、
前記規則記憶手段は、前記第1の言語による前記音声を入力した前記第1ユーザおよび前記第2の言語による翻訳結果を受け取る前記第2ユーザの少なくとも一方を前記応答ユーザとして対応づけた規則を格納し、
前記応答実行手段は、前記第1ユーザおよび前記第2ユーザの少なくとも一方に対して前記応答を実行することを特徴とする請求項1に記載の音声処理装置。 - 前記応答実行手段は、前記応答ユーザ選択手段が選択した前記応答ユーザに対して前記応答を実行し、前記応答ユーザ選択手段が選択しなかった他のユーザに対して、前記応答に関する情報を提示することを特徴とする請求項1に記載の音声処理装置。
- 前記誤り要因検出手段は、前記誤り要因として、少なくとも前記音声の発声速度を検出することを特徴とする請求項1に記載の音声処理装置。
- 前記誤り要因検出手段は、前記誤り要因として、少なくとも前記音声の音量を検出することを特徴とする請求項1に記載の音声処理装置。
- 前記誤り要因検出手段は、前記誤り要因として、少なくとも前記音声に含まれる雑音を検出することを特徴とする請求項1に記載の音声処理装置。
- 前記誤り要因検出手段は、前記雑音として、少なくとも予め定められた第1の時間以上継続して発生する定常雑音を検出することを特徴とする請求項9に記載の音声処理装置。
- 前記誤り要因検出手段は、前記雑音として、前記定常雑音と、前記第1の時間より短い時間であって、予め定められた第2の時間内に発生する突発雑音とを検出することを特徴とする請求項10に記載の音声処理装置。
- 前記規則記憶手段は、前記音声の全体で発生した前記誤り要因または前記音声の一部で発生した前記誤り要因と、前記応答方法と、前記応答ユーザとを対応づけた規則を格納し、
前記誤り要因検出手段は、前記音声の全体または前記音声の一部で発生した前記誤り要因を検出することを特徴とする請求項1に記載の音声処理装置。 - 前記音声認識手段が認識した前記音声の認識結果を出力する表示手段をさらに備え、
前記応答実行手段は、前記誤り要因検出手段が前記音声の一部で発声した前記誤り要因を検出した場合に、前記誤り要因が検出された前記音声の一部に対応する前記認識結果の部分に、前記誤り要因が検出されたことを示す情報を関連づけて前記表示手段に出力することを特徴とする請求項12に記載の音声処理装置。 - 前記音声を入力する音声入力手段をさらに備え、
前記入力受付手段は、前記音声入力手段から前記音声の入力を受付けることを特徴とする請求項1に記載の音声処理装置。 - 外部装置と情報の送受信を行う通信手段をさらに備え、
前記入力受付手段は、前記通信手段を介して前記外部装置から送信された前記音声の入力を受付けることを特徴とする請求項1に記載の音声処理装置。 - 音声の入力を受付ける入力受付ステップと、
前記入力受付ステップが受付けた前記音声を認識する音声認識ステップと、
前記音声認識ステップが前記音声を認識した際に発生した誤り要因を検出する誤り要因検出ステップと、
音声認識の誤り要因と、音声認識で誤りが発生したときの応答方法と、前記入力受付ステップが受付けた音声を発話したユーザを表す第1ユーザおよび前記入力受付ステップが受付けた音声を発話していないユーザを表す第2ユーザのいずれかを表す応答ユーザとを対応づけた規則を格納する規則記憶手段から、前記誤り要因検出ステップが検出した前記誤り要因に対応づけられた前記応答方法を選択する応答方法選択ステップと、
前記誤り要因検出ステップが検出した前記誤り要因に対応づけられた前記応答ユーザを前記規則記憶手段から選択する応答ユーザ選択ステップと、
前記応答ユーザ選択ステップが選択した前記応答ユーザに対して、前記応答方法選択ステップが選択した前記応答方法により前記応答を実行する応答実行ステップと、
を備えたことを特徴とする音声処理方法。 - 音声の入力を受付ける入力受付手順と、
前記入力受付手順が受付けた前記音声を認識する音声認識手順と、
前記音声認識手順が前記音声を認識した際に発生した誤り要因を検出する誤り要因検出手順と、
音声認識の誤り要因と、音声認識で誤りが発生したときの応答方法と、前記入力受付手順が受付けた音声を発話したユーザを表す第1ユーザおよび前記入力受付手順が受付けた音声を発話していないユーザを表す第2ユーザのいずれかを表す応答ユーザとを対応づけた規則を格納する規則記憶手段から、前記誤り要因検出手順が検出した前記誤り要因に対応づけられた前記応答方法を選択する応答方法選択手順と、
前記誤り要因検出手順が検出した前記誤り要因に対応づけられた前記応答ユーザを前記規則記憶手段から選択する応答ユーザ選択手順と、
前記応答ユーザ選択手順が選択した前記応答ユーザに対して、前記応答方法選択手順が選択した前記応答方法により前記応答を実行する応答実行手順と、
をコンピュータに実行させる音声処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006086513A JP4786384B2 (ja) | 2006-03-27 | 2006-03-27 | 音声処理装置、音声処理方法および音声処理プログラム |
CNA2007101016257A CN101046960A (zh) | 2006-03-27 | 2007-03-09 | 处理语音中的话音的装置和方法 |
US11/685,907 US7949523B2 (en) | 2006-03-27 | 2007-03-14 | Apparatus, method, and computer program product for processing voice in speech |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006086513A JP4786384B2 (ja) | 2006-03-27 | 2006-03-27 | 音声処理装置、音声処理方法および音声処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007264126A JP2007264126A (ja) | 2007-10-11 |
JP4786384B2 true JP4786384B2 (ja) | 2011-10-05 |
Family
ID=38534637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006086513A Expired - Fee Related JP4786384B2 (ja) | 2006-03-27 | 2006-03-27 | 音声処理装置、音声処理方法および音声処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7949523B2 (ja) |
JP (1) | JP4786384B2 (ja) |
CN (1) | CN101046960A (ja) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100100383A1 (en) * | 2008-10-17 | 2010-04-22 | Aibelive Co., Ltd. | System and method for searching webpage with voice control |
JP5163519B2 (ja) * | 2009-01-29 | 2013-03-13 | 富士通株式会社 | インタビュー支援方法、装置及びプログラム |
US20100198583A1 (en) * | 2009-02-04 | 2010-08-05 | Aibelive Co., Ltd. | Indicating method for speech recognition system |
WO2010098209A1 (ja) * | 2009-02-26 | 2010-09-02 | 国立大学法人豊橋技術科学大学 | 音声検索装置および音声検索方法 |
US8185373B1 (en) * | 2009-05-05 | 2012-05-22 | The United States Of America As Represented By The Director, National Security Agency, The | Method of assessing language translation and interpretation |
KR20110010939A (ko) * | 2009-07-27 | 2011-02-08 | 삼성전자주식회사 | 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법 |
CN102376303B (zh) * | 2010-08-13 | 2014-03-12 | 国基电子(上海)有限公司 | 录音设备及利用该录音设备进行声音处理与录入的方法 |
JP5017441B2 (ja) * | 2010-10-28 | 2012-09-05 | 株式会社東芝 | 携帯型電子機器 |
JP5653392B2 (ja) * | 2012-06-29 | 2015-01-14 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
CN103685196B (zh) * | 2012-09-19 | 2017-04-26 | 上海港联电信股份有限公司 | 基于云计算的精准数据分析通话系统及其方法 |
KR102070196B1 (ko) | 2012-09-20 | 2020-01-30 | 삼성전자 주식회사 | 사용자 디바이스에서 상황 인식 서비스 제공 방법 및 장치 |
US10042603B2 (en) * | 2012-09-20 | 2018-08-07 | Samsung Electronics Co., Ltd. | Context aware service provision method and apparatus of user device |
CN103744842A (zh) * | 2013-12-23 | 2014-04-23 | 武汉传神信息技术有限公司 | 一种翻译错误的数据分析方法 |
CN103744843B (zh) * | 2013-12-25 | 2017-01-04 | 北京百度网讯科技有限公司 | 一种在线语音翻译方法及装置 |
JP5802784B2 (ja) * | 2014-03-24 | 2015-11-04 | 株式会社東芝 | 音声処理装置および音声処理方法 |
US9870772B2 (en) * | 2014-05-02 | 2018-01-16 | Sony Interactive Entertainment Inc. | Guiding device, guiding method, program, and information storage medium |
JP6394103B2 (ja) * | 2014-06-20 | 2018-09-26 | 富士通株式会社 | 音声処理装置、音声処理方法および音声処理プログラム |
JP6464703B2 (ja) * | 2014-12-01 | 2019-02-06 | ヤマハ株式会社 | 会話評価装置およびプログラム |
EP3239975A4 (en) * | 2014-12-26 | 2018-08-08 | Sony Corporation | Information processing device, information processing method, and program |
US10796805B2 (en) | 2015-10-08 | 2020-10-06 | Cordio Medical Ltd. | Assessment of a pulmonary condition by speech analysis |
WO2017104272A1 (ja) * | 2015-12-18 | 2017-06-22 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
WO2017168936A1 (ja) * | 2016-03-31 | 2017-10-05 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
WO2017171864A1 (en) * | 2016-04-01 | 2017-10-05 | Intel Corporation | Acoustic environment understanding in machine-human speech communication |
US10339224B2 (en) * | 2016-07-13 | 2019-07-02 | Fujitsu Social Science Laboratory Limited | Speech recognition and translation terminal, method and non-transitory computer readable medium |
JP7014163B2 (ja) * | 2016-07-19 | 2022-02-01 | ソニーグループ株式会社 | 情報処理装置、および情報処理方法 |
CN106231197A (zh) * | 2016-08-16 | 2016-12-14 | 北京金山安全软件有限公司 | 一种视频拍摄控制方法、装置及电子设备 |
CN106231196A (zh) * | 2016-08-16 | 2016-12-14 | 北京金山安全软件有限公司 | 一种视频拍摄控制方法、装置及电子设备 |
JP6569926B2 (ja) * | 2016-08-17 | 2019-09-04 | パナソニックIpマネジメント株式会社 | 音声入力装置、翻訳装置、音声入力方法、及び音声入力プログラム |
CN106210545A (zh) * | 2016-08-22 | 2016-12-07 | 北京金山安全软件有限公司 | 一种视频拍摄方法、装置及电子设备 |
GB2564478A (en) * | 2017-07-14 | 2019-01-16 | Univ Sheffield | Speech processing systems |
CN107464564B (zh) * | 2017-08-21 | 2023-05-26 | 腾讯科技(深圳)有限公司 | 语音交互方法、装置及设备 |
KR102485342B1 (ko) * | 2017-12-11 | 2023-01-05 | 현대자동차주식회사 | 차량의 환경에 기반한 추천 신뢰도 판단 장치 및 방법 |
KR20190113130A (ko) * | 2018-03-27 | 2019-10-08 | 삼성전자주식회사 | 사용자 음성 입력을 처리하는 장치 |
US20210201929A1 (en) * | 2018-05-31 | 2021-07-01 | Sony Corporation | Information processing apparatus, information processing method, and program |
US10891950B2 (en) * | 2018-09-27 | 2021-01-12 | International Business Machines Corporation | Graph based prediction for next action in conversation flow |
US10847177B2 (en) | 2018-10-11 | 2020-11-24 | Cordio Medical Ltd. | Estimating lung volume by speech analysis |
US11024327B2 (en) | 2019-03-12 | 2021-06-01 | Cordio Medical Ltd. | Diagnostic techniques based on speech models |
US11011188B2 (en) | 2019-03-12 | 2021-05-18 | Cordio Medical Ltd. | Diagnostic techniques based on speech-sample alignment |
JP7312639B2 (ja) * | 2019-07-29 | 2023-07-21 | 株式会社第一興商 | カラオケ用入力装置 |
CN110364155A (zh) * | 2019-07-30 | 2019-10-22 | 广东美的制冷设备有限公司 | 语音控制报错方法、电器及计算机可读存储介质 |
US11484211B2 (en) | 2020-03-03 | 2022-11-01 | Cordio Medical Ltd. | Diagnosis of medical conditions using voice recordings and auscultation |
US11417342B2 (en) | 2020-06-29 | 2022-08-16 | Cordio Medical Ltd. | Synthesizing patient-specific speech models |
CN112257165B (zh) * | 2020-10-30 | 2023-10-31 | 深圳供电局有限公司 | 一种变电工程可研与人工智能辅助审查方法 |
CN113223538B (zh) * | 2021-04-01 | 2022-05-03 | 北京百度网讯科技有限公司 | 语音唤醒方法、装置、系统、设备和存储介质 |
US11810558B2 (en) * | 2021-05-26 | 2023-11-07 | International Business Machines Corporation | Explaining anomalous phonetic translations |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5623609A (en) * | 1993-06-14 | 1997-04-22 | Hal Trust, L.L.C. | Computer system and computer-implemented process for phonology-based automatic speech recognition |
FR2723457B1 (fr) * | 1994-08-08 | 1997-01-31 | Oce Graphics France | Procede de reconnaissance automatique d'un langage dans lequel des donnees numeriques sont recues |
GB2370401A (en) * | 2000-12-19 | 2002-06-26 | Nokia Mobile Phones Ltd | Speech recognition |
US7346492B2 (en) * | 2001-01-24 | 2008-03-18 | Shaw Stroz Llc | System and method for computerized psychological content analysis of computer and media generated communications to produce communications management support, indications, and warnings of dangerous behavior, assessment of media images, and personnel selection support |
JP4042360B2 (ja) * | 2001-07-18 | 2008-02-06 | 日本電気株式会社 | 自動通訳システム及びその方法並びにプログラム |
US20030033266A1 (en) * | 2001-08-10 | 2003-02-13 | Schott Wade F. | Apparatus and method for problem solving using intelligent agents |
US7567676B2 (en) * | 2002-05-03 | 2009-07-28 | Harman International Industries, Incorporated | Sound event detection and localization system using power analysis |
JP2003330491A (ja) * | 2002-05-10 | 2003-11-19 | Nec Corp | 音声認識装置および音声認識方法ならびにプログラム |
JP3926242B2 (ja) * | 2002-09-19 | 2007-06-06 | 富士通株式会社 | 音声対話システム、音声対話のためのプログラムおよび音声対話方法 |
JP4074543B2 (ja) * | 2003-04-23 | 2008-04-09 | シャープ株式会社 | 音声処理装置、音声処理方法、音声処理プログラム、および、プログラム記録媒体 |
US20060122834A1 (en) * | 2004-12-03 | 2006-06-08 | Bennett Ian M | Emotion detection device & method for use in distributed systems |
US20060122837A1 (en) * | 2004-12-08 | 2006-06-08 | Electronics And Telecommunications Research Institute | Voice interface system and speech recognition method |
JP4405418B2 (ja) | 2005-03-30 | 2010-01-27 | 株式会社東芝 | 情報処理装置及びその方法 |
-
2006
- 2006-03-27 JP JP2006086513A patent/JP4786384B2/ja not_active Expired - Fee Related
-
2007
- 2007-03-09 CN CNA2007101016257A patent/CN101046960A/zh active Pending
- 2007-03-14 US US11/685,907 patent/US7949523B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007264126A (ja) | 2007-10-11 |
US20070225975A1 (en) | 2007-09-27 |
US7949523B2 (en) | 2011-05-24 |
CN101046960A (zh) | 2007-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4786384B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
JP4791984B2 (ja) | 入力された音声を処理する装置、方法およびプログラム | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
JP4542974B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
US10176809B1 (en) | Customized compression and decompression of audio data | |
US10163436B1 (en) | Training a speech processing system using spoken utterances | |
EP2645364B1 (en) | Spoken dialog system using prominence | |
US20170371863A1 (en) | Intention inference system and intention inference method | |
JPH09500223A (ja) | 多言語音声認識システム | |
JPH096389A (ja) | 音声認識対話処理方法および音声認識対話装置 | |
JP2008077601A (ja) | 機械翻訳装置、機械翻訳方法および機械翻訳プログラム | |
JP2007500367A (ja) | 音声認識方法およびコミュニケーション機器 | |
CN111243599B (zh) | 语音识别模型构建方法、装置、介质及电子设备 | |
KR101836430B1 (ko) | 음성 인식과 번역 방법 및 그를 위한 단말 장치와 서버 | |
CN110675866B (zh) | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 | |
WO2006083020A1 (ja) | 抽出された音声データを用いて応答音声を生成する音声認識システム | |
US10143027B1 (en) | Device selection for routing of communications | |
US20170337922A1 (en) | System and methods for modifying user pronunciation to achieve better recognition results | |
KR20210036169A (ko) | 대화 시스템, 대화 처리 방법, 번역 장치 및 번역 방법 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
US20040006469A1 (en) | Apparatus and method for updating lexicon | |
JP6723907B2 (ja) | 言語認識システム、言語認識方法、及び言語認識プログラム | |
JP6397641B2 (ja) | 自動通訳装置及び方法 | |
Manjunath et al. | Automatic phonetic transcription for read, extempore and conversation speech for an Indian language: Bengali |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070926 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110524 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110621 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110713 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4786384 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140722 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |