JP2014191030A - 音声認識端末およびコンピュータ端末を用いる音声認識方法 - Google Patents
音声認識端末およびコンピュータ端末を用いる音声認識方法 Download PDFInfo
- Publication number
- JP2014191030A JP2014191030A JP2013063878A JP2013063878A JP2014191030A JP 2014191030 A JP2014191030 A JP 2014191030A JP 2013063878 A JP2013063878 A JP 2013063878A JP 2013063878 A JP2013063878 A JP 2013063878A JP 2014191030 A JP2014191030 A JP 2014191030A
- Authority
- JP
- Japan
- Prior art keywords
- terminal
- voice
- server
- recognition
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000004044 response Effects 0.000 claims abstract description 165
- 238000004891 communication Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims 2
- 238000012545 processing Methods 0.000 description 13
- 238000005304 joining Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 241001149724 Cololabis adocetus Species 0.000 description 2
- 241000237503 Pectinidae Species 0.000 description 2
- 241000277331 Salmonidae Species 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 235000020637 scallop Nutrition 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 1
- 241001313700 Gadus chalcogrammus Species 0.000 description 1
- 241001098054 Pollachius pollachius Species 0.000 description 1
- 241000785681 Sander vitreus Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】
端末は、ユーザからの音声を検出して認識し(S11、S12)、サーバにも音声の特徴データなどを送信する(S13)。サーバは、端末から受領したデータの音声認識処理を行い(S22)、その認識結果から回答を生成して端末に送信する(S23)。端末は、必要がある場合は場つなぎ処理を適用して、不自然に間延びしないように第1応答文を生成して出力する(S14〜S16)。場つなぎ処理が不要な場合、端末は、端末側の認識結果に基づいて第1応答文を生成し出力する。端末は、サーバからの回答を受信すると、その回答を用いて第2応答文を生成し、出力する(S18)。
【選択図】図3
Description
Claims (9)
- 音声を認識して応答する音声認識端末であって、
音声入力部から入力される音声を認識する端末側音声認識部と、
音声認識機能を有するサーバに前記音声に関するデータを送信し、前記サーバからサーバ側認識結果を受信する端末側通信制御部と、
前記端末側音声認識部による端末側認識結果に基づき第1応答文を生成して音声出力部から出力し、前記サーバ側認識結果に基づき第2応答文を生成して前記音声出力部から出力する、端末側応答生成部と、
を備える
音声認識端末。 - 前記端末側応答生成部は、前記端末側音声認識部の認識結果のうち所定値以上の尤度を有するキーワードに基づいて前記第1応答文を生成する、
請求項1に記載の音声認識端末。 - 前記端末側応答生成部は、予め設定される場つなぎ条件が成立した場合、前記第1応答文に関して所定の場つなぎ処理を適用する、
請求項1または2のいずれかに記載の音声認識端末。 - 前記場つなぎ条件が成立する場合とは、前記端末側音声認識部の認識結果に所定値以上の尤度を有するキーワードが存在しない場合、および/または、前記サーバ側認識結果を受信するまでの時間が所定の待ち時間以上の場合である、
請求項3に記載の音声認識端末。 - 前記所定の場つなぎ処理には、前記第1応答文を前記音声出力部から出力する速度を所定の基準速度よりも遅くする処理、および/または、前記第1応答文の出力前、出力中、出力後のいずれか一つ以上のタイミングで所定の場つなぎ語を挿入して前記音声出力部から出力する処理が含まれる、
請求項3または4のいずれかに記載の音声認識端末。 - 前記端末側応答生成部は、過去の応答履歴と前記サーバ側認識結果を用いて前記第2応答文を作成することができる、
請求項1〜5のいずれかに記載の音声認識端末。 - 前記端末側応答生成部は、前記サーバ側認識結果と前記端末側認識結果とが異なる場合は前記サーバ側認識結果が正しいものとして扱い、前記第1応答文の誤りを修正するための文を含めて前記第2応答文を生成する、
請求項1〜6のいずれかに記載の音声認識端末。 - コンピュータ端末を用いる音声認識方法であって、
前記コンピュータ端末に接続される音声入力部から入力される音声を前記コンピュータ端末内の音声認識部で認識するステップと、
音声認識機能を有するサーバに前記音声に関するデータを送信するステップと、
前記サーバからサーバ側認識結果を受信するステップと、
前記コンピュータ端末内の音声認識部による端末側認識結果に基づき第1応答文を生成して音声出力部から出力するステップと、
前記サーバから受信した前記サーバ側認識結果に基づき第2応答文を生成して前記音声出力部から出力するステップと、
をそれぞれ実行するコンピュータ端末を用いる音声認識方法。 - コンピュータを音声認識端末として機能させるコンピュータプログラムであって、
前記コンピュータに接続される音声入力部から入力される音声を認識する端末側音声認識部と、
音声認識機能を有するサーバに前記音声に関するデータを送信し、前記サーバからサーバ側認識結果を受信する端末側通信制御部と、
前記端末側音声認識部による端末側認識結果に基づき第1応答文を生成して音声出力部から出力し、前記サーバ側認識結果に基づき第2応答文を生成して前記音声出力部から出力する端末側応答生成部と、
を前記コンピュータ上に実現するためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013063878A JP5753869B2 (ja) | 2013-03-26 | 2013-03-26 | 音声認識端末およびコンピュータ端末を用いる音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013063878A JP5753869B2 (ja) | 2013-03-26 | 2013-03-26 | 音声認識端末およびコンピュータ端末を用いる音声認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014191030A true JP2014191030A (ja) | 2014-10-06 |
JP5753869B2 JP5753869B2 (ja) | 2015-07-22 |
Family
ID=51837363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013063878A Active JP5753869B2 (ja) | 2013-03-26 | 2013-03-26 | 音声認識端末およびコンピュータ端末を用いる音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5753869B2 (ja) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015135419A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
JP2015135420A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
WO2016052164A1 (ja) * | 2014-09-30 | 2016-04-07 | シャープ株式会社 | 対話装置 |
JP2016090681A (ja) * | 2014-10-31 | 2016-05-23 | マツダ株式会社 | 車両用音声対話装置 |
JP2016126294A (ja) * | 2015-01-08 | 2016-07-11 | シャープ株式会社 | 音声対話制御装置、音声対話制御装置の制御方法、および音声対話装置 |
WO2017006766A1 (ja) * | 2015-07-09 | 2017-01-12 | ヤマハ株式会社 | 音声対話方法および音声対話装置 |
JP2017049471A (ja) * | 2015-09-03 | 2017-03-09 | カシオ計算機株式会社 | 対話制御装置、対話制御方法及びプログラム |
WO2017200078A1 (ja) * | 2016-05-20 | 2017-11-23 | 日本電信電話株式会社 | 対話方法、対話システム、対話装置、およびプログラム |
CN107995249A (zh) * | 2016-10-27 | 2018-05-04 | 中兴通讯股份有限公司 | 一种语音播报的方法和装置 |
JP2018124425A (ja) * | 2017-02-01 | 2018-08-09 | ファーハット ロボティクス エービー | 音声対話装置及び音声対話方法 |
EP3370230A1 (en) | 2017-03-03 | 2018-09-05 | Kyoto University | Voice interaction apparatus, its processing method, and program |
JP2019053473A (ja) * | 2017-09-14 | 2019-04-04 | 日本電信電話株式会社 | 擬似応答送信装置、相づち表現学習装置、情報端末装置、通信システム、擬似応答送信方法、相づち表現学習方法および擬似応答送信プログラム |
CN110021294A (zh) * | 2018-01-09 | 2019-07-16 | 深圳市优必选科技有限公司 | 机器人的控制方法、装置以及存储装置 |
WO2019138477A1 (ja) * | 2018-01-10 | 2019-07-18 | 株式会社ウフル | スマートスピーカー、スマートスピーカーの制御方法、及びプログラム |
JP2019124855A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社ユピテル | 装置及びプログラム等 |
JP2019144831A (ja) * | 2018-02-20 | 2019-08-29 | トヨタ自動車株式会社 | 情報処理装置および情報処理方法 |
JP2019527392A (ja) * | 2016-06-27 | 2019-09-26 | グーグル エルエルシー | デジタルアシスタント要求の非同期処理 |
WO2020175384A1 (en) * | 2019-02-25 | 2020-09-03 | Clarion Co., Ltd. | Hybrid voice interaction system and hybrid voice interaction method |
WO2020217318A1 (ja) * | 2019-04-23 | 2020-10-29 | 三菱電機株式会社 | 機器制御装置、および、機器制御方法 |
US11538474B2 (en) | 2019-09-19 | 2022-12-27 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device thereof |
JP2023505917A (ja) * | 2020-11-20 | 2023-02-14 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 音声インタラクション方法、装置、機器、及びコンピュータ記憶媒体 |
JP7451033B2 (ja) | 2020-03-06 | 2024-03-18 | アルパイン株式会社 | データ処理システム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108428448A (zh) * | 2017-02-13 | 2018-08-21 | 芋头科技(杭州)有限公司 | 一种语音端点检测方法及语音识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002318132A (ja) * | 2001-04-23 | 2002-10-31 | Hitachi Ltd | 音声対話型ナビゲーションシステムおよび移動端末装置および音声対話サーバ |
JP2010085536A (ja) * | 2008-09-30 | 2010-04-15 | Fyuutorekku:Kk | 音声認識システム、音声認識方法、音声認識クライアントおよびプログラム |
JP2012137777A (ja) * | 1999-10-05 | 2012-07-19 | Research In Motion Ltd | 出力オーディオ信号が生ずる間に入力音声信号を処理する方法および装置 |
JP2012168349A (ja) * | 2011-02-15 | 2012-09-06 | Alpine Electronics Inc | 音声認識システムおよびこれを用いた検索システム |
-
2013
- 2013-03-26 JP JP2013063878A patent/JP5753869B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012137777A (ja) * | 1999-10-05 | 2012-07-19 | Research In Motion Ltd | 出力オーディオ信号が生ずる間に入力音声信号を処理する方法および装置 |
JP2002318132A (ja) * | 2001-04-23 | 2002-10-31 | Hitachi Ltd | 音声対話型ナビゲーションシステムおよび移動端末装置および音声対話サーバ |
JP2010085536A (ja) * | 2008-09-30 | 2010-04-15 | Fyuutorekku:Kk | 音声認識システム、音声認識方法、音声認識クライアントおよびプログラム |
JP2012168349A (ja) * | 2011-02-15 | 2012-09-06 | Alpine Electronics Inc | 音声認識システムおよびこれを用いた検索システム |
Cited By (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015135419A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
JP2015135420A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社デンソー | 音声認識端末装置、音声認識システム、音声認識方法 |
US9349371B2 (en) | 2014-01-17 | 2016-05-24 | Denso Corporation | Speech recognition terminal device, speech recognition system, and speech recognition method |
US9349370B2 (en) | 2014-01-17 | 2016-05-24 | Denso Corporation | Speech recognition terminal device, speech recognition system, and speech recognition method |
WO2016052164A1 (ja) * | 2014-09-30 | 2016-04-07 | シャープ株式会社 | 対話装置 |
JP2016090681A (ja) * | 2014-10-31 | 2016-05-23 | マツダ株式会社 | 車両用音声対話装置 |
JP2016126294A (ja) * | 2015-01-08 | 2016-07-11 | シャープ株式会社 | 音声対話制御装置、音声対話制御装置の制御方法、および音声対話装置 |
JP2017021125A (ja) * | 2015-07-09 | 2017-01-26 | ヤマハ株式会社 | 音声対話装置 |
WO2017006766A1 (ja) * | 2015-07-09 | 2017-01-12 | ヤマハ株式会社 | 音声対話方法および音声対話装置 |
JP2017049471A (ja) * | 2015-09-03 | 2017-03-09 | カシオ計算機株式会社 | 対話制御装置、対話制御方法及びプログラム |
WO2017200078A1 (ja) * | 2016-05-20 | 2017-11-23 | 日本電信電話株式会社 | 対話方法、対話システム、対話装置、およびプログラム |
US11232789B2 (en) | 2016-05-20 | 2022-01-25 | Nippon Telegraph And Telephone Corporation | Dialogue establishing utterances without content words |
JPWO2017200078A1 (ja) * | 2016-05-20 | 2019-03-28 | 日本電信電話株式会社 | 対話方法、対話システム、対話装置、およびプログラム |
US10777204B2 (en) | 2016-06-27 | 2020-09-15 | Google Llc | Asynchronous processing of user requests |
JP2019527392A (ja) * | 2016-06-27 | 2019-09-26 | グーグル エルエルシー | デジタルアシスタント要求の非同期処理 |
US11302333B2 (en) | 2016-06-27 | 2022-04-12 | Google Llc | Asynchronous processing of user requests |
CN107995249A (zh) * | 2016-10-27 | 2018-05-04 | 中兴通讯股份有限公司 | 一种语音播报的方法和装置 |
JP2018124425A (ja) * | 2017-02-01 | 2018-08-09 | ファーハット ロボティクス エービー | 音声対話装置及び音声対話方法 |
CN108630203A (zh) * | 2017-03-03 | 2018-10-09 | 国立大学法人京都大学 | 语音交互设备及其处理方法和程序 |
CN108630203B (zh) * | 2017-03-03 | 2022-12-20 | 国立大学法人京都大学 | 语音交互设备及其处理方法和程序 |
US20180253280A1 (en) | 2017-03-03 | 2018-09-06 | Toyota Jidosha Kabushiki Kaisha | Voice interaction apparatus, its processing method, and program |
EP3370230A1 (en) | 2017-03-03 | 2018-09-05 | Kyoto University | Voice interaction apparatus, its processing method, and program |
US10452352B2 (en) | 2017-03-03 | 2019-10-22 | Toyota Jidosha Kabushiki Kaisha | Voice interaction apparatus, its processing method, and program |
JP2019053473A (ja) * | 2017-09-14 | 2019-04-04 | 日本電信電話株式会社 | 擬似応答送信装置、相づち表現学習装置、情報端末装置、通信システム、擬似応答送信方法、相づち表現学習方法および擬似応答送信プログラム |
CN110021294A (zh) * | 2018-01-09 | 2019-07-16 | 深圳市优必选科技有限公司 | 机器人的控制方法、装置以及存储装置 |
WO2019138477A1 (ja) * | 2018-01-10 | 2019-07-18 | 株式会社ウフル | スマートスピーカー、スマートスピーカーの制御方法、及びプログラム |
JP2019124855A (ja) * | 2018-01-18 | 2019-07-25 | 株式会社ユピテル | 装置及びプログラム等 |
JP7130201B2 (ja) | 2018-01-18 | 2022-09-05 | 株式会社ユピテル | 装置及びプログラム等 |
JP2019144831A (ja) * | 2018-02-20 | 2019-08-29 | トヨタ自動車株式会社 | 情報処理装置および情報処理方法 |
US11269936B2 (en) | 2018-02-20 | 2022-03-08 | Toyota Jidosha Kabushiki Kaisha | Information processing device and information processing method |
WO2020175384A1 (en) * | 2019-02-25 | 2020-09-03 | Clarion Co., Ltd. | Hybrid voice interaction system and hybrid voice interaction method |
US20220148574A1 (en) * | 2019-02-25 | 2022-05-12 | Faurecia Clarion Electronics Co., Ltd. | Hybrid voice interaction system and hybrid voice interaction method |
JPWO2020217318A1 (ja) * | 2019-04-23 | 2021-10-14 | 三菱電機株式会社 | 機器制御装置、および、機器制御方法 |
CN113711307A (zh) * | 2019-04-23 | 2021-11-26 | 三菱电机株式会社 | 设备控制装置及设备控制方法 |
WO2020217318A1 (ja) * | 2019-04-23 | 2020-10-29 | 三菱電機株式会社 | 機器制御装置、および、機器制御方法 |
CN113711307B (zh) * | 2019-04-23 | 2023-06-27 | 三菱电机株式会社 | 设备控制装置及设备控制方法 |
US11538474B2 (en) | 2019-09-19 | 2022-12-27 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device thereof |
JP7451033B2 (ja) | 2020-03-06 | 2024-03-18 | アルパイン株式会社 | データ処理システム |
JP2023505917A (ja) * | 2020-11-20 | 2023-02-14 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 音声インタラクション方法、装置、機器、及びコンピュータ記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP5753869B2 (ja) | 2015-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5753869B2 (ja) | 音声認識端末およびコンピュータ端末を用いる音声認識方法 | |
JP6465077B2 (ja) | 音声対話装置および音声対話方法 | |
US20210264916A1 (en) | Electronic device for generating personalized asr model and method for operating same | |
KR101211796B1 (ko) | 외국어 학습 장치 및 그 제공 방법 | |
US20170103757A1 (en) | Speech interaction apparatus and method | |
JP7230806B2 (ja) | 情報処理装置、及び情報処理方法 | |
US20190147851A1 (en) | Information processing apparatus, information processing system, information processing method, and storage medium which stores information processing program therein | |
JP2018146715A (ja) | 音声対話装置、その処理方法及びプログラム | |
JP6715943B2 (ja) | 対話装置、対話装置の制御方法、および制御プログラム | |
JP6625772B2 (ja) | 検索方法及びそれを用いた電子機器 | |
JP6614080B2 (ja) | 音声対話システムおよび音声対話方法 | |
CN114223029A (zh) | 支持装置进行语音识别的服务器及服务器的操作方法 | |
CN113782030B (zh) | 基于多模态语音识别结果纠错方法及相关设备 | |
KR20190074508A (ko) | 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법 | |
JP6468258B2 (ja) | 音声対話装置および音声対話方法 | |
JP6904225B2 (ja) | 情報処理装置 | |
US20170221481A1 (en) | Data structure, interactive voice response device, and electronic device | |
US20220254346A1 (en) | Interaction device | |
KR20210123545A (ko) | 사용자 피드백 기반 대화 서비스 제공 방법 및 장치 | |
JP6306447B2 (ja) | 複数の異なる対話制御部を同時に用いて応答文を再生する端末、プログラム及びシステム | |
KR20210029354A (ko) | 전자장치 및 그 제어방법 | |
JP5818753B2 (ja) | 音声対話システム及び音声対話方法 | |
KR20210059367A (ko) | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 | |
KR20210044606A (ko) | 웨이크업 모델 생성 방법 및 이를 위한 전자 장치 | |
CN113823263A (zh) | 一种语音识别方法以及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20141202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150224 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20150304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150512 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150525 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5753869 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |