JP2018022075A - 発話生成装置、方法、及びプログラム - Google Patents
発話生成装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2018022075A JP2018022075A JP2016153957A JP2016153957A JP2018022075A JP 2018022075 A JP2018022075 A JP 2018022075A JP 2016153957 A JP2016153957 A JP 2016153957A JP 2016153957 A JP2016153957 A JP 2016153957A JP 2018022075 A JP2018022075 A JP 2018022075A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- utterance
- voice
- recognition
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
Description
今週末とかはうってつけですね。
<cand>バラエティー</cand>もよく見るんですよ。
20 演算部
28 通信部
30 音声区間検出部
32 音声認識部
40 発話生成部
42 相槌生成部
44 焦点抽出部
46 復唱生成部
48 応答部
50 発話出力部
100 発話生成装置
Claims (13)
- ユーザ発話を表す音のストリームを入力とし、音声の開始と音声の終了を検出し、検出された音声の開始と音声の終了とで規定される区間の音声を逐次出力し、かつ、音声の開始を検出したとき、あるいは音声の終了を検出したときに、検出結果を出力する音声区間検出部と、
前記音声区間検出部によって検出された音声の開始に対応する区間の音声について音声認識を行い、前記区間の途中の認識結果を含む、前記区間の終了までの認識結果を逐次出力する音声認識部と、
前記音声区間検出部による検出結果、及び前記音声認識部による認識結果に基づいて、前記音声認識が行われていることを示す発話を生成する相槌生成部、前記音声認識部による認識結果に基づいて、認識された文字列を示す発話を生成する焦点抽出部、及び前記音声認識部による認識結果に基づいて、システムが理解した内容を示す発話を生成する復唱生成部の少なくとも一つを含む発話生成部と、
発話出力部と、
前記音声認識部及び前記音声区間検出部の両方又は何れかからの出力を、前記発話生成部へ出力し、前記発話生成部からの出力を前記発話出力部へ出力する通信部と、
を含む発話生成装置。 - ユーザ発話を表す音のストリームを入力とし、音声の開始と音声の終了を検出し、検出された音声の開始と音声の終了とで規定される区間の音声を逐次出力し、かつ、音声の開始を検出したとき、あるいは音声の終了を検出したときに、検出結果を出力する音声区間検出部と、
前記音声区間検出部によって検出された音声の開始に対応する区間の音声について音声認識を行い、前記区間の途中の認識結果を含む、前記区間の終了までの認識結果を逐次出力する音声認識部と、
前記音声区間検出部による検出結果、及び前記音声認識部による認識結果に基づいて、前記音声認識が行われていることを示す発話を生成する相槌生成部、前記音声認識部による認識結果に基づいて、認識された文字列を示す発話を生成する焦点抽出部、及び前記音声認識部による認識結果に基づいて、システムが理解した内容を示す発話を生成する復唱生成部の少なくとも一つを含む発話生成部と、
前記音声認識部による認識結果に基づいて、前記ユーザ発話に対応する応答発話を生成する応答部と、
発話出力部と、
前記音声認識部及び前記音声区間検出部の両方又は何れかからの出力を、前記発話生成部及び前記応答部へ出力し、前記発話生成部及び前記応答部の両方又は何れかからの出力を前記発話出力部へ出力する通信部と、
を含む発話生成装置。 - 前記発話出力部は、前記発話生成部によって生成された前記発話を出力しているときに、前記発話生成部によって生成された新たな前記発話が入力されると、前記新たな前記発話の出力は行わない請求項1記載の発話生成装置。
- 前記発話出力部は、前記発話生成部によって生成された前記発話を出力しているときに、前記発話生成部によって生成された新たな前記発話が入力されると、前記新たな前記発話の出力は行わず、
前記発話生成部によって生成された前記発話を出力しているときに、前記応答部によって生成された前記応答発話が入力されると、前記発話生成部によって生成された前記発話を出力した後に、前記応答発話の出力を行う請求項2記載の発話生成装置。 - 前記復唱生成部は、前記音声認識部による認識結果を表す文字列から、述語項構造を抽出し、前記抽出された述語項構造に基づいて、前記システムが理解した内容を示す発話を生成する請求項1〜請求項4の何れか1項記載の発話生成装置。
- 前記相槌生成部は、前記音声区間検出部によって前記音声の開始が検出されたときに、前記音声認識が行われていることを示す発話を生成する請求項1〜請求項5の何れか1項記載の発話生成装置。
- 前記音声認識部は、ショートポーズを検知したとき、又は前記区間の終了までの期間における一定時間おきに、認識結果を出力し、
前記相槌生成部は、前記音声認識部による、ショートポーズを検知したときの認識結果の出力、又は前記音声認識部による一定時間おきの認識結果の出力があったときに、前記音声認識が行われていることを示す発話を生成する請求項1〜請求項6の何れか1項記載の発話生成装置。 - 前記相槌生成部は、前記音声認識部によって前記区間が終了したときの認識結果が出力されたときに、前記音声認識が行われていることを示す発話を生成する請求項1〜請求項7の何れか1項記載の発話生成装置。
- 前記発話出力部は、音声により出力する請求項1〜請求項8の何れか1項記載の発話生成装置。
- 前記発話出力部は、ディスプレイ表示により出力する請求項1〜請求項8の何れか1項記載の発話生成装置。
- 音声区間検出部と、音声認識部、相槌生成部、及び焦点抽出部の少なくとも一つを含む発話生成部と、復唱生成部と、発話出力部と、通信部とを含む発話生成装置における発話生成方法であって、
前記音声区間検出部が、ユーザ発話を表す音のストリームを入力とし、音声の開始と音声の終了を検出し、検出された音声の開始と音声の終了とで規定される区間の音声を逐次出力し、かつ、音声の開始を検出したとき、あるいは音声の終了を検出したときに、検出結果を出力するステップと、
前記音声認識部が、前記音声区間検出部によって検出された音声の開始に対応する区間の音声について音声認識を行い、前記区間の途中の認識結果を含む、前記区間の終了までの認識結果を逐次出力するステップと、
前記通信部が、前記音声認識部及び前記音声区間検出部の両方又は何れかからの出力を、前記発話生成部へ出力するステップと、
前記発話生成部において、前記相槌生成部が、前記音声区間検出部による検出結果、及び前記音声認識部による認識結果に基づいて、前記音声認識が行われていることを示す発話を生成するステップ、前記焦点抽出部が、前記音声認識部による認識結果に基づいて、認識された文字列を示す発話を生成するステップ、及び前記復唱生成部が、前記音声認識部による認識結果に基づいて、システムが理解した内容を示す発話を生成するステップの少なくとも一つを実行するステップを含み、
前記通信部が、前記発話生成部からの出力を前記発話出力部へ出力するステップと、
を含む発話生成方法。 - 音声区間検出部と、音声認識部、相槌生成部、及び焦点抽出部の少なくとも一つを含む発話生成部と、復唱生成部と、発話出力部と、応答部と、通信部とを含む発話生成装置における発話生成方法であって、
前記音声区間検出部が、ユーザ発話を表す音のストリームを入力とし、音声の開始と音声の終了を検出し、検出された音声の開始と音声の終了とで規定される区間の音声を逐次出力し、かつ、音声の開始を検出したとき、あるいは音声の終了を検出したときに、検出結果を出力するステップと、
前記音声認識部が、前記音声区間検出部によって検出された音声の開始に対応する区間の音声について音声認識を行い、前記区間の途中の認識結果を含む、前記区間の終了までの認識結果を逐次出力するステップと、
前記通信部が、前記音声認識部及び前記音声区間検出部の両方又は何れかからの出力を、前記発話生成部及び前記応答部へ出力するステップと、
前記発話生成部において、前記相槌生成部が、前記音声区間検出部による検出結果、及び前記音声認識部による認識結果に基づいて、前記音声認識が行われていることを示す発話を生成するステップ、前記焦点抽出部が、前記音声認識部による認識結果に基づいて、認識された文字列を示す発話を生成するステップ、及び前記復唱生成部が、前記音声認識部による認識結果に基づいて、システムが理解した内容を示す発話を生成するステップの少なくとも一つを実行するステップを含み、
前記応答部が、前記音声認識部による認識結果に基づいて、前記ユーザ発話に対応する応答発話を生成するステップと、
前記通信部が、前記発話生成部及び前記応答部の両方又は何れかからの出力を前記発話出力部へ出力するステップと、
を含む発話生成方法。 - コンピュータを、請求項1〜請求項9のいずれか1項に記載の発話生成装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016153957A JP6649200B2 (ja) | 2016-08-04 | 2016-08-04 | 発話生成装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016153957A JP6649200B2 (ja) | 2016-08-04 | 2016-08-04 | 発話生成装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018022075A true JP2018022075A (ja) | 2018-02-08 |
JP6649200B2 JP6649200B2 (ja) | 2020-02-19 |
Family
ID=61165599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016153957A Active JP6649200B2 (ja) | 2016-08-04 | 2016-08-04 | 発話生成装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6649200B2 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259090A (ja) * | 1993-03-09 | 1994-09-16 | Nec Corp | 音声対話システム |
JPH11175093A (ja) * | 1997-12-08 | 1999-07-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識確認応答方法 |
JP2001056698A (ja) * | 1999-08-20 | 2001-02-27 | Cadix Inc | 音声認識装置及びそれに用いられるプログラムを格納した記録媒体 |
JP2003228449A (ja) * | 2002-02-01 | 2003-08-15 | Sharp Corp | 対話装置及び対話処理プログラムを記録した記録媒体 |
JP2005196134A (ja) * | 2003-12-12 | 2005-07-21 | Toyota Central Res & Dev Lab Inc | 音声対話システム及び方法並びに音声対話プログラム |
JP2007206888A (ja) * | 2006-01-31 | 2007-08-16 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
JP2012226068A (ja) * | 2011-04-19 | 2012-11-15 | Honda Motor Co Ltd | 対話装置 |
WO2013132712A1 (ja) * | 2012-03-07 | 2013-09-12 | 三菱電機株式会社 | ナビゲーション装置 |
-
2016
- 2016-08-04 JP JP2016153957A patent/JP6649200B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06259090A (ja) * | 1993-03-09 | 1994-09-16 | Nec Corp | 音声対話システム |
JPH11175093A (ja) * | 1997-12-08 | 1999-07-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識確認応答方法 |
JP2001056698A (ja) * | 1999-08-20 | 2001-02-27 | Cadix Inc | 音声認識装置及びそれに用いられるプログラムを格納した記録媒体 |
JP2003228449A (ja) * | 2002-02-01 | 2003-08-15 | Sharp Corp | 対話装置及び対話処理プログラムを記録した記録媒体 |
JP2005196134A (ja) * | 2003-12-12 | 2005-07-21 | Toyota Central Res & Dev Lab Inc | 音声対話システム及び方法並びに音声対話プログラム |
JP2007206888A (ja) * | 2006-01-31 | 2007-08-16 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
JP2012226068A (ja) * | 2011-04-19 | 2012-11-15 | Honda Motor Co Ltd | 対話装置 |
WO2013132712A1 (ja) * | 2012-03-07 | 2013-09-12 | 三菱電機株式会社 | ナビゲーション装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6649200B2 (ja) | 2020-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101211796B1 (ko) | 외국어 학습 장치 및 그 제공 방법 | |
CN113439301A (zh) | 使用序列到序列映射在模拟数据与语音识别输出之间进行协调 | |
US11797772B2 (en) | Word lattice augmentation for automatic speech recognition | |
Angga et al. | Design of chatbot with 3D avatar, voice interface, and facial expression | |
KR20210146368A (ko) | 숫자 시퀀스에 대한 종단 간 자동 음성 인식 | |
US11093110B1 (en) | Messaging feedback mechanism | |
US10325599B1 (en) | Message response routing | |
JP2004355629A (ja) | 高度対話型インターフェースに対する理解同期意味オブジェクト | |
JP2001100781A (ja) | 音声処理装置および音声処理方法、並びに記録媒体 | |
JP2001101187A (ja) | 翻訳装置および翻訳方法、並びに記録媒体 | |
US11295730B1 (en) | Using phonetic variants in a local context to improve natural language understanding | |
CA3160315C (en) | Real-time speech-to-speech generation (rssg) apparatus, method and a system therefore | |
EP3509062B1 (en) | Audio recognition device, audio recognition method, and program | |
JP2023524088A (ja) | エンドツーエンドの複数話者重複音声認識 | |
US11615787B2 (en) | Dialogue system and method of controlling the same | |
JP2014048443A (ja) | 音声合成システム、音声合成方法及び音声合成プログラム | |
JP6649200B2 (ja) | 発話生成装置、方法、及びプログラム | |
CN115050351A (zh) | 生成时间戳的方法、装置及计算机设备 | |
Šoić et al. | Spoken notifications in smart environments using Croatian language | |
McTear | Rule-Based Dialogue Systems: Architecture, Methods, and Tools | |
Milde et al. | MoM: Minutes of Meeting Bot. | |
Koo et al. | KEBAP: Korean Error Explainable Benchmark Dataset for ASR and Post-processing | |
JP7012935B1 (ja) | プログラム、情報処理装置、方法 | |
US11501091B2 (en) | Real-time speech-to-speech generation (RSSG) and sign language conversion apparatus, method and a system therefore | |
KR102448733B1 (ko) | 문맥 내 턴 구성을 고려하여 응답을 선택하는 대화 시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190416 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190417 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190724 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6649200 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |