JP6559417B2 - 情報処理装置、情報処理方法、対話システム、および制御プログラム - Google Patents
情報処理装置、情報処理方法、対話システム、および制御プログラム Download PDFInfo
- Publication number
- JP6559417B2 JP6559417B2 JP2014245349A JP2014245349A JP6559417B2 JP 6559417 B2 JP6559417 B2 JP 6559417B2 JP 2014245349 A JP2014245349 A JP 2014245349A JP 2014245349 A JP2014245349 A JP 2014245349A JP 6559417 B2 JP6559417 B2 JP 6559417B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- utterance
- user
- recognition result
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Description
本発明の一実施形態について図1〜図5に基づいて説明すれば以下のとおりである。
まず、図2に基づいて本実施形態の概要を説明する。図2は、本実施形態に係る音声対話装置1とユーザとの対話例を示す図である。図2に示すように、本実施形態では、音声対話装置1がロボット掃除機である例を説明する。ただし、音声対話装置1はユーザの声などの外部の音声を取得し、取得した音声に対する応答音声を発することができるものであればよく、ロボット掃除機に限定されない。例えば、対話ロボットであってもよいし、音声の入出力機能を有する冷蔵庫、エアコンなどの家電であってもよいし、タブレット端末、スマートフォン、パーソナルコンピュータ等の多機能端末であってもよい。
次に、上記音声対話装置1に上述のような発話を行わせる対話システム5の構成を図1に基づいて説明する。図1は、対話システム5に含まれる音声対話装置1および発話制御装置(情報処理装置)2の要部構成の一例を示すブロック図である。図示のように、対話システム5は、ユーザの発話する音声を取得する音声対話装置1と発話制御装置2を含むシステムであり、発話制御装置2の制御により、音声対話装置1に発話させるシステムである。
次に、音声対話装置1の構成を説明する。図示のように、音声対話装置1は、制御部10、音声入力部11、音声出力部12、記憶部13、および通信部14を備えている。また、制御部10は、入力音声送信部101および応答音声取得部102を含む。
次に、発話制御装置2の要部構成について説明する。発話制御装置2は、制御部20、記憶部21、および通信部22を備えている。制御部20は、発話制御装置2が備える各部を統括制御するものであり、記憶部21は、発話制御装置2にて使用される各種データを記憶する記憶装置である。また、通信部22は、発話制御装置2が外部の装置(特に音声対話装置1と端末装置3)と通信するための通信装置である。なお、音声対話装置1と通信するための通信部と、端末装置3と通信するための通信部が個別に設けられていてもよい。
次に、図3を参照して、発話制御装置2が実行する発話制御処理の流れについて説明する。図3は、発話制御処理(情報処理方法)の一例を示すフローチャートである。なお、図3のフローの開始時には、発話制御装置2は非口頭メモモードである。
次に、口頭メモモードにおける処理の流れについて、図5を参照して説明する。図5は、口頭メモモードにおける処理の流れの一例を示すフローチャートである。
本発明の他の実施形態について、図6および図7に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。
次に、図7を参照して、本実施形態の口頭メモモードにおける処理の流れについて説明する。図7は、口頭メモモードにおける処理の一例を示すフローチャートである。なお、図7の例は、S21でNOの場合に、S27の処理を行う前にS40の処理を行う点で図5の例と異なっているから、ここではこの相違点を中心に説明し、他の処理の説明は省略する。
上記各実施形態では、発話制御装置2の制御により音声対話装置1に発話させ、また発話制御装置2が口頭メモを記録する例を説明した。しかしながら、音声対話装置1が単体でユーザの発話に応答する機能、開始キーワード等の各種キーワードを検出する機能、および口頭メモを記録する機能を備えていてもよい。
また、例えば音声解析部202および音声合成部206を音声対話装置1の制御部10に含めてもよい。この場合、音声対話装置1は、音声入力部11から入力されるユーザの発話音声を音声解析部202によって音声解析し、これによって得られた音声認識結果のテキストデータを発話制御装置2に送信する。
さらに、例えば音声解析部202および音声合成部206に加えて、キーワード判定部203および通常応答部204についても音声対話装置1の制御部10に含めてもよい。この場合、音声対話装置1は、キーワード判定部203が開始キーワードを検出したときには、発話制御装置2に音声認識結果のテキストデータを送信して、これをメモデータ213として記録させる。また、この場合、非口頭メモモードでは、発話制御装置2と通信することなく、速やかにユーザに応答を返すことができる。
上記対話システム5は、音声対話装置1を複数含んでもよく、この場合、音声対話装置1毎に、ユーザに対する応答やメモの記録の態様を異ならせてもよい。これにより、音声対話装置1毎の個性をユーザに感じさせることができる。
上記各実施形態では、1つの発話制御装置2を用いる例を説明したが、発話制御装置2の有する各機能が、個別のサーバにて実現されていてもよい。例えば、音声対話装置1に通常の対話(非口頭メモモードにおける対話)を行わせる機能と、口頭メモモードを実現する機能(メモの生成、記録、復唱など)とを個別のサーバで実現してもよい。そして、複数のサーバを適用する場合においては、各サーバは、同じ事業者によって管理されていてもよいし、異なる事業者によって管理されていてもよい。
音声対話装置1および発話制御装置2の各ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。後者の場合、音声対話装置1および発話制御装置2のそれぞれを、図8に示すようなコンピュータ(電子計算機)を用いて構成することができる。
本発明の態様1に係る情報処理装置(発話制御装置2)は、ユーザの発する音声を取得して応答音声を出力する音声対話装置(1)による上記音声への応答に用いられる、該音声の音声認識結果を取得する認識結果取得部(キーワード判定部203)と、上記音声認識結果から上記ユーザの発話内容を示すテキストデータを生成して記録するテキスト記録部(メモ生成部208)と、を備えている。
2 発話制御装置(情報処理装置)
202 音声解析部(音声認識部)
203 キーワード判定部(認識結果取得部、記録制御部)
207 発話制御部
208 メモ生成部(テキスト記録部)
209 メモ通知部(テキスト送信部)
213 メモデータ(ユーザの発話内容を示すテキストデータ)
5 対話システム
Claims (8)
- ユーザの発する音声を取得して応答音声を出力する音声対話装置による上記音声への応答に用いられる、該音声の音声認識結果を取得する認識結果取得部と、
上記音声認識結果から上記ユーザの発話内容を示すテキストデータを生成して記録するテキスト記録部と、
音声入力をやり直すためのキーワードが音声認識された場合に、発話を促す音声を上記音声対話装置に出力させる発話制御部と、を備え、
上記テキスト記録部は、音声入力をやり直すためのキーワードが音声認識された場合、上記発話制御部が発話を促す音声を上記音声対話装置に出力させた後の音声認識結果から上記ユーザの発話内容を示すテキストデータを生成して記録し、
上記発話制御部は、上記ユーザの一連の発話が終了するまでの期間、上記ユーザの発話が途切れる毎に、それまでに上記テキスト記録部が記録した上記一連の発話のテキストデータを上記音声対話装置に音声出力させる、ことを特徴とする情報処理装置。 - 上記情報処理装置の動作モードには、上記ユーザの発話内容を示すテキストデータを記録する記録モードと、該テキストデータは記録せずに上記音声対話装置にユーザと対話させる対話モードとが含まれており、
上記認識結果取得部が取得した上記音声認識結果に所定の語句が含まれているときに、上記情報処理装置を上記記録モードに遷移させる記録制御部を備えていることを特徴とする請求項1に記載の情報処理装置。 - 上記認識結果取得部が取得した上記音声認識結果に上記所定の語句が含まれているときに、該語句を再度発話することを促す音声を上記音声対話装置に出力させる発話制御部を備え、
上記記録制御部は、上記発話制御部が上記語句を再度発話することを促す音声を上記音声対話装置に出力させた後、上記認識結果取得部が取得した音声認識結果に上記所定の語句が含まれている場合に、上記情報処理装置を上記記録モードに遷移させることを特徴とする請求項2に記載の情報処理装置。 - 上記テキスト記録部は、上記認識結果取得部が取得した上記音声認識結果の内容を所定の規則に従って要約して生成したテキストデータを記録することを特徴とする請求項1から3の何れか1項に記載の情報処理装置。
- 上記テキスト記録部が記録したテキストデータを所定の送信先に送信するテキスト送信部を備えていることを特徴とする請求項1から4の何れか1項に記載の情報処理装置。
- 情報処理装置が実行する情報処理方法であって、
ユーザの発する音声を取得して応答音声を出力する音声対話装置による上記音声への応答に用いられる、該音声の音声認識結果を取得する認識結果取得ステップと、
音声入力をやり直すためのキーワードが音声認識された場合に、発話を促す音声を上記音声対話装置に出力させるステップと、
発話を促す音声を上記音声対話装置に出力させた後の音声認識結果から上記ユーザの発話内容を示すテキストデータを生成して記録するテキスト記録ステップと、
上記ユーザの一連の発話が終了するまでの期間、上記ユーザの発話が途切れる毎に、それまでに記録した上記一連の発話のテキストデータを上記音声対話装置に音声出力させるステップと、を含むことを特徴とする情報処理方法。 - ユーザの発する音声を取得する音声対話装置と、該音声対話装置に上記音声に応じた応答音声を出力させる情報処理装置とを含む対話システムであって、
上記情報処理装置は、
上記音声対話装置が取得した上記音声の音声認識結果を取得する認識結果取得部と、
上記音声認識結果から上記ユーザの発話内容を示すテキストデータを生成して記録するテキスト記録部と、
音声入力をやり直すためのキーワードが音声認識された場合に、発話を促す音声を上記音声対話装置に出力させる発話制御部と、を備え、
上記テキスト記録部は、音声入力をやり直すためのキーワードが音声認識された場合、上記発話制御部が発話を促す音声を上記音声対話装置に出力させた後の音声認識結果から上記ユーザの発話内容を示すテキストデータを生成して記録し、
上記発話制御部は、上記ユーザの一連の発話が終了するまでの期間、上記ユーザの発話が途切れる毎に、それまでに上記テキスト記録部が記録した上記一連の発話のテキストデータを上記音声対話装置に音声出力させる、ことを特徴とする対話システム。 - 請求項1に記載の情報処理装置としてコンピュータを機能させるための制御プログラムであって、上記認識結果取得部、上記テキスト記録部、および上記発話制御部としてコンピュータを機能させるための制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014245349A JP6559417B2 (ja) | 2014-12-03 | 2014-12-03 | 情報処理装置、情報処理方法、対話システム、および制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014245349A JP6559417B2 (ja) | 2014-12-03 | 2014-12-03 | 情報処理装置、情報処理方法、対話システム、および制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016109784A JP2016109784A (ja) | 2016-06-20 |
JP6559417B2 true JP6559417B2 (ja) | 2019-08-14 |
Family
ID=56124042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014245349A Expired - Fee Related JP6559417B2 (ja) | 2014-12-03 | 2014-12-03 | 情報処理装置、情報処理方法、対話システム、および制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6559417B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7028179B2 (ja) * | 2016-09-29 | 2022-03-02 | 日本電気株式会社 | 情報処理装置、情報処理方法およびコンピュータ・プログラム |
CN107231478A (zh) * | 2017-06-06 | 2017-10-03 | 深圳市乃斯网络科技有限公司 | 终端记事本的应用方法及系统 |
JP2019086903A (ja) | 2017-11-02 | 2019-06-06 | 東芝映像ソリューション株式会社 | 音声対話端末、および音声対話端末制御方法 |
CN107895016B (zh) * | 2017-11-14 | 2022-02-15 | 百度在线网络技术(北京)有限公司 | 一种播放多媒体的方法和装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09330096A (ja) * | 1996-06-10 | 1997-12-22 | Fujitsu Ten Ltd | 車載用音声メモ装置 |
JP2004226698A (ja) * | 2003-01-23 | 2004-08-12 | Yaskawa Electric Corp | 音声認識装置 |
JP4014044B2 (ja) * | 2003-01-28 | 2007-11-28 | 株式会社国際電気通信基礎技術研究所 | コミュニケーションロボットおよびそれを用いたコミュニケーションシステム |
JP2009025538A (ja) * | 2007-07-19 | 2009-02-05 | Nissan Motor Co Ltd | 音声対話装置 |
JP2009025517A (ja) * | 2007-07-19 | 2009-02-05 | Nissan Motor Co Ltd | 車載用情報提供対話装置 |
JP2011257626A (ja) * | 2010-06-10 | 2011-12-22 | Murata Mach Ltd | 音声認識装置と認識方法 |
-
2014
- 2014-12-03 JP JP2014245349A patent/JP6559417B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016109784A (ja) | 2016-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11341972B2 (en) | Speech recognition using two language models | |
KR100679043B1 (ko) | 음성 대화 인터페이스 장치 및 방법 | |
US9721563B2 (en) | Name recognition system | |
US10887764B1 (en) | Audio verification | |
US20160293157A1 (en) | Contextual Voice Action History | |
WO2015098306A1 (ja) | 応答制御装置、制御プログラム | |
US20170287465A1 (en) | Speech Recognition and Text-to-Speech Learning System | |
JP5731998B2 (ja) | 対話支援装置、対話支援方法および対話支援プログラム | |
JP6559417B2 (ja) | 情報処理装置、情報処理方法、対話システム、および制御プログラム | |
CN107622768B (zh) | 音频截剪器 | |
JP2019090942A (ja) | 情報処理装置、情報処理システム、情報処理方法、および情報処理プログラム | |
CN112513984A (zh) | 电子设备及其控制方法 | |
JPWO2018043138A1 (ja) | 情報処理装置および情報処理方法、並びにプログラム | |
US20120053937A1 (en) | Generalizing text content summary from speech content | |
JP6715943B2 (ja) | 対話装置、対話装置の制御方法、および制御プログラム | |
JP6904225B2 (ja) | 情報処理装置 | |
JP6644141B2 (ja) | 応答装置および応答装置の制御方法、制御プログラム | |
CN111104071A (zh) | 用于语音助手搜索结果的集成打印的系统和方法 | |
JP2021113835A (ja) | 音声処理装置および音声処理方法 | |
KR20210098250A (ko) | 전자 장치 및 이의 제어 방법 | |
JP2018022086A (ja) | サーバ装置、制御システム、方法、情報処理端末、および制御プログラム | |
JP2021149664A (ja) | 出力装置、出力方法及び出力プログラム | |
JPWO2016104193A1 (ja) | 対応決定装置、音声対話システム、対応決定装置の制御方法、および音声対話装置 | |
JP2015036826A (ja) | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム | |
JP6468069B2 (ja) | 電子機器制御システム、サーバー、及び、端末装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170925 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190618 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6559417 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |