JP6644153B2 - 応答装置およびその制御方法、ならびに制御プログラム - Google Patents

応答装置およびその制御方法、ならびに制御プログラム Download PDF

Info

Publication number
JP6644153B2
JP6644153B2 JP2018536951A JP2018536951A JP6644153B2 JP 6644153 B2 JP6644153 B2 JP 6644153B2 JP 2018536951 A JP2018536951 A JP 2018536951A JP 2018536951 A JP2018536951 A JP 2018536951A JP 6644153 B2 JP6644153 B2 JP 6644153B2
Authority
JP
Japan
Prior art keywords
response
voice
personal information
unit
conversation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2018536951A
Other languages
English (en)
Other versions
JPWO2018042798A1 (ja
Inventor
一倫 脇
一倫 脇
裕士 中田
裕士 中田
遥 岡田
遥 岡田
奥田 計
計 奥田
佳子 今城
佳子 今城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPWO2018042798A1 publication Critical patent/JPWO2018042798A1/ja
Application granted granted Critical
Publication of JP6644153B2 publication Critical patent/JP6644153B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Manipulator (AREA)
  • Toys (AREA)

Description

本発明は、入力内容を認識し、認識した内容に基づいて応答する応答装置などに関する。
入力内容を認識し、認識した内容に基づいて応答する応答装置が従来技術として知られている。このような応答装置では、認識した内容をそのまま音声として出力した場合、情報送信先の機器の所有者とは異なる第三者へも、伝達すべきでない情報が伝わってしまう場合がある。
一方、スマートフォンのように音声を使用せず、単にデータ通信によって情報を送信した場合、第三者への伝達すべきでない情報の漏洩は避けられるものの、応答装置で重要な要素の一つである会話感が失われてしまうという問題がある。
このような問題点を解決する技術として特許文献1に開示された音声変換装置がある。この音声変換装置では、入力された音声データの予め定められた置換対象語を含む単語部分を、単語部分に対応する代替音声データに置き換えることで、伝達すべきでない情報の漏洩を低減させている。
日本国公開特許公報「特開2007−41433号公報(2007年2月15日公開)」
しかしながら、上記の従来技術では、個人情報の漏洩を完全に回避することができないという問題点がある。例えば、上記特許文献1に開示された音声変換装置では、置換対象語の一部の単語部分のみを代替音声データに置換しているため、個人情報の一部が漏洩してしまう可能性があるという問題点がある。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、会話中における個人情報の漏洩を使用者には完全に回避しつつ、相手装置には内容を伝え、意味のある会話を継続することができる応答装置などを実現することにある。
上記の課題を解決するために、本発明の一態様に係る応答装置は、入力された音声の音声認識の結果に基づいて応答文を生成する応答生成部と、生成された応答文の中に個人情報が含まれているか否かを判定する個人情報判定部と、上記応答文の中に個人情報が含まれていると判定された場合、当該個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することで上記応答文を変更する応答変更部と、上記応答生成部によって生成された応答文、または上記応答変更部によって変更された応答文、の何れかから合成された音声を出力する音声出力部と、を備えていることを特徴としている。
上記の課題を解決するために、本発明の一態様に係る応答装置の制御方法は、入力された音声の音声認識の結果に基づいて応答する応答装置の制御方法であって、入力された音声の音声認識の結果に基づいて応答文を生成する応答生成ステップと、生成された応答文の中に個人情報が含まれているか否かを判定する個人情報判定ステップと、上記応答文の中に個人情報が含まれていると判定された場合、当該個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することで上記応答文を変更する応答変更ステップと、上記応答生成ステップで生成された応答文、または上記応答変更ステップで変更された応答文、の何れかから合成された音声を出力する音声出力ステップと、を含むことを特徴としている。
本発明の一態様に係る応答装置およびその制御方法によれば、会話中における個人情報の漏洩を使用者には完全に回避しつつ、相手装置には内容を伝え、意味のある会話を継続することができるという効果を奏する。
本発明の一実施形態に係るロボット(応答装置)の構成を示すブロック図である。 上記ロボットの特徴的な動作の流れを示すフローチャートである。 上記ロボットによる会話の一例を示す図である。 上記ロボットが使用する会話シナリオの例を示す図である。
本発明の実施の形態について図1〜図4に基づいて説明すれば、次の通りである。以下、説明の便宜上、特定の項目にて説明した構成と同一の機能を有する構成については、同一の符号を付記し、その説明を省略する場合がある。
〔ロボットの構成〕
まず、図1に基づき、本発明の一実施形態に係るロボット(応答装置)1の構成について説明する。図1は、ロボット1の構成を示すブロック図である。詳細は後述するが、本実施形態のロボット1は、個人情報が含まれる実際のデータを会話で交換する際に、会話シナリオ中の個人情報に関する内容に対応する音声を代替音声に置換して伝達することで個人情報の漏えいを回避するようになっている〔また、相手側のロボット(機器)のみで、この代替音声から実際のデータへ復元することが可能になっている〕。同図に示すように、ロボット1は、音声入力部11、音声出力部12、記憶部13、通信部14、情報提示部15、および制御部20を備える。
音声入力部11は具体的には、マイク等の集音装置であればよい。音声入力部11は検出した他のロボットによる発話を音声データとして後述する音声認識部21に送る。なお、図1の例では音声認識部21はロボット1に内蔵されているが、音声認識部21はロボット1に取付けられた外部装置や、通信部14を利用するネットワークサーバーであっても構わない。なお、音声入力部11は、他のロボットの発話の間(音声を発していない時間)などから1回の発話(1まとまりの文または文章となる発話)を特定し、当該1回の発話毎の音声データを音声認識部21に送信することが望ましい。
音声出力部12は、後述する音声合成部26から受信した音声データを音声として外部に出力する出力部として機能する。より具体的には、音声出力部12は、後述する応答生成部23によって生成された応答文、または後述する応答変更部25によって変更された応答文、の何れかに基づいて音声合成部26が合成した音声を出力する。音声出力部12は具体的にはロボット1に備えられたスピーカ等で実現される。なお、図1の例では音声出力部12はロボット1に内蔵されているが、音声出力部12はロボット1に取付けられた外部装置であっても構わない。記憶部13は、ロボット1にて扱われる各種データを記憶する。本実施形態に係る記憶部13には、ロボット同士で交換される会話シナリオのデータ、個人情報と、それに対応する代替音声(または暗号化データ)と、の対応関係、および個人情報に相当すると指定されたデータ(後述する指定データ)などが記憶される。
なお、代替音声は、早送り音声、逆再生音声または暗号化された音声の何れかであることが好ましい。これにより、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声を実現することができる。
通信部14は、近くにいる他のロボットと通信(通信プロトコルを確立し)を行う。なお、他のロボットから個人情報が含まれる実際のデータを、通信部14を介して受信するようにしても良い。しかしながら、ロボット1は、他のロボットの発話を検出する際、必ずしもその発話に対応する実際のデータを他のロボットから受信する必要はない。情報提示部15は、後述する復元した実際のデータ(個人情報)をユーザに提示する。
制御部20は、ロボット1の各部を統括して制御するものであり、音声認識部21、シナリオ確認部22、応答生成部23、個人情報判定部24、応答変更部25、音声合成部26、および復元部27を備える。なお、図1の例では制御部20はロボット1に内蔵されているが、制御部20はロボット1に取付けられた外部装置や、通信部14を介して利用するネットワークサーバーであっても構わない。
音声認識部21は、音声入力部11から受信した、1回の発話の音声データについて音声認識を行う。なお、本明細書において「音声認識」とは、発話の音声データから発話内容(入力内容)を示すテキストデータを得る処理を示す。音声認識部21の音声認識の方法は特に限定されず、従来あるいずれの方法を用いて音声認識を行ってもよい。
シナリオ確認部22は、音声認識部21による音声認識の結果が、記憶部13に記憶されている所定の会話シナリオ中のどの会話に対応しているかを確認し(特定し)、その結果を応答生成部23に通知する。
これにより、会話シナリオに従って会話を継続させることができる。また、シナリオ確認部22は、ロボット1が会話シナリオ中のどの会話を発話したかを確認し、その確認結果を、発話毎に通信部14を介して他のロボットに送信しても良い。また、シナリオ確認部22は、他のロボットが会話シナリオ中のどの会話を発話したかの確認結果を、通信部14を介して他のロボットから受信するようにしても良い。
ここで、図4に基づき、記憶部13に記憶される会話シナリオの例について説明する。図4は、ロボット1が使用する会話シナリオの例を示す図である。本実施形態のロボット1は、電話発信中、メール受信中、メール入力中、カメラアプリ起動中、ユーザへ質問中、回答待ち、など複数の様々な状態ごとに、入力音声(テキスト変換されたもの)と、それに対応する応答テキスト(出力音声)のとの対応関係を示すテーブルを記憶部13に保持しており、ロボット1は上記テーブルの中から選択された応答テキストを音声として出力するようになっている。より具体的には、図4に示す入力音声と出力音声との組み合わせに係るテーブル情報を、上述した状態ごとに複数保持している。
応答生成部23は、音声認識部21による音声認識の結果に基づいて応答文を生成する。例えば、応答生成部23は、シナリオ確認部22によって確認された会話の返答に対応する会話を記憶部13に記憶されている会話シナリオ中から検索し、その検索結果に基づいて上記応答文を生成しても良い。
個人情報判定部24は、応答生成部23によって生成された応答文の中に個人情報が含まれているか否かを判定する。より具体的には、個人情報判定部24は、応答生成部23によって生成された応答文の中に個人情報として予め指定された指定データが含まれているか否かによって、上記応答文の中に個人情報が含まれている否かを判定する。これにより、応答文の中に含まれる個人情報に係るデータが予め指定データとして指定されているため、応答文の中から個人情報に係るデータを確実に判別することができる。指定データの例としては、電話番号、メールアドレス、誕生日、出身地、および現住所などを例示することができる。一方、現在時刻、今日の日付、今日の曜日、今日の天気、およびプリインストールデータなどは、指定データとされない情報の例である。
応答変更部25は、個人情報判定部24によって応答文の中に個人情報が含まれていると判定された場合、当該個人情報を代替音声に置換することで上記応答文を変更する。より具体的には、応答変更部25は、上述した指定データを個人情報として代替音声に置換する。代替音声は基本的には、人には理解できず、会話の相手側のロボットにて元の情報に復元することが可能な(ロボットには内容が理解できる)、但し音声としては聞き取れるものである。代替音声の例としては、暗号化された音声、X倍速音声(早送り音声)、逆再生音声、および個人情報を含む部分の音声データ全体を暗号化した機械音のような音声などを例示することができる。
また、応答変更部25は、個人情報判定部24により、応答生成部23によって生成された応答文の中に個人情報が含まれていないと判定された場合、応答生成部23によって生成された応答文を変更しない。これにより、応答文中の個人情報と関係ない部分が間違って代替音声に置換されることを回避することができる。
音声合成部26は、応答生成部23によって生成された応答文、または応答変更部25によって変更された応答文、の何れかのテキストデータを音声データに変換する(音声を合成する)。音声合成部26は、変換した音声データを音声出力部12に出力する。
復元部27は、通信部14が受信した実際のデータに個人情報を暗号化した暗号化データが含まれている場合、その暗号化データを元のデータに復号する。また、復元部27は、音声認識部21による音声認識の結果に代替音声が含まれている場合に、当該代替音声から元の個人情報を復元する。これにより、会話中に含まれる代替音声から元の個人情報を復元することができる。暗号化されたデータおよび代替音声を元の実際のデータに復元する際は、複合化または復元化のための鍵情報を用いても良い。この鍵情報を有していなければ、暗号化されたデータおよび代替音声を元の実際のデータに復元することはできないようにすることで、セキュリティ性を高めることができる。また、鍵情報は、会話を行うロボットのそれぞれが予め保持していても良いし、ロボット同士の通信プロトコルが確立した際に、会話を行うロボット同士で鍵情報の交換を行うようにしても良い。
(ロボット1の効果)
ロボット1によれば、入力された音声の音声認識の結果に基づいて応答文を生成し、生成された応答文の中に個人情報が含まれているか否かを判定し、応答文の中に個人情報が含まれていると判定された場合、当該個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することで上記応答文を変更する。これにより、入力された音声の音声認識の結果に含まれる個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することができる。また、ロボット1によれば、応答生成部23によって生成された応答文、または応答変更部25によって変更された応答文、の何れかから合成された音声を出力する。このため、ロボット1によれば、会話中における個人情報の漏洩を使用者(人)には完全に回避しつつ、相手装置には内容を伝え、意味のある会話を継続することができる。
〔ロボットの特徴的な動作〕
次に、図2のフローチャートに基づき、ロボット1の特徴的な動作について説明する。図2は、ロボット1の特徴的な動作の流れを示すフローチャートである。以下では、ロボット1であるロボットAおよびロボットBの2台のロボットが会話を行う場合について説明する。
まず、2台のロボットAおよびBのそれぞれで接続開始する。接続開始の方法はボタンを押す、音声コマンド、筐体を揺らすなどのユーザによる操作であってもよいし、通信部14を介して接続中のネットワークサーバーから開始しても良い。ロボットAおよびBのそれぞれは、WLAN(Wireless Local Area Network)や位置情報、または、Bluetooth(登録商標)によって相手を発見して通信プロトコルを確立する。ロボットAおよびBのそれぞれは、これから再生する会話シナリオを交換して、図2に示すフローチャートの動作が開始される(START)。
ステップS101(以下、「ステップ」を省略する)では、ロボットAの発話音声が、ロボットBの音声入力部11を介して入力されて音声情報に変換され、音声情報は音声認識部21に送信されて、S102に進む。S102では、ロボットBの音声認識部21が、ロボットAの発話音声に係る音声情報の音声認識を行い、音声認識の結果がシナリオ確認部22に送信されて、S103に進む。
S103では、シナリオ確認部22が、音声認識の結果を記憶部13に記憶された会話シナリオ中のどの会話に対応しているかを確認し、確認結果を応答生成部23に送信して、S104に進む。S104では、応答生成部23が、シナリオ確認部22が確認した会話の返答に対応する会話を会話シナリオ中から検索し、その検索結果に基づいて応答(応答文)を作成(生成)し、個人情報判定部24に送信して、S105に進む。
S105では、個人情報判定部24が、応答文に個人情報が含まれているか否かを判定し、応答文に個人情報が含まれていると判定された場合は、S106に進む。一方、S105で、応答文に個人情報が含まれていないと判定された場合は、S107に進む。S106では、応答変更部25は、応答生成部23が生成した応答文に含まれる個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換して応答文に変更を加え、音声合成部26へ送信して、S108に進む。
S107では、応答変更部25は、応答生成部23が生成した応答文に変更を加えず、そのまま音声合成部26へ送信してS108に進む。S108では、音声合成部26が、応答生成部23によって生成された応答文、または応答変更部25によって変更された応答文、の何れかに基づいて音声を合成し、音声出力部12に送信して、S109に進む。S109では、音声出力部12が、音声合成部26で合成された音声を出力し、動作を終了する(END)。ロボットAおよびBのそれぞれは、上述したS101〜S109までの動作を繰り返すことで、会話を継続する。
〔ロボットによる会話の一例〕
次に、図3に基づき、ロボット1であるロボットAおよびB同士の会話の一例について説明する。図3は、ロボットによる会話の一例を示す図である。
まず、会話C201(以下、「会話」は省略する)では、ロボットAが、「こんにちは」と発話し、C202に移行する。次に、C202では、ロボットBが、「どーもどーもー」と返答し、C203に移行する。
C203では、ロボットAが、「佐藤さんのロボットです。」と発話して、C204に移行する。C204では、ロボットBが、「僕の名前は、ロボ太郎です。」と返答し、C205に移行する。
C205では、ロボットAが、「連絡先を交換しよう!」と発話して、C206に移行する。C206では、ロボットBが、「オッケー!連絡先教えるね」と返答し、C207に移行する。C207では、ロボットBが、ロボットBの連絡先の代替音声を発話して、C208に移行する。
C208では、ロボットAが、ロボットAの連絡先の代替音声を発話して、C209に移行する。S209では、ロボットAが、「サンキュー!これからよろしくね」と発話して、C210に移行する。C210では、ロボットBが、「うん!これからよろしくね」と返答して会話が終了する。以上のように、ロボット1によれば、会話感の喪失を抑制しつつ、第三者への個人情報の漏洩を完全に回避することができる。
〔ソフトウェアによる実現例〕
ロボット1における制御部20の制御ブロック(特にシナリオ確認部22、応答生成部23、個人情報判定部24および応答変更部25)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
後者の場合、ロボット1における制御部20は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
〔まとめ〕
本発明の態様1に係る応答装置(ロボット1)は、入力された音声の音声認識の結果に基づいて応答文を生成する応答生成部(23)と、生成された応答文の中に個人情報が含まれているか否かを判定する個人情報判定部(24)と、上記応答文の中に個人情報が含まれていると判定された場合、当該個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することで上記応答文を変更する応答変更部(25)と、上記応答生成部によって生成された応答文、または上記応答変更部によって変更された応答文、の何れかから合成された音声を出力する音声出力部(12)と、を備えている構成である。
上記構成によれば、入力された音声の音声認識の結果に基づいて応答文を生成し、生成された応答文の中に個人情報が含まれているか否かを判定し、応答文の中に個人情報が含まれていると判定された場合、当該個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することで上記応答文を変更する。これにより、入力された音声の音声認識の結果に含まれる個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することができる。また、上記構成によれば、応答生成部によって生成された応答文、または応答変更部によって変更された応答文、の何れかから合成された音声を出力する。このため、会話中における個人情報の漏洩を使用者(人)には完全に回避しつつ、相手装置には内容を伝え、意味のある会話を継続することができる。
本発明の態様2に係る応答装置は、上記態様1において、上記代替音声は、早送り音声、逆再生音声または暗号化された音声の何れかであることが好ましい。上記構成によれば、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声を実現することができる。
本発明の態様3に係る応答装置は、上記態様1または2において、上記個人情報判定部は、上記応答生成部によって生成された応答文の中に個人情報として予め指定された指定データが含まれているか否かによって、上記応答文の中に個人情報が含まれている否かを判定し、上記応答変更部は、上記指定データを上記個人情報として代替音声に置換することが好ましい。上記構成によれば、応答文の中に含まれる個人情報に係るデータが予め指定データとして指定されているため、応答文の中から個人情報に係るデータを確実に判別することができる。
本発明の態様4に係る応答装置は、上記態様1〜3の何れかにおいて、上記応答変更部は、上記応答生成部によって生成された応答文の中に個人情報が含まれていないと判定された場合、上記生成された応答文を変更しないことが好ましい。上記構成によれば、応答文中の個人情報と関係ない部分が間違って代替音声に置換されることを回避することができる。
本発明の態様5に係る応答装置は、上記態様1〜4の何れかにおいて、上記音声認識の結果が、所定の会話シナリオ中のどの会話に対応しているかを確認するシナリオ確認部(22)を備え、上記応答生成部は、上記シナリオ確認部によって確認された会話の返答に対応する会話を上記会話シナリオ中から検索し、その検索結果に基づいて上記応答文を生成することが好ましい。上記構成によれば、会話シナリオに従って会話を継続させることができる。
本発明の態様6に係る応答装置は、上記態様1〜5の何れかにおいて、上記音声認識の結果に代替音声が含まれている場合に、当該代替音声から個人情報を復元する復元部(27)を備えていても良い。上記構成によれば、会話中に含まれる代替音声から元の個人情報を復元することができる。
本発明の態様7に係る応答装置の制御方法は、入力された音声の音声認識の結果に基づいて応答する応答装置の制御方法であって、入力された音声の音声認識の結果に基づいて応答文を生成する応答生成ステップと、生成された応答文の中に個人情報が含まれているか否かを判定する個人情報判定ステップと、上記応答文の中に個人情報が含まれていると判定された場合、当該個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することで上記応答文を変更する応答変更ステップと、上記応答生成ステップで生成された応答文、または上記応答変更ステップで変更された応答文、の何れかから合成された音声を出力する音声出力ステップと、を含む方法である。上記方法によれば、上記態様1と同様の効果を得ることができる。
本発明の各態様に係る応答装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記応答装置が備える各部(ソフトウェア要素)として動作させることにより上記応答装置をコンピュータにて実現させる応答装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
〔付記事項〕
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。
1 ロボット(応答装置)
12 音声出力部
21 音声認識部
22 シナリオ確認部
23 応答生成部
24 個人情報判定部
25 応答変更部
26 音声合成部
27 復元部

Claims (8)

  1. 入力された音声の音声認識の結果に基づいて応答文を生成する応答生成部と、
    生成された応答文の中に個人情報が含まれているか否かを判定する個人情報判定部と、
    上記応答文の中に個人情報が含まれていると判定された場合、当該個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することで上記応答文を変更する応答変更部と、
    上記応答生成部によって生成された応答文、または上記応答変更部によって変更された応答文、の何れかから合成された音声を出力する音声出力部と、を備えていることを特徴とする応答装置。
  2. 上記代替音声は、早送り音声、逆再生音声または暗号化された音声の何れかであることを特徴とする請求項1に記載の応答装置。
  3. 上記個人情報判定部は、
    上記応答生成部によって生成された応答文の中に個人情報として予め指定された指定データが含まれているか否かによって、上記応答文の中に個人情報が含まれている否かを判定し、
    上記応答変更部は、
    上記指定データを上記個人情報として代替音声に置換することを特徴とする請求項1または2に記載の応答装置。
  4. 上記応答変更部は、
    上記応答生成部によって生成された応答文の中に個人情報が含まれていないと判定された場合、上記生成された応答文を変更しないことを特徴とする請求項1から3までの何れか1項に記載の応答装置。
  5. 上記音声認識の結果が、所定の会話シナリオ中のどの会話に対応しているかを確認するシナリオ確認部を備え、
    上記応答生成部は、
    上記シナリオ確認部によって確認された会話の返答に対応する会話を上記会話シナリオ中から検索し、その検索結果に基づいて上記応答文を生成することを特徴とする請求項1から4までの何れか1項に記載の応答装置。
  6. 上記音声認識の結果に代替音声が含まれている場合に、当該代替音声から個人情報を復元する復元部を備えていることを特徴とする請求項1から5までの何れか1項に記載の応答装置。
  7. 請求項1に記載の応答装置としてコンピュータを機能させるための制御プログラムであって、上記応答生成部、上記個人情報判定部、および上記応答変更部としてコンピュータを機能させるための制御プログラム。
  8. 入力された音声の音声認識の結果に基づいて応答する応答装置の制御方法であって、
    入力された音声の音声認識の結果に基づいて応答文を生成する応答生成ステップと、
    生成された応答文の中に個人情報が含まれているか否かを判定する個人情報判定ステップと、
    上記応答文の中に個人情報が含まれていると判定された場合、当該個人情報を、人には理解できず、会話の相手側の装置にて元の情報に復元することが可能な代替音声に置換することで上記応答文を変更する応答変更ステップと、
    上記応答生成ステップで生成された応答文、または上記応答変更ステップで変更された応答文、の何れかから合成された音声を出力する音声出力ステップと、を含むことを特徴とする応答装置の制御方法。
JP2018536951A 2016-09-02 2017-06-05 応答装置およびその制御方法、ならびに制御プログラム Expired - Fee Related JP6644153B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016172311 2016-09-02
JP2016172311 2016-09-02
PCT/JP2017/020737 WO2018042798A1 (ja) 2016-09-02 2017-06-05 応答装置およびその制御方法、ならびに制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2018042798A1 JPWO2018042798A1 (ja) 2019-03-07
JP6644153B2 true JP6644153B2 (ja) 2020-02-12

Family

ID=61300307

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018536951A Expired - Fee Related JP6644153B2 (ja) 2016-09-02 2017-06-05 応答装置およびその制御方法、ならびに制御プログラム

Country Status (3)

Country Link
JP (1) JP6644153B2 (ja)
CN (1) CN109643543A (ja)
WO (1) WO2018042798A1 (ja)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004517376A (ja) * 2000-07-07 2004-06-10 クゥアルコム・インコーポレイテッド 可聴音による確実な識別認証のための方法と装置
JP2002269047A (ja) * 2001-03-07 2002-09-20 Nec Eng Ltd 音声ユーザ認証システム
JP3578450B2 (ja) * 2001-06-29 2004-10-20 株式会社東芝 電子文書の実名語/匿名語マップ作成装置及びプログラム、電子文書の匿名化装置及びプログラム、電子文書の実名化装置及びプログラム
JP4747573B2 (ja) * 2004-12-22 2011-08-17 日本電気株式会社 音声情報加工システム、音声情報加工方法及び音声情報加工プログラム
JP5175231B2 (ja) * 2009-02-20 2013-04-03 沖電気工業株式会社 通話システム、通話方法、通話プログラム、電話端末及び交換機
JP2012170024A (ja) * 2011-02-16 2012-09-06 Nikon Corp 情報処理装置
JP2013098869A (ja) * 2011-11-02 2013-05-20 Chiba Inst Of Technology 音声システム
CN102438024A (zh) * 2012-01-05 2012-05-02 重庆大学 基于非语言特征的声音验证方法
EP3089158B1 (en) * 2013-12-26 2018-08-08 Panasonic Intellectual Property Management Co., Ltd. Speech recognition processing

Also Published As

Publication number Publication date
JPWO2018042798A1 (ja) 2019-03-07
WO2018042798A1 (ja) 2018-03-08
CN109643543A (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
JP5701916B2 (ja) 電話での会話をテキストに書き起こすための方法及びシステム
JP2001217935A (ja) 音声認識手段を使用する自動音声応答システムおよび方法
JP2012156781A (ja) 携帯通信端末
JP2017138536A (ja) 音声処理装置
WO2018135276A1 (ja) 言動制御装置、ロボット、制御プログラムおよび言動制御装置の制御方法
JP6559417B2 (ja) 情報処理装置、情報処理方法、対話システム、および制御プログラム
JP6644153B2 (ja) 応答装置およびその制御方法、ならびに制御プログラム
US20200065057A1 (en) Audio adjusting device, computer-readable non-transitory storage medium storing control program, electronic apparatus, and method for controlling audio adjusting device
WO2018020828A1 (ja) 翻訳装置および翻訳システム
JP6508251B2 (ja) 音声対話システムおよび情報処理装置
US20240007560A1 (en) System and method for providing voice communication sessions between communication devices
JP2007235328A (ja) 音声通話用端末装置及び音声通話用プログラム
JP2000285063A (ja) 情報処理装置および情報処理方法、並びに媒体
JPWO2019003357A1 (ja) コンピュータシステム、Web会議音声補助方法及びプログラム
JP5175231B2 (ja) 通話システム、通話方法、通話プログラム、電話端末及び交換機
KR20020020585A (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
JP2010177773A (ja) 電子機器及びイヤホン検出方法
JP2006295468A (ja) 携帯通信端末装置
JPWO2018168460A1 (ja) 管理サーバ
JP2007028266A (ja) 電話サービス提供装置及びその方法
JP6972576B2 (ja) 通信装置、通信システム、通信方法及びプログラム
JP2007006238A (ja) 電話連絡方法、及び記録媒体
JP5110045B2 (ja) 電話中継装置、電話中継方法、及びプログラム
JP2015231083A (ja) 音声合成通話システム、通信端末および音声合成通話方法
JP2005295253A (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200107

R150 Certificate of patent or registration of utility model

Ref document number: 6644153

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees