JP7010073B2

JP7010073B2 - 出力内容制御装置、出力内容制御方法、及び出力内容制御プログラム

Info

Publication number: JP7010073B2
Application number: JP2018044598A
Authority: JP
Inventors: 立巳長沼
Original assignee: JVCKenwood Corp
Current assignee: JVCKenwood Corp
Priority date: 2018-03-12
Filing date: 2018-03-12
Publication date: 2022-01-26
Anticipated expiration: 2038-03-12
Also published as: JP2019159060A; US11244675B2; CN110265005B; CN110265005A; US20190279631A1

Description

本発明は、出力内容制御装置、出力内容制御方法、及び出力内容制御プログラムに関する。

例えば特許文献１に示すように、検出したユーザの音声を解析して、ユーザの意図に応じた処理を行う音声制御装置が提案されている。また、ユーザの意図した処理を行ったことを音声で出力したり、ユーザの問い合わせ内容を音声で出力したりする音声制御装置も提案されている。

特公平７－１０９５６０号公報

ここで、音声を出力する音声処理装置を用いる場合、ユーザの問い合わせ内容に対する音声制御装置からの通知が、ユーザ以外の周囲にいる人にも聞こえてしまう場合がある。この場合、音声制御装置からの通知をユーザ以外に知られたくない場合でも、ユーザ以外にも知られてしまうおそれがある。従って、ユーザの問い合わせ内容を通知する場合に、その通知の内容をユーザ以外に理解させ難くすることが求められている。

本発明は、上記課題を鑑み、ユーザの問い合わせ内容を通知する場合に、その通知の内容をユーザ以外に理解させ難くする出力内容制御装置、出力内容制御方法、及び出力内容制御プログラムを提供することを目的とする。

本発明の一態様にかかる出力内容制御装置は、音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類部と、前記音声取得部が取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を検出する意図解析部と、前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得部と、前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成部と、を有し、前記出力内容生成部は、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成する。

本発明の一態様にかかる出力内容制御方法は、音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力文章生成ステップと、を有し、前記出力文章生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成する。

本発明の一態様にかかる出力内容制御プログラムは、音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力文章生成ステップと、をコンピュータに実行させ、前記出力文章生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成する。

本発明によれば、ユーザの問い合わせ内容を通知する場合に、その通知の内容をユーザ以外に理解させ難くすることができる。

図１は、第１実施形態に係る出力内容制御装置の模式図である。図２は、第１実施形態に係る出力内容制御装置の模式的なブロック図である。図３は、意図情報の例を示すテーブルである。図４は、属性情報の例を示すテーブルである。図５は、取得情報の例を示すテーブルである。図６は、関係情報の一例を示すテーブルである。図７は、第１実施形態に係る出力文章の出力処理のフローを示すフローチャートである。図８は、第１実施形態に係る出力内容制御装置の他の例を示す模式図である。図９は、第２実施形態に係る情報出力システムの模式的なブロック図である。

以下に、本発明の実施形態を図面に基づいて詳細に説明する。なお、以下に説明する実施形態により本発明が限定されるものではない。

（第１実施形態）
最初に、第１実施形態について説明する。図１は、第１実施形態に係る出力内容制御装置の模式図である。図１に示すように、第１実施形態に係る出力内容制御装置１は、ユーザＨが発する音声Ｖ１を音声検出部１０で検出し、検出した音声Ｖ１を解析して所定の処理を行って、音声出力部１２により、音声Ｖ２を出力するものである。ここで、音声Ｖ２は、ユーザＨに向かって出力されるが、出力内容制御装置１の周囲に他の人がいる場合、その人にも届く場合がある。この場合、ユーザＨにとって、他の人に知られたくない情報が音声Ｖ２に含まれている場合であっても、ユーザＨ以外にも音声Ｖ２が聞こえ、情報を知られてしまうおそれがある。本実施形態に係る出力内容制御装置１は、音声Ｖ１を解析して、音声Ｖ２として出力される文章などを調整することで、音声Ｖ２の内容をユーザＨにのみ適切に理解することを可能とし、さらにユーザＨ以外のユーザには理解させ難くすることを可能としている。

図２は、第１実施形態に係る出力内容制御装置の模式的なブロック図である。図２に示すように、出力内容制御装置１は、音声検出部１０と、音声出力部１２と、点灯部１４と、制御部１６と、通信部１８と、記憶部２０とを有する。出力内容制御装置１は、いわゆるスマートスピーカ（ＡＩスピーカ）であるが、後述する機能を発揮する装置であれば、それに限られない。出力内容制御装置１は、例えばスマートフォンやタブレットなどであってもよい。

音声検出部１０は、マイクであり、ユーザＨが発する音声Ｖ１を検出する。ユーザＨは、音声検出部１０に向けて、出力内容制御装置１に実行して欲しい処理内容の情報を含めるように、音声Ｖ１を発する。なお、音声検出部１０は、外部からの情報を受け付ける入力部であるともいえるが、入力部は、音声検出部１０以外にも設けられていてよく、例えば、ユーザＨの操作により音声Ｖ２の音量を調整するスイッチなどが設けられていてもよい。音声出力部１２は、スピーカであり、制御部１６が生成した文章（後述する出力文章）を、音声Ｖ２として出力する。点灯部１４は、例えばＬＥＤ（Light Emitting Diode）などの光源であり、制御部１６の制御により、点灯する。通信部１８は、例えばアンテナなど、外部サーバなどに通信する機構であり、制御部１６の制御により、図示しない外部サーバと情報の送受信を行う。通信部１８は、無線通信により外部サーバと情報の送受信を行うが、有線通信により外部サーバと情報の送受信を行ってもよい。記憶部２０は、制御部１６の演算内容やプログラムの情報などを記憶するメモリであり、例えば、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）と、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）と、フラッシュメモリ（ＦｌａｓｈＭｅｍｏｒｙ）などの外部記憶装置とのうち、少なくとも１つ含む。

制御部１６は、演算装置、すなわちＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）である。制御部１６は、音声取得部３０と、音声解析部３２と、意図解析部３４と、通知情報取得部３６と、処理部３８と、出力内容生成部（音声内容生成部）４０と、音声分類部４２と、出力制御部４４とを有する。音声取得部３０と、音声解析部３２と、意図解析部３４と、通知情報取得部３６と、処理部３８と、出力内容生成部４０と、音声分類部４２と、出力制御部４４とは、記憶部２０に記憶されたソフトウェア（プログラム）を読み出すことで、後述する処理を実行する。

音声取得部３０は、音声検出部１０が検出した音声Ｖ１を取得する。音声解析部３２は、音声取得部３０が取得した音声Ｖ１の音声解析を実行して、音声Ｖ１をテキストデータに変換する。テキストデータは、音声Ｖ１として発せられた文章を含む文字データ（テキストデータ）である。音声解析部３２は、例えば、音声Ｖ１から、時間毎の振幅波形（音声波形）を検出する。そして、音声解析部３２は、振幅と文字との関係を記憶したテーブルに基づき、時間毎の振幅をそれぞれ文字に置き換えることで、音声Ｖ１をテキストデータに変換する。ただし、音声解析部３２は、音声Ｖ１をテキストデータに変換できるものであれば、変換の方法は任意である。

意図解析部３４は、音声解析部３２が生成したテキストデータを取得して、テキストデータに基づき、意図情報Ｉを検出する。意図情報Ｉとは、ユーザＨの意図を示す情報、すなわちインテントである。言い換えれば、意図情報Ｉは、ユーザＨが、出力内容制御装置１にどのような処理を行うことを意図しているかを示す情報であり、本実施形態では、ユーザＨがどのような情報を求めているかを示す情報である。

意図解析部３４は、例えば自然言語処理を用いて、テキストデータから意図情報Ｉを検出する。本実施形態では、意図解析部３４は、記憶部２０に記憶されている複数の教師ありデータに基づき、テキストデータから、意図情報Ｉを検出する。ここでの教師有りデータは、テキストデータに対して意図情報Ｉが予め設定されているデータである。すなわち、意図解析部３４は、音声解析部３２が生成したテキストデータと類似している教師ありデータを抽出し、その教師ありデータの意図情報Ｉを、音声解析部３２が生成したテキストデータの意図情報Ｉとする。なお、教師有りデータは、記憶部２０に記憶されていなくてもよく、意図解析部３４が、通信部１８を制御して外部サーバから教師ありデータを検索してもよい。なお、意図解析部３４は、テキストデータから意図情報Ｉを検出するものであれば、意図情報Ｉの検出方法は任意である。例えば、意図解析部３４は、記憶部２０に記憶されたキーワードと意図情報Ｉとの関係テーブルを読み出し、テキストデータに関係テーブル中のキーワードが含まれている場合に、そのキーワードに紐づいた意図情報Ｉを抽出してもよい。

図３は、意図情報の例を示すテーブルである。例えばテキストデータが「今日のスケジュールは」という文章である場合、意図解析部３４は、上述のような解析を行って、スケジュールをユーザＨに通知するという処理が、ユーザＨが要求している処理の情報である、すなわち意図情報Ｉであると認識する。すなわち、意図解析部３４は、ユーザが求めている情報、すなわち意図情報Ｉが、スケジュールであると検出する。

なお、テキストデータによる意図情報Ｉの検出方法は、これに限られず任意である。例えば、出力内容制御装置１は、キーワードと意図情報Ｉとの関係テーブルを記憶部２０に記憶しておき、ユーザＨが発した音声Ｖ１のテキストデータがそのキーワードを含む場合に、そのキーワードに紐付けられた意図情報Ｉを検出してもよい。この場合の例としては、「こんにちは」というキーワードと、天気情報及びニュースの情報とを紐付けておくことが挙げられる。この場合、ユーザＨが「こんにちは」という音声Ｖ１を発すると、意図解析部３４は、天気情報とニュースの情報とを、意図情報Ｉとして検出する。

通知情報取得部３６は、意図情報Ｉに基づき、ユーザＨへ通知する情報の内容である通知情報を取得する。図２に示すように、通知情報取得部３６は、属性情報Ｅを取得する属性情報取得部５０と、取得情報Ａを取得する取得情報取得部５２とを有する。なお、通知情報は、属性情報Ｅと取得情報Ａとを含む情報である。

属性情報取得部５０は、意図情報Ｉに基づき、属性情報Ｅを取得する。属性情報Ｅとは、意図情報Ｉに紐づいた情報であり、ユーザＨが求める情報を取得するために必要となる条件を示す情報である。すなわち、属性情報Ｅは、エンティティである。例えば、意図情報Ｉがスケジュールであるとしても、いつのスケジュールであって誰のスケジュールであるかという、意図情報Ｉをより特定するための条件が分からない場合、出力内容制御装置１は、どのようなスケジュールを通知すればよいかの判断ができない。この場合、出力内容制御装置１は、ユーザＨの意図に応じた通知をすることができない。それに対し、属性情報取得部５０は、どのようなスケジュールを通知すればよいかを判断可能とするために、意図情報Ｉをより特定するための条件として、属性情報Ｅを取得する。

図４は、属性情報の例を示すテーブルである。属性情報Ｅは、属性種類情報Ｅ０と、属性内容情報Ｅ１とを含む。属性種類情報Ｅ０は、条件の種類、すなわちどのような条件であるかを示す情報であり、言い換えれば、意図情報Ｉをより特定するための条件を分類した情報である。そして、属性内容情報Ｅ１は、その属性種類情報Ｅ０の内容を指す。従って、属性種類情報Ｅ０は、属性内容情報Ｅ１の種類を示す情報であるともいえる。従って、属性種類情報Ｅ０と属性内容情報Ｅ１とは、互いに紐付けられている。図４に示すように、例えば、属性種類情報Ｅ０が、条件の種類を人であると分類するものである場合、それに紐付けられた属性内容情報Ｅ１は、その人の名称（ここでは「山田さん」）を指した情報となる。また、図４の例のように、属性種類情報Ｅ０が、条件の種類を日付であると分類するものである場合、それに紐付けられた属性内容情報Ｅ１は、日付（ここでは２０２０年３月２０日）を示す情報となる。このように属性内容情報Ｅ１を設定することにより、例えば、２０２０年３月２０日の山田さんのスケジュールを通知すればよいことが明らかとなる。なお、本実施形態の例では、山田さんとは、ユーザＨ自身である。

本実施形態では、属性情報取得部５０は、抽出した意図情報Ｉから、属性種類情報Ｅ０を検出する。属性情報取得部５０は、記憶部２０に記憶されている意図情報Ｉと属性種類情報Ｅ０との関係テーブルを読み出し、関係テーブルから、意図解析部３４が検出した意図情報Ｉと一致する意図情報Ｉを、検出する。そして、属性情報取得部５０は、関係テーブルから、意図解析部３４が検出した意図情報Ｉと一致する意図情報Ｉに紐付けられた属性種類情報Ｅ０を、抽出して取得する。例えば、意図情報Ｉがスケジュールである場合、関係テーブルには、スケジュールに紐付けられた属性種類情報Ｅ０として、人と日付とが含まれる。この場合、属性情報取得部５０は、属性種類情報Ｅ０として、人と日付との２つを抽出する。このように、１つの意図情報Ｉに対応する属性種類情報Ｅ０は、この例では２つであるが、１つの意図情報Ｉに対応する属性種類情報Ｅ０の数は、意図情報Ｉの内容によって異なる。すなわち、１つの意図情報Ｉに対応する属性種類情報Ｅ０の数は、１つでもよいし、３つ以上であってもよい。また、意図解析部３４は、記憶部２０から関係テーブルを読み出していたが、関係テーブルの読出し先は任意であり、例えば通信部１８を介して図示しない外部サーバ（外部装置）と通信し、外部サーバから関係テーブルを取得してもよい。

属性情報取得部５０は、属性種類情報Ｅ０を取得したら、属性種類情報Ｅ０毎に、属性内容情報Ｅ１を設定する。属性情報取得部５０は、例えば、音声解析部３２が生成したテキストデータから、属性内容情報Ｅ１を抽出する。例えば、音声Ｖ１から生成されたテキストデータに「今日」というキーワードが含まれていたら、日付の属性種類情報Ｅ０に対応する属性内容情報Ｅ１を、今日の日付（図４の例では「２０２０年３月２０日」）に設定する。また、属性情報取得部５０は、属性種類情報Ｅ０に対する属性内容情報Ｅ１を予め設定していてもよい。この場合、例えば、意図情報Ｉがスケジュールである場合、属性内容情報Ｅ１が予め決められた内容である旨の設定データを、記憶部２０に記憶させておく。すなわち、例えば人の属性種類情報Ｅ０に対応する属性内容情報Ｅ１が「山田さん」である旨を、記憶部２０に記憶させておく。このようにしておけば、属性情報取得部５０は、人を示すキーワードがテキストデータに含まれない場合でも、人の属性内容情報Ｅ１を設定可能である。また、属性情報取得部５０は、通信部１８によって外部サーバと通信して属性内容情報Ｅ１を設定してもよい。例えば属性種類情報Ｅ０が場所である場合、意図解析部３４は、通信によりＧＰＳにより現在の場所を取得し、それを属性内容情報Ｅ１として設定してよい。また、出力内容制御装置１は、ユーザＨに、属性内容情報Ｅ１の情報を伝えることを促す通知を出力してもよい。この場合、例えば、属性情報取得部５０が、属性内容情報Ｅ１の取得が必要な属性種類情報Ｅ０を選択し、出力内容生成部４０に、ユーザＨに対してその属性種類情報Ｅ０についての属性内容情報Ｅ１を伝達することを要請する文章を、生成させる。例えば、日付の属性種類情報Ｅ０の場合は、出力内容生成部４０は、たとえば、「通知するスケジュールの日付を教えて下さい」などの文章を生成する。そして、出力制御部４４が、この文章を、音声出力部１２に出力させる。これにより、ユーザＨは、例えば日付が今日である旨の音声を発し、その音声を音声解析部３２で解析して、属性情報取得部５０が、属性内容情報Ｅ１が今日である旨の情報を取得する。

図５は、取得情報の例を示すテーブルである。図２に示す取得情報取得部５２は、意図情報Ｉと属性情報Ｅとに基づき、取得情報Ａを取得する。取得情報Ａとは、ユーザＨの意図に応じた情報であり、言い換えれば、ユーザＨが求めている情報である。取得情報Ａは、取得種類情報Ａ０と、取得内容情報Ａ１とを含む。取得種類情報Ａ０は、ユーザＨが求めている情報がどのような種類のものであるかを示す情報であり、言い換えれば、ユーザＨが求めている情報を分類した情報である。そして、取得内容情報Ａ１は、その取得種類情報Ａ０の内容を指す。すなわち、取得種類情報Ａ０は、取得内容情報Ａ１の種類を示す情報であるともいえる。従って、取得種類情報Ａ０と取得内容情報Ａ１とは、互いに紐付けられている。図５に示すように、例えば、取得種類情報Ａ０が、ユーザＨが求めている情報の種類を場所であると分類するものである場合、それに紐付けられた取得内容情報Ａ１は、その場所を指す情報（図５の例では、「東京ビルディング」）となる。

本実施形態において、取得情報取得部５２は、意図情報Ｉから、取得種類情報Ａ０を検出する。属性情報取得部５０は、記憶部２０に記憶されている意図情報Ｉと取得種類情報Ａ０との関係テーブルを読み出し、関係テーブルから、意図解析部３４が検出した意図情報Ｉと一致する意図情報Ｉを、検出する。そして、取得情報取得部５２は、関係テーブルから、意図解析部３４が検出した意図情報Ｉと一致する意図情報Ｉに紐付けられた取得種類情報Ａ０を、抽出して取得する。例えば、意図情報Ｉがスケジュールである場合、関係テーブルには、スケジュールに紐付けられた取得種類情報Ａ０として、場所と時間と内容と人とを含む。この場合、取得情報取得部５２は、取得種類情報Ａ０として、場所と時間と内容と人との４つを抽出する。このように、１つの意図情報Ｉに対応する取得種類情報Ａ０は、この例では４つであるが、１つの意図情報Ｉに対応する取得種類情報Ａ０の数は、意図情報Ｉの内容によって異なる。すなわち、１つの意図情報Ｉに対応する取得種類情報Ａ０の数は、１つでもよいし、３つ以上であってもよい。また、取得情報取得部５２は、記憶部２０から関係テーブルを読み出していたが、関係テーブルの読出し先は任意であり、例えば通信部１８を介して図示しない外部サーバと通信し、外部サーバから関係テーブルを取得してもよい。

取得情報取得部５２は、取得種類情報Ａ０を取得したら、取得種類情報Ａ０毎に、取得内容情報Ａ１を取得する。取得情報取得部５２は、取得情報取得部５２が取得した属性内容情報Ｅ１である場合の取得内容情報Ａ１を、取得種類情報Ａ０毎に取得する。すなわち、取得情報取得部５２は、属性内容情報Ｅ１の条件下においての取得内容情報Ａ１を、取得種類情報Ａ０毎に取得する。取得情報取得部５２は、記憶部２０に取得内容情報Ａ１が記憶されている場合、記憶部２０から取得内容情報Ａ１を取得する。また、取得情報取得部５２は、通信部１８によって外部サーバ（外部機器）と通信して、取得種類情報Ａ０毎に、外部サーバから、取得内容情報Ａ１を取得してもよい。すなわち、取得内容情報Ａ１とは、取得情報取得部５２が、外部サーバや記憶部２０などのデータベースから取得するデータであるといえる。

今回の例では、取得情報取得部５２は、２０２０年３月２０日の山田さんのスケジュールという条件における、取得内容情報Ａ１を取得する。この場合、例えば、取得情報取得部５２は、山田さんのスケジュールを記録してある外部サーバとしての端末と通信を行ったり、記憶部２０が記憶している山田さんのスケジュールを読み出したりして、２０２０年３月２０日における、山田さんのスケジュールの情報を、取得種類情報Ａ０毎に読み出す。ここでは、２０２０年３月２０日における山田さんのスケジュールが、東京ビルディングで１５時から吉田さんとのミーティングである場合を例にする。この場合、取得情報取得部５２は、場所の取得種類情報Ａ０に対する取得内容情報Ａ１として、「東京ビルディング」であるという情報を取得し、時間の取得種類情報Ａ０に対する取得内容情報Ａ１として、「１５時」であるという情報を取得し、内容の取得種類情報Ａ０に対する取得内容情報Ａ１として、「ミーティング」であるという情報を取得し、人の取得種類情報Ａ０に対する取得内容情報Ａ１として、「吉田さん」であるという情報を取得する。

取得情報取得部５２は、このようにして、ユーザＨが求めている情報の内容である取得内容情報Ａ１を、取得種類情報Ａ０毎に取得する。ここで、後述する出力内容生成部４０は、この取得内容情報Ａ１を含む文章を、ユーザＨに通知する出力文章として生成することで、ユーザＨが求めている情報を通知することができる。ただし、ユーザＨに通知する出力文章としては、取得内容情報Ａ１だけでなく、属性内容情報Ｅ１を含む場合がある。すなわち、取得内容情報Ａ１のみの文章は、「東京ビルディングで１５時から吉田さんとのミーティングです」という文章になるのに対し、属性内容情報Ｅ１を含む文章は、「２０２０年３月２０日の山田さんのスケジュールは、東京ビルディングで１５時から吉田さんとのミーティングです」となり、内容をより理解しやすくなる。このように、ユーザに通知する情報は、取得内容情報Ａ１と属性内容情報Ｅ１とを含む。従って、以下、属性情報Ｅと取得情報Ａとを、適宜、通知情報と呼ぶ。

また、通知情報は、種類情報と内容情報とを有するといえる。内容情報は、属性内容情報Ｅ１と取得内容情報Ａ１とであり、ユーザＨに通知する情報の内容を示すものであるといえる。また、種類情報は、属性種類情報Ｅ０と取得種類情報Ａ０とを指し、ユーザに通知する情報の種類を示す情報であり、内容情報の種類を示すものであるといえる。図２に示す通知情報取得部３６は、種類情報と内容情報とを、通知情報として取得しているといえる。

なお、通知情報取得部３６は、意図情報Ｉが、ユーザＨが情報を通知することを求めているという内容である場合に、ユーザＨが求める情報を取得する処理を実行している。一方、ユーザＨは、出力内容制御装置１に対し、情報を通知することを求める以外に、他の機器を制御することを求める場合がある。例えば、ユーザＨは、「キッチンの照明をつけて」という音声Ｖ１を出力する場合がある。この場合、意図解析部３４は、機器を制御するという意図情報Ｉを検出する。そして、図２に示す処理部３８が、この意図情報Ｉに基づき、場所という属性種類情報Ｅ０の属性内容情報Ｅ１を「キッチン」とし、対象機器という属性種類情報Ｅ０の属性内容情報Ｅ１を「照明」とし、処理内容という属性種類情報Ｅ０の属性内容情報Ｅ１を「オンにする」として検出し、属性内容情報Ｅ１に基づき、キッチンの照明をオンにするという制御を実行する。この場合、出力内容生成部４０は、「はい、処理を終了しました」という出力文章を生成し、出力制御部４４が、この出力文章を、音声出力部１２に出力させる。ただし、出力内容制御装置１は、ユーザＨが求める情報を通知するものであればよく、このように他の機器を制御する処理を行わなくてもよい。

図２に戻り、出力内容生成部４０は、通知情報取得部３６が取得した通知情報、より具体的には属性内容情報Ｅ１と取得内容情報Ａ１とに基づき、出力文章を生成する。出力文章とは、音声出力部１２に出力させる音声Ｖ２用の文章のデータ、すなわちテキストデータである。出力文章は、ダイアログデータであるということもできる。出力内容生成部４０は、出力文章として第１出力文章を生成する第１出力内容生成部６０と、出力文章として第２出力文章を生成する第２出力内容生成部６２とを有する。第１出力内容生成部６０と第２出力内容生成部６２とを説明する前に、音声分類部４２について説明する。

音声分類部４２は、音声取得部３０が取得した音声Ｖ１を解析して、音声が、所定の音声であるか否かを判定する。本実施形態では、音声分類部４２は、音声取得部３０が取得した音声Ｖ１を解析して、音声Ｖ１を、第１音声Ｖ１Ａと第２音声Ｖ１Ｂとのいずれかに分類する。第１音声Ｖ１Ａが、所定の音声に相当する。本実施形態では、音声分類部４２は、音声Ｖ１を解析して、音声Ｖ１がささやき声である場合、その音声Ｖ１を第１音声Ｖ１Ａに分類する（所定の音声であると判定する）。そして、音声分類部４２は、音声Ｖ１がささやき声でない場合、その音声Ｖ１を第２音声Ｖ１Ｂに分類する。ささやき声とは、声帯を振動させず無声化したときの声であるが、例えば後述の方法で第１音声Ｖ１Ａとして分類される声であれば、声帯を振動させず無声化したときの声であることに限られない。

例えば、音声分類部４２は、音声Ｖ１の強度の時間波形を取得し、その時間波形をフーリエ変換することで、周波数毎の音声Ｖ１の強度を示すスペクトルを取得する。そして、音声分類部４２は、スペクトルが有する所定強度以上のピークの周波数を特徴量として、音声Ｖ１が、第１音声Ｖ１Ａであるか第２音声Ｖ１Ｂであるか分類する。例えば、音声分類部４２は、ピークの周波数が閾値以下である場合、ささやき声であるとして、第１音声Ｖ１Ａであると分類し、ピークの周波数が閾値より大きい場合、ささやき声でないとして、第２音声Ｖ１Ｂであると分類する。ただし、音声分類部４２は、任意の方法で、第１音声Ｖ１Ａと第２音声Ｖ１Ｂとを分類してもよい。例えば、音声分類部４２は、スペクトルのピークの傾きを特徴量として、第１音声Ｖ１Ａと第２音声Ｖ１Ｂとを分類してもよい。また、音声分類部４２は、音声Ｖ１の音量、音声Ｖ１に含まれるユーザＨの発語の速度、及び、音声Ｖ１のうちの人の発語と風切音との音量比のいずれかを特徴量として、第１音声Ｖ１Ａと第２音声Ｖ１Ｂとを分類してもよい。また、出力内容制御装置１に近接センサを設け、近接センサの検出結果によりユーザＨと出力内容制御装置１との間の距離を算出し、その距離を特徴量として、第１音声Ｖ１Ａと第２音声Ｖ１Ｂとを分類してもよい。また、音声分類部４２は、音声Ｖ１から、特徴量としてメル周波数ケプストラム係数を導出して、メル周波数ケプストラム係数に基づき、第１音声Ｖ１Ａと第２音声Ｖ１Ｂとを分類してもよい。これらの場合において、音声分類部４２は、特徴量について閾値を設定しておき、特徴量が閾値を上回るか否かに基づき、音声Ｖ１を、第１音声Ｖ１Ａと第２音声Ｖ１Ｂとのいずれかに分類する。

このように、音声分類部４２は、音声取得部３０が取得した音声Ｖ１を用いて、音声Ｖ１を分類するものである。すなわち、音声分類部４２は、音声Ｖ１の意味が同じであっても、音声Ｖ１がささやき声である場合は、第１音声Ｖ１Ａに分類し、音声Ｖ１がささやき声でない場合は、第２音声Ｖ１Ｂに分類する。

また、音声分類部４２は、音声Ｖ１から第１音声Ｖ１Ａであるか第２音声Ｖ１Ｂであるかを分類する方法に限らない。音声取得部３０が取得した音声Ｖ１に対して文字解析を行うことで音声Ｖ１のテキストデータを生成し、音声Ｖ１のテキストデータを用いて分類することであってもよい。例えば、音声分類部４２は、ささやき声であるかの判定ではなく、例えば音声Ｖ１に含まれるキーワードに基づき音声Ｖ１を分類してもよい。すなわち、音声分類部４２は、音声Ｖ１に、記憶部２０が記憶したキーワードが含まれる場合に、第１音声Ｖ１Ａであると分類し、記憶部２０が記憶したキーワードが含まれない場合に、第２音声Ｖ１Ｂであると分類してもよい。

音声分類部４２は、以上説明した分類方法のいずれかを用いてもよいし、以上説明した分類方法を組み合わせて、分類を行ってもよい。

出力内容生成部４０は、音声分類部４２によって、音声Ｖ１が第２音声Ｖ１Ｂであると分類された場合に、第２出力内容生成部６２に、第２出力文章を生成させる。すなわち、出力内容生成部４０は、音声Ｖ１が第２音声Ｖ１Ｂであると分類された場合には、第１出力文章を生成せず第２出力文章を生成する。第２出力内容生成部６２は、属性情報取得部５０に取得された属性内容情報Ｅ１と取得情報取得部５２に取得された取得内容情報Ａ１と意図解析部３４に取得された意図情報Ｉとの全ての情報を含む文章を、第２出力文章として生成する。すなわち、第２出力文章は、属性内容情報Ｅ１と取得内容情報Ａ１と意図情報Ｉとを全て含むテキストデータである。

さらに言えば、第２出力文章は、意図情報Ｉの内容を示す単語と属性内容情報Ｅ１の内容を示す単語と取得内容情報Ａ１の内容を示す単語とを含んだテキストデータであるといえる。意図情報Ｉの内容を示す単語は、ここでは「スケジュール」という名詞である。また、属性内容情報Ｅ１の内容を示す単語は、ここでは、「山田さん」という名詞（さらに言えば固有名詞）と、「２０２０年３月２０日」という数値を含む単語である。また、取得内容情報Ａの内容を示す単語は、ここでは、「東京ビルディング」、「吉田さん」という名詞（さらに言えば固有名詞）と、「ミーティング」という名詞、「１５時」という数値とを含む。第２出力文章は、これらの単語を全て含むテキストデータであるといえる。具体的には、この例での第２出力文章は、「２０２０年３月２０日の山田さんのスケジュールは、東京ビルディングで１５時から吉田さんとのミーティングです」というものとなる。ただし、第２出力文章は、意図情報Ｉと属性内容情報Ｅ１と取得内容情報Ａ１との内容を示す単語を全て含むものでなくてもよく、意図情報Ｉと属性内容情報Ｅ１と取得内容情報Ａ１との内容を示す単語の少なくともいずれかを含まなくてもよい。第２出力文章は、後述する第１出力文章とは異なり、意図情報Ｉと属性内容情報Ｅ１と取得内容情報Ａ１との内容を示す単語が、他の単語に置換されたものでなければよい。

一方、出力内容生成部４０は、音声分類部４２によって、音声Ｖ１が第１音声Ｖ１Ａであると分類された場合に、第１出力内容生成部６０に、第１出力文章を生成させる。すなわち、出力内容生成部４０は、音声Ｖ１が第１音声Ｖ１Ａであると分類された場合には、第２出力文章を生成せず第１出力文章を生成する。第１出力内容生成部６０は、内容情報（属性内容情報Ｅ１と取得内容情報Ａ１）に含まれる単語のうちから選択した単語を他の単語に置換した文章を、第１出力文章として生成する。すなわち、第１出力内容生成部６０は、意図情報Ｉの内容を示す単語と属性内容情報Ｅ１の内容を示す単語と取得内容情報Ａ１の内容を示す単語とを取得する。そして、第１出力内容生成部６０は、属性内容情報Ｅ１と取得内容情報Ａ１との内容を示す単語から、他の単語に置換する単語を選択する。そして、第１出力内容生成部６０は、選択した単語を他の単語に置換し、選択しなかった単語は置換しない。従って、第１出力文章は、意図情報Ｉと属性内容情報Ｅ１と取得内容情報Ａ１との内容を示す単語とのうち置換しなかった単語と、意図情報Ｉと属性内容情報Ｅ１と取得内容情報Ａ１との内容を示す単語とのうち置換した単語とを含んだ文章となる。このように、本実施形態では、属性内容情報Ｅ１と取得内容情報Ａ１とを示す通知情報から、置換する単語を選択する。ただし、第１出力内容生成部６０は、意図情報Ｉについても通知情報として、意図情報Ｉからも置換する単語を選択してもよい。

なお、第１出力内容生成部６０は、置換する単語として、名詞、より好適には固有名詞を選択することが好ましい。ただし、置換する単語として動詞や数値を選択してもよい。ただし、置換する単語が名詞である場合は置換後の単語も名詞であることが好ましく、置換する単語が動詞である場合は置換後の単語も動詞であることが好ましく、置換する単語が数値である場合は置換後の単語も数値であることが好ましい。このように置換前と置換後の品詞を一致させておくことで、置換後の第１出力文章が、ユーザＨにも分かり難くなることを抑制する。

ここで、内容情報と置換情報とは、紐付けられている。言い換えれば、属性内容情報Ｅ１と属性種類情報Ｅ０とは、例えば図４に示す「山田さん」と「人」とのように、紐付けられており、取得内容情報Ａ１と取得種類情報Ａ０とも、例えば図５に示す「ミーティング」と「内容」とのように、紐付けられている。第１出力内容生成部６０は、属性内容情報Ｅ１に含まれる単語とその属性内容情報Ｅ１に紐付けられた属性種類情報Ｅ０とに基づき、他の単語に置換する単語を選択する。同様に、第１出力内容生成部６０は、取得内容情報Ａ１に含まれる単語とその取得内容情報Ａ１に紐付けられた取得種類情報Ａ０とに基づき、他の単語に置換する単語を選択する。以下、より具体的に説明する。

図６は、関係情報の一例を示すテーブルである。記憶部２０は、図６に示すような関係情報を、テーブルとして予め記憶している。ここでの関係情報は、置換の対象となる単語である置換元単語（第１単語）と、置換された後の単語である置換単語（第２単語）とが紐付けられた情報である。関係情報は、互いに異なる複数の置換元単語を有しており、１つの置換元単語には、１つの置換単語が紐付けられている。すなわち、関係情報は、置換元単語と置換単語との組を、複数有している。なお、置換単語は、置換元単語ごとに、すなわち組毎に、異なる単語となっている。なお、ここでの置換元単語と置換単語とも、名詞であるが、動詞や数値であってよい。ただし、置換元単語が名詞である場合は置換単語も名詞であることが好ましく、置換元単語が動詞である場合は置換単語も動詞であることが好ましく、置換元単語が数値である場合は置換単語も数値であることが好ましい。

また、関係情報は、置換元単語が示す情報の種類を示す種類情報も含んでいる。関係情報は、種類情報毎に、置換元単語と置換単語との組を有している。例えば、図６の例では、種類情報は、内容である。従って、図６の例では、関係情報は、「内容」という種類情報について、置換元単語が「ミーティング」であり置換単語が「食事」である組と、置換元単語が「通院」であり置換単語が「ミーティング」である組とを有している。なお、種類情報毎の組の数は、図６の例では２つであるが、任意の数であってよい。また、図６の例では、種類情報が「内容」である例を示したが、複数の種類情報について、それぞれ置換元単語と置換単語との組を有していてもよい。

第１出力内容生成部６０は、このような関係情報を、記憶部２０から読み出す。そして、第１出力内容生成部６０は、内容情報に紐付けられた種類情報（例えば図５の「内容」）と一致する種類情報が、関係情報に存在するかを検出する。そして、第１出力内容生成部６０は、一致する種類情報がある場合、種類情報に紐付けられた内容情報に含まれる単語（例えば図５の「ミーティング」）と一致する単語が、一致する種類情報に紐付けられた置換元単語（例えば図６の「ミーティング」）として存在するかを、検出する。第１出力内容生成部６０は、一致する置換元単語がある場合、内容情報に含まれる単語を、置換する単語として選択して、その単語を、一致する置換元単語に紐付けられた置換単語に置換する。すなわち、第１出力内容生成部６０は、内容情報に含まれる単語の種類情報と置換元単語の種類情報とが一致し、かつ、内容情報に含まれる単語が置換元と一致する場合に、その内容情報に含まれる単語を、他の単語に置換する単語として選択する。そして、第１出力内容生成部６０は、置換する単語として選択した単語を、その選択した単語に一致する置換元単語に紐付けられた置換単語に、置換する。なお、第１出力内容生成部６０は、種類情報と単語とのいずれか一方が一致していたとしても、その内容情報に含まれる単語を、他の単語に置換する単語として選択せず、その単語を置換しないで第１出力文章に含めることが好ましい。

今回の例では、関係情報での種類情報が「内容」であるため、図５に示す「内容」という種類情報（取得種類情報Ａ０）に一致する。そして、今回の例では、「内容」という種類情報（取得種類情報Ａ０）についての内容情報（取得内容情報Ａ１）は、図５に示すように、「ミーティング」であり、図６に示すように、「内容」という種類情報についての置換元単語には、一致する「ミーティング」が含まれる。従って、今回の例では、「内容」という種類情報が一致し、かつ、「ミーティング」という単語が一致する。従って、図５に示す「内容」という取得種類情報Ａ０についての「ミーティング」という単語が、置換単語である「通院」に置換される。また、今回の例では、「ミーティング」の他に、種類情報と単語との両方が一致する内容情報が無いため、他の単語は、置換されない。従って、今回の例において、第１出力内容生成部６０は、第１出力文章として、「２０２０年３月２０日の山田さんのスケジュールは、東京ビルディングで１５時から吉田さんとの食事です」となり、「ミーティング」が「食事」に置換された文章となる。

なお、この説明では、記憶部２０が、関係情報をテーブルとして記憶していた。すなわち、関係情報は、予め設定されたものであった。ただし、関係情報は、記憶部２０にテーブルとして記憶されているものに限られない。第１出力内容生成部６０は、ユーザＨ（ここでは山田さん）に関する情報から、関係情報を生成してもよい。例えば、出力内容制御装置１や、ユーザＨが有する他の機器に、ユーザＨに関する情報が記憶されている場合、第１出力内容生成部６０は、その情報を読み出し、その情報から、関係情報を生成する。

例えば、出力内容制御装置１や、ユーザＨが有する他の機器に、連絡先リストが設定されており、その連絡先リストに名前が設定されている人に、ユーザＨによって、その名前とは別の名称（ニックネームなど）が設定されている場合がある。このような場合、第１出力内容生成部６０は、その連絡先リストから、その人の名前と、別の名称とを読み出して、関係情報を生成する。すなわち、この場合、第１出力内容生成部６０は、種類情報として「人」という関係情報を生成し、その関係情報における置換元単語を、その人の名前（例えば吉田さん）とし、置換単語として、その人に設定された別の名称（例えばヨシ）とする。この場合、図５に示す「吉田さん」という取得内容情報Ａ１について、種類情報と単語との両方が一致する。従って、「吉田さん」が、置換単語としての「ヨシ」に置換される。この場合、第１出力文章は、「２０２０年３月２０日の山田さんのスケジュールは、東京ビルディングで１５時からヨシとのミーティングです」となる。

また、例えば、出力内容制御装置１や、ユーザＨが有する他の機器に、地図アプリや住所録が記憶されており、それらに含まれる住所や建物に、ユーザＨによって、別の名称が設定されている場合がある。このような場合、第１出力内容生成部６０は、地図アプリや住所録から、その住所や建物の名称と、別の名称とを読み出して、関係情報を生成する。すなわち、この場合、第１出力内容生成部６０は、種類情報として「場所」という関係情報を生成し、その関係情報における置換元単語を、その住所や建物（例えば東京ビルディング）とし、置換単語として、その住所や建物に設定された別の名称（例えば東ビル）とする。この場合、図５に示す「吉田さん」という取得内容情報Ａ１について、種類情報と単語との両方が一致する。従って、「東京ビルディング」が、置換単語としての「東ビル」に置換される。この場合、第１出力文章は、「２０２０年３月２０日の山田さんのスケジュールは、東ビルで１５時から吉田さんとのミーティングです」となる。

なお、出力内容制御装置１は、関係情報を予めテーブルとして記憶していた場合、このようにユーザＨに関する情報に基づき新たに生成した関係情報を、このテーブルにさらに加えてもよい。

このように、関係情報は、予め置換元単語と置換単語とが設定されているため、ユーザＨは認識できるが、ユーザＨ以外には認識し難い。従って、第１出力文章が音声として出力された場合、ユーザＨにその内容は理解可能であるが、ユーザＨ以外には、内容が理解し難くなり、情報がユーザＨ以外に伝わることを抑制することができる。また、第１出力内容生成部６０は、種類情報が一致した場合に、単語を置換する。従って、第１出力内容生成部６０は、異なる種類、すなわち異なる意味であるが読みとして一致する単語がある場合に、その単語が置換されることを抑制し、置換後の第１出力文章が、ユーザＨにも分かり難くなることを抑制する。ただし、第１出力内容生成部６０は、種類情報が一致しない場合でも、単語さえ一致すれば、その単語を置換してもよい。

また、以上の説明では、第１出力内容生成部６０は、予め置換元単語と置換単語とが設定された関係情報を用いて単語を置換していたが、単語の置換に、必ずしもこのような関係情報を用いなくてもよい。例えば、第１出力内容生成部６０は、内容情報に含まれる単語を、その単語の上位概念となる単語に置換する。上位概念となる単語とは、その単語が、他の単語を包括することを指し、さらに言えば、他の単語より一般的、総称的、又は抽象的な単語をいう。従って、内容情報に含まれる単語を上位概念の単語に置換した場合、その上位概念の単語に包括される単語は、内容情報に含まれる単語以外にも複数あることとなる。従って、ユーザＨ以外の人は、上位概念の単語を聞いても、置換前の内容情報に含まれる単語を類推することができず、情報がユーザＨ以外に伝わることを抑制することができる。一方、ユーザＨは、内容情報に含まれる単語を元々認識していることが多いため、上位概念の単語を聞いて置換前の内容情報に含まれる単語を類推することが可能となり、内容を理解することができる。なお、この場合でも、第１出力内容生成部６０は、種類情報に基づいて置換を行ってよい。すなわち、第１出力内容生成部６０は、内容情報に含まれる単語が上位概念に置換可能であり（例えば後述するような固有名詞である場合など）、かつ、その内容情報に紐付けられた種類情報が、予め定めた所定の種類情報に該当する場合に、その内容情報に含まれる単語を、上位概念の単語に置換する。

例えば、第１出力内容生成部６０は、内容情報に含まれる単語が固有名詞である場合、その固有名詞を、その固有名詞の頭文字に置換する。すなわち、頭文字が、固有名詞の上位概念となる。なお、この場合でも、第１出力内容生成部６０は、種類情報に基づいて置換を行ってよい。すなわち、第１出力内容生成部６０は、内容情報に含まれる単語が固有名詞であって、かつ、その内容情報に紐付けられた種類情報が、予め定めた所定の種類情報に該当する場合、例えば「人」や「法人名」や「店名」などの名称に関連する種類情報である場合に、その単語（固有名詞）を、その頭文字に置換する。この場合、例えば、第１出力文章は、「２０２０年３月２０日のＹさんのスケジュールは、東京ビルディングで１５時からＹさんとのミーティングです」となる。

また例えば、第１出力内容生成部６０は、内容情報の紐付けられた種類情報が場所である場合、その内容情報の単語を、その内容情報における場所の近隣にある施設の名称や、その内容情報の建物や住所が属する地区（町や区や通り）の名称などに置換する。すなわち、近隣にある施設の名称や地区の名称が、上位概念となる。例えば、図５に示す「東京ビルディング」を「東京駅」に置換した場合、第１出力文章は、「２０２０年３月２０日の山田さんのスケジュールは、東京駅近くで１５時から吉田さんとのミーティングです」となる。

第１出力内容生成部６０は、第１音声Ｖ１Ａと分類された場合に、以上のようにして、内容情報に含まれる単語のうちから選択した単語を他の単語に置換した文章を、第１出力文章として生成する。なお、以上説明した単語の置換方法は、それぞれ組み合わせてもよいし、いずれか１つだけ用いてもよい。それぞれ組みわせることで、より他人に理解させ難くすることが可能となる。

図２に戻り、出力制御部４４は、出力内容生成部４０が生成した出力文章、すなわち第１出力文章又は第２出力文章を取得する。出力制御部４４は、このテキストデータとしての出力文章を音声データに変換し、その音声データを、音声Ｖ２として、音声出力部１２に出力させる。また、出力制御部４４は、音声Ｖ２を出力する際や、処理部３８による処理が終了した際や、音声Ｖ１を検出した際などに、点灯部１４を制御して点灯させてもよい。

制御部１６は、以上のような構成となっている。以下、制御部１６による出力文章の出力処理のフローを、フローチャートに基づき説明する。図７は、第１実施形態に係る出力文章の出力処理のフローを示すフローチャートである。図７に示すように、制御部１６は、音声取得部３０により、入力音声、すなわち音声Ｖ１の音声データを取得する（ステップＳ１０）。制御部１６は、音声解析部３２により、音声取得部３０が取得した音声Ｖ１の音声データを解析して、テキストデータを生成する（ステップＳ１２）。そして、制御部１６は、意図解析部３４により、テキストデータから、意図情報Ｉを検出し（ステップＳ１４）、属性情報取得部５０により、意図情報Ｉに基づき、属性情報Ｅを導出する（ステップＳ１６）。属性情報取得部５０は、意図情報Ｉに基づき、属性種類情報Ｅ０と、属性内容情報Ｅ１とを取得する。属性情報Ｅを導出したら、制御部１６は、取得情報取得部５２により、意図情報Ｉと属性情報Ｅとに基づき、取得情報Ａ、すなわち取得種類情報Ａ０と、取得内容情報Ａ１とを取得する（ステップＳ１８）。また、ステップＳ１０で入力音声、すなわち音声Ｖ１を取得したら、制御部１６は、音声分類部４２により、音声Ｖ１を第１音声Ｖ１Ａ、第２音声Ｖ１Ｂのいずれかに分類する（ステップＳ２２）。

制御部１６は、音声Ｖ１が第１音声Ｖ１Ａであるかを判定し（ステップＳ２４）、第１音声Ｖ１Ａである場合（ステップＳ２４；Ｙｅｓ）、第１出力内容生成部６０により、第１出力文章を生成する（ステップＳ２６）。一方、制御部１６は、第１音声Ｖ１Ａでない場合（ステップＳ２４；Ｎｏ）、すなわち第２音声Ｖ１Ｂである場合、第２出力内容生成部６２により、第２出力文章を生成する（ステップＳ２８）。制御部１６は、出力文章、すなわち第１出力文章又は第２出力文章を生成したら、出力制御部４４により、その出力文章を、音声出力部１２により音声Ｖ２として出力させ（ステップＳ３０）、処理を終了する。すなわち、出力制御部４４は、第１出力文章が生成されたら、その第１出力文章を音声データに変換して、音声出力部１２により音声Ｖ２として出力させる。そして、出力制御部４４は、第２出力文章が生成された場合には、その第２出力文章を音声データに変換して、音声出力部１２により音声Ｖ２として出力させる。

以上説明したように、本実施形態に係る出力内容制御装置１は、音声分類部４２と、意図解析部３４と、通知情報取得部３６と、出力内容生成部４０とを有する。音声分類部４２は、音声取得部３０が取得したユーザＨが発する音声Ｖ１を解析して、音声Ｖ１が所定の音声（第１音声Ｖ１Ａ）であるか否かを判定する。意図解析部３４は、音声取得部３０が取得した音声Ｖ１を解析して、ユーザＨがどのような情報を求めているかを示す意図情報Ｉを検出する。通知情報取得部３６は、意図情報Ｉに基づき、ユーザＨへ通知する情報である通知情報を取得する。出力内容生成部４０は、通知情報に基づき、ユーザＨに向けて出力する文章データである出力文章を生成する。出力内容生成部４０は、第１音声Ｖ１Ａと分類された場合、すなわち所定の音声と判定された場合に、通知情報に含まれる単語のうちから選択した単語を他の単語に置換した出力文章（第１出力文章）を生成する。

出力文章の音声データとして出力される音声Ｖ２は、ユーザＨに向かって出力されるが、上述のように、出力内容制御装置１の周囲にいるユーザＨ以外の人にも届く場合がある。しかし、例えばプライバシーの観点から、音声Ｖ２の内容を、ユーザＨ以外には知られたくない場合がある。ユーザＨは、周りの人に音声Ｖ２の内容、すなわち出力内容制御装置１からの出力文章の内容を、他の人に知られたくない場合には、ささやき声で音声Ｖ１を発したりするなど、内容が知られてもよい場合に対し、同じ内容を伝える場合であっても、音声Ｖ１を変化させる。一方、出力内容制御装置１は、第１音声Ｖ１Ａと分類されるような音声Ｖ１が検出された場合には、ユーザＨ以外に内容を知られなくする必要があると判断して、音声Ｖ２用に、第１出力文章を生成する。第１出力文章は、内容情報、すなわちユーザＨに通知する内容（ユーザＨが知りたい情報）に含まれる単語を、他の単語に置換する。これにより、他の単語に置換されると、ユーザＨ以外は、第１出力文章の意味が理解し難くなるため、ユーザＨ以外に、内容を理解させ難くすることができる。

また、出力内容生成部４０は、第２音声Ｖ２Ｂと分類された場合に、通知情報に含まれる単語を置換しない第２出力文章を生成する。この出力内容制御装置１は、ユーザの音声Ｖ１を解析して、第２音声Ｖ１Ｂと分類されるような音声Ｖ１が検出された場合には、ユーザＨ以外に知られてもよい判断して、単語を置換せずに第２出力文章を生成する。これにより、不要な際に単語を置換することを抑制することができる。

また、通知情報取得部３６は、通知情報として、ユーザＨへ通知する情報の内容である内容情報と、内容情報の種類を示す種類情報とを取得する。出力内容生成部４０は、内容情報に含まれる単語とその内容情報に紐付けられた種類情報とに基づき、他の単語に置換する単語を選択する。内容情報に含まれる単語を他の単語に置換した場合、ユーザＨも内容を理解し難くなるおそれがある。それに対し、出力内容制御装置１は、通知する情報と、その情報の種類とに基づき、置換する単語を選択するため、ランダムに単語が置換されることを抑制して、ユーザＨが理解し難くなることを抑制する。

また、出力内容生成部４０は、所定の単語である置換元単語（第１単語）と置換元単語（第１単語）に紐付けられた置換単語（第２単語）との情報を有する関係情報を読み出す。出力内容生成部４０は、通知情報に含まれる単語が置換元単語（第１単語）と一致する場合に、通知情報に含まれる単語を、置換単語（第２単語）に置換する。関係情報は、予め置換元単語と置換単語とが設定されているため、ユーザＨは認識できるが、ユーザＨ以外には認識し難い。従って、出力内容制御装置１は、このように置換単語に置換するため、ユーザＨにその内容は理解可能であるが、情報がユーザＨ以外に伝わることを適切に抑制することができる。

また、関係情報は、置換元単語（第１単語）の種類を示す種類情報の情報も含んでいる。出力内容生成部４０は、通知情報に含まれる単語の種類情報と置換元単語（第１単語）の種類情報とが一致し、かつ、通知情報に含まれる単語が置換元単語（第１単語）と一致する場合に、通知情報に含まれる単語を、他の単語に置換する単語として選択する。このように、出力内容制御装置１は、種類情報が一致した場合に、単語を置換する。従って、第１出力内容生成部６０は、異なる種類、すなわち異なる意味であるが読みとして一致する単語がある場合に、その単語が置換されることを抑制し、置換後の第１出力文章が、ユーザＨにも分かり難くなることを抑制する。

また、出力内容生成部４０は、通知情報に含まれる単語を、その単語の上位概念となる単語に置換する。ユーザＨ以外の人は、上位概念の単語を聞いても、置換前の内容情報に含まれる単語を類推することができず、情報がユーザＨ以外に伝わることを抑制することができる。一方、ユーザＨは、内容情報に含まれる単語を元々認識しておくことが可能であるため、上位概念の単語を聞いて置換前の内容情報に含まれる単語を類推することが可能となり、内容を適切に理解することができる。

また、出力内容生成部４０は、通知情報に含まれる単語が固有名詞である場合、その単語を、固有名詞の頭文字に置換する。ユーザＨ以外の人は、頭文字を聞いても、置換前の内容情報に含まれる単語を類推することができず、情報がユーザＨ以外に伝わることを抑制することができる。一方、ユーザＨは、内容情報に含まれる単語を元々認識しておくことが可能であるため、頭文字を聞いて置換前の内容情報に含まれる単語を類推することが可能となり、内容を適切に理解することができる。

音声分類部４２は、ユーザが発する音声Ｖ１がささやき声である場合に、音声Ｖ１を第２音声Ｖ２Ｂとして分類する。この出力内容制御装置１は、ささやき声を検出して、その場合に第２出力文章を生成ことで、ユーザＨに聞かれたくない内容であるかを適切に検出して、その影響を適切に抑制することができる。

図８は、第１実施形態に係る出力内容制御装置の他の例を示す模式図である。第１実施形態に係る出力内容制御装置１は、上述のように、出力制御部４４は、出力文章を音声データに変換し、その音声データを、音声Ｖ２として、音声出力部１２に出力させていた。ただし、出力内容制御装置１は、第１出力文章を出力する際には、図８に示すように、第１出力文章を、テキストデータとして、音声出力部１２以外の出力部に出力してもよい。例えば、出力内容制御装置１は、出力内容制御装置１に接続された表示装置１２Ａに、第１出力文章を表示させてもよい。また、出力内容制御装置１は、例えばユーザＨが有する端末１０２に、第１出力文章を表示させてもよい。また、出力内容制御装置１は、第１出力文章を電子メールに添付して、その電子メールを、所定の宛先に送信してもよい。この場合、出力内容制御装置１は、送信する宛先を、予め定めておくことが好ましい。このように、出力内容制御装置１は、第１出力文章を出力する際には、音声でなく、テキストデータとして、第１出力文章を出力してもよい。このような場合、音声が出力されないため、他の人に聞かれることがなくなり、内容が知られる可能性をより低減することができる。さらに、例えこのテキストデータを視認されたとしても、第１出力文章として、単語が置換されているため、他の人は理解し難くなる。

（第２実施形態）
次に、第２実施形態について説明する。第１実施形態に係る出力内容制御装置１は、音声検出部１０及び音声出力部１２を有しているが、第２実施形態に係る出力内容制御装置１Ａは、音声検出部１０及び音声出力部１２を有していない。第２実施形態において第１実施形態と構成が共通する箇所は、説明を省略する。

図９は、第２実施形態に係る情報出力システムの模式的なブロック図である。図９に示すように、第２実施形態に係る情報出力システム１００は、出力内容制御装置１Ａと、応答装置２Ａとを有する。応答装置２Ａは、例えば、スマートスピーカであり、音声検出部１０と、音声出力部１２と、点灯部１４と、通信部１５Ａとを有する。出力内容制御装置１Ａは、応答装置２Ａから離れた箇所にある装置（サーバ）であり、制御部１６と、通信部１８Ａと、記憶部２０とを有する。出力内容制御装置１Ａと応答装置２Ａとは、無線通信で接続されているが、有線通信で接続されていてもよい。

出力内容制御装置１Ａは、音声検出部１０が検出した音声Ｖ１を、通信部１５Ａと通信部１８Ａとを介した情報通信により、取得する。そして、出力内容制御装置１Ａは、第１実施形態と同様の処理を実行して出力文章を生成し、その出力文章を、応答装置２Ａに出力する。応答装置２Ａは、音声出力部１２で、出力文章を音声データに変換して、音声Ｖ２として出力する。ただし、出力内容制御装置１Ａが、出力文章の音声データを生成し、応答装置２Ａに送信してもよい。この場合、音声出力部１２は、取得した音声データを、音声Ｖ２として出力する。このように、情報出力システム１００は、出力内容制御装置１Ａと、ユーザＨが発する音声Ｖ１を検出する音声検出部１０と、出力内容生成部４０が生成した出力文章を、音声Ｖ２として出力する音声出力部１２と、を有する。このように、出力内容制御装置１Ａは、応答装置２Ａと別体であっても、第１実施形態と同様の効果を奏する。すなわち、第１実施形態に係る出力内容制御装置１は、応答装置２Ａと一体であるということができ、言い換えれば、情報出力システムであるということもできる。

このように、情報出力システムは、出力内容制御装置と、出力内容生成部４０が生成した出力文章を出力する出力部とを有する。出力部は、出力文章を音声として出力する音声出力部１２であるが、上述のように、表示装置１２Ａなどであってもよく、出力文章の出力の方法は、音声であってもよいし、テキストデータであってもよい。

以上、本発明の実施形態を説明したが、これら実施形態の内容により実施形態が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。

１出力内容制御装置
１０音声検出部
１２音声出力部
１６制御部
３０音声取得部
３２音声解析部
３４意図解析部
３６通知情報取得部
４０出力内容生成部（音声内容生成部）
４４出力制御部
５０属性情報取得部
５２取得情報取得部
Ａ取得情報
Ｅ属性情報
Ｈユーザ
Ｉ意図情報
Ｖ１、Ｖ２音声
Ｖ１Ａ第１音声
Ｖ１Ｂ第２音声

Claims

音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類部と、
前記音声取得部が取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を検出する意図解析部と、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得部と、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成部と、を有し、
前記出力内容生成部は、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記通知情報取得部は、前記通知情報として、前記ユーザへ通知する情報の内容である
内容情報と、前記内容情報の種類を示す種類情報とを取得し、
前記出力内容生成部は、前記内容情報に含まれる単語とその内容情報に紐付けられた前記種類情報とに基づき、他の単語に置換する単語を選択する、
出力内容制御装置。
前記出力内容生成部は、所定の単語である第１単語と前記第１単語に紐付けられた第２単語との情報を有する関係情報を読み出し、前記通知情報に含まれる単語が前記第１単語と一致する場合に、前記通知情報に含まれる単語を、前記第２単語に置換する、請求項１に記載の出力内容制御装置。
前記関係情報は、前記第１単語の種類を示す種類情報の情報も含んでおり、
前記出力内容生成部は、前記通知情報に含まれる単語の種類情報と前記第１単語の種類情報とが一致し、かつ、前記通知情報に含まれる単語が前記第１単語と一致する場合に、前記通知情報に含まれる単語を、他の単語に置換する単語として選択する、請求項２に記載の出力内容制御装置。
前記音声分類部は、前記ユーザが発する音声がささやき声である場合に、前記所定の音声として判定する、請求項１から請求項３のいずれか１項に記載の出力内容制御装置。
音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類部と、
前記音声取得部が取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を検出する意図解析部と、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得部と、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成部と、を有し、
前記出力内容生成部は、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記音声分類部は、前記ユーザが発する音声がささやき声である場合に、前記所定の音声として判定する、
出力内容制御装置。
音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、
前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成ステップと、を有し、
前記出力内容生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記通知情報取得ステップにおいて、前記通知情報として、前記ユーザへ通知する情報の内容である内容情報と、前記内容情報の種類を示す種類情報とを取得し、
前記出力内容生成ステップにおいて、前記内容情報に含まれる単語とその内容情報に紐付けられた前記種類情報とに基づき、他の単語に置換する単語を選択する、
出力内容制御方法。
音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、
前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成ステップと、をコンピュータに実行させ、
前記出力内容生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記通知情報取得ステップにおいて、前記通知情報として、前記ユーザへ通知する情報の内容である内容情報と、前記内容情報の種類を示す種類情報とを取得し、
前記出力内容生成ステップにおいて、前記内容情報に含まれる単語とその内容情報に紐付けられた前記種類情報とに基づき、他の単語に置換する単語を選択する、
出力内容制御プログラム。
音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、
前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成ステップと、を有し、
前記出力内容生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記音声分類ステップにおいて、前記ユーザが発する音声がささやき声である場合に、前記所定の音声として判定する、
出力内容制御方法。
音声取得部が取得したユーザが発する音声を解析して、前記音声が、所定の音声であるか否かを判定する音声分類ステップと、
前記音声取得部で取得した音声を解析して、前記ユーザがどのような情報を求めているかを示す意図情報を抽出する意図解析ステップと、
前記意図情報に基づき、前記ユーザへ通知する情報である通知情報を取得する通知情報取得ステップと、
前記通知情報に基づき、前記ユーザに向けて出力する文章データである出力文章を生成する出力内容生成ステップと、をコンピュータに実行させ、
前記出力内容生成ステップにおいて、前記所定の音声と判定された場合に、前記通知情報に含まれる単語のうちから選択した単語を他の単語に置換した前記出力文章を生成し、
前記音声分類ステップにおいて、前記ユーザが発する音声がささやき声である場合に、前記所定の音声として判定する、
出力内容制御プログラム。