JP6992800B2

JP6992800B2 - 情報処理装置および情報処理方法

Info

Publication number: JP6992800B2
Application number: JP2019506947A
Authority: JP
Inventors: 広岩瀬; 真里斎藤; 真一河野
Original assignee: Sony Corp; Sony Group Corp
Current assignee: Sony Corp; Sony Group Corp
Priority date: 2017-03-24
Filing date: 2017-12-25
Publication date: 2022-01-13
Anticipated expiration: 2037-12-25
Also published as: US11183167B2; WO2018173404A1; EP3599549A1; EP3599549A4; US20200193963A1; JPWO2018173404A1

Description

本開示は、情報処理装置および情報処理方法に関する。

近年、ユーザに対し情報通知などを行う種々のエージェント装置が普及している。また、上記のようなエージェント装置による情報通知の利便性や精度を向上させる技術が開発されている。例えば、特許文献１には、予め設定される優先度に基づいて情報通知に係る発話の出力順番を制御する技術が開示されている。

特開２０１５－２２７９５１号公報

しかし、特許文献１に記載の技術では、情報通知を行う際のユーザの状況が考慮されていない。このため、特許文献１に記載の技術では、ユーザの注意が向いていない状況で優先度の高い通知内容を出力することも想定され、ユーザが重要な情報を見逃す可能性もある。

そこで、本開示では、ユーザに通知内容をより効果的に把握させることが可能な、新規かつ改良された情報処理装置および情報処理方法を提案する。

本開示によれば、通知内容に基づくユーザへの情報通知を制御する制御部、を備え、前記制御部は、算出された前記ユーザに係るアテンション獲得難易度に基づいて、前記通知内容における主題の出力位置を決定する、情報処理装置が提供される。

また、本開示によれば、プロセッサが、通知内容に基づくユーザへの情報通知を制御すること、を含み、前記制御することは、算出された前記ユーザに係るアテンション獲得難易度に基づいて、前記通知内容における主題の出力位置を決定すること、をさらに含む、情報処理方法が提供される。

以上説明したように本開示によれば、ユーザに通知内容をより効果的に把握させることが可能となる。

なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。

本開示の一実施形態に係るユーザのアテンションと通知内容の理解との関係を示す図である。同実施形態に係る情報処理システムのシステム構成図の一例である。同実施形態に係る情報処理端末の機能ブロック図の一例である。同実施形態に係る外部装置の機能ブロック図の一例である。同実施形態に係る情報処理サーバの機能ブロック図の一例である。同実施形態に係る発話制御部による情報通知の基本概念について説明するための図である。同実施形態に係る発話制御部による主題の出力位置の決定の流れを示すフローチャートである。同実施形態に係る発話制御部による主題の抽出について説明するための図である。同実施形態に係るアテンション獲得難易度に基づいて決定される主題の出力位置の例を示す図である。同実施形態に係る発話制御部による通知内容の出力制御の流れを示すフローチャートである。同実施形態に係るアテンション獲得難易度がレベル３である場合における通知内容の出力制御の具体例を示す図である。同実施形態に係る情報処理サーバの動作の流れを示すフローチャートである。本開示の一実施形態に係るハードウェア構成例を示す図である。

以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

なお、説明は以下の順序で行うものとする。
１．実施形態
１．１．実施形態の概要
１．２．システム構成例
１．３．情報処理端末１０の機能構成例
１．４．外部装置２０の機能構成例
１．５．情報処理サーバ３０の機能構成例
１．６．主題の出力位置決定の詳細
１．７．情報処理サーバ３０の動作の流れ
２．ハードウェア構成例
３．まとめ

＜１．実施形態＞
＜＜１．１．実施形態の概要＞＞
まず、本開示の一実施形態の概要について説明する。上述したように、近年では、種々のエージェントが開発されている。上記のようなエージェントは、例えば、人工音声を用いた発話により、ユーザに様々な情報を提示することができる。

この際、エージェントが行う情報提示は、主に応答と通知の二つに大別される。ここで、上記の応答とは、ユーザからの問い合わせに応答してエージェントが情報を提示することを指す。例えば、ユーザから、「今日の私のスケジュールは？」、と問い合わせがあった際に、エージェントが当該問い合わせに応答して、「今夜は、ディナーの予定が入っています」、と出力する場合などが上記の応答に該当する。

一方、上記の通知とは、エージェントからユーザに対し情報を発信することを指す。例えば、エージェントが、メールを受信したことに基づいて、「Ａさんからメールを受信しました。内容は以下のとおりです・・・」、などの出力を行う場合が上記の通知に該当する。

ここで、上記の応答と通知との主な違いには、ユーザの注意度（以下、アテンション、とも称する）が挙げられる。応答の場合、ユーザからの問い合わせを前提とするため、エージェントが情報を出力する際には、ユーザのアテンションがエージェントに向いていることが想定される。このため、応答の場合、ユーザが出力される情報を把握できる可能性が高いといえる。

一方、通知の場合、エージェント発信の情報出力となるため、情報の出力時にユーザのアテンションを直ぐに得ることができるとは限らない。また、ユーザのアテンションがエージェントに向いている場合であっても、アテンションは時間経過と共に徐々に低下していくことが想定される。

図１は、ユーザのアテンションと通知内容の理解との関係を示す図である。例えば、図１の上段に示すように、テレビジョン装置から音声出力が行われるなど騒音レベルが高い状況において、情報処理端末１０から情報通知ＳＯ１が出力された場合、ユーザＵ１ａのアテンションが得られるまでには時間を要することが想定される。このため、ユーザＵ１ａは、アテンションが向いていなかった情報通知ＳＯ１の前半部分については、内容を把握することが困難な場合がある。

一方、図１の下段に示すように、騒音レベルが低い状況において、情報処理端末１０から情報通知ＳＯ１が出力された場合、ユーザＵ１ｂのアテンションを得ることは比較的容易であるものの、人工音声による発話は一般に抑揚が単調であるなどの理由から、ユーザＵ１ｂのアテンションは時間経過と共に徐々に低下することが想定される。このため、ユーザＵ１ｂは、アテンションの低下した情報通知ＳＯ１の後半部分については、内容を把握し損ねる可能性がある。

本実施形態に係る情報処理装置および情報処理方法は、上記の点に着目して発想されたものであり、ユーザのアテンション状況に応じた適切な情報通知を実現する。このために、本実施形態に係る情報処理装置および情報処理方法は、ユーザのアテンションの取りづらさの指標であるアテンション獲得難易度に基づいて通知内容における主題の出力位置を決定し、当該出力位置に則した情報通知を情報処理端末に行わせることを特徴の一つとする。

より具体的には、例えば、図１に示す一例の場合、本実施形態に係る情報処理装置は、騒音レベルが高い状況においては、ユーザＵ１ａに係るアテンション獲得難易度が高いと判定し、主題の出力位置を通知内容の後半に設定してよい。また、例えば、騒音レベルが低い状況においては、情報処理装置は、ユーザＵ１ｂに係るアテンション獲得難易度が低いと判定し、主題の出力位置を通知内容の前半に設定してよい。本実施形態に係る情報処理装置および情報処理方法によれば、ユーザが通知内容の主題を把握し損ねる可能性を大幅に低減し、より利便性の高い情報通知を実現することが可能となる。

＜＜１．２．システム構成例＞＞
次に、本実施形態に係る情報処理システムのシステム構成例について説明する。図２は、本実施形態に係る情報処理システムのシステム構成図の一例である。図２を参照すると、本実施形態に係る情報処理システムは、情報処理端末１０、外部装置２０、および情報処理サーバ３０を備える。また、情報処理端末１０と情報処理サーバ３０、外部装置２０と情報処理サーバ３０は、ネットワーク４０を介して互いに通信が行えるように接続される。

（情報処理端末１０）
本実施形態に係る情報処理端末１０は、情報処理サーバ３０による制御に基づいて、ユーザに対し種々の情報通知を行う情報処理装置である。特に、本実施形態に係る情報処理端末１０は、情報処理サーバ３０が決定した主題の出力位置に基づいて通知内容の音声出力を行うことができる。本実施形態に係る情報処理端末１０は、例えば、据え置き型、組み込み型、または自律移動型の専用装置であってもよい。また、本実施形態に係る情報処理端末１０は、携帯電話、スマートフォン、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、タブレット、または各種のウェアラブル装置であってもよい。本実施形態に係る情報処理端末１０は、音声による情報通知機能を有する種々の装置として定義される。

また、本実施形態に係る情報処理端末１０は、ユーザの発話や周囲における音を収集し、情報処理サーバ３０に送信する機能を有してよい。また、本実施形態に係る情報処理端末１０は、ユーザの画像を撮像し、情報処理サーバ３０に送信してもよい。情報処理端末１０により収集される種々の情報は、後述する情報処理サーバ３０によるアテンション獲得難易度の算出やアテンション行動の検出に用いられ得る。

（外部装置２０）
本実施形態に係る外部装置２０は、装置の稼働状況や取集したセンサ情報を情報処理サーバ３０に送信する情報処理装置である。上記の稼働状況やセンサ情報は、情報処理サーバ３０によるアテンション獲得難易度の算出に用いられ得る。例えば、ある外部装置２０が稼働中である場合、ユーザが当該外部装置２０の操作に集中していることが想定されるため、アテンションが獲得しづらい状況が推定される。このように、本実施形態に係るアテンション獲得難易度は、騒音のほか、ユーザの状況を加味して算出され得る。

このため、本実施形態に係る外部装置２０は、ユーザにより操作、あるいは利用される種々の装置であってよい。なお、図２の一例では、外部装置２０がゲーム機器である場合が示されているが、本実施形態に係る外部装置２０は、係る例に限定されない。本実施形態に係る外部装置２０は、例えば、携帯電話、スマートフォン、ＰＣ、タブレット、ウェアラブル装置などであってもよい。また、本実施形態に係る外部装置２０は、種々の家電機器、オフィス機器、照明を含む屋内設備などであってもよい。

（情報処理サーバ３０）
本実施形態に係る情報処理サーバ３０は、情報処理端末１０によるユーザへの情報通知を制御する情報処理装置である。この際、本実施形態に係る情報処理サーバ３０は、ユーザに係るアテンション獲得難易度に基づいて通知内容における主題の出力位置を決定し、当該出力位置に則した通知内容の音声出力を情報処理端末１０に行わせることができる。

上述したとおり、上記のアテンション獲得難易度とは、ユーザのアテンションの取りづらさを示す指標であってよい。本実施形態に係る情報処理サーバ３０は、情報処理端末１０や外部装置２０により収集された各種の情報に基づいて、アテンション獲得難易度を算出することができる。

（ネットワーク４０）
ネットワーク４０は、情報処理端末１０と情報処理サーバ３０、外部装置２０と情報処理サーバ３０を接続する機能を有する。ネットワーク４０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）などを含んでもよい。また、ネットワーク４０は、ＩＰ－ＶＰＮ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ－ＶｉｒｔｕａｌＰｒｉｖａｔｅＮｅｔｗｏｒｋ）などの専用回線網を含んでもよい。また、ネットワーク４０は、Ｗｉ－Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）など無線通信網を含んでもよい。

以上、本実施形態に係る情報処理システムのシステム構成例について説明した。なお、図２を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理システムの構成は係る例に限定されない。例えば、本実施形態に係る情報処理端末１０および情報処理サーバ３０が有する機能は、単一の装置により実現されてもよい。また、本実施形態に係る情報処理サーバ３０が有する機能は、複数の装置により分散して実現することも可能である。本実施形態に係る情報処理システムの構成は、仕様や運用に応じて柔軟に変形され得る。

＜＜１．３．情報処理端末１０の機能構成例＞＞
次に、本実施形態に係る情報処理端末１０の機能構成例について説明する。図３は、本実施形態に係る情報処理端末１０の機能ブロック図の一例である。図３を参照すると、本実施形態に係る情報処理端末１０は、音声収集部１１０、センサ部１２０、出力部１３０、および通信部１４０を備える。

（音声収集部１１０）
音声収集部１１０は、ユーザの音声や周囲の環境音を収集する機能を有する。音声収集部１１０は、例えば、本実施形態に係る音声収集部１１０は、ユーザの音声や環境音を電気信号に変換するマイクロフォンにより実現される。

（センサ部１２０）
センサ部１２０は、ユーザの画像を撮像する機能を有する。このために、本実施形態に係るセンサ部１２０は、撮像センサを備える。また、センサ部１２０は、ユーザの状況の推定に用いられる種々のセンサ情報を収集してよい。このため、センサ部１２０は、例えば、赤外線センサ、加速度センサ、ジャイロセンサ、地磁気センサ、振動センサ、圧力センサ、ＧＮＳＳ（ＧｌｏｂａｌＮａｖｉｇａｔｉｏｎＳａｔｅｌｌｉｔｅＳｙｓｔｅｍ）信号受信機などを備える。

（出力部１３０）
出力部１３０は、情報処理サーバ３０による制御に基づいて通知内容の出力を行う機能を有する。この際、出力部１３０は、情報処理サーバ３０により合成された人工音声に基づく音声出力を行ってよい。このために、本実施形態に係る出力部１３０は、スピーカやアンプを備える。

また、出力部１３０は、情報処理サーバ３０による制御に基づいて視覚情報を出力してもよい。この場合、出力部１３０は、液晶ディスプレイ（ＬＣＤ：ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）装置、ＯＬＥＤ（ＯｒｇａｎｉｃＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ）装置などの表示装置を備える。

（通信部１４０）
通信部１４０は、ネットワーク４０を介して、情報処理サーバ３０との情報通信を行う機能を有する。具体的には、通信部１４０は、音声収集部１１０により収集された音情報やセンサ部１２０により収集された画像情報、センサ情報を情報処理サーバ３０に送信する。また、通信部１４０は、通知内容に係る人工音声情報や、通知内容に係るテキスト情報などを情報処理サーバ３０から受信する。

以上、本実施形態に係る情報処理端末１０の機能構成例について説明した。なお、図３を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理端末１０の機能構成は係る例に限定されない。例えば、本実施形態に係る情報処理端末１０は、図２に示す以外の構成をさらに備えてもよい。情報処理端末１０は、例えば、ユーザによる入力操作を検出する入力部などを備え得る。本実施形態に係る情報処理端末１０の機能構成は、柔軟に変形され得る。

＜＜１．４．外部装置２０の機能構成例＞＞
次に、本実施形態に係る外部装置２０の機能構成例について説明する。図４は、本実施形態に係る外部装置２０の機能ブロック図の一例である。図４を参照すると、本実施形態に係る外部装置２０は、稼働状況取得部２１０、センサ部２２０、および通信部２３０を備える。

（稼働状況取得部２１０）
稼働状況取得部２１０は、装置の稼働状況を取得する機能を有する。稼働状況取得部２１０により取得された外部装置２０の稼働状況は、情報処理サーバ３０によるアテンション獲得難易度の算出に用いられ得る。例えば、外部装置２０がＰＣやスマートフォンなどである場合、稼働状況取得部２１０は、キーボードやマウス、タッチパネルなどがユーザにより操作されていることを検出してもよい。また、例えば、外部装置２０がゲーム機器である場合、稼働状況取得部２１０は、コントローラなどがユーザなどにより操作されていることを検出してもよい。

また、例えば、外部装置２０が通話機能を有する電話機などの装置である場合、稼働状況取得部２１０は、通話が行われていることを検出してもよい。また、例えば、外部装置２０が家電機器である場合、稼働状況取得部２１０は、冷蔵庫のドアが開いていること、炊飯器の保温機能が動作しており蓋が開いていること、または掃除機の吸引動作が行われていること、などを検出してよい。また、例えば、外部装置２０がテレビジョン装置である場合、稼働状況取得部２１０は、映像または音声の出力が行われており、かつ周囲に人が存在すること、などを検出してよい。この際、稼働状況取得部２１０は、例えば、人感センサにより収集されたセンサ情報に基づいて、周囲に人がいることを検出することができる。このように、本実施形態に係る稼働状況取得部２１０は、センサ部２２０により収集された種々のセンサ情報に基づいて外部装置２０の稼働状況を取得することも可能である。

さらには、稼働状況取得部２１０は、他の外部装置２０の稼働状況を取得してもよいし、複数の外部装置２０の稼働状況を取得してもよい。本実施形態に係る稼働状況取得部２１０は、センサ部２２０により収集された他の外部装置２０に係るセンサ情報に基づいて、当該外部装置２０の稼働状況を推定することが可能である。

（センサ部２２０）
センサ部２２０は、外部装置２０に係る種々のセンサ情報を収集する機能を有する。センサ部２２０が収集したセンサ情報は、稼働状況取得部２１０による稼働状況の取得に用いられてもよい。また、センサ部２２０は、ユーザや周囲の状況に係るセンサ情報を収集してもよい。センサ部２２０は、例えば、ユーザの発話やユーザの画像などを取得することが可能である。このために、本実施形態に係るセンサ部２２０は、種々のセンサ装置を備えてよい。センサ部２２０は、例えば、マイクロフォン、撮像センサ、熱センサ、振動センサ、照度センサ、人感センサ、加速度センサ、ジャイロセンサ、地磁気センサなどを備える。

（通信部２３０）
通信部２３０は、ネットワーク４０を介して、情報処理サーバ３０との情報通信を行う機能を有する。具体的には、通信部２３０は、稼働状況取得部２１０により取得された外部装置２０の稼働状況を情報処理サーバ３０に送信する。また、通信部２３０は、センサ部２２０により収集されたセンサ情報を情報処理サーバ３０に送信してもよい。

以上、本実施形態に係る外部装置２０の機能構成例について説明した。なお、図４を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る外部装置２０の機能構成は係る例に限定されない。本実施形態に係る外部装置２０は、上記の構成に加え、外部装置２０の特性に応じた種々の構成を備え得る。

＜＜１．５．情報処理サーバ３０の機能構成例＞＞
次に、本実施形態に係る情報処理サーバ３０の機能構成例について説明する。図５は、本実施形態に係る情報処理サーバ３０の機能ブロック図の一例である。図５を参照すると、情報処理サーバ３０は、音響解析部３１０、画像解析部３２０、状況推定部３３０、自然言語処理部３４０、ユーザ情報ＤＢ３５０、発話制御部３６０、音声合成部３７０、および通信部３８０を備える。

（音響解析部３１０）
音響解析部３１０は、情報処理端末１０や外部装置２０から送信される音情報に基づいて音の大きさを認識する機能を有する。より具体的には、本実施形態に係る音響解析部３１０は、周囲の騒音レベルを認識してよい。この際、本実施形態に係る音響解析部３１０は、例えば、単位時間における音響信号の振幅値の二乗平均平方根（実効値またはＲＭＳとも称する）に基づいて騒音レベルを算出することができる。なお、上記の単位時間は、例えば、情報処理端末１０により撮像される１画像のフレーム時間が用いられてもよい。本実施形態に係る音響解析部３１０により算出される騒音レベルは、後述する状況推定部３３０によるアテンション獲得難易度の算出に用いられる。

また、音響解析部３１０は、情報処理端末１０や外部装置２０から送信される音情報に基づいて音の種別を認識する機能を有する。本実施形態に係る音響解析部３１０は、特に、ユーザの行動に伴い生じる作業音を認識してよい。上記の作業音には、例えば、ユーザがＰＣのキーボードを打つ動作に伴い生じる音、ユーザによる掃除機などの家電機器の操作に伴い生じる音などが含まれる。また、上記の作業音には、例えば、ユーザがキッチンで行う洗い物、食材の処理、加工などの動作に伴い生じる音が含まれる。さらには、上記の作業音には、ユーザや他者の発話などが含まれてよい。本実施形態に係る音響解析部３１０により認識される作業音は、後述する状況推定部３３０によるアテンション獲得難易度の算出において、ユーザの行動状況の一指標として用いられる。

（画像解析部３２０）
画像解析部３２０は、情報処理端末１０や外部装置２０から送信される画像情報やセンサ情報に基づいてユーザの状況を認識する機能を有する。本実施形態に係る画像解析部３２０は、特に、ユーザのアテンションに係る状況を認識する。画像解析部３２０は、例えば、情報処理端末１０からユーザまでの距離を認識してよい。この際、画像解析部３２０は、例えば、画像中におけるユーザの顔領域の大きさや、深度センサなどにより収集された情報に基づいて、上記の距離を認識することが可能である。本実施形態に係る画像解析部３２０により認識されるユーザの状況は、後述する状況推定部３３０によるアテンション獲得難易度の算出やアテンション行動の検出に用いられる。

また、画像解析部３２０は、ユーザの顔の向きや視線を認識してもよい。より具体的には、画像解析部３２０は、ユーザの顔の向きや視線が情報処理端末１０の方向とどれだけ乖離しているかを認識することができる。

さらに、画像解析部３２０により認識されるユーザの状況には、行動状況も含まれる。本実施形態に係る画像解析部３２０は、情報処理端末１０や外部装置２０から送信される画像情報やセンサ情報に基づいてユーザの行動状況を認識してよい。画像解析部３２０は、例えば、画像情報に基づいて、ユーザが本を読んでいることや勉強などの集中していることを認識してもよい。また、例えば、画像解析部３２０は、画像情報、加速度情報、角速度情報などに基づいて、ユーザが運動を行っていることを認識してもよい。本実施形態に係る画像解析部３２０により認識されるユーザの行動状況は、後述する状況推定部３３０によるアテンション獲得難易度の算出に用いられる。

（状況推定部３３０）
本実施形態に係る状況推定部３３０は、ユーザのアテンションの取りづらさの指標であるアテンション獲得難易度を算出する機能を有する。この際、本実施形態に係る状況推定部３３０は、騒音レベルやユーザの状況に基づいてアテンション獲得難易度を算出することができる。より具体的には、状況推定部３３０は、音響解析部３１０により認識された騒音レベルや、画像解析部３２０により認識されたユーザの顔や視線の向き、ユーザと情報処理端末１０との距離などに基づいてアテンション獲得難易度を算出してよい。

また、上述したとおり、上記のユーザの状況には、ユーザの行動状況が含まれる。すなわち、本実施形態に係る状況推定部３３０は、音響解析部３１０により認識された作業音や外部装置２０から送信される外部装置２０の稼働状況、画像解析部３２０により認識されたユーザの行動状況にさらに基づいて、アテンション獲得難易度を算出してよい。

このように、本実施形態に係る状況推定部３３０は、騒音レベル以外にも種々の要因を考慮し、総合的にユーザのアテンションの取りづらさを算出することができる。この際、本実施形態に係る状況推定部３３０は、例えば、下記の数式（１）に示すように、各要因の重み付けを線形結合し、アテンション獲得難易度Ａを算出してもよい。

ここで、上記の数式（１）におけるＫ_ｉは各要因の重み係数を示し、要因ごとにそれぞれ設定される値で値であってよい。また、上記の数式（１）におけるＦ_ｉは、各要因の検出値を示す。

例えば、要因が騒音レベルである場合、検出値Ｆ_ｉには、音響解析部３１０により認識された音の大きさ（ｄＢ）や当該音の大きさに応じたレベル値（例えば、１～１０、など）が入力されてもよい。すなわち、状況推定部３３０は、騒音レベルが高いほどユーザのアテンションが取りづらいと推定する。

また、例えば、要因がユーザの行動状況である場合、検出値Ｆ_ｉには、該当する行動の検出有無を示す値（例えば、未検出：０、検出：１）が入力されてよい。上述したように、ユーザの行動状況には、音響解析部３１０により認識された作業音や画像解析部３２０により認識されたユーザの行動状況、または外部装置２０の稼働状況から推定されるユーザの行動状況が含まれる。すなわち、状況推定部３３０は、ユーザが他の行動を行っている場合には、ユーザのアテンションが取りづらいと推定する。

また、例えば、要因がユーザまでの距離である場合、検出値Ｆ_ｉには、画像解析部３２０により認識された距離の値（ｃｍなど）や当該距離に応じたレベル値（例えば、１～１０、など）が入力されてもよい。すなわち、状況推定部３３０は、情報処理端末１０からユーザが離れているほど、ユーザのアテンションが取りづらいと推定する。

また、例えば、要因がユーザの顔や視線の方向である場合、検出値Ｆ_ｉには、顔や視線が情報処理端末に向いているか否かを示す値（例えば、向いている：０、向いていない：１）や、情報処理端末１０の方向と顔や視線の向きの方向との乖離度（°）などが入力されてもよい。すなわち、状況推定部３３０は、ユーザの視界に情報処理端末１０が入っていない場合には、ユーザのアテンションが取りづらいと推定する。

以上、本実施形態に係る状況推定部３３０によるアテンション獲得難易度の算出例について説明した。なお、上記の算出方法はあくまで一例であり、本実施形態に係る状況推定部３３０は、他の数式や手法を用いてアテンション獲得難易度を算出してもよい。また、本実施形態に係る状況推定部３３０は、算出したアテンション獲得難易度と実際のユーザの反応とを学習することで、アテンション獲得難易度の算出に利用する要因や重み係数の値を最適化することも可能である。

また、本実施形態に係る状況推定部３３０は、ユーザのアテンション行動を検出する機能を有する。ここで、上記のアテンション行動とは、情報処理端末１０から出力される通知内容に対し、ユーザが反応を示す行動を指す。この際、状況推定部３３０は、画像解析部３２０により認識されたユーザの状況に基づいてアテンション行動を検出してよい。状況推定部３３０は、例えば、ユーザが情報処理端末１０に近づいてきたこと、ユーザの顔や視線が情報処理端末１０の方向に向いたこと、などに基づいてアテンション行動を検出することができる。

また、状況推定部３３０は、音響解析部３１０により認識されたユーザの発話に基づいてアテンション行動を検出することも可能である。状況推定部３３０は、例えば、ユーザが、「なに？」や「え？」などの発話を行ったことに基づいて、アテンション行動を検出することができる。

（自然言語処理部３４０）
自然言語処理部３４０は、通知内容に係るテキスト情報に基づいて、形態素解析や係り受け構造解析、意味概念の付与などの自然言語処理を行う機能を有する。なお、上記の通知内容に係るテキスト情報は、予め情報処理サーバ３０に保持されていてもよいし、通信部３８０やネットワーク４０を介して取得されてもよい。

（ユーザ情報ＤＢ３５０）
ユーザ情報ＤＢ３５０は、ユーザに係る種々の情報を記憶するデータベースである。ユーザ情報ＤＢ３５０は、ユーザの名前やＩＤのほか、例えば、年齢、性別、使用言語、出身地などの属性情報を記憶する。本実施形態に係るユーザ情報ＤＢ３５０に記憶される属性情報は、後述する発話制御部３６０による通知内容の成形に用いられる。また、本実施形態に係るユーザ情報ＤＢ３５０には、ユーザの画像情報や音声特徴などが記憶されてもよい。この場合、音響解析部３１０や画像解析部３２０は、ユーザ情報ＤＢ３５０に記憶される上記の情報に基づいて、ユーザを識別することも可能である。また、ユーザ情報ＤＢ３５０は、ユーザの趣味嗜好やスケジュールなどを記憶してもよい。

（発話制御部３６０）
発話制御部３６０は、通知内容に基づくユーザへの情報通知を制御する機能を有する。より具体的には、本実施形態に係る発話制御部３６０は、自然言語処理部３４０による自然言語処理の結果に基づいて、通知内容から主題を抽出する機能と、状況推定部３３０により算出されたアテンション獲得難易度に基づいて、通知内容における主題の出力位置を決定する機能と、を有する。また、本実施形態に係る発話制御部３６０は、決定した出力位置に則した通知内容を情報処理端末１０に音声出力させる。なお、発話制御部３６０は、情報処理端末１０に通知内容を視覚情報として出力させてもよい。

ここで、本実施形態に係る発話制御部３６０による情報通知制御の基本概念について説明する。図６は、本実施形態に係る発話制御部３６０による情報通知の基本概念について説明するための図である。図６の上段には、状況推定部３３０により算出されるアテンション獲得難易度Ａの強度がレベル１～３で示されており、中段および下段には、各レベルにおけるユーザのアテンションの推移、および発話制御部３６０により決定される主題の出力位置がそれぞれ示されている。

例えば、アテンション獲得難易度Ａがレベル１である場合、すなわちユーザのアテンションが比較的取り易い状況である場合、ユーザのアテンションは、曲線Ｃ１に示すように、情報通知の開始直後が最も高く、その後、時刻ｔの経過と共に下降していくことが予測される。この場合、本実施形態に係る発話制御部３６０は、主題ＳＰの出力位置を通知内容の前半、特に冒頭に配置してもよい。

また、例えば、アテンション獲得難易度Ａがレベル２である場合、すなわちユーザのアテンションの取りづらさが中程度である場合、ユーザのアテンションは、曲線Ｃ２に示すように、時刻ｔの経過と共に上昇し、その後、下降していくことが予測される。この場合、本実施形態に係る発話制御部３６０は、主題ＳＰの出力位置を通知内容の中央付近に配置してもよい。

また、例えば、アテンション獲得難易度Ａがレベル３である場合、すなわちユーザのアテンションが比較的取りづらい状況である場合、ユーザのアテンションは、曲線Ｃ３に示すように、情報通知の開始直後に最も低く、その後、時刻ｔの経過と共に上昇していくことが予測される。この場合、本実施形態に係る発話制御部３６０は、主題ＳＰの出力位置を通知内容の後半、特に末尾に配置してもよい。

このように、本実施形態に係る発話制御部３６０は、アテンション獲得難易度に応じたユーザのアテンションの推移に対し、ユーザのアテンションが最も高くなると予想されるタイミングで主題を出力させることができる。本実施形態に係る発話制御部３６０による上記の制御によれば、ユーザの状況に応じて通知内容の主題の出力位置を動的に変更することができ、より効果的なタイミングでユーザに通知内容の主題を通知することが可能となる。

（音声合成部３７０）
音声合成部３７０は、発話制御部３６０により成形された通知内容に基づく人工音声を生成する機能を有する。音声合成部３７０が生成する人口音声は、通信部３８０およびネットワーク４０を介して情報処理端末１０に送信され、出力部１３０により音声出力される。

（通信部３８０）
通信部３８０は、ネットワーク４０を介して、情報処理端末１０および外部装置２０との情報通信を行う機能を有する。具体的には、通信部３８０は、情報処理端末１０から、音情報や画像情報、センサ情報を受信する。また、通信部３８０は、外部装置２０から、外部装置２０の稼働状況やセンサ情報を受信する。また、通信部３８０は、発話制御部３６０により主題の出力位置が指定された通知内容に係る人工音声やテキスト情報を情報処理端末１０に送信する。

以上、本実施形態に係る情報処理サーバ３０の機能構成例について詳細に説明した。なお、図５を用いて説明した上記の構成はあくまで一例であり、本実施形態に係る情報処理サーバ３０の機能構成は係る例に限定されない。例えば、情報処理サーバ３０が有する各機能は、複数の装置により分散して実現することも可能である。また、上述したとおり、情報処理サーバ３０は、情報処理端末１０が有する機能をさらに備えてもよい。この場合、情報処理サーバ３０は、決定した主題の出力位置に則した通知内容の音声出力などを行うことができる。本実施形態に係る情報処理サーバ３０の機能構成は、仕様や運用に応じて適宜変形され得る。

＜＜１．６．主題の出力位置決定の詳細＞＞
次に、本実施形態に係る主題の出力位置決定について詳細に述べる。図７は、本実施形態に係る発話制御部３６０による主題の出力位置の決定の流れを示すフローチャートである。

図７を参照すると、発話制御部３６０は、まず、自然言語処理部３４０による自然言語処理の結果に基づいて、通知内容から主題を抽出する（Ｓ１１０１）。

図８は、本実施形態に係る発話制御部３６０による主題の抽出について説明するための図である。図８の上段には、通知内容ＯＳが示されており、また、中段には、自然言語処理部３４０により区切られた各文節が示されている。また、各文節には、自然言語処理部３４０により句の種類や意味概念が付与されていてよい。

この際、発話制御部３６０は、各文節の中から、「依頼」、「提案」、「願望」、または「意見」などの意味概念を有する文言を有する文節を検出する。例えば、発話制御部３６０は、図８に示すように、“Ｉｒｅｃｏｍｍｅｎｄ”を検出してよい。次に、発話制御部３６０は、検出した“Ｉｒｅｃｏｍｍｅｎｄ”の対象となる格を有する文節、“ｂｒｉｎｇｉｎｇａｎｕｍｂｒｅｌｌａ．”を検出し、主題“Ｉｒｅｃｏｍｍｅｎｄ
ｂｒｉｎｇｉｎｇａｎｕｍｂｒｅｌｌａ．”を抽出することができる。

一方で、発話制御部３６０は、固有名詞や数値が含まれる文節と、当該文節の係り先となる述語節を主題として抽出してもよい。また、メールやＳＮＳ（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇＳｅｒｖｉｃｅ）などで受信したメッセージを通知内容の一部とする場合には、発話制御部３６０は、当該メッセージの内容を主題としてもよい。なお、この際、発話制御部３６０は、メッセージの送信日時や送信者のメールアドレス、ＵＲＬ、メッセージの属性情報など、音声による理解が困難あるいは冗長である情報については通知内容から削除することも可能である。

また、発話制御部３６０が情報処理端末１０による視覚情報の出力を制御する場合においては、発話制御部３６０は、音声発話に係る主題として、モニタなどに表示される視覚情報の確認を依頼する文章を設定し、通知内容の詳細を情報処理端末１０の出力部１３０に出力させてもよい。

再び、図７を参照し、発話制御部３６０による主題の出力位置の決定の流れについて説明を続ける。ステップＳ１１０１における主題の抽出が完了すると、続いて、発話制御部３６０は、抽出した主題をユーザの属性情報に基づいて成形する（Ｓ１１０２）。

例えば、主題が、“Ｉｒｅｃｏｍｍｅｎｄｂｒｉｎｇｉｎｇａｎｕｍｂｒｅｌｌａ．”であり、対象ユーザが子供である場合、発話制御部３６０は、より直接的な表現を用いて、主題を、“Ｙｏｕｓｈｏｕｌｄｔａｋｅａｎｕｍｂｒｅｌｌａ．”としてもよい。

また、例えば、通知内容に用いられる言語が日本語のように、語順の入れ替えが比較的容易である場合には、発話制御部３６０は、子供のユーザに対しては、動詞句を主題の先頭に配置してもよい。一方、ユーザが大人である場合には、発話制御部３６０は、対象の名詞句を主題の先頭に配置することもできる。

このように、本実施形態に係る発話制御部３６０は、ユーザＤＢ３５０に記憶されるユーザの属性情報や用いられる言語の特性に応じて、ユーザにとってより把握の容易い主題を成形することができる。

なお、発話制御部３６０は、主題の成形に関し、ユーザが日常において使用している様式を採用してもよい。発話制御部３６０は、例えば、ユーザの日常における発話を収集することで、ユーザが好んで用いる語順や単語を学習することが可能である。また、発話制御部３６０は、ユーザが日常において聞き馴染んでいる様式に主題を成形してもよい。例えば、ユーザが子供である場合、発話制御部３６０は、母親などが当該ユーザに対して日常的に使用する語順や単語を採用して主題を成形することができる。

ステップＳ１１０２における主題の成形が完了すると、続いて、発話制御部３６０は、状況推定部３３０により算出されたアテンション獲得難易度に基づいて主題の出力位置を決定する。

この際、発話制御部３６０は、まず、アテンション獲得難易度が第１の閾値以下であるか否かを判定してよい（Ｓ１１０３）。すなわち、発話制御部３６０は、アテンション獲得難易度が、比較的アテンションの取り易いレベル１に相当するか否かを判定する。

ここで、アテンション獲得難易度が第１の閾値以下である場合（Ｓ１１０３：Ｙｅｓ）、発話制御部３６０は、ステップＳ１１０２において成形した主題の出力位置を、図９に示すように、通知内容の前半に設定する（Ｓ１１０４）。図９は、本実施形態に係るアテンション獲得難易度に基づいて決定される主題の出力位置の例を示す図である。なお、図９の最上段には、主題ＳＰとその他の文章ＯＰを含む元の通知内容ＯＳが示されている。図９を参照すると、アテンション獲得難易度Ａがレベル１である場合、発話制御部３６０が元の通知内容ＯＳから主題の出力位置を冒頭に変更した新たな通知内容ＣＳ－１を生成していることがわかる。なお、この際、発話制御部３６０は、通知内容ＣＳ－１をテキストファイルとして保存してもよい。

一方、アテンション獲得難易度が第１の閾値を上回る場合（Ｓ１１０３：Ｎｏ）、すなわち、アテンション獲得難易度がレベル２以上である場合、発話制御部３６０は、主題の出力位置を通知内容の後半に設定する（Ｓ１１０５）。より具体的には、発話制御部３６０は、図９に示すように、主題ＳＰの出力位置を末尾に位置した新たな通知内容ＣＳ－２を生成する。

次に、発話制御部３６０は、ステップＳ１１０５で生成した通知内容ＣＳ－２における冒頭から主題ＳＰまでの長さを計測し、当該長さに基づいて、レベル２およびレベル３の境界となる第２の閾値を決定する（Ｓ１１０６）。この際、発話制御部３６０は、その他の文章ＯＰの文字数をカウントすることで上記の長さを計測してもよい。また、発話制御部３６０は、上記の長さに比例して値が大きくなるように第２の閾値を決定する。その他の文章ＯＰが長いほど、後述する付加情報を付加せずとも、その他の文章ＯＰの出力中にユーザのアテンションが取れる可能性が高くなる。一方で、その他の文章ＯＰが短い場合には、その他の文章ＯＰの出力中にユーザのアテンションを得ることが困難となるため、レベル３へ分岐しやすくなるよう、発話制御部３６０は、第２の閾値の値を低く設定してよい。

次に、発話制御部３６０は、アテンション獲得難易度がステップＳ１１０６において決定した第２の閾値以下であるか否かを判定する（Ｓ１１０７）。すなわち、発話制御部３６０は、アテンション獲得難易度がレベル２に相当するか否かを判定する。

ここで、アテンション獲得難易度が第２の閾値を上回る場合（Ｓ１１０７：Ｎｏ）、すなわち、アテンション獲得難易度がレベル３である場合、発話制御部３６０は、図９に示すように、通知内容ＣＳ－２の冒頭に付加情報ＡＰを付加した通知内容ＣＳ－３を生成する（Ｓ１１０８）。

この際、発話制御部３６０は、アテンション獲得難易度Ａの高さに応じて付加情報ＡＰの長さを決定してよい。発話制御部３６０は、例えば、アテンション獲得難易度Ａから第２の閾値を引いた値に比例した長さの付加情報ＡＰを付加してもよい。

また、発話制御部３６０は、元の通知内容ＯＳに関連する関連話題を付加情報ＡＰとして付加してよい。この際、発話制御部３６０は、ユーザＤＢ３５０に記憶されるユーザの名前や、ユーザのスケジュール、趣味嗜好などを取得し、これらの情報を用いた関連話題を生成することで、いわゆるカクテルパーティー効果を誘発し、ユーザのアテンションを得るきっかけとしてもよい。また、発話制御部３６０は、音声合成部３７０に、元の通知内容ＯＰに由来する文章（主題ＳＰおよびその他の文章ＯＰ）と関連話題とを異なる人工音声で合成させることで、ユーザに出力が関連話題であることを明示的に示してもよい。

なお、本実施形態に係る付加情報ＡＰは、上記のような関連話題に限定されず、種々の情報であり得る。例えば、付加情報ＡＰは、音楽やラジオプログラムなどであってもよい。発話制御部３６０は、ユーザの嗜好に応じた音楽やラジオプログラムを冒頭に再生させることで、ユーザのアテンションが取得できる可能性を向上させることができる。

以上、本実施形態に係る発話制御部３６０による主題の出力位置の決定の流れについて説明した。発話制御部３６０は、上記のようにアテンション獲得難易度のレベルに応じて主題の出力位置を決定し、当該出力位置に則した通知内容を情報処理端末１０に出力させることができる。本実施形態に係る発話制御部３６０が有する上記の機能によれば、ユーザのアテンションが最も高まると推定されるタイミングで通知内容の主題を提示することが可能となり、ユーザにより効果的な情報通知を行うことが可能となる。

なお、図７および図９を用いて説明した主題の出力位置はあくまで一例であり、本実施形態に係る発話制御部３６０により決定される主題の出力位置は係る例に限定されない。例えば、元の通知内容ＯＰが十分に長い場合にあっては、発話制御部３６０は、主題の成形後に、アテンション獲得難易度に係る第２の閾値を先に決定してもよい。この場合、発話制御部３６０は、レベル１～３の判定を一度に行うことが可能である。また、この際、アテンション獲得難易度がレベル２に相当する場合には、発話制御部３６０は、主題の出力位置を通知内容の中央付近に配置してもよい。本実施形態に係る発話制御部３６０による主題の出力位置の決定機能は、元の通知内容ＯＰや用いられる言語に応じて柔軟に変形され得る。

続いて、本実施形態に係る発話制御部３６０による通知内容の出力中における主題の出力位置の変更機能について説明する。本実施形態に係る発話制御部３６０は、通知内容の出力中にユーザのアテンション行動を検出した場合、主題の出力位置を変更する制御を行ってもよい。

より具体的には、本実施形態に係る発話制御部３６０は、通知内容の冒頭に付加した付加情報の出力中にアテンション行動を検出したことに基づいて、主題の出力位置を変更することができる。

図１０は、本実施形態に係る発話制御部３６０による通知内容の出力制御の流れを示すフローチャートである。

図１０を参照すると、発話制御部３６０は、まず、アテンション獲得難易度がどのレベルに相当するかを判定する（Ｓ１２０１）。

ここで、アテンション獲得難易度がレベル１である場合（Ｓ１２０１：レベル１）、発話制御部３６０は、レベル１において設定した主題の出力位置（通知内容ＣＳ－１）で、情報処理端末１０による通知内容の出力開始を制御し（Ｓ１２０２）、そのまま通知内容を最後まで出力させる。

一方、アテンション獲得難易度がレベル２である場合（Ｓ１２０１：レベル２）、発話制御部３６０は、レベル２において設定した主題の出力位置（通知内容ＣＳ－２）で、情報処理端末１０による通知内容の出力開始を制御し（Ｓ１２０３）、そのまま通知内容を最後まで出力させる。

他方、アテンション獲得難易度がレベル３である場合（Ｓ１２０１：レベル３）、発話制御部３６０は、レベル３において設定した主題の出力位置（通知内容ＣＳ－３）で、情報処理端末１０による通知内容の出力開始を制御する（Ｓ１２０４）。

レベル３に対応した通知内容ＣＳ－３の出力開始を制御した場合、続いて、発話制御部３６０は、出力中にアテンション行動の検出判定を継続して実行する（Ｓ１２０５）。

ここで、アテンション行動を検出した場合（Ｓ１２０５：Ｙｅｓ）、続いて、発話制御部３６０は、付加情報の出力中であるか否かを判定する（Ｓ１２０６）。

ここで、付加情報の出力中である場合（Ｓ１２０６：Ｙｅｓ）、すなわち、付加情報の出力中にアテンション行動を検出した場合、発話制御部３６０は、情報処理端末１０による付加情報の出力を終了させ（Ｓ１２０７）、レベル１で設定した主題の出力位置による通知内容の出力を開始させる。この際、発話制御部３６０は、例えば、通知内容に係る文字列情報を動的に変更してもよい。また、発話制御部３６０は、予めレベル１およびレベル３に係る２つの通知内容に対応するテキストを生成しておき、アテンション行動を検出したことに基づいて、レベル１の通知内容に対応するテキストに切り替えを行うことも可能である。

図１１は、本実施形態に係るアテンション獲得難易度がレベル３である場合における通知内容の出力制御の具体例を示す図である。図１１の上段には、アテンション獲得難易度がレベル３である場合に設定される通知内容ＣＳ－３が示されている。この際、通知内容ＣＳ－３の冒頭には、上述したとおり、付加情報ＡＰが付加され、また、通知内容ＣＳ－３の末尾には主題ＳＰが配置される。

ここで、付加情報ＡＰの出力中にユーザのアテンション行動ＡＢを検出した場合、発話制御部３６０は、図１１の下段に示すように、付加情報ＡＰの出力を途中で終了させ、主題ＳＰの出力位置を付加情報ＡＰの直後に変更する。この際、発話制御部３６０は、例えば、出力中の文章が最後まで出力されたタイミングで、付加情報ＡＰの出力を終了させてもよい。また、発話制御部３６０は、付加情報ＡＰと主題ＳＰと繋ぐ発話を行わせることで、切り替えの違和感を軽減させることも可能である。また、付加情報ＡＰが音楽やラジオプログラムである場合、発話制御部３６０は、音量を徐々に下げさせることで、出力の切り替えがより自然となるよう制御を行ってもよい。

一方、その他の文章ＯＰの出力中にユーザのアテンション行動ＡＢを検出した場合、発話制御部３６０は、図１１の中段に示すように、その他の文章ＯＰおよび主題ＳＰをそのまま出力させ発話制御に係る処理を終了してよい。

以上、本実施形態に係る発話制御部３６０による通知内容の出力制御について説明した。上述したように、本実施形態に係る発話制御部３６０によれば、ユーザの状態に応じて通知内容における主題の出力位置を柔軟に制御することができ、より効果的な情報通知を行うことが可能となる。

なお、図１０および図１１を用いた上記の説明では、発話制御部３６０がユーザのアテンション行動を検出した場合に主題の出力位置を変更する場合について述べたが、本実施形態に主題の出力位置の変更制御は係る例に限定されない。本実施形態に係る発話制御部３６０は、通知内容の出力中にユーザのアテンション獲得難易度の変化を検出したことに基づいて、主題の出力位置を変更することも可能である。

発話制御部３６０は、例えば、図１１に示す通知内容ＣＳ－３の付加情報を出力中に、ユーザのアテンション獲得難易度がレベル１またはレベル２に変化したことを検出し、図中下段に示すような出力制御を行うことも可能である。また、発話制御部３６０は、例えば、アテンション獲得難易度がレベル２である場合において、その他の文章ＯＰの出力中にアテンション獲得難易度がレベル３に変化したことに基づいて、主題の出力位置の前に付加情報ＡＰを挿入してもよい。

さらには、発話制御部３６０は、アテンション獲得難易度の変化に基づいて、通知内容の再出力を制御することも可能である。例えば、アテンション獲得難易度がレベル２またはレベル３である場合において、ユーザのアテンション行動が検出できなかった際、発話制御部３６０は、ユーザのアテンション獲得難易度の低下したタイミングで、通知内容を再出力させてもよい。

また、通知内容の再出力は、ユーザの発話などによる要求に基づいて行われてもよい。この場合、主題の出力時にユーザのアテンションが取れていなかったことが予想されるため、発話制御部３６０は、上記の要求回数を記憶し、次回の通知内容の出力においては、当該要求回数に応じて主題の出力位置をより遅らせるようにアテンション獲得難易度を高めに算出してもよい。

一方、付加情報ＡＰの出力時にアテンション行動を検出した場合、発話制御部３６０は、ユーザごとに上記の検出回数を記憶し、次回の通知内容の出力においては、当該当該検出回数に応じて主題の出力位置をより早めるようにアテンション獲得難易度を低めに算出してもよい。

＜＜１．７．情報処理サーバ３０の動作の流れ＞＞
次に、本実施形態に係る情報処理サーバ３０の全体の動作の流れについて説明する。図１２は、本実施形態に係る情報処理サーバ３０の動作の流れを示すフローチャートである。

図１２を参照すると、情報処理サーバ３０の通信部３８０は、まず、情報処理端末１０や外部装置２０からセンサ情報や稼働状況を受信する（Ｓ１３０１）。ここで、上記のセンサ情報には、音情報や画像情報が含まれる。

次に、音響解析部３１０は、ステップＳ１３０１において受信された音情報に基づく音響解析を実施する（Ｓ１３０２）。この際、音響解析部３１０は、騒音レベルや作業音に係る解析を行ってよい。

また、画像解析部３２０は、ステップＳ１３０２において受信された画像情報に基づく画像解析を実施する（Ｓ１３０２）。この際、画像解析部３２０は、ユーザの状況に係る解析を行ってよい。

次に、状況推定部３３０は、ステップＳ１３０１において受信した外部装置２０の稼働状況や、ステップＳ１３０２やＳ１３０３において解析された情報に基づいて、ユーザのアテンション獲得難易度を算出する（Ｓ１３０４）。

次に、発話制御部３６０は、通知内容から主題の抽出を行う（Ｓ１３０５）。

続いて、発話制御部３６０は、ステップＳ１３０４において算出されたアテンション獲得難易度に基づいて、ステップＳ１３０５において抽出した主題の出力位置を設定する（Ｓ１３０６）。

続いて、発話制御部３６０は、ステップＳ１３０６において設定した主題の出力位置に基づく発話制御を行う（Ｓ１３０７）。

＜２．ハードウェア構成例＞
次に、本開示の一実施形態に係る情報処理端末１０および情報処理サーバ３０に共通するハードウェア構成例について説明する。図１３は、本開示の一実施形態に係る情報処理端末１０および情報処理サーバ３０のハードウェア構成例を示すブロック図である。図１３を参照すると、情報処理端末１０および情報処理サーバ３０は、例えば、ＣＰＵ８７１と、ＲＯＭ８７２と、ＲＡＭ８７３と、ホストバス８７４と、ブリッジ８７５と、外部バス８７６と、インターフェース８７７と、入力装置８７８と、出力装置８７９と、ストレージ８８０と、ドライブ８８１と、接続ポート８８２と、通信装置８８３と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。

（ＣＰＵ８７１）
ＣＰＵ８７１は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ８７２、ＲＡＭ８７３、ストレージ８８０、又はリムーバブル記録媒体９０１に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。

（ＲＯＭ８７２、ＲＡＭ８７３）
ＲＯＭ８７２は、ＣＰＵ８７１に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ８７３には、例えば、ＣＰＵ８７１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。

（ホストバス８７４、ブリッジ８７５、外部バス８７６、インターフェース８７７）
ＣＰＵ８７１、ＲＯＭ８７２、ＲＡＭ８７３は、例えば、高速なデータ伝送が可能なホストバス８７４を介して相互に接続される。一方、ホストバス８７４は、例えば、ブリッジ８７５を介して比較的データ伝送速度が低速な外部バス８７６に接続される。また、外部バス８７６は、インターフェース８７７を介して種々の構成要素と接続される。

（入力装置８７８）
入力装置８７８には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置８７８としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ（以下、リモコン）が用いられることもある。また、入力装置８７８には、マイクロフォンなどの音声入力装置が含まれる。

（出力装置８７９）
出力装置８７９は、例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ）、ＬＣＤ、又は有機ＥＬ等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置８７９は、触覚刺激を出力することが可能な種々の振動デバイスを含む。

（ストレージ８８０）
ストレージ８８０は、各種のデータを格納するための装置である。ストレージ８８０としては、例えば、ハードディスクドライブ（ＨＤＤ）等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。

（ドライブ８８１）
ドライブ８８１は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体９０１に記録された情報を読み出し、又はリムーバブル記録媒体９０１に情報を書き込む装置である。

（リムーバブル記録媒体９０１）
リムーバブル記録媒体９０１は、例えば、ＤＶＤメディア、Ｂｌｕ－ｒａｙ（登録商標）メディア、ＨＤＤＶＤメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体９０１は、例えば、非接触型ＩＣチップを搭載したＩＣカード、又は電子機器等であってもよい。

（接続ポート８８２）
接続ポート８８２は、例えば、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（ＳｍａｌｌＣｏｍｐｕｔｅｒＳｙｓｔｅｍＩｎｔｅｒｆａｃｅ）、ＲＳ－２３２Ｃポート、又は光オーディオ端子等のような外部接続機器９０２を接続するためのポートである。

（外部接続機器９０２）
外部接続機器９０２は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダ等である。

（通信装置８８３）
通信装置８８３は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（ＷｉｒｅｌｅｓｓＵＳＢ）用の通信カード、光通信用のルータ、ＡＤＳＬ（ＡｓｙｍｍｅｔｒｉｃＤｉｇｉｔａｌＳｕｂｓｃｒｉｂｅｒＬｉｎｅ）用のルータ、又は各種通信用のモデム等である。

＜３．まとめ＞
以上説明したように、本開示の一実施形態に係る情報処理サーバ３０は、ユーザのアテンションの取りづらさの指標であるアテンション獲得難易度に基づいて通知内容における主題の出力位置を決定し、当該出力位置に則した情報通知を情報処理端末に行わせることを特徴の一つとする。係る構成によれば、ユーザに通知内容をより効果的に把握させることが可能となる。

以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

例えば、上記実施形態では、情報処理サーバ３０が、決定した主題の出力位置に基づく通知内容の音声出力を制御する場合について主に説明したが、情報処理サーバ３０は、主題の出力位置に基づく視覚情報の出力を制御してもよい。例えば、情報処理サーバ３０は、情報処理端末１０が備える表示装置において、通知内容に係るテキストスクロールなどを制御することができる。この際、情報処理サーバ３０は、ユーザのアテンション獲得難易度に基づいて、上記のテキストスクロールにおける主題の出力位置を制御してよい。

また、本明細書の情報処理サーバ３０の処理に係る各ステップは、必ずしもフローチャートに記載された順序に沿って時系列に処理される必要はない。例えば、情報処理サーバ３０の処理に係る各ステップは、フローチャートに記載された順序と異なる順序で処理されても、並列的に処理されてもよい。

また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

なお、以下のような構成も本開示の技術的範囲に属する。
（１）
通知内容に基づくユーザへの情報通知を制御する制御部、
を備え、
前記制御部は、算出された前記ユーザに係るアテンション獲得難易度に基づいて、前記通知内容における主題の出力位置を決定する、
情報処理装置。
（２）
前記制御部は、前記出力位置に則した前記通知内容の音声出力を制御する、
前記（１）に記載の情報処理装置。
（３）
前記制御部は、前記アテンション獲得難易度が第１の閾値以下であることに基づいて、前記主題の前記出力位置を前記通知内容の前半に設定する、
前記（１）または（２）に記載の情報処理装置。
（４）
前記制御部は、前記アテンション獲得難易度が第１の閾値を上回ることに基づいて、前記主題の前記出力位置を前記通知内容の後半に設定する、
前記（１）～（３）のいずれかに記載の情報処理装置。
（５）
前記制御部は、前記アテンション獲得難易度が第２の閾値を上回ることに基づいて、前記通知内容の冒頭に付加情報を付加し、前記付加情報を含む前記通知内容を出力させる、前記（１）～（４）のいずれかに記載の情報処理装置。
（６）
前記制御部は、前記通知内容の出力中に前記ユーザのアテンション行動が検出されたことに基づいて、前記主題の前記出力位置を変更する、
前記（１）～（５）のいずれかに記載の情報処理装置。
（７）
前記制御部は、前記通知内容の冒頭に含まれる付加情報の出力中に前記アテンション行動が検出されたことに基づいて、前記主題の前記出力位置を変更する、
前記（６）に記載の情報処理装置。
（８）
前記制御部は、前記付加情報の出力中に前記アテンション行動が検出されたことに基づいて、前記付加情報の出力を終了させ、前記主題の前記出力位置を前記付加情報の直後に変更する、
前記（７）に記載の情報処理装置。
（９）
前記制御部は、前記通知内容の出力中における前記アテンション獲得難易度の変化に基づいて、前記主題の前記出力位置を変更する、
前記（１）～（８）のいずれかに記載の情報処理装置。
（１０）
前記付加情報は、前記通知内容に関連する関連話題である、
前記（５）、７、または８のいずれかに記載の情報処理装置。
（１１）
前記制御部は、自然言語処理の結果に基づいて前記通知内容から前記主題を抽出する、前記（１）～（１０）のいずれかに記載の情報処理装置。
（１２）
前記アテンション獲得難易度は、騒音レベルまたは前記ユーザの状況のうち少なくともいずれかに基づいて算出される、
前記（１）～（１１）のいずれかに記載の情報処理装置。
（１３）
前記ユーザの状況は、前記ユーザの行動状況を含み、
前記アテンション獲得難易度は、少なくとも前記ユーザの行動状況に基づいて算出される、
前記（１２）に記載の情報処理装置。
（１４）
前記ユーザの行動状況は、少なくとも前記ユーザの行動に伴い生じる作業音に基づいて推定される、
前記（１３）に記載の情報処理装置。
（１５）
前記ユーザの行動状況は、少なくとも外部装置の稼働状況に基づいて推定される、
前記（１３）または（１４）に記載の情報処理装置。
（１６）
前記ユーザの行動状況は、少なくとも前記ユーザの画像に基づいて推定される、
前記（１３）～（１５）のいずれかに記載の情報処理装置。
（１７）
前記アテンション獲得難易度を算出する状況推定部、
をさらに備える、
前記（１）～（１６）のいずれかに記載の情報処理装置。
（１８）
前記状況推定部は、前記ユーザのアテンション行動を検出する、
前記（１７）に記載の情報処理装置。
（１９）
前記制御部による制御に基づいて前記通知内容を出力する出力部、
をさらに備える、
前記（１）～（１８）のいずれかに記載の情報処理装置。
（２０）
プロセッサが、通知内容に基づくユーザへの情報通知を制御すること、
を含み、
前記制御することは、算出された前記ユーザに係るアテンション獲得難易度に基づいて、前記通知内容における主題の出力位置を決定すること、
をさらに含む、
情報処理方法。

１０情報処理端末
１１０音声収集部
１２０センサ部
１３０出力部
１４０通信部
２０外部装置
２１０稼働状況取得部
２２０センサ部
２３０通信部
３０情報処理サーバ
３１０音響解析部
３２０画像解析部
３３０状況推定部
３４０自然言語処理部
３５０ユーザ情報ＤＢ
３６０発話制御部
３７０音声合成部
３８０通信部

Claims

通知内容に基づくユーザへの情報通知を制御する制御部、
を備え、
前記制御部は、算出された前記ユーザに係るアテンション獲得難易度に基づいて、前記通知内容における主題の出力位置を決定するとともに、前記通知内容の出力中に前記ユーザのアテンション行動が検出されたことに基づいて、前記主題の前記出力位置を変更する、
情報処理装置。
前記制御部は、前記出力位置に則した前記通知内容の音声出力を制御する、
請求項１に記載の情報処理装置。
前記制御部は、前記アテンション獲得難易度が第１の閾値以下であることに基づいて、前記主題の前記出力位置を前記通知内容の前半に設定する、
請求項１に記載の情報処理装置。
前記制御部は、前記アテンション獲得難易度が第１の閾値を上回ることに基づいて、前記主題の前記出力位置を前記通知内容の後半に設定する、
請求項１に記載の情報処理装置。
前記制御部は、前記アテンション獲得難易度が第２の閾値を上回ることに基づいて、前記通知内容の冒頭に付加情報を付加し、前記付加情報を含む前記通知内容を出力させる、
請求項１に記載の情報処理装置。
前記制御部は、前記通知内容の冒頭に含まれる付加情報の出力中に前記アテンション行動が検出されたことに基づいて、前記主題の前記出力位置を変更する、
請求項１に記載の情報処理装置。
前記制御部は、前記付加情報の出力中に前記アテンション行動が検出されたことに基づいて、前記付加情報の出力を終了させ、前記主題の前記出力位置を前記付加情報の直後に変更する、
請求項６に記載の情報処理装置。
前記制御部は、前記通知内容の出力中における前記アテンション獲得難易度の変化に基づいて、前記主題の前記出力位置を変更する、
請求項１に記載の情報処理装置。
前記付加情報は、前記通知内容に関連する関連話題である、
請求項５に記載の情報処理装置。
前記制御部は、自然言語処理の結果に基づいて前記通知内容から前記主題を抽出する、
請求項１に記載の情報処理装置。
前記アテンション獲得難易度は、騒音レベルまたは前記ユーザの状況のうち少なくともいずれかに基づいて算出される、
請求項１に記載の情報処理装置。
前記ユーザの状況は、前記ユーザの行動状況を含み、
前記アテンション獲得難易度は、少なくとも前記ユーザの行動状況に基づいて算出される、
請求項１１に記載の情報処理装置。
前記ユーザの行動状況は、少なくとも前記ユーザの行動に伴い生じる作業音に基づいて推定される、
請求項１２に記載の情報処理装置。
前記ユーザの行動状況は、少なくとも外部装置の稼働状況に基づいて推定される、
請求項１２に記載の情報処理装置。
前記ユーザの行動状況は、少なくとも前記ユーザの画像に基づいて推定される、
請求項１２に記載の情報処理装置。
前記アテンション獲得難易度を算出する状況推定部、
をさらに備える、
請求項１に記載の情報処理装置。
前記状況推定部は、前記ユーザのアテンション行動を検出する、
請求項１６に記載の情報処理装置。
前記制御部による制御に基づいて前記通知内容を出力する出力部、
をさらに備える、
請求項１に記載の情報処理装置。
プロセッサが、通知内容に基づくユーザへの情報通知を制御すること、
を含み、
前記制御することは、算出された前記ユーザに係るアテンション獲得難易度に基づいて、前記通知内容における主題の出力位置を決定するとともに、前記通知内容の出力中に前記ユーザのアテンション行動が検出されたことに基づいて、前記主題の前記出力位置を変更すること、
をさらに含む、
情報処理方法。