JPWO2017175432A1 - 情報処理装置、情報処理方法、およびプログラム - Google Patents

情報処理装置、情報処理方法、およびプログラム Download PDF

Info

Publication number
JPWO2017175432A1
JPWO2017175432A1 JP2018510230A JP2018510230A JPWO2017175432A1 JP WO2017175432 A1 JPWO2017175432 A1 JP WO2017175432A1 JP 2018510230 A JP2018510230 A JP 2018510230A JP 2018510230 A JP2018510230 A JP 2018510230A JP WO2017175432 A1 JPWO2017175432 A1 JP WO2017175432A1
Authority
JP
Japan
Prior art keywords
user
information
processing apparatus
information processing
presentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018510230A
Other languages
English (en)
Inventor
直樹 澁谷
直樹 澁谷
村田 誠
誠 村田
允文 加藤
允文 加藤
健吾 吉井
健吾 吉井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2017175432A1 publication Critical patent/JPWO2017175432A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Abstract

【課題】情報提示を受けられる時間内に聞き終わるよう音声情報の情報量を制御し、音声情報提示の利便性を向上させることが可能な情報処理装置、情報処理方法、およびプログラムを提供する。【解決手段】ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定する推定部と、前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整する調整部と、を備える、情報処理装置。【選択図】図1

Description

本開示は、情報処理装置、情報処理方法、およびプログラムに関する。
近年の情報処理および情報通信技術の発展に伴い、コンピュータが広く普及し、日常生活においてもコンピュータが積極的に利用されるようになった。例えば、スマートフォン、携帯電話端末等のモバイル通信端末を用いて、外出先でネットワーク上の情報を閲覧したり、目的地までのナビゲーションサービスを享受したりすることが可能となる。
また、ネットワーク上の様々なテキスト情報を音声化して享受するサービスとして、例えば下記特許文献1では、総音声時間長、話速、必須再生記事数等の条件付きで記事群の中から関心度の高い記事を関心度の高い順に選択し、選択した記事を適切な量に要約して合成音声で再生する音声合成方法が提案されている。
特開2008−164759号公報
ここで、音声による情報提示開始後、情報を聞けない状態になった場合には音声再生を止めたりボリュームを下げたりといった煩雑な操作が必要であった。表示により提示される視覚情報であれば視線を外せばよいが、音声情報の場合は音声再生を止める必要があった。
そこで、本開示では、情報提示を受けられる時間内に聞き終わるよう音声情報の情報量を制御し、音声情報提示の利便性を向上させることが可能な情報処理装置、情報処理方法、およびプログラムを提案する。
本開示によれば、ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定する推定部と、前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整する調整部と、を備える、情報処理装置を提案する。
本開示によれば、プロセッサが、ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定することと、前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整することと、を含む、情報処理方法を提案する。
本開示によれば、コンピュータを、ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定する推定部と、前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整する調整部と、として機能させる、プログラムを提案する。
以上説明したように本開示によれば、情報提示を受けられる時間内に聞き終わるよう音声情報の情報量を制御し、音声情報提示の利便性を向上させることが可能となる。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。
本実施形態による情報処理装置の概要を説明する図である。 本実施形態による情報処理装置の構成の一例を示すブロック図である。 本実施形態による音声情報提示制御タイミングを説明するための図である。 本実施形態によるユーザ本人の行動履歴に基づく読み上げ可能時間の推定について説明する図である。 本実施形態による全ユーザの行動履歴に基づく読み上げ可能時間の推定について説明する図である。 本実施形態による読み上げ調整の動作処理を示すフローチャートである。 本実施形態による読み上げ可能時間推定の動作処理を示すフローチャートである。 本実施形態による第1の変形例による情報処理装置の構成の一例を示すブロック図である。 本実施形態による第1の変形例による読み上げ調整の動作処理を示すフローチャートである。 本実施形態による第2の変形例によるシステム構成の一例を示す図である。 本実施形態による第2の変形例によるサーバの構成の一例を示す図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、説明は以下の順序で行うものとする。
1.本開示の一実施形態による情報処理装置の概要
2.内部構成例
3.動作処理
4.変形例
4−1.第1の変形例
4−2.第2の変形例
5.まとめ
<<1.本開示の一実施形態による情報処理装置の概要>>
まず、本開示の一実施形態による情報処理装置の概要について、図1を参照して説明する。図1は、本実施形態による情報処理装置1の外観構成の一例を示す斜視図である。
図1に示すように、本実施形態による情報処理装置1は、例えばユーザの首に掛けられるネックバンド型の情報処理端末であってもよい。ネックバンド型の情報処理装置1は、首の両側から後ろ側(背中側)にかけて半周回するような形状の装着ユニット(装着部)を有し、ユーザの首にかけられることでユーザに装着される。図1では、装着ユニットをユーザが装着した状態における斜視図を示す。なお、本明細書では、上下左右前後といった方向を示す言葉を用いるが、これらの方向はユーザの直立姿勢における、ユーザの体の中心(例えば鳩尾の位置)からみた方向を示すものとする。例えば、「右」とはユーザの右半身側の方向を示し、「左」とはユーザの左半身側の方向を示し、「上」とはユーザの頭側の方向を示し、「下」とはユーザの足側の方向を示すものとする。また、「前」とはユーザの体が向く方向を示し、「後」とはユーザの背中側の方向を示すものとする。
図1に示すように、装着ユニットは、ユーザの首に密着して装着されてもよいし、離間して装着されてもよい。なお首かけ型の装着ユニットの他の形状としては、例えば首下げ紐によりユーザに装着されるペンダント型や、頭にかけるヘッドバンドの代わりに首の後ろ側を通るネックバンドを有するヘッドセット型が考えられる。
また、装着ユニットの使用形態は、人体に直接的に装着されて使用される形態であってもよい。直接的に装着されて使用される形態とは、装着ユニットと人体との間に何らの物体も存在しない状態で使用される形態を指す。例えば、図1に示す装着ユニットがユーザの首の肌に接するように装着される場合は本形態に該当する。他にも、頭部に直接的に装着されるヘッドセット型やメガネ型等の多様な形態が考えられる。若しくは、装着ユニットの使用形態は、人体に間接的に装着されて使用される形態であってもよい。間接的に装着されて使用される形態とは、装着ユニットと人体との間に何らかの物体が存在する状態で使用される形態を指す。例えば、図1に示した装着ユニットが、シャツの襟の下に隠れるように装着される等、服の上からユーザに接するように装着される場合は、本形態に該当する。他にも、首下げ紐によりユーザに装着されるペンダント型や、衣服に留め具等で留められるブローチ型等の多様な形態が考えられる。
また、本実施形態による情報処理装置1には、複数のマイクロホン12(12A、12B)、カメラ13(13A、13B)、およびスピーカ15(15A、15B)が設けられている。マイクロホン12は、ユーザ音声又は周囲の環境音等の音声データを取得する。カメラ13は、周囲の様子を撮像し撮像データを取得する。また、スピーカ15は、音声データの再生を行う。図1では、マイクロホン12A、12Bが、情報処理装置1の両端側に設けられ、カメラ13A、13Bが情報処理装置1の両端前方に設けられ、スピーカ15A、15Bは、情報処理装置1を装着した際にユーザの両耳の近くにそれぞれ位置する箇所に設けられている。これらマイクロホン12、カメラ13、およびスピーカ15の設置位置および設置数は一例であって、図1に示す例に限定されない。例えば、マイクロホン12、カメラ13、およびスピーカ15は、1つまたは3つ以上設けられてもよいし、設置位置が図1と異なる個所であってもよい。
ここで、ウェアラブル装置を身に付けて、情報収集、エンターテインメント、行動支援のために常時情報提示を受ける際、視覚的な情報提示であると日常生活の多くの「ながら」中の確認ができない、という問題があった。例えば、歩きながら、自転車に乗りながら、家事をしながら等の情報提示の確認は、視覚が一時的に奪われるため危険であった。
これに対し、聴覚的な情報提示、すなわち音声による情報提示の場合は、日常の「ながら」動作中にもハンズフリー、アイズフリーで確認することが可能となる。
また、提示される情報にはプル型とプッシュ型が想定される。プル型とは、ユーザが知りたい時にリクエストして提示される情報であって、ボタン操作や画面操作、音声操作によって発動する。また、プッシュ型とは、ユーザが意識せずとも、自動で提示される情報であって、例えばメール通知、着信、アプリケーションからの呼び出し、通知、電池残量の警告等が想定される。
プッシュ型の音声通知は、自動的に情報が提示されるというメリットがある一方、ユーザが情報を聞けない状態の時にも情報提示されてしまうというデメリットがある。また、情報提示開始後に、ユーザが情報を聞けない状態になった場合には音声を止める操作が必要であった。さらに、視覚的な情報のように前の情報が見えないので、前に聞いた内容を簡単に参照することができなかった。
そこで、本実施形態では、ユーザが情報提示を受けられる時間を推定し、時間内に聞き終わるよう音声情報の情報量を制御することで、音声情報提示の利便性を向上させることを可能とする。
これにより、ユーザが情報を聞ける状態になった時に音声による情報提示が受けられる。また、ユーザが情報を受けられる区間の間に情報提示を終わるように情報量が調整されるため、情報提示開始後にユーザが情報を聞けない状態になって音声を止める操作が必要になることもない。
また、前に聞いていた内容を簡易的に伝えることで、前回聞いた内容を簡単に参照することが可能となる。
<<2.内部構成例>>
続いて、本実施形態による情報処理装置1の内部構成について図2を参照して説明する。図2は、本実施形態による情報処理装置1の内部構成の一例を示すブロック図である。図2に示すように、情報処理装置1は、制御部10、通信部11、マイクロホン12、カメラ13、9軸センサ14、スピーカ15、位置測位部16、記憶部17、および生体センサ18を有する。
(制御部10)
制御部10は、演算処理装置および制御装置として機能し、各種プログラムに従って情報処理装置1内の動作全般を制御する。制御部10は、例えばCPU(Central Processing Unit)、マイクロプロセッサ等の電子回路によって実現される。また、制御部10は、使用するプログラムや演算パラメータ等を記憶するROM(Read Only Memory)、及び適宜変化するパラメータ等を一時記憶するRAM(Random Access Memory)を含んでいてもよい。
また、本実施形態による制御部10は、図2に示すように、ユーザ状況認識部10a、周辺状況認識部10b、判別部10c、推定部10d、調整部10e、提示情報取得部10f、および音声合成部10gとして機能する。
ユーザ状況認識部10aは、ユーザに関する各種センサ情報に基づいて、ユーザの状況を認識する機能を有する。例えばユーザ状況認識部10aは、マイクロホン12により収音されたユーザ音声、カメラ13により撮像されたユーザの顔画像、9軸センサ14に含まれる加速度センサ、ジャイロセンサ、地磁気センサ等より検知されたセンサデータ、位置測位部16により測位された位置情報に基づいて、ユーザの行動認識を行う。ユーザの行動認識では、歩いている、走っている、止まっているといった状況、さらには、自転車/自動車/電車に乗っている、座っている、立っている、寝ているといった詳細状況も把握され得る。
また、生体センサ18から取得した生体センサデータに基づいて、ユーザの状況(集中度等)を認識することも可能である。生体センサデータは、例えば脈拍、心拍、発汗量、体温、脳波、視線(眼の動きを撮像した画像や眼の周囲の筋肉の動きを検知して検出され得る)等が想定される。
周辺状況認識部10bは、環境に関する各種センサ情報に基づいて、ユーザ周辺の環境、状況を認識する機能を有する。例えばユーザ状況認識部10aは、マイクロホン12により収音された環境音声(雑音、自動車の音等)、カメラ13により撮像された周辺の景色、位置測位部16により測位された位置情報に基づいて、ユーザの周囲の状況(危険度等)が認識される。
判別部10cは、ユーザの状況または周囲の状況の少なくともいずれかに基づいて、ユーザが音声による情報提示を受けられる状態であるか否かを判別する。本実施形態による情報処理装置1は、ユーザが情報を受けられる状態であるか否かを判別し、情報を受けられる状態である場合に音声による情報提示を行う。例えば、判別部10cは、ユーザ状況に基づいて集中度を算出し、ユーザが何か一つのことに集中している場合は情報提示NGであって、リラックスしている場合は情報提示OKとすることが考えられる。また、ユーザがどのような行動をしているかによって情報提示のOK/NGが判別され得る。例えばユーザが激しく身体を動かす移動中は情報提示NGであることが望ましい。具体的には、走っていたり、自転車を漕いでいる時は情報提示NGであって、座っていたり、歩いている時は情報提示OKである。より具体的に述べると、ユーザが自転車を全力で漕いでいる時は情報提示はNGであって、交差点等で止まっている間は情報提示OKとする。また、ユーザがランニングしている間は情報提示はNGであって、信号待ち等で止まっている間は情報提示OKとする。
また、判別部10cは、周囲の状況に応じて、情報提示が受けられるか否かを判別し得る。例えば判別部10cは、周囲の映像や音声から、周りの危険度(気をつけなくてはならない度合い)を算出し、危険度が高い場合は情報提示NGとする。例えば判別部10cは、交通量の多い交差点は危険度が高いため、情報提示NGとする。より具体的には、例えばユーザが自動車運転中であっても、スムーズに進んでいる場合は情報提示OKであるが、混みあった交差点等、周囲に注意を払わなくてはならない時はNGとされる。また、周囲の騒音が煩い場所では情報提示NGとされる。なお周囲の状況は、情報処理装置1に設けられるマイクロホン12やカメラ13の他、周辺に設置されている監視カメラや人感センサからのセンサデータを通信部11を介して受信し、周囲状況の認識に用いてもよい。
また、判別部10cは、「ユーザ状況」と「周辺状況」とを総合的に勘案して、ユーザが音声による情報提示を受けられる状態であるか否かを判別することも可能である。例えば判別部10cは、「ユーザ状況」と「周辺状況」を各々判別し、両者とも情報提示OKと判別できた場合にのみ、全体として情報提示OKと判別結果を出力し、少なくともいずれかが情報提示NGの場合は全体としても情報提示NGと判別結果を出力するようにしてもよい。若しくは、判別部10cは、「ユーザ状況」と「周辺状況」を各々判別し、両者の情報提示を受けられているか否かを示すスコアを重み付け加算し、閾値を超えた場合に総合的に情報提示OKと判別してもよい。
推定部10dは、ユーザが情報提示を受けられる状態の継続時間を推定する。本実施形態では、ユーザが情報を受けられる区間(時間内)に音声による情報提示を終えるよう制御する。ユーザが情報提示を受けられる状態の継続時間とは、例えばユーザが自転車を漕いでいて信号待ちで止まった場合は、信号が青になって動き出すまでの時間である。図3は、本実施形態による音声情報提示制御タイミングを説明するための図である。以下、図3を参照して、ユーザが情報を受けられる区間(時間)について説明する。
図3に示すように、ユーザ状況や周辺状況の判別結果に基づいて、読み上げ開始推奨タイミングは、情報提示OKが開始するタイミングt1であって、読み上げ終了推奨タイミングは、情報提示OKの状態が終わるタイミングt3である。タイミングt1からt3の間が、ユーザが情報を受けられる区間、すなわち「読み上げ可能時間」となる。本実施形態による情報処理装置1は、例えばタイミングt1から読み上げ(音声情報提示)を開始し、読み上げが終了するタイミングt2が、読み上げ可能時間が終わるタイミングt3より前となるよう、「読み上げ時間」(音声情報提示時間)を調整する。「読み上げ時間」は、主に提示する音声情報の情報量の制御により調整されるが、詳細な説明は後述する。また、読み上げが終了したタイミングt2から、次の読み上げ開始のタイミングt4までの時間を、「読み上げ間隔」と称す。
ユーザが情報提示を受けられる状態の継続時間(以下、「読み上げ可能時間」と称す)は、例えばユーザ本人の過去の行動履歴または全ユーザの過去の行動履歴に基づいて推定され得る。例えば本実施形態による記憶部17には、日常的にユーザの行動履歴(日時、位置、行動)が蓄積されている。そして、推定部10dは、行動履歴に基づいて、ユーザが「情報を受けられる状態」になった時の状況(位置情報、曜日・時刻情報、行動)と、「情報が受けられない状態」になるまでの時間(読み上げ可能時間)の関係の傾向を統計的に求めることが可能である。すなわち、推定部10dは、ある状況になった場合に過去の類似した状況における読み上げ可能時間の平均値から、読み上げ可能時間を推定することができる。なお推定部10dは、機械学習を用いて読み上げ可能時間を求めることも可能である。
図4は、本実施形態によるユーザ本人の行動履歴に基づく読み上げ可能時間の推定について説明する図である。図4に示すように、例えば位置情報、曜日、時刻、行動、および読み上げ可能時間の履歴に基づいて、推定部10dは、「XX交差点」で「平日の朝8時1分」に「自転車で停車」した際の読み上げ可能時間を統計的に「42秒」と推定し得る。
また、本実施形態による推定部10dは、ユーザ本人の行動履歴に限定されず、全ユーザの過去の行動履歴に基づいて、同様に、読み上げ可能時間を推定することも可能である。全ユーザの過去の行動履歴は、例えば通信部11を介して接続するネットワーク上のサーバから取得され得る。
図5は、本実施形態による全ユーザの行動履歴に基づく読み上げ可能時間の推定について説明する図である。図5に示すように、例えばユーザID、位置情報、曜日、時刻、行動、および読み上げ可能時間の履歴に基づいて、推定部10dは、「XX交差点」で「平日の朝8時1分」に「自転車で停車」した際の読み上げ可能時間を統計的に「42秒」と推定し得る。
以上、ユーザ本人の行動履歴または全ユーザの行動履歴を用いた読み上げ可能時間の推定について具体的に説明した。
なお本実施形態による推定部10dは、現在位置情報に基づいて、サーバに対して現在位置における全ユーザの行動履歴を要求し、推定に必要な充分なデータが得られなかった場合(所定量に満たない場合)に、記憶部17に蓄積するユーザ本人の行動履歴に基づく推定に切り替えるようにしてもよい。
また、推定部10dは、全ユーザの行動履歴に基づいて推定する場合に、全ユーザの行動履歴から規則性を抽出し、読み上げ可能時間の推定に用いてもよい。例えば、ある信号でここ1時間内に止まった人達の行動履歴から、当該信号が変わるタイミングの規則性を算出し、当該信号でユーザが止まった際に信号が青になって動き出すまでの「情報提示を受けられる継続時間」(読み上げ可能時間)を推定する。ユーザの行動や周囲の状況が、信号や踏切等の規則的に変化する交通設備による場合、推定部10dは、全ユーザの位置情報と動き出し時刻から、信号が赤から青になるタイミングの規則性を推定できる。その結果、あとどのくらいで信号が青に変わるかが推定でき、読み上げ可能時間を推定することができる。
例えば、推定部10dは、自転車に乗車するユーザが、XX信号で停車後、再度動き出すタイミングとして、全ユーザの行動履歴によると8時1分、8時4分、8時7分、8時10分…の頻度が高い場合、当該信号は8時の間は 1+3n (n=0,...,19) 分で信号が赤から青に変わると推測できる。そのようなXX信号に、あるユーザが8時6分に自転車で停車した場合、1分間停車し、その後動き出すことが推測できるので、読み上げ可能時間は「1分」と推定される。なお、交通設備や自動車から制御情報を受信できるシステムが構築されている場合、推定部10dは、停車した信号機から制御情報を受信し、信号が赤から青に変わる時刻を把握し、より正確に読み上げ可能時間を推定し得る。
推定部10dは、全ユーザの行動履歴に基づく推定またはユーザ本人の行動履歴に基づく推定を行った後に、交通設備の規則的な変化に依る確信度の高い推定が出来た場合、当該推定結果を採用するようにしてもよい。
調整部10eは、ユーザに提示する情報を、推定部10dにより推定された読み上げ可能時間内に音声出力が終了する情報量に調整する機能を有する。ユーザに提示する情報は、提示情報取得部10fにより取得される。ユーザに提示する情報は、上述したように、例えばプッシュ型通知等、適切なタイミングで自動的にユーザに提示される情報である。例えばメール通知、着信、アプリケーションからの呼び出し、通知、電池残量の警告等の他、予め登録したニュースサイトやSNS(Social Networking Service)等の新着情報の提示も想定され得る。
具体的には、例えば調整部10eは、読み上げるアイテム数、読み上げる内容、または読み上げる速度を調整することが可能である。また、調整部10eは、これらの調整方法を組み合わせてもよい。
・読み上げるアイテム数の調整
調整部10eは、読み上げる情報(ニュース記事やメール等、「アイテム」と称す)1件毎の読み上げにかかる時間を予め算出し、読み上げ可能時間に何件読み上げられるかを算出し、読み上げ可能時間に応じて読み上げるアイテム数を調整する。読み上げにかかる時間は、過去にかかった時間の平均から求めてもよいし、読み上げるテキストの文字数から推定して求めてもよい。例えば調整部10eは、読み上げ可能時間が長い場合はニュースを10記事読み上げて、短い時は3記事だけ読み上げるよう調整することができる。
・読み上げる内容の粒度を調整
調整部10eは、タイトルのみ、最初の1文のみ、または全文といったように、情報の粒度毎の読み上げにかかる時間を予め算出し、読み上げ可能時間と読み上げなくてならないアイテム数に応じて、適切な粒度に調整する。例えば調整部10eは、読み上げ可能時間が短い場合はニュースのタイトルだけを読み上げて、少し長い場合は最初の1文まで読み上げて、更に長い場合は要約文まで読み上げて、充分に時間がある場合は全文を読み上げるよう調整することができる。
・読み上げる速度を調整
調整部10eは、読み上げる情報量から通常スピード時の読み上げ時間を算出し、読み上げ可能時間に対して少し足りない場合、時間内に読み終わるよう速度を早めるよう調整する。例えば調整部10eは、読み上げ可能時間が少し短い場合は通常より読み上げる速度を上げるよう調整することができる。
提示情報取得部10fは、ユーザに提示する情報を取得する。提示情報は、通信部11により受信してもよいし、記憶部17から抽出してもよいし、情報処理装置1で起動するアプリケーションにより生成されてもよい。
音声合成部10gは、調整部10eにより調整された提示情報(テキスト)に基づいて音声合成を行う機能を有する。音声合成部10gにより提示情報が音声化されると、音声情報がスピーカ15から出力され、ユーザに音声提示される。
(通信部11)
通信部11は、有線/無線により他の装置との間でデータの送受信を行うための通信モジュールである。通信部11は、例えば有線LAN(Local Area Network)、無線LAN、Wi−Fi(Wireless Fidelity、登録商標)、赤外線通信、Bluetooth(登録商標)、近距離/非接触通信等の方式で、外部機器と直接、またはネットワークアクセスポイントを介して無線通信する。
(マイクロホン12)
マイクロホン12は、ユーザの音声や周囲の環境を収音し、音声データとして制御部10に出力する。
(カメラ13)
カメラ13は、撮像レンズ、絞り、ズームレンズ、及びフォーカスレンズ等により構成されるレンズ系、レンズ系に対してフォーカス動作やズーム動作を行わせる駆動系、レンズ系で得られる撮像光を光電変換して撮像信号を生成する固体撮像素子アレイ等を有する。固体撮像素子アレイは、例えばCCD(Charge Coupled Device)センサアレイや、CMOS(Complementary Metal Oxide Semiconductor)センサアレイにより実現されてもよい。例えば、カメラ13は、情報処理装置1(装着ユニット)がユーザに装着された状態で、ユーザの前方を撮像可能に設けられる。この場合、カメラ13は、ユーザの周囲の景色や、ユーザが見ている方向の景色を撮像することが可能となる。また、カメラ13は、情報処理装置1がユーザに装着された状態で、ユーザの顔を撮像可能に設けられてもよい。この場合、情報処理装置1は、撮像画像からユーザの視線方向や表情を特定することが可能となる。また、カメラ13は、デジタル信号とされた撮像画像のデータを制御部10へ出力する。
(9軸センサ14)
9軸センサ14は、3軸ジャイロセンサ(角速度(回転速度)の検出)、3軸加速度センサ(Gセンサとも称す。移動時の加速度の検出)、および3軸地磁気センサ(コンパス、絶対方向(方位)の検出)を含む。9軸センサ14は、情報処理装置1を装着したユーザの状態または周囲の状態をセンシングする機能を有する。なお9軸センサ14は、センサ部の一例であって、本実施形態はこれに限定されず、例えば速度センサまたは振動センサ等をさらに用いてもよいし、加速度センサ、ジャイロセンサ、および地磁気センサのうち少なくともいずれかを用いてもよい。また、センサ部は、情報処理装置1(装着ユニット)とは別の装置に設けられていてもよいし、複数の装置に分散して設けられていてもよい。例えば、加速度センサ、ジャイロセンサ、および地磁気センサが頭部に装着されたデバイス(例えばイヤホン)に設けられ、速度センサや振動センサがスマートフォンに設けられてもよい。9軸センサ14は、センシング結果を示す情報を制御部10へ出力する。
(スピーカ15)
スピーカ15は、制御部10の制御に従って、音声合成部10gにより処理された音声信号を再生する。また、スピーカ15は、指向性を有していてもよい。
(位置測位部16)
位置測位部16は、外部からの取得信号に基づいて情報処理装置1の現在位置を検知する機能を有する。具体的には、例えば位置測位部16は、GPS(Global Positioning System)測位部により実現され、GPS衛星からの電波を受信して、情報処理装置1が存在している位置を検知し、検知した位置情報を制御部10に出力する。また、情報処理装置1は、GPSの他、例えばWi−Fi(登録商標)、Bluetooth(登録商標)、携帯電話・PHS・スマートフォン等との送受信、または近距離通信等により位置を検知するものであってもよい。
(記憶部17)
記憶部17は、上述した制御部10が各機能を実行するためのプログラムやパラメータを格納する。また、本実施形態による記憶部17は、ユーザの行動履歴を蓄積し得る。
(生体センサ18)
生体センサ18は、ユーザの各種生体情報を検知し、生体センサデータとして制御部10へ出力する。生体センサデータは、上述したように、例えば脈拍、心拍、発汗量、体温、脳波、視線等が想定される。なお、生体センサ18の少なくとも一部が、外部装置に設けられていてもよい。この場合、外部装置の生体センサにより検知された生体センサデータが無線通信を介して通信部11により受信され、制御部10に出力され得る。
以上、本実施形態による情報処理装置1の内部構成例について具体的に説明した。
<<3.動作処理>>
続いて、本実施形態による情報処理装置1の動作処理について図6および図7を参照して説明する。図6は、本実施形態による読み上げ調整の動作処理を示すフローチャートである。
図6に示すように、まず、情報処理装置1の判別部10cは、読み上げ可能タイミングであるか否かの判別を行う(ステップS103)。すなわち、判別部10cは、ユーザ状況や周辺状況の認識結果に応じて、現在、ユーザが音声情報提示を受けられる状態であるか否かを判別する。
次に、現在、読み上げ可能タイミングであると判別された場合(ステップS106/Yes)、提示情報取得部10fは、読み上げ情報の取得を行う(ステップS109)。読み上げ情報は、例えばプッシュ型通知情報等、自動的に用意される情報であるため、提示情報取得部10fは、現時点でユーザへ提示すべき情報の探索を行う。
次いで、読み上げ情報が存在する場合(ステップS112/Yes)、推定部10dは、読み上げ可能時間を推定する(ステップS115)。読み上げ可能時間の推定処理については、図7を参照して詳細する。
次に、調整部10eは、推定された読み上げ可能時間内に提示情報を読み合えるよう、読み上げ内容の調整(すなわち読み上げ内容の生成)を行う(ステップS118)。
そして、情報処理装置1は、音声合成部10gにより調整した内容を音声化し、スピーカ15から情報の読み上げ(音声提示)を行う(ステップS121)。
続いて、上記ステップS115に示す読み上げ可能時間の推定処理について図7を参照して説明する。
図7は、本実施形態による読み上げ可能時間推定の動作処理を示すフローチャートである。図7に示すように、まず、情報処理装置1の推定部10dは、現在位置における全てのユーザの過去履歴を取得する(ステップS130)。全てのユーザの過去履歴は、例えばサーバ上にあって、推定部10dは、位置測位部16により測位された現在位置情報と共に、当該現在位置による全ユーザの過去履歴をサーバに要求する。
次に、全てのユーザの過去履歴が所定量蓄積されている場合(ステップS133/Yes)、全てのユーザの過去履歴に基づいて読み上げ可能時間を推定する(ステップS136)。
一方、全てのユーザの過去履歴が所定量蓄積されていない場合(ステップS133/No)、ユーザ本人の過去履歴に基づいて読み上げ可能時間を推定する(ステップS139)。
次いで、推定部10dは、対象の過去履歴から規則性が算出可能であるか否かを判断する(ステップS142)。規則性とは、踏切や信号等の交通設備の規則的な変化であって、ユーザ状況や周辺状況が周辺の交通設備に依る場合、これらの規則性を考慮することでより確実な読み上げ可能時間を推定することが可能となる。
次に、規則性が算出可能である場合(ステップS142/Yes)、推定部10dは、規則性を算出し、算出した規則性に基づいて読み上げ可能時間の推定値を更新する(ステップS145)。
以上、本実施形態による動作処理について説明した。
<<4.変形例>>
<4−1.第1の変形例>
続いて、本実施形態による第1の変形例について図8〜図9を参照して説明する。本変形例では、ユーザが情報を受けた後、次の情報を受けられるようになるまでの間隔(図3に示す「読み上げ間隔」)に応じて、次の情報の読み上げ方法を変更する。具体的には、読み上げ間隔に応じて、次の情報提示の際に前回の内容や前回の内容との関連性を示すことで、より心地よい情報提示を実現し得る。
(構成)
図8は、本変形例による情報処理装置1−1の構成の一例を示すブロック図である。図8に示すように、情報処理装置1−1は、制御部10−1、通信部11、マイクロホン12、カメラ13、9軸センサ14、スピーカ15、位置測位部16、記憶部17、および生体センサ18を有する。
制御部10−1は、図8に示すように、ユーザ状況認識部10a、周辺状況認識部10b、判別部10c、推定部10d、調整部10e、提示情報取得部10f、音声合成部10g、関連度算出部10h、忘却度算出部10i、および内容変更部10jとして機能する。
図2を参照して説明した構成と同符号の構成は、同様の処理を行うため、ここでの説明は省略する。
関連度算出部10hは、前回情報提示した内容と、今回情報提示する内容との関連度を算出する機能を有する。関連度は、例えば共通する事柄に関する情報(例えば同じ事件に関するニュース)であるか、同じ種類の情報であるか(例えばニュース、警告、通知等、情報のジャンルや、番組内の同じコーナーの情報等)といったことが算出される。関連度が高い場合は、次に説明する忘却度に応じて前回の情報を思い出すように導入メッセージを加えて情報提示し、関連度が低い場合には、前回の情報を思い出させる必要がないため、前回の情報についての情報提示は行わない。
忘却度算出部10iは、前回情報提示した内容をユーザがどの程度忘れているかを予測し、忘却度として算出する。例えば忘却度算出部10iは、読み上げ間隔の長さ、すなわち前回読み上げを終了してから今回読み上げを開始するまでの時間の長さに応じて忘却度を算出してもよい。また、忘却度算出部10iは、前回読み上げを終了してから今回読み上げを開始するまでの時間内にユーザが行った行動(他の人と喋っていた、テレビを見ていた、運動していた、仕事していた、休んでいた、他の情報を取得していた等)をさらに考慮して忘却度を算出してもよい。例えば下記式1に示すように、基本的には、前回情報提示からの時間tに比例して忘却度(F)が大きくなるとしてよいが、その間のユーザ行動によっても忘却度が増える場合がある。
Figure 2017175432
上記式1において、αは間隔にかかる係数、βiは各ユーザ行動にかかる係数である。また、Tは前回情報提示からの間隔の長さ(時間)、Aiは間隔Tの間におけるユーザ行動である。
内容変更部10jは、算出された忘却度に応じて、ユーザに提示する情報の内容を変更する。例えば内容変更部10jは、忘却度の大きさに応じて、今回ユーザに提示する情報の冒頭に、前回の提示情報との関係性や前回の提示情報の内容について言及する導入メッセージを追加する。より具体的には、内容変更部10jは、忘却度が第1の閾値より小さい場合、「続きです。」とだけ前置きする内容に変更する。また、内容変更部10jは、忘却度が第1の閾値より大きく第2の閾値より小さい場合(ここでは、第1の閾値<第2の閾値とする)、「引き続き○○コーナーです。先ほどはXXXに関してお伝えしました。」と、冒頭に前回の提示情報のキーワードを説明する内容に変更する。また、忘却度が第2の閾値より大きい場合、「○○コーナーです。前回は『・・・・・』。」と、冒頭で前回提示した情報の内容を1文程度の簡単な要約で伝える内容に変更する。
(動作処理)
続いて、本変形例の動作処理について図9を参照して説明する。図9は、本変形例による読み上げ調整の動作処理を示すフローチャートである。
図9に示すように、まず、情報処理装置1−1の判別部10cは、読み上げ可能タイミングであるか否かの判別を行う(ステップS203)。
次に、現在、読み上げ可能タイミングであると判別された場合(ステップS206/Yes)、提示情報取得部10fは、読み上げ情報の取得を行い(ステップS209)、読み上げ情報が存在するか否かを判断する(ステップS212)。これらステップS203〜S212に示す処理は、図6を参照して説明したステップS103〜S112に示す処理と同様である。
次いで、読み上げ情報が存在する場合(ステップS212/Yes)、関連度算出部10hは、今回提示する情報と、前回提示した情報との内容関連度の算出を行う(ステップS215)。
次に、内容関連度が予め設定した所定値より高い場合(ステップS218/Yes)、忘却度算出部10iは、忘却度の算出を行う(ステップS221)。
次いで、算出された忘却度に応じて、内容変更部10jは、提示情報の内容を変更する(ステップS224)。
一方、内容関連度が予め設定した所定値より低い場合(ステップS218/No)、提示情報の内容変更は行われない。
続いて、推定部10dは、読み上げ可能時間を推定する(ステップS227)。読み上げ可能時間の推定処理は、図7を参照して説明した処理と同様であるため、ここでの詳細は省略する。なお、読み上げ可能時間の推定処理を行うタイミングは、図9に示す処理順に限定されず、内容関連度の算出(上記ステップS215)より前または内容関連度の算出と並行で行われてもよい。
次に、調整部10eは、推定された読み上げ可能時間内に提示情報を読み合えるよう、読み上げ内容の調整を行う(ステップS230)。
そして、情報処理装置1は、音声合成部10gにより調整した内容を音声化し、スピーカ15から情報の読み上げ(音声提示)を行う(ステップS233)。
<4−2.第2の変形例>
次に、本実施形態による第2の変形例について図10〜図11を参照して説明する。図10は、本変形例によるシステム構成の一例を示す図である。
図10に示すように、本実施形態は、クライアント−サーバ型システムにより構成されていてもよい。すなわち、情報処理装置1(1A、1B)が、ネットワーク3を介してサーバ4に接続されるシステム構成である。
情報処理装置1A、1Bは、いずれも本実施形態による情報処理装置1の一例である。情報処理装置1Aは、例えばユーザにより使用される端末であって、情報処理装置1Bは、他ユーザにより使用される端末である。情報処理装置1Bは、例えばスマートフォンにより実現され、無線または有線でイヤホン5と接続し、イヤホン5から音声情報の提示を行い得る。情報処理装置1A、1Bは、ネットワーク3と無線または有線により接続し、クラウド上のサーバ4とデータの送受信を行い得る。なお、図10に示す例では2つの情報処理装置1を示したが、本実施形態はこれに限定されず、多数のユーザに利用される多数の情報処理装置1が、ネットワーク3を介してサーバ4と接続され得る。
サーバ4は、全ユーザの行動履歴DB(データベース)42を有し、情報処理装置1Aや1Bから送信された行動情報を蓄積し、必要に応じて外部装置へ送信する。かかるサーバ4の構成について図11を参照して説明する。
図11は、本実施形態によるサーバ4の構成の一例を示すブロック図である。図11に示すように、サーバ4は、制御部40、通信部41、および全ユーザの行動履歴DB42を有する。制御部40は、推定部40a、調整部40b、および提示情報取得部40cとして機能し得る。各構成の機能は、情報処理装置1の同構成の機能と同様である。
なお通信部41は、ネットワーク3を介して外部装置とデータの送受信を行い得る。また、全ユーザの行動履歴DB42には、通信部41を介して情報処理装置1Aや1B等から受信したユーザの行動履歴が蓄積されている。
サーバ4は、例えば情報処理装置1Aからの要求に応じて、全ユーザの行動履歴DB42から所定の行動履歴を抽出して返送してもよい。
また、サーバ4は、推定部40aにより、例えば情報処理装置1Aからの要求に応じて、ある状況になった場合の過去の全ユーザの類似した状況における読み上げ可能時間の平均値から読み上げ可能時間を推定し、返送してもよい。
また、サーバ4は、例えば情報処理装置1Aからの要求に応じて、提示情報取得部40cによりユーザへの提示情報を取得し、推定部40aにより推定された読み上げ可能時間内に読み上げが終わるよう調整したデータを返送してもよい。
また、サーバ4に音声合成部10gや、図8に示す関連度算出部10h、忘却度算出部10i、内容変更部10jに相当する構成を設けてもよい。
<<5.まとめ>>
上述したように、本開示の実施形態による情報処理装置1では、情報提示を受けられる時間(すなわち、読み上げ可能時間)を推定し、時間内に聞き終わるよう音声情報の情報量を制御することで、音声情報提示の利便性を向上させることを可能とする。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本技術はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
例えば、上述した情報処理装置1に内蔵されるCPU、ROM、およびRAM等のハードウェアに、情報処理装置1の機能を発揮させるためのコンピュータプログラムも作成可能である。また、当該コンピュータプログラムを記憶させたコンピュータ読み取り可能な記憶媒体も提供される。
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
なお、本技術は以下のような構成も取ることができる。
(1)
ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定する推定部と、
前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整する調整部と、
を備える、情報処理装置。
(2)
前記情報提示を受けられる状態であるか否かは、前記ユーザの状況または周囲の状況の少なくともいずれかに基づいて判別される、前記(1)に記載の情報処理装置。
(3)
前記ユーザの状況は、前記ユーザの行動を含み、
前記ユーザの行動認識結果に応じて、前記ユーザが情報提示を受けられる状態であるか否かが判別される、前記(2)に記載の情報処理装置。
(4)
前記ユーザの状況は、前記ユーザの集中度を含み、
前記集中度の算出結果に応じて、前記ユーザが情報提示を受けられる状態であるか否かが判別される、前記(2)または(3)に記載の情報処理装置。
(5)
前記ユーザの状況は、前記ユーザの周辺の危険度を含み、
前記危険度の算出結果に応じて、前記ユーザが情報提示を受けられる状態であるか否かが判別される、前記(2)〜(4)のいずれか1項に記載の情報処理装置。
(6)
前記調整部は、前記ユーザに提示する情報を、前記継続時間内に音声出力が終了する情報量に調整する、前記(2)〜(5)のいずれか1項に記載の情報処理装置。
(7)
前記調整部は、前記ユーザに提示する情報の数を増減することで調整する、前記(6)に記載の情報処理装置。
(8)
前記調整部は、前記ユーザに提示する情報の粒度を変更することで調整する、前記(6)または(7)に記載の情報処理装置。
(9)
前記調整部は、前記ユーザに提示する情報の読み上げ速度を変更することで調整する、前記(6)〜(8)のいずれか1項に記載の情報処理装置。
(10)
前記推定部は、前記ユーザの過去の行動履歴に基づいて、前記情報提示を受けられる状態の継続時間を推定する、前記(1)〜(9)のいずれか1項に記載の情報処理装置。
(11)
前記推定部は、全てのユーザの過去の行動履歴に基づいて、前記情報提示を受けられる状態の継続時間を推定する、前記(1)〜(9)のいずれか1項に記載の情報処理装置。
(12)
前記推定部は、前記ユーザの現在位置に紐づく全てのユーザの過去の行動履歴が所定量ある場合は全てのユーザの行動履歴を用いて前記継続時間を推定し、所定量に満たない場合は前記ユーザの行動履歴を用いて前記継続時間を推定する、前記(1)〜(9)のいずれか1項に記載の情報処理装置。
(13)
前記推定部は、全てのユーザの過去の行動履歴に基づいて、周辺の交通設備の規則性を抽出し、前記継続時間を推定する、前記(1)〜(9)のいずれか1項に記載の情報処理装置。
(14)
前記推定部は、交通設備または自動車から取得した制御情報に基づいて前記継続時間を推定する、前記(1)〜(13)のいずれか1項に記載の情報処理装置。
(15)
前記情報処理装置は、
前記ユーザの忘却度を算出する算出部と、
前記算出された忘却度に応じて、前記ユーザに提示する情報を変更する変更部と、
をさらに備える、前記(1)〜(14)のいずれか1項に記載の情報処理装置。
(16)
前記変更部は、前回提示した情報に基づく導入メッセージを提示情報の読み上げ冒頭に付加する、前記(15)に記載の情報処理装置。
(17)
前記算出部は、前回提示した時刻からの経過時間およびその間のユーザ行動の少なくともいずれかに基づいて忘却度を算出する、前記(15)または(16)に記載の情報処理装置。
(18)
前記情報処理装置は、
前記ユーザの状況または前記ユーザの周囲の状況に関するリアルタイムのセンシングデータを取得する取得部と、
前記ユーザが情報提示を受けられる状態の継続時間内に読み上げが終了するよう調整された、提示情報の読み上げ音声を出力する出力部と、
をさらに備える、前記(1)〜(17)のいずれか1項に記載の情報処理装置。
(19)
プロセッサが、
ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定することと、
前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整することと、
を含む、情報処理方法。
(20)
コンピュータを、
ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定する推定部と、
前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整する調整部と、
として機能させる、プログラム。
1、1A、1B 情報処理装置
10、10−1 制御部
10a ユーザ状況認識部
10b 周辺状況認識部
10c 判別部
10d 推定部
10e 調整部
10f 提示情報取得部
10g 音声合成部
10h 関連度算出部
10i 忘却度算出部
10j 内容変更部
11 通信部
12 マイクロホン
13 カメラ
14 9軸センサ
15 スピーカ
16 位置測位部
17 記憶部
18 生体センサ
3 ネットワーク
4 サーバ
40 制御部
40a 推定部
40b 調整部
40c 提示情報取得部
41 通信部
42 全ユーザの行動履歴DB
5 イヤホン

Claims (20)

  1. ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定する推定部と、
    前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整する調整部と、
    を備える、情報処理装置。
  2. 前記情報提示を受けられる状態であるか否かは、前記ユーザの状況または周囲の状況の少なくともいずれかに基づいて判別される、請求項1に記載の情報処理装置。
  3. 前記ユーザの状況は、前記ユーザの行動を含み、
    前記ユーザの行動認識結果に応じて、前記ユーザが情報提示を受けられる状態であるか否かが判別される、請求項2に記載の情報処理装置。
  4. 前記ユーザの状況は、前記ユーザの集中度を含み、
    前記集中度の算出結果に応じて、前記ユーザが情報提示を受けられる状態であるか否かが判別される、請求項2に記載の情報処理装置。
  5. 前記ユーザの状況は、前記ユーザの周辺の危険度を含み、
    前記危険度の算出結果に応じて、前記ユーザが情報提示を受けられる状態であるか否かが判別される、請求項2に記載の情報処理装置。
  6. 前記調整部は、前記ユーザに提示する情報を、前記継続時間内に音声出力が終了する情報量に調整する、請求項2に記載の情報処理装置。
  7. 前記調整部は、前記ユーザに提示する情報の数を増減することで調整する、請求項6に記載の情報処理装置。
  8. 前記調整部は、前記ユーザに提示する情報の粒度を変更することで調整する、請求項6に記載の情報処理装置。
  9. 前記調整部は、前記ユーザに提示する情報の読み上げ速度を変更することで調整する、請求項6に記載の情報処理装置。
  10. 前記推定部は、前記ユーザの過去の行動履歴に基づいて、前記情報提示を受けられる状態の継続時間を推定する、請求項1に記載の情報処理装置。
  11. 前記推定部は、全てのユーザの過去の行動履歴に基づいて、前記情報提示を受けられる状態の継続時間を推定する、請求項1に記載の情報処理装置。
  12. 前記推定部は、前記ユーザの現在位置に紐づく全てのユーザの過去の行動履歴が所定量ある場合は全てのユーザの行動履歴を用いて前記継続時間を推定し、所定量に満たない場合は前記ユーザの行動履歴を用いて前記継続時間を推定する、請求項1に記載の情報処理装置。
  13. 前記推定部は、全てのユーザの過去の行動履歴に基づいて、周辺の交通設備の規則性を抽出し、前記継続時間を推定する、請求項1に記載の情報処理装置。
  14. 前記推定部は、交通設備または自動車から取得した制御情報に基づいて前記継続時間を推定する、請求項1に記載の情報処理装置。
  15. 前記情報処理装置は、
    前記ユーザの忘却度を算出する算出部と、
    前記算出された忘却度に応じて、前記ユーザに提示する情報を変更する変更部と、
    をさらに備える、請求項1に記載の情報処理装置。
  16. 前記変更部は、前回提示した情報に基づく導入メッセージを提示情報の読み上げ冒頭に付加する、請求項15に記載の情報処理装置。
  17. 前記算出部は、前回提示した時刻からの経過時間およびその間のユーザ行動の少なくともいずれかに基づいて忘却度を算出する、請求項15に記載の情報処理装置。
  18. 前記情報処理装置は、
    前記ユーザの状況または前記ユーザの周囲の状況に関するリアルタイムのセンシングデータを取得する取得部と、
    前記ユーザが情報提示を受けられる状態の継続時間内に読み上げが終了するよう調整された、提示情報の読み上げ音声を出力する出力部と、
    をさらに備える、請求項1に記載の情報処理装置。
  19. プロセッサが、
    ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定することと、
    前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整することと、
    を含む、情報処理方法。
  20. コンピュータを、
    ユーザが音声による情報提示を受けられる状態であると判別された際に、当該情報提示を受けられる状態の継続時間を推定する推定部と、
    前記推定された継続時間に応じて、前記ユーザに提示する情報量を調整する調整部と、
    として機能させる、プログラム。
JP2018510230A 2016-04-05 2016-12-28 情報処理装置、情報処理方法、およびプログラム Pending JPWO2017175432A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016076027 2016-04-05
JP2016076027 2016-04-05
PCT/JP2016/089186 WO2017175432A1 (ja) 2016-04-05 2016-12-28 情報処理装置、情報処理方法、およびプログラム

Publications (1)

Publication Number Publication Date
JPWO2017175432A1 true JPWO2017175432A1 (ja) 2019-03-22

Family

ID=60000998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018510230A Pending JPWO2017175432A1 (ja) 2016-04-05 2016-12-28 情報処理装置、情報処理方法、およびプログラム

Country Status (5)

Country Link
US (2) US10671340B2 (ja)
EP (1) EP3441873A4 (ja)
JP (1) JPWO2017175432A1 (ja)
CN (1) CN109074237B9 (ja)
WO (1) WO2017175432A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6669342B2 (ja) * 2018-03-31 2020-03-18 Nl技研株式会社 認知支援システム、認知支援装置、および認知支援サーバ
JP7098390B2 (ja) * 2018-04-12 2022-07-11 株式会社Nttドコモ 情報処理装置
US11363953B2 (en) * 2018-09-13 2022-06-21 International Business Machines Corporation Methods and systems for managing medical anomalies
JP7318241B2 (ja) * 2019-03-18 2023-08-01 コニカミノルタ株式会社 音声情報処理装置及びプログラム
CN111724774A (zh) * 2019-03-22 2020-09-29 阿里巴巴集团控股有限公司 语音交互及车载语音交互方法、装置、设备及存储介质
CN110085066B (zh) * 2019-04-17 2021-12-21 北京小米移动软件有限公司 展示阅读信息的方法、装置及电子设备
US10904622B2 (en) * 2019-05-29 2021-01-26 Rovi Guides, Inc. Learning activity duration for providing content during activity
JP6719140B1 (ja) * 2019-11-15 2020-07-08 Fairy Devices株式会社 首掛け型装置
JP7453193B2 (ja) 2021-09-27 2024-03-19 Kddi株式会社 ユーザの周辺状況に連動して音声合成に基づく音声を制御する携帯装置、プログラム及び方法

Citations (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05232982A (ja) * 1992-02-24 1993-09-10 Nippon Telegr & Teleph Corp <Ntt> 時間長指定型記事読み上げ方法
JPH09101990A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
JPH11101652A (ja) * 1997-09-26 1999-04-13 Toyota Motor Corp 電子メールデータ受信装置、電子メールホスト装置、これらのためのプログラムを記録した媒体、及び電子メールシステム
JPH11153446A (ja) * 1997-11-19 1999-06-08 Nissan Motor Co Ltd 車載情報装置
JP2000089777A (ja) * 1998-09-10 2000-03-31 Ricoh Co Ltd 文書読み上げ装置
JP2001014237A (ja) * 1999-07-02 2001-01-19 Nec Corp 電子メール番組装置および電子メール番組用プログラムを記録した記録媒体
JP2002365061A (ja) * 2001-06-11 2002-12-18 Pioneer Electronic Corp 移動体用電子システムの制御装置及び制御方法、移動体用電子システム並びにコンピュータプログラム
JP2003083752A (ja) * 2001-09-10 2003-03-19 Nissan Motor Co Ltd 車両用情報提供システム
JP2003099080A (ja) * 2001-09-25 2003-04-04 Nissan Motor Co Ltd 音声読み上げ装置、音声読み上げシステム、及び音声読み上げ方法
JP2003187382A (ja) * 2001-12-17 2003-07-04 Nissan Motor Co Ltd 車両情報提供装置
JP2003345487A (ja) * 2002-05-28 2003-12-05 Sharp Corp 操作補助方法、操作補助装置、プログラムおよびプログラムを記録した媒体
WO2005006199A1 (ja) * 2003-07-14 2005-01-20 Matsushita Electric Industrial Co., Ltd. コンテンツ配信装置及びコンテンツ再生装置
JP2005025619A (ja) * 2003-07-04 2005-01-27 Aisin Aw Co Ltd 情報端末、情報配信装置及び情報配信システム
JP2005084752A (ja) * 2003-09-04 2005-03-31 Denso It Laboratory Inc コンテンツ配信システム及びコンテンツ受信再生装置
JP2007047710A (ja) * 2005-08-12 2007-02-22 Sharp Corp 音声化装置、キャッシュレジスタ、音声化方法、音声化プログラム、および音声化プログラムを記録したコンピュータ読取り可能な記録媒体
JP2008046425A (ja) * 2006-08-17 2008-02-28 National Institute Of Information & Communication Technology 印象表現出力装置及び方法
JP2008233345A (ja) * 2007-03-19 2008-10-02 Toshiba Corp インタフェース装置及びインタフェース処理方法
WO2009072412A1 (ja) * 2007-12-03 2009-06-11 Nec Corporation 読み上げシステム、読み上げ方法、読み上げプログラム、および記録媒体
JP2009168773A (ja) * 2008-01-21 2009-07-30 Nissan Motor Co Ltd ナビゲーション装置および情報提供方法
JP2010008068A (ja) * 2008-06-24 2010-01-14 Denso Corp ナビゲーション装置
JP2010039805A (ja) * 2008-08-06 2010-02-18 Hitachi Ltd コンテンツスケジューリング装置
JP2011221766A (ja) * 2010-04-08 2011-11-04 Toyota Motor Corp 車両用危険度情報提供装置
JP2012027679A (ja) * 2010-07-23 2012-02-09 Mitsubishi Electric Information Systems Corp 文章作成システム及び文章作成プログラム
JP2013131145A (ja) * 2011-12-22 2013-07-04 Sanyo Electric Co Ltd 移動体通信装置及び走行支援方法
JP2013186684A (ja) * 2012-03-08 2013-09-19 Hishiki Unso Kk 信号機システムおよび信号情報受信端末
JP2013538403A (ja) * 2010-09-13 2013-10-10 トムトム インターナショナル ベスローテン フエンノートシャップ ポータブル処理装置の改良又はそれに関する改良
JP2014174016A (ja) * 2013-03-08 2014-09-22 Panasonic Corp 推定方法、表示方法、推定装置、表示装置
WO2015037396A1 (ja) * 2013-09-11 2015-03-19 株式会社デンソー 音声出力制御装置、プログラムおよび記録媒体
WO2015094891A1 (en) * 2013-12-20 2015-06-25 Robert Bosch Gmbh System and method for dialog-enabled context-dependent and user-centric content presentation
JP2015518171A (ja) * 2012-04-03 2015-06-25 ソニー株式会社 再生制御装置、再生制御方法、およびプログラム
WO2016038798A1 (ja) * 2014-09-10 2016-03-17 株式会社デンソー 車両用制御装置
WO2016042889A1 (ja) * 2014-09-17 2016-03-24 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
JP2019105942A (ja) * 2017-12-11 2019-06-27 株式会社Nttドコモ コンテンツの提示順位を制御する装置、方法、及び、プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1893639A (zh) * 2005-07-01 2007-01-10 英保达股份有限公司 回放广播节目的节目概要的系统及方法
US7717921B2 (en) 2005-10-19 2010-05-18 Warsaw Orthopedic, Inc. Instruments and methods for delivering multiple implants in a surgical procedure
JP4871119B2 (ja) 2006-12-27 2012-02-08 日本電信電話株式会社 音声合成方法、音声合成装置、プログラム、記録媒体
US8990848B2 (en) * 2008-07-22 2015-03-24 At&T Intellectual Property I, L.P. System and method for temporally adaptive media playback
JP4864950B2 (ja) * 2008-09-16 2012-02-01 パイオニア株式会社 車載機器、情報通信システム、車載機器の制御方法およびプログラム
US8379807B1 (en) * 2009-06-02 2013-02-19 Sprint Communications Company L.P. Providing a customized voicemail-retrieval announcement
US8035023B2 (en) * 2009-08-25 2011-10-11 Volkswagen Ag Predictive environment music playlist selection
US8769560B2 (en) * 2009-10-13 2014-07-01 At&T Intellectual Property I, L.P. System and method to obtain content and generate modified content based on a time limited content consumption state
KR102064952B1 (ko) * 2013-07-12 2020-01-10 삼성전자주식회사 수신 데이터를 이용하여 어플리케이션을 운영하는 전자 장치
KR101558656B1 (ko) * 2013-07-30 2015-10-08 현대자동차주식회사 수신자 맞춤형 메시지 처리 장치 및 그 방법
JP6481484B2 (ja) 2014-09-10 2019-03-13 株式会社デンソー 車両用制御装置

Patent Citations (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05232982A (ja) * 1992-02-24 1993-09-10 Nippon Telegr & Teleph Corp <Ntt> 時間長指定型記事読み上げ方法
JPH09101990A (ja) * 1995-07-31 1997-04-15 Toshiba Corp 情報フィルタリング装置
JPH11101652A (ja) * 1997-09-26 1999-04-13 Toyota Motor Corp 電子メールデータ受信装置、電子メールホスト装置、これらのためのプログラムを記録した媒体、及び電子メールシステム
JPH11153446A (ja) * 1997-11-19 1999-06-08 Nissan Motor Co Ltd 車載情報装置
JP2000089777A (ja) * 1998-09-10 2000-03-31 Ricoh Co Ltd 文書読み上げ装置
JP2001014237A (ja) * 1999-07-02 2001-01-19 Nec Corp 電子メール番組装置および電子メール番組用プログラムを記録した記録媒体
JP2002365061A (ja) * 2001-06-11 2002-12-18 Pioneer Electronic Corp 移動体用電子システムの制御装置及び制御方法、移動体用電子システム並びにコンピュータプログラム
JP2003083752A (ja) * 2001-09-10 2003-03-19 Nissan Motor Co Ltd 車両用情報提供システム
JP2003099080A (ja) * 2001-09-25 2003-04-04 Nissan Motor Co Ltd 音声読み上げ装置、音声読み上げシステム、及び音声読み上げ方法
JP2003187382A (ja) * 2001-12-17 2003-07-04 Nissan Motor Co Ltd 車両情報提供装置
JP2003345487A (ja) * 2002-05-28 2003-12-05 Sharp Corp 操作補助方法、操作補助装置、プログラムおよびプログラムを記録した媒体
JP2005025619A (ja) * 2003-07-04 2005-01-27 Aisin Aw Co Ltd 情報端末、情報配信装置及び情報配信システム
WO2005006199A1 (ja) * 2003-07-14 2005-01-20 Matsushita Electric Industrial Co., Ltd. コンテンツ配信装置及びコンテンツ再生装置
JP2005084752A (ja) * 2003-09-04 2005-03-31 Denso It Laboratory Inc コンテンツ配信システム及びコンテンツ受信再生装置
JP2007047710A (ja) * 2005-08-12 2007-02-22 Sharp Corp 音声化装置、キャッシュレジスタ、音声化方法、音声化プログラム、および音声化プログラムを記録したコンピュータ読取り可能な記録媒体
JP2008046425A (ja) * 2006-08-17 2008-02-28 National Institute Of Information & Communication Technology 印象表現出力装置及び方法
JP2008233345A (ja) * 2007-03-19 2008-10-02 Toshiba Corp インタフェース装置及びインタフェース処理方法
WO2009072412A1 (ja) * 2007-12-03 2009-06-11 Nec Corporation 読み上げシステム、読み上げ方法、読み上げプログラム、および記録媒体
JP2009168773A (ja) * 2008-01-21 2009-07-30 Nissan Motor Co Ltd ナビゲーション装置および情報提供方法
JP2010008068A (ja) * 2008-06-24 2010-01-14 Denso Corp ナビゲーション装置
JP2010039805A (ja) * 2008-08-06 2010-02-18 Hitachi Ltd コンテンツスケジューリング装置
JP2011221766A (ja) * 2010-04-08 2011-11-04 Toyota Motor Corp 車両用危険度情報提供装置
JP2012027679A (ja) * 2010-07-23 2012-02-09 Mitsubishi Electric Information Systems Corp 文章作成システム及び文章作成プログラム
JP2013538403A (ja) * 2010-09-13 2013-10-10 トムトム インターナショナル ベスローテン フエンノートシャップ ポータブル処理装置の改良又はそれに関する改良
JP2013131145A (ja) * 2011-12-22 2013-07-04 Sanyo Electric Co Ltd 移動体通信装置及び走行支援方法
JP2013186684A (ja) * 2012-03-08 2013-09-19 Hishiki Unso Kk 信号機システムおよび信号情報受信端末
JP2015518171A (ja) * 2012-04-03 2015-06-25 ソニー株式会社 再生制御装置、再生制御方法、およびプログラム
JP2014174016A (ja) * 2013-03-08 2014-09-22 Panasonic Corp 推定方法、表示方法、推定装置、表示装置
WO2015037396A1 (ja) * 2013-09-11 2015-03-19 株式会社デンソー 音声出力制御装置、プログラムおよび記録媒体
WO2015094891A1 (en) * 2013-12-20 2015-06-25 Robert Bosch Gmbh System and method for dialog-enabled context-dependent and user-centric content presentation
WO2016038798A1 (ja) * 2014-09-10 2016-03-17 株式会社デンソー 車両用制御装置
WO2016042889A1 (ja) * 2014-09-17 2016-03-24 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
JP2016062239A (ja) * 2014-09-17 2016-04-25 ソニー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
JP2019105942A (ja) * 2017-12-11 2019-06-27 株式会社Nttドコモ コンテンツの提示順位を制御する装置、方法、及び、プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SAWHNEY ET AL.: "Nomadic Radio: Speech and Audio Interaction for Contextual Messaging in Nomadic Environments", ACM TRANSACTION ON COMPUTER-HUMAN INTERACTION[オンライン], vol. 7, no. 3, JPN7021000203, September 2000 (2000-09-01), US, pages 353 - 383, XP001003176, ISSN: 0004583590, DOI: 10.1145/355324.355327 *

Also Published As

Publication number Publication date
CN109074237B (zh) 2021-10-22
EP3441873A1 (en) 2019-02-13
US20200264837A1 (en) 2020-08-20
US10671340B2 (en) 2020-06-02
CN109074237B9 (zh) 2021-12-17
WO2017175432A1 (ja) 2017-10-12
US20190107993A1 (en) 2019-04-11
EP3441873A4 (en) 2019-03-20
CN109074237A (zh) 2018-12-21
US11016726B2 (en) 2021-05-25

Similar Documents

Publication Publication Date Title
JPWO2017175432A1 (ja) 情報処理装置、情報処理方法、およびプログラム
US11626127B2 (en) Systems and methods for processing audio based on changes in active speaker
US20220312128A1 (en) Hearing aid system with differential gain
JP6481210B2 (ja) 情報処理装置、制御方法、およびプログラム
JP6402718B2 (ja) 情報処理装置、制御方法およびプログラム
JP7167910B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20220232321A1 (en) Systems and methods for retroactive processing and transmission of words
JP6079566B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US11929087B2 (en) Systems and methods for selectively attenuating a voice
JPWO2015083411A1 (ja) 情報処理装置、情報処理方法、およびプログラム
CN109061903B (zh) 数据显示方法、装置、智能眼镜及存储介质
US20220284915A1 (en) Separation of signals based on direction of arrival
US20150124101A1 (en) Information processing apparatus, information processing method, and program
JP6891879B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US11875791B2 (en) Systems and methods for emphasizing a user&#39;s name
WO2019054086A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6256634B2 (ja) ウェアラブルデバイス、ウェアラブルデバイスの制御方法、及びプログラム
US20220417677A1 (en) Audio feedback for correcting sound degradation
US20230062598A1 (en) Adjusting an audio transmission when a user is being spoken to by another person
WO2022219405A1 (en) Integrated camera and hearing interface device
CN110709837A (zh) 信息处理装置、信息处理方法及程序
JP2018085733A (ja) 携帯装置、携帯装置の制御方法、及びプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190208

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190214

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190222

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190515

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191209

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211022

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220405