JP2019109780A - 情報提供装置、情報提供方法、および情報提供プログラム - Google Patents

情報提供装置、情報提供方法、および情報提供プログラム Download PDF

Info

Publication number
JP2019109780A
JP2019109780A JP2017243089A JP2017243089A JP2019109780A JP 2019109780 A JP2019109780 A JP 2019109780A JP 2017243089 A JP2017243089 A JP 2017243089A JP 2017243089 A JP2017243089 A JP 2017243089A JP 2019109780 A JP2019109780 A JP 2019109780A
Authority
JP
Japan
Prior art keywords
information
sound
user
information providing
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017243089A
Other languages
English (en)
Inventor
晃輔 渡辺
Kosuke Watanabe
晃輔 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017243089A priority Critical patent/JP2019109780A/ja
Publication of JP2019109780A publication Critical patent/JP2019109780A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

【課題】短時間でユーザに情報を伝達することができる情報提供装置、情報提供方法、および情報提供プログラムを提供すること。【解決手段】実施形態に係る情報提供装置は、受付部と、出力部とを備える。受付部は、ユーザから情報の提供要求を受け付ける。出力部は、受付部によって受け付けられる提供要求に対する応答として、それぞれがユーザへ通知する情報を音によって表現する複数の音響を重畳して出力させる。出力部は、ユーザへ提供する情報を音声言語によって表現する主音響と、ユーザへ提供する情報をユーザに連想させる副音響とを出力させる。【選択図】図1

Description

開示の実施形態は、情報提供装置、情報提供方法、および情報提供プログラムに関する。
近年、ユーザから音声による情報の提供要求を受け付けた場合に、ユーザが提供を望む情報を音声言語にしてユーザへ提供する装置がある。
例えば、特許文献1には、ユーザから「今日の天気教えて」という天気情報の提供要求を受け付けた場合に、通信ネットワークを介して天気情報を提供するサーバ装置から天気予報情報を取得し、天気予報情報を音声言語にしてユーザへ提供する装置が開示されている。
特開2017−107078号公報
しかしながら、ユーザが望む情報を音声言語だけでユーザへ提供する装置は、短時間でユーザへ情報を伝達することができない場合がある。
実施形態の一態様は、上記に鑑みてなされたものであって、短時間でユーザに情報を伝達することができる情報提供装置、情報提供方法、および情報提供プログラムを提供することを目的とする。
実施形態の一態様に係る情報提供装置は、受付部と、出力部とを備える。受付部は、ユーザから情報の提供要求を受け付ける。出力部は、前記受付部によって受け付けられる前記提供要求に対する応答として、それぞれがユーザへ通知する情報を音によって表現する複数の音響を重畳して出力させる。
実施形態の一態様によれば、短時間でユーザに情報を伝達することができるという効果を奏する。
図1は、実施形態に係る情報提供装置が行う情報提供方法の概要を示す説明図である。 図2は、実施形態に係る情報提供装置の構成の一例を示すブロック図である。 図3は、実施形態に係る情報提供装置の動作説明図である。 図4は、実施形態に係る情報提供装置の動作説明図である。 図5は、実施形態に係る情報提供装置の動作説明図である。 図6は、実施形態に係る情報提供装置の動作説明図である。 図7は、実施形態に係る情報提供装置の制御部が実行する処理の一例を示すフローチャートである。 図8は、実施形態に係る情報提供装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願に係る情報提供装置、情報提供方法、および情報提供プログラムを実施するための形態(以下、「実施形態」と記載する)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報提供装置、情報提供方法、および情報提供プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.情報提供方法の概要〕
まず、図1を参照し、実施形態に係る情報提供装置1が行う情報提供方法の概要について説明する。図1は、実施形態に係る情報提供装置1が行う情報提供方法の概要を示す説明図である。
実施形態に係る情報提供装置1は、例えば、住宅等で使用される所謂スマートスピーカであり、ユーザ10から音声による情報の提供要求を受け付けた場合に、ユーザ10が提供を望む情報を音声言語にしてユーザ10へ提供する装置である。
情報提供装置1は、AI(人工知能:Artificial Intelligence)アシスタント機能を備えており、通信ネットワークを介して様々な情報を配信する複数のサーバ装置と通信可能に接続される。以下では、通信ネットワークがインターネット100である場合を例に挙げて説明する。
情報提供装置1は、ユーザ10から情報の提供要求を受け付けると、ユーザ10が提供を望む情報をサーバ装置110から取得し、情報を音声言語に変換して読み上げることによってユーザ10へ提供する。
ここで、一般的なスマートスピーカは、ユーザが望む情報を音声言語だけでユーザへ提供するため、短時間でユーザへ情報を伝達することができない場合がある。例えば、一般的なスマートスピーカは、ユーザへ提供する情報量が多い場合、読み上げる音声言語が長文となり、短時間でユーザへ情報を伝達することができない。
そこで、実施形態に係る情報提供装置1は、後述する受付部61および出力部64(図2参照)を備える。受付部61は、ユーザ10から情報の提供要求を受け付ける。出力部64は、受付部61によって受け付けられる提供要求に対する応答として、それぞれがユーザ10へ通知する情報を音によって表現する複数の音響を重畳して出力させる。これにより、情報提供装置1は、短時間で同時により多くの情報をユーザへ伝達することができる。
例えば、図1の上図に示すように、情報提供装置1は、ユーザ10が「Listen!○○は?」という音声言語M1を発話すると、「Listen!」という起動単語を認識してAIアシスタント機能を起動し、「○○は?」という質問文を音声認識する。かかる場合、「○○は?」という質問文が情報の提供要求となる。
情報提供装置1は、かかる情報の提供要求を受け付けると、図1の下図に示すように、質問文に含まれる「○○」に関する情報をインターネット100上で開示しているサーバ装置110と通信し、「○○」に関する情報を取得して音声言語に変換する。
そして、情報提供装置1は、例えば、対話形式で「○○ですね。○○は、・・・です。」という音声言語M2を発話する。さらに、情報提供装置1は、音声言語M2に重畳させて音声言語M2とは異なる音響M3を出音させる。このとき、情報提供装置1は、音声言語M2の要旨をユーザ10が直感的に連想できるような効果音、環境音、または背景音楽等の音響M3を出音させる。
なお、情報提供装置1は、このとき、音声言語M2とは直接的に関連しないが、そのときにユーザ10へ伝える必要がある他の情報を音によって表現した別の音響を音声言語M2に重畳させて出音することもできる。なお、かかる情報提供装置1が行う動作の具体例については、図3〜図6を参照して後述する。
このように、情報提供装置1は、ユーザ10が起動単語および情報の提供要求を含む音声言語M1を発話した場合に、音声言語M2および音響M3というそれぞれがユーザ10へ通知する情報を音によって表現する2つの音響を重畳して出音させる。
これにより、情報提供装置1は、音声言語M2によって表現される情報と、音響M3によって表現される情報とを同時にユーザ10へ認識させることができるので、短時間でより多くの情報をユーザ10へ伝達することができる。
〔2.情報提供装置の構成〕
次に、図2を参照し、実施形態に係る情報提供装置1の構成の一例について説明する。図2は、実施形態に係る情報提供装置1の構成の一例を示すブロック図である。図2に示すように、情報提供装置1は、マイク2と、スピーカ3と、通信部4と、記憶部5と、制御部6とを有する。
(マイク)
マイク2は、ユーザ10が発話する音声言語を集音して制御部6へ入力する入力装置の一例である。なお、情報提供装置1は、他の入力装置として、例えば、ユーザ10による入力操作を受け付けるキーボード、タッチパネル、またはマウス等を備える構成であってもよい。
(スピーカ)
スピーカ3は、ユーザ10へ提供する情報を音によって表現した様々な音響を出力する出力装置の一例である。なお、情報提供装置1は、他の出力装置として、例えば、液晶ディスプレイ等の表示装置を備える構成であってもよい。
(通信部)
通信部4は、例えば、NIC(Network Interface Card)等によって実現される。通信部4は、例えば、インターネット100を介して有線又は無線によって、天気予報サーバ101、交通機関サーバ102、および通信販売サーバ103等といった様々なコンテンツやサービスを配信する装置と通信可能に接続される。
また、通信部4は、赤外線通信機能を備えており、情報提供装置1が使用される住宅に設置される家電製品104と通信可能に接続される。情報提供装置1は、通信部4を介して、家電製品104の状態を取得したり、家電製品104の電源をオンにしたり、オフにしたりすることも可能である。
(記憶部)
記憶部5は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。かかる記憶部5は、音声言語情報51、効果音情報52、環境音情報53、および背景音楽情報54等を記憶する。
(音声言語情報)
音声言語情報51は、辞書に収められているような、あらゆる語句のテキストと、その語句を読み上げる場合の音声とが対応付けられたデータベースである。制御部6は、かかる音声言語情報を使用することによって、音声からテキストへの変換や、テキストから音声への変換を行うことができる。
(効果音情報)
効果音情報52は、種々のシチュエーションやキーワードに対して、それぞれ固有の効果音が対応付けられて登録されたデータベースである。効果音は、例えば、チャイム、ベル、ブザー、およびアラーム等の電子音である。
ユーザ10は、例えば、情報提供装置1用のアプリケーションプログラムがインストールされたスマートフォン等の端末装置(図示略)を使用して、所望のシチュエーション、キーワード、および効果音を効果音情報52に登録することができる。
(環境音情報)
環境音情報53は、種々のシチュエーションやキーワードに対して、それぞれ固有の環境音が対応付けられて登録されたデータベースである。環境音は、様々なシチュエーションで生録音された音響であり、例えば、雨音、風音、屋外で遊ぶ子供の声、電車の走行音等の音響である。
かかる環境音情報53は、予め想定された複数のシチュエーションやキーワードに対して、一般的なユーザがそのシチュエーションやキーワードを連想する可能性が高い環境音が対応付けられて登録される。
なお、ユーザ10は、効果音と同様に、情報提供装置1用のアプリケーションプログラムがインストールされたスマートフォン等の端末装置(図示略)を使用して、所望のシチュエーション、キーワードおよび環境音を環境音情報53に登録することもできる。
(背景音楽情報)
背景音楽情報54は、種々のシチュエーションやキーワードに対して、それぞれ固有の楽曲が対応付けられて登録されたデータベースである。楽曲は、例えば、映画、ドラマ、およびアニメの主題歌、年代別のヒットソング、クラシック、ジャズ、およびロック等、あらゆるジャンルの音楽を含む。
かかる背景音楽情報54は、予め想定された複数のシチュエーションやキーワードに対して、一般的なユーザがそのシチュエーションやキーワードを連想する可能性が高い楽曲が対応付けられて登録される。
なお、ユーザ10は、効果音と同様に、情報提供装置1用のアプリケーションプログラムがインストールされたスマートフォン等の端末装置(図示略)を使用して、所望のシチュエーション、キーワードおよび楽曲を環境音情報53に登録することもできる。
(制御部)
制御部6は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、入出力ポートなどを有するマイクロコンピュータや各種の回路を含む。
制御部6は、CPUがROMに記憶された各種プログラム(実施形態に係る情報提供プログラムの一例に相当)を、RAMを作業領域として使用して実行することにより機能する複数の処理部を備える。具体的には、制御部6は、受付部61、音声認識部62、情報取得部63、および出力部64を備える。
なお、制御部6が備える複数の処理部は、それぞれ一部または全部がASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等のハードウェアで構成されてもよい。
受付部61、音声認識部62、情報取得部63、および出力部64は、それぞれ以下に説明する情報処理の作用を実現または実行する。なお、制御部6の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
(受付部)
受付部61は、ユーザ10から情報の提供要求を受け付ける処理部である。受付部61は、マイク2から、前述したように、例えば、「Listen!」という起動単語の音声が入力されると起動し、続けてマイク2から入力される音声言語を情報の提供要求として受け付け、受け付けた音声言語を音声認識部62へ出力する。
(音声認識部)
音声認識部62は、受付部61から入力される音声言語を音声認識する処理部である。音声認識部62は、例えば、受付部61から入力される音声言語を単語単位に分割し、音声言語情報51を使用して各単語をテキストへ変換する。そして、音声認識部62は、変換したテキストを繋ぎ合わせてテキストの文書を生成し、情報取得部63へ出力する。
(情報取得部)
情報取得部63は、音声認識部62から入力されるテキストの文書に基づいて、ユーザ10が提供を望む情報をインターネット100上に公開されている情報から検索して通信部4を介して取得する処理部である。
情報取得部63は、例えば、音声認識部62から入力されるテキストの文書から助詞や助動詞等の単独で文節を構成できない単語を排除し、名詞や動詞等の文書中で重要となる複数のキーワードを抽出する。
そして、情報取得部63は、例えば、インターネット100上で利用可能な検索エンジンを使用したキーワードのOR検索を行って、インターネット100上に公開されている様々なコンテンツの中からユーザ10が提供を望む情報のテキストを取得する。そして、情報取得部63は、取得したテキストを出力部64へ出力する。
(出力部)
出力部64は、受付部61によって受け付けられるユーザ10からの情報の提供要求に対する応答として、それぞれがユーザ10へ通知する情報を音によって表現する複数の音響を重畳してスピーカ3から出力させる処理部である。
出力部64は、情報取得部63から入力されるテキストを単語単位に分割し、音声言語情報51を使用して各単語のテキストを音声へ変換する。そして、出力部64は、変換した音声を繋ぎ合わせて音声言語の文書を生成し、音声言語の文書を主音響としてスピーカ3から出音させる。
また、出力部64は、情報取得部63から入力されるテキストからキーワードを抽出する。また、出力部64は、可能な場合は、抽出したキーワードからシチュエーションを推定する。
続いて、出力部64は、テキストから抽出したキーワードが対応付けられた音響、またはキーワードから推定できた場合には、推定したシチュエーションが対応付けられた音響を効果音情報52、環境音情報53、および背景音楽情報54から検索して選択する。
そして、出力部64は、ユーザ10へ提供する情報をユーザ10に連想させる副音響として、選択した効果音、環境音、または背景音楽の音響を上記した主音響に重畳させてスピーカ3から出音させる。これにより、情報提供装置1は、主音響と副音響とを同時にユーザ10へ聞かせることができる。
しかも、主音響は、ユーザ10が提供を望む情報を含む音声言語である。一方、副音響は、音声言語ではなく、ユーザ10へ提供する情報をユーザ10に連想させる効果音、環境音、または背景音楽等の音響である。このため、情報提供装置1は、主音響によって表現する情報と、副音響によって表現する情報との双方を、同時にユーザ10へ認識させることができる。
また、出力部64は、情報提供装置1の状況や家電製品104の状況が変化した場合、そのシチュエーションが対応付けられた音響を効果音情報52、環境音情報53、および背景音楽情報54から選択し、副音響として主音響と共に出音させることもできる。
これにより、情報提供装置1は、ユーザ10が提供を望む情報だけでなく、情報提供装置1の状況の変化や、家電製品104の状況の変化等といったユーザ10へ伝える必要がある情報まで同時にユーザ10へ伝達することができる。
〔3.情報提供装置の動作例〕
次に、図3〜図6を参照しながら、かかる情報提供装置1の具体的な動作例1〜4について説明する。図3〜図6は、実施形態に係る情報提供装置1の動作説明図である。
(動作例1)
図3の上図に示すように、情報提供装置1は、例えば、ユーザ10が「Listen!明日の天気は?」という音声言語M4を発話した場合、「Listen!」という起動単語を認識してAIアシスタント機能を起動する。その後、情報提供装置1は、「明日の天気は?」という質問文を情報の提供要求として受け付ける。
かかる場合、情報提供装置1は、図3の下図に示すように、天気予報情報をインターネット100上で配信している天気予報サーバ101から、ユーザ10の住宅がある□□地方の明日の天気予報情報を取得する。
そして、情報提供装置1は、例えば、明日の天気が雨の場合、「明日の□□地方の天気は、雨、・・・です。」という音声言語M5を主音響として出音する。さらに、情報提供装置1は、かかる主音響に重畳させる副音響として「ザーザーザーザー」という雨音の環境音M6を出音する。
このとき、情報提供装置1は、主音響および副音響の出音を同時に開始してもよいし、副音響の出音を開始した後に、副音響に重畳させて主音響を出音してもよい。これにより、情報提供装置1は、例えば、ユーザ10が急いでいる場合等に、音声言語M5で「雨」という音声を読み上げるよりも前に、雨音の環境音M6によって、ユーザ10へ明日の天気が雨であるという情報を短時間で伝達することができる。
このように、情報提供装置1は、天気の概要については副音響によって短時間でユーザ10へ伝達し、天気の詳細については主音響によって時間を掛けてユーザ10へ確実に伝達することができる。
なお、情報提供装置1は、例えば、明日の天気が晴れの場合、屋外で遊ぶ子供の声の環境音を副音響として出音することで、明日が晴れであることをユーザ10へ連想させることができる。
また、情報提供装置1は、予めユーザ10が曇りを連想する背景音楽を背景音楽情報54へ登録している場合、明日の天気が曇りであれば、その背景音楽を副音響として出音することで、明日が曇りであることをユーザ10へ連想させることができる。
(動作例2)
また、図4の上図に示すように、情報提供装置1は、例えば、ユーザ10が「Listen!電車は遅延している?」という音声言語M7を発話した場合、「Listen!」という起動単語を認識してAIアシスタント機能を起動する。その後、情報提供装置1は、「電車は遅延している?」という質問文を情報の提供要求として受け付ける。
かかる場合、情報提供装置1は、図4の下図に示すように、電車の運行情報をインターネット100上で配信している交通機関サーバ102から、ユーザ10が利用する最寄駅に停車する電車の運行情報を取得する。
そして、情報提供装置1は、例えば、電車の遅延時間が30分であった場合、「10:00現在××線の電車は、30分遅れで運行中です。」という音声言語M8を主音響として出音する。さらに、情報提供装置1は、かかる主音響に重畳させる副音響として「ガタン!、、、ゴトン!」という電車が徐行運転している走行音の環境音M9を出音する。
このとき、情報提供装置1は、主音響および副音響の出音を同時に開始してもよいし、副音響の出音を開始した後に、副音響に重畳させて主音響を出音してもよい。これにより、情報提供装置1は、「30分遅れ」という音声を読み上げるよりも前に、電車が徐行運転している走行音の環境音M9によって、ユーザ10へ電車が遅延しているという情報を短時間で伝達することができる。
このように、情報提供装置1は、電車の遅延状況の概要については副音響によって短時間でユーザ10へ伝達し、電車の遅延状況の詳細については主音響によって時間を掛けてユーザ10へ確実に伝達することができる。
なお、情報提供装置1は、例えば、電車の遅延が解消している場合、電車が通常の運行速度で走行している走行音の環境音を副音響として出音することで、電車の遅延が解消していることをユーザ10へ連想させることができる。
(動作例3)
また、図5の上図に示すように、情報提供装置1は、例えば、ユーザ10が「Listen!注文した△△、いつ届く?」という音声言語M10を発話した場合、「Listen!」という起動単語を認識してAIアシスタント機能を起動する。その後、情報提供装置1は、「注文した△△、いつ届く?」という質問文を情報の提供要求として受け付ける。
かかる場合、情報提供装置1は、図5の下図に示すように、商品の配送情報をインターネット100上で提供している通信販売サーバ103から、ユーザ10が注文した商品の配送情報を取得する。
そして、情報提供装置1は、例えば、3日後の12月23日に配達予定の場合、「△△のお届け予定日は、12月23日です。」という音声言語M11を主音響として出音する。さらに、情報提供装置1は、例えば、ユーザ10が商品配達までの日数を効果音の出音回数とするように登録している場合、上記主音響に重畳させる副音響として「♪♪♪」という単音の音を3回鳴らす効果音M12を出音する。
このとき、情報提供装置1は、主音響および副音響の出音を同時に開始してもよいし、副音響の出音を開始した後に、副音響に重畳させて主音響を出音してもよい。これにより、情報提供装置1は、商品が3日後に届く場合に、「12月23日です。」という音声を読み上げるよりも前に、3回出音される単音の効果音M12によって、3日後に商品が配達されるという情報を短時間で伝達することができる。
このように、情報提供装置1は、商品の配送情報の概要については副音響によって短時間でユーザ10へ伝達し、商品の配送情報の詳細については主音響によって時間を掛けてユーザ10へ確実に伝達することができる。
(動作例4)
なお、動作例1〜3では、情報提供装置1が主音響によってユーザ10へ伝達する情報に関連する情報を音によって表現する副音響を主音響に重畳させて出音する場合について説明したが、これは一例である。情報提供装置1は、主音響によってユーザ10へ伝達する情報に関連しない情報を音によって表現する副音響を主音響に重畳させて出音することもできる。
例えば、図6の上図に示すように、情報提供装置1は、ユーザ10が「Listen!映画◇◇の主題歌が聴きたい!」という音声言語M13を発話した場合、「Listen!」という起動単語を認識してAIアシスタント機能を起動する。その後、情報提供装置1は、「映画◇◇の主題歌が聴きたい!」という要望文を情報の提供要求として受け付ける。
かかる場合、情報提供装置1は、図6の下図に示すように、「♪映画◇◇の主題歌♪〜〜」の楽曲M14を背景音楽情報54から取得し、主音響として出音する。このとき、情報提供装置1は、情報提供装置1の状況や家電製品104の状況が変化し、その旨をユーザ10へ通知する必要がある場合には、その旨を示す情報を音によって表現した副音響を主音響に重畳させて出音することができる。
例えば、予めユーザ10が情報提供装置1のバッテリ残量不足というシチュエーションに対して、所定の効果音を対応付けて効果音情報52に登録していたとする。かかる場合、情報提供装置1は、楽曲M14の出音中に、情報提供装置1のバッテリの残量が30%まで減少すると、その旨を示す「ピー!ピー!」という警告音M15を副音響として主音響に重畳させて出音する。
これにより、情報提供装置1は、ユーザ10から提供要求された情報と、ユーザ10から提供要求された情報以外でユーザ10へ通知すべき情報とを同時にユーザ10へ伝達することができる。
また、情報提供装置1は、上記のように、ユーザ10からの提供要求に対する応答として、主音響を出音中に、提供要求された情報以外のユーザ10へ通知すべき情報を副音響によって通知する。これにより、情報提供装置1は、提供要求された情報以外のユーザ10へ通知すべき情報をユーザ10に違和感を与えることなく通知することができる。
具体的には、例えば、情報提供装置1は、ユーザ10が起動単語を発していない場合、つまり、ユーザ10が情報の提供を望んでいない場合に、ユーザ10へ通知すべき情報に対応する音響を出音すると、ユーザ10を驚かせたり違和感を与えたりすることがある。
そこで、情報提供装置1は、例えば、バッテリの残量が30%まで減少しても、ユーザ10から情報の提供要求を受け付けるまで、つまり、起動単語を認識してスリープ状態から起動するまでは、バッテリの残量を通知しない。
その後、情報提供装置1は、例えば、ユーザ10から情報の提供要求を受け付けて起動し、主音響を出音中に、副音響としてバッテリの残量に関する警告音M15を出音させる。これにより、情報提供装置1は、提供要求された情報以外のユーザ10へ通知すべき情報をユーザ10に違和感を与えることなく通知することができる。
なお、情報提供装置1が提供要求された情報以外でユーザ10へ通知する情報は、バッテリの残量に関する情報に限定されるものではない。情報提供装置1は、提供要求された情報以外に、他の出力装置(例えば、テレビモニタ)による情報の出力準備ができたことを示す情報や、Wi−Fi(登録商標)に接続できたことを示す情報等、ユーザ10へ通知すべき任意の情報を副音響によって通知することができる。
〔4.情報提供装置の処理〕
次に、図7を参照し、実施形態に係る情報提供装置1の制御部6が実行する処理の一例について説明する。図7は、実施形態に係る情報提供装置1の制御部6が実行する処理の一例を示すフローチャートである。
図7に示すように、制御部6は、まず、起動単語を認識したか否かを判定し(ステップS101)、認識しない場合(ステップS101,No)、起動単語を認識するまで、ステップS101の判定を繰り返す。また、制御部6は、起動単語を認識したと判定した場合(ステップS101,Yes)、情報の提供要求を受け付けたか否かを判定する(ステップS102)。
そして、制御部6は、情報の提供要求を受け付けていないと判定した場合(ステップS102,No)、受け付けるまでステップS102の判定処理を繰り返す。また、制御部6は、情報の提供要求を受け付けたと判定した場合(ステップS102,Yes)、受け付けた情報の提供要求を音声認識する(ステップS103)。
続いて、制御部6は、提供要求された情報を取得し(ステップS104)、取得した情報に基づいて主音響を生成する(ステップS105)。その後、制御部6は、提供要求された情報に関連する副音響を選択する(ステップS106)。
このとき、制御部6は、ユーザ10へ通知すべき情報がある場合には、通知すべき情報が対応付けられた副音響をさらに選択する。そして、制御部6は、主音響および副音響を重畳して出力させ(ステップS107)、処理を終了する。その後、制御部6は、再度、ステップS101から処理を開始する。
〔5.変形例〕
上述した実施形態に係る情報提供装置は、上記実施形態以外にも種々の異なる形態にて実施されてよい。上述した実施形態では、情報提供装置がスマートスピーカである場合を例に挙げて説明したが、実施形態に係る情報提供装置は、スマートスピーカに限定されるものではない。
実施形態に係る情報提供装置は、図2に示す構成要素と同様の機能を備える装置であれば、スマートフォン、タブレット型端末、PDA(Personal Digital Assistant)等の端末装置であってもよい。
これにより、情報提供装置は、主音響および副音響に加えて、端末装置の表示部に情報を表示させたり、端末装置が備えるバイブレーション機能を利用して情報を提供したりすることによって、さらに多くの情報を同時にユーザへ伝達することができる。
また、上述した実施形態では、情報提供装置がマイクによってユーザから情報の提供要求を受け付ける場合について説明したが、これは一例である。実施形態に係る情報提供装置は、スピーカによる情報の出力が可能であれば、情報の提供要求については、キーボード、マウス、タッチパネルの操作によって受け付ける構成であってもよい。これにより、情報提供装置は、発声が困難なユーザであっても、情報の提供要求を受け付けることができ、提供要求された情報を短時間でそのユーザへ伝達することができる。
〔6.効果〕
上述したように、実施形態に係る情報提供装置1は、受付部61と、出力部64とを備える。受付部61は、ユーザ10から情報の提供要求を受け付ける。出力部64は、受付部61によって受け付けられる提供要求に対する応答として、それぞれがユーザ10へ通知する情報を音によって表現する複数の音響を重畳して出力させる。その結果、情報提供装置1は、短時間でユーザ10に情報を伝達することができる。
また、出力部64は、ユーザ10へ提供する情報を音声言語によって表現する主音響と、ユーザ10へ提供する情報をユーザ10に連想させる副音響とを出力させる。これにより、情報提供装置1は、例えば、提供要求された情報の概要については副音響によって短時間でユーザ10へ伝達し、提供要求された情報の詳細については主音響によって時間を掛けてユーザ10へ確実に伝達することができる。
また、出力部64は、副音響として、効果音、生録音された環境音、および背景音楽のうち、少なくともいずれか一つを出力させる。これにより、情報提供装置1は、副音響によって表現する情報を直感的にユーザ10に連想させることができる。
また、情報提供装置1が副音響によってユーザ10に連想させる情報は、主音響によって表現される情報に関連する情報である。これにより、情報提供装置1は、提供要求された情報を主音響および副音響の双方によって迅速、且つ確実に伝達することができる。
また、情報提供装置1が副音響によってユーザ10に連想させる情報は、主音響によって表現される情報に関連しない情報であってもよい。これにより、情報提供装置1は、短時間により多くの情報をユーザ10へ伝達することができる。
〔7.ハードウェア構成〕
また、上述してきた実施形態に係る情報提供装置1は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、実施形態に係る情報提供装置1の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、インターネット100等の通信ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを通信ネットワークNを介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、スピーカ3(図2参照)、ディスプレイ、プリンタ等の出力装置、マイク2(図2参照)、キーボード、マウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る情報提供装置1として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部6の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信ネットワークNを介してこれらのプログラムを取得してもよい。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔8.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、受付部61、音声認識部62、情報取得部63、および出力部64を情報提供装置1の外部装置としてネットワーク経由で接続するようにしてもよい。また、受付部61、音声認識部62、情報取得部63、および出力部64を別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記の情報提供装置1の機能を実現するようにしてもよい。
すなわち、情報提供装置1は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、受付部61は、受付手段や受付回路に読み替えることができる。
1 情報提供装置
2 マイク
3 スピーカ
4 通信部
5 記憶部
6 制御部
10 ユーザ
51 音声言語情報
52 効果音情報
53 環境音情報
54 背景音楽情報
61 受付部
62 音声認識部
63 情報取得部
64 出力部
100 インターネット
101 天気予報サーバ
102 交通機関サーバ
103 通信販売サーバ
104 家電製品
110 サーバ装置

Claims (9)

  1. ユーザから情報の提供要求を受け付ける受付部と、
    前記受付部によって受け付けられる前記提供要求に対する応答として、それぞれがユーザへ通知する情報を音によって表現する複数の音響を重畳して出力させる出力部と
    を備えることを特徴とする情報提供装置。
  2. 前記出力部は、
    ユーザへ提供する情報を音声言語によって表現する主音響と、ユーザへ提供する情報を前記ユーザに連想させる副音響とを出力させる
    ことを特徴とする請求項1に記載の情報提供装置。
  3. 前記出力部は、
    前記副音響として、効果音を出力させる
    ことを特徴とする請求項2に記載の情報提供装置。
  4. 前記出力部は、
    前記副音響として、生録音された環境音を出力させる
    ことを特徴とする請求項2または請求項3に記載の情報提供装置。
  5. 前記出力部は、
    前記副音響として、背景音楽を出力させる
    ことを特徴とする請求項2〜4のいずれか一つに記載の情報提供装置。
  6. 前記副音響によってユーザに連想させる情報は、
    前記主音響によって表現される情報に関連する情報である
    ことを特徴とする請求項2〜5のいずれか一つに記載の情報提供装置。
  7. 前記副音響によってユーザに連想させる情報は、
    前記主音響によって表現される情報に関連しない情報である
    ことを特徴とする請求項2〜5のいずれか一つに記載の情報提供装置。
  8. コンピュータが実行する情報提供方法であって、
    ユーザから情報の提供要求を受け付ける受付工程と、
    前記受付工程によって受け付けられる前記提供要求に対する応答として、それぞれがユーザへ通知する情報を音によって表現する複数の音響を重畳して出力させる出力工程と
    を含むことを特徴とする情報提供方法。
  9. ユーザから情報の提供要求を受け付ける受付手順と、
    前記受付手順によって受け付けられる前記提供要求に対する応答として、それぞれがユーザへ通知する情報を音によって表現する複数の音響を重畳して出力させる出力手順と
    をコンピュータに実行させることを特徴とする情報提供プログラム。
JP2017243089A 2017-12-19 2017-12-19 情報提供装置、情報提供方法、および情報提供プログラム Pending JP2019109780A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017243089A JP2019109780A (ja) 2017-12-19 2017-12-19 情報提供装置、情報提供方法、および情報提供プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017243089A JP2019109780A (ja) 2017-12-19 2017-12-19 情報提供装置、情報提供方法、および情報提供プログラム

Publications (1)

Publication Number Publication Date
JP2019109780A true JP2019109780A (ja) 2019-07-04

Family

ID=67179898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017243089A Pending JP2019109780A (ja) 2017-12-19 2017-12-19 情報提供装置、情報提供方法、および情報提供プログラム

Country Status (1)

Country Link
JP (1) JP2019109780A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021026124A (ja) * 2019-08-06 2021-02-22 本田技研工業株式会社 音声対話装置、音声対話方法、及びプログラム
KR20230055719A (ko) * 2021-10-19 2023-04-26 주식회사 카카오엔터프라이즈 응답 목소리가 가변되는 음성 인식 장치, 음성 인식 시스템, 음성 인식 프로그램 및 그것의 제어 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001043126A (ja) * 1999-07-27 2001-02-16 Tadamitsu Ryu ロボットシステム
JP2002318593A (ja) * 2001-04-20 2002-10-31 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
WO2015186445A1 (ja) * 2014-06-03 2015-12-10 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001043126A (ja) * 1999-07-27 2001-02-16 Tadamitsu Ryu ロボットシステム
JP2002318593A (ja) * 2001-04-20 2002-10-31 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
WO2015186445A1 (ja) * 2014-06-03 2015-12-10 ソニー株式会社 情報処理装置、情報処理方法、及びプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
真貝 寿明: "未来をになうキミたちへの宿題だ!", 子供の科学 10月号, vol. 第77巻, JPN6018042421, 10 September 2014 (2014-09-10), JP, pages 12 - 21, ISSN: 0003908594 *
真貝 寿明: "未来をになうキミたちへの宿題だ!", 子供の科学 10月号, vol. 第77巻, JPN6019010692, 10 September 2014 (2014-09-10), pages 12 - 21, ISSN: 0004004808 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021026124A (ja) * 2019-08-06 2021-02-22 本田技研工業株式会社 音声対話装置、音声対話方法、及びプログラム
JP7217209B2 (ja) 2019-08-06 2023-02-02 本田技研工業株式会社 音声対話装置、音声対話方法、及びプログラム
KR20230055719A (ko) * 2021-10-19 2023-04-26 주식회사 카카오엔터프라이즈 응답 목소리가 가변되는 음성 인식 장치, 음성 인식 시스템, 음성 인식 프로그램 및 그것의 제어 방법
KR102588017B1 (ko) * 2021-10-19 2023-10-11 주식회사 카카오엔터프라이즈 응답 목소리가 가변되는 음성 인식 장치, 음성 인식 시스템, 음성 인식 프로그램 및 그것의 제어 방법

Similar Documents

Publication Publication Date Title
US11887590B2 (en) Voice enablement and disablement of speech processing functionality
US11520471B1 (en) Systems and methods for identifying a set of characters in a media file
US10733983B2 (en) Parameter collection and automatic dialog generation in dialog systems
US11688402B2 (en) Dialog management with multiple modalities
KR102309540B1 (ko) 사용자의 입력 입력에 기초하여 타겟 디바이스를 결정하고, 타겟 디바이스를 제어하는 서버 및 그 동작 방법
US20190034542A1 (en) Intelligent agent system and method of accessing and delivering digital files
CN109346076A (zh) 语音交互、语音处理方法、装置和系统
JP7230806B2 (ja) 情報処理装置、及び情報処理方法
KR20150013631A (ko) 제3자 서비스를 디지털 어시스턴트와 통합하기 위한 시스템 및 방법
KR20160100811A (ko) 정보 제공 방법 및 디바이스
JP6570226B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
JP7171911B2 (ja) ビジュアルコンテンツからのインタラクティブなオーディオトラックの生成
JP6310796B2 (ja) 制御装置、制御方法および制御プログラム
JP2019109780A (ja) 情報提供装置、情報提供方法、および情報提供プログラム
JP2019200598A (ja) サーバ
US10693944B1 (en) Media-player initialization optimization
US20230208791A1 (en) Contextual interstitials
JP6621593B2 (ja) 対話装置、対話システム、及び対話装置の制御方法
US11875786B2 (en) Natural language recognition assistant which handles information in data sessions
JP6898064B2 (ja) 対話決定システム、対話決定方法、対話決定プログラム、及び端末装置
KR20210017730A (ko) Tts 기능을 구비하는 매장 맞춤형 음악 제공 방법 및 서버
JP7230085B2 (ja) 音声を処理するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP6904428B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP6559290B1 (ja) 情報提供装置、情報提供方法、および情報提供プログラム
JP6998289B2 (ja) 抽出装置、学習装置、抽出方法、抽出プログラム、学習方法および学習プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180615

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20180615

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20180724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180919

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20181030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190111

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20190111

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190117

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20190122

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20190329

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20190402

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20200218

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20200317

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20200414

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20200414