JP2021009434A - ブラウザ装置、情報出力方法及び情報出力プログラム - Google Patents

ブラウザ装置、情報出力方法及び情報出力プログラム Download PDF

Info

Publication number
JP2021009434A
JP2021009434A JP2019121414A JP2019121414A JP2021009434A JP 2021009434 A JP2021009434 A JP 2021009434A JP 2019121414 A JP2019121414 A JP 2019121414A JP 2019121414 A JP2019121414 A JP 2019121414A JP 2021009434 A JP2021009434 A JP 2021009434A
Authority
JP
Japan
Prior art keywords
scenario
unit
user
external
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019121414A
Other languages
English (en)
Inventor
首藤 勝行
Katsuyuki Shudo
勝行 首藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2019121414A priority Critical patent/JP2021009434A/ja
Publication of JP2021009434A publication Critical patent/JP2021009434A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】動作の円滑化を図り、ユーザが心地よく使用可能なブラウザ装置、情報出力方法及び情報出力プログラムを提供する。【解決手段】ブラウザ装置は、ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶する記憶部と、記憶部とは異なる外部記憶部に記憶されるシナリオを外部シナリオとして取得する取得部と、質問項目を出力する出力部と、ユーザの感情情報を検出する感情認識部と、感情認識部の検出結果に基づいて、内部シナリオ及び外部シナリオのうち少なくとも一方のシナリオを選択し、選択したシナリオに基づいて複数の質問項目を出力部に出力させる制御部とを備える。【選択図】図2

Description

本発明は、ブラウザ装置、情報出力方法及び情報出力プログラムに関する。
インターネット等のネットワークに接続し、予め設定された複数の質問項目をユーザに対して予め設定された順序(シナリオ)で出力するブラウザ装置が知られている(例えば、特許文献1参照)。
特開2005−37662号公報
上記のブラウザ装置では、一連のシナリオをダウンロードするか、またはダウンロードしておいたシナリオを利用して情報提供する。しかしながら、全てシナリオどおりに動作するため、ダウンロードする情報量が多く、また保存する場合に保存するデータ量が多くなり、ダウンロード時間が長くなるため、円滑な動作が困難となる。また、近年、ユーザとの間で人同士のコミュニケーションに近い形でのやり取りを行うことで、ユーザが心地よく使用可能なブラウザ装置が求められている。
本発明は、上記に鑑みてなされたものであり、動作の円滑化を図り、ユーザが心地よく使用可能なブラウザ装置、情報出力方法及び情報出力プログラムを提供することを目的とする。
本発明に係るブラウザ装置は、ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶する記憶部と、前記記憶部とは異なる外部記憶部に記憶されるシナリオを外部シナリオとして取得する取得部と、前記質問項目を出力する出力部と、ユーザの感情情報を検出する感情認識部と、前記感情認識部の検出結果に基づいて、前記内部シナリオ及び前記外部シナリオのうち少なくとも一方のシナリオを選択し、選択した前記シナリオに基づいて複数の前記質問項目を前記出力部に出力させる制御部とを備える。
本発明に係る情報出力方法は、ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶部に記憶することと、前記記憶部とは異なる外部記憶部に記憶されるシナリオを外部シナリオとして取得することと、ユーザの感情情報を検出することと、検出結果に基づいて、前記内部シナリオ及び前記外部シナリオのうち少なくとも一方のシナリオを選択し、選択した前記シナリオに基づいて複数の前記質問項目を出力部に出力させることとを含む。
本発明に係る情報出力プログラムは、ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶部に記憶する処理と、前記記憶部とは異なる外部記憶部に記憶されるシナリオを外部シナリオとして取得する処理と、ユーザの感情情報を検出する処理と、検出結果に基づいて、前記内部シナリオ及び前記外部シナリオのうち少なくとも一方のシナリオを選択し、選択した前記シナリオに基づいて複数の前記質問項目を出力部に出力させる処理とをコンピュータに実行させる。
本発明によれば、動作の円滑化を図り、ユーザが心地よく使用可能なブラウザ装置、情報出力方法及び情報出力プログラムを提供することができる。
図1は、本実施形態に係るブラウザ装置の一例を示す模式図である。 図2は、ブラウザ装置の制御部の一例を示す機能ブロック図である。 図3は、シナリオデータのデータ構成の一例を示す図である。 図4は、本実施形態に係るブラウザ装置の基本動作の一例を示すフローチャートである。 図5は、内部シナリオを用いて会話を行う処理の一例を示すフローチャートである。 図6は、図5に示すステップS204を実行する処理の一例を示すフローチャートである。 図7は、図4に示すステップS103の挨拶動作の一例を示すフローチャートである。 図8は、図4に示すステップS108の処理の一例を示すフローチャートである。 図9は、図8に示すステップS507の処理の一例を示すフローチャートである。 図10は、図8に示すステップS515の情報表示を実行する場合の動作の一例を示すフローチャートである。 図11は、シナリオをユーザに提示する処理の一例を示すフローチャートである。 図12は、ブラウザ装置の表示部に顔画像が表示される場合の例を示す図である。 図13は、ブラウザ装置の表示部に顔画像が表示される場合の例を示す図である。 図14は、ブラウザ装置の一例を示す図である。
以下、本発明に係るブラウザ装置、情報出力方法及び情報出力プログラムの実施形態を図面に基づいて説明する。なお、この実施形態によりこの発明が限定されるものではない。また、下記実施形態における構成要素には、当業者が置換可能かつ容易なもの、あるいは実質的に同一のものが含まれる。
図1は、本実施形態に係るブラウザ装置100の一例を示す模式図である。図1に示すブラウザ装置100は、筐体10と、表示部20と、音声入力部30と、音声出力部40と、タッチパネル入力部50と、通信部60(通信部のうちの接続線)と、制御部70とを備える。ブラウザ装置100としては、例えばスマートフォン、タブレット型コンピュータ、ノート型コンピュータ、デスクトップ型コンピュータ等、各種の通信可能な電子機器が挙げられる。
筐体10は、表示部20、音声入力部30、音声出力部40、タッチパネル入力部50、通信部60(通信部のうちの接続線)及び制御部70の各部を保持する。表示部20は、画像、映像等の情報を表示可能であり、例えば液晶ディスプレイ等の表示パネルにより構成される。音声入力部30は、例えばマイク等から構成される。音声出力部40は、例えばスピーカ等から構成される。タッチパネル入力部50は、表示部20上に配置され、表示部20に表示された情報から選択したい場合に使用する。例えば、表示部に表示されたURLにおいて、ジャンプできる関連情報のホームページが複数ある場合に、候補を表示部20に表示し、表示部20上のタッチパネル入力部50をタッチすることにより選択することも可能である。通信部60は、ネットワークNWとの間で情報の送信及び受信を行う。ネットワークNWとしては、インターネット、イントラネット等の各種のネットワーク等が挙げられる。
図2は、ブラウザ装置100の制御部70の一例を示す機能ブロック図である。制御部70は、CPU、ROM、RAM等を用いて構成され、ブラウザ装置100の全体の制御を行う。
制御部70は、演算処理部71と、表示制御部72と、音声認識部73と、音声合成部74と、感情認識部75と、シナリオ選択部76と、シナリオ発生部77と、タイミング発生部78と、タイマ79と、HTML解析部81と、記憶部83とを有する。
演算処理部71は、各種の演算を行う。演算処理部71は、後述するように、感情認識部75の検出結果に応じたURLを記憶部83から選択する選択部としての機能を有する。表示制御部72は、表示部20の表示動作を制御する。音声認識部73は、音声入力部30から入力された音声データを認識し、所定の言葉を判別する。音声認識部73は、例えば音声認識ソフトウェア、認識辞書データ等を有する。音声合成部74は、音声合成ソフトウェア、音声データ等を有する。音声合成部74は、例えば人間が話す声を合成可能である。
感情認識部75は、音声入力部30から入力された音声により、感情情報を検出する。感情認識部75は、音声入力部30に入力される音声信号から韻律的特徴量を検出し、検出された韻律的特徴量に基づいて、喜怒哀楽、驚き等の度合いを数値で出力することが可能である。本実施形態において、感情認識部75は、喜び、悲しみ、及び怒り等の感情を検出するものとする。感情認識部75において検出される感情情報は、例えば、感情の種類(喜び、悲しみ、怒り)と、感情の種類ごとの感情の度合いの値と、を含む。感情の具体的な検出方法については、公知の技術を適宜用いることができる。
シナリオ選択部76は、感情認識部75の検出結果に基づいて、内部シナリオ及び外部シナリオのうち少なくとも一方のシナリオを選択し、選択したシナリオに基づいて複数の質問項目を出力部に出力させる。本実施形態において、シナリオは、ユーザに対する複数の質問項目及び質問項目の質問順を設定したものである。内部シナリオは、記憶部83に記憶される所定のシナリオである。内部シナリオとしては、例えば挨拶、確認事項等のように使用頻度、汎用性が高く、簡単で基本的なシナリオ等が挙げられる。外部シナリオは、記憶部83とは異なる外部記憶部に記憶されるシナリオである。外部シナリオは、記憶部83に保存することができる。記憶部83に保存される内部シナリオ及び外部シナリオは、使用頻度、保存されてからの期間等に応じて、適宜更新されてもよい。本実施形態において、外部記憶部の一例として、情報提供サーバ90が挙げられる。シナリオ発生部77は、会話の内容を選択し、検索したい内容を調べるためのシナリオを発生させる。
シナリオ選択部76は、外部シナリオ選択フラグを設定する。外部シナリオ選択フラグは、シナリオ選択部76がシナリオを選択する際、外部シナリオを取得するか否かを判定するためのフラグである。外部シナリオ選択フラグが「1」の場合、シナリオ選択部76は、シナリオを選択する際に、外部シナリオを取得する。この場合、シナリオ選択部76は、内部シナリオ及び外部シナリオのうち少なくとも一方を選択可能となる。また、外部シナリオ選択フラグが「0」の場合、シナリオ選択部76は、シナリオを選択する際に、外部シナリオを取得しない。この場合、シナリオ選択部76は、内部シナリオのみを選択可能となる。このように、シナリオ選択部76が例えばユーザの感情の種類及び感情の度合い等に応じてシナリオを変更できるため、ブラウザ装置100は、ユーザが心地よく使用可能となっている。
タイミング発生部78は、例えばタイマ79を用いて時間を計測する。タイミング発生部78は、音声入力部30によるユーザの声の取得が無い時間をタイマ79に計測させ、所定時間以上取得が無い場合に、ユーザに対して音声入力部30に音声を入力するように案内する案内情報を表示部20及び音声出力部40の少なくとも一方に出力する。具体的には、タイミング発生部78は、ユーザからブラウザ装置100に対して話しかけが無い場合に、音声出力部40及び表示部20の少なくとも一方を介して、挨拶や話題を提供するためのタイミングを発生させる。
図3は、シナリオについてのデータ(シナリオデータ)のデータ構成の一例を示す図である。図3に示すシナリオデータDは、複数(N個)のシナリオステップを有する。シナリオステップは、例えばシナリオを構成する一の会話単位を示している。当該シナリオデータDにおいて、総ステップ数データは、シナリオステップの総数を示す。ステップ番号データは、シナリオステップのステップ番号を示す。従属シナリオフラグは、シナリオの終了後に他のシナリオが従属するか否かを示し、例えば他のシナリオが従属する場合には「1」、従属しない場合には「0」となる。従属シナリオは、例えば従属元のシナリオにおける選択結果に応じて、質問事項、質問順が変更される場合のシナリオを含む。従属シナリオを設定可能とすることにより、シナリオを柔軟に変更することが可能となる。
表示画像データは、表示部20に表示させる画像に関するデータである。表示画像データとしては、例えばユーザとの会話に対応した顔画像、顔動画等が挙げられる。表示画像データは、静止画及び動画等の画像データを含む。例えば記憶部83に予め保存された画像データを用いる場合、表示画像データは、当該記憶部83に保存された画像データのファイル名等のコードを含む。この場合、シナリオデータのデータ量を少なくすることができるため、処理時間の短縮化を図ることができる。
発語データは、音声出力部40から出力される会話等の内容を示すデータであり、例えば文字データである。内部シナリオフラグは、シナリオ選択部76により内部シナリオとして選択されるか否かを示し、内部シナリオとして選択される場合には「1」、選択されない場合には「0」となる。例えば定型の挨拶等、汎用性が高いシナリオについては、内部シナリオフラグ「1」とすることができる。内部シナリオのアドレスデータは、記憶部83に保存される内部シナリオのデータの番号(アドレス)を示す。また、外部シナリオを記憶部83に保存した場合、当該記憶部83に保存した外部シナリオにおいては、内部シナリオフラグは「0」である。一方、この内部シナリオフラグを「0」から「1」にすることにより、情報提供サーバ90から取得した外部シナリオを内部シナリオとして保存することができる。出現の可能性の高いシナリオを内部シナリオとして記憶部83に保存することにより、外部シナリオのダウンロードを少なくすることができ、通信時間の短縮化を図ることができる。このため、ブラウザ装置100の動作の円滑化を図ることができる。
選択データ受信フラグは、選択データを受信するか否かを示すデータである。選択データは、ユーザが回答した音声を認識してデータ化するための、語彙情報の文字データである。選択データ受信フラグが「0」の場合、選択データの受信は不要である。また、選択データ受信フラグは「1」の場合、選択データの受信が必要である。選択データ受信フラグが「1」となる場合の例としては、例えば直前の質問事項に対するユーザの回答内容により選択肢を変更する必要がある場合等が挙げられる。具体例については、図11の説明において後述する。また、選択データ総数は、選択データの総数を示す。以降、次のステップ番号について同様のデータ構造が繰り返される。
図4は、本実施形態に係るブラウザ装置100の基本動作の一例を示すフローチャートである。図4に示すように、ブラウザ装置100を起動した場合、シナリオ選択部76は、記憶部83に保存されている内部シナリオにより挨拶動作を行うように制御する(ステップS101)。この場合、表示制御部72は、例えば無表情の顔映像をモニタに出力する(ステップS102)。次に、音声認識部73は、音声入力部30において音声入力の有無をチェックする(ステップS103)。ステップS103の詳細については、後述する。音声認識部73は、例えば、「検索」という言葉を認識した場合、この「検索」の言葉に対応したコードを記憶部83に保存し、音声入力ありとする(ステップS104のYes)。ユーザの音声が入力された場合、感情認識部75では、音声入力に基づいて、ユーザの感情の種類及び感情の度合いを認識する。
一方、音声認識部73において音声入力が検出されない場合(ステップS104のNo)、ユーザがブラウザ装置100に対して要求をしていないことになる。この場合において、制御部70は、例えばブラウザ装置100とユーザとの親密性を増加させ、ユーザがより感情移入可能となるように、ユーザに話しかけるトリガを発生するタイミングをチェックする(ステップS105)。ステップS105において、制御部70は、例えば直近に会話が終了してからの経過時間をタイマ79で計測し、タイミング発生部78によりタイミングを発生する。シナリオ発生部77は、タイマ79での計測時間が所定値以上になった場合、会話のタイミングが到達したと判定し(ステップS106のYes)、記憶部83に保存されている会話の内部シナリオを開始する。また、タイマ79での計測時間が所定値未満の場合、ステップS102以降の処理を繰り返し行う。
ステップS104のYes又はステップS106のYesが選択された場合、シナリオ選択部76は、ユーザが検索したい内容のジャンルを調べるためのシナリオを設定する(ステップS107)。ステップS107において、シナリオ選択部76は、ユーザの要求に対応可能なシナリオが記憶部83に保存されているか否かを検出する。このとき、シナリオ選択部76は、感情認識部75の検出結果により、内部シナリオのみを使用するか、内部シナリオ及び外部シナリオを選択するかを選択する。この場合、シナリオ選択部76は、感情認識部75の検出結果に応じて、外部シナリオ選択フラグを設定する。シナリオ選択部76は、感情認識部75の検出結果においてユーザの感情の高ぶりが所定の基準よりも低い場合には、外部シナリオ選択フラグを「0」とし、内部シナリオのみを選択するようにする。また、シナリオ選択部76は、感情認識部75の検出結果においてユーザの感情の高ぶりが所定の基準よりも高い場合には、外部シナリオ選択フラグを「1」とし、内部シナリオ及び外部シナリオの少なくとも一方を選択可能とする。なお、感情認識部75の検出結果においてユーザの感情の高ぶりが所定の基準よりも高い場合、シナリオ選択部76は、少なくとも外部シナリオを選択するように設定することができる。なお、ユーザの感情の高ぶりが大きいと判定される場合、シナリオ選択部76は、ユーザを平静にさせるようなシナリオを表示部20に表示可能である。
ユーザの入手したい情報が、「旅行」、「商品購入」、「天気」、「路線検索」などである場合、シナリオ選択部76は、通信部60を介して、これらに対応したコードを情報提供サーバ90に送信する。情報提供サーバ90は、このコードに対応する外部シナリオのシナリオデータ、HTMLデータ、発語データなどをブラウザ装置100に送信する。ブラウザ装置100は、通信部60を介して、これらのデータを取得する。なお、情報提供サーバ90では、上記入手したい情報を取得した後のシナリオを発展させて、選択肢を増やしたシナリオをブラウザ装置100に送信してもよい。このようにして、外部記憶部である情報提供サーバ90から外部シナリオを取得することができる。
シナリオを設定した後、シナリオ選択部76は、設定したシナリオを実行する(ステップS108)。ステップS108の詳細については、後述する。
次に、シナリオ選択部76は、設定したシナリオデータに含まれる従属シナリオフラグが1であるか0であるかを検出する(ステップS109)。シナリオ選択部76は、従属シナリオフラグが「1」である場合、外部シナリオ選択フラグを確認し(ステップS113)、外部シナリオ選択フラグが1である場合(ステップS114のYes)、シナリオ選択部76は、通信部60を介して、情報提供サーバ90から外部シナリオを取得する(ステップS115)。また、外部シナリオ選択フラグが0である場合(ステップS114のNo)、外部シナリオを取得せずに、ステップS108以降の処理を繰り返し行う。
また、従属シナリオフラグが0である場合(ステップS109のNo)、内部シナリオを用いて全体を終了するか否かを確認する(ステップS110)。全体を終了しない場合(ステップS111のNo)、ステップS102以降の処理を繰り返し行う。全体を終了する場合、内部シナリオを用いて終了時の挨拶の会話等を行う(ステップS112)。例えば、表示制御部72は、頭を下げる顔映像を表示部20に表示し、音声出力部40から「さようなら」等の音声を出力する。
図5は、内部シナリオを用いて会話を行う処理の一例を示すフローチャートである。例えば、感情認識部75の認識結果においてユーザの感情の高ぶりが小さいと判定される場合、シナリオ選択部76は、内部シナリオを選択することができる。この場合、図5に示すように、シナリオ選択部76は、会話内容に応じた内部シナリオのシナリオデータを選択する(ステップS201)。シナリオデータのデータ構造は、例えば内部データフラグが1、選択データ受信フラグが0であり、内部シナリオを用いる設定となっている。
次に、シナリオデータの総ステップ数を設定する(S202)。次に、シナリオステップカウンタを1とする(ステップS203)。なお、シナリオステップカウンタは、例えば制御部70のRAM等に配置することができる。
次に、シナリオステップを実行する(ステップS204)。ステップS204の詳細については、後述する。シナリオステップを実行した後、シナリオステップカウンタのカウント数が所定の値に到達したか否かを検出し、到達していればシナリオステップの実行を終了し(ステップS205のYes)、ユーザに対する返答内容が確定となる(ステップS207)。また、到達していなければ、シナリオステップを引き続き行い(ステップS205のNo)、シナリオステップカウンタのカウント値を+1として(ステップS206)、ステップS204以降の処理を繰り返し行う。
図6は、図5に示すステップS204を実行する処理の一例を示すフローチャートである。図6に示すように、表示制御部72は、シナリオデータに基づいてブラウザ装置100の表示部20に画像を表示する(ステップS301)。この処理により、ブラウザ装置100において、会話の場合には表示部20に顔画像が表示される。また、ブラウザ装置100において、メニューから選択する場合にはメニュー画像となる。
次に、発語データによる発語を行う(ステップS302)。発語は、発語データ(文字データ)を音声合成することにより実現する。発語内容としては、例えばユーザに対する質問内容又は選択を促す内容等が挙げられる。次に、表示制御部72は、ユーザの声を聞くような表情の顔画像を表示する(ステップ303)。
また、音声入力部30は、ユーザの反応の音声を入力する(ステップS304)。音声認識部73は、音声入力部30から入力されたユーザの音声を認識する(ステップS305)。音声認識部73は、入力される語彙を判定し、記憶部83に記憶される語彙の集合の中から最も発音が近い選択データが選ばれる。これにより、音声認識の認識率を高めることができる。また、必要最低限の語彙情報で安定なシステムを構築することが可能である。このようにして、音声入力された内容を決定する(ステップS306)。
図7は、図4に示すステップS101の挨拶動作の一例を示すフローチャートである。図7に示すように、タイマ79により現在時刻を取得する(ステップS401)。次に、表示制御部72は、ユーザに対して話しかける(口が動いている)顔画像を表示部20に表示する(ステップS402)。次に、音声合成部74は、時刻に対応させて、例えば午前5〜午前10時なら「おはようございます」、午前10〜午後6時なら「こんにちは」、午後6〜午前5時なら「こんばんは」、等と音声合成により発話させる(ステップS403)。次に、制御部70は、タイマ79を用いてタイムアウトのタイミングとなる時刻を設定する(ステップS404)。次に、表示制御部72は、ユーザに対して話しかける顔映像から、ユーザの声を聞いている様子(口が動いていない)の顔映像を出力する(ステップS405)。そして、制御部70は、ユーザからの返答を待つために、音声入力をチェックする(ステップS406)。音声認識部73は、ユーザからの返事が検出されたか否かを判定し、返事が検出された場合(ステップS407のYes)、処理を終了する。また、返事が検出されない場合(ステップS407のNo)、設定されたタイムアウトのタイミングを検出し、所定時間経過していない場合(ステップS407のYes)、S406以降の動作を繰り返し行わせる。また、所定のタイムアウトのタイミングが到達した場合(ステップS408のYes)、待機状態を中断して処理を終了する。
図8は、図4に示すステップS108の処理の一例を示すフローチャートである。図8に示すように、まず、制御部70のRAM等に保存される外部シナリオ選択フラグを検出する(ステップS501)。外部シナリオ選択フラグが「1」である場合(ステップS501のYes)、制御部70は、通信部60を介して外部シナリオデータを情報提供サーバから取得する(ステップS502)。また、シナリオ選択部76は、外部シナリオデータ選択する(ステップS503)。外部シナリオ選択フラグが「0」である場合(ステップS502のNo)、シナリオ選択部76は、内部シナリオデータ選択する(ステップS504)。
次に、シナリオ選択部76は、図3に示すシナリオデータの総ステップ数を検出し、当該総ステップ数を設定する(ステップS505)。そして、制御部70は、シナリオステップカウンタを1にする(ステップS506)。このシナリオステップカウンタの値が、実行するシナリオステップ番号になる。次に、シナリオ選択部76は、シナリオステップのうちの最初のステップ1のシナリオデータを読み込み、シナリオステップを実行し、必要なデータ等を取得する(ステップS507)。ステップS507の詳細については、後述する。
次に、シナリオ選択部76は、シナリオステップカウンタのカウント値がシナリオデータの総ステップ数と一致するか否かを判定し、シナリオの終了を確認する(ステップS508)。シナリオを終了しない場合(ステップS508のNo)、シナリオステップカウンタのカウント値を+1として、ステップS507以降の処理を繰り返し行う。
シナリオを終了する場合(ステップS508のYes)、シナリオ選択部76は、記憶部83に記憶される内部シナリオにより、例えば「これで良いですか」等の内容確認をユーザに対して行う(ステップS510)。ステップS510において、音声合成部74は、上記質問事項を音声出力部40から出力させてもよい。表示制御部72は、上記質問事項に対応した顔画像を表示部20に表示させてもよい。
次に、音声認識部73によってユーザから例えば「いいえ」等の了承しない旨の返事が得られた場合(ステップS511のNo)、シナリオ選択部76は、内部シナリオを選択し、シナリオ全体の終了を確認する(ステップS512)。音声認識部73によってユーザから終了する旨の返答が得られた場合(ステップS513のYes)、処理を終了する。また、音声認識部73によってユーザから終了しない旨の返答が得られた場合(ステップS513のNo)、ステップS507以降の処理を繰り返し行う。
また、音声認識部73によってユーザから例えば「はい」等の了承する旨の返事が得られた場合(ステップS511のYes)、HTML解析部81は、当該情報を情報提供サーバ90から取得するためのURLを設定する(ステップS514)。また、表示制御部72は、設定されたURLの情報を表示する(ステップS515)。
図9に、図8に示すステップS507の処理の一例を示すフローチャートである。図9に示すように、まず、表示制御部72は、シナリオデータに基づいて、表示部20に画像を表示する(ステップS601)。表示制御部72は、当該画像として、例えば会話の場合には顔画像を表示し、メニュー選択の場合にはメニュー画像を表示する。顔画像は、口が動いて話しかけているようなものが望ましい。メニュー画像は、画像そのものでも良いし、HTMLで構成されても良い。
次に、シナリオ選択部76は、内部シナリオフラグが1であるか否かを判定する(ステップS602)。内部シナリオフラグが「0」の場合(ステップS602のYes)、内部シナリオフラグが「1」の場合、シナリオ選択部76は、シナリオデータにおけるステップ番号に基づいて、内部シナリオのシナリオステップを順次読み出す(ステップS603)。
また、内部シナリオフラグが「0」の場合(ステップS602のNo)、選択データ受信フラグが1であるか否かを判定する(ステップS604)。ステップS604において、選択データ受信フラグが1である、つまり、選択データの受信が必要であると判定された場合(ステップS604のYes)、情報提供サーバ90から選択データを受信する(ステップS605)。選択データ受信フラグが0である場合、ステップS605を飛ばしてステップS606以降の処理を行う。なお、選択データ受信フラグが0となる場合として、例えばシナリオ中で選択肢変更の必要が無く、予め全ての選択データを受信可能な場合等が挙げられる。
次に、音声合成部74は、発語データによる発語を行う(ステップS606)。ステップS606の発語は、発語データ(文字データ)を音声合成することにより実現する。これは、質問や選択促しなどを行う。次に、表示制御部72は、ユーザの声を聞くような表情の顔画像を表示部20に表示する(ステップS607)。
次に、音声入力部30は、ユーザの返答による音声の入力を受け付ける(ステップS608)。入力された音声は、音声認識部73により認識され(ステップS609)、認識結果に基づいて選択データが生成される。これにより、音声認識の認識率を高めることができる。また、必要最低限の語彙情報で安定なシステムを構築することが可能である。
次に、シナリオ選択部76は、選ばれた選択データをコード化する(ステップS610)。例えば、シナリオ選択部76は、シナリオデータの選択データ番号を割り付ければよい。次に、このコードをサーバに送り返す(ステップS611)。これで、選択が完了する。
なお、ステップS611において、情報提供サーバ90に送り返す情報が時間等の数値である場合には、数値を情報提供サーバ90に送信すればよいので、内部の語彙情報で済み、選択データは不要となる。また、情報提供サーバ90には数字列を送信すればよい。また、メニュー画面による選択の場合には、メニュー画面を表示した後、メニューの選択を促す音声を合成し、反応語を認識して、情報提供サーバ90に送信してもよい。
図10は、図8に示すステップS515の情報表示を実行する場合の動作の一例を示すフローチャートである。情報表示を実行する場合において、HTML解析部81は、ネットワークNWよりハイパーテキストを取得し、記憶部83に蓄積する(ステップS701)。次に、HTML解析部81は、蓄積したハイパーテキストのHTMLを解析する(ステップS702)。音声合成部74及び表示制御部72は、解析結果に従って、文字、画像、映像、音声などを出力する(ステップS703)。
図11は、シナリオをユーザに提示する処理の一例を示すフローチャートである。図11に示す例は、ユーザが天気予報を調べる場合の、ユーザに対する質問事項及び質問順示すシナリオである。当該シナリオにおいて、シナリオステップの総ステップ数は5である。
まず、表示制御部72は、天気予報を調べたい場所を特定するため、対象となる地方の入力を促すための表示を行う(ステップS801)。ステップS601において、表示制御部72は、記憶部83に保存された口が動く画像のコードを読み込んで対応している顔画像を表示させる。顔画像は、ユーザの言葉を聞いている様子の画像である。発語データは、例えば「どのちほうの、てんきですか」等である。この場合、シナリオデータに含まれる選択データとしては、例えば「ほっかいどう」、「とうほく」、「かんとう」、「ちゅうぶ」、「きんき」、「ちゅうごく」、「しこく」、「きゅうしゅう」となる。この場合の選択データの総数は、8である。ユーザは、この8つの選択データのうちどれかを答えることになる。したがって、音声認識部73は、この8つの選択データに対応する語彙を音声認識して、その地方に対応した選択データの番号を情報提供サーバ90に送信する。
ステップS801の後、表示制御部72は、回答のあった地方における具体的な県名の入力を促すための表示を行う(ステップS802)。シナリオデータにおいては、回答される地方に応じた選択データを読み込む必要があるので、選択データの受信フラグは1となっている。この場合、ステップ1で「かんとう”を選択したとすると、選択データは、「とうきょう」、「かながわ」、「さいたま」、「とちぎ」、「いばらき」、「ちば」、「ぐんま」となり、総選択データ数は7となる。同様に、表示制御部72は、回答のあった県における具体的な市町村名の選択を促す(ステップS803)。
次に、表示制御部72は、日にちの入力を促すための表示を行う(ステップS804)。この場合、年、月、日を順番に、ユーザに発語してもらう形となる。入力は数値となるため、選択データは不要で選択データ受信フラグは0である。装置内部の数字語彙データをもとに音声認識すればよい。ステップS804の後、表示制御部72は、対象となる日にちにおける具体的な時間の入力を促すための表示を行う(ステップS805)。ステップS805では、上記同様に、時間データを入力する。
図12及び図13は、ブラウザ装置100の表示部20に顔画像が表示される場合の例を示す図である。図12に示すように、表示部20に目と口のみが表示されてもよい。この場合、目と口を強調することができる。また、図13に示すように、表示部20に顔の輪郭を含めた状態で表示されてもよい。この場合、ユーザは、ブラウザ装置100との会話が実際の会話の状態に近い感覚となり、感情移入しやすい。なお、顔画像の表示態様は、上記の2種類に限定されず、他の態様であってもよい。表示制御部72が会話の動作においてこのような顔画像の表示態様を切り替えることにより、使いやすく、楽しいブラウザ装置100を実現できる。
図14は、ブラウザ装置100の一例を示す図である。図14に示すように、ブラウザ装置100において、表示部20には天気予報についてのホームページが表示され、音声出力部40から天気予報の情報が出力されている。この状態で、ユーザがタッチパネル入力部50を操作することで、異なるホームページにアクセスすることが可能となっている。
以上のように、本実施形態に係るブラウザ装置100は、ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶する記憶部83と、記憶部83とは異なる情報提供サーバ90に記憶されるシナリオを外部シナリオとして取得する通信部60と、質問項目を出力する表示部20及び音声出力部40と、ユーザの感情情報を検出する感情認識部75と、感情認識部75の検出結果に基づいて、内部シナリオ及び外部シナリオのうち少なくとも一方のシナリオを選択し、選択したシナリオに基づいて複数の質問項目を出力部に出力させる制御部70とを備える。
本実施形態に係る情報出力方法は、ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶部83に記憶することと、記憶部83とは異なる情報提供サーバ90に記憶されるシナリオを外部シナリオとして取得することと、ユーザの感情情報を検出することと、検出結果に基づいて、内部シナリオ及び外部シナリオのうち少なくとも一方のシナリオを選択し、選択したシナリオに基づいて複数の質問項目を表示部20及び音声出力部40に出力させることとを含む。
本実施形態に係る情報出力プログラムは、ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶部83に記憶する処理と、記憶部83とは異なる情報提供サーバ90に記憶されるシナリオを外部シナリオとして取得する処理と、ユーザの感情情報を検出する処理と、検出結果に基づいて、内部シナリオ及び外部シナリオのうち少なくとも一方のシナリオを選択し、選択したシナリオに基づいて複数の質問項目を表示部20及び音声出力部40に出力させる処理とをコンピュータに実行させる。
この構成によれば、記憶部に内部シナリオが予め保存されているため、シナリオのダウンロードを抑制することができる。また、シナリオ選択部76が、ユーザの感情情報に応じて、内部シナリオと外部シナリオとを変更することができるため、ユーザとの間で人同士のコミュニケーションに近い形でのやり取りを行うことが可能となる。以上の点により、動作の円滑化を図り、ユーザが心地よくブラウザ装置100を使用可能となる。また、シナリオを自律的に変更することにより、タイミングによって会話内容が変化するため、シナリオの画一化を抑制できる。
本実施形態に係るブラウザ装置100において、制御部70は、感情認識部75の検出結果においてユーザの感情の高ぶりが所定の基準よりも低い場合には、内部シナリオを選択する。これにより、ユーザの感情の高ぶりが低い場合には、内部シナリオを提示して通信時間を抑制し、動作の円滑化を図ることができる。
本実施形態に係るブラウザ装置100において、制御部70は、感情認識部75の検出結果においてユーザの感情の高ぶりが所定の基準よりも高い場合には、少なくとも外部シナリオを選択する。これにより、ユーザの感情の高ぶりが高い場合には、外部シナリオを提示してユーザに心地よくブラウザ装置100を使用させることができる。
本実施形態に係るブラウザ装置100において、制御部70は、情報提供サーバ90から取得した外部シナリオを記憶部83に記憶させることで内部シナリオとする。これにより、使用頻度の高い外部シナリオを内部シナリオとしてユーザに提示することが可能となるため、外部との通信を抑制し、動作の円滑化を図ることができる。
本発明の技術範囲は上記実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更を加えることができる。例えば、上記実施形態では、感情認識部75がユーザの音声情報に基づいてユーザの感情情報を認識する構成を例に挙げて説明したが、これに限定されない。例えば、ブラウザ装置100が不図示の撮像部を備え、撮像部によってユーザの顔の表情等を撮像し、撮像結果に基づいてユーザの感情情報を認識する構成であってもよい。
また、上記実施形態においては、外部記憶部として情報提供サーバ90を例に挙げて説明したが、これに限定されない。外部記憶部としては、例えばブラウザ装置100に対して着脱可能な記憶媒体等であってもよい。
D…シナリオデータ、NW…ネットワーク、10…筐体、20…表示部、30…音声入力部、40…音声出力部、50…タッチパネル入力部、60…通信部、70…制御部、71…演算処理部、72…表示制御部、73…音声認識部、74…音声合成部、75…感情認識部、76…シナリオ選択部、77…シナリオ発生部、78…タイミング発生部、79…タイマ、81…HTML解析部、83…記憶部、90…情報提供サーバ、100…ブラウザ装置

Claims (6)

  1. ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶する記憶部と、
    前記記憶部とは異なる外部記憶部に記憶されるシナリオを外部シナリオとして取得する取得部と、
    前記質問項目を出力する出力部と、
    ユーザの感情情報を検出する感情認識部と、
    前記感情認識部の検出結果に基づいて、前記内部シナリオ及び前記外部シナリオのうち少なくとも一方のシナリオを選択し、選択した前記シナリオに基づいて複数の前記質問項目を前記出力部に出力させる制御部と
    を備えるブラウザ装置。
  2. 前記制御部は、前記感情認識部の検出結果において前記ユーザの感情の高ぶりが所定の基準よりも低い場合には、前記内部シナリオを選択する
    請求項1に記載のブラウザ装置。
  3. 前記制御部は、前記感情認識部の検出結果において前記ユーザの感情の高ぶりが所定の基準よりも高い場合には、少なくとも前記外部シナリオを選択する
    請求項1又は請求項2に記載のブラウザ装置。
  4. 前記制御部は、前記外部記憶部から取得した前記外部シナリオを前記記憶部に記憶させることで前記内部シナリオとする
    請求項1から請求項3のいずれか一項に記載のブラウザ装置。
  5. ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶部に記憶することと、
    前記記憶部とは異なる外部記憶部に記憶されるシナリオを外部シナリオとして取得することと、
    ユーザの感情情報を検出することと、
    検出結果に基づいて、前記内部シナリオ及び前記外部シナリオのうち少なくとも一方のシナリオを選択し、選択した前記シナリオに基づいて複数の前記質問項目を出力部に出力させることと
    を含む情報出力方法。
  6. ユーザに対する複数の質問項目及び当該質問項目の質問順を設定したシナリオを内部シナリオとして記憶部に記憶する処理と、
    前記記憶部とは異なる外部記憶部に記憶されるシナリオを外部シナリオとして取得する処理と、
    ユーザの感情情報を検出する処理と、
    検出結果に基づいて、前記内部シナリオ及び前記外部シナリオのうち少なくとも一方のシナリオを選択し、選択した前記シナリオに基づいて複数の前記質問項目を出力部に出力させる処理と
    をコンピュータに実行させる情報出力プログラム。
JP2019121414A 2019-06-28 2019-06-28 ブラウザ装置、情報出力方法及び情報出力プログラム Pending JP2021009434A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019121414A JP2021009434A (ja) 2019-06-28 2019-06-28 ブラウザ装置、情報出力方法及び情報出力プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019121414A JP2021009434A (ja) 2019-06-28 2019-06-28 ブラウザ装置、情報出力方法及び情報出力プログラム

Publications (1)

Publication Number Publication Date
JP2021009434A true JP2021009434A (ja) 2021-01-28

Family

ID=74200075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019121414A Pending JP2021009434A (ja) 2019-06-28 2019-06-28 ブラウザ装置、情報出力方法及び情報出力プログラム

Country Status (1)

Country Link
JP (1) JP2021009434A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7205962B1 (ja) * 2022-10-14 2023-01-17 ユニロボット株式会社 自動対話のためのシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7205962B1 (ja) * 2022-10-14 2023-01-17 ユニロボット株式会社 自動対話のためのシステム

Similar Documents

Publication Publication Date Title
KR102374910B1 (ko) 음성 데이터 처리 방법 및 이를 지원하는 전자 장치
US9858924B2 (en) Voice processing apparatus and voice processing method
US9378730B1 (en) Evaluating pronouns in context
US20150331665A1 (en) Information provision method using voice recognition function and control method for device
US20200285444A1 (en) Providing a communications channel between instances of automated assistants
KR20190100512A (ko) 챗봇과 대화하기 위한 전자 장치 및 그의 동작 방법
JP6903380B2 (ja) 情報提示装置、情報提示システム、端末装置
CN111542814A (zh) 改变应答以提供表现丰富的自然语言对话的方法、计算机装置及计算机可读存储介质
US11881229B2 (en) Server for providing response message on basis of user's voice input and operating method thereof
JPWO2019031268A1 (ja) 情報処理装置、及び情報処理方法
US11922929B2 (en) Presentation support system
KR101376292B1 (ko) 통화 중 감정 분석 서비스 제공 방법 및 장치
JP6973380B2 (ja) 情報処理装置、および情報処理方法
CN111557001B (zh) 提供自然语言对话的方法、计算机装置及计算机可读存储介质
JP2016071192A (ja) 対話装置および対話方法
JP2021009434A (ja) ブラウザ装置、情報出力方法及び情報出力プログラム
KR102417029B1 (ko) 자연어 표현 생성 방법 및 전자 장치
JP6832503B2 (ja) 情報提示方法、情報提示プログラム及び情報提示システム
KR20210037857A (ko) 관계 설정을 이용한 실감형 인공지능기반 음성 비서시스템
KR102519635B1 (ko) 음성 명령을 처리하기 위한 전자 문서 표시 방법 및 그 전자 장치
JP4079275B2 (ja) 会話支援装置
US10600412B2 (en) Communication system
US20210326104A1 (en) Providing a communications channel between instances of automated assistants
JP7258686B2 (ja) 情報処理システム、情報処理方法、及びプログラム
JP2020119043A (ja) 音声翻訳システムおよび音声翻訳方法