JP2022139599A - 情報出力装置、情報出力方法、および、情報出力装置用プログラム - Google Patents
情報出力装置、情報出力方法、および、情報出力装置用プログラム Download PDFInfo
- Publication number
- JP2022139599A JP2022139599A JP2021040061A JP2021040061A JP2022139599A JP 2022139599 A JP2022139599 A JP 2022139599A JP 2021040061 A JP2021040061 A JP 2021040061A JP 2021040061 A JP2021040061 A JP 2021040061A JP 2022139599 A JP2022139599 A JP 2022139599A
- Authority
- JP
- Japan
- Prior art keywords
- desire
- information output
- conversation
- output device
- possibility
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 230000004044 response Effects 0.000 claims description 21
- 239000000284 extract Substances 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 235000021205 intention to eat Nutrition 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 235000003642 hunger Nutrition 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
【課題】会話の妨げをできるだけ防止する情報出力装置、情報出力方法及び情報出力装置用のプログラムを提供する。【解決手段】情報出力装置による方法であって、音声取得手段が会話の音声データを取得し、キーワード抽出手段が音声データからキーワードを抽出し(S1、S2)、無音声時間カウント手段が無音声時間をカウントし(S5、S6)、無音声時間が所定時間以上になった場合(S7YES)、出力手段がキーワードに関連する情報を出力する(S8)。【選択図】図6
Description
本願は、情報出力装置、情報出力方法、および、情報出力装置用のプログラムの技術分野に属する。
車両に搭載されたスマートスピーカを使用して、音声で指示がなされ、楽曲が再生されたり、質問に対する応答がされたりしている。下記特許文献1には、複数の音声アシスタントを利用可能に設けられた情報処理装置であって、マスター制御部を備え、マスター制御部は、ユーザの発話の内容に基づき、音声アシスタントそれぞれに対する発話指示を生成して音声アシスタントのサーバ装置へ送信する情報処理装置が開示されている。
しかしながら、上記特許文献1の技術では、会話の状況に関係なく、単に音声指示に対する回答を出力していたため、音声アシスタントのシステムにより会話の妨げになることもあった。
そこで本願は、上記の各問題点に鑑みて為されたもので、その課題の一例は、会話の妨げをできるだけ防止する情報出力装置等を提供することにある。
上記課題を解決するため、請求項1に記載の発明は、会話の音声データを取得する音声取得手段と、前記音声データからキーワードを抽出するキーワード抽出手段と、無音声時間をカウントする無音声時間カウント手段と、前記無音声時間が所定時間以上になった場合、前記キーワードに関連する情報を出力する出力手段と、を備えることを特徴とする。
また請求項5に記載の発明は、会話の音声データを取得する音声取得手段と、前記音声データに基づいて前記会話に話者の願望の可能性が含まれているか否かを判定する願望判定手段と、前記願望判定手段によって、前記願望の可能性が含まれていると判定された場合に、前記願望に対する回答が前記願望判定以後の前記会話に含まれていない時間をカウントする無回答時間カウント手段と、前記無回答時間が所定時間以上になった場合、前記願望に対応する情報を出力する出力手段と、を備えることを特徴とする。
また請求項6に記載の発明は、音声取得手段が、会話の音声データを取得する音声取得ステップと、キーワード抽出手段が、前記音声データからキーワードを抽出するキーワード抽出ステップと、無音声時間カウント手段が、無音声時間をカウントする無音声時間カウントステップと、出力手段が、前記無音声時間が所定時間以上になった場合、前記キーワードに関連する情報を出力する出力ステップと、を含むことを特徴とする。
また請求項7に記載の発明は、音声取得手段が、会話の音声データを取得する音声取得ステップと、願望判定手段が、前記音声データに基づいて前記会話に話者の願望の可能性が含まれているか否かを判定する願望判定ステップと、無回答時間カウント手段が、前記願望判定手段によって、前記願望の可能性が含まれていると判定された場合に、前記願望に対する回答が前記判定以後の前記会話に含まれていない時間をカウントする無回答時間カウントステップと、出力手段が、前記無回答時間が所定時間以上になった場合、前記願望に対応する情報を出力する出力ステップと、を含むことを特徴とする。
また請求項8に記載の発明は、コンピュータを、請求項1から請求項4のいずれか1項に記載の情報出力装置として機能させることを特徴とする。
本願を実施するための形態について、図1を用いて説明する。なお図1は、実施形態に係る情報出力装置の構成の一例を示すブロック図である。
図1に示すように、情報出力装置1は、音声取得手段1aと、キーワード抽出手段1bと、無音声時間カウント手段1cと、出力手段1dと、を備えて構成されている。
この構成において、音声取得手段1aは、会話の音声データを取得する。
キーワード抽出手段1bは、音声データからキーワードを抽出する。
無音声時間カウント手段1cは、無音声時間をカウントする。
出力手段1dは、無音声時間が所定時間以上になった場合、前記キーワードに関連する情報を出力する。
以上説明したように、実施形態に係る情報出力装置1によれば、会話の音声データを取得し、音声データからキーワードを抽出し、無音声時間をカウントして、無音声時間が所定時間以上になった場合に、キーワードに関連する情報を出力することにより、会話が止まってから直ぐにキーワードに関連する情報を出力せず所定時間以上の間隔を置いて情報出力装置1が出力するので、会話の妨げをできるだけ防止することができる。
[1.情報出力システム]
次に、上述した実施形態に対応する具体的な実施例について、図2-図6を用いて説明する。なお以下に説明する実施例は、情報出力装置10に対して、本願を適用した場合の実施例である。
(1.1 情報出力システムの構成および概要)
情報出力システムの構成および概要について、図2を用いて説明する。
情報出力システムの構成および概要について、図2を用いて説明する。
図2は、実施例に係る情報出力装置による情報出力システムの一例を示す模式図である。
図2に示すように、情報出力システムSは、車両Vhに搭載された情報出力装置10(情報出力装置1の一例)と、車両Vhの内部の搭乗者Psを撮影するカメラCmと、搭乗者Psの声を集音するマイクロフォンMcと、合成音声等を出力するスピーカSpと、を有する。
情報出力装置10は、例えば、ナビゲーション機能、オーディオ機能、AIアシスタント機能等を有するコンピュータである。
カメラCmは、CMOSイメージセンサ等の撮影素子を有する。カメラCmは、搭乗者Psの動画や静止画を撮影する。カメラCmは、車両Vh内の搭乗者Ps全員が映りやすい位置、例えば、車両Vhのリアビューミラー付近に設置される。なお、複数台のカメラCmが車両Vh内に設置されてもよい。また、情報出力システムSは、車両Vhの外を写すカメラを有してもよい。
マイクロフォンMcは、例えば、エレクトレットコンデンサマイクロフォン、MEMS(Micro-Electro-Mechanical System)マイクロフォンである。マイクロフォンMcは、車両Vh内の音を電気信号に変換する。マイクロフォンMcは、車両Vh内の搭乗者Psの会話を集音しやすい位置、例えば、車両Vhのリアビューミラー付近に設置される。
スピーカSpは、例えば、車両Vhのオーディオのスピーカである。スピーカSpは、音楽、ナビゲーションの音声誘導の合成音声等を出力する。スピーカSpは、車両Vhに追加で設置された機器のスピーカや、車両Vhのオーディオのスピーカ、利用者が車に持ち込んだ本システムと連携するように設定したハンディ機器のスピーカでもよい。
なお、車両Vhの他に、移動体の一例として、例えば、鉄道、船舶、航空機等が挙げられる。
(1.2 情報出力装置10の構成および機能)
次に、情報出力装置10の構成および機能について、図3および図4を用いて説明する。
次に、情報出力装置10の構成および機能について、図3および図4を用いて説明する。
図3は、実施例に係る情報出力装置の概略構成の一例を示すブロック図である。図4および図5は、情報出力装置のデータベースの一例を示す模式図である。
図3に示すように、情報出力装置10は、通信部11と、記憶部12と、表示部13と、操作部14と、インターフェース部15と、センサ部16と、制御部17と、を有する。
通信部11は、例えば、無線通信網等のネットワークに接続して、外部のサーバ装置との通信状態を制御するようになっている。情報出力装置10および外部のサーバ装置は、ネットワークを介して、例えば、通信プロトコルにTCP/IP等を用いて相互にデータの送受信が可能になっている。なお、ネットワークは、例えば、インターネット、専用通信回線(例えば、CATV(Community Antenna Television)回線)、移動体通信網(基地局等を含む)、およびゲートウェイ等により構築されている。なお、外部のサーバ装置は、例えば、検索サーバ装置、交通情報提供サーバ装置等である。
記憶部12は、例えば、ハードディスクドライブ、ソリッドステートドライブ等により構成されている。
記憶部12は、情報出力装置10を制御するための各種プログラム等を記憶する。各種プログラムは、オペレーティングシステム、ナビゲーションや音楽再生用のアプリケーションソフト、音声用のプログラム等が挙げられる。音声用のプログラムは、例えば、音響分析、音響モデル等により音声データをテキストデータに変換する音声認識用のプログラム、形態素分析、構文解析、意味解析等の自然言語処理のプログラム、テキストデータから合成音声を生成するプログラム等である。なお、各種プログラムは、例えば、ネットワークを介して取得されるようにしてもよいし、CD、DVD等の記録媒体に記録されてドライブ装置を介して読み込まれるようにしてもよい。
また、記憶部12には、情報出力用のデータベースが構築されている。例えば、図4に示すように、記憶部12には、話者の願望の可能性の度合いに関連付けて、キーワードを記憶したキーワード・データベースが構築されている。
ここで、話者の願望の可能性の度合いは、例えば、「疲れるなあ」、「疲れたなあ」、「疲れたー」の順で、または、「腹減るなあ」、「腹減ったなあ」、「腹減ったー」の順で、願望の可能性が高くなると設定される。「疲れるなあ」と独り言を発した場合、休憩したいという願望、意図の可能性がまだ低いと考えられる(願望の可能性度合い:1)。「疲れたなあ」と発した場合、疲労が貯まってきて、休憩したいという願望、意図の可能性が高くなってきたと考えられる(願望の可能性度合い:2)。「疲れたー」と発した場合、疲労感が強く、休憩したいという願望、意図の可能性が高いと考えられる(願望の可能性度合い:3)。「腹減るなあ」と発した場合、食事をしたいという願望、意図の可能性がまだ低いと考えられる(願望の可能性度合い:1)。「腹減ったなあ」と発した場合、空腹感が少し強くなり、食事したいという願望、意図の可能性が高くなってきたと考えられる(願望の可能性度合い:2)。「腹減ったー」と発した場合、空腹感が強く、食事したいという願望、意図の可能性が高いと考えられる(願望の可能性度合い:3)。このデータベースは、上述の「疲れたなあ」、「疲れたなあ」、「疲れたー」等の語尾「なあ」、「るなあ」、「たなあ」、「たー」等を分類したデータベースでもよい。また、記憶部12は、「もう1時間走っている」、「お昼どうしよう」等心理予測されるキーワードのデータベースを有してもよい。さらに、利用時間帯や普段の行動傾向に基づき、願望度合いが設定されてもよい。
また、記憶部12には、情報出力用のデータベースとして、図5に示すように、願望の可能性の度合いに関連付けて、所定時間を記憶した所定時間データベースが構築されている。願望の可能性の度合いが低い「1」から、高い「4」までに応じて、所定時間を、例えば、それぞれ、5秒、4秒、3.5秒、3秒と設定される。願望の可能性の度合いが低い場合は、情報出力システムSが、話者の願望を検出した際、直ぐに応答する必要がなく、願望に応答するまでの所定時間が長く設定される。願望の可能性の度合い高い場合は、願望に応答するまでの所定時間が短く設定される。
なお、記憶部12は、AIアシスタント機能を実現するデータベースを有してもよい。
表示部13は、情報出力装置10を操作する際に使用される、液晶表示素子またはEL素子等によって構成されたモニタ用のディスプレイである。表示部13には、ルート案内情報等が表示される。
操作部14は、例えば、機械式の電源ボタン、音量ボタン等の各種ボタンや、表示部14がタッチパネルのようなタッチスイッチ方式の表示パネルである。
インターフェース部15は、情報出力装置10と、カメラCm、マイクロフォンMcおよびスピーカSpと、を接続する。
センサ部16は、例えば、速度センサ、加速度センサ、ジャイロセンサ、GPSセンサ、方位センサ、操舵角センサ、座席センサ、温度センサ等の各種のセンサである。また、センサ部16は、時間をカウントするタイマー機能および時刻を計測する時計機能を有してもよい。
速度センサは、車両Vhの速度を検出する。加速度センサは、車両Vhの加速度を検出する。GPSセンサは、車両Vhの現在位置として、緯度・経度情報を取得する。ジャイロセンサは、車両Vhの車体の角加速度を検出する。方位センサは、車両Vhの方位を検出する。操舵角センサは、ステアリングの角度を検出する。座席センサは、車両Vhの搭乗者が座席に座っていることを検出する。温度センサは、車両Vh内の気温、外気の気温等を検出する。
制御部17は、例えば、CPU(Central Processing Unit)と、ROM(Read Only Memory)と、RAM(Random Access Memory)と、を有する。制御部17は、CPUが、ROMや、RAMや、記憶部12に記憶された各種プログラムを読み出して実行する。また、制御部17は、AI機能用のチップを有してもよい。
制御部17は、ルート計算を行ったり、音声認識を行ったり、AIアシスタント機能を実現したり、情報出力装置10を制御したりする。
[2.情報出力装置10の動作]
次に、実施例に係る情報出力装置10の動作について図6を用いて説明する。
次に、実施例に係る情報出力装置10の動作について図6を用いて説明する。
図6は、実施例に係る情報出力装置の動作の一例を示すフローチャートである。
図6に示すように、情報出力装置10は、音声データを取得して分析する(ステップS1)。具体的には、制御部17が、マイクロフォンMcから、車両Vh内の音の電気信号を受信し、A/D変換して音のデジタル信号にする。制御部17が、音のデジタル信号に含まれる音声データを、音声認識用のプログラムによりテキストデータに変換する。次に、制御部17が、自然言語処理のプログラムにより、テキストデータからワードを抽出する。なお、音声データの取得に関して、ユーザからの許諾後、本動作が起動する。
制御部17が、搭乗者Psが発する声の音声データを分析して、音声があるか否かを分析する。例えば、音声データの音量が、所定値以下の場合、制御部17が、音声がないと判定する。音はあるが、音声認識用のプログラムにより音声と認識できない音である場合、制御部17が、音声がないと判定する。
また、制御部17が、音声認識用のプログラムにより、音声データから、各人を識別して、搭乗者Psの数を推定する。なお、制御部17が、カメラCmの画像から、画像認識のプログラムにより人を抽出して、車両Vhに搭載している人の数をカウントしてもよい。また、制御部17が、車両Vhのセンサ部16の座席センサの情報から、搭乗者Psの数をカウントしてもよい。また、制御部17が、画像認識のプログラムにより、搭乗者Psの年齢、性別、個人を特定してもよい。制御部17が、個人を特定して、搭乗者Psのユーザ情報を取得してもよい。
なお、制御部17が、搭乗者Psの会話のテンポ、会話の盛り上がり度等の会話の状態を、音声データから分析してもよい。例えば、会話のテンポは、単位時間当たりに、発せられる単語の数から計算される。単位時間当たりに、発せられる単語の数が多いほど、会話のテンポが速いとする。また、会話の盛り上がり度は、例えば、音量、会話に参加している人数、音声データの周波数分析等により計算される。音量[dB]が大きいほど、会話が盛り上がっているとする。会話に参加している人数が多いほど、会話が盛り上がっているとする。周波数分析をして高周波成分のパワースペクトルが強いほど、会話が盛り上がっているとする。なお、音量で盛り上がりの度を判定する場合、高速道路を走行しているとき、路面が悪い道路を走行しているとき、雨の日に走行している等の外部からの音がうるさいとき、会話が盛り上がっているとする音量の閾値を高くしてもよい。また、制御部17が、カメラCmの画像から、各人の表情分析を分析して、会話の盛り上がり度等の会話の状態を判定してもよい。
また、制御部17が、抽出したワードの統計をとって、頻度が高い名詞、動詞等の言葉を、話題のキーワードとしてもよい。例えば、「アメリカ」というワードの頻度が高いならば、制御部17が、話題のキーワードとして「アメリカ」を抽出してもよい。なお、話題のキーワードの場合、願望の可能性度合いは、前回例示した「1」より低く設定されてもよい。
また、制御部17が、通信部11を介して取得した交通情報、センサ部16からの速度情報、位置情報等に基づき、車両Vhの走行状態を検出してもよい。
次に、情報出力装置10は、キーワードであるか否かを判定する(ステップS2)。具体的には、制御部17が、記憶部12のキーワード・データベースを参照して、抽出したワードが、キーワードであるか否かを判定する。制御部17が、例えば、テキスト化した文章の中に、キーワードである「疲れるなあ」、「疲れたなあ」、「疲れたー」等があるか否かを判定する。
抽出されたワードがキーワードでない場合(ステップS2;NO)、情報出力装置10は、ステップS1の処理に戻る。
抽出されたワードがキーワードである場合(ステップS2;YES)、情報出力装置10は、所定時間を設定する(ステップS3)。具体的には、制御部17が、記憶部12のキーワード・データベースおよび所定時間データベースを参照して、キーワードの願望の可能性度合いに基づき、所定時間を設定する。例えば、キーワードが「疲れるなあ」、「腹減るなあ」等の場合、願望の可能性度合いが2で、制御部17が、所定時間を4秒と設定する。キーワードが「疲れたなあ」、「腹減ったなあ」等の場合、願望の可能性度合いが3で、制御部17が、所定時間を3.5秒と設定する。キーワードが「疲れたー」、「腹減ったー」等の場合、願望の可能性度合いが4で、制御部17が、所定時間を3秒と設定する。
次に、情報出力装置10は、音声データを取得して分析する(ステップS4)。具体的には、制御部17が、ステップS1のように、音声データを取得して分析し、音声があるか否かを分析する。
次に、情報出力装置10は、無音声か否かを判定する(ステップS5)。具体的には、制御部17が、ステップS4の音声データの分析結果に基づき、音声があるか否かを判定する。
無音声でない場合(ステップS5;NO)、情報出力装置10は、ステップS1の処理に戻る。
無音声である場合(ステップS5;YES)、情報出力装置10は、時間をカウントする(ステップS6)。具体的には、制御部17が、無音声である時間の計測を始める。なお、制御部17が、時計機能を使用して、ステップS5で音声があると判定された時刻と、現在の時刻とを比較して、カウントされた時間としてもよい。
次に、情報出力装置10は、所定時間以上であるか否かを判定する(ステップS7)。具体的には、制御部17が、カウントされた時間が設定された所定時間以上であるか否かを判定する。
所定時間以上でない場合(ステップS7;NO)、情報出力装置10は、ステップS4の処理に戻る。
所定時間以上である場合(ステップS7;YES)、情報出力装置10は、キーワードに関連する情報を出力する(ステップS8)。具体的には、制御部17が、ステップS2で判定されたキーワード、または、キーワードを含む、話者が発した文章に基づき、AIアシスタント機能により、レスポンスするテキストデータ形式の文章を生成し、音声を合成して、スピーカSpから音声を出力させる。レスポンスする内容が楽曲の場合は、制御部17が、音楽データを取得して、楽曲を再生してスピーカSpから音楽を出力させる。
例えば、発せられたワードが「腹減るなあ」、「腹減ったなあ」、「腹減ったー」の場合、ナビゲーション機能で設定されているルート上にあるレストランが検索され、制御部17が検索結果に基づく特定のレストランでの食事を勧める文章を生成して、スピーカSpから音声で提案をする。発せられたワードが「疲れるなあ」、「疲れたなあ」、「疲れたー」の場合、ナビゲーション機能で設定されているルート上にあるパーキングエリア、喫茶店等が検索され、制御部17が検索結果に基づく特定のパーキングエリア、喫茶店等での休憩を勧める文章を生成して、スピーカSpから音声で提案をする。また、この場合、癒しの音楽、懐かしの音楽、元気が出る音楽、歌って楽しむ音楽等の音楽を流すように、制御部17が提案をスピーカSpから音声で提案したり、自動的に音楽を再生したりしてもよい。また、制御部17が遠隔の家族や友人と電話で話して和むように提案してもよい。また、話題のキーワードが特定の場所の名称の場合、場所の名称で検索し、検索結果として、場所の情報を提供する。
また、情報出力装置10は、キーワードに関連する情報として、提案の他に、追加の質問を生成して、出力をしてもよい。これにより、話者が発したキーワードに対する回答の内容の確度がより高まる。
なお、制御部17が、願望の可能性度合いに応じて、検索内容を変えてもよい。「腹減るなあ」の場合は、カフェ程度の提案、「腹減ったー」の場合は、本格的に食事ができるレストランの提案がされる。また、提案の代わりに、制御部17が、「なるほど~」、「ふ~ん」等の相づちの音声を出力してもよい。
制御部17が、キーワードに関連する情報を表示部13に出力してもよい。例えば、制御部17が、レスポンスするテキストデータ形式で表示させたり、関連した映像等を再生したりする。
また、外部サーバ装置において、検索またはAIアシスタント機能により、キーワードに関連する情報を求めてもよい。
なお、情報出力装置10は、搭乗者Psの会話の状態に応じて所定時間を設定してもよい。例えば、ステップS1において会話のテンポが速いと分析された場合、または、会話が盛り上がっていると分析された場合、ステップS3において、制御部17が、会話のリズムに合わせて所定時間を短くしてもよい。また、ステップS1において搭乗者の数が1人と分析された場合、ステップS3において、制御部17が、会話の相手が車両Vh内にいないので、所定時間を短くしてもよい。
また、情報出力装置10は、車両Vhの走行状態に応じて所定時間を設定してもよい。例えば、ステップS1において車両Vhの走行状態が渋滞中であると分析された場合、ステップS3において、制御部17が、所定時間を短くしてもよい。車両Vhの走行状態が渋滞中でない場合、制御部17が、所定時間を長くしてもよい。渋滞中は、イライラしやすいので、所定時間を短くして、情報出力装置10からのレスポンスを早くする。
以上説明したように、実施例に係る動作によれば、会話の音声データを取得し、音声データからキーワードを抽出し、無音声時間をカウントして、無音声時間が所定時間以上になった場合、キーワードに関連する情報を出力することにより、会話が止まってから直ぐにキーワードに関連する情報を出力せず、所定時間以上の間隔を置いて出力するので、会話の妨げをできるだけ防止することができる。会話の妨げをできるだけ防止することで、その場の空気を読んだような効果を実現できる。
また、話者の明確な指示になる前に、願望の可能性により回答をしているので、話者に先回りしてレスポンスができる、いわゆる気の利いたシステムを構築できる。
また、音声データから会話の状態を分析し、無音時間が、会話の状態に応じて設定された所定時間以上になったとき、キーワードに関連する情報を出力する場合、会話の状態に応じた長さに所定時間が設定されるので、より会話の妨げをできるだけ防止することができる。
また、音声データに基づいて会話に話者の願望の可能性度合いを判定し、無音時間が、話者の願望の可能性度合いに応じて設定された所定時間以上になったとき、キーワードに関連する情報を出力する場合、話者の願望の可能性度合いに応じた長さに所定時間が設定されるので、より会話の妨げをできるだけ防止することができる。
また、会話の話者が搭乗する車両Vh等の移動体の走行状態を検出し、無音時間が、走行状態に応じて設定された所定時間以上になったとき、キーワードに関連する情報を出力する場合、走行状態に応じた長さに所定時間が設定されるので、より会話の妨げをできるだけ防止することができる。
(変形例)
次に、情報出力装置10の動作の変形例について図7を用いて説明する。なお、前記実施例と同一または対応する部分には、同一の符号を用いて異なる構成および動作のみを説明する。
次に、情報出力装置10の動作の変形例について図7を用いて説明する。なお、前記実施例と同一または対応する部分には、同一の符号を用いて異なる構成および動作のみを説明する。
図7は、実施例に係る情報出力装置の動作の変形例を示すフローチャートである。
図7に示すように、情報出力装置10は、音声データを取得して分析する(ステップS11)。具体的には、ステップS1のように、制御部17が、マイクロフォンMcから車両Vh内の音の電気信号を受信し、A/D変換して音のデジタル信号にする。制御部17が、音のデジタル信号に含まれる音声データをテキストデータに変換し、自然言語処理等のAI機能により意味解釈して、会話に話者の願望の可能性が含まれている否かを分析する。
なお、制御部17が、音のデジタル信号から、搭乗者Psが発する声のイントネーション等を分析してもよい。また、制御部17が、自然言語処理等のAI機能により意味解釈して、話者である搭乗者Psの願望の可能性の程度を算出してもよい。
また、制御部17が、AI機能により、各搭乗者Psを識別して、搭乗者Psの数を推定したり、搭乗者Psの年齢、性別、個人を特定したりしてもよい。制御部17が、AI機能により、会話のテンポ、会話の盛り上がり度等の会話の状態を、音声データから分析してもよい。制御部17が、AI機能により意味解釈することにより、会話の話題を特定してもよい。
次に、情報出力装置10は、願望であるか否かを判定する(ステップS12)。具体的には、制御部17が、自然言語処理等のAI機能により意味解釈して、音声データに基づいて会話、または、会話の文章に、話者の願望の可能性が含まれているか否かを判定する。
願望でない場合(ステップS12;NO)、情報出力装置10は、ステップS11の処理に戻る。
願望である場合(ステップS12;YES)、情報出力装置10は、所定時間を設定する(ステップS13)。例えば、制御部17が、ステップS11で算出された、話者の願望の可能性の程度に応じて、ステップS3のように、所定時間を設定する。また、情報出力装置10は、会話の状態に応じて所定時間を設定してもよい。情報出力装置10は、車両Vhの走行状態に応じて所定時間を設定してもよい。
次に、情報出力装置10は、音声データを取得して分析する(ステップS14)。具体的には、制御部17が、ステップS11のように、音声データを取得し、自然言語処理等のAI機能により意味解釈して、会話に話者の願望の可能性に対する回答が含まれているか否かを分析する。
次に、情報出力装置10は、回答か否かを判定する(ステップS15)。具体的には、制御部17が、ステップS14の音声データの分析結果に基づき、会話に話者の願望の可能性に対する回答が含まれているか否かを判定する。
回答が含まれている場合(ステップS15;YES)、情報出力装置10は、ステップS11の処理に戻る。
回答が含まれていない場合(ステップS15;NO)、情報出力装置10は、時間をカウントする(ステップS16)。具体的には、制御部17が、願望に対する回答が、ステップS15の判定以後の会話に含まれていない時間(無回答時間)の計測を始める。なお、制御部17が、時計機能を使用して、ステップS15で願望の可能性があると判定された時刻と、現在の時刻とを比較して、カウントされた時間としてもよい。
次に、情報出力装置10は、回答が含まれていない時間が所定時間以上であるか否かを判定する(ステップS17)。具体的には、制御部17が、カウントされた時間が設定された所定時間以上であるか否かを判定する。
所定時間以上でない場合(ステップS17;NO)、情報出力装置10は、ステップS14の処理に戻る。
所定時間以上である場合(ステップS17;YES)、情報出力装置10は、ステップS8のように、話者の願望に対応する情報を出力する(ステップS18)。具体的には、制御部17が、ステップS12における願望を含む、話者が発した文章に基づき、AIアシスタント機能により、話者の願望に対応する情報としてレスポンスするテキストデータ形式の文章を生成し、音声を合成して、スピーカSpから音声を出力させる。レスポンスする内容が楽曲の場合は、制御部17が、音楽データを取得して、楽曲を再生してスピーカSpから音楽を出力させる。
例えば、話者が「腹減るなあ」、「腹減ったなあ」、「腹減ったー」等発して、願望の可能性があるとされた場合、ナビゲーション機能で設定されているルート近辺にあるレストランが検索され、制御部17が検索結果に基づく特定のレストランでの食事を勧める文章を生成して、スピーカSpから音声で提案をする。話者が「疲れるなあ」、「疲れたなあ」、「疲れたー」等発して、話者の願望の可能性があるとされた場合、ナビゲーション機能で設定されているルート近辺にあるパーキングエリア、喫茶店等や、再生する音楽が検索され、制御部17が検索結果に基づく特定のパーキングエリア、喫茶店等での休憩を勧める文章、または、再生する音楽を勧める文章を生成して、スピーカSpから音声で提案をする。話題として場所の名称の場合、場所の名称で検索し、検索結果として、場所の情報を提供する。
制御部17が、ステップS11で算出された、話者の願望の可能性の程度に応じて、願望に対応する情報を変えてもよい。例えば、「腹減るなあ」の場合は、カフェ程度の提案、「腹減ったー」の場合は、本格的に食事ができるレストランの提案がされる。
以上説明したように、変形例に係る動作によれば、会話の音声データを取得し、音声データに基づいて会話に話者の願望の可能性が含まれているか否かを判定し、願望の可能性が含まれていると判定された場合に、願望に対する回答が会話に含まれていない時間をカウントし、無回答時間が所定時間以上になった場合、願望に対応する情報を出力することにより、話者の願望が検出されてから直ちに願望に対応する情報を出力せず、会話の話者達の中で回答が無い時間が所定時間以上の間隔を置いて、願望に対応する情報を出力するので、会話の妨げをできるだけ防止することができる。
1、10・・・情報出力装置
1a・・・音声取得手段
1b・・・キーワード抽出手段
1c・・・無音声時間カウント手段
1d・・・出力手段
1a・・・音声取得手段
1b・・・キーワード抽出手段
1c・・・無音声時間カウント手段
1d・・・出力手段
Claims (8)
- 会話の音声データを取得する音声取得手段と、
前記音声データからキーワードを抽出するキーワード抽出手段と、
無音声時間をカウントする無音声時間カウント手段と、
前記無音声時間が所定時間以上になった場合、前記キーワードに関連する情報を出力する出力手段と、
を備えることを特徴とする情報出力装置。 - 請求項1に記載の情報出力装置において、
前記音声データから会話の状態を分析する会話状態分析手段を更に備え、
前記所定時間が、前記会話の状態に応じて設定されることを特徴とする情報出力装置。 - 請求項1または請求項2に記載の情報出力装置において、
前記音声データに基づいて前記会話に話者の願望の可能性度合いを判定する願望可能性度合判定手段を更に備え、
前記所定時間が、前記話者の願望の可能性度合いに応じて設定されることを特徴とする情報出力装置。 - 請求項1から請求項3のいずれか1項に記載の情報出力装置において、
前記会話の話者が搭乗する移動体の走行状態を検出する走行状態検出手段を更に備え、
前記所定時間が、前記走行状態に応じて設定されることを特徴とする情報出力装置。 - 会話の音声データを取得する音声取得手段と、
前記音声データに基づいて前記会話に話者の願望の可能性が含まれている否かを判定する願望判定手段と、
前記願望判定手段によって、前記願望の可能性が含まれていると判定された場合に、前記願望に対する回答が前記願望判定以後の前記会話に含まれていない時間をカウントする無回答時間カウント手段と、
前記無回答時間が所定時間以上になった場合、前記願望に対応する情報を出力する出力手段と、
を備えることを特徴とする情報出力装置。 - 音声取得手段が、会話の音声データを取得する音声取得ステップと、
キーワード抽出手段が、前記音声データからキーワードを抽出するキーワード抽出ステップと、
無音声時間カウント手段が、無音声時間をカウントする無音声時間カウントステップと、
出力手段が、前記無音声時間が所定時間以上になった場合、前記キーワードに関連する情報を出力する出力ステップと、
を含むことを特徴とする情報出力方法。 - 音声取得手段が、会話の音声データを取得する音声取得ステップと、
願望判定手段が、前記音声データに基づいて前記会話に話者の願望の可能性が含まれている否かを判定する願望判定ステップと、
無回答時間カウント手段が、前記願望判定手段によって、前記願望の可能性が含まれていると判定された場合に、前記願望に対する回答が前記判定以後の前記会話に含まれていない時間をカウントする無回答時間カウントステップと、
出力手段が、前記無回答時間が所定時間以上になった場合、前記願望に対応する情報を出力する出力ステップと、
を含むことを特徴とする情報出力方法。 - コンピュータを、請求項1から請求項5のいずれか1項に記載の情報出力装置として機能させることを特徴とする情報出力装置用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021040061A JP2022139599A (ja) | 2021-03-12 | 2021-03-12 | 情報出力装置、情報出力方法、および、情報出力装置用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021040061A JP2022139599A (ja) | 2021-03-12 | 2021-03-12 | 情報出力装置、情報出力方法、および、情報出力装置用プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022139599A true JP2022139599A (ja) | 2022-09-26 |
Family
ID=83400329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021040061A Pending JP2022139599A (ja) | 2021-03-12 | 2021-03-12 | 情報出力装置、情報出力方法、および、情報出力装置用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022139599A (ja) |
-
2021
- 2021-03-12 JP JP2021040061A patent/JP2022139599A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11237793B1 (en) | Latency reduction for content playback | |
WO2017057170A1 (ja) | 対話装置及び対話方法 | |
KR102118209B1 (ko) | 디지털 어시스턴트를 위한 음성 트리거 | |
US7177809B2 (en) | Contents presenting system and method | |
JP3892410B2 (ja) | 音楽データ選曲装置、音楽データ選曲方法、並びに、音楽データの選曲プログラムおよびそれを記録した情報記録媒体 | |
JP2006092430A (ja) | 音楽再生装置 | |
JPWO2018055898A1 (ja) | 情報処理装置、及び情報処理方法 | |
CN110696756A (zh) | 一种车辆的音量控制方法及装置、汽车、存储介质 | |
CN111727473A (zh) | 信息处理装置、信息处理方法和程序 | |
JP2005049773A (ja) | 音楽再生装置 | |
JP2001005487A (ja) | 音声認識装置 | |
CN111861666A (zh) | 车辆信息的交互方法及装置 | |
JP2001272991A (ja) | 音声対話方法及び音声対話装置 | |
JP6387287B2 (ja) | 不明事項解消処理システム | |
JP2022139599A (ja) | 情報出力装置、情報出力方法、および、情報出力装置用プログラム | |
KR20200022932A (ko) | 차량 탑승자 대화기반 컨텐츠 추천 방법 및 장치 | |
JP7407047B2 (ja) | 音声出力の制御方法および音声出力制御装置 | |
JP2023531417A (ja) | オーディオ認識を活用したライフログ装置およびその方法 | |
WO2020208972A1 (ja) | 応答生成装置及び応答生成方法 | |
JP2020152298A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JP6971205B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
WO2020189340A1 (ja) | 情報処理装置および情報処理方法、並びにプログラム | |
JP7274901B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
EP4350690A1 (en) | Artificial intelligence device and operating method thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240207 |