JP2021033929A - 制御システム、及び制御方法 - Google Patents

制御システム、及び制御方法 Download PDF

Info

Publication number
JP2021033929A
JP2021033929A JP2019156830A JP2019156830A JP2021033929A JP 2021033929 A JP2021033929 A JP 2021033929A JP 2019156830 A JP2019156830 A JP 2019156830A JP 2019156830 A JP2019156830 A JP 2019156830A JP 2021033929 A JP2021033929 A JP 2021033929A
Authority
JP
Japan
Prior art keywords
control
unit
instruction
agent
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019156830A
Other languages
English (en)
Inventor
航 遠藤
Ko Endo
航 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2019156830A priority Critical patent/JP2021033929A/ja
Publication of JP2021033929A publication Critical patent/JP2021033929A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】乗員の発話に応じて、乗員が所望する車両機器の制御を記憶させることができる制御システム、及び制御方法を提供すること。【解決手段】制御対象装置制御装置第1記憶部第2記憶部第3記憶部及び音声インターフェース装置を含む制御システムであって利用者により発話された音声を示すデータを取得する取得部とデータに基づいて利用者の発話の内容を解釈する発話内容解釈部と発話の内容に制御対象装置における制御対象を制御する指示が含まれる場合指示と制御対象の動作量とが対応付けられた第2記憶部に記憶された第1対応情報を参照し制御対象の動作量を決定する決定部と決定された動作量で制御対象を制御するように制御装置に指示する指示部とを備えるとともに指示部は制御装置によって実際に制御対象が制御された際の制御量を発話内容解釈部により解釈された指示に基づく情報に対応付けられた第2対応情報として第1記憶部に登録させる制御システム。【選択図】図1

Description

本発明は、制御システム、及び制御方法に関する。
従来、車両に搭載された汎用スイッチに乗員が所望する車両機器の制御を対応付けて記憶させ、乗員が汎用スイッチを操作するだけで所望する車両機器の制御を実行することができるようにする技術が開示されている(例えば、特許文献1)。
特開2003−312388号公報
近年、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供する応答機能が知られている。しかしながら、従来の技術では、乗員の発話に応じて乗員が所望する車両機器の制御を記憶させることまでは困難であった。
本発明は、このような事情を考慮してなされたものであり、乗員の発話に応じて乗員が所望する車両機器の制御を記憶させる制御システム、及び制御方法を提供することを目的の一つとする。
この発明に係る制御システム、及び制御方法は、以下の構成を採用した。
(1)この発明の一態様の制御システムは、制御対象装置、制御装置、第1記憶部、第2記憶部、第3記憶部、及び音声インターフェース装置とを含む制御システムであって、利用者により発話された音声を示すデータを取得する取得部と、前記取得部により取得された前記データに基づいて、前記利用者の発話の内容を解釈する発話内容解釈部と、前記発話の内容に、前記制御対象装置における制御対象を制御する指示が含まれる場合、指示と前記制御対象の動作量とが対応付けられた第2記憶部に記憶された第1対応情報を参照し、前記制御対象の動作量を決定する決定部と、前記決定部により決定された動作量で前記制御対象を制御するように前記制御装置に指示する指示部と、を備えるとともに、前記指示部は、前記制御装置によって実際に前記制御対象が制御された際の制御量を、前記発話内容解釈部により解釈された指示に基づく情報に対応付けられた第2対応情報として前記第1記憶部に登録させるものである。
(2)の態様は、上記(1)の態様に係る制御システムにおいて、前記指示部は、前記発話内容解釈部に解釈された指示と、前記第2対応情報とに更に基づいて、前記制御対象を制御するように前記制御装置に指示するものである。
(3)の態様は、上記(1)または(2)の態様に係る制御システムが、前記利用者の操作を受け付ける受付部を更に備え、前記指示部は、当該指示部の指示に応じて前記制御対象が制御される場合において、前記受付部により前記利用者の操作が受け付けられた場合に、前記指示部の指示による制御の内容を、前記利用者の操作に対応付けた第3対応情報として前記第1記憶部に記憶させるものである。
(4)の態様は、上記(1)または(2)の態様に係る制御システムが、前記利用者の操作を受け付ける受付部を、前記制御対象の該制御対象装置専用に更に備え、前記指示部は、当該指示部の指示に応じて前記制御対象が制御される場合において、前記受付部により前記利用者の操作が受け付けられた場合に、前記指示部の指示による制御の内容を、前記利用者の操作に対応付けた第4対応情報として第3記憶部に記憶させるものである。
(5)の態様は、上記(3)の態様に係る制御システムにおいて、前記指示部は、前記受付部に受け付けられた操作と、前記第3対応情報とに更に基づいて、前記制御対象を制御するように前記制御装置に指示するものである。
(6)の態様は、上記(3)または(4)の態様に係る制御システムが、前記指示部の指示に応じて前記制御対象が制御される場合において、前記受付部の操作を促す通知部を更に備えるものである。
(7)の態様は、上記(1)から(5)のいずれかの態様に係る制御システムにおいて、前記指示部の指示に応じて前記制御対象が制御される場合において、解釈された前記発話の内容に前記制御量を補正する指示が含まれる場合、当該指示に基づいて前記第2対応情報を更新するものである。
(8)この発明の他の態様の制御方法は、制御対象装置、制御装置、第1記憶部、第2記憶部、第3記憶部、及び音声インターフェース装置とを構成する複数のコンピュータが実行する、利用者により発話された音声を示すデータを取得する取得プロセスと、取得された前記データに基づいて、前記利用者の発話の内容を解釈する発話内容解釈プロセスと、前記発話の内容に前記制御対象装置を制御する指示が含まれる場合、指示と前記制御対象装置の動作量とが対応付けられた第2記憶部に記憶された第1対応情報を参照し、前記制御対象装置の動作量を決定する決定プロセスと、決定された前記動作量で前記制御対象装置を制御するように前記制御装置に指示する指示プロセスと、前記制御装置により実際に前記制御対象装置が制御された際の制御量が、解釈された指示に基づく情報に対応付けられた第2対応情報として前記第1記憶部に登録される登録プロセスと、を有するものである。
(1)〜(8)によれば、乗員の発話に応じて、乗員が所望する車両機器の制御を記憶させることができる。
(2)によれば、乗員の発話に応じた制御が行われて以降、同様の発話に係る車両機器の制御を簡便に行うことができる。
(3)によれば、乗員の操作に応じて、乗員が所望する車両機器の制御を記憶させることができる。
(5)によれば、乗員の発話に応じた制御が行われて以降、同様の発話を用いずに簡便に車両機器の制御を行うことができる。
(6)によれば、発話を用いない車両機器の制御を促すことができる。
(7)によれば、乗員が所望する車両機器の制御を補正することができる。
エージェント装置100を含むエージェントシステム1の構成図である。 実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。 車両機器60の構成の一例を示す図である。 制御量情報152の内容の一例を示す図である。 第2対応情報154の内容の一例を示す図である。 実施形態に係るエージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。 第1対応情報260の内容の一例を示す図である。 エージェント機能部130が運転席のパワーウィンドウ装置を制御する場面を模式的に示す図である。 スイッチと制御を対応付ける場面の一例を示す図である。 第3対応情報156の内容の一例を示す図である。 第4対応情報842の内容の一例を示す図である。 実施形態に係るエージェントシステム1の一連の動作の一例を示すフローチャートである。 車両Mの乗員が制御量を補正する指示を発話している場面の一例を示す図である。 変形例に係るエージェントシステム1の一連の動作の一例を示すフローチャートである。
以下、図面を参照し、本発明の制御システム、及び制御方法の実施形態について説明する。
<実施形態>
エージェント装置は、本実施形態のエージェントシステム1の一部または全部を実現する装置である。以下では、エージェント装置の一例として、乗員(利用者の一例)が搭乗する車両(以下、車両M)に搭載され、エージェント機能を備えたエージェント装置について説明する。なお、本発明の適用上、必ずしもエージェント装置がエージェント機能を有している必要はない。また、エージェント装置は、スマートフォン等の可搬型端末装置(汎用端末)であってもよいが、以下では、車両に搭載されたエージェント機能を備えたエージェント装置を前提として説明する。エージェント機能とは、例えば、車両Mの乗員と対話をしながら、乗員の発話の中に含まれる要求(コマンド)に基づく各種の情報提供や各種機器制御を行ったり、ネットワークサービスを仲介したりする機能である。エージェント装置が複数のエージェント機能を有する場合、エージェント機能は、それぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器(例えば運転制御や車体制御に関わる機器)の制御等を行う機能を有するものがあってよい。
エージェント機能は、例えば、乗員の音声を認識する音声認識機能(音声をテキスト化する機能)に加え、自然言語処理機能(テキストの構造や意味を理解する機能)、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、AI(Artificial Intelligence)技術によって実現されてよい。また、これらの機能を行うための構成の一部(特に、音声認識機能や自然言語処理解釈機能)は、車両Mの車載通信装置または車両Mに持ち込まれた汎用通信装置と通信可能なエージェントサーバ(外部装置)に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバとが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体(サービス・エンティティ)をエージェントと称する。
<全体構成>
図1は、エージェント装置100を含むエージェントシステム1の構成図である。エージェントシステム1は、例えば、エージェント装置100と、一以上のエージェントサーバ200と、を備える。本実施形態におけるエージェントシステム1を提供する提供者は、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者や製造者等が挙げられ、任意の主体(法人、団体、個人等)がエージェントシステム1の提供者となり得る。なお、図1では、エージェントサーバ200が一つである場合について説明したが、これに限られず、エージェントシステム1は、二以上のエージェントサーバ200を備えるものであってもよい。この場合、各エージェントサーバ200は、互いに異なる任意の主体によって提供されてもよい。
エージェント装置100は、ネットワークNWを介してエージェントサーバ200と通信する。ネットワークNWは、例えば、インターネット、セルラー網、Wi−Fi網、WAN(Wide Area Network)、LAN(Local Area Network)、公衆回線、電話回線、無線基地局等の通信網のうち一部または全部を含む。ネットワークNWには、各種ウェブサーバ300が接続されており、エージェントサーバ200またはエージェント装置100は、ネットワークNWを介して各種ウェブサーバ300からウェブページを取得することができる。
エージェント装置100は、車両Mの乗員と対話を行い、乗員からの音声をエージェントサーバ200に送信し、エージェントサーバ200から得られた回答を、音声出力や画像表示の形で乗員に提示する。
[車両]
図2は、実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、スピーカ20と、表示・操作装置30と、汎用スイッチ40と、ナビゲーション装置50と、車両機器60と、車載通信装置70と、エージェント装置100とが搭載される。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図2に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。エージェント装置100は、「制御対象、第1記憶部、及び制御装置を含む装置」の一例である。
マイク10は、車室内で発せられた音を収集する収音部である。スピーカ20は、例えば、車室内に配設されたスピーカ(音出力部)を含む。表示・操作装置30は、画像を表示するとともに、入力操作を受付可能な装置(或いは装置群)である。表示・操作装置30は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置30は、更に、HUD(Head Up Display)や機械式の入力装置を含んでもよい。表示・操作装置30は、エージェント装置100とナビゲーション装置50とで共用されてもよい。
汎用スイッチ40は、例えば、一以上のスイッチを備え、乗員の操作を受け付ける。以下、汎用スイッチ40が、第1スイッチSW1と、第2スイッチSW2と、第3スイッチSW3との三つの押しボタンスイッチを備えるものとする。また、以下、押しボタンスイッチは、スイッチとスイッチを乗員に明示するLED(Light Emitting Diode)とが一体に構成されたものとする。なお、汎用スイッチ40が備えるスイッチの数は一例であり、これに限られず、一つであってもよく、二つであってもよく、四つ以上であってもよい。また、汎用スイッチ40に代えて(或いは、加えて)、乗員の操作を受け付ける機能部がMに搭載されていてもよい。この機能部は、例えば、タッチパネル等であってもよい。第1スイッチSW1、第2スイッチSW2、及び第3スイッチSW3にそれぞれ設けられるLEDは、「通知部」の一例である。
ナビゲーション装置50は、ナビHMI(Human Machine Interface)と、GPS(Global Positioning System)等の位置測位装置と、地図情報を記憶した記憶装置と、経路探索等を行う制御装置(ナビゲーションコントローラ)とを備える。マイク10、スピーカ20、及び表示・操作装置30のうち一部または全部がナビHMIとして用いられてもよい。ナビゲーション装置50は、位置測位装置によって特定された車両Mの位置から、乗員によって入力された目的地まで移動するための経路(ナビ経路)を探索し、経路に沿って車両Mが走行できるように、ナビHMIを用いて案内情報を出力する。経路探索機能は、ネットワークNWを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置50は、ナビゲーションサーバから経路を取得して案内情報を出力する。
なお、エージェント装置100は、ナビゲーションコントローラを基盤として構築されてもよい。この場合、ナビゲーションコントローラとエージェント装置100は、ハードウェア上は一体に構成される。
車両機器60は、例えば、エンジンや走行用モータ等の駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置、パワーウィンドウ制御装置、シート位置の制御装置、ルームミラーの角度位置制御装置、車両内外の照明装置の制御装置、ワイパーやデフォッガーの制御装置、方向指示灯の制御装置、空調装置、走行距離やタイヤの空気圧の情報や燃料の残量情報等の車両情報を取得する取得装置等を含む。また、車両機器60は、車両Mの速度を検出する車速センサや加速度を検出する加速度センサ、鉛直軸回りの角速度を検出するヨーレートセンサ、車両Mの向きを検出する方位センサ等を含んでもよい。
図3は、車両機器60の構成の一例を示す図である。以下、車両機器60がパワーウィンドウ制御装置であるものとする。この場合、車両機器60は、例えば、窓の開閉に係る駆動部62と、車両機器用ECU80と、操作スイッチ90とを備える。
駆動部62は、例えば、アクチュエータにより実現され、車両機器用ECU80の制御に基づいて駆動することによって車両Mの窓を開状態、又は閉状態にする。
操作スイッチ90は、専用第1スイッチSW4と、専用第2スイッチSW5と、専用第3スイッチSW6と、汎用第1スイッチSW7と、汎用第2スイッチSW8と、汎用第3スイッチSW9とを備える。以降の説明において、専用第1スイッチSW4と、専用第2スイッチSW5と、専用第3スイッチSW6とを区別しない場合には、「専用スイッチ」と記載し、汎用第1スイッチSW7と、汎用第2スイッチSW8と、汎用第3スイッチSW9とを区別しない場合には、「汎用スイッチ」と記載する。専用スイッチは、例えば、車両機器60の機能(この場合、窓の開閉)に係る操作を受け付けるスイッチである。汎用スイッチは、例えば、車両Mの乗員によって割り当てられた制御に係る操作を受け付けるスイッチである。車両Mの乗員によって汎用スイッチに制御を割り当てる処理の詳細は、後述する。
車両機器用ECU80は、例えば、受付部82と、制御部83と、記憶部84とを備える。記憶部84には、HDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)により実現されてもよく、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)により実現されてもよく、ドライブ装置に装着される記憶媒体であってもよい。また、記憶部84の一部又は全部は、NASや外部のストレージサーバ等、車両機器60が(直接、或いは、エージェント装置100を介して)アクセス可能な外部装置であってもよい。記憶部84には、第4対応情報842が記憶される。第4対応情報842の詳細については、後述する。記憶部84は、「第3記憶部」の一例である。
受付部82は、操作スイッチ90において受け付けられた操作を受け付ける。制御部83は、受付部82によって受け付けられた車両Mの乗員の操作と、第4対応情報842に基づいて、駆動部62を制御する。
図2に戻り、車載通信装置70は、例えば、セルラー網やWi−Fi網を利用してネットワークNWにアクセス可能な無線通信装置である。
[エージェント装置]
エージェント装置100は、管理部110と、エージェント機能部130と、車載通信部140と、記憶部150とを備える。管理部110は、例えば、音響処理部112と、エージェントWU(Wake Up)判定部114と、通信制御部116と、出力制御部120と備える。図2に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部130と車載通信装置70の間に管理部110が介在してもよいように、任意に改変することができる。また、以下では、エージェント機能部130とエージェントサーバ200が協働して出現させるエージェントを、単に「エージェント」と称する場合がある。
エージェント装置100の各構成要素は、例えば、CPU(Central Processing Unit)等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。記憶部150は、HDDやフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)により実現されてもよく、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)により実現されてもよく、ドライブ装置に装着される記憶媒体であってもよい。また、記憶部150の一部又は全部は、NASや外部のストレージサーバ等、エージェント装置100がアクセス可能な外部装置であってもよい。記憶部150には、例えば、エージェント装置100において実行されるプログラム等の他、制御量情報152、第2対応情報154、第3対応情報156等の情報が記憶される。まず、制御量情報152、及び第2対応情報154について説明し、第3対応情報156の詳細については、後述する。記憶部150は、「第1記憶部」の一例である。
図4は、制御量情報152の内容の一例を示す図である。制御量情報152は、例えば、車両Mに搭載される車両機器60の動作量と、当該動作量だけ車両機器60を動作させる際の車両機器60の制御装置の制御量とが車両機器60毎に互いに対応付けられた情報である。例えば、車両機器60が運転席のパワーウィンドウ装置である場合、車両機器60の動作量は、窓の開閉の程度であり、車両機器60の制御装置の制御量は、パワーウィンドウ装置のアクチュエータの制御量(例えば、モータの回転数)である。窓の開閉の程度は、例えば、窓が完全に閉じている状態を0[%]、窓が完全に開いている状態を100[%]として示した開度、又は窓が完全に閉じている状態を100[%]、窓が完全に開いている状態を0[%]として示した閉度等である。
図4の例において、制御量情報152は、運転席のパワーウィンドウ装置に係る動作量の「10%開ける」に対して、制御量の「モータ10回転」が対応付けられ、動作量の「20%開ける」に対して、制御量の「モータ20回転」が対応付けられ、動作量の「30%開ける」に対して、制御量の「モータ30回転」が対応付けられた情報が含まれる。ここで、同一の動作量であっても、車両Mに搭載される車両機器60の性能によっては、制御量が車両M(或いは、車種、性能等)毎に異なる場合がある。したがって、制御量情報152は、予め車両M毎に定められた情報である。
図5は、第2対応情報154の内容の一例を示す図である。第2対応情報154は、例えば、車両Mに搭載される車両機器60に対する乗員の指示と、当該指示に対応する車両機器60の制御装置の制御量とが車両機器60毎に互いに対応付けられた情報である。例えば、車両機器60が運転席のパワーウィンドウ装置である場合、車両機器60に対する乗員の指示は、窓の開閉の程度(例えば、開度)を指定する指示であり、指示に対応する車両機器60の制御量は、パワーウィンドウ装置のアクチュエータの制御量(例えば、モータの回転数)である。窓の開閉の程度を指定する指示は、例えば、「ちょっと開けて」、「少し開けて」、「結構開けて」等の指示である。
図5の例において、第2対応情報154は、運転席のパワーウィンドウ装置に係る乗員の指示の「ちょっと開けて」に対して、制御量の「モータ10回転」が対応付けられ、乗員の指示の「少し開けて」に対して、制御量の「モータ20回転」が対応付けられ、乗員の指示の「結構開けて」に対して、制御量の「モータ30回転」が対応付けられる。第2対応情報154は、後述するエージェント機能部130によって生成され、記憶部150に記憶される。
図2に戻り、管理部110は、OS(Operating System)やミドルウェア等のプログラムが実行されることで機能する。
管理部110の音響処理部112は、マイク10から収集される音を受け付け、受け付けた音に対して、エージェントごとに予め設定されているウエイクアップワードを認識したり、その他の発話内容を認識するのに適した状態になるようにしたりする音響処理を行う。ウエイクアップワードとは、例えば、対象のエージェントを起動させるためのワード(単語)やフレーズ等である。ウエイクアップワードは、単体のエージェントを起動させるものでもよく、複数のエージェントを起動させるものでもよい。音響処理とは、例えば、バンドパスフィルタ等のフィルタリングによるノイズ除去や音の増幅等である。また、音響処理部112は、音響処理された音声を、エージェントWU判定部114や起動中のエージェント機能部130に出力する。音響処理部112は、「取得部」の一例である。
エージェントWU判定部114は、エージェントに予め定められているウエイクアップワードを認識する。エージェントWU判定部114は、音響処理が行われた音声(音声ストリーム)から発話された音声を認識する。まず、エージェントWU判定部114は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントWU判定部114は、混合ガウス分布モデル(GMM;Gaussian mixture model) に基づくフレーム単位の音声識別、及び非音声識別に基づく区間検出を行ってもよい。
次に、エージェントWU判定部114は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントWU判定部114は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合、エージェントWU判定部114は、ウエイクアップワードに対応するエージェント機能部130を起動させる。なお、エージェントWU判定部114に相当する機能が、エージェントサーバ200に搭載されてもよい。この場合、管理部110は、音響処理部112によって音響処理が行われた音声ストリームをエージェントサーバ200に送信し、エージェントサーバ200がウエイクアップワードであると判定した場合、エージェントサーバ200からの指示に従ってエージェント機能部130が起動する。また、各エージェント機能部130は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部110がエージェントWU判定部114を備える必要はない。
また、エージェントWU判定部114は、上述した手順と同様の手順で、発話された音声に含まれる終了ワードを認識した場合であり、且つ、終了ワードに対応するエージェントが起動している状態(以下、必要に応じて「起動中」と称する)である場合、起動中のエージェント機能部を終了(停止)させる。なお、エージェントの起動、及び終了は、例えば、表示・操作装置30から所定の操作を受け付けることによって実行されてもよいが、以下では、音声による起動、及び停止の例を説明する。また、起動中のエージェントは、音声の入力を所定時間以上受け付けなかった場合に停止させてもよい。
通信制御部116は、エージェント機能部130を、ネットワークNWに接続可能にするための制御を行う。例えば、通信制御部116は、エージェント機能部130がネットワークを介して外部装置(例えば、エージェントサーバ200)と通信を行う場合の接続状態等を制御する。また、通信制御部116は、通信が途切れた場合の再接続や、接続状態の切り替え等の制御を行う。
出力制御部120は、通信制御部116またはエージェント機能部130等からの指示に応じて表示部またはスピーカ20に応答内容等の情報を出力させることで、乗員にサービス等の提供を行う。出力制御部120は、例えば、音声制御部122と、表示制御部124と、受付部126とを備える。
音声制御部122は、エージェント機能部130がエージェントサーバ200から取得した情報に基づいて、エージェントが車両Mの乗員の発話に応答する応答内容を、車両Mの乗員に通知するために用いられる音声をスピーカ20に出力させる。
表示制御部124は、エージェント機能部130がエージェントサーバ200から取得した情報に基づいて、エージェントが車両Mの乗員の発話に応答する応答内容を、車両Mの乗員に通知するために用いられる画像を表示・操作装置30のディスプレイ装置に表示させる。また、表示制御部124は、汎用スイッチ40が備える第1スイッチSW1、第2スイッチSW2、及び第3スイッチSW3のLEDを点灯、又は滅灯させる。
受付部126は、汎用スイッチ40が備える第1スイッチSW1、第2スイッチSW2、及び第3スイッチSW3に入力された乗員の操作を受け付ける。
エージェント機能部130は、エージェントサーバ200と協働して、車両の乗員の発話に応じて、音声、及び画像による応答を含むサービスを提供する。エージェント機能部130には、例えば、車両M、又は車両Mに搭載される車載機器を制御する権限が付与されており、後述する処理によりエージェントサーバ200によって認識された車両Mの発話内容が、車両Mに搭載される車両機器60の動作を指示するコマンドである場合、エージェント機能部130は、コマンドに基づいてそれらの車両機器60を制御する。エージェント機能部130は、通信制御部116の制御に基づいて、車載通信部140によって車載通信装置70を介してエージェントサーバ200と通信する。
なお、エージェント機能部130には、法律や条例、エージェントを提供する事業者同士の契約等に応じて、車両機器60を制御する権限が割り振られるものであってもよい。車両機器60の制御に係る処理において、エージェント機能部130は、「指示部」の一例である。
車載通信部140は、例えば、エージェント機能部130がネットワークNWに接続する場合に、車載通信装置70を介して通信させる。車載通信部140は、エージェント機能部130からの情報を、車載通信装置70を介してエージェントサーバ200やその他の外部装置に出力する。また、車載通信部140は、車載通信装置70により出力された情報をエージェント機能部130に出力する。
エージェント機能部130は、エージェントWU判定部114による起動指示に基づいて起動し、乗員の発話に対して、エージェントサーバ200を介して乗員の発話の音声に含まれる要求に対する応答内容を生成し、生成した応答内容を出力制御部120に出力する。また、エージェント機能部130は、エージェントサーバ200と通信を行う場合には、通信制御部116により制御された接続状態によって通信を行う。また、エージェント機能部130は、エージェントWU判定部114による制御に基づいて、エージェントを停止させてもよい。
[エージェントサーバ]
図6は、実施形態に係るエージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。以下、エージェントサーバ200の構成とともに、エージェント機能部130等の動作について説明する。ここでは、エージェント装置100からネットワークNWまでの物理的な通信についての説明を省略する。エージェントサーバ200は、「音声インターフェース装置」の一例である。
エージェントサーバ200は、通信部210を備える。通信部210は、例えば、NIC(Network Interface Card)等のネットワークインターフェースである。更に、エージェントサーバ200は、例えば、音声認識部220と、自然言語処理部221と、対話管理部222と、ネットワーク検索部223と、応答内容生成部224との機能部を備える。これらの構成要素は、例えば、CPU等のハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPU等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリ等の記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。音声認識部220と、自然言語処理部221とを合わせたものは、「発話内容解釈部」の一例である。
また、エージェントサーバ200は、記憶部250を備える。記憶部250は、上記の記憶部150を実現する各種記憶装置と同様の装置により実現される。記憶部250には、例えば、辞書DB252、パーソナルプロファイル254、知識ベースDB256、応答規則DB258、第1対応情報260等のデータやプログラムが格納される。記憶部250は、「第2記憶部」の一例である。
エージェント装置100において、エージェント機能部130は、例えば、音響処理部112等から入力される音声ストリーム、或いは圧縮や符号化等の処理を行った音声ストリームを、エージェントサーバ200に送信する。エージェント機能部130は、ローカル処理(エージェントサーバ200を介さない処理)が可能なコマンド(要求内容)が認識できた場合には、コマンドで要求された処理を実行してもよい。ローカル処理が可能なコマンドとは、例えば、エージェント装置100が備える記憶部150を参照することで応答可能なコマンドである。より具体的には、ローカル処理が可能なコマンドとは、例えば、記憶部150内に存在する電話帳データ(不図示)から特定者の名前を検索し、合致した名前に対応付けられた電話番号に電話をかける(相手を呼び出す)コマンドである。したがって、エージェント機能部130は、エージェントサーバ200が備える機能の一部を有してもよい。
音声ストリームを取得すると、音声認識部220が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部221が文字情報に対して辞書DB252を参照しながら意味解釈を行う。辞書DB252は、例えば、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書DB252は、例えば、機能辞書252Aと、汎用辞書252Bとを含む。
機能辞書252Aは、エージェントサーバ200がエージェント機能部130と協働して実現するエージェントが提供する機能(サービス)をカバーするための辞書である。例えば、エージェントが車載エアコンを制御する機能を提供する場合、機能辞書252Aには、「エアコン」、「空調」、「つける」、「消す」、「温度」、「上げる」、「下げる」、「内気」、「外気」等の単語が、動詞、目的語等の単語種別、及び抽象化された意味と対応付けられて登録されている。また、機能辞書252Aには、同時に使用可能であることを示す単語間リンク情報が含まれてよい。
汎用辞書252Bは、エージェントの提供する機能に限らず、一般的な物事の事象を抽象化された意味と対応付けた辞書である。機能辞書252Aと汎用辞書252Bのそれぞれは、同義語や類義語の一覧情報を含んでもよい。機能辞書252Aと汎用辞書252Bとは、複数の言語のそれぞれに対応して用意されてよく、その場合、音声認識部220及び自然言語処理部221は、予め設定されている言語設定に応じた機能辞書252A及び汎用辞書252B、並びに文法情報(不図示)を使用する。音声認識部220の処理と、自然言語処理部221の処理は、段階が明確に分かれるものではなく、自然言語処理部221の処理結果を受けて音声認識部220が認識結果を修正する等、相互に影響し合って行われてよい。
自然言語処理部221は、音声認識部220による認識結果に基づく意味解析の一つとして、音声に含まれるサービスの要求に対応するために必要な機能に関する情報(以下、必要機能と称する)を取得する。例えば、認識結果として、「ちょっと開けて」等の乗員の指示に係る発話の意味が認識された場合、自然言語処理部221は、辞書DB252等を参照し、「パワーウィンドウ装置制御」という機能種別を取得する。そして、自然言語処理部221は、取得した必要機能をエージェント機能部130に出力し、機能必要情報に対する実行可否の判定結果を取得する。自然言語処理部221は、必要機能が実行可能である場合に、要求に対応できるものとして、解釈された発話内容に対応したコマンドを生成する。
例えば、自然言語処理部221は、認識結果として、「窓を少し開けて」、「少し窓を開けて」、「少し開けて窓を」等の乗員の指示の発話が認識された場合に、標準文字情報「少し窓を開ける」「OPEN_WINDOW_A_LITTLE」等に置き換える。これにより、リクエスト(要求)の発話に表現の揺れが有った場合にも要求に合ったサービスの提供をし易くすることができる。また、自然言語処理部221は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成したりしてもよい。そして、自然言語処理部221は、置き換えた標準文字情報と、第1対応情報260とに基づいて、認識された乗員の指示に対応する車両機器60の動作量を特定する。
図7は、第1対応情報260の内容の一例を示す図である。第1対応情報260は、例えば、車両Mに搭載される車両機器60に対する乗員の指示と、当該指示に対応する車両機器60の動作量とが車両機器60毎に対応付けられた情報である。例えば、車両機器60が運転席のパワーウィンドウ装置である場合、車両機器60に対する乗員の指示は、運転席の窓の開閉の程度を指定する指示であり、当該指示に対応する車両機器60の動作量は、運転席の窓の開閉の程度である。
図7の例において、第1対応情報260は、運転席のパワーウィンドウ装置に係る乗員の指示の「ちょっと窓を開けて」に対して、動作量の「10%窓を開ける」が対応付けられ、乗員の指示の「少し窓を開けて」に対して、動作量の「20%窓を開ける」が対応付けられ、乗員の指示の「結構窓を開けて」に対して、動作量の「30%窓を開ける」が対応付けられる。自然言語処理部221は、認識された乗員の指示の意味(標準文字情報)を検索キーとして第1対応情報260を検索し、特定された車両機器60と、当該指示に対応付けられた動作量とを、エージェント装置100へのコマンドとして生成する。コマンドには、例えば、乗員の指示を示す情報と、特定した車両機器60を示す情報と、特定した車両機器60の動作量を示す情報とが含まれる。例えば、自然言語処理部221は、認識された乗員の指示の意味が「少し窓を開けて」であった場合、「少し窓を開けて」を検索キーとして第1対応情報260を検索し、「少し窓を開けて」という指示に対応付けられた運転席のパワーウィンドウ装置の動作量である「20%窓を開ける」を特定する。そして、自然言語処理部221は、乗員の指示(この場合、「少し窓を開けて」)と、特定した車両機器60(この場合、「運転席のパワーウィンドウ装置」)と、特定した車両機器60の動作量(この場合、「20%窓を開ける」)とを含むコマンドを生成する。
対話管理部222は、自然言語処理部221により生成されたコマンドに基づいて、パーソナルプロファイル254や知識ベースDB256、応答規則DB258を参照しながら車両Mの乗員に対する応答内容(例えば、乗員への発話内容や出力部から出力する画像、音声)を決定する。知識ベースDB256は、物事の関係性を規定した情報である。応答規則DB258は、コマンドに対してエージェントが行うべき動作(回答や機器制御の内容等)を規定した情報である。
また、対話管理部222は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル254と照合を行うことで、乗員を特定してもよい。この場合、パーソナルプロファイル254には、例えば、音声の特徴情報が更に応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム(音の高低のパターン)等の喋り方の特徴や、メル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficients)等による特徴量に関する情報である。音声の特徴情報は、例えば、乗員の初期登録時に所定の単語や文章等を乗員に発声させ、発声させた音声を認識することで得られる情報である。対話管理部222は、例えば、自然言語処理部221により生成されたコマンドが「少し窓を開ける」である場合、当該コマンドが、音声ストリームにより特定した乗員の近傍の窓(運転席の乗員が特定された場合、運転席のパワーウィンドウ装置)に係るコマンドであると特定し、自然言語処理部221が生成したコマンドに含まれる車両機器60に係る情報を更新してもよい。
対話管理部222は、コマンドがネットワークNWを介して検索可能な情報を要求するものである場合、ネットワーク検索部223に検索を行わせる。ネットワーク検索部223は、ネットワークNWを介して各種ウェブサーバ300にアクセスし、所望の情報を取得する。「ネットワークNWを介して検索可能な情報」とは、例えば、車両Mの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Mの位置に応じた天気予報であったりする。
応答内容生成部224は、対話管理部222により決定された発話の内容が車両Mの乗員に理解されるように、応答文を生成し、生成した応答文(応答内容の一例)をエージェント装置100に送信する。また、応答内容生成部224は、乗員認識装置80による認識結果をエージェント装置100から取得し、取得した認識結果によりコマンドを含む発話を行った乗員がパーソナルプロファイル254に登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にしたりした応答文を生成してもよい。
エージェント機能部130は、応答文を取得すると、音声合成を行って音声を出力するように音声制御部122に指示する。また、エージェント機能部130は、応答文を含む画像等を表示するように表示制御部124に指示する。
また、エージェント機能部130は、自然言語処理部221によって生成されたコマンドを取得し、取得したコマンドに基づいて、車両機器60を制御する。エージェント機能部130は、例えば、これまでに処理実績の有るコマンドを取得した場合、第2対応情報154に基づいて車両機器60を制御し、これまでに処理実績の無いコマンドを取得した場合、制御量情報152、及び制御量情報152に基づいて車両機器60を制御する。以下、エージェント機能部130が車両機器60を制御する制御処理の詳細について説明する。
[制御処理の例(その1):処理実績の無いコマンドを取得した場合]
まず、処理実績のないコマンドを取得した場合のエージェント機能部130の制御処理について説明する。エージェント機能部130は、エージェントサーバ200からコマンドを取得する。エージェント機能部130は、取得したコマンドと、第2対応情報154とに基づいて、取得したコマンドに含まれる車両機器60に係る指示が、第2対応情報154に含まれるか否かを判定する。エージェント機能部130は、第2対応情報154にコマンドが含まれないと判定する場合、当該コマンドについて処理実績が無いものとみなし、制御量情報152に基づいて、制御量を特定する。エージェント機能部130は、コマンドに含まれる車両機器60に係る動作量を検索キーとして制御量情報152を検索し、当該動作量に対応付けられた制御量を特定する。換言すると、エージェント機能部130は、コマンドと、制御量情報152に基づいて、動作量を制御量に変換する。エージェント機能部130は、変換した制御量をコマンドに含まれる制御対象の車両機器60に対する制御の制御量として決定し、制御を実行する。車両機器60の制御の実行に係る処理において、エージェント機能部130は、「指示部」の一例である。
そして、エージェント機能部130は、コマンドに含まれる指示と、実際に車両機器60を制御した制御量とを対応付けた情報を、制御対象の車両機器60に係る第2対応情報154として生成(更新)する。エージェント機能部130は、次回以降、同一の指示に係る車両機器60の制御について第2対応情報154を参照すれば、動作量を制御量に変換する処理を行わなくとも、取得したコマンドに含まれる指示から制御量を決定できるため、同様の発話に係る制御を簡便に行うことができる。
[制御処理の例(その2):処理実績の有るコマンドを取得した場合]
次に、処理実績の有るコマンドを取得した場合のエージェント機能部130の制御処理について説明する。エージェント機能部130は、エージェントサーバ200からコマンド(指示)をエージェントサーバ200から取得する。エージェント機能部130は、取得したコマンドと、第2対応情報154とに基づいて、取得したコマンドに含まれる車両機器60に係る指示が、第2対応情報154に含まれるか否かを判定する。エージェント機能部130は、第2対応情報154にコマンドが含まれると判定する場合、当該コマンドについて処理実績が有るものとみなし、コマンドに含まれる指示に対応付けられた制御量を特定する。エージェント機能部130は、特定した制御量をコマンドに含まれる制御対象の車両機器60に対する制御の制御量として決定し、制御を実行する。
[制御場面]
図8は、エージェント機能部130により運転席のパワーウィンドウ装置の制御が行われる場面(以下、制御場面)を模式的に示す図である。図8において、車両Mの乗員(この場合、運転席に着座する乗員)は、運転席の窓を開けることを意図してエージェントに対して、「ちょっと窓を開けて」の指示を行う。音響処理部112は、10から収集される車両Mの乗員の発話の音声に基づいて、音声ストリームを生成し、エージェント機能部130に出力する。エージェント機能部130は、音響処理部112によって生成された音声ストリームをエージェントサーバ200に送信する。自然言語処理部221は、音声ストリームが音声認識部220により音声認識された認識結果に基づいて、制御対象の車両機器60に係る動作量を特定し、コマンドを生成する。図8において、自然言語処理部221は、乗員の指示である、「ちょっと窓を開けて」と、特定した車両機器60である「運転席のパワーウィンドウ装置」と、特定した車両機器60の動作量である、「10%窓を開ける」とを含むコマンドを生成する。
上述したように、エージェント機能部130は、コマンドに含まれる車両Mの乗員の指示について、処理実績が有る場合には、第2対応情報154に基づいて制御量を決定し、処理実績が無い場合には、制御量情報152に基づいて制御量を決定する。図5に示す第2対応情報154には、「ちょっと窓を開けて」の指示が含まれるため、エージェント機能部130は、「ちょっと窓を開けて」という指示に対応する制御量を「モータ10回転」として決定する。そして、エージェント機能部130は、決定した制御量によって制御対象の車両機器60を制御する。
図8において、運転席のパワーウィンドウ装置PWは、窓部WDと、駆動部AQとを備える。窓部WDと、駆動部AQとは、互いに固定され、駆動部AQがエージェント機能部130の制御に基づいてレールWRに沿って移動することにより、窓部WDは、上下方向に移動(開閉)される。エージェント機能部130は、運転席のパワーウィンドウ装置PWに対して、駆動部AQを「モータ10回転」の制御量によって制御して、窓部WDを開状態にするように指示し、窓部WDを「10%窓を開ける」状態にする。
これにより、エージェントシステム1は、乗員の発話に応じて乗員が所望する車両機器60の制御を行いつつ、当該制御を第2対応情報154として記憶させ、次回から乗員の発話に応じた車両機器60の制御を簡便な処理によって行うようにすることができる。
[コマンドと汎用スイッチ40との対応付け]
また、制御場面において、第1スイッチSW1〜第3スイッチSW3のいずれかのスイッチに対する車両Mの乗員の操作が受付部126によって受け付けられた場合、当該操作が受け付けられたスイッチに、車両機器60に対する制御を対応付けてもよい。図9は、スイッチと制御を対応付ける場面の一例を示す図である。表示制御部124は、例えば、制御場面において、第1スイッチSW1〜第3スイッチSW3のうちいずれか(図示では第1スイッチSW1)のLEDを点灯させ、スイッチの操作を車両Mの乗員に促す。エージェント機能部130は、受付部126によりスイッチへの入力が受け付けられた場合、入力を受け付けたスイッチを示す情報と、制御場面において制御対象の車両機器60に対して行われた制御に係る情報とを互いに対応付けた一以上のレコードを含む第3対応情報156を生成する。
図10は、第3対応情報156の内容の一例を示す図である。第3対応情報156は、例えば、スイッチを示す情報と、制御場面の制御対象の車両機器60を示す情報と、制御場面の制御に係るコマンドに含まれる指示を示す情報と、制御場面の制御対象の車両機器60を制御する制御量を示す情報とが互いに対応付けられた情報である。第3対応情報156が生成(更新)された以降、エージェント機能部130は、受付部126によって第1スイッチSW1〜第3スイッチSW3のいずれかのスイッチに対する車両Mの乗員の操作が受け付けられた場合、第3対応情報156に基づいて、当該スイッチに制御に係る情報が対応付けられているか否かを判定する。エージェント機能部130は、当該スイッチに制御に係る情報が対応付けられている場合、当該スイッチに対応付けられた制御量によって、当該スイッチに対応付けられた制御対象の車両機器60を制御する。
[コマンドと車両機器のスイッチとの対応付け]
また、制御場面において、車両機器60の汎用スイッチのいずれかのスイッチに対する車両Mの乗員の操作が、車両機器60の受付部82によって受け付けられた場合、当該操作が受け付けられたスイッチに、車両機器60に対する制御を対応付けてもよい。例えば、音声制御部122が、制御場面において、汎用スイッチのうちいずれか(例えば、汎用第1スイッチSW7)に対して、スイッチの操作を車両Mの乗員に促すための音声をスピーカ30から出力させる。エージェント機能部130は、車両機器60の受付部82によりスイッチへの入力が受け付けられた場合、入力を受け付けたスイッチを示す情報と、制御場面において制御対象の車両機器60に対して行われた制御に係る情報とを互いに対応付けた一以上のレコードを含む第4対応情報842を生成する。
図11は、第4対応情報842の内容の一例を示す図である。第4対応情報842は、例えば、スイッチを示す情報と、制御場面の制御対象の車両機器60(この場合、運転席のパワーウィンドウ装置)において、制御場面の制御に係るコマンドに含まれる指示を示す情報と、制御場面の制御対象の車両機器60を制御する制御量を示す情報とが互いに対応付けられた情報である。第4対応情報842が生成(更新)された以降、車両機器60の車両機器用ECU80は、車両機器60の受付部82によって汎用スイッチのいずれかのスイッチに対する車両Mの乗員の操作が受け付けられた場合、第4対応情報842に基づいて、当該スイッチに制御に係る情報が対応付けられているか否かを判定する。車両機器60の車両機器用ECU80は、当該スイッチに制御に係る情報が対応付けられている場合、当該スイッチに対応付けられた制御量によって、当該スイッチに対応付けられた制御対象の車両機器60を制御する。
これにより、エージェントシステム1は、乗員の発話に応じて乗員が所望する車両機器60に対して行われた制御とスイッチとを対応付けて記憶させることができ、対応付けた以降は乗員の発話を用いずにスイッチを操作するだけで車両機器60の制御を行うようにすることができる。
なお、上述では、表示制御部124は、第1スイッチSW1〜第3スイッチSW3のうちいずれかのLEDを点灯させる場合について説明したが、これに限られない。表示制御部124は、例えば、第3対応情報156を参照し、制御が対応付けられていないスイッチのLEDを点灯させ、当該スイッチの操作を車両Mの乗員に促すようにしてもよい。例えば、表示制御部124は、第3対応情報156がいずれのスイッチにも制御が対応付けられていないことを示す場合、複数のスイッチ(全てでもよい)のLEDを点灯させてもよい。また、表示制御部124は、LEDを単に点灯させる以外にも、点滅させたりすることによって、より車両Mの乗員の操作を促すようにしてもよい。
[動作フロー]
図12は、実施形態に係るエージェントシステム1の一連の動作の一例を示すフローチャートである。本フローチャートの処理は、例えば、所定周期或いは所定のタイミングで繰り返し実行されてよい。また、図12の例では、エージェント装置100により実行される処理のうち、主にウエイクアップワードによりエージェントを起動し、乗員の発話に含まれる要求に応答する処理について説明するものとし、エージェント装置100のエージェント機能部130と協働して実行されるエージェントサーバ200の処理も含めて説明するものとする。
図12の例において、まず、エージェントWU判定部114は、ウエイクアップワードに対応付けられたエージェント(エージェント機能部130)を起動させる(ステップS100)。次に、音響処理部112は、マイク10等により音声を受け付けたか否かを判定する(ステップS102)。音声を受け付けた場合、音響処理部112は、受け付けた音声に対して発話内容を認識するのに適した状態になるように音響処理を行う(ステップS104)。音響処理された音声は、エージェント機能部130からエージェントサーバ200に送信される。
エージェントサーバ200の音声認識部220は、受け付けた音声の認識を行い、音声をテキスト化する(ステップS106)。次に、自然言語処理部221は、テキスト化された文字情報に対する自然言語処理を実行し、文字情報の意味解析を行う(ステップS108)。次に、自然言語処理部221は、意味解析結果に対応する機能を抽出し、コマンドを生成する(ステップS110)。自然言語処理部221により生成されたコマンドは、通信部210からエージェント装置100に送信される。次に、エージェント機能部130は、自然言語処理部221により生成されたコマンドを取得(受信)し、取得したコマンドに含まれる指示が、第2対応情報154に含まれるか否かを判定する(ステップS110)。
エージェント機能部130は、取得したコマンドに含まれる指示が、第2対応情報154に含まれると判定した場合、第2対応情報154に基づいて、当該指示に対応付けられた制御量を、制御対象の車両機器60の制御に係る制御量として決定する(ステップS112)。エージェント機能部130は、取得したコマンドに含まれる指示が、第2対応情報154に含まれないと判定した場合、制御量情報152に基づいて、当該コマンドに含まれる動作量に対応付けられた制御量を、制御対象の車両機器60の制御に係る制御量として決定する(ステップS114)。エージェント機能部130は、ステップS112、又はステップS114において決定した制御量によって制御対象の車両機器60を制御する(ステップS118)。エージェント機能部130は、例えば、決定した制御量によって車両機器60を制御するように、車両機器60の制御装置ECU1に指示する。エージェント機能部130は、制御量情報152に基づいて制御量を決定した場合、取得したコマンドと、決定した制御量とに基づいて、第2対応情報154を生成(更新)する(ステップS120)。
応答内容生成部224は、生成した応答内容をエージェント装置100に送信し、エージェント機能部130は、エージェントサーバ200から取得した応答結果を出力部に出力させる(ステップS122)。具体的には、エージェント機能部130は、エージェントサーバ200から取得した応答結果を、音声として音声制御部122にスピーカ20から出力させ、画像として表示制御部124に表示・操作装置30の表示装置に表示させる。ステップS122の処理後、またはステップS120の処理において音声を受け付けていない場合、エージェント機能部130は、エージェントの処理を終了させるか否かを判定する(ステップS124)。エージェントを終了させないと判定された場合には、ステップS102の処理に戻る。また、エージェントを終了させると判定された場合、管理部110は、エージェントを終了させる(ステップS126)。エージェントを終了させる場合には、例えば、エージェントを終了させる終了ワードの音声を受け付けた場合、エージェントを終了させる車載スイッチが押された場合、マイク10が音声を受け付けない状態が所定時間以上継続した場合等が含まれる。本フローチャートの処理は、終了する。
[実施形態のまとめ]
以上説明したように、本実施形態のエージェントシステム1によれば、乗員の発話に応じて、乗員が所望する車両機器60の制御に係る制御量情報152を記憶部150に記憶させることができる。そして、本実施形態のエージェントシステム1によれば、制御量情報152が記憶された以降、同様の発話に係る車両機器60の制御を、動作量と制御量との変換をせずに簡便に行うことができる。また、本実施形態のエージェントシステム1によれば、乗員の発話に応じて、乗員が所望する車両機器60の制御を、汎用スイッチ40が備える一以上の受付部(本実施形態では、スイッチ)に対応付けた第3対応情報156を記憶部150に記憶させることができる。そして、本実施形態のエージェントシステム1によれば、第3対応情報156が記憶された以降、同様の車両機器60の制御を、発話を用いずに簡便に行うことができる。
ここで、車両Mの乗員が、車両M以外の他の車両に乗車する場合であり、且つ車両Mと他の車両とが同様の機能を有する場合がある。この場合、車両Mと、他の車両との間で第2対応情報154や、第3対応情報156が共有可能である場合、他の車両に乗車する乗員は、車両Mに乗車する際と同様の発話によって、同様に車両機器60を制御することができ、車両Mの汎用スイッチ40に対する操作と同様の操作によって、同様に車両機器60を制御することができる。したがって、本実施形態のエージェントシステム1によれば、車両機器60の制御に係る発話、或いは操作を車両間で同期することができる。
なお、車両Mの乗員が、車両M以外の他の車両に乗車する場合であり、且つ車両Mと他の車両とが同一の機能を有していない場合には、エージェント機能部130は、車両Mと他の車両とに係る変換情報(不図示)を参照し、第2対応情報154の制御量を他の車両に応じた制御量に変換してもよい。これにより、本実施形態のエージェントシステム1は、車両Mと他の車両とが同一の機能を有していない場合であっても、車両機器60の制御に係る発話、或いは操作を車両間で同期することができる。
[変形例]
以下、図面を参照して本実施形態に係る変形例について説明する。実施形態では、変形例では、車両Mの乗員の発話の内容に制御量を補正する指示が含まれる場合に、当該補正する指示に基づいて、第2対応情報154を更新する場合について説明する。なお、上述した実施形態と同様の構成については、同一の符号を付して説明を省略する。
図13は、車両Mの乗員が制御量を補正する指示を発話している場面の一例を示す図である。エージェント機能部130は、先の乗員の発話(この一例では、「ちょっと窓を開けて」)に基づき、上述した制御によって、運転席のパワーウィンドウ装置の制御量を「モータ10回転」と決定し、制御する。車両Mの乗員は、この制御に係る制御場面において所望の制御が行われなかった場合等に、制御量の補正に係る発話を行う。制御場面において所望の制御が行われなかった場合とは、例えば、乗員の発話に基づく制御量によって車両機器60が制御されたものの、乗員が所望するような制御状態まで車両機器60が制御されなかった場合等である。具体的には、乗員の「ちょっと窓を開けて」という発話に対して、パワーウィンドウ装置が「モータ10回転」の制御量によって制御されたものの、乗員が所望するような開度まで窓が開かなかった場合等である。また、制御量の補正に係る発話は、例えば、現在の制御状態から変更したい車両機器60の制御状態や、車両機器60の動作量の程度等を含む発話である。具体的には、制御量の補正に係る発話は、「もっと開けて」、「もうちょっと開けて」、「もっと閉めて」、「もうちょっと閉めて」等の発話である。
変形例において、自然言語処理部221は、制御場面において音声制御部122によって生成された音声ストリームに基づいて、意味解釈を行う。そして、自然言語処理部221は、意味解釈された結果、制御場面における車両Mの乗員の発話が、車両Mの乗員が制御量の補正に係る発話であるか否かを判定する。自然言語処理部221は、制御場面における車両Mの乗員の発話が、車両Mの乗員が制御量の補正に係る発話であると判定された場合、当該発話の内容に基づいて、制御量を補正する指示を特定する。図13に示す例では、自然言語処理部221は、「もっと開けて」という指示を、直前の制御量を補正する指示として特定する。
エージェント機能部130は、自然言語処理部221により特定された制御量を補正する指示に基づいて、第2対応情報154に示される制御量を補正する。この場合、エージェント機能部130は、制御量を補正する指示から、現在の制御状態から変更したい車両機器60の制御状態(この場合、窓を「開ける」)や、車両機器60の動作量の程度(この場合、「もっと」)を特定し、特定した情報に基づいて、第2対応情報154を補正する。エージェント機能部130は、制御場面において制御された車両機器60について、補正した第2対応情報154に基づいて、更に制御し、車両Mの乗員が所望する制御が行われるまでの間(つまり、制御場面において制御量を補正する指示が含まれた発話がなくなるまでの間)、処理を繰り返す。
[動作フロー]
図14は、変形例に係るエージェントシステム1の一連の動作の一例を示すフローチャートである。図14に示す処理のうち、図12に示す処理と同一の処理については、同一のステップ番号を付して説明を省略する。
ステップS118において、エージェント機能部130が決定した制御量によって制御対象の車両機器60を制御した後、変形例の自然言語処理部221は、ステップS102〜S108と同様の処理を行い、意味解釈された車両Mの乗員の発話が、車両Mの乗員が制御量の補正に係る発話であるか否かを判定する(ステップS200)。自然言語処理部221は、意味解釈された車両Mの乗員の発話が、車両Mの乗員が制御量の補正に係る発話ではないと判定した場合、処理をステップS120に進める。エージェント機能部130は、自然言語処理部221により、意味解釈された車両Mの乗員の発話が、車両Mの乗員が制御量の補正に係る発話であると判定された場合、発話の内容に基づいて、第2対応情報154を補正する(ステップS202)。エージェント機能部130は、例えば、制御量を補正する指示から、現在の制御状態から変更したい車両機器60の制御状態や、車両機器60の動作量の程度を特定し、特定した情報に基づいて、第2対応情報154を補正する。また、エージェント機能部130は、補正の結果、他の指示と制御量が同一になってしまった場合、当該補正に応じた制御量だけ、他の指示の制御量を増やしたり、減らしたりする補正を更に行ってもよい。エージェント機能部130は、補正した第2対応情報154に基づいて、制御量を決定し(ステップS204)、処理をステップS118に進める。エージェント機能部130は、ステップS204において決定された制御量に基づいて、車両機器60を制御する。
[変形例のまとめ]
以上説明したように、変形例のエージェントシステム1によれば、乗員の発話に応じて第2対応情報154を補正し、乗員が所望する車両機器60の制御を補正することができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1…エージェントシステム、10…マイク、20…スピーカ、30…表示・操作装置、40…汎用スイッチ、50…ナビゲーション装置、60…車両機器、70…車載通信装置、80…乗員認識装置、100…エージェント装置、110…管理部、112…音響処理部、114…エージェントWU判定部、116…通信制御部、120…出力制御部、122…音声制御部、124…表示制御部、126…受付部、130…エージェント機能部、140…車載通信部、150…記憶部、152…制御量情報、154…第2対応情報、156…第3対応情報、200…エージェントサーバ、210…通信部、220…音声認識部、221…自然言語処理部、222…対話管理部、223…ネットワーク検索部、224…応答内容生成部、250…記憶部、252A…機能辞書、252B…汎用辞書、252…辞書DB、254…パーソナルプロファイル、256…知識ベースDB、258…応答規則DB、260…第1対応情報、300…各種ウェブサーバ

Claims (8)

  1. 制御対象装置、制御装置、第1記憶部、第2記憶部、第3記憶部、及び音声インターフェース装置とを含む制御システムであって、
    利用者により発話された音声を示すデータを取得する取得部と、
    前記取得部により取得された前記データに基づいて、前記利用者の発話の内容を解釈する発話内容解釈部と、
    前記発話の内容に、前記制御対象装置における制御対象を制御する指示が含まれる場合、指示と前記制御対象の動作量とが対応付けられた第2記憶部に記憶された第1対応情報を参照し、前記制御対象の動作量を決定する決定部と、
    前記決定部により決定された動作量で前記制御対象を制御するように前記制御装置に指示する指示部と、を備えるとともに、
    前記指示部は、前記制御装置によって実際に前記制御対象が制御された際の制御量を、前記発話内容解釈部により解釈された指示に基づく情報に対応付けられた第2対応情報として前記第1記憶部に登録させる、
    制御システム。
  2. 前記指示部は、前記発話内容解釈部に解釈された指示と、前記第2対応情報とに更に基づいて、前記制御対象を制御するように前記制御装置に指示する、
    請求項1に記載の制御システム。
  3. 前記利用者の操作を受け付ける受付部を更に備え、
    前記指示部は、当該指示部の指示に応じて前記制御対象が制御される場合において、前記受付部により前記利用者の操作が受け付けられた場合に、前記指示部の指示による制御の内容を、前記利用者の操作に対応付けた第3対応情報として前記第1記憶部に記憶させる、
    請求項1または2に記載の制御システム。
  4. 前記利用者の操作を受け付ける受付部を、前記制御対象の該制御対象装置専用に更に備え、
    前記指示部は、当該指示部の指示に応じて前記制御対象が制御される場合において、前記受付部により前記利用者の操作が受け付けられた場合に、前記指示部の指示による制御の内容を、前記利用者の操作に対応付けた第4対応情報として第3記憶部に記憶させる、
    請求項1または2に記載の制御システム。
  5. 前記指示部は、前記受付部に受け付けられた操作と、前記第3対応情報とに更に基づいて、前記制御対象を制御するように前記制御装置に指示する、
    請求項3に記載の制御システム。
  6. 前記指示部の指示に応じて前記制御対象が制御される場合において、前記受付部の操作を促す通知部を更に備える、
    請求項3または4に記載の制御システム。
  7. 前記指示部の指示に応じて前記制御対象が制御される場合において、解釈された前記発話の内容に前記制御量を補正する指示が含まれる場合、当該指示に基づいて前記第2対応情報を更新する、
    請求項1から5のうちいずれか一項に記載の制御システム。
  8. 制御対象装置、制御装置、第1記憶部、第2記憶部、第3記憶部、及び音声インターフェース装置とを構成する複数のコンピュータが実行する、
    利用者により発話された音声を示すデータを取得する取得プロセスと、
    取得された前記データに基づいて、前記利用者の発話の内容を解釈する発話内容解釈プロセスと、
    前記発話の内容に前記制御対象装置を制御する指示が含まれる場合、指示と前記制御対象装置の動作量とが対応付けられた第2記憶部に記憶された第1対応情報を参照し、前記制御対象装置の動作量を決定する決定プロセスと、
    決定された前記動作量で前記制御対象装置を制御するように前記制御装置に指示する指示プロセスと、
    前記制御装置により実際に前記制御対象装置が制御された際の制御量が、解釈された指示に基づく情報に対応付けられた第2対応情報として前記第1記憶部に登録される登録プロセスと、
    を有する制御方法。
JP2019156830A 2019-08-29 2019-08-29 制御システム、及び制御方法 Pending JP2021033929A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019156830A JP2021033929A (ja) 2019-08-29 2019-08-29 制御システム、及び制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019156830A JP2021033929A (ja) 2019-08-29 2019-08-29 制御システム、及び制御方法

Publications (1)

Publication Number Publication Date
JP2021033929A true JP2021033929A (ja) 2021-03-01

Family

ID=74677471

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019156830A Pending JP2021033929A (ja) 2019-08-29 2019-08-29 制御システム、及び制御方法

Country Status (1)

Country Link
JP (1) JP2021033929A (ja)

Similar Documents

Publication Publication Date Title
US11532303B2 (en) Agent apparatus, agent system, and server device
JP7239366B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7198122B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US20200317055A1 (en) Agent device, agent device control method, and storage medium
US11608076B2 (en) Agent device, and method for controlling agent device
JP7274903B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7222757B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7288781B2 (ja) 情報提供装置、情報提供方法、およびプログラム
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US11797261B2 (en) On-vehicle device, method of controlling on-vehicle device, and storage medium
US11542744B2 (en) Agent device, agent device control method, and storage medium
US20200320998A1 (en) Agent device, method of controlling agent device, and storage medium
JP7175221B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US20200320997A1 (en) Agent apparatus, agent apparatus control method, and storage medium
CN111798842B (zh) 对话系统和对话处理方法
JP2021033929A (ja) 制御システム、及び制御方法
JP2020152298A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020154994A (ja) エージェントシステム、エージェントサーバ、エージェントサーバの制御方法、およびプログラム
JP2020142758A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020160133A (ja) エージェントシステム、エージェントシステムの制御方法、およびプログラム
JP7217209B2 (ja) 音声対話装置、音声対話方法、及びプログラム
JP7297483B2 (ja) エージェントシステム、サーバ装置、エージェントシステムの制御方法、およびプログラム
JP7274901B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7274376B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2021026188A (ja) 通信制御システム、通知制御方法、及び通信制御プログラム