JP2020157855A - エージェント装置、エージェント装置の制御方法、およびプログラム - Google Patents

エージェント装置、エージェント装置の制御方法、およびプログラム Download PDF

Info

Publication number
JP2020157855A
JP2020157855A JP2019057645A JP2019057645A JP2020157855A JP 2020157855 A JP2020157855 A JP 2020157855A JP 2019057645 A JP2019057645 A JP 2019057645A JP 2019057645 A JP2019057645 A JP 2019057645A JP 2020157855 A JP2020157855 A JP 2020157855A
Authority
JP
Japan
Prior art keywords
agent
display
interrupt
information
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019057645A
Other languages
English (en)
Other versions
JP7239366B2 (ja
Inventor
善史 我妻
Yoshifumi Wagatsuma
善史 我妻
基嗣 久保田
Mototsugu Kubota
基嗣 久保田
俊克 倉持
Toshikatsu Kuramochi
俊克 倉持
裕介 大井
Yusuke Oi
裕介 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2019057645A priority Critical patent/JP7239366B2/ja
Priority to US16/822,049 priority patent/US20200319841A1/en
Priority to CN202010210416.1A priority patent/CN111752686A/zh
Publication of JP2020157855A publication Critical patent/JP2020157855A/ja
Application granted granted Critical
Publication of JP7239366B2 publication Critical patent/JP7239366B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4812Task transfer initiation or dispatching by interrupt, e.g. masked
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/147Digital output to display device ; Cooperation and interconnection of the display device with other functional units using display panels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3626Details of the output of route guidance instructions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3626Details of the output of route guidance instructions
    • G01C21/3629Guidance using speech or audio output, e.g. text-to-speech
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/003Details of a display terminal, the details relating to the control arrangement of the display terminal and to the interfaces thereto
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L15/222Barge in, i.e. overridable guidance for interrupting prompts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/40Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
    • H04W4/44Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for communication between vehicles and infrastructures, e.g. vehicle-to-cloud [V2C] or vehicle-to-home [V2H]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/20Details of the management of multiple sources of image data
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/24Keyboard-Video-Mouse [KVM] switch
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2380/00Specific applications
    • G09G2380/10Automotive applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Automation & Control Theory (AREA)
  • Acoustics & Sound (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mechanical Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Navigation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Stored Programmes (AREA)

Abstract

【課題】より自然な使用感でエージェント機能によるサービス提供を開始または終了することができるエージェント装置、エージェント装置の制御方法、およびプログラムを提供すること。【解決手段】車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェントを表示部(20)に表示させる表示制御部(116)と、前記乗員の状況、前記エージェントの稼働状況、および前記車両の稼働状況に基づいて前記エージェントを制御する制御部(120)と、を備えるエージェント装置(100)であって、前記制御部は、前記エージェントによるサービス提供の最中に割り込み制御が発生した場合、前記割り込みに関する情報の割り込み情報と被割り込み関連情報とを表示する制御を行う、エージェント装置。【選択図】図2

Description

本発明は、エージェント装置、エージェント装置の制御方法、およびプログラムに関する。
従来、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供するエージェント機能に関する技術が開示されている(例えば、特許文献1参照)。
特開2006−335231号公報
近年では、複数のエージェント機能が車両に搭載されたり、ナビゲーション装置などの他装置により提供される機能とエージェント機能とが同時に利用されたりする場合がある。この場合において、エージェント機能が実行されている際に他のエージェント機能または他装置による割り込み処理が発生した場合など、エージェントの発話が途切れることがある。このようなエージェントの発話が途切れた場合の対処について十分に検討されていなかった。このため、従来の技術では、自然な使用感を乗員に提供することができない場合があった。
本発明は、このような事情を考慮してなされたものであり、より自然な使用感でエージェント機能によるサービス提供を開始または終了することができるエージェント装置、エージェント装置の制御方法、およびプログラムを提供することを目的の一つとする。
この発明に係るエージェント装置、エージェント装置の制御方法、およびプログラムは、以下の構成を採用した。
(1):この発明の一態様に係るエージェント装置は、車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェントを表示部に表示させる制御を行う表示制御部と、前記乗員の状況、前記エージェントの稼働状況、および他装置の稼働状況に基づいて前記エージェントを制御する制御部と、を備えるエージェント装置であって、前記表示制御部は、前記エージェントによるサービス提供の最中に割り込み制御が発生した場合、前記割り込みに関する情報の割り込み情報と被割り込み関連情報とを表示する制御を行うものである。
(2):上記(1)の態様において、前記被割り込み関連情報は、前記エージェントが提供中であったサービスに関連する報知情報である。
(3):上記(1)または(2)の態様において、前記表示制御部は、前記非割り込み関連情報の表示を消す制御を行った後、前記割り込み情報を消す制御を行うものである。
(4):上記(1)から(3)のいずれかの態様において、前記サービス提供は第1のエージェント及び第2のエージェントからそれぞれ提供されるものであって、前記表示制御部は、前記第1のエージェントを表示中に前記第2のエージェントによる割り込み制御が発生した場合に、前記第1のエージェントの表示を制限するものである。
(5):上記(4)の態様において、前記制御部は、前記割り込み制御が終了した場合、被割り込み関連情報の表示を終了して前記第1のエージェント機能部によるサービス提供を再開させるものである。
(6):上記(5)の態様において、前記制御部は、前記割り込み制御が開始される前に提供途中であったサービス提供を一時的に停止し、前記割り込み制御が終了した場合、前記一時的に停止したサービス提供を再開させるものである。
(7):上記(6)の態様において、前記制御部は、前記サービス提供を一時的に停止した時点のエージェントの発話の先頭から再開させるものである。
(8):上記(5)から(7)のいずれかの態様において、前記制御部は、前記割り込み制御が開始される前に提供途中であったサービス提供を一時的に停止し、前記割り込み制御が開始される前に提供途中であったサービス提供内容に関連する処理を継続実行し、前記割り込み制御が終了した場合、前記一時的に停止したサービス提供内容、および前記継続実行した処理の結果に基づいて前記第1のエージェント機能部によるサービス提供を再開させるものである。
(9):上記(1)から(8)のいずれかの態様において、前記制御部は、前記表示部に前記サービス提供が抑制された間の待機時間に応じて前記被割り込み関連情報の表示態様を変更するものである。
(10):本発明の他の態様に係るエージェント装置の制御方法は、車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェントを表示部に表示させる制御を行う表示制御部と、前記乗員の状況、前記複数のエージェント機能部の稼働状況、および前記車両の稼働状況に基づいて前記エージェントを制御する制御部と、を備えるエージェント装置を制御する制御方法であって、エージェント装置のコンピュータが、前記表示制御部に、前記エージェントによるサービス提供の最中に割り込み制御が発生した場合、前記割り込みに関する情報の割り込み情報と被割り込み関連情報とを表示する制御を行わせる、エージェント装置の制御方法である。
(11):本発明の他の態様に係るプログラムは、コンピュータに、車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェントを表示部に表示させる制御を行わせ、前記乗員の状況、前記複数のエージェント機能部の稼働状況、および前記車両の稼働状況に基づいて前記エージェントを制御させる、プログラムであって、前記エージェントによるサービス提供の最中に割り込み制御が発生した場合、前記割り込みに関する情報の割り込み情報と被割り込み関連情報とを表示する制御を行わせる、プログラムである。
(1)〜(11)の態様によれば、より自然な使用感でエージェント機能によるサービス提供を開始または終了することができる。
エージェント装置100を含むエージェントシステム1の構成図である。 第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。 表示・操作装置20の配置例を示す図である。 スピーカユニット30の配置例を示す図である。 エージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。 被割り込み制御部124による処理を説明するための図である。 被割り込み制御部124による待機時間と、第1ディスプレイ22に表示される被割り込み関連情報の関係を説明するための図である。 被割り込み制御部124による表示態様の変更の一例を説明するための図である。 被割り込み制御部124による表示態様の変更の他の一例を説明するための図である。 エージェント装置100による処理の流れの一例を示すフローチャートである。
以下、図面を参照し、本発明のエージェント装置、エージェント装置の制御方法、およびプログラムの実施形態について説明する。エージェント装置は、エージェントシステムの一部または全部を実現する装置である。以下では、エージェント装置の一例として、車両(以下、車両M)に搭載され、複数種類のエージェント機能を備えたエージェント装置について説明する。エージェント機能とは、例えば、車両Mの乗員と対話をしながら、乗員の発話の中に含まれる要求(コマンド)に基づく各種の情報提供を行ったり、ネットワークサービスを仲介したりする機能である。複数種類のエージェントはそれぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器(例えば運転制御や車体制御に関わる機器)の制御等を行う機能を有するものがあってよい。
エージェント機能は、例えば、乗員の音声を認識する音声認識機能(音声をテキスト化する機能)に加え、自然言語処理機能(テキストの構造や意味を理解する機能)、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、AI(Artificial Intelligence)技術によって実現されてよい。また、これらの機能を行うための構成の一部(特に、音声認識機能や自然言語処理解釈機能)は、車両Mの車載通信装置または車両Mに持ち込まれた汎用通信装置と通信可能なエージェントサーバ(外部装置)に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービスをエージェントと称する。
<全体構成>
図1は、エージェント装置100を含むエージェントシステム1の構成図である。エージェントシステム1は、例えば、エージェント装置100と、複数のエージェントサーバ200−1、200−2、200−3、…とを備える。符号の末尾のハイフン以下の数字は、エージェントを区別するための識別子であるものとする。いずれのエージェントサーバであるかを区別しない場合、単にエージェントサーバ200と称する場合がある。図1では3つのエージェントサーバ200を示しているが、エージェントサーバ200の数は2つであってもよいし、4つ以上であってもよい。それぞれのエージェントサーバ200は、互いに異なるエージェントシステムの提供者が運営するものである。従って、本発明におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者や製造者などが挙げられ、任意の主体(法人、団体、個人等)がエージェントシステムの提供者となり得る。
エージェント装置100は、ネットワークNWを介してエージェントサーバ200と通信する。ネットワークNWは、例えば、インターネット、セルラー網、Wi−Fi網、WAN(Wide Area Network)、LAN(Local Area Network)、公衆回線、電話回線、無線基地局などのうち一部または全部を含む。ネットワークNWには、各種ウェブサーバ300が接続されており、エージェントサーバ200またはエージェント装置100は、ネットワークNWを介して各種ウェブサーバ300からウェブページを取得することができる。
エージェント装置100は、車両Mの乗員と対話を行い、乗員からの音声をエージェントサーバ200に送信し、エージェントサーバ200から得られた回答を、音声出力や画像表示の形で乗員に提示する。
<第1実施形態>
[車両]
図2は、第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、表示・操作装置20と、スピーカユニット30と、ナビゲーション装置40と、車両機器50と、車載通信装置60と、乗員認識装置80と、エージェント装置100とが搭載される。また、スマートフォンなどの汎用通信装置70が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図2に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。
マイク10は、車室内で発せられた音声を収集する収音部である。表示・操作装置20は、画像を表示すると共に、入力操作を受付可能な装置(或いは装置群)である。表示・操作装置20は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置20は、更に、HUD(Head Up Display)や機械式の入力装置を含んでもよい。スピーカユニット30は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ(音出力部)を含む。表示・操作装置20は、エージェント装置100とナビゲーション装置40とで共用されてもよい。これらの詳細については後述する。
ナビゲーション装置40は、ナビHMI(Human machine Interface)と、GPS(Global Positioning System)などの位置測位装置と、地図情報を記憶した記憶装置と、経路探索などを行う制御装置(ナビゲーションコントローラ)とを備える。マイク10、表示・操作装置20、およびスピーカユニット30のうち一部または全部がナビHMIとして用いられてもよい。ナビゲーション装置40は、位置測位装置によって特定された車両Mの位置から、乗員によって入力された目的地まで移動するための経路(ナビ経路)を探索し、経路に沿って車両Mが走行できるように、ナビHMIを用いて案内情報を出力する。経路探索機能は、ネットワークNWを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置40は、ナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置100は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置100は、ハードウェア上は一体に構成される。以下の説明において、ナビゲーション装置40により提供されるサービスを「ナビ機能」と称する場合がある。
車両機器50は、例えば、エンジンや走行用モータなどの駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置、窓、窓の開閉装置及び窓の開閉制御装置、シート、シート位置の制御装置、ルームミラー及びその角度位置制御装置、車両内外の照明装置及びその制御装置、ワイパーやデフォッガー及びそれぞれの制御装置、方向指示灯及びその制御装置、空調装置、走行距離やタイヤの空気圧の情報や燃料の残量情報などの車両情報装置などを含む。
車載通信装置60は、例えば、セルラー網やWi−Fi網を利用してネットワークNWにアクセス可能な無線通信装置である。
乗員認識装置80は、例えば、着座センサ、車室内カメラ、画像認識装置などを含む。着座センサは座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサなどを含む。車室内カメラは、車室内に設けられたCCD(Charge Coupled Device)カメラやCMOS(Complementary Metal Oxide Semiconductor)カメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとの乗員の有無、顔向きなどを認識する。
図3は、表示・操作装置20の配置例を示す図である。表示・操作装置20は、例えば、第1ディスプレイ22と、第2ディスプレイ24と、操作スイッチASSY26とを含む。表示・操作装置20は、更に、HUD28を含んでもよい。
車両Mには、例えば、ステアリングホイールSWが設けられた運転席DSと、運転席DSに対して車幅方向(図中Y方向)に設けられた助手席ASとが存在する。第1ディスプレイ22は、インストルメントパネルにおける運転席DSと助手席ASとの中間辺りから、助手席ASの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第2ディスプレイ24は、運転席DSと助手席ASとの車幅方向に関する中間あたり、且つ第1ディスプレイの下方に設置されている。例えば、第1ディスプレイ22と第2ディスプレイ24は、共にタッチパネルとして構成され、表示部としてLCD(Liquid Crystal Display)や有機EL(Electroluminescence)、プラズマディスプレイなどを備えるものである。操作スイッチASSY26は、ダイヤルスイッチやボタン式スイッチなどが集積されたものである。表示・操作装置20は、乗員によってなされた操作の内容をエージェント装置100に出力する。第1ディスプレイ22または第2ディスプレイ24が表示する内容は、エージェント装置100によって決定されてよい。
図4は、スピーカユニット30の配置例を示す図である。スピーカユニット30は、例えば、スピーカ30A〜30Hを含む。スピーカ30Aは、運転席DS側の窓柱(いわゆるAピラー)に設置されている。スピーカ30Bは、運転席DSに近いドアの下部に設置されている。スピーカ30Cは、助手席AS側の窓柱に設置されている。スピーカ30Dは、助手席ASに近いドアの下部に設置されている。スピーカ30Eは、右側後部座席BS1側に近いドアの下部に設置されている。スピーカ30Fは、左側後部座席BS2側に近いドアの下部に設置されている。スピーカ30Gは、第2ディスプレイ24の近傍に設置されている。スピーカ30Hは、車室の天井(ルーフ)に設置されている。
係る配置において、例えば、専らスピーカ30Aおよび30Bに音を出力させた場合、音像は運転席DS付近に定位することになる。また、専らスピーカ30Cおよび30Dに音を出力させた場合、音像は助手席AS付近に定位することになる。また、専らスピーカ30Eに音を出力させた場合、音像は右側後部座席BS1付近に定位することになる。また、専らスピーカ30Fに音を出力させた場合、音像は左側後部座席BS2付近に定位することになる。また、専らスピーカ30Gに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ30Hに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット30は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。
[エージェント装置]
図2に戻り、エージェント装置100は、管理部110と、エージェント機能部150−1、150−2、150−3と、ペアリングアプリ実行部152とを備える。管理部110は、例えば、音響処理部112と、表示制御部116と、音声制御部118と、起動制御部120とを備える。いずれのエージェント機能部であるか区別しない場合、単にエージェント機能部150と称する。3つのエージェント機能部150を示しているのは、図1におけるエージェントサーバ200の数に対応させた一例に過ぎず、エージェント機能部150の数は、2つであってもよいし、4つ以上であってもよい。図2に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部150と車載通信装置60の間に管理部110が介在してもよいように、任意に改変することができる。
エージェント装置100の各構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
エージェント機能部150は、対応するエージェントサーバ200と協働してエージェントを出現させ、車両の乗員の発話に応じて、音声による応答を含むサービスを提供する。エージェント機能部150には、車両機器50を制御する権限が付与されたものが含まれてよい。また、エージェント機能部150には、ペアリングアプリ実行部152を介して汎用通信装置70と連携し、エージェントサーバ200と通信するものがあってよい。例えば、エージェント機能部150−1には、車両機器50を制御する権限が付与されている。エージェント機能部150−1は、車載通信装置60を介してエージェントサーバ200−1と通信する。エージェント機能部150−2は、車載通信装置60を介してエージェントサーバ200−2と通信する。エージェント機能部150−3は、ペアリングアプリ実行部152を介して汎用通信装置70と連携し、エージェントサーバ200−3と通信する。ペアリングアプリ実行部152は、例えば、Bluetooth(登録商標)によって汎用通信装置70とペアリングを行い、エージェント機能部150−3と汎用通信装置70とを接続させる。なお、エージェント機能部150−3は、USB(Universal Serial Bus)などを利用した有線通信によって汎用通信装置70に接続されるようにしてもよい。以下、エージェント機能部150−1とエージェントサーバ200−1が協働して出現させるエージェントをエージェント1、エージェント機能部150−2とエージェントサーバ200−2が協働して出現させるエージェントをエージェント2、エージェント機能部150−3とエージェントサーバ200−3が協働して出現させるエージェントをエージェント3と称する場合がある。
管理部110は、OS(Operating System)やミドルウェアなどのプログラムが実行されることで機能する。
音響処理部112は、エージェントごとに予め設定されているウエイクアップワードを認識するのに適した状態になるように、入力された音に対して音響処理を行う。
表示制御部116は、エージェント機能部150からの指示に応じて第1ディスプレイ22または第2ディスプレイ24に画像を表示させる。以下では、第1ディスプレイ22を使用するものとする。表示制御部116は、一部のエージェント機能部150の制御により、例えば、車室内で乗員とのコミュニケーションを行う擬人化されたエージェントの画像(以下、エージェント画像と称する)を生成し、生成したエージェント画像を第1ディスプレイ22に表示させる。エージェント画像は、例えば、乗員に対して話しかける態様の画像である。エージェント画像は、例えば、少なくとも観者(乗員)によって表情や顔向きが認識される程度の顔画像を含んでよい。例えば、エージェント画像は、顔領域の中に目や鼻に擬したパーツが表されており、顔領域の中のパーツの位置に基づいて表情や顔向きが認識されるものであってよい。また、エージェント画像は、立体的に感じられ、観者によって三次元空間における頭部画像を含むことでエージェントの顔向きが認識されたり、本体(胴体や手足)の画像を含んだりすることで、エージェントの動作や振る舞い、姿勢等が認識されるものであってもよい。また、エージェント画像は、アニメーション画像であってもよい。
音声制御部118は、エージェント機能部150からの指示に応じて、スピーカユニット30に含まれるスピーカのうち一部または全部に音声を出力させる。音声制御部118は、複数のスピーカユニット30を用いて、エージェント画像の表示位置に対応する位置にエージェント音声の音像を定位させる制御を行ってもよい。エージェント画像の表示位置に対応する位置とは、例えば、エージェント画像がエージェント音声を喋っていると乗員が感じると予測される位置であり、具体的には、エージェント画像の表示位置付近(例えば、2〜3[cm]以内)の位置である。また、音像が定位するとは、例えば、乗員の左右の耳に伝達される音の大きさを調節することにより、乗員が感じる音源の空間的な位置を定めることである。
起動制御部120は、乗員の状況、およびエージェント装置100以外の他装置を含む車両Mの稼働状況、エージェント機能部150の稼働状況に基づいて、エージェント機能部150を制御する。起動制御部120は、「制御部」の一例である。
起動制御部120は、例えば、エージェントごとWU(Wake Up)判定部122と、被割り込み制御部124とを備える。
エージェントごとWU判定部122は、エージェント機能部150−1、150−2、150−3のそれぞれに対応して存在し、エージェントごとに予め定められているウエイクアップワードを認識する。エージェントごとWU判定部122は、音響処理が行われた音声(音声ストリーム)から音声の意味を認識する。まず、エージェントごとWU判定部122は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントごとWU判定部122は、混合ガウス分布モデル(GMM;Gaussian mixture model) に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。
次に、エージェントごとWU判定部122は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントごとWU判定部122は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合。エージェントごとWU判定部122は、対応するエージェント機能部150を起動させる。なお、エージェントごとWU判定部122に相当する機能がエージェントサーバ200に搭載されてもよい。この場合、管理部110は、音響処理部112によって音響処理が行われた音声ストリームをエージェントサーバ200に送信し、エージェントサーバ200がウエイクアップワードであると判定した場合、エージェントサーバ200からの指示に従ってエージェント機能部150が起動する。なお、各エージェント機能部150は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部110がエージェントごとWU判定部122を備える必要はない。
被割り込み制御部124は、エージェント機能部150が表示・操作装置20にエージェントを表示させてサービスを提供している最中に、他装置(例えば、ナビゲーション装置40や車両機器50)または他のエージェント機能部150が他のサービスを提供する処理を割り込み起動させる場合、既に起動しているエージェント機能部150のサービス提供を終了する制御(以下、被割り込み制御)を行う。被割り込み制御部124による被割り込み制御については後述する。
[エージェントサーバ]
図5は、エージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。以下、エージェントサーバ200の構成と共にエージェント機能部150等の動作について説明する。ここでは、エージェント装置100からネットワークNWまでの物理的な通信についての説明を省略する。
エージェントサーバ200は、通信部210を備える。通信部210は、例えばNIC(Network Interface Card)などのネットワークインターフェースである。更に、エージェントサーバ200は、例えば、音声認識部220と、自然言語処理部222と、対話管理部224と、ネットワーク検索部226と、応答文生成部228とを備える。これらの構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
エージェントサーバ200は、記憶部250を備える。記憶部250は、上記の各種記憶装置により実現される。記憶部250には、パーソナルプロファイル252、辞書DB(データベース)254、知識ベースDB256、応答規則DB258などのデータやプログラムが格納される。
エージェント装置100において、エージェント機能部150は、音声ストリーム、或いは圧縮や符号化などの処理を行った音声ストリームを、エージェントサーバ200に送信する。エージェント機能部150は、ローカル処理(エージェントサーバ200を介さない処理)が可能な音声コマンドを認識した場合は、音声コマンドで要求された処理を行ってよい。ローカル処理が可能な音声コマンドとは、エージェント装置100が備える記憶部(不図示)を参照することで回答可能な音声コマンドであったり、エージェント機能部150−1の場合は車両機器50を制御する音声コマンド(例えば、空調装置をオンにするコマンドなど)であったりする。従って、エージェント機能部150は、エージェントサーバ200が備える機能の一部を有してもよい。
音声ストリームを取得すると、音声認識部220が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部222が文字情報に対して辞書DB254を参照しながら意味解釈を行う。辞書DB254は、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書DB254は、同義語や類義語の一覧情報を含んでもよい。音声認識部220の処理と、自然言語処理部222の処理は、段階が明確に分かれるものではなく、自然言語処理部222の処理結果を受けて音声認識部220が認識結果を修正するなど、相互に影響し合って行われてよい。
自然言語処理部222は、例えば、認識結果として、「今日の天気は」、「天気はどうですか」等の意味が認識された場合、標準文字情報「今日の天気」に置き換えたコマンドを生成する。これにより、リクエストの音声に文字揺らぎがあった場合にも要求にあった対話をし易くすることができる。また、自然言語処理部222は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成してもよい。
対話管理部224は、自然言語処理部222の処理結果(コマンド)に基づいて、パーソナルプロファイル252や知識ベースDB256、応答規則DB258を参照しながら車両Mの乗員に対する発話の内容を決定する。パーソナルプロファイル252は、乗員ごとに保存されている乗員の個人情報、趣味嗜好、過去の対話の履歴などを含む。知識ベースDB256は、物事の関係性を規定した情報である。応答規則DB258は、コマンドに対してエージェントが行うべき動作(回答や機器制御の内容など)を規定した情報である。
また、対話管理部224は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル252と照合を行うことで、乗員を特定してもよい。この場合、パーソナルプロファイル252には、例えば、音声の特徴情報に、個人情報が対応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム(音の高低のパターン)等の喋り方の特徴や、メル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficients)等による特徴量に関する情報である。音声の特徴情報は、例えば、乗員の初期登録時に所定の単語や文章等を乗員に発声させ、発声させた音声を認識することで得られる情報である。
対話管理部224は、コマンドが、ネットワークNWを介して検索可能な情報を要求するものである場合、ネットワーク検索部226に検索を行わせる。ネットワーク検索部226は、ネットワークNWを介して各種ウェブサーバ300にアクセスし、所望の情報を取得する。「ネットワークNWを介して検索可能な情報」とは、例えば、車両Mの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Mの位置に応じた天気予報であったりする。
応答文生成部228は、対話管理部224により決定された発話の内容が車両Mの乗員に伝わるように、応答文を生成し、エージェント装置100に送信する。応答文生成部228は、乗員がパーソナルプロファイルに登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にした応答文を生成してもよい。
エージェント機能部150は、応答文を取得すると、音声合成を行って音声を出力するように音声制御部118に指示する。また、エージェント機能部150は、音声出力に合わせてエージェントの画像を表示するように表示制御部116に指示する。このようにして、仮想的に出現したエージェントが車両Mの乗員に応答するエージェント機能が実現される。
[被割り込み制御]
以下、被割り込み制御部124において実行される被割り込み制御について説明する。被割り込み処理とは、エージェント機能部150のサービス提供の最中にエージェント機能部150のサービスの提供よりも優先的に受け付けると利用者によりあらかじめ設定されていた外部装置によるサービス提供または他のエージェント機能部150が起動する場合に、稼働中のエージェント機能部150のサービス提供を一旦終了し、外部装置または他のエージェント機能による情報提供の終了後にエージェント機能部150によるサービス提供を再開させる処理である。被割り込み処理は、例えば、電話・メッセージ等の着信、アラーム、ナビゲーション装置40によるPOI(Point of Interest)通知、車載バッテリ残量低下等のアラートなどの、乗員にとって緊急度が高い情報や、乗員により優先的に知らせるよう設定された情報が提供される場合に発生する処理である。以下の説明において、被割り込み制御を開始させる外部装置または他のエージェント機能部150による処理のことを「割り込み処理」と称する場合がある。
被割り込み制御部124は、被割り込み処理の開始により、エージェント機能部150の提供するサービスに関連する情報の第1ディスプレイ22への表示やエージェントの発話を終了する場合、完全に表示および発話が終了されるまでに何らかの前置き処理(例えば、表示内容を切り替えることをユーザに報知するための画面表示や、エージェント機能による表示内容を切り替えることを乗員に報知する「少々お待ちください」、「エージェントサービスを休止します」などの発話、エージェントの発話の音量が徐々に下がる、割り込み処理の開始を示すアラーム音を鳴らすなど)を行ってもよいし、即時終了して割り込み処理を行う外部装置または他のエージェント機能部150による制御が開始されてもよい。以下、上記のような被割り込み処理の開始直前の表示を「被割り込み開始制御」と称する。
また、被割り込み制御部124は、被割り込み処理を終了する場合、割り込みにより終了されたエージェント機能部150の提供するサービスに関連する情報の第1ディスプレイ22への表示やエージェントの発話を再開する。被割り込み制御部124は、被割り込み制御が開始された際にサービス提供途中であった表示および発話の停止位置からサービス提供を再開させてもよいし、表示および発話を区切りのよい位置である、サービス提供の最初の発話や発話途中であった発話文の先頭から言い直しさせてもよいし、終了された発話の振り出しなどまで遡って再開させてもよいし、被割り込み制御により終了される前に表示していた情報とは異なる表示および発話を行ってもよい。被割り込み制御が終了した場合、エージェント機能部150がどのようにサービス提供を再開させるかは、あらかじめ乗員によって設定されるものであってもよいし、エージェント機能部150が通常のサービス提供時と同様に、被割り込み制御終了時の車両Mの位置情報や乗員認識装置80を介して乗員の様子などを認識した結果、マイク10を介して収音された乗員の発話に基づいてその都度決定するものであってもよい。
以下の説明において、エージェント機能部150−1によるサービス提供中にナビゲーション装置40による割り込み処理が発生したものとして説明するが、これに限定されるものではなく、例えば、エージェント機能部150−1によるサービス提供中に、エージェント機能部150−2による割り込み処理が発生した場合などにも同様の制御が行われるものであってもよい。また、第1ディスプレイ22は、エージェント装置100とナビゲーション装置40とで共用されているものとして説明する。エージェント機能部150―1により実現されるエージェント機能は「第1のエージェント」の一例である。
また、以下の説明において、ナビゲーション装置40の割り込み処理により第1ディスプレイ22に表示される情報を「割り込み情報」と称する場合がある。
図6は、被割り込み制御部124による処理を説明するための図である。第1ディスプレイ22は、時刻t1以前にはエージェント機能部150−1およびナビゲーション装置40からの表示入力を受け付けておらず、何も投影していない。管理部110は、時刻t1において乗員のウエイクアップワードの発話がエージェントごとWU判定部122により認識された場合、または事前に予約設定されていた起動条件が満たされた場合に、被割り込み制御部124にエージェント機能部150−1のエージェント機能1を第1ディスプレイ22に表示させてもよいか否かを判定させる。被割り込み制御部124は、他装置や他エージェント機能が起動していないことを確認して、エージェント機能1を表示させてもよいと判定する。これ以後、被割り込み制御部124は、エージェント機能1によるサービス提供が終了するまで、他機能による割り込み処理を受け付けるための処理(以下、割り込み判定処理)を行う。割り込み判定処理は、0.5〔sec〕程度の周期で繰り返し行われる。管理部110は、時刻t2の時点から被割り込み制御部124による割り込み判定処理の結果と、時刻t1以降の乗員の発話または事前に予約設定されていたサービス提供内容に基づいて、エージェント機能部150によるエージェント機能1を第1ディスプレイ22に表示させてサービス提供を開始させる。
ナビゲーション装置40は、時刻t3において、第1ディスプレイ22に割り込み情報を表示させるよう、管理部110に出力指示を行う。被割り込み制御部124は割り込み判定処理の結果、ナビゲーション装置40による割り込みを開始すると決定し、表示中のエージェント機能1による表示および発話を終了して、第1ディスプレイ22にナビゲーション装置40によるナビ機能を表示させる。このとき、被割り込み制御部124は、被割り込み開始制御に基づく情報を第1ディスプレイ22に表示させてもよい。また、このとき、エージェント機能部150−1は、エージェント機能1が被割り込み制御処理中であることを示す何らかの表示(以下、被割り込み関連情報)を第1ディスプレイ22に表示させてもよい。被割り込み関連情報とは、エージェント機能部150−1が提供中であったサービスに関連する報知情報であり、例えば、被割り込み制御中であることを示す文字情報、アイコンなどである。
被割り込み制御部124は、第1ディスプレイ22にエージェント機能1によるサービス提供が抑制された間の待機時間に応じて、被割り込み関連情報の表示態様を変更してもよい。その場合、図6に示すように、複数パターンの被割り込み制御情報が表示されてもよい。
図7は、被割り込み制御部124による待機時間と、第1ディスプレイ22に表示される被割り込み関連情報の関係を説明するための図である。被割り込み制御部124は、例えば、待機時間が30[sec]未満である場合には、エージェント機能1の表示態様を表示パターン1とし、待機時間が30[sec]以上となった場合には、エージェント機能1の表示態様を表示パターン1から表示パターン2に変更する。さらに、被割り込み制御部124は、例えば、待機時間が1[min]以上となった場合には、エージェント機能1の表示態様を表示パターン2から表示パターン3に変更する。このような待機時間と表示態様の関係は、エージェント装置100の製造者によってあらかじめ設定されてもよいし、車両Mの乗員によって設定が変更されるものであってもよい。表示パターン1〜3の具体例については後述する。
図6に戻り、ナビゲーション装置40は、時刻t4においてサービス提供が終了すると被割り込み制御部124に割り込み処理の終了を通知する。被割り込み制御部124は、エージェント機能部150−1によるエージェント機能1の表示および発話を再開させる。このとき、被割り込み制御部124は、第1ディスプレイ22にエージェント機能1によるサービス提供を再開させることを乗員に報知するための表示や発話(以下、復帰制御)を行ってもよい。被割り込み制御部124は、例えば、復帰制御として乗員に対してエージェント機能1の表示を再開させるか否かの発話または操作を促すコメントを第1ディスプレイ22に表示する、被割り込み制御部124は、復帰制御に対応付いた乗員の発話または操作に基づいて、エージェント機能1のサービス提供を再開させる、またはエージェント機能1をそのまま終了させる。なお、復帰制御は、乗員の発話に基づく制御に限定するものではなく、例えば、5[sec]程度表示される文字情報の表示や、エージェントによる「サービスを再開します」等の発話であってもよい。復帰制御には、例えば、30[sec]程度の応答上限時間が設けられ、乗員による発話または操作が応答上限時間以内に確認されなかった場合にはエージェント機能1のサービス提供を終了させるものとしてもよい。
被割り込み制御部124は、復帰表示を終了した後に、エージェント機能部150−1によるエージェント機能1の表示を再開させる。
〔表示態様の変更例1〕
被割り込み制御部124は、例えば、エージェント機能部150の被割り込み処理が開始されてからの経過時間(以下、待機時間)に応じて、第1ディスプレイ22における表示内容を変更する。図8は、被割り込み制御部124による表示態様の変更の一例を説明するための図である。なお、以下の説明において、エージェント機能部150−1により車両Mが走行途中で立ち寄り可能なレストランに関する情報に関するサービス提供中にナビゲーション装置40による割り込み処理が発生したものとして説明する。
図8の左図は、被割り込み制御部124による被割り込み制御処理が実施される前の第1ディスプレイ22に表示される画面イメージIM10である。画面イメージIM10には、例えば、エージェント画像IM12と、エージェント機能部150により提供されるサービスに付随する情報を含む画像IM14が含まれる。画像IM14には、例えば、ネットワークNWを介して検索可能な情報に基づいた文字情報や画像情報などが含まれる。
図8の中央図は、被割り込み制御部124による被割り込み制御が実施されている最中の第1ディスプレイ22に表示される画面イメージIM20である。画面イメージIM20には、例えば、ナビゲーション装置40により表示される割り込み情報に関する画像IM22と、被割り込み関連情報に関する画像IM24とを含む。画像IM24には、例えば、「しばらくお待ちください」などの文字情報が含まれる。
被割り込み制御部124は、図7に示したように、待機時間に応じて被割り込み関連情報を変更してもよい。被割り込み制御部124は、例えば、図7に示す表示パターンのパターン1として画像IM24を表示し、待機時間が30[sec]を超過すると表示パターンのパターン2として、画像IM24とは異なる情報を含む被割り込み関連情報(以下、被割り込み関連情報2)に対応付いた画像IM26を表示する。画像IM26には、例えば、「ナビゲーション終了まで待機中」などの文字情報が含まれる。また、被割り込み制御部124は、例えば、待機時間が1[min]を超過すると表示パターンのパターン3として、画像IM24および画像IM26とは異なる情報を含む被割り込み関連情報(以下、被割り込み関連情報3)に対応付いた画像IM28を表示する。画像IM28には、例えば、「まもなくエージェント機能を再開します」などの文字情報が含まれる。なお、被割り込み制御部124は、待機時間が表示パターンの変更の閾値である30[sec]や1[min]に到達しなかった場合には、表示パターンの変更を行わなくてもよい。すなわち、待機時間が短い場合には、図示の画像IM26および画像IM28は表示されない可能性がある。
図8の右図は、被割り込み制御部124による被割り込み制御処理が終了した前の第1ディスプレイ22に表示される画面イメージIM30である。画面イメージIM30には、例えば、エージェント画像IM12と、エージェント機能部150により提供されるサービスに付随する情報を含む画像IM14とを含む、被割り込み処理の開始前と同様の画面イメージIM30と、被割り込み処理終了情報を含む画像32とが含まれる。画像IM32には、例えば、エージェント機能1によるサービス提供を再開することを示す情報が含まれる。なお、画像IM32の表示は省略されてもよく、その場合、エージェント機能1によりサービス提供を再開することを乗員に報知するための発話が行われてもよいし、発話が省略されてもよい。
〔表示態様の変更例2〕
また、被割り込み制御部124は、例えば、エージェント機能部150によるサービス提供が抑制された間の待機時間に応じて、第1ディスプレイ22における被割り込み関連情報の表示割合を徐々に小さく変更したり、情報量を徐々に少なくしたりする。図9は、被割り込み制御部124による表示態様の変更の他の一例を説明するための図である。
図9の左図は、図8の左図と同様の被割り込み制御部124による被割り込み制御処理が実施される前の第1ディスプレイ22に表示される画面イメージIM10である。
図9の中央図は、被割り込み制御部124による被割り込み制御が実施されている最中の第1ディスプレイ22に表示される画面イメージIM40である。画面イメージIM40には、例えば、ナビゲーション装置40により表示される割り込み情報に関する画像IM42と、被割り込み関連情報に関する画像IM44とを含む。画像IM42は、例えば、POI通知の画像である。画像IM44には、例えば、画面イメージIM10の縮小表示が含まれる。また、被割り込み制御部124は、画像IM42および画像IM44のそれぞれの表示位置や画像の大きさを変更することを被割り込み制御としてもよいし、画像IM42および画像IM44がそれぞれ表示する情報量(例えば、画像内に含まれる文字量)を変更することを被割り込み制御としてもよい。
被割り込み制御部124は、例えば、図8に示した変更例と同様に、表示パターンのパターン1として画像IM44を表示し、待機時間が30[sec]を超過すると表示パターンのパターン2として、画像IM44とは異なる情報を含む被割り込み関連情報に対応付いた画像IM46を表示する。被割り込み制御部124は、画像IM46の情報量を画像IM44よりも少なくしたり、画像IM44よりも表示サイズを小さくしたりする。また、被割り込み制御部124は、例えば、待機時間が1[min]を超過すると表示パターンのパターン3として、画像IM44および画像IM46とは異なる情報を含む被割り込み関連情報に対応付いた画像IM48を表示する。被割り込み制御部124は、画像IM44およびIM46よりも画像IM48が含む情報量を少なくしたり、画像IM44および画像IM46よりも表示サイズを小さくしたりする。画像IM48には、例えば、エージェント機能が待機中であることを示すアイコンが含まれる。
〔表示態様の変更例3〕
被割り込み制御部124は、被割り込み制御中にエージェント機能1のサービス提供内容を更新する処理を継続実行してもよい。被割り込み制御部124は、図9の表示例を例に取ると、被割り込み処理中にあたるナビゲーション装置40による提供サービスに関する画面イメージIM40を表示中にも、割り込みが発生しなければ画像IM14に表示していた情報を引き続き取得しておき、被割り込み処理が終了した場合に、更新後の情報を提供する。
図9の左図は、被割り込み制御部124による被割り込み制御処理が終了した前の第1ディスプレイ22に表示される画面イメージIM50である。画面イメージIM50には、例えば、エージェント画像IM52と、被割り込み処理の開始前の画面イメージIM10とは異なるエージェント機能部150により提供されるサービスに付随する情報を含む画像54とが含まれる。画像IM54には、画像IM14に含まれる情報が更新された異なる情報が含まれてもよい。このような処理は、画像IM14に含まれる情報の情報源がネットワークNWを介して検索可能な情報であってその情報が頻繁に更新される場合(例えば、情報源がSNS(social networking service)やミニブログである場合)や、車両Mの現在位置に応じて変化する場合に有用である。
なお、上記では第1ディスプレイ22が主としてエージェント装置100により制御される単一のエージェント機能または他装置による情報を表示するものとして説明したが、図3に示したように複数のディスプレイを有する場合には、エージェント装置100が各ディスプレイの表示内容のそれぞれを制御するものであってもよい。例えば、第1ディスプレイ22にエージェント機能を表示させてサービス提供をしている最中に被割り込み制御が発生した場合、HUD28に割り込み情報を表示させ、第1ディスプレイ22にエージェント機能を表示させたままとし、エージェントによる発話のみを終了することでサービス提供を一時的に停止するといった制御が行われてもよい。その場合、被割り込み制御部124は、被割り込み制御中のエージェント機能の画面表示の輝度を下げるなどの視認性を下げる処理を更に行って、乗員がHUD28に注目しやすくなるようにしてもよい。
なお、エージェント機能部150−1により制御されるエージェント1(第1のエージェント)がサービス提供中である場合に、他のエージェント機能部150−2により制御されるエージェント2(「第2のエージェント」の一例)が割り込み処理を行う場合にも上述のような被割り込み制御が行われてもよい。
表示制御部116および被割り込み制御部124は、例えば、サービスがエージェント1およびエージェント2からそれぞれ提供される場合に、エージェント1を表示中にエージェント2による割り込み制御が発生した場合に、エージェント1の表示を、以下に示す複数のエージェントによるサービス提供の処理例の(2)〜(4)に示すように制限する。
<複数のエージェントによるサービス提供の処理例>
(1)エージェント1の表示およびサービス提供。
(2)エージェント2による割り込み制御の発生を示す表示、および(1)に関連する被割り込み関連情報の表示。
(3)エージェント2による割り込み情報の表示、および(1)に関連する被割り込み関連情報の表示。
(4)エージェント2による割り込み制御終了。
(5)エージェント1の表示を(1)の状態に戻す。
なお、上述の(4)において、表示制御部116は、エージェント1に関する非割り込み関連情報の表示を消す制御を行った後、エージェント2による割り込み情報を消す制御を行う。なお、(2)および(3)において表示されるエージェント2により提供される割り込み情報は、例えば、ポップアップ通知形式で表示されてもよい。
[処理フロー]
図10は、エージェント装置100による処理の流れの一例を示すフローチャートである。図10に示す処理フローは、例えば、エージェント機能部150によりエージェントを表示してサービスを提供している最中に行われる処理である。
まず、被割り込み制御部124は、他装置等による割り込み通知を受信したか否かを判定する(ステップS100)。割り込み通知を受信しなかったと判定した場合、被割り込み制御部124は、一定時間経過後に再度ステップS100の処理を行う。割り込み通知を受信したと判定した場合、被割り込み制御部124は、待機時間を計測するためのタイマーをスタートさせ(ステップS102)、割り込み情報の表示を開始し(ステップS104)、さらに被割り込み関連情報の表示を開始する(ステップS106)。なお、ステップS104およびステップS106の処理は、同時に開始されてもよいし、ステップS106の処理の開始後にステップS104の処理が開始されてもよい。
次に、被割り込み制御部124は、被割り込み制御の開始前にエージェント機能部150が表示していた(または表示を予定していた)サービス提供情報において、継続実行する処理があるか否かを判定する(ステップS108)。継続実行する処理があると判定した場合、被割り込み制御部124は、エージェント機能部150にその継続実行する処理をバックグラウンドで実行させる(ステップS110)。継続実行する処理がないと判定した場合、ステップS112に処理を進める。
次に、被割り込み制御部124は、ステップS102で待機時間の計測を開始したタイマーに基づいて、待機時間が所定時間以上か否かを判定する(ステップS112)。所定時間以上であると判定した場合、被割り込み制御部124は、被割り込み関連情報の表示態様を変更する(ステップS114)。所定時間以上であると判定しなかった場合、被割り込み制御部124は、ステップS116に処理を進める。
次に、被割り込み制御部124は、他装置等から割り込み終了の通知を受信したか否かを判定する(ステップS116)。割り込み終了の通知を受信したと判定しなかった場合、被割り込み制御部124は、ステップS112に処理を戻す。割り込み終了の通知を受信したと判定した場合、被割り込み制御部124は、割り込み終了を示す被割り込み関連情報を表示して(ステップS118)、復帰制御を行うか否かの乗員の発話または操作を受け付ける(ステップS120)。復帰制御を行う場合、管理部110はエージェント機能部150によるサービス提供を再開させる(ステップS122)復帰制御を行わない場合、管理部110は、エージェント機能部150によるサービス提供を終了させる(ステップS124)。以上、本フローチャートの処理の説明を終了する。
上記説明した第1実施形態のエージェント装置100によれば、他装置等による割り込み処理を受け付けてエージェント機能によるサービス提供を一時的に停止させ、割り込み処理が終了した場合にはエージェント機能によるサービス提供を再開させたり、終了させたりするといった、乗員に取ってより自然な使用感でサービス提供をすることができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
10 マイク
20 表示・操作装置
30 スピーカユニット
40 ナビゲーション装置
50 車両機器
60 車載通信装置
70 汎用通信装置
80 乗員認識装置
100 エージェント装置
110 管理部
112 音響処理部
116 表示制御部
118 音声制御部
120 起動制御部
122 エージェントごとWU判定部
124 被割り込み制御部
150 エージェント機能部
152 ペアリングアプリ実行部
200 エージェントサーバ

Claims (11)

  1. 車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェントを表示部に表示させる制御を行う表示制御部と、
    前記乗員の状況、前記エージェントの稼働状況、および前記車両の稼働状況に基づいて前記エージェントを制御する制御部と、
    を備えるエージェント装置であって、
    前記表示制御部は、前記エージェントによるサービス提供の最中に割り込み制御が発生した場合、前記割り込みに関する情報の割り込み情報と被割り込み関連情報とを表示する制御を行う、
    エージェント装置。
  2. 前記被割り込み関連情報は、前記エージェントが提供中であったサービスに関連する報知情報である、
    請求項1に記載のエージェント装置。
  3. 前記表示制御部は、前記被割り込み関連情報の表示を消す制御を行った後、前記割り込み情報の表示を消す制御を行う、
    請求項1または2に記載のエージェント装置。
  4. 前記サービスは第1のエージェント及び第2のエージェントからそれぞれ提供され、
    前記表示制御部は、前記第1のエージェントを表示中に前記第2のエージェントによる割り込み制御が発生した場合に、前記第1のエージェントの表示を制限する、
    請求項1から3のうちいずれか1項に記載のエージェント装置。
  5. 前記制御部は、前記割り込み制御が終了した場合、前記被割り込み関連情報の表示を終了して前記エージェントによるサービス提供を再開させる、
    請求項4に記載のエージェント装置。
  6. 前記制御部は、前記割り込み制御が開始される前に提供途中であったサービス提供を一時的に停止し、前記割り込み制御が終了した場合、前記一時的に停止したサービス提供を再開させる、
    請求項5に記載のエージェント装置。
  7. 前記制御部は、前記サービス提供を一時的に停止した時点のエージェントの発話の先頭から再開させる、
    請求項6に記載のエージェント装置。
  8. 前記制御部は、前記割り込み制御が開始される前に提供途中であったサービス提供を一時的に停止し、さらに前記割り込み制御が開始される前に提供途中であったサービス提供内容に関連する処理を継続実行し、前記割り込み制御が終了した場合、前記一時的に停止したサービス提供内容、および前記継続実行した処理の結果に基づいて前記第1のエージェントによるサービス提供を再開させる、
    請求項5から7のうちいずれか1項に記載のエージェント装置。
  9. 前記制御部は、前記表示部に前記サービス提供が抑制された間の待機時間に応じて前記被割り込み関連情報の表示態様を変更する、
    請求項1から8のうちいずれか1項に記載のエージェント装置。
  10. 車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェントを表示部に表示させる制御を行う表示制御部と、
    前記乗員の状況、前記エージェントの稼働状況、および前記車両の稼働状況に基づいて前記エージェントを制御する制御部と、
    を備えるエージェント装置を制御する制御方法であって、エージェント装置のコンピュータが、
    前記表示制御部に、前記エージェントによるサービス提供の最中に割り込み制御が発生した場合、前記割り込みに関する情報の割り込み情報と被割り込み関連情報とを表示する制御を行わせる、
    エージェント装置の制御方法。
  11. コンピュータに、
    車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェントを表示部に表示させる制御を行わせ、
    前記乗員の状況、前記エージェントの稼働状況、および前記車両の稼働状況に基づいて前記エージェントを制御させる、
    プログラムであって、
    前記エージェントによるサービス提供の最中に割り込み制御が発生した場合、前記割り込みに関する情報の割り込み情報と被割り込み関連情報とを表示する制御を行わせる、
    プログラム。
JP2019057645A 2019-03-26 2019-03-26 エージェント装置、エージェント装置の制御方法、およびプログラム Active JP7239366B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019057645A JP7239366B2 (ja) 2019-03-26 2019-03-26 エージェント装置、エージェント装置の制御方法、およびプログラム
US16/822,049 US20200319841A1 (en) 2019-03-26 2020-03-18 Agent apparatus, agent apparatus control method, and storage medium
CN202010210416.1A CN111752686A (zh) 2019-03-26 2020-03-23 智能体装置、智能体装置的控制方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019057645A JP7239366B2 (ja) 2019-03-26 2019-03-26 エージェント装置、エージェント装置の制御方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2020157855A true JP2020157855A (ja) 2020-10-01
JP7239366B2 JP7239366B2 (ja) 2023-03-14

Family

ID=72641351

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019057645A Active JP7239366B2 (ja) 2019-03-26 2019-03-26 エージェント装置、エージェント装置の制御方法、およびプログラム

Country Status (3)

Country Link
US (1) US20200319841A1 (ja)
JP (1) JP7239366B2 (ja)
CN (1) CN111752686A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113488024A (zh) * 2021-05-31 2021-10-08 杭州摸象大数据科技有限公司 一种基于语义识别的电话打断识别方法和系统
WO2024042359A1 (ja) * 2022-08-26 2024-02-29 日産自動車株式会社 情報処理方法及び情報処理装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220284883A1 (en) * 2021-03-05 2022-09-08 Comcast Cable Communications, Llc Keyword Detection

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100382A (ja) * 2003-09-01 2005-04-14 Matsushita Electric Ind Co Ltd 対話装置及び対話方法
JP2015052980A (ja) * 2013-09-09 2015-03-19 株式会社デンソー コンテンツ提供システム
JP2017507828A (ja) * 2014-01-06 2017-03-23 ジョンソン コントロールズ テクノロジー カンパニーJohnson Controls Technology Company 車両におけるオーディオビジュアルコンテンツの提示及びこれとの相互作用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4645310B2 (ja) * 2005-06-02 2011-03-09 株式会社デンソー エージェントキャラクタ表示を利用した表示システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100382A (ja) * 2003-09-01 2005-04-14 Matsushita Electric Ind Co Ltd 対話装置及び対話方法
JP2015052980A (ja) * 2013-09-09 2015-03-19 株式会社デンソー コンテンツ提供システム
JP2017507828A (ja) * 2014-01-06 2017-03-23 ジョンソン コントロールズ テクノロジー カンパニーJohnson Controls Technology Company 車両におけるオーディオビジュアルコンテンツの提示及びこれとの相互作用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113488024A (zh) * 2021-05-31 2021-10-08 杭州摸象大数据科技有限公司 一种基于语义识别的电话打断识别方法和系统
WO2024042359A1 (ja) * 2022-08-26 2024-02-29 日産自動車株式会社 情報処理方法及び情報処理装置

Also Published As

Publication number Publication date
US20200319841A1 (en) 2020-10-08
JP7239366B2 (ja) 2023-03-14
CN111752686A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
JP7340940B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7239366B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020144260A (ja) 車載エージェントシステム、車載エージェントシステムの制御方法、およびプログラム
CN111559328B (zh) 智能体装置、智能体装置的控制方法及存储介质
US11240342B2 (en) Agent device, method of controlling agent device, and computer-readable non-transient storage medium
US20200317055A1 (en) Agent device, agent device control method, and storage medium
JP2020144264A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020144081A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020162003A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US11797261B2 (en) On-vehicle device, method of controlling on-vehicle device, and storage medium
JP7175221B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
US11518398B2 (en) Agent system, agent server, method of controlling agent server, and storage medium
US11542744B2 (en) Agent device, agent device control method, and storage medium
US20200320997A1 (en) Agent apparatus, agent apparatus control method, and storage medium
JP2020157853A (ja) 車載エージェントシステム、車載エージェントシステムの制御方法、およびプログラム
JP2020152298A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020154942A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020160133A (ja) エージェントシステム、エージェントシステムの制御方法、およびプログラム
JP2020142758A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
CN111559317B (zh) 智能体装置、智能体装置的控制方法及存储介质
JP7297483B2 (ja) エージェントシステム、サーバ装置、エージェントシステムの制御方法、およびプログラム
JP2020152297A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020160132A (ja) エージェント装置、エージェント装置の制御方法、プログラム、エージェントサーバ、およびエージェントサーバの制御方法
JP2020157864A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020157854A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221025

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230302

R150 Certificate of patent or registration of utility model

Ref document number: 7239366

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150