JP2020067785A - 制御装置、エージェント装置及びプログラム - Google Patents

制御装置、エージェント装置及びプログラム Download PDF

Info

Publication number
JP2020067785A
JP2020067785A JP2018199654A JP2018199654A JP2020067785A JP 2020067785 A JP2020067785 A JP 2020067785A JP 2018199654 A JP2018199654 A JP 2018199654A JP 2018199654 A JP2018199654 A JP 2018199654A JP 2020067785 A JP2020067785 A JP 2020067785A
Authority
JP
Japan
Prior art keywords
unit
request
agent
information
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018199654A
Other languages
English (en)
Inventor
俊克 倉持
Toshikatsu Kuramochi
俊克 倉持
関口 敦
Atsushi Sekiguchi
敦 関口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2018199654A priority Critical patent/JP2020067785A/ja
Priority to CN201910983613.4A priority patent/CN111092988A/zh
Priority to US16/658,149 priority patent/US20200133630A1/en
Publication of JP2020067785A publication Critical patent/JP2020067785A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04817Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/802D [Two Dimensional] animation, e.g. using sprites
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • G08G1/0962Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
    • G08G1/0968Systems involving transmission of navigation instructions to the vehicle
    • G08G1/0969Systems involving transmission of navigation instructions to the vehicle having a display in the form of a map
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/75Indicating network or usage conditions on the user display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72439User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for image or video messaging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72454User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72469User interfaces specially adapted for cordless or mobile telephones for operating the device by selecting functions from two or more displayed items, e.g. menus or icons
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72484User interfaces specially adapted for cordless or mobile telephones wherein functions are triggered by incoming communication events
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/038Indexing scheme relating to G06F3/038
    • G06F2203/0381Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/008Registering or indicating the working of vehicles communicating information to a remotely located station
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Navigation (AREA)

Abstract

【課題】 ユーザの通信環境によっては、ユーザ及びエージェントの間の円滑なコミュニケーションが困難になる。【解決手段】 通信ネットワークを介してユーザの音声及びジェスチャの少なくとも一方により示される要求を取得し、当該要求に応じた処理を実行する第1要求処理装置のユーザインタフェースとして機能するエージェント装置を制御する。第1要求処理装置、及び、エージェント装置の間の通信状態を示す通信情報を取得する通信情報取得部と、通信情報取得部が取得した通信情報により示される通信状態に基づいて、エージェント装置による情報の提供に利用されるエージェントの様態を決定する様態決定部とを備える。【選択図】図1

Description

本発明は、制御装置、エージェント装置及びプログラムに関する。
擬人化されたエージェントを介したユーザとのインタラクションに基づいて、各種の処理を実行するエージェント装置が知られている。(例えば、特許文献1〜2を参照されたい)。
[先行技術文献]
[特許文献]
[特許文献1] 特開2006−189394号公報
[特許文献2] 特開2000−020888号公報
エージェント装置は、クラウド上又はサーバ上で動作する支援アプリケーションと協働して、ユーザとのインタラクションを実現する。音声認識処理、推論処理、対話管理処理などのマシンパワーを必要とする処理は、支援アプリケーションにより実行され、エージェント装置は、ユーザインタフェースとして機能する。そのため、ユーザの通信環境によっては、ユーザ及びエージェントの間の円滑なコミュニケーションが困難になる。
本発明の第1の態様においては、制御装置が提供される。上記の制御装置は、例えば、エージェント装置を制御する。上記のエージェント装置は、例えば、第1要求処理装置のユーザインタフェースとして機能する。上記の第1要求処理装置は、例えば、通信ネットワークを介してユーザの音声及びジェスチャの少なくとも一方により示される要求を取得する。上記の第1要求処理装置は、例えば、上記の要求に応じた処理を実行する。上記の制御装置は、例えば、第1要求処理装置、及び、エージェント装置の間の通信状態を示す通信情報を取得する通信情報取得部を備える。上記の制御装置は、例えば、通信情報取得部が取得した通信情報により示される通信状態に基づいて、エージェント装置による情報の提供に利用されるエージェントの様態を決定する様態決定部を備える。
上記の制御装置において、エージェントの様態は、(i)エージェントとして利用されるキャラクタの種類、(ii)キャラクタの外観、(iii)キャラクタの声、及び、(iv)キャラクタのインタラクションの様態の少なくとも1つであってよい。
上記の制御装置において、エージェント装置は、第1要求処理装置とは異なる第2要求処理装置のユーザインタフェースとして機能してもよい。第2要求処理装置は、有線通信又は近距離無線通信により、エージェント装置から、ユーザの音声又はジェスチャによる要求を取得してよい。第2要求処理装置は、上記の要求に応じた処理を実行してよい。上記の制御装置は、通信情報取得部が取得した通信情報により示される通信状態に基づいて、エージェント装置を、第1要求処理装置及び第2要求処理装置の何れのユーザインタフェースとして機能させるかを決定する処理装置決定部を備えてよい。
上記の制御装置において、様態決定部は、(i)エージェント装置を、第1要求処理装置のユーザインタフェースとして機能させることが決定された場合と、(ii)エージェント装置を、第2要求処理装置のユーザインタフェースとして機能させることが決定された場合とで、エージェントの様態が異なるように、エージェントの様態を決定してよい。上記の制御装置において、様態決定部は、(i)エージェント装置が、第1要求処理装置のユーザインタフェースとして機能する場合におけるエージェントの様態と、(ii)エージェント装置が、第2要求処理装置のユーザインタフェースとして機能する場合におけるエージェントの様態とを、予め決定していてもよい。上記の制御装置において、様態決定部は、処理装置決定部の決定結果に基づいて、エージェントの様態を切り替えてよい。
上記の制御装置において、様態決定部は、(i)エージェント装置が、第1要求処理装置のユーザインタフェースとして機能する場合と、(ii)エージェント装置が、第2要求処理装置のユーザインタフェースとして機能する場合とで、同一の種類のキャラクタを利用することを決定してよい。上記の制御装置において、様態決定部は、(i)エージェント装置が、第1要求処理装置のユーザインタフェースとして機能する場合に利用されるキャラクタの設定年齢を、(ii)エージェント装置が、第2要求処理装置のユーザインタフェースとして機能する場合に利用されるキャラクタの設定年齢よりも高くすることを決定してよい。
上記の制御装置において、様態決定部は、(i)エージェント装置が、第1要求処理装置のユーザインタフェースとして機能する場合、エージェントのキャラクタとして、大人のキャラクタを利用することを決定してよい。上記の制御装置において、様態決定部は、(ii)エージェント装置が、第2要求処理装置のユーザインタフェースとして機能する場合、エージェントのキャラクタとして、子供のキャラクタ、大人のキャラクタの幼少期のキャラクタ、又は、大人のキャラクタの外観がデフォルメされたキャラクタを利用することを決定してよい。
上記の制御装置において、様態決定部は、(i)エージェント装置が、第1要求処理装置のユーザインタフェースとして機能する場合、エージェントの音声として、大人の音声又は大人のキャラクタの音声を利用することを決定してよい。上記の制御装置において、様態決定部は、(ii)エージェント装置が、第2要求処理装置のユーザインタフェースとして機能する場合、エージェントの音声として、子供の音声又は子供のキャラクタの音声を利用することを決定してよい。
上記の制御装置は、ユーザの要求に応答する音声メッセージを生成する音声メッセージ生成部を備えてよい。上記の制御装置において、音声メッセージ生成部は、エージェント装置が、第2要求処理装置のユーザインタフェースとして機能する場合、要求の種類に基づいて定められた定型文を利用して、音声メッセージを生成してよい。上記の制御装置において、第2要求処理装置が認識できる要求の種類の数は、第1要求処理装置が認識できる要求の種類の数よりも少なくてよい。上記の制御装置において、第2要求処理装置が処理できる要求の種類の数は、第1要求処理装置が処理できる要求の種類の数よりも少なくてよい。上記の制御装置において、エージェント装置は、対話型の車両用運転支援装置であってよい。
本発明の第2の態様においては、エージェント装置が提供される。上記のエージェント装置は、例えば、要求処理装置のユーザインタフェースとして機能する。上記の要求処理装置は、例えば、ユーザの音声及びジェスチャの少なくとも一方により示される要求を取得する。上記の要求処理装置は、例えば、上記の要求に応じた処理を実行する。上記のエージェント装置は、例えば、上記の制御装置を備える。上記のエージェント装置は、例えば、制御装置の様態決定部が決定した様態に従って、エージェントの画像を表示又は投影するエージェント出力部を備える。
上記のエージェント装置は、ユーザの音声及びジェスチャの少なくとも一方を示す情報を入力する入力部を備えてよい。上記のエージェント装置は、ユーザに音声メッセージを出力する音声メッセージ出力部を備えてよい。
本発明の第3の態様においては、プログラムが提供される。上記のプログラムを格納する非一時的コンピュータ可読媒体が提供されてもよい。上記のプログラムは、コンピュータを、上記の制御装置として機能させるためのプログラムであってよい。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
対話型エージェントシステム100のシステム構成の一例を概略的に示す。 車両110の内部構成の一例を概略的に示す。 入出力制御部272の内部構成の一例を概略的に示す。 要求処理部340の内部構成の一例を概略的に示す。 要求決定部420の内部構成の一例を概略的に示す。 応答管理部350の内部構成の一例を概略的に示す。 エージェント情報格納部360の内部構成の一例を概略的に示す。 支援サーバ120の内部構成の一例を概略的に示す。 要求決定部842の内部構成の一例を概略的に示す。 出力様態の遷移の一例を概略的に示す。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。なお、図面において、同一または類似の部分には同一の参照番号を付して、重複する説明を省く場合がある。
[対話型エージェントシステム100の概要]
図1は、対話型エージェントシステム100のシステム構成の一例を概略的に示す。本実施形態において、対話型エージェントシステム100は、車両110と、支援サーバ120とを備える。本実施形態において、車両110は、応答システム112と、通信システム114とを有する。
対話型エージェントシステム100は、第1要求処理装置及び第2要求処理装置の一例であってよい。第1要求処理装置及び第2要求処理装置のそれぞれは、要求処理装置の一例であってよい。車両110又は車両110に搭載された機器は、エージェント装置の一例であってよい。応答システム112は、エージェント装置の一例であってよい。支援サーバ120は、第1要求処理装置の一例であってよい。
本実施形態において、車両110及び支援サーバ120は、通信ネットワーク10を介して、互いに情報を送受することができる。また、車両110と、車両110のユーザ20が利用する通信端末30とが、通信ネットワーク10を介して情報を送受してもよく、支援サーバ120と、通信端末30とが、通信ネットワーク10を介して情報を送受してもよい。
本実施形態において、通信ネットワーク10は、有線通信の伝送路であってもよく、無線通信の伝送路であってもよく、無線通信の伝送路及び有線通信の伝送路の組み合わせであってもよい。通信ネットワーク10は、無線パケット通信網、インターネット、P2Pネットワーク、専用回線、VPN、電力線通信回線などを含んでもよい。通信ネットワーク10は、(i)携帯電話回線網などの移動体通信網を含んでもよく、(ii)無線MAN(例えば、WiMAX(登録商標)である。)、無線LAN(例えば、WiFi(登録商標)である。)、Bluetooth(登録商標)、Zigbee(登録商標)、NFC(Near Field Communication)などの無線通信網を含んでもよい。
本実施形態において、ユーザ20は、車両110の利用者であってよい。ユーザ20は、車両110の運転者であってもよく、当該運転者の同乗者であってもよい。ユーザ20は、車両110の所有者であってもよく、車両110の占有者であってもよい。車両110の占有者は、車両110のレンタルサービス又はシェアサービスの利用者であってもよい。
本実施形態において、通信端末30は、車両110及び支援サーバ120の少なくとも一方と情報を送受することができればよく、その詳細については特に限定されない。通信端末30としては、パーソナルコンピュータ、携帯端末などが例示される。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。
通信端末30は、1又は複数の通信方式に対応していてもよい。通信方式としては、移動体通信方式、無線MAN方式、無線LAN方式、無線PAN方式などが例示される。移動体通信方式としては、GSM(登録商標)方式、3G方式、LTE方式、4G方式、5G方式などが例示される。無線MAN方式としては、WiMAX(登録商標)が例示される。無線LAN方式としては、WiFi(登録商標)が例示される。無線PAN方式としては、Bluetooth(登録商標)、Zigbee(登録商標)、NFC(Near Field Communication)などが例示される。
本実施形態において、対話型エージェントシステム100は、ユーザ20の音声及びジェスチャの少なくとも一方により示される要求を取得し、当該要求に応じた処理を実行する。ジェスチャとしては、身振り、手振り、仕草、顔の向き、視線の向き、顔の表情などが例示される。また、対話型エージェントシステム100は、上記の処理の結果をユーザ20に伝達する。対話型エージェントシステム100は、対話型エージェントシステム100のインタフェースとして機能するエージェントと、ユーザ20との間の対話型のインストラクションを介して、上記の要求の取得及び結果の伝達を実行してよい。
エージェントは、ユーザ20への情報の伝達に利用される。ユーザ20と、エージェントとのインタラクションにより、言語情報だけでなく、非言語情報も伝達され得る。これにより、より円滑な情報伝達が達成され得る。エージェントは、ソフトウエアエージェントであってもよく、ハードウエアエージェントであってもよい。なお、エージェントは、AIアシスタントと称される場合もある。
ソフトウエアエージェントは、コンピュータにより実現される擬人化エージェントであってよい。上記のコンピュータは、通信端末30及び車両110の少なくとも一方に搭載されたコンピュータであってよい。擬人化エージェントは、例えば、コンピュータの表示装置又は投影装置上に表示又は投影され、ユーザ20とコミュニケーションを図ることができる。擬人化エージェントは、音声により、ユーザ20とコミュニケーションを図ってもよい。ハードウエアエージェントは、ロボットであってよい。ロボットは、ヒューマノイド型のロボットであってもよく、ペット型のロボットであってもよい。
エージェントは、顔を有してもよい。「顔」には、人間又は動物の顔だけでなく、顔の同等物が含まれてもよい。顔の同等物は、顔と同様の機能を有するものであってよい。顔の機能としては、感情を伝達する機能、注視点を示す機能などが例示される。
エージェントは、目を有してもよい。「目」には、人間又は動物の眼だけでなく、眼の同等物が含まれてもよい。眼の同等物は、眼と同様の機能を有するものであってよい。眼の機能としては、感情を伝達する機能、注視点を示す機能などが例示される。
なお、「対話」には、言語情報によるコミュニケーションだけでなく、非言語情報によるコミュニケーションが含まれてよい。言語情報によるコミュニケーションとしては、(i)会話、(ii)手話、(iii)ジェスチャと、当該ジェスチャによる伝達内容とが予め定義されたサイン又はサイン音などが例示される。非言語情報によるコミュニケーションとしては、身振り、手振り、仕草、顔の向き、視線の向き、顔の表情などが例示される。
本実施形態において、対話型エージェントシステム100は、応答システム112に実装された対話エンジン(図示されていない。ローカル型対話エンジンと称される場合がある。)と、支援サーバ120に実装された対話エンジン(図示されていない。クラウド型対話エンジンと称される場合がある。)とを備える。音声認識、ジェスチャ認識などによりユーザ20からの要求が検出された場合、対話型エージェントシステム100は、ローカル型対話エンジン及びクラウド型対話エンジンの何れの対話エンジンを利用して上記の要求に応答するかを決定してよい。
ローカル型対話エンジン及びクラウド型対話エンジンは、物理的に異なる対話エンジンであってよい。ローカル型対話エンジン及びクラウド型対話エンジンは、性能の異なる対話エンジンであってよい。一実施形態において、ローカル型対話エンジンが認識できる要求の種類の数は、クラウド型対話エンジンが認識できる要求の種類の数よりも少ない。他の実施形態において、ローカル型対話エンジンが処理できる要求の種類の数は、クラウド型対話エンジンが認識できる処理の種類の数よりも少ない。クラウド型対話エンジンは、第1要求処理装置の一例であってよい。ローカル型対話エンジンは、第2要求処理装置の一例であってよい。
本実施形態によれば、対話型エージェントシステム100は、車両110及び支援サーバ120の間の通信状態に基づいて、ローカル型対話エンジン及びクラウド型対話エンジンの何れの対話エンジンを利用するかを決定する。例えば、通信状態が比較的良好である場合、対話型エージェントシステム100は、クラウド型対話エンジンを利用して、ユーザ20の要求に応答する。一方、通信状態が比較的不良である場合、対話型エージェントシステム100は、ローカル型対話エンジンを利用して、ユーザ20の要求に応答する。これにより、車両110及び支援サーバ120の間の通信状態に応じて、ローカル型対話エンジンと、クラウド型対話エンジンとが切り替えられ得る。
対話型エージェントシステム100は、応答システム112の状態に基づいて、エージェントの様態を決定してよい。これにより、応答システム112の状態に応じて、エージェントの様態が切り替わり得る。応答システム112の状態としては、(i)応答システム112が停止している状態(OFF状態と称される場合がある)、(ii)応答システム112が作動している状態(ON状態と称される場合がある)であって、対話エンジンによる応答処理を開始するための要求(起動要求と称される場合がある。)を待ち受けている状態(スタンバイ状態と称される場合がある。)、(iii)ON状態であって、対話エンジンによる応答処理が実行されている状態(起動状態と称される場合がある。)などが例示される。
スタンバイ状態は、起動要求を受け付け、当該起動要求を処理するための状態であってもよい。起動状態は、エージェントを介して起動要求以外の要求を処理するための状態であってもよい。
起動要求は、エージェントを起動させるための要求であってもよく、エージェントを介した応答処理を開始するための要求であってもよく、対話エンジンの音声認識機能又はジェスチャ認識機能を起動又は有効化するための要求であってもよい。起動要求は、応答システム112の状態を、スタンバイ状態から起動状態に変更するための要求であってよい。起動要求は、起動ワード、トリガーフレーズなどと称される場合がある。起動要求は、音声に限定されない。起動要求は、予め定められたジェスチャであってもよく、起動要求を入力するための操作であってもよい。
上記の応答システム112の状態の少なくとも1つは、さらに細分化されていてもよい。例えば、対話エンジンによる応答処理が実行されている状態は、ローカル型対話エンジンがユーザ20の要求を処理している状態と、クラウド型対話エンジンがユーザ20の要求を処理している状態とに細分化され得る。これにより、例えば、対話型エージェントシステム100は、ローカル型対話エンジンがユーザ20の要求を処理している場合と、クラウド型対話エンジンがユーザ20の要求を処理している場合とで、エージェントの様態を切り替えることができる。
エージェントの様態としては、エージェントとして利用されるキャラクタの種類、当該キャラクタの外観、当該キャラクタの声、及び、インタラクションの様態の少なくとも1つが例示される。キャラクタとしては、実在する人物、動物又は物体をモデルにしたキャラクタ、歴史上の人物、動物又は物体をモデルにしたキャラクタ、架空の又は空想上の人物、動物又は物体をモデルにしたキャラクタなどが例示される。上記の物体は、有体物であってもよく、無体物であってもよい。キャラクタは、上記の人物、動物又は物体の一部をモデルにしたキャラクタであってもよい。
外観としては、(i)形状、模様、色彩及びこれらの組み合わせ、(ii)デフォルメ、誇張又は変形の手法及び程度、並びに、(iii)画像の画風の少なくとも1つが例示される。形状としては、容姿、髪型、服装、アクセサリ、表情及び姿勢の少なくとも1つが例示される。デフォルメの手法としては、頭身比率の変更、パーツの配置の変更、パーツの簡素化などが例示される。画風としては、画像全体の色合い、タッチなどが例示される。タッチとしては、写実的なタッチ、イラスト風のタッチ、漫画風のタッチ、アメリカンコミック風のタッチ、劇画風のタッチ、シリアスなタッチ、コメディ調のタッチなどが例示される。
例えば、同一のキャラクタであっても、年齢によって外観が異なる場合がある。幼少期、青年期、壮年期、中年期、老年期、及び、晩年期の少なくとも2つにおいて、キャラクタの外観が異なってもよい。また、同一のキャラクタであっても、デフォルメの程度が進行するにつれて、外観が幼く見える場合がある。例えば、同一のキャラクタの外観の画像であって、頭身比率の異なる2つの画像を比較すると、頭身比率が小さい画像中のキャラクタは、頭身比率が大きい画像中のキャラクタよりも幼く見える。
声としては、声質、声色(トーンと称される場合がある)、及び、声の高さ(ピッチと称される場合がある)の少なくとも1つが例示される。インタラクションの様態としては、応答時の話し方及び仕草の少なくとも一方が例示される。話し方としては、声量、口調、テンポ、1回あたりの発話の長さ、間の取り方、抑揚のつけ方、強弱のつけ方、相槌の打ち方、癖、及び、話題の展開方法の少なくとも1つが例示される。なお、ユーザ20及びエージェントの間のインタラクションが手話により実現される場合の話し方の具体例は、ユーザ20及びエージェントの間のインタラクションが会話により実現される場合の話し方の具体例と同様であってよい。
一般的に、クラウド型対話エンジンは、ローカル型対話エンジンよりも機能が豊富であり、処理可能な要求の数も多く、認識精度も高い。そのため、車両110の移動、車両110又は支援サーバ120における通信障害などにより、車両110及び支援サーバ120の間の通信状態が悪化し、対話エンジンがクラウド型対話エンジンからローカル型対話エンジンに切り替わると、応答の品質が低下する。その結果、ユーザ20のユーザ体験が劣化する可能性がある。
本実施形態によれば、対話エンジンがクラウド型対話エンジンからローカル型対話エンジンに切り替わると、エージェントの様態も変化する。これにより、ユーザ20は、エージェントとの対話中に、当該エージェントの現在の状態を感覚的に理解することができる。その結果、ユーザ20のユーザ体験の劣化が抑制され得る。
なお、本実施形態においては、応答システム112が車両110に実装された対話型の車両用運転支援装置である場合を例として、対話型エージェントシステム100の詳細が説明される。しかしながら、対話型エージェントシステム100は本実施形態に限定されない。他の実施形態において、応答システム112が実装される機器は車両に限定されない。応答システム112は、据付式の機器、移動式の機器(移動体と称される場合がある)、又は、携帯式若しくは可搬式の機器に実装されてよい。応答システム112は、情報を出力する機能と、通信機能とを備えた機器に実装されることが好ましい。例えば、応答システム112は、通信端末30に実装され得る。応答システム112が実装された機器は、エージェント装置、制御装置及び第2要求処理装置の一例であってよい。
据付式の機器としては、デスクトップ型のPC、テレビ、スピーカ、冷蔵庫などの電化製品が例示される。移動式の機器としては、車両、作業機械、船舶、飛行体などが例示される。携帯式若しくは可搬式の機器としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータ、モバイルバッテリなどが例示される。
[対話型エージェントシステム100の各部の概要]
本実施形態において、車両110は、ユーザ20の移動に利用される。車両110としては、自動車、自動二輪車などが例示される。自動二輪車としては、(i)バイク、(ii)三輪バイク、(iii)セグウェイ(登録商標)、動力ユニット付きキックボード(登録商標)、動力ユニット付きスケートボードのような、動力ユニットを有する立ち乗り二輪車などが例示される。
本実施形態において、応答システム112は、ユーザ20の音声及びジェスチャの少なくとも一方により示される要求を取得する。応答システム112は、上記の要求に応じた処理を実行する。また、応答システム112は、上記の処理の結果をユーザ20に伝達する。
一実施形態において、応答システム112は、ユーザ20が車両110に搭載された機器に入力した要求を取得する。応答システム112は、車両110に搭載された機器を介して、上記の要求に対する応答を、ユーザ20に提示する。他の実施形態において、応答システム112は、ユーザ20が通信端末30に搭載された機器に入力した要求を、通信システム114を介して取得する。応答システム112は、上記の要求に対する応答を、通信システム114を介して通信端末30に送信する。通信端末30は、応答システム112から取得した情報を、ユーザ20に提示する。
一実施形態において、応答システム112は、(i)ユーザ20が車両110に搭載された機器に入力した要求、又は、(ii)ユーザ20が通信端末30に搭載された機器に入力した要求を取得する。応答システム112は、ユーザ20が通信端末30に搭載された機器に入力した要求を、通信システム114を介して取得してよい。応答システム112は、車両110に搭載された情報出力機器を介して、上記の要求に対する応答を、ユーザ20に提示する。
他の実施形態において、応答システム112は、(i)ユーザ20が車両110に搭載された機器に入力した要求、又は、(ii)ユーザ20が通信端末30に搭載された機器に入力した要求を取得する。応答システム112は、ユーザ20が通信端末30に搭載された機器に入力した要求を、通信システム114を介して取得してよい。応答システム112は、上記の要求に対する応答を、通信システム114を介して通信端末30に送信する。通信端末30は、応答システム112から取得した情報を、ユーザ20に提示する。
応答システム112は、ローカル型対話エンジンのユーザインタフェースとして機能してよい。応答システム112は、クラウド型対話エンジンのユーザインタフェースとして機能してよい。
本実施形態において、通信システム114は、通信ネットワーク10を介して、車両110と、支援サーバ120との間で情報を送受する。通信システム114は、有線通信又は近距離無線通信により、車両110と、通信端末30との間で情報を送受してもよい。
例えば、通信システム114は、応答システム112がユーザ20から取得したユーザ20に関する情報を、支援サーバ120に送信する。通信システム114は、通信端末30がユーザ20から取得したユーザ20に関する情報を、支援サーバ120に送信してよい。通信システム114は、車両110に搭載された機器から車両110に関する情報を取得し、車両110に関する情報を支援サーバ120に送信してよい。通信システム114は、通信端末30から通信端末30に関する情報を取得し、通信端末30に関する情報を支援サーバ120に送信してもよい。
また、通信システム114は、クラウド型対話エンジンが出力した情報を、支援サーバ120から受信する。通信システム114は、クラウド型対話エンジンが出力した情報を、応答システム112に転送する。通信システム114は、応答システム112が出力した情報を、通信端末30に送信してもよい。
本実施形態において、支援サーバ120は、支援サーバ120のコンピュータを、クラウド型対話エンジンとして機能させるためのプログラムを実行する。これにより、支援サーバ120の上で、クラウド型対話エンジンが動作する。
本実施形態において、支援サーバ120は、通信ネットワーク10を介して、ユーザ20の音声及びジェスチャの少なくとも一方により示される要求を取得する。支援サーバ120は、上記の要求に応じた処理を実行する。また、支援サーバ120は、通信ネットワーク10を介して、上記の処理の結果を応答システム112に通知する。
[対話型エージェントシステム100の各部の具体的な構成]
対話型エージェントシステム100の各部は、ハードウエアにより実現されてもよく、ソフトウエアにより実現されてもよく、ハードウエア及びソフトウエアにより実現されてもよい。対話型エージェントシステム100の各部は、その少なくとも一部が、単一のサーバによって実現されてもよく、複数のサーバによって実現されてもよい。対話型エージェントシステム100の各部は、その少なくとも一部が、仮想マシン上又はクラウドシステム上で実現されてもよい。対話型エージェントシステム100の各部は、その少なくとも一部が、パーソナルコンピュータ又は携帯端末によって実現されてもよい。携帯端末としては、携帯電話、スマートフォン、PDA、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。対話型エージェントシステム100の各部は、ブロックチェーンなどの分散型台帳技術又は分散型ネットワークを利用して、情報を格納してもよい。
対話型エージェントシステム100を構成する構成要素の少なくとも一部がソフトウエアにより実現される場合、当該ソフトウエアにより実現される構成要素は、一般的な構成の情報処理装置において、当該構成要素に関する動作を規定したプログラムを起動することにより実現されてよい。上記の情報処理装置は、例えば、(i)CPU、GPUなどのプロセッサ、ROM、RAM、通信インタフェースなどを有するデータ処理装置と、(ii)キーボード、タッチパネル、カメラ、マイク、各種センサ、GPS受信機などの入力装置と、(iii)表示装置、スピーカ、振動装置などの出力装置と、(iv)メモリ、HDDなどの記憶装置(外部記憶装置を含む。)とを備える。
上記の情報処理装置において、上記のデータ処理装置又は記憶装置は、プログラムを格納してよい。上記のプログラムは、非一時的なコンピュータ可読記録媒体に格納されてよい。上記のプログラムは、プロセッサによって実行されることにより、上記の情報処理装置に、当該プログラムによって規定された動作を実行させる。
プログラムは、非一時的なコンピュータ可読記録媒体に格納されていてもよい。プログラムは、CD−ROM、DVD−ROM、メモリ、ハードディスクなどのコンピュータ読み取り可能な媒体に記憶されていてもよく、ネットワークに接続された記憶装置に記憶されていてもよい。プログラムは、コンピュータ読み取り可能な媒体又はネットワークに接続された記憶装置から、対話型エージェントシステム100の少なくとも一部を構成するコンピュータにインストールされてよい。プログラムが実行されることにより、コンピュータが、対話型エージェントシステム100の各部の少なくとも一部として機能してもよい。
コンピュータを対話型エージェントシステム100の各部の少なくとも一部として機能させるプログラムは、対話型エージェントシステム100の各部の動作を規定したモジュールを備えてよい。これらのプログラム又はモジュールは、データ処理装置、入力装置、出力装置、記憶装置等に働きかけて、コンピュータを対話型エージェントシステム100の各部として機能させたり、コンピュータに対話型エージェントシステム100の各部における情報処理方法を実行させたりする。
プログラムに記述された情報処理は、当該プログラムがコンピュータに読込まれることにより、当該プログラムに関連するソフトウエアと、対話型エージェントシステム100の各種のハードウエア資源とが協働した具体的手段として機能する。そして、上記の具体的手段が、本実施形態におけるコンピュータの使用目的に応じた情報の演算又は加工を実現することにより、当該使用目的に応じた対話型エージェントシステム100が構築される。
[車両110の各部の概要]
図2は、車両110の内部構成の一例を概略的に示す。本実施形態において、車両110は、入力部210と、出力部220と、通信部230と、センス部240と、駆動部250と、付帯設備260と、制御部270とを備える。本実施形態において、制御部270は、入出力制御部272と、車両制御部274と、通信制御部276とを有する。本実施形態において、応答システム112は、入力部210、出力部220及び入出力制御部272により構成される。また、通信システム114は、通信部230及び通信制御部276により構成される。
入力部210は、入力部の一例であってよい。出力部220は、エージェント出力部の一例であってよい。制御部270は、制御装置及び第2要求処理装置の一例であってよい。入出力制御部272は、制御装置の一例であってよい。
本実施形態において、入力部210は、情報の入力を受け付ける。例えば、入力部210は、ユーザ20からの要求を受け付ける。入力部210は、通信端末30を介して、ユーザ20からの要求を受け付けてもよい。
一実施形態において、入力部210は、車両110の操作に関する要求を受け付ける。車両110の操作に関する要求としては、センス部240の操作又は設定に関する要求、駆動部250の操作又は設定に関する要求、付帯設備260の操作又は設定に関する要求などが例示される。設定に関する要求としては、設定を変更するための要求、設定を確認するための要求などが例示される。他の実施形態において、入力部210は、ユーザ20の音声及びジェスチャの少なくとも一方により示される要求を受け付ける。
入力部210としては、キーボード、ポインティングデバイス、タッチパネル、操作ボタン、マイク、カメラ、センサ、3次元スキャナ、視線計測器、ハンドル、アクセル、ブレーキ、シフトレバーなどが例示される。入力部210は、ナビゲーション装置の一部を構成してよい。
本実施形態において、出力部220は情報を出力する。出力部220は、例えば、ユーザ20からの要求に対する対話型エージェントシステム100の応答を、ユーザ20に提示する。出力部220は、通信端末30を介して、上記の応答をユーザ20に提示してもよい。出力部220としては、画像出力装置、音声出力装置、振動発生装置、超音波発生装置などが例示される。出力部220は、ナビゲーション装置の一部を構成してよい。
画像出力装置は、エージェントの画像を表示又は投影する。画像は、静止画像であってもよく、動画像(映像と称される場合がある。)であってもよい。画像は、平面画像であってもよく、立体画像であってもよい。立体画像の方式は、特に限定されるものではないが、2眼立体方式、インテグラル方式、ホログラフィー方式などが例示される。
画像出力装置としては、表示装置、投影装置、印刷装置などが例示される。音声出力装置としては、スピーカ、ヘッドホン、イヤホンなどが例示される。スピーカは、指向性を有してもよく、指向性の向きを調整又は変更する機能を有してもよい。
本実施形態において、通信部230は、通信ネットワーク10を介して、車両110と、支援サーバ120との間で情報を送受する。通信部230は、有線通信又は近距離無線通信により、車両110と、通信端末30との間で情報を送受してもよい。通信部230は、1又は複数の通信方式に対応していてもよい。
本実施形態において、センス部240は、車両110の状態を検出又は監視する1又は複数のセンサを含む。1又は複数のセンサのそれぞれは、任意の内界センサであってもよく、任意の外界センサであってもよい。1又は複数のセンス部240の少なくとも一部は、入力部210として利用されてもよい。例えば、センス部240は、車両110の内部を撮像するカメラ、車両110の内部の音声を収集するマイク、車両110の外部を撮像するカメラ、及び、車両110の外部の音声を収集するマイクの少なくとも1つを含む。上記のカメラ又はマイクは、入力部210として利用されてよい。
車両110の状態としては、速度、加速度、傾斜、振動、騒音、駆動部250の作動状況、付帯設備260の作動状況、安全装置の作動状況、自動運転装置の作動状況、異常の発生状況、現在位置、移動経路、外気の温度、外気の湿度、外気の圧力、内部空間の温度、内部空間の湿度、内部空間の圧力、周囲の物体との相対位置、周囲の物体との相対速度などが例示される。安全装置としては、ABS(Antilock Brake System)、エアバッグ、自動ブレーキ、衝突回避装置などが例示される。
本実施形態において、駆動部250は、車両110を駆動する。駆動部250は、制御部270からの命令に応じて、車両110を駆動してよい。駆動部250は、内燃機関によって動力を発生させてもよく、電動機によって動力を発生させてもよい。
本実施形態において、付帯設備260は、車両110に搭載される機器のうち、駆動部250以外の機器であってよい。付帯設備260は、制御部270からの命令に従って作動してよい。付帯設備260は、ユーザ20の操作に従って作動してもよい。付帯設備260としては、保安機器、座席調整機器、施錠管理機器、窓開閉機器、照明機器、空調機器、ナビゲーション機器、音響機器、映像機器などが例示される。
本実施形態において、制御部270は、車両110の各部を制御する。制御部270は、応答システム112を制御してもよい。制御部270は、通信システム114を制御してもよい。制御部270は、入力部210、出力部220、通信部230、センス部240、駆動部250及び付帯設備260の少なくとも1つを制御してもよい。また、制御部270の各部は、互いに情報を送受してよい。
本実施形態において、入出力制御部272は、車両110における情報の入出力を制御する。例えば、入出力制御部272は、ユーザ20と、車両110との間における情報の伝達を制御する。入出力制御部272は、入力部210及び出力部220の少なくとも一方の動作を制御してよい。入出力制御部272は、応答システム112の動作を制御してもよい。
例えば、入出力制御部272は、入力部210を介して、ユーザ20からの要求を含む情報を取得する。入出力制御部272は、上記の要求に対する応答を決定する。入出力制御部272は、応答の内容及び様態の少なくとも一方を決定してよい。入出力制御部272は、上記の応答に関する情報を出力する。一実施形態において、入出力制御部272は、出力部220を介して、上記の応答を含む情報をユーザ20に提示する。他の実施形態において、入出力制御部272は、通信部230を介して、上記の応答を含む情報を通信端末30に送信する。通信端末30は、上記の応答を含む情報をユーザ20に提示する。
入出力制御部272は、ローカル型対話エンジン及びクラウド型対話エンジンの少なくとも一方を利用して、上記の要求に対する応答を決定してよい。これにより、入出力制御部272は、応答システム112を、ローカル型対話エンジンのユーザインタフェースとして機能させることができる。また、入出力制御部272は、応答システム112を、クラウド型対話エンジンのユーザインタフェースとして機能させることができる。
入出力制御部272は、車両110及び支援サーバ120の間の通信状態を示す情報(通信情報と称される場合がある。)に基づいて、ローカル型対話エンジン及びクラウド型対話エンジンの何れの対話エンジンにおける処理の実行結果に基づいて応答するかを決定する。なお、入出力制御部272は、複数のローカル型対話エンジンを利用してもよく、複数のクラウド型対話エンジンを利用してもよい。この場合、入出力制御部272は、少なくとも通信情報に基づいて、どの対話エンジンにおける処理の実行結果に基づいて応答するかを決定してよい。入出力制御部272は、発話者又は運転者に応じて、どの対話エンジンにおける処理の実行結果に基づいて応答するかを決定してもよい。入出力制御部272は、同乗者の有無に応じて、どの対話エンジンにおける処理の実行結果に基づいて応答するかを決定してもよい。
一実施形態において、入出力制御部272は、通信情報に基づいて、ユーザ20からの要求を処理する対話エンジンを決定する。この場合、ローカル型対話エンジン及びクラウド型対話エンジンの一方がユーザ20からの要求を処理し、他方はユーザ20からの要求を処理しない。
他の実施形態において、ローカル型対話エンジン及びクラウド型対話エンジンのそれぞれが、ユーザ20からの要求に応じた処理を実行し、当該要求に対する応答の候補となる情報を入出力制御部272に出力する。入出力制御部272は、予め定められた期間内に得られた1又は複数の候補を利用して、ユーザ20からの要求に対する応答を決定する。例えば、入出力制御部272は、予め定められたアルゴリズムに従って、1又は複数の候補のうちの1つを、ユーザ20からの要求に対する応答として決定する。
なお、入出力制御部272又は対話エンジンがユーザ20からの要求を受け付けた後、予め定められた期間内に、入出力制御部272が、支援サーバ120の上で動作するクラウド型対話エンジンにおける処理の実行結果を受信することができたか否かを示す情報は、通信情報の一例であってもよい。例えば、入出力制御部272が、ユーザ20からの要求を受け付けた後、予め定められた期間内に、クラウド型対話エンジンにおける処理の実行結果を受信できない場合、入出力制御部272は、車両110及び支援サーバ120の間の通信状態が良好でないと判定することができる。
入出力制御部272は、例えば、通信制御部276から、通信情報を取得する。なお、通信情報は、(i)通信部230、入出力制御部272又は通信制御部276と、支援サーバ120との間の通信状態を示す情報であってもよく、(ii)通信部230、入出力制御部272又は通信制御部276と、通信ネットワーク10との間の通信状態を示す情報であってもよく、(iii)通信ネットワーク10の通信状態を示す情報であってもよく、(iv)通信ネットワーク10と、支援サーバ120との間の通信状態を示す情報であってもよく、(v)車両110及び支援サーバ120の少なくとも一方における通信障害の有無を示す情報であってもよい。
入出力制御部272は、1又は複数のイベントの発生を検出し、検出されたイベントの種類に基づいて、応答システム112の動作を制御してもよい。一実施形態において、入出力制御部272は、起動要求の入力を検出する。起動要求の入力が検出された場合、入出力制御部272は、例えば、応答システム112の状態を、スタンバイ状態から起動状態に変更することを決定する。
他の実施形態において、入出力制御部272が、ユーザ20の通信端末30にメッセージを送信すべきイベント(伝言イベントと称される場合がある。)の発生を検出する。伝言イベントの発生が検出された場合、入出力制御部272は、例えば、通信ネットワーク10を介して、ユーザ20の通信端末30に音声メッセージを送信することを決定する。
入出力制御部272は、ユーザ20からの要求に応答するときのエージェントの様態を制御してよい。一実施形態において、入出力制御部272は、通信情報に基づいて、エージェントの様態を制御する。例えば、入出力制御部272は、車両110及び支援サーバ120の間の通信状態が予め定められた条件を満足する場合と、車両110及び支援サーバ120の間の通信状態が上記の条件を満足しない場合とで、エージェントの様態を切り替える。予め定められた条件は、通信状態が予め定められた特定の状態よりも良好であるという条件であってよい。
他の実施形態において、入出力制御部272は、ユーザ20からの要求を処理した対話エンジンを示す情報に基づいて、エージェントの様態を制御する。例えば、入出力制御部272は、ローカル型対話エンジンにおける処理の実行結果に基づいて応答する場合と、クラウド型対話エンジンにおける処理の実行結果に基づいて応答する場合とで、エージェントの様態を切り替える。なお、上述のとおり、通信情報に基づいて、どの対話エンジンにおける処理の実行結果に基づいて応答するかが決定されてもよい。
他の実施形態において、入出力制御部272は、(i)ユーザ20による要求の伝達手段を示す情報、(ii)ユーザ20による要求の伝え方を示す情報、並びに、(iii)要求伝達時のユーザ20の心理状態、覚醒状態及び健康状態の少なくとも1つを示す情報の少なくとも1つに基づいて、エージェントの様態を制御する。要求の伝達手段としては、発話、手話、手話以外のジェスチャなどが例示される。手話以外のジェスチャとしては、手又は指の動作により定義されたサイン、頭部の動作により定義されたサイン、視線により定義されたサイン、顔表情により定義されたサインなどが例示される。
要求の伝え方としては、要求伝達時のユーザ20の様子、要求の伝達に要した時間の長さ、要求の明確性の程度などが例示される。要求伝達時のユーザ20の様子としては、(i)発話又は手話の口調、癖、テンポ、及び、間の取り方、(ii)発話のアクセント、イントネーション、及び、声量、(iii)エージェント又は出力部220と、ユーザとの相対位置、並びに、(iv)注視点の位置の少なくとも1つが例示される。要求の明確性の程度としては、要求が端的に伝達されているか否か、要求を伝達するためのメッセージが冗長的であるか否かなどが例示される。
さらに他の実施形態において、入出力制御部272は、車両110の状態を示す情報に基づいて、エージェントの様態を制御する。車両110の状態は、車両110の移動状態、車両110の各部の動作状態、及び、車両110の内部空間の状態の少なくとも1つであってよい。
車両110の移動状態としては、現在位置、移動経路、速度、加速度、傾斜、振動、騒音、渋滞の有無又は程度、連続運転時間、急加速の有無又は頻度、急減速の有無又は頻度などが例示される。車両110の各部の動作状態としては、駆動部250の作動状況、付帯設備260の作動状況、安全装置の作動状況、自動運転装置の作動状況などが例示される。作動状況としては、正常動作中、停止中、メンテナンス中、異常発生中などが例示される。作動状況には、特定の機能の作動の有無又は頻度が含まれてもよい。
車両110の内部空間の状態としては、内部空間の温度、湿度、圧力、特定の化学物質の濃度、内部空間に存在するユーザ20の人数、内部空間に存在する複数のユーザ20の人間関係などが例示される。内部空間に存在するユーザ20の人数を示す情報は、同乗者の有無を示す情報の一例であってよい。
本実施形態において、車両制御部274は、車両110の動作を制御する。例えば、車両制御部274は、センス部240が出力した情報を取得する。車両制御部274は、駆動部250及び付帯設備260の少なくとも一方の動作を制御してよい。車両制御部274は、センス部240が出力した情報に基づいて、駆動部250及び付帯設備260の少なくとも一方の動作を制御してもよい。
本実施形態において、通信制御部276は、車両110と外部の機器との間の通信を制御する。通信制御部276は、通信部230の動作を制御してよい。通信制御部276は、通信インタフェースであっってもよい。通信制御部276は、1又は複数の通信方式に対応してよい。通信制御部276は、車両110及び支援サーバ120の間の通信状態を検出又は監視してよい。通信制御部276は、上記の検出又は監視の結果に基づいて、通信情報を生成してよい。
通信情報としては、通信の可否、電波状況、通信品質、通信方式の種類、及び、通信キャリアの種類などに関する情報が例示される。電波状況としては、電波受信レベル、電波強度、RSCP(Received Signal Code Power)、CID(Cell ID)などが例示される。通信品質としては、通信速度、データ通信のスループット、データ通信のレイテンシなどが例示される。
通信の可否に関し、例えば、通信ネットワーク10、通信システム114及び支援サーバ120の少なくとも1つにおいて通信障害が発生している場合に、通信が可能でない(通信不可と称される場合がある。)と判断される。電波受信レベルが予め定められたレベルよりも小さい場合(例えば、圏外である場合)に、通信不可と判断されてもよい。通信の可否は、特定の電波状況又は通信品質に関する情報を取得する処理(試行と称される場合がある。)を複数回繰り返した結果に基づいて、判断されてもよい。
一実施形態によれば、予め定められた回数の試行のうち、電波状況又は通信品質が予め定められた第1の閾値よりも良好であった試行の割合が、予め定められた第2の閾値よりも大きい場合に、通信が可能である(通信可能と称される場合がある。)と判断される。それ以外の場合は、通信不可と判断される。他の実施形態によれば、予め定められた回数の試行のうち、電波状況又は通信品質が予め定められた第1の閾値よりも不良であった試行の割合が、予め定められた第2の閾値よりも大きい場合に、通信不可と判断される。それ以外の場合は、通信可能と判断される。
[入出力制御部272の各部の概要]
図3は、入出力制御部272の内部構成の一例を概略的に示す。本実施形態において、入出力制御部272は、音声情報取得部312と、画像情報取得部314と、操作情報取得部316と、車両情報取得部318と、通信情報取得部322と、転送部330と、要求処理部340と、応答管理部350と、エージェント情報格納部360とを備える。
通信情報取得部322は、通信情報取得部の一例であってよい。要求処理部340は、第2要求処理装置の一例であってよい。応答管理部350は、様態決定部及び処理装置決定部の一例であってよい。
本実施形態において、音声情報取得部312は、入力部210から、入力部210に入力された音声に関する情報(音声情報と称される場合がある。)を取得する。音声情報取得部312は、通信部230を介して、通信端末30の入力装置に入力された音声に関する情報(音声情報と称される場合がある。)を取得してもよい。例えば、音声情報取得部312は、ユーザ20の音声に関する情報を取得する。音声情報としては、音声が記録された音声データ、当該音声が記録された時刻を示す情報などが例示される。音声情報取得部312は、音声情報を転送部330に出力してよい。
本実施形態において、画像情報取得部314は、入力部210から、入力部210が取得した画像に関する情報(画像情報と称される場合がある。)を取得する。画像情報取得部314は、通信部230を介して、通信端末30の入力装置が取得した画像に関する情報(画像情報と称される場合がある。)を取得してもよい。例えば、画像情報取得部314は、ユーザ20を撮像した画像に関する情報を取得する。画像情報としては、画像が記録された画像データ、当該画像が記録された時刻を示す情報などが例示される。画像情報取得部314は、画像情報を転送部330に出力してよい。
本実施形態において、操作情報取得部316は、入力部210から、ユーザ20による車両110の操作に関する情報(操作情報と称される場合がある。)を取得する。車両110の操作としては、駆動部250に関する操作、及び、付帯設備260に関する操作の少なくとも一方が例示される。一実施形態において、操作情報取得部316は、操作情報を転送部330に出力する。他の実施形態において、操作情報取得部316は、操作情報を車両制御部274に出力する。
駆動部250に関する操作としては、ハンドル操作、アクセル操作、ブレーキ操作、運転モードの変更に関する操作などが例示される。付帯設備260に関する操作としては、付帯設備260のON/OFFに関する操作、付帯設備260の設定に関する操作、付帯設備260の動作に関する操作、などが例示される。より具体的には、方向指示器に関する操作、ワイパーに関する操作、ウインドウォッシャー液の吐出に関する操作、ドアの施錠に関する操作、窓の開閉に関する操作、空調機器又は照明機器のON/OFFに関する操作、空調機器又は照明機器の設定に関する操作、ナビゲーション機器、音響機器又は映像機器のON/OFFに関する操作、ナビゲーション機器、音響機器又は映像機器の設定に関する操作、ナビゲーション機器、音響機器又は映像機器の動作の開始又は終了に関する操作などが例示される。
本実施形態において、車両情報取得部318は、センス部240から、車両110の状態を示す情報(車両情報と称される場合がある。)を取得する。一実施形態において、車両情報取得部318は、車両情報を転送部330に出力する。他の実施形態において、車両情報取得部318は、車両情報を車両制御部274に出力してよい。
本実施形態において、通信情報取得部322は、通信制御部276から、通信情報を取得する。一実施形態において、通信情報取得部322は、通信情報を応答管理部350に出力する。他の実施形態において、通信情報取得部322は、通信情報を転送部330又は要求処理部340に出力してよい。
本実施形態において、転送部330は、音声情報、画像情報、操作情報及び車両情報の少なくとも1つを、要求処理部340及び支援サーバ120の少なくとも一方に転送する。転送部330は、応答管理部350からの命令に従って、各種情報の転送先を決定してよい。転送部330は、操作情報を車両制御部274に転送してよい。転送部330は、操作情報及び車両情報を車両制御部274に転送してよい。
なお、本実施形態においては、通信情報取得部322が応答管理部350に通信情報を出力し、応答管理部350が、通信情報に基づいて、音声情報、画像情報、操作情報、車両情報などの転送先を決定する場合を例として、入出力制御部272の詳細が説明される。しかしながら、入出力制御部272は本実施形態に限定されない。他の実施形態において、通信情報取得部322は、転送部330に通信情報を出力し、転送部330が、通信情報に基づいて、音声情報、画像情報、操作情報、車両情報などの転送先を決定してもよい。
本実施形態において、要求処理部340は、ユーザ20からの要求を取得し、当該要求に応じた処理を実行する。要求処理部340は、上記の要求に対する応答を決定する。例えば、要求処理部340は、応答の内容及び様態の少なくとも一方を決定する。要求処理部340は、上記の決定結果に基づいて、応答に関する情報を生成する。要求処理部340は、応答に関する情報を応答管理部350に出力する。
要求処理部340は、起動要求を検出してよい。起動要求が検出された場合、要求処理部340は、起動要求が検出されたことを示す情報を応答管理部350に出力してよい。これにより、応答システム112における応答処理が開始される。要求処理部340は、ローカル型対話エンジンの一例であってよい。要求処理部340の詳細は後述される。
なお、本実施形態においては、要求処理部340が、入力部210に入力されたユーザ20の音声又はジェスチャによる要求を、有線通信又は近距離無線通信により取得し、当該要求に応じた処理を実行する場合を例として、要求処理部340の詳細が説明される。しかしながら、要求処理部340は本実施形態に限定されない。他の実施形態において、要求処理部340は、通信端末30の入力装置に入力されたユーザ20の音声又はジェスチャによる要求を、有線通信又は近距離無線通信により取得し、当該要求に応じた処理を実行する。この場合、通信端末30は、応答システム112の一部を構成してもよい。
また、本実施形態においては、要求処理部340が車両110に配される場合を例として、要求処理部340の詳細が説明される。しかしながら、要求処理部340は本実施形態に限定されない。他の実施形態において、要求処理部340は通信端末30に配されてよい。この場合、通信端末30は、応答システム112の一部を構成してもよい。
本実施形態において、応答管理部350は、ユーザ20からの要求に対する応答を管理する。応答管理部350は、ローカル型対話エンジン及びクラウド型対話エンジンの利用を管理してよい。例えば、応答管理部350は、転送部330の動作を制御して、ローカル型対話エンジン及びクラウド型対話エンジンの利用を管理する。応答管理部350は、応答の内容及び様態の少なくとも一方を管理してよい。
例えば、ユーザ20からの要求が検索又は調査に関する要求である場合、応答管理部350は、出力部220から出力される応答メッセージの内容を管理する。応答管理部350は、エージェントが応答メッセージを出力するときのエージェントの様態を管理してよい。応答管理部350は、エージェント情報格納部360に格納された情報を参照して、出力部220から出力される音声及び画像の少なくとも一方を生成してよい。なお、ユーザ20からの要求が車両110の制御に関する要求である場合、応答管理部350は、当該要求に応じて車両110を制御するための命令を、車両制御部274に出力してよい。応答管理部350の詳細は後述される。
本実施形態において、エージェント情報格納部360は、エージェントに関する各種の情報を格納する。エージェント情報格納部360の詳細は後述される。
図4は、要求処理部340の内部構成の一例を概略的に示す。本実施形態において、要求処理部340は、要求決定部420と、実行部430と、応答情報生成部440と、設定情報格納部450とを備える。
本実施形態によれば、理解を容易にすることを目的として、要求処理部340が、予め定められた1又は複数の種類の要求を認識し、その他の要求は認識しないように構成される場合を例として、要求処理部340の詳細が説明される。要求処理部340が認識することのできる要求は、要求処理部340が受け付けることのできる処理に対応する要求であってよい。
本実施形態によれば、理解を容易にすることを目的として、要求処理部340が、通信ネットワーク10を利用しない処理は受け付ける一方で、通信ネットワーク10を利用する処理は受け付けない場合を例として、要求処理部340の詳細が説明される。例えば、要求処理部340は、車両110の操作に関する処理を受け付けるが、インターネット上の情報を検索する処理を受け付けない。
本実施形態において、要求決定部420は、転送部330を介して、音声情報取得部312が取得した音声情報、及び、画像情報取得部314が取得した画像情報の少なくとも一方を取得する。要求決定部420は、音声情報取得部312が取得した音声情報、画像情報取得部314が取得した画像情報、操作情報取得部316が取得した操作情報、及び、車両情報取得部318が取得した車両情報の少なくとも1つを取得してもよい。要求決定部420は、(i)音声情報及び画像情報の一方と、(ii)音声情報及び画像情報の他方、操作情報、並びに、車両情報の少なくとも1つとを取得してもよい。
要求決定部420は、上記の音声情報及び画像情報の少なくとも一方を解析して、特定の種類の要求(特定要求と称される場合がある。)を認識するための処理を実行する。要求決定部420は、設定情報格納部450に格納された情報を参照して、特定要求を認識してよい。特定要求としては、起動要求、応答システム112における応答処理を中止又は中断するための要求(中止要求と称される場合がある)、車両110の操作に関する要求などが例示される。車両110の操作に関する要求としては、センス部240の操作又は設定に関する要求、駆動部250の操作又は設定に関する要求、付帯設備260の操作又は設定に関する要求などが例示される。設定に関する要求としては、設定を変更するための要求、設定を確認するための要求などが例示される。
(a)特定要求が認識された場合、要求決定部420は、認識された特定要求の種類を示す情報を、実行部430に出力してよい。これにより、要求決定部420は、ユーザ20の音声及びジェスチャの少なくとも一方により示される要求を取得することができる。
一方、(b)起動要求が認識された後、特定要求が認識されない場合において、特定要求以外の要求が認識されたとき、要求決定部420は、要求処理部340では当該要求に応じることができないことを示す情報を、応答情報生成部440に出力してよい。また、(c)起動要求が認識された後、特定要求が認識されない場合において、音声情報及び画像情報の少なくとも一方を解析しても要求を認識することができないとき、要求決定部420は、要求の認識が不能であることを示す情報を、応答情報生成部440に出力してよい。要求決定部420の詳細は後述される。
本実施形態において、実行部430は、要求決定部420から、認識された特定要求の種類を示す情報を取得する。実行部430は、認識された特定要求の種類に応じた処理を実行する。実行部430は、設定情報格納部450に格納された情報を参照して、上記の処理を決定してよい。実行部430は、例えば、実行結果を示す情報を、応答情報生成部440に出力する。実行部430は、処理が実行されたことを示す情報を、応答情報生成部440に出力してもよい。
本実施形態において、応答情報生成部440は、ユーザ20からの要求に対する応答を決定する。応答情報生成部440は、応答の内容及び様態の少なくとも一方を決定してよい。応答情報生成部440は、決定された応答の内容及び様態の少なくとも一方を示す情報(応答情報と称される場合がある。)を生成してよい。応答情報生成部440は、生成された応答情報を、応答管理部350に出力してよい。
応答の内容としては、出力部220から出力される応答メッセージの種類又は内容、車両制御部274に送信される命令の種類又は内容などが例示される。応答メッセージとして、1又は複数の定型のメッセージが用意されている場合、応答メッセージの種類は、1又は複数の定型のメッセージのそれぞれを識別するための識別情報であってよい。命令の種類は、車両制御部274において実行可能な1又は複数の命令のそれぞれを識別するための識別情報であってよい。
応答の様態としては、出力部220が応答メッセージを出力するときのエージェントの様態、車両制御部274による車両110の制御の様態などが例示される。上述のとおり、エージェントの様態としては、エージェントとして利用されるキャラクタの種類、当該キャラクタの外観、当該キャラクタの声、及び、インタラクションの様態の少なくとも1つが例示される。車両110の制御の様態としては、急加速、急減速、急ハンドルなどの急な操作を抑制する態様などが例示される。
本実施形態において、設定情報格納部450は、要求処理部340の設定に関する各種の情報を格納する。例えば、設定情報格納部450は、特定要求の種類を識別するための識別情報と、当該特定要求を検出するための特徴を示す特徴情報とを対応づけて格納する。設定情報格納部450は、特定要求の種類を識別するための識別情報と、当該特定要求を検出するための特徴を示す特徴情報と、当該特定要求に応じた処理の内容及び様態の少なくとも一方を示す情報とを対応付けて格納してもよい。
図5は、要求決定部420の内部構成の一例を概略的に示す。本実施形態において、要求決定部420は、入力情報取得部520と、音声認識部532と、ジェスチャ認識部534と、判定部540とを備える。
本実施形態において、入力情報取得部520は、要求処理部340の入力となる情報を取得する。例えば、入力情報取得部520は、音声情報取得部312が取得した音声情報、及び、画像情報取得部314が取得した画像情報の少なくとも一方を取得する。入力情報取得部520は、音声情報取得部312が取得した音声情報、画像情報取得部314が取得した画像情報、操作情報取得部316が取得した操作情報、及び、車両情報取得部318が取得した車両情報の少なくとも1つを取得してもよい。入力情報取得部520は、(i)音声情報及び画像情報の一方と、(ii)音声情報及び画像情報の他方、操作情報、並びに、車両情報の少なくとも1つとを取得してもよい。
本実施形態において、入力情報取得部520は、取得された音声情報を音声認識部532に転送する。入力情報取得部520は、取得された画像情報をジェスチャ認識部534に転送する。
なお、本実施形態においては、理解を容易にすることを目的として、入力情報取得部520が、音声情報及び画像情報の少なくとも一方を取得する場合を例として、要求決定部420の詳細が説明される。しかしながら、入力情報取得部520が車両情報を取得した場合、入力情報取得部520は、車両情報を、音声認識部532及びジェスチャ認識部534の少なくとも一方に転送してもよい。また、入力情報取得部520が操作情報を取得した場合、入力情報取得部520は、操作情報を車両制御部274に転送してもよい。
本実施形態において、音声認識部532は、音声情報を解析して、ユーザ20の発話の内容を特定する。音声認識部532は、ユーザ20の発話の内容を解析して、ユーザ20の要求を認識する。音声認識部532は、特定要求以外の要求を認識しないように設定されてもよい。音声認識部532は、認識された要求の種類を示す情報を、判定部540に出力する。音声認識部532は、音声情報を解析したにもかかわらず、要求を認識することができなかった場合、要求の認識が不能であることを示す情報を、判定部540に出力してよい。
本実施形態において、ジェスチャ認識部534は、画像情報を解析して、ユーザ20により示された1又は複数のジェスチャを抽出する。ジェスチャ認識部534は、抽出されたジェスチャを解析して、ユーザ20の要求を認識する。ジェスチャ認識部534は、特定要求以外の要求を認識しないように設定されてもよい。ジェスチャ認識部534は、認識された要求の種類を示す情報を、判定部540に出力する。ジェスチャ認識部534は、画像情報を解析したにもかかわらず、要求を認識することができなかった場合、要求の認識が不能であることを示す情報を、判定部540に出力してよい。
本実施形態において、判定部540は、音声認識部532及びジェスチャ認識部534の少なくとも一方において認識された要求が、特定要求であるか否かを判定する。例えば、判定部540は、設定情報格納部450に格納された情報を参照して、音声認識部532及びジェスチャ認識部534の少なくとも一方において認識された要求が、特定要求であるか否かを判定する。
(a)音声認識部532及びジェスチャ認識部534の少なくとも一方において認識された要求が、特定要求であった場合、判定部540は、認識された特定要求の種類を示す情報を、実行部430に出力してよい。(b)音声認識部532及びジェスチャ認識部534において認識された要求が、特定要求ではなかった場合、判定部540は、要求処理部340では当該要求に応じることができないことを示す情報を、応答情報生成部440に出力してよい。(c)音声認識部532及びジェスチャ認識部534が要求を認識することができなかった場合、判定部540は、要求の認識が不能であることを示す情報を、応答情報生成部440に出力してよい。
図6は、応答管理部350の内部構成の一例を概略的に示す。本実施形態において、応答管理部350は、転送制御部620と、応答決定部630と、音声合成部642と、画像生成部644と、命令生成部650とを備える。本実施形態において、応答決定部630は、起動管理部632と、応答内容決定部634と、応答様態決定部636とを有する。
転送制御部620は、処理装置決定部の一例であってよい。応答決定部630は、処理装置決定部の一例であってよい。応答内容決定部634は、処理装置決定部の一例であってよい。応答様態決定部636は、様態決定部及び処理装置決定部の一例であってよい。音声合成部642は、音声メッセージ生成部の一例であってよい。
本実施形態において、転送制御部620は、転送部330の動作を制御する。転送制御部620は、転送部330の動作を制御するための命令を生成し、当該命令を転送部330に送信してよい。転送制御部620は、転送部330の設定を変更するための命令を生成し、当該命令を転送部330に送信してもよい。
例えば、転送制御部620は、通信情報取得部322から、通信情報を取得する。転送制御部620は、通信情報に基づいて、上記の命令を生成する。これにより、転送制御部620は、通信情報により示される通信状態に基づいて、応答システム112を、クラウド型対話エンジン及びローカル型対話エンジンの何れのユーザインタフェースとして機能させるかを決定することができる。
例えば、転送制御部620は、通信情報により示される通信状態が予め定められた条件を満足する場合、通信状態が良好であると判定する。一方、転送制御部620は、通信情報により示される通信状態が上記の予め定められた条件を満足しない場合、通信状態が不良であると判定する。予め定められた条件としては、通信が可能であるという条件、電波状況が特定の状況よりも良好であるという条件、通信品質が特定の品質よりも良好であるという条件などが例示される。
通信状態が良好であると判定された場合、転送制御部620は、転送部330に入力された情報が、通信部230を介して支援サーバ120に転送されるように、上記の命令を生成する。転送制御部620は、音声情報及び画像情報の少なくとも一方が支援サーバ120に転送されるように、上記の命令を生成してよい。これにより、ユーザ20からの要求がクラウド型対話エンジンにおいて処理され得る。
一方、通信状態が不良であると判定された場合、転送制御部620は、転送部330に入力された情報が、要求処理部340に転送されるように、上記の命令を生成する。転送制御部620は、音声情報及び画像情報の少なくとも一方が要求処理部340に転送されるように、上記の命令を生成してよい。これにより、ユーザ20からの要求がローカル型対話エンジンにおいて処理され得る。
なお、転送制御部620は、車両110及び支援サーバ120の間の通信状態にかかわらず、転送部330に入力された情報が、支援サーバ120及び要求処理部340の両方に転送されるように、上記の命令を生成してもよい。この場合において、車両110及び支援サーバ120の間の通信状態が不良であるときには、応答管理部350は、所定の期間内に、支援サーバ120により実現されるクラウド型対話エンジンからの回答を受領することができない。そのため、結果として、応答管理部350は、要求処理部340により実現されるローカル型対話エンジンからの回答を利用して、ユーザ20からの要求に応答することになる。
転送制御部620は、操作情報が転送部330に入力された場合に、当該操作情報が車両制御部274に転送されるように、上記の命令を生成してもよい。これにより、車両110の操作に対するレスポンスが向上する。
本実施形態において、応答決定部630は、応答システム112による応答処理を管理する。例えば、応答決定部630は、応答処理が開始又は終了するタイミングを決定する。また、応答決定部630は、ユーザ20からの要求に対する応答を決定する。応答決定部630は、ローカル型対話エンジン及びクラウド型対話エンジンの何れの出力に基づいて、ユーザ20からの要求に応答するかを決定してもよい。応答決定部630は、転送制御部620を介して、転送部330の動作を制御してもよい。
本実施形態において、起動管理部632は、応答システム112による応答処理が開始又は終了するタイミグを管理する。起動管理部632は、応答システム112の状態に応じて、転送部330を制御してよい。
[応答システム112による応答処理を開始する手順]
例えば、起動管理部632は、下記の手順に従って、応答システム112による応答処理を開始する。本実施形態において、応答システム112が起動してスタンバイ状態に移行すると、起動管理部632は、要求処理部340が起動要求を検出することができるように、転送部330を制御する。具体的には、起動管理部632は、応答システム112がスタンバイ状態に移行したことを示す情報を、転送制御部620に出力する。
転送制御部620は、応答システム112がスタンバイ状態に移行したことを示す情報を取得すると、音声情報及び画像情報の少なくとも一方を要求処理部340に転送することを指示する命令を、転送部330に送信する。転送制御部620は、(i)音声情報及び画像情報の一方と、(ii)音声情報及び画像情報の他方、操作情報及び車両情報の少なくとも1つとを要求処理部340に転送することを指示する命令を、転送部330に送信してもよい。
要求処理部340は、転送部330から情報が入力されると、少なくとも音声情報又は画像情報を解析して、ユーザ20の発話、ジェスチャなどから起動要求を検出するための処理を開始する。要求処理部340は、起動要求を検出すると、起動要求が検出されたことを示す情報を、応答管理部350に出力する。
本実施形態において、起動管理部632は、要求処理部340から、起動要求が検出されたことを示す情報を取得する。起動要求が検出されたことに応じて、起動管理部632は、応答処理を開始することを決定する。
このとき、起動管理部632は、転送部330に入力された各種情報の少なくとも1つの転送先を決定してもよい。起動管理部632は、上記の転送先に要求処理部340が含まれるか否かを決定してよい。起動管理部632は、上記の転送先に支援サーバ120が含まれるか否かを決定してよい。起動管理部632は、通信情報取得部322から通信情報を取得し、当該通信情報に基づいて、転送部330に入力された各種情報の少なくとも1つの転送先を決定してもよい。
例えば、起動管理部632は、通信情報により示される通信状態が予め定められた第1条件を満足する場合、要求処理部340における要求認識処理に利用される情報の転送先に、要求処理部340が含まれることを決定する。第1条件としては、(i)通信情報により示される通信状態が、予め定められた第1状態よりも不良である場合、(ii)通信情報により示される通信状態を表すパラメータの値又は区分が、予め定められた第1の値又は区分よりも、通信状態が良好であることを示している場合などが例示される。
なお、起動管理部632は、応答システム112による応答処理が実行されている間、音声情報及び画像情報の少なくとも一方の転送先に、要求処理部340が含まれることを決定してもよい。要求処理部340における要求認識処理に利用される情報は、音声情報及び画像情報の少なくとも一方であってよい。要求処理部340における要求認識処理に利用される情報は、(i)音声情報及び画像情報の一方、及び、(ii)音声情報及び画像情報の他方、操作情報及び車両情報の少なくとも1つであってよい。
例えば、起動管理部632は、通信情報により示される通信状態が予め定められた第2条件を満足する場合、支援サーバ120における要求認識処理に利用される情報の転送先に、支援サーバ120が含まれることを決定する。第2条件としては、(i)通信情報により示される通信状態が、予め定められた第2状態よりも良好である場合、(ii)通信情報により示される通信状態を表すパラメータの値又は区分が、予め定められた第2の値又は区分よりも、通信状態が良好であることを示している場合などが例示される。第2状態は、第1状態と同一の状態であってもよく、第1状態とは異なる状態であってもよい。
なお、起動管理部632は、応答システム112による応答処理が実行されている間、音声情報及び画像情報の少なくとも一方の転送先に、支援サーバ120が含まれることを決定してもよい。支援サーバ120における要求認識処理に利用される情報は、音声情報及び画像情報の少なくとも一方であってよい。支援サーバ120における要求認識処理に利用される情報は、(i)音声情報及び画像情報の一方、及び、(ii)音声情報及び画像情報の他方、操作情報及び車両情報の少なくとも1つであってよい。
起動管理部632は、応答処理を開始することが決定されたことを示す情報を、転送制御部620に出力する。起動管理部632は、各情報の転送先を示す情報を、転送制御部620に出力してもよい。
転送制御部620は、応答処理を開始することが決定されたことを示す情報を取得すると、転送部330に入力される各種情報のそれぞれの転送先を決定する。一実施形態において、転送制御部620は、各情報の転送先を示す情報を起動管理部632から取得し、当該情報に基づいて、各情報の転送先を決定する。他の実施形態において、転送制御部620は、応答処理を開始することが決定されたことを示す情報を取得すると、予め定められた設定に従って、各情報の転送先を決定する。
転送制御部620は、転送先に関する設定の変更を指示する命令と、転送先に関する新たな設定に関する情報とを、転送部330に送信する。これにより、転送部330に入力された各種の情報が、車両110及び支援サーバ120の間の通信状態に応じた適切な対話エンジンに送信される。その結果、応答システム112が、ローカル型対話エンジン及びクラウド型対話エンジンの何れの出力に基づいて、ユーザ20からの要求に応答するかが、決定され得る。
要求処理部340は、転送部330から情報が入力されると、少なくとも音声情報又は画像情報を解析して、ユーザ20の発話、ジェスチャなどから特定要求を認識するための処理を開始する。要求処理部340は、特定要求を認識すると、認識された特定要求に応じた処理を実行し、当該特定要求に対する応答に関する情報を応答管理部350に出力する。
支援サーバ120は、転送部330から情報が入力されると、少なくとも音声情報又は画像情報を解析して、ユーザ20の発話、ジェスチャなどからユーザ20の要求を認識するための処理を開始する。要求処理部340は、ユーザ20の要求を認識すると、認識された要求に応じた処理を実行し、当該要求に対する応答に関する情報を応答管理部350に出力する。
起動管理部632は、応答システム112による応答処理を開始させるための処理が完了すると、音声合成部642及び画像生成部644の少なくとも一方と、出力部220とを介して、応答システム112よる応答処理が実行中であることを、ユーザ20に伝達する。例えば、起動管理部632は、エージェントの様態を、スタンバイ状態に対応する様態から、応答処理の実行中に対応する様態に切り替えることを決定する。
なお、本実施形態においては、要求処理部340が、音声情報又は画像情報を解析して起動要求を検出し、応答管理部350は、要求処理部340から、起動要求が検出されたことを示す情報を取得する場合を例として、応答管理部350の詳細が説明された。しかしながら、応答管理部350は本実施形態に限定されない。他の実施形態において、応答管理部350が、音声情報又は画像情報を解析して起動要求を検出してもよい。さらに他の実施形態において、支援サーバ120が、音声情報又は画像情報を解析して起動要求を検出し、応答管理部350は、支援サーバ120から、起動要求が検出されたことを示す情報を取得してもよい。
[応答システム112による応答処理を終了する手順]
例えば、起動管理部632は、下記の手順に従って、応答システム112による応答処理を終了する。一実施形態において、起動管理部632は、要求処理部340及び支援サーバ120の少なくとも一方から、中止要求が検出されたことを示す情報を取得する。中止要求が検出された場合、起動管理部632は、応答システム112をスタンバイ状態に移行させることを決定する。起動管理部632は、応答システム112をスタンバイ状態に移行させることを示す情報を、転送制御部620及び要求処理部340に出力する。起動管理部632は、応答システム112をスタンバイ状態に移行させることを示す情報を、支援サーバ120に出力してもよい。
転送制御部620は、応答システム112をスタンバイ状態に移行させることを示す情報を取得すると、(i)音声情報及び画像情報の少なくとも一方を要求処理部340に転送することを指示する命令、及び、(ii)支援サーバ120への情報の転送を中止することを指示する命令の少なくとも一方を、転送部330に送信する。転送制御部620は、(i)音声情報及び画像情報の一方と、(ii)音声情報及び画像情報の他方、操作情報及び車両情報の少なくとも1つとを要求処理部340に転送することを指示する命令を、転送部330に送信してもよい。
要求処理部340は、応答システム112をスタンバイ状態に移行させることを示す情報を取得すると、少なくとも音声情報又は画像情報を解析して、ユーザ20の発話、ジェスチャなどから起動要求を検出するための処理を開始する。このとき、要求処理部340は、起動要求以外の要求を認識しなくてもよい。これにより、制御部270の計算機能力及び電力の消費が抑制される。
他の実施形態において、ローカル型対話エンジン及びクラウド型対話エンジンは、応答処理中に、ユーザ20の活動レベルを判定する。例えば、(i)ローカル型対話エンジン及びクラウド型対話エンジンの少なくとも一方が要求を認識する頻度、(ii)ユーザ20の音声の大きさ、並びに、(iii)ユーザ20のジェスチャの変化の大きさの少なくとも1つが、予め定められた値よりも小さな状態が、一定時間継続した場合、ローカル型対話エンジン及びクラウド型対話エンジンは、応答処理中に、ユーザ20の活動レベルが低下したと判定する。
起動管理部632は、要求処理部340及び支援サーバ120の少なくとも一方から、ユーザ20の活動レベルが低下していることを示す情報を取得する。ユーザ20の活動レベルの低下が検出された場合、起動管理部632は、応答システム112をスタンバイ状態に移行させることを決定する。起動管理部632は、上記の実施形態における手順と同様の手順により、応答システム112をスタンバイ状態に移行させてよい。
本実施形態において、応答内容決定部634は、ユーザ20からの要求に対する応答の内容を決定する。応答内容決定部634は、要求処理部340から、ローカル型対話エンジンが決定した応答の内容を示す情報を取得する。応答内容決定部634は、支援サーバ120から、クラウド型対話エンジンが決定した応答の内容を示す情報を取得する。これらの情報は、応答の候補として利用される。
一実施形態において、例えば、車両110及び支援サーバ120の間の通信状態が良好でない場合、応答内容決定部634は、要求が受け付けられた後、所定の期間内に、支援サーバ120から、クラウド型対話エンジンが決定した応答の内容を示す情報を取得することができない。この場合、応答内容決定部634は、ローカル型対話エンジンが決定した応答の内容を、ユーザ20からの要求に対する応答の内容として決定する。その結果、本実施形態によれば、ユーザ20からの要求に対する応答の内容が、車両110及び支援サーバ120の間の通信状態に基づいて決定される。
他の実施形態において、例えば、車両110及び支援サーバ120の間の通信状態が良好である場合、応答内容決定部634は、要求が受け付けられた後、所定の期間内に、要求処理部340から、ローカル型対話エンジンが決定した応答の内容を示す情報を取得することができない。この場合、応答内容決定部634は、クラウド型対話エンジンが決定した応答の内容を、ユーザ20からの要求に対する応答の内容として決定する。その結果、本実施形態によれば、ユーザ20からの要求に対する応答の内容が、車両110及び支援サーバ120の間の通信状態に基づいて決定される。
さらに他の実施形態において、応答内容決定部634は、要求が受け付けられた後、所定の期間内に、ローカル型対話エンジンが決定した応答の内容を示す情報と、クラウド型対話エンジンが決定した応答の内容を示す情報とを取得する。この場合、この場合、応答内容決定部634は、例えば、クラウド型対話エンジンが決定した応答の内容を、ユーザ20からの要求に対する応答の内容として決定する。
本実施形態において、応答様態決定部636は、ユーザ20からの要求に対する応答の様態を決定する。応答様態決定部636は、要求処理部340から、ローカル型対話エンジンが決定した応答の様態を示す情報を取得する。応答様態決定部636は、支援サーバ120から、クラウド型対話エンジンが決定した応答の様態を示す情報を取得する。これらの情報は、応答の候補として利用される。
一実施形態において、例えば、車両110及び支援サーバ120の間の通信状態が良好でない場合、応答様態決定部636は、要求が受け付けられた後、所定の期間内に、支援サーバ120から、クラウド型対話エンジンが決定した応答の内容を示す情報を取得することができない。この場合、応答様態決定部636は、ローカル型対話エンジンが決定した応答の様態を、ユーザ20からの要求に対する応答の様態として決定する。その結果、本実施形態によれば、ユーザ20からの要求に対する応答の様態が、車両110及び支援サーバ120の間の通信状態に基づいて決定される。
他の実施形態において、例えば、車両110及び支援サーバ120の間の通信状態が良好である場合、応答様態決定部636は、要求が受け付けられた後、所定の期間内に、要求処理部340から、ローカル型対話エンジンが決定した応答の様態を示す情報を取得することができない。この場合、応答様態決定部636は、クラウド型対話エンジンが決定した応答の様態を、ユーザ20からの要求に対する応答の様態として決定する。その結果、本実施形態によれば、ユーザ20からの要求に対する応答の様態が、車両110及び支援サーバ120の間の通信状態に基づいて決定される。
さらに他の実施形態において、応答様態決定部636は、要求が受け付けられた後、所定の期間内に、ローカル型対話エンジンが決定した応答の様態を示す情報と、クラウド型対話エンジンが決定した応答の様態を示す情報とを取得する。この場合、この場合、応答様態決定部636は、例えば、クラウド型対話エンジンが決定した応答の様態を、ユーザ20からの要求に対する応答の様態として決定する。
上述のとおり、応答の様態としては、出力部220が応答メッセージを出力するときのエージェントの様態、車両制御部274による車両110の制御の様態などが例示される。また、エージェントの様態としては、エージェントとして利用されるキャラクタの種類、当該キャラクタの外観、当該キャラクタの声、及び、インタラクションの様態の少なくとも1つが例示される。
一実施形態において、応答様態決定部636は、(i)応答システム112又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合と、(ii)応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合とで、エージェントの様態が異なるように、エージェントの様態を決定する。その結果、エージェントの様態が、車両110及び支援サーバ120の間の通信状態に基づいて決定される。
他の実施形態において、応答様態決定部636は、(i)応答システム112又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合におけるエージェントの様態と、(ii)応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合におけるエージェントの様態とを、予め決定しておいてよい。応答様態決定部636は、ローカル型対話エンジン及びクラウド型対話エンジンの何れの対話エンジンからの情報が、ユーザ20からの要求に対する応答として採用されるかを決定する。応答様態決定部636は、上記の決定結果に基づいて、エージェントの様態を切り替える。その結果、エージェントの様態が、車両110及び支援サーバ120の間の通信状態に基づいて切り替えられる。
エージェントとして利用されるキャラクタの種類、及び、当該キャラクタに関する設定の少なくとも一方を適切に決定することで、対話エンジンがクラウド型対話エンジンからローカル型対話エンジンに切り替わり、応答の品質が低下した場合であっても、ユーザ体験の劣化が抑制され得る。特に、応答システム112が、移動式の機器、又は、携帯式若しくは可搬式の機器に実装される場合、当該機器の移動により、通信状態が大きく変化する。本実施形態によれば、このような場合であっても、ユーザ体験の劣化が大きく抑制され得る。
一実施形態において、応答様態決定部636は、(i)応答システム112又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合と、(ii)応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合とで、エージェントとして、同一の種類のキャラクタを利用することを決定してもよい。この場合において、応答様態決定部636は、(i)応答システム112又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合に利用されるキャラクタの設定年齢を、(ii)応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合に利用されるキャラクタの設定年齢よりも高くすることを決定してよい。
本実施形態によれば、応答システム112が、比較的性能の低いローカル型対話エンジンを利用して応答している場合、例えば、エージェントの外観及び声の少なくとも一方が幼くなる。これにより、ユーザ20の期待値が低下する。また、出力部220から警告メッセージを出力する場合と比較して、ユーザ20の不快感も軽減される。その結果、ユーザ体験の劣化が抑制される。
他の実施形態において、応答様態決定部636は、(i)応答システム112又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合、エージェントのキャラクタとして、大人のキャラクタを利用することを決定してよい。一方、応答様態決定部636は、(ii)応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、エージェントのキャラクタとして、子供のキャラクタ、大人のキャラクタの幼少期のキャラクタ、又は、大人のキャラクタの外観がデフォルメされたキャラクタを利用することを決定してよい。本実施形態によれば、上記の実施形態の場合と同様の理由により、ユーザ体験の劣化が抑制される。
他の実施形態において、応答様態決定部636は、(i)応答システム112又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合、エージェントの音声として、大人の音声又は大人のキャラクタの音声を利用することを決定してよい。一方、応答様態決定部636は、(ii)応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、エージェントの音声として、子供の音声又は子供のキャラクタの音声を利用することを決定してよい。本実施形態によれば、上記の実施形態の場合と同様の理由により、ユーザ体験の劣化が抑制される。
さらに実施形態において、応答様態決定部636は、(i)応答システム112又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合と、(ii)応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合とで、エージェントとして、異なる種類のキャラクタを利用することを決定してもよい。この場合において、応答様態決定部636は、(i)応答システム112又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合に利用されるキャラクタとして、ユーザ20に、勤勉である、誠実である、落ち着いている、冷静である、又は、大人っぽいという印象を与えるキャラクタを利用することを決定する。一方、応答様態決定部636は、(ii)応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、エージェントのキャラクタとして、幼い、可愛い、子供っぽい、ユーモアがある、好感がもてるという印象を与えるキャラクタを利用することを決定する。本実施形態によれば、上記の実施形態の場合と同様の理由により、ユーザ体験の劣化が抑制される。
音声合成部642は、ユーザ20の要求に応答する音声メッセージを生成する。音声合成部642は、応答内容決定部634が決定した応答の内容と、応答様態決定部636が決定した応答の様態に基づいて、音声メッセージを生成してよい。応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、音声合成部642は、ユーザ20からの要求の種類に基づいて予め定められた定型文を利用して、音声メッセージを生成してよい。音声合成部642は、生成された音声メッセージを出力部220に出力してよい。
画像生成部644は、ユーザ20の要求に応答する画像(応答画像と称される場合がある。)を生成する。画像生成部644は、ユーザ20の要求に応答するエージェントのアニメーション画像を生成してよい。画像生成部644は、応答内容決定部634が決定した応答の内容と、応答様態決定部636が決定した応答の様態に基づいて、応答画像を生成してよい。応答システム112又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、画像生成部644は、ユーザ20からの要求の種類に基づいて予め作成された画像を利用して、応答画像を生成してよい。画像生成部644は、生成された応答画像を出力部220に出力してよい。
なお、本実施形態においては、エージェントがソフトウエアエージェントであり、画像生成部644が、エージェントのアニメーション画像を生成する場合を例として、応答管理部350の詳細が説明された。しかしながら、応答管理部350は本実施形態に限定されない。他の実施形態において、エージェントがハードウエアエージェントである場合、応答管理部350は、エージェントの各部の駆動を制御する駆動制御部を有してよく、駆動制御部は、応答内容決定部634が決定した応答の内容と、応答様態決定部636が決定した応答の様態に基づいて、エージェントを駆動してよい。
命令生成部650は、車両110を操作するための命令を生成する。命令生成部650は、応答内容決定部634が決定した応答の内容に基づいて、操作の種類を決定してよい。命令生成部650は、応答様態決定部636が決定した応答の様態に基づいて、操作量又は操作モードを決定してよい。命令生成部650は、生成された命令を車両制御部274に出力してよい。
図7は、エージェント情報格納部360の内部構成の一例を概略的に示す。本実施形態において、エージェント情報格納部360は、設定データ格納部722と、音声データ格納部732と、画像データ格納部734とを備える。
本実施形態において、設定データ格納部722は、各エージェントの設定に関する情報を格納する。設定としては、年齢、性別、性格、ユーザ20に与える印象などが例示される。本実施形態において、音声データ格納部732は、各エージェントの音声を合成するための情報(音声情報と称される場合がある。)を格納する。例えば、音声データ格納部732は、キャラクタごとに、コンピュータが当該キャラクタの声でメッセージを読み上げるためのデータを格納する。本実施形態において、画像データ格納部734は、各エージェントの画像を生成するための情報を格納する。例えば、画像データ格納部734は、キャラクタごとに、コンピュータが、当該キャラクタのアニメーション画像を動的に生成するためのデータを格納する。
[支援サーバ120の各部の概要]
図8は、支援サーバ120の内部構成の一例を概略的に示す。本実施形態において、支援サーバ120は、通信部820と、通信制御部830と、要求処理部840とを備える。本実施形態において、要求処理部840は、要求決定部842と、実行部844と、応答情報生成部846と、設定情報格納部848とを有する。要求処理部840は、第1要求処理装置の一例であってよい。
本実施形態の支援サーバ120によれば、ハードウエアと、ソフトウエアとの協働により、クラウド型対話エンジンが実現される。本実施形態において、通信部820は、通信部230と同様の構成を有してよい。例えば、通信部820は、通信ネットワーク10を介して、車両110及び通信端末30の少なくとも一方と、支援サーバ120との間で情報を送受する。本実施形態において、通信制御部830は、通信制御部276と同様の構成を有してよい。例えば、通信制御部830は、支援サーバ120と外部の機器との間の通信を制御する。通信制御部830は、通信部820の動作を制御してよい。
本実施形態において、要求処理部840は、要求決定部842がクラウド型対話エンジンを実現する点で、要求処理部340と相違する。上記の相違点以外の点につき、要求処理部840は、要求処理部340と同様の構成を有してよい。例えば、実行部844は、実行部430と同様の構成を有してよい。応答情報生成部846は、応答情報生成部440と同様の構成を有してよい。設定情報格納部848は、設定情報格納部450と同様の構成を有してよい。
本実施形態において、要求決定部842は、クラウド型対話エンジンを実現する点で、要求決定部420と相違する。上記の相違点以外の点につき、要求決定部842は、要求決定部420と同様の構成を有してよい。要求決定部842の詳細は後述される。
図9は、要求決定部842の内部構成の一例を概略的に示す。本実施形態において、要求決定部842は、入力情報取得部920と、音声認識部932と、ジェスチャ認識部934と、推定部940とを備える。本実施形態において、推定部940は、要求推定部942と、ユーザ状態推定部944と、車両状態推定部946とを有する。
要求決定部842は、判定部540の代わりに、推定部940を備える点で、要求決定部420と相違する。上記の相違点以外の点につき、要求決定部842は、要求決定部420と同様の構成を有してよい。例えば、入力情報取得部920は、入力情報取得部520と同様の構成を有してよい。音声認識部932は、音声認識部532と同様の構成を有してよい。ジェスチャ認識部934は、ジェスチャ認識部534と同様の構成を有してよい。
本実施形態において、入力情報取得部920は、要求処理部840の入力となる情報を取得する。例えば、入力情報取得部920は、音声情報取得部312が取得した音声情報、及び、画像情報取得部314が取得した画像情報の少なくとも一方を取得する。入力情報取得部920は、音声情報取得部312が取得した音声情報、画像情報取得部314が取得した画像情報、操作情報取得部316が取得した操作情報、及び、車両情報取得部318が取得した車両情報の少なくとも1つを取得してもよい。入力情報取得部920は、(i)音声情報及び画像情報の一方と、(ii)音声情報及び画像情報の他方、操作情報、並びに、車両情報の少なくとも1つとを取得してもよい。
本実施形態において、入力情報取得部920は、取得された音声情報を音声認識部932に転送する。入力情報取得部520は、取得された画像情報をジェスチャ認識部934に転送する。入力情報取得部920は、取得された操作情報を推定部940に転送する。入力情報取得部920は、取得された車両情報を推定部940に転送する。入力情報取得部920は、取得された操作情報及び車両情報の少なくとも一方を、音声認識部932及びジェスチャ認識部の少なくとも一方に転送してもよい。
本実施形態において、音声認識部932は、音声情報を解析して、ユーザ20の発話の内容を特定する。音声認識部932は、ユーザ20の発話の内容を示す情報を、推定部940に出力する。音声認識部932は、発話の内容を解析して要求を認識する処理を実行してもよく、当該処理を実行しなくてもよい。
本実施形態において、ジェスチャ認識部934は、画像情報を解析して、ユーザ20により示された1又は複数のジェスチャを抽出する。ジェスチャ認識部534は、抽出されたジェスチャを示す情報を、推定部940に出力する。ジェスチャ認識部934は、抽出されたジェスチャを解析して要求を認識する処理を実行してもよく、当該処理を実行しなくてもよい。
本実施形態において、推定部940は、ユーザ20からの要求を認識又は推定する。推定部940は、ユーザ20の状態を認識又は推定してよい。推定部940は、車両110の状態を認識又は推定してよい。
本実施形態において、要求推定部942は、ユーザ20からの要求を認識又は推定する。要求推定部942は、特定要求を認識するだけでなく、特定要求以外の要求も認識又は推定できるように設定されてよい。一実施形態において、要求推定部942は、音声認識部932から、ユーザ20の発話の内容を示す情報を取得する。要求推定部942は、ユーザ20の発話の内容を解析して、ユーザ20の要求を認識又は推定する。他の実施形態において、要求推定部942は、ジェスチャ認識部934から、画像情報の解析により抽出されたジェスチャを示す情報を取得する。要求推定部942は、抽出されたジェスチャを解析して、ユーザ20の要求を認識又は推定する。
要求推定部942は、音声情報又は画像情報に加えて、音声情報及び画像情報以外の情報を利用して、ユーザ20からの要求を認識又は推定してもよい。例えば、要求推定部942は、入力情報取得部920から、操作情報及び車両情報の少なくとも一方を取得する。要求推定部942は、ユーザ状態推定部944から、ユーザ20の状態を示す情報を取得してもよい。要求推定部942は、車両状態推定部946から、車両110の状態を示す情報を取得してもよい。これらの情報が利用されることで、要求推定部942における認識又は推定の精度が向上し得る。
要求推定部942は、認識された要求の種類を示す情報を、実行部844に出力してよい。要求推定部942は、音声情報又は画像情報を解析したにもかかわらず要求を認識することができなかった場合、要求の認識が不能であることを示す情報を、応答情報生成部846に出力してよい。
本実施形態において、ユーザ状態推定部944は、ユーザ20の状態を認識又は推定する。ユーザ状態推定部944は、音声情報、画像情報、操作情報及び車両情報の少なくとも1つに基づいて、ユーザ20の状態を認識又は推定する。ユーザ20の状態としては、ユーザ20の心理状態、覚醒状態及び健康状態の少なくとも1つが例示される。ユーザ状態推定部944は、ユーザ20の状態を示す情報を、要求推定部942に出力してよい。これにより、要求推定部942は、例えば要求の候補を絞ることができるので、要求推定部942の推定精度が向上し得る。
本実施形態において、車両状態推定部946は、車両110の状態を認識又は推定する。車両状態推定部946は、音声情報、画像情報、操作情報及び車両情報の少なくとも1つに基づいて、車両110の状態を認識又は推定する。上述のとおり、車両110の状態は、車両110の移動状態、車両110の各部の動作状態、及び、車両110の内部空間の状態の少なくとも1つであってよい。車両状態推定部946は、車両110の状態を示す情報を、要求推定部942に出力してよい。これにより、要求推定部942は、例えば要求の候補を絞ることができるので、要求推定部942の推定精度が向上し得る。
[エージェントの様態の一例]
図10は、情報の出力様態の遷移の一例を概略的に示す。図10は、応答システム112の状態に応じて、エージェントの外観が変化する様子の一例を概略的に示す。図10に示される例において、画像1020は、クラウド型対話エンジンがユーザ20の要求を処理している状態におけるエージェントの外観を示す画像の一例であってよい。画像1040は、ローカル型対話エンジンがユーザ20の要求を処理している状態におけるエージェントの外観を示す画像の一例であってよい。
画像1040は、画像1020に描かれたキャラクタがデフォルメされた画像であってよい。本実施形態によれば、画像1040のキャラクタの頭身比率は、画像1040のキャラクタの頭身比率よりも小さい。これにより、画像1040に描かれたキャラクタは、画像1020に描かれたキャラクタよりも幼く見える。
本実施形態によれば、応答システム112の状態が、クラウド型対話エンジンがユーザ20の要求を処理している状態から、ローカル型対話エンジンがユーザ20の要求を処理している状態に遷移すると、出力部220が表示又は投影するエージェントの画像が、画像1020から画像1040に切り替わる。同様に、応答システム112の状態が、ローカル型対話エンジンがユーザ20の要求を処理している状態から、クラウド型対話エンジンがユーザ20の要求を処理している状態に遷移すると、出力部220が表示又は投影するエージェントの画像が、画像1040から画像1020に切り替わる。
本実施形態によれば、ユーザ20は、対話エンジンの遷移を感覚的に理解することができる。また、ローカル型対話エンジンに対応する画像1040に描かれたキャラクタの年齢設定が、クラウド型対話エンジンに対応する画像1020に描かれたキャラクタの年齢設定よりも小さいことから、ローカル型対話エンジンがユーザ20の要求を処理している場合であっても、対話エンジンに対するユーザ20の期待値が低下する。その結果、ユーザ20のユーザ体験の劣化が抑制され得る。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。また、技術的に矛盾しない範囲において、特定の実施形態について説明した事項を、他の実施形態に適用することができる。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
10 通信ネットワーク、20 ユーザ、30 通信端末、100 対話型エージェントシステム、110 車両、112 応答システム、114 通信システム、120 支援サーバ、210 入力部、220 出力部、230 通信部、240 センス部、250 駆動部、260 付帯設備、270 制御部、272 入出力制御部、274 車両制御部、276 通信制御部、312 音声情報取得部、314 画像情報取得部、316 操作情報取得部、318 車両情報取得部、322 通信情報取得部、330 転送部、340 要求処理部、350 応答管理部、360 エージェント情報格納部、420 要求決定部、430 実行部、440 応答情報生成部、450 設定情報格納部、520 入力情報取得部、532 音声認識部、534 ジェスチャ認識部、540 判定部、620 転送制御部、630 応答決定部、632 起動管理部、634 応答内容決定部、636 応答様態決定部、642 音声合成部、644 画像生成部、650 命令生成部、722 設定データ格納部、732 音声データ格納部、734 画像データ格納部、820 通信部、830 通信制御部、840 要求処理部、842 要求決定部、844 実行部、846 応答情報生成部、848 設定情報格納部、920 入力情報取得部、932 音声認識部、934 ジェスチャ認識部、940 推定部、942 要求推定部、944 ユーザ状態推定部、946 車両状態推定部、1020 画像、1040 画像

Claims (15)

  1. 通信ネットワークを介してユーザの音声及びジェスチャの少なくとも一方により示される要求を取得し、当該要求に応じた処理を実行する第1要求処理装置のユーザインタフェースとして機能するエージェント装置を制御する制御装置であって、
    前記第1要求処理装置、及び、前記エージェント装置の間の通信状態を示す通信情報を取得する通信情報取得部と、
    前記通信情報取得部が取得した前記通信情報により示される前記通信状態に基づいて、前記エージェント装置による情報の提供に利用されるエージェントの様態を決定する様態決定部と、
    を備える、制御装置。
  2. 前記エージェントの様態は、(i)前記エージェントとして利用されるキャラクタの種類、(ii)前記キャラクタの外観、(iii)前記キャラクタの声、及び、(iv)前記キャラクタのインタラクションの様態の少なくとも1つである、
    請求項1に記載の制御装置。
  3. 前記エージェント装置は、さらに、前記第1要求処理装置とは異なる第2要求処理装置のユーザインタフェースとして機能し、
    前記第2要求処理装置は、
    有線通信又は近距離無線通信により、前記エージェント装置から、前記ユーザの音声又はジェスチャによる要求を取得し、
    当該要求に応じた処理を実行し、
    前記制御装置は、
    前記通信情報取得部が取得した前記通信情報により示される前記通信状態に基づいて、前記エージェント装置を、前記第1要求処理装置及び前記第2要求処理装置の何れのユーザインタフェースとして機能させるかを決定する処理装置決定部、
    をさらに備える、
    請求項1又は請求項2に記載の制御装置。
  4. 前記様態決定部は、(i)前記エージェント装置を、前記第1要求処理装置のユーザインタフェースとして機能させることが決定された場合と、(ii)前記エージェント装置を、前記第2要求処理装置のユーザインタフェースとして機能させることが決定された場合とで、前記エージェントの様態が異なるように、前記エージェントの様態を決定する、
    請求項3に記載の制御装置。
  5. 前記様態決定部は、
    (i)前記エージェント装置が、前記第1要求処理装置のユーザインタフェースとして機能する場合における前記エージェントの様態と、(ii)前記エージェント装置が、前記第2要求処理装置のユーザインタフェースとして機能する場合における前記エージェントの様態とを、予め決定しておき、
    前記処理装置決定部の決定結果に基づいて、前記エージェントの様態を切り替える、
    請求項3又は請求項4に記載の制御装置。
  6. 前記様態決定部は、
    (i)前記エージェント装置が、前記第1要求処理装置のユーザインタフェースとして機能する場合と、(ii)前記エージェント装置が、前記第2要求処理装置のユーザインタフェースとして機能する場合とで、同一の種類のキャラクタを利用することを決定し、
    (i)前記エージェント装置が、前記第1要求処理装置のユーザインタフェースとして機能する場合に利用される前記キャラクタの設定年齢を、(ii)前記エージェント装置が、前記第2要求処理装置のユーザインタフェースとして機能する場合に利用される前記キャラクタの設定年齢よりも高くすることを決定する、
    請求項3から請求項5までの何れか一項に記載の制御装置。
  7. 前記様態決定部は、
    (i)前記エージェント装置が、前記第1要求処理装置のユーザインタフェースとして機能する場合、前記エージェントのキャラクタとして、大人のキャラクタを利用することを決定し、
    (ii)前記エージェント装置が、前記第2要求処理装置のユーザインタフェースとして機能する場合、前記エージェントのキャラクタとして、子供のキャラクタ、前記大人のキャラクタの幼少期のキャラクタ、又は、前記大人のキャラクタの外観がデフォルメされたキャラクタを利用することを決定する、
    請求項3から請求項6までの何れか一項に記載の制御装置。
  8. 前記様態決定部は、
    (i)前記エージェント装置が、前記第1要求処理装置のユーザインタフェースとして機能する場合、前記エージェントの音声として、大人の音声又は大人のキャラクタの音声を利用することを決定し、
    (ii)前記エージェント装置が、前記第2要求処理装置のユーザインタフェースとして機能する場合、前記エージェントの音声として、子供の音声又は子供のキャラクタの音声を利用することを決定する、
    請求項3から請求項7までの何れか一項に記載の制御装置。
  9. 前記制御装置は、
    前記ユーザの前記要求に応答する音声メッセージを生成する音声メッセージ生成部、
    をさらに備え、
    前記音声メッセージ生成部は、前記エージェント装置が、前記第2要求処理装置のユーザインタフェースとして機能する場合、前記要求の種類に基づいて定められた定型文を利用して、前記音声メッセージを生成する、
    請求項3から請求項8までの何れか一項に記載の制御装置。
  10. 前記第2要求処理装置が認識できる要求の種類の数は、前記第1要求処理装置が認識できる要求の種類の数よりも少ない、
    請求項3から請求項9までの何れか一項に記載の制御装置。
  11. 前記第2要求処理装置が処理できる要求の種類の数は、前記第1要求処理装置が処理できる要求の種類の数よりも少ない、
    請求項3から請求項10までの何れか一項に記載の制御装置。
  12. 前記エージェント装置は、対話型の車両用運転支援装置である、
    請求項1から請求項11までの何れか一項に記載の制御装置。
  13. ユーザの音声及びジェスチャの少なくとも一方により示される要求を取得し、当該要求に応じた処理を実行する要求処理装置のユーザインタフェースとして機能するエージェント装置であって、
    請求項1から請求項12までの何れか一項に記載の制御装置と、
    前記制御装置の前記様態決定部が決定した様態に従って、前記エージェントの画像を表示又は投影するエージェント出力部と、
    を備える、エージェント装置。
  14. 前記ユーザの音声及びジェスチャの少なくとも一方を示す情報を入力する入力部と、
    前記ユーザに音声メッセージを出力する音声メッセージ出力部と、
    をさらに備える、
    請求項13に記載のエージェント装置。
  15. コンピュータを、請求項1から請求項12までの何れか一項に記載の制御装置として機能させるための、プログラム。
JP2018199654A 2018-10-24 2018-10-24 制御装置、エージェント装置及びプログラム Pending JP2020067785A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018199654A JP2020067785A (ja) 2018-10-24 2018-10-24 制御装置、エージェント装置及びプログラム
CN201910983613.4A CN111092988A (zh) 2018-10-24 2019-10-16 控制装置、智能体装置以及计算机可读存储介质
US16/658,149 US20200133630A1 (en) 2018-10-24 2019-10-20 Control apparatus, agent apparatus, and computer readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018199654A JP2020067785A (ja) 2018-10-24 2018-10-24 制御装置、エージェント装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2020067785A true JP2020067785A (ja) 2020-04-30

Family

ID=70325434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018199654A Pending JP2020067785A (ja) 2018-10-24 2018-10-24 制御装置、エージェント装置及びプログラム

Country Status (3)

Country Link
US (1) US20200133630A1 (ja)
JP (1) JP2020067785A (ja)
CN (1) CN111092988A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021182219A (ja) * 2020-05-18 2021-11-25 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム
WO2022001120A1 (zh) * 2020-06-30 2022-01-06 江苏科技大学 一种多智能体系统及其控制方法
WO2022195783A1 (ja) 2021-03-17 2022-09-22 パイオニア株式会社 音出力制御装置、音出力制御方法および音出力制御プログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7226393B2 (ja) * 2020-05-18 2023-02-21 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法及びエージェント制御プログラム
JP7318587B2 (ja) * 2020-05-18 2023-08-01 トヨタ自動車株式会社 エージェント制御装置
JP2022097198A (ja) * 2020-12-18 2022-06-30 本田技研工業株式会社 情報処理装置、移動体、プログラム及び情報処理方法
FR3136564A1 (fr) * 2022-06-13 2023-12-15 Psa Automobiles Sa Procédé et dispositif de contrôle de rendu d’un contenu sonore dans un véhicule avec spatialisation du son

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014020835A1 (ja) * 2012-07-31 2014-02-06 日本電気株式会社 エージェント制御システム、方法およびプログラム
JP2014164325A (ja) * 2013-02-21 2014-09-08 Fujitsu Ten Ltd 通信装置、通信システム、通信方法、及び、プログラム
JP2015018327A (ja) * 2013-07-09 2015-01-29 株式会社Nttドコモ 端末装置、コミュニケーションシステム、コミュニケーション方法及びプログラム
US20180108343A1 (en) * 2016-10-14 2018-04-19 Soundhound, Inc. Virtual assistant configured by selection of wake-up phrase

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100750633B1 (ko) * 2006-04-18 2007-08-20 삼성전자주식회사 휴대 단말기 간의 캐릭터 전이 시스템 및 방법
US20080301556A1 (en) * 2007-05-30 2008-12-04 Motorola, Inc. Method and apparatus for displaying operational information about an electronic device
US10264138B2 (en) * 2009-01-28 2019-04-16 Headwater Research Llc Mobile device and service management
WO2014057503A2 (en) * 2012-10-12 2014-04-17 Ankush Gupta Method and system for enabling communication between at least two communication devices using an animated character in real-time
KR101677645B1 (ko) * 2014-11-03 2016-11-18 엘지전자 주식회사 이동 통신 시스템 및 그 제어 방법
CN107562195A (zh) * 2017-08-17 2018-01-09 英华达(南京)科技有限公司 人机交互方法及系统
US20190149490A1 (en) * 2017-11-14 2019-05-16 Fuji Xerox Co.,Ltd. Information processing apparatus and non-transitory computer readable medium
US10635462B2 (en) * 2018-05-23 2020-04-28 Microsoft Technology Licensing, Llc Skill discovery for computerized personal assistant

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014020835A1 (ja) * 2012-07-31 2014-02-06 日本電気株式会社 エージェント制御システム、方法およびプログラム
JP2014164325A (ja) * 2013-02-21 2014-09-08 Fujitsu Ten Ltd 通信装置、通信システム、通信方法、及び、プログラム
JP2015018327A (ja) * 2013-07-09 2015-01-29 株式会社Nttドコモ 端末装置、コミュニケーションシステム、コミュニケーション方法及びプログラム
US20180108343A1 (en) * 2016-10-14 2018-04-19 Soundhound, Inc. Virtual assistant configured by selection of wake-up phrase

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021182219A (ja) * 2020-05-18 2021-11-25 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム
JP7310706B2 (ja) 2020-05-18 2023-07-19 トヨタ自動車株式会社 エージェント制御装置、エージェント制御方法、及びエージェント制御プログラム
WO2022001120A1 (zh) * 2020-06-30 2022-01-06 江苏科技大学 一种多智能体系统及其控制方法
WO2022195783A1 (ja) 2021-03-17 2022-09-22 パイオニア株式会社 音出力制御装置、音出力制御方法および音出力制御プログラム

Also Published As

Publication number Publication date
US20200133630A1 (en) 2020-04-30
CN111092988A (zh) 2020-05-01

Similar Documents

Publication Publication Date Title
JP7053432B2 (ja) 制御装置、エージェント装置及びプログラム
JP2020067785A (ja) 制御装置、エージェント装置及びプログラム
US10809802B2 (en) Line-of-sight detection apparatus, computer readable storage medium, and line-of-sight detection method
US20190051302A1 (en) Technologies for contextual natural language generation in a vehicle
US10956761B2 (en) Control apparatus, control method agent apparatus, and computer readable storage medium
US20200143810A1 (en) Control apparatus, control method, agent apparatus, and computer readable storage medium
JP7133029B2 (ja) エージェント装置、エージェント制御方法、およびプログラム
US11507825B2 (en) AI apparatus and method for managing operation of artificial intelligence system
WO2018230654A1 (ja) インタラクション装置、インタラクション方法、およびプログラム
US20200319841A1 (en) Agent apparatus, agent apparatus control method, and storage medium
US11508370B2 (en) On-board agent system, on-board agent system control method, and storage medium
JP2019086805A (ja) 車内システム
JP7084848B2 (ja) 制御装置、エージェント装置及びプログラム
JP7340943B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP6657048B2 (ja) 処理結果異常検出装置、処理結果異常検出プログラム、処理結果異常検出方法及び移動体
JP7175221B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020157853A (ja) 車載エージェントシステム、車載エージェントシステムの制御方法、およびプログラム
JP7297483B2 (ja) エージェントシステム、サーバ装置、エージェントシステムの制御方法、およびプログラム
WO2023220194A1 (en) In-vehicle generation of routines using voice commands
JP2021144321A (ja) エージェントシステム、制御装置、およびコンピュータプログラム
CN117112633A (zh) 基于智能座舱主动交互方法、系统及存储介质
JP2020152297A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210928

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220322